Machine Learning en Python

NAPSIA

Non finançable CPF
Tout public
En ligne
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Étudiant
Prix
Nous contacter
Durée
Nous contacter
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
En savoir plus sur les localités en présentiel
Cette formation est disponible dans les centres de formation suivants:
  • 31 - Toulouse
Cette formation peut être dispensée dans votre entreprise dans les localités suivantes :
  • 09 - Ariège
  • 11 - Aude
  • 12 - Aveyron
  • 30 - Gard
  • 31 - Haute-Garonne
  • 32 - Gers
  • 34 - Hérault
  • 46 - Lot
  • 48 - Lozère
  • 65 - Hautes-Pyrénées
  • 66 - Pyrénées-Orientales
  • 81 - Tarn
  • 82 - Tarn-et-Garonne
Objectifs
Comprendre l'apport du Machine Learning et ses limites
Maîtriser les principaux algorithmes
Savoir créer et optimiser un modèle prédictif en python
Mesurer la qualité des modèles et les performances attendues en production
Connaître le workflow global du projet
Savoir mettre en oeuvre les bonnes pratiques pour éviter les écueils de ce type de projet
Pouvoir déployer un modèle, le superviser et le mettre à jour en production
Comprendre comment appliquer le Machine Learning sur des données structurées, sur du texte, et sur des séries temporelles
Programme
JOUR 1
Introduction au Machine Learning :
Principe général et concepts basiques
Exemples de cas d'usage dans différents secteurs : industrie, marketing, IoT, web, énergie…
Cadre d'utilisation : possibilités et limitations
Bien formuler la problématique : comment passer d'un problème métier à un problème Machine Learning
Ecosystème Python :
Python scientifique : numpy, pandas, matplotlib, scipy
La lirairie Scikit-learn
Notebook Jupyter, Anaconda
Algorithmes de Machine Learning, première partie : les bases
Régression linéaire et régression logistique
K plus proches voisins : KNN
Arbres de décision et Random Forests
 

 

JOUR 2
Critères d'évaluation :
Régression : MAE, MSE, RMSLE, R²…
Classification : accuracy, precision, recall, F1 score…
Procédures d'évaluation : train-test split, cross-validation, validation set
Optimisation des hyper-paramètres :
Gridsearch, randomsearch
Soft optimisation et hard optimisation
Méthodologie et bonnes pratiques :
Déroulé d'un projet de data science : une procédure itérative
Workflow complet du projet
Pipeline de transformation
Ecueils à éviter et comment s'en prémunir : surrapprentissage (overfitting) et fuite de données (data leakage)
 

 

JOUR 3
Data prepration et feature extraction :
Traitement des données aberrantes et manquantes
Normalisation et standardisation
Combinaison de features
Mise en production :
Déployer un modèle en production via une API
Monitoring des modèles
Mise à jour des modèles
Algorithmes de Machine Learning, deuxième partie : les autres catégories
Boosting et gradient boosting
Clustering
Détection d'anomalie
Réseaux de neurones et Deep Learning
Adapter selon le type de données :
Comment traiter du texte
Comment traiter des séries temporelles

Envie d’en savoir plus sur cette formation ?

Documentez-vous sur la formation

Ces formations peuvent vous intéresser

Quelle est votre situation ?

Haut de page