Data engineer

Blent.AI

Non finançable CPF
Tout public
En ligne
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
4800 €
Durée
Nous contacter
Niveau visé
Non diplômante
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
En savoir plus sur les localités en présentiel
Objectifs
- Élaborer des codes Python pour la transformation des données
- Construire des algorithmes de Machine Learning et Deep Learning
- Expliquer et auditer le comportement des algorithmes
- Mettre en place des calculs distribués
- Déployer des modèles de Machine Learning dans le Cloud
Programme
Première phase : Préparation des données

Module 1 : Introduction
1.1 : Récupérer les données et regarder leur structure

Module 2 : Exploration des données
2.1 : Construire des graphiques pour comprendre les données
2.2 : Étudier les séries temporelles pour en déduire le comportement des prix

Module 3 : Nettoyage et encodage des données
3.1 : Nettoyer les données en modifiant les valeurs manquantes et supprimant les valeurs aberrantes
3.2 : Encoder numériquement les variables pour l'apprentissage des modèles

Seconde phase : Modélisation

Module 4 : Introduction à la modélisation
4.1 : Comprendre les concepts fondamentaux de l'apprentissage supervisé
4.2 : Savoir appliquer un modèle de Machine Learning avec le modèle linéaire

Module 5 : Arbres de décisions
5.1 : Découvrir les arbres de décision et l'algorithme CART
5.2 : Appliquer un arbre de régression sur les données Airbnb

Module 6 : Random Forest
6.1 : Découvrir les Random Forest
6.2 : Optimiser les hyper-paramètres des modèles

Module 7 : XGBoost
7.1 : Découvrir le modèle XGBoost et le Gradient Boosting
7.2 : Valider des modèles par des méthodes de validation croisée

Module 8 : Interprétabilité
8.1 : Comprendre l'intérêt de l'interprétabilité avec les PDP
8.2 : Utiliser SHAP pour interpréter localement les modèles

Module 9 : Deep Learning
9.1 : Introduire les modèles de Deep Learning avec les réseaux de neurones

Troisième phase : Déploiement

Module 10 : Data Engineering
10.1 : Comprendre Spark et sa différence avec Hadoop
10.2 : Comprendre l'architecture Map Reduce sur un algorithme

Module 11 : Déploiement de modèles
11.1 : Se rappeler des notions réseaux et de Cloud Computing
11.2 : Être capable de déployer le modèle avec Heroku

Envie d’en savoir plus sur cette formation ?

Documentez-vous sur la formation

Ces formations peuvent vous intéresser

Quelle est votre situation ?

Vous êtes ?

Veuillez choisir un lieu

Please fill out this field.

Please fill out this field.

Veuillez sélectionner un niveau de formation

Informez-vous gratuitement et sans engagement sur la formation.

Please fill out this field.

Please fill out this field.

Please fill out this field.

Veuillez saisir une adresse email

  • Vous voulez dire ?
  • ou plutôt ?

En cliquant sur "J'envoie ma demande", vous acceptez les CGU et déclarez avoir pris connaissance de la politique de protection des données du site maformation.fr

Haut de page