Data engineer
Blent.AI
Non finançable CPF
Tout public
En ligne
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Étudiant
Prix
4800 €
Durée
Nous contacter
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
Objectifs
- Élaborer des codes Python pour la transformation des données
- Construire des algorithmes de Machine Learning et Deep Learning
- Expliquer et auditer le comportement des algorithmes
- Mettre en place des calculs distribués
- Déployer des modèles de Machine Learning dans le Cloud
- Construire des algorithmes de Machine Learning et Deep Learning
- Expliquer et auditer le comportement des algorithmes
- Mettre en place des calculs distribués
- Déployer des modèles de Machine Learning dans le Cloud
Programme
Première phase : Préparation des données
Module 1 : Introduction
1.1 : Récupérer les données et regarder leur structure
Module 2 : Exploration des données
2.1 : Construire des graphiques pour comprendre les données
2.2 : Étudier les séries temporelles pour en déduire le comportement des prix
Module 3 : Nettoyage et encodage des données
3.1 : Nettoyer les données en modifiant les valeurs manquantes et supprimant les valeurs aberrantes
3.2 : Encoder numériquement les variables pour l'apprentissage des modèles
Seconde phase : Modélisation
Module 4 : Introduction à la modélisation
4.1 : Comprendre les concepts fondamentaux de l'apprentissage supervisé
4.2 : Savoir appliquer un modèle de Machine Learning avec le modèle linéaire
Module 5 : Arbres de décisions
5.1 : Découvrir les arbres de décision et l'algorithme CART
5.2 : Appliquer un arbre de régression sur les données Airbnb
Module 6 : Random Forest
6.1 : Découvrir les Random Forest
6.2 : Optimiser les hyper-paramètres des modèles
Module 7 : XGBoost
7.1 : Découvrir le modèle XGBoost et le Gradient Boosting
7.2 : Valider des modèles par des méthodes de validation croisée
Module 8 : Interprétabilité
8.1 : Comprendre l'intérêt de l'interprétabilité avec les PDP
8.2 : Utiliser SHAP pour interpréter localement les modèles
Module 9 : Deep Learning
9.1 : Introduire les modèles de Deep Learning avec les réseaux de neurones
Troisième phase : Déploiement
Module 10 : Data Engineering
10.1 : Comprendre Spark et sa différence avec Hadoop
10.2 : Comprendre l'architecture Map Reduce sur un algorithme
Module 11 : Déploiement de modèles
11.1 : Se rappeler des notions réseaux et de Cloud Computing
11.2 : Être capable de déployer le modèle avec Heroku
Module 1 : Introduction
1.1 : Récupérer les données et regarder leur structure
Module 2 : Exploration des données
2.1 : Construire des graphiques pour comprendre les données
2.2 : Étudier les séries temporelles pour en déduire le comportement des prix
Module 3 : Nettoyage et encodage des données
3.1 : Nettoyer les données en modifiant les valeurs manquantes et supprimant les valeurs aberrantes
3.2 : Encoder numériquement les variables pour l'apprentissage des modèles
Seconde phase : Modélisation
Module 4 : Introduction à la modélisation
4.1 : Comprendre les concepts fondamentaux de l'apprentissage supervisé
4.2 : Savoir appliquer un modèle de Machine Learning avec le modèle linéaire
Module 5 : Arbres de décisions
5.1 : Découvrir les arbres de décision et l'algorithme CART
5.2 : Appliquer un arbre de régression sur les données Airbnb
Module 6 : Random Forest
6.1 : Découvrir les Random Forest
6.2 : Optimiser les hyper-paramètres des modèles
Module 7 : XGBoost
7.1 : Découvrir le modèle XGBoost et le Gradient Boosting
7.2 : Valider des modèles par des méthodes de validation croisée
Module 8 : Interprétabilité
8.1 : Comprendre l'intérêt de l'interprétabilité avec les PDP
8.2 : Utiliser SHAP pour interpréter localement les modèles
Module 9 : Deep Learning
9.1 : Introduire les modèles de Deep Learning avec les réseaux de neurones
Troisième phase : Déploiement
Module 10 : Data Engineering
10.1 : Comprendre Spark et sa différence avec Hadoop
10.2 : Comprendre l'architecture Map Reduce sur un algorithme
Module 11 : Déploiement de modèles
11.1 : Se rappeler des notions réseaux et de Cloud Computing
11.2 : Être capable de déployer le modèle avec Heroku
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation
Ces formations peuvent vous intéresser
DATA Engineer - Alternance - Titre RNCP Niveau 7
TOULOUSE, NANCY, LILLE ET 12 AUTRE(S) LOCALITÉ(S)
Non finançable CPF
Nous contacter
À distance / En alternance / En entreprise
Demandeur d'emploi / Étudiant
Avis du centre
.
DATASCIENTEST
Data Analyst - Formation certifiante à Paris
PARIS 11E
Finançable CPF
6890 €
En centre
Tout public
Avis du centre
.
DataBird
Bootcamp Data Analyst - formation certifiante RNCP
À DISTANCE
Finançable CPF
4500 €
À distance
Tout public
Avis du centre
.
DATAROCKSTARS
Microsoft Power BI (Microsoft Certified : Data Analyst Associate)
LYON, PARIS
Finançable CPF
1500 €
À distance / En centre / En entreprise
Salarié en poste / Entreprise
MYPE
Formation au métier de Data Analyst (Power BI, SQL, certification TOSA incluse)
LILLE, GRENOBLE, MARSEILLE ET 11 AUTRE(S) LOCALITÉ(S)
Finançable CPF
3300 €
À distance / En centre
Salarié en poste / Entreprise
Avis du centre
.
Skills4All
Apprenez SQL et Power BI en individuel et développez vos compétences Data Analyst
À DISTANCE
Finançable CPF
4320 €
À distance
Salarié en poste / Entreprise
Académie digitale européenne
Les formations les plus recherchées
Paris
Lyon
Toulouse
Marseille
Montpellier
Bordeaux
Dijon
Mâcon
Nantes
Rennes
Informatique CPF
Informatique en Ligne
Data science
Data science CPF
Data science en Ligne
Data scientist
Technicien support informatique
Consultant en informatique
Administrateur systeme
Technicien informatique
Spark
Programmation
Technicien reseaux
Administrateur reseau
Developpeur informatique
Data science Alfortville
Data scientist Alfortville
Data scientist Antony
Data science Antony
Data science Argenteuil
Data scientist Argenteuil
Data scientist Asnières-sur-Seine
Data science Asnières-sur-Seine
Data science Athis-Mons
Data scientist Athis-Mons