Data Science (Certifiant RNCP 6 - Bootcamp 9 semaines)

Le Wagon PACA

Finançable CPF

Tout public

Présentiel

Voir des formations similaires

Public admis

Salarié en poste

Demandeur d'emploi

Entreprise

Etudiant

Prix

7400 €

Prise en charge CPF

Durée

9 semaines

Niveau visé

Niveau BAC + 3/4

Taux de réussite

85%

Pré-requis

Types de données, variables, conditions, boucles, fonctions, structures de données. Mathématiques niveau Terminale S (fonctions, dérivés, équations linéaires). Anglais écrit B1.

Certifications

Datadock Qualiopi

Localité

En présentiel

Découvrez les localités disponibles pour suivre cette formation en présentiel.

Objectifs

Apprenez de nouvelles compétences Tech, changez de carrière ou lancez votre startup grâce au bootcamp le mieux noté au monde !

Grâce à cette formation de " Concepteur développeur en intelligence artificielle et analyse big data", développez les compétences les plus demandées sur le marché en quelques semaines et faites évoluer votre carrière dans la Tech.

Au cours des 9 semaines de formation, vous apprendrez à développer des compétences data avancées, maîtriser le Machine Learning et l'IA, pour lancer votre carrière en tant que Data Scientist, Analyst, Ingénieur(e) en Intelligence Artificielle, Data Manager, et plus encore...

Le Wagon c'est...

- Le Bootcamp Tech classé n°1 au monde avec 4.98/5 sur 6000+ avis

- 26 000 alumni dans le monde

- Une certification niveau 6 en seulement 2 mois en ligne ou sur campus

- Un job dans la tech en 3 mois en moyenne

Programme

Semaine type :
En présentiel ou remote du lundi au vendredi, de 9h à 18h

En résumé :

TRAVAIL PRÉPARATOIRE (40h)
INTRODUCTION A PYTHON (40h)
ANALYSE DE DONNÉES (40h)
DECISION SCIENCE (40h)
MACHINE LEARNING (80h)
DEEP LEARNING (40h)
MACHINE LEARNING ENGINEERING (40h)
PROJETS (80h)
CAREER SERVICES & CERTIFICATION RNCP 38616 (1 semaine)

Dans le détail :

Travail préparatoire : à distance

Semaines 1 & 2 : Maîtriser la Data Analyse (80h)

- Apprenez à programmer en Python en utilisant Jupyter Notebook et des librairies puissantes comme Pandas et NumPy pour explorer de gros jeux de données. Collectez vos données depuis différentes sources, dont des fichiers CSV, des requêtes SQL, Google Big Query, ou encore en utilisant une API ou le Web scraping.
- Rendez vos analyses de données plus parlantes en intégrant des visualisations de données à vos Notebooks.
- Apprenez à tracer des graphes à partir de vos data frames grâce à des librairies Python comme matplotlib ou seaborn pour rendre vos données plus actionnables.
- Comprenez les concepts mathématiques qui sont derrière les librairies et les modèles que vous utilisez tout au long du bootcamp. - Maîtrisez les notions de base en probabilités et en statistiques (moyenne, variance, variable aléatoire, théorème de Bayes, etc.) et en calcul matriciel, au cœur des opérations exécutées par les librairies Pandas et NumPy.

Semaine 3 : Maîtriser la Decision Science (40h)

- Vous apprendrez comment structurer un projet Python en programmation orientée objet afin de rendre votre code réutilisable, comment survivre à la phase de préparation d'un vaste ensemble de données, et comment trouver et interpréter des résultats statistiques significatifs basés sur des modèles de régression linéaires à plusieurs variables.
- Vous apprendrez à avoir de l'impact en expliquant vos conclusions techniques et en les transformant en
recommandations business à l'aide d'une analyse coûts/bénéfices. Vous pourrez partager, présenter et comparer vos résultats à vos coéquipiers.

Semaine 4 & 5 : Maîtriser le Machine Learning (80h)

- Explorez, nettoyez et préparez vos jeux de données grâce aux techniques de preprocessing comme la vectorisation.
- Familiarisez-vous avec les modèles classiques de l'apprentissage supervisé
- Les régressions linéaires et logistiques. Travaillez sur des tâches de prédiction et de classification avec la librairie scikit-learn en utilisant des algorithmes comme les KNN (k-nearest neighbors).
- Généralisation et Overfitting. Assurez-vous que votre modèle peut se généraliser à de nouvelles données et être mis en production
avec une exactitude prédictible, en mettant en place des phases d'entraînement et de test.
- Apprenez à éviter l'overfitting avec des méthodes de régularisation et à améliorer la finesse de votre modèle en choisissant la bonne fonction de coût à minimiser.
- Evaluez votre modèle en définissant ce que vous voulez optimiser et les bonnes métriques d'erreur en fonction de votre problématique business. Améliorez la performance de votre modèle avec des méthodes de validation comme la cross validation ou l'hyperparameter tuning. Ajoutez une nouvelle méthode à votre boîte à outils: SVM (Support Vector Machines).
- Passez à l'apprentissage non supervisé avec des méthodes comme la PCA (analyse en composante principale) pour faire de la réduction de dimension ou le clustering pour découvrir des groupes dans un jeu de données. Complétez vos connaissances avec les méthodes ensemblistes, qui combinent plusieurs modèles pour améliorer la performance, comme Random Forest ou Gradient Boosting.

Semaine 6 : Maîtriser le Machine Learning (40h)

- Réseaux de neurones : Levez le voile sur la magie du Deep Learning en comprenant l'architecture des réseaux de neurones
(neurones, couches, piles) et leurs paramètres (activations, pertes, optimiseurs). Devenez autonome pour construire vos propres réseaux, notamment pour travailler avec des images, des séries temporelles et du texte, tout en apprenant les techniques et astuces qui font fonctionner le Deep Learning.
- Approfondissez vos compétences en computer vision avec les réseaux de neurones convolutifs, des architectures conçues pour tirer le meilleur parti des images. Améliorez la généralisation de votre modèle grâce aux techniques d'augmentation de données, et mettez en place des méthodes avancées pour bénéficier d'architectures de pointe grâce au Transfer Learning.
- Familiarisez-vous avec la gestion de données séquentielles et de textes (séquence de mots) en les transformant en données adaptées. Exploitez la puissance des réseaux de neurones récurrents pour prévoir des valeurs futures et réaliser un traitement du langage naturel efficace (Natural Language Processing).
- Découvrez la librairie Keras Deep Learning qui vous permettra de prototyper facilement, tout en ayant la flexibilité de régler précisément votre réseau de neurones. De plus, Google Colab accélérera considérablement le temps de calcul grâce à des processeurs graphiques dédiés.

Semaine 7 : Maîtriser la Data Engineering (40h)

- Passez de Jupyter Notebook à un éditeur de code et apprenez à configurer un projet de code de machine learning pour itérer rapidement en toute confiance. Découvrez comment mettre en place une pipeline robuste et scalable avec sklearn-pipeline en utilisant des encoders et des transformers.
- Pour implémenter un modèle de machine learning, il faut passer par de nombreuses étapes de préparation, d'expérimentation, d'itération et de réglage. On vous apprendra à mettre en place votre feature engineering et votre hyperparameter tuning pour construire le meilleur modèle. Pour ça, vous utiliserez la libraire MLflow
- Mise en production avec Google Cloud Platform : Finalement, déployez votre code et votre modèle en production ! En utilisant Google Cloud AI Platform vous serez capable d'entraîner vos modèles à l'échelle, de les packager, les mettre en ligne, et les rendre disponibles à tous. Cerise sur le gâteau, apprenez à utiliser un environnement Docker pour déployer votre propre API Flask RESTful qui pourra être connectée à n'importe quelle interface Front-End.

Semaines 8 & 9 : Projets (80h)

Après ce premier projet e-commerce d'une semaine, vous passerez les deux semaines suivantes sur un projet de groupe en choisissant vous-même le problème de data science que vous souhaitez résoudre. Vous utiliserez un mélange de vos propres données (si vous voulez utiliser des données de votre entreprise ou association) et de données en open data (initiatives publiques, Kaggle... etc). Un excellent moyen de mettre en pratique les outils, techniques et méthodologies de la formation Data Science, qui vous fera prendre conscience de l'autonomie que vous avez acquise.

Cette formation est temporairement suspendue.

Voici des formations similaires :