
Machine Learning Engineering for Production (MLOps)
Maîtriser l’ensemble du cycle de vie d’un projet de Machine Learning
Maîtriser le système d’exploitation Linux
Apprendre à utiliser un terminal
Créer et gérer des exécutables Bash
Maîtriser les outils de versioning
Coopérer et sauvegarder des projets avec Git et Github
Automatiser les workflows grâce à Github Actions
Comprendre le fonctionnement des workflows en général et CI/CD en particulier
Etre capable de gérer des tests unitaires
Vérifier le fonctionnement d’unités de code indépendantes lors du développement
Maîtriser la bibliothèque Beautiful Soup pour le Web Scraping
Comprendre les APIs
Apprendre à créer une API avec Flask et FastAPI
Requêter une API HTTP
Comprendre la virtualisation
Maîtriser les techniques et outils de conteneurisation et d’orchestration des conteneurs
Comprendre les principes d’orchestration
Automatiser des tâches précises grâce à
la maîtrise d’Apache Airflow
Gérer les montées en charge grâce à Kubernetes
Maîtrise de l’architecture MLFlow
Web Scraping :
Introduction au Web Scraping
Introduction aux langages web
Web Scraping avec la bibliothèque Beautiful Soup
Web Scraping de recherches Google
Système Linux et Script Bash :
Présentation des systèmes Linux
Prise en main et utilisation d’un terminal
Mise en place de scripts Bash
Git et Github :
Introduction au système de contrôle Git
Découverte du travail collaboratif sur Git et Github
Gestion des projets Git avec le système de dépôts
Partage de fichiers et des projets grâce à la fonction push
Mise à jour de votre dépôt local grâce au pull
Participation à l’amélioration de projets publics
Introduction aux workflows ainsi qu’à leur automatisation grâce à Github Actions
Mise en place de tests unitaires avec Pytest
Introduction aux tests d’intégration et leurs fonctions
Présentation des avantages des tests
DATA OPS - ISOLATION - durée 29h
API :
Introduction aux APIs et découverte des architectures micro-services
Présentation des différentes méthodes HTTP et de leurs fonctions
Utilisation des librairies FastAPI et Flask pour développer des API
Documentation d’une API avec la spécification OpenAPI
Gestion des erreurs et des performances d’une API
Mettre en place la sécurité dans les API
avec Flask et FastAPI
Sécurisation des API :
Introduction à la sécurité des APIs et des clés API (API Keys)
Maîtrise de l’authentification HTTP Basique
Introduction aux JSON Web Token et HTTPS
Docker :
Présentation de la conteneurisation et de son utilité par rapport à la virtualisation
Initiation au fonctionnement de Docker
Manipulation des images et des conteneurs
Communication avec les conteneurs
Persistance des données grâce aux volumes
Création d’une image Docker via Dockerfile
Partage des images sur le Dockerhub
Utilisation de docker-compose
DATA OPS - ORCHESTRATION - durée 18h
Kubernetes :
Déployer et gérer des conteneurs
Orchestrer plusieurs services et gérer les
montées en charge
Airflow :
Découverte des concepts d’Airflow
Présentation des principes de
l’orchestration et leur utilité
Graphe orienté acycliques ou DAG
(Directed Acyclic Graphs)
Opérateurs
Gestion des tâches par le biais
d’Operators spécifiques
Monitoring des DAGs via l’interface
graphique d’Airflow
MODELOPS - durée 8h
MLFlow :
Cycle de vie d’un projet de Machine
Learning
Data Preparation
Model training
Model deploying
Model serving
Présentation de l’architecture MLFlow
Acculturation Data (optionnel) :
RGPD et éthique dans la data
Les métiers de la data
Gérer une équipe data
Définitions des termes les plus utilisés en data
Formation diplômante
inscrite au RNCP
Financement facilité
CPF, OPCA, etc.
Professeur dédié
5 jours sur 7
Financement
Des solutions de financement pour vous aider
À propos du centre DATASCIENTEST
Leader français de la formation en Data Science, DataScientest offre un apprentissage d’excellence orienté emploi pour professionnels et particuliers.
Notre dispositif joui de plusieurs avantages qui expliquent ce succès:
Un système d’apprentissage hybride innovant:
Notre formation repose sur un dispositif reposant à la fois sur une plateforme full Saas de E-Learning et un accompagnement personnalisé de cours et coaching en distanciel (depuis la crise sanitaire). Le rapport est d’environ 85% et 15%. Ceci permet d’allier la flexibilité et rigueur qui assure un taux de satisfaction de 94% et de complétion de 99%.
Deux options de rythme:
Une formation en format Bootcamp, intensive sur une base de 35h par semaine idéale pour les reconversion et une formation continue d’environ 5/7h par semaine qui permet de conjuguer formation et projets professionnels ou personnels.Des professeurs-concepteurs maître de leurs disciplines:
Tous nos professeurs, issus des meilleures écoles d’ingénieur (Polytechnique, Centrale…), travaillent à temps plein pour DataScientest à la fois dans la conception de nouvelles formations, dans le coaching personnel des apprenants, la R&D… Nous ne ferons jamais appel à des prestataires externes pour une meilleure maîtrise des sujets abordés.
Ce dispositif explique qu’en l’espace de quatre ans, plus de 35 entreprises du CAC40 et de nombreux autres champions français et étrangers nous ont déjà fait confiance pour former quelque 1500 professionnels. Entre temps, et depuis le lancement de notre offre pour particuliers il y a un an, environ 2 cohortes sont lancées tous les mois.
Nous proposons trois formations aux data sciences aux prérequis plus ou moins exigeant: Data Analyst, Data Scientist, Data Engineer, toutes éligibles à une certification de l’Université Panthéon Sorbonne et de l'école MINES ParisTech.
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation


