
Formation Data Scientist
Artefact School of Data
Maîtrisez les compétences fondamentales d'un Data Scientist en quelques semaines :
Collectez
Devenez un maître dans l’extraction des données de diverses sources pour résoudre des problèmes complexes (Bases de données, fichiers, API…)
Analysez
Apprenez à déchiffrer l’histoire que racontent les données, utilisez des techniques avancées pour découvrir des tendances et présentez vos résultats de manière captivante à travers des tableaux de bord automatisés
Modélisez
Passez maître dans l’art de prédire l’avenir en créant des modèles prédictifs et en développant des algorithmes de machine learning et de deep learning pour résoudre des tâches complexes
Automatisez
Mettez vos compétences en pratique en déployant vos modèles dans le cloud, automatisez vos processus de données, et optimisez vos performances pour garantir une efficacité à long terme.
Nous avons défini ces objectifs avec les experts métiers du leader mondial de la data, Artefact. C'est également eux qui vous délivreront leur expertise à travers ce programme de formation exclusivement conçu à partir des problématiques réelles que l'on rencontre chez nos clients.
Durant le bootcamp, vous travaillerez en immersion au sein du cabinet de conseil Artefact, aux côtés des plus grands experts de la data et sur des uses-cases constamment mis à jour en fonction des derniers défis data rencontrés chez nos clients internationaux. 90% de la formation est basé sur la pratique, melant challenge en autonomie et en groupe. Rien de mieux pour devenir un as de la data.
Vous beneficiez également d'un mentor tout le long de la formation. il vous guidera sur vos choix professionnels et, vous aidera pour vos entretiens.
- Principes de base de la programmation Python et environnement de travail
- Structuration des données en Python et manipulation des données avec Pandas
- Visualisation des données avec Matplotlib
- Statistiques pour la data science
- Programmation
- Introduction au web scraping et à l’utilisation d’API pour la collecte de données
- Travailler avec des formats de données structurés et non structurés (par exemple CSV, JSON, XML)
- Introduction aux concepts de SQL et des bases de données (ex. normalisation, indexation)
- Utiliser des bases de données SQL (par exemple, MySQL, PostgreSQL)
- Sourcing des données à partir de fichiers, de web scraping ou d’API
- Manipuler les données avec Python, Pandas et Numpy
- Interroger/stocker des données avec SQL et Google Big Query
- Visualisation avec Jupyter Notebook, Matplotlib, Seaborn et Plotly
- Algorithmes d’apprentissage supervisé (classification, régression)
- Algorithmes d’apprentissage non supervisé (clustering, réduction de dimension, graphes)
- Méthodes ensemblistes (random forest, boosting)
- Modèles de recommandation, séries temporelles, détection d’anomalies
- Dérouler un projet de machine learning (préparation des données, mesure de performance, optimisation des hyperparamètres, gestion du sur-apprentissage, validation croisée et régularisation)
- Prétraitement des données textuelles (par ex. tokénisation, déformation, lemmatisation)
- Bags of words, similarités et vectorisation
- Applications NLP (classification de textes, analyse de sentiments, reconnaissance d’entités nommées)
- Architectures de réseaux neuronaux (perceptron multicouches, réseaux neuronaux convolutifs, réseaux neuronaux récurrents)
- Applications de l’apprentissage profond (vision par ordinateur, traitement du langage naturel, génération)
- Techniques avancées d’apprentissage profond (apprentissage par transfert, apprentissage par renforcement, transformers)
- Création et utilisation des conteneurs logiciels pour vos applications avec Docker
- Orchestrer des conteneurs sur des clusters de serveurs avec Kubernetes et automatiser le déploiement avec Kubeflow
- Déploiement dans le cloud de Google Cloud Platform, Amazon Web Services ou Microsoft Azure
- Construction des architectures de calcul distribué pour le traitement de volumes massifs de données (Hadoop, Spark)
- DataOps : API, pipelines, infrastructure as code, streaming
- MLOps : versionning, packaging, tests, monitoring et cycle de vie
+ Projet
Cette formation est temporairement suspendue.
Voici des formations similaires :
Débutant Power BI

Python pour la data science

Data Analytics

Data Scientist et IA - Formation certifiante à Distance

DATA SCIENTIST - certifié par Formation Continue Panthéon-Sorbonne

DATA SCIENTIST | Titre RNCP niveau 7 - Bac +5 | Co-certifiée école MINES Paris - PSL

Les formations les plus recherchées
Cette formation est temporairement suspendue.
Voir des formations similaires