
DATA ANALYSE
Le Data Analyst ou business analyst traite et analyse les données dans une optique de prise de décision Business, organisationnelle, Projet etc...
En suivant ce cursus, vous aurez toutes les clefs pour y parvenir. Les compétences en Python, DataViz, mais également Machine Learning SQL ou Business intelligence. Un programme exhaustif qui fera de vous un Data Analyst opérationnel à l'aise avec toutes les technos utilisées sur le matché.
Informations pratiques:
- Parcours de formation Hybride mêlant sessions de coaching en visio conférence et autoformation sur notre plateforme full saas prete à coder.
- Nos professeurs sont également concepteur du programme pour garantir une cohérence et un suivi homogène tout au long du parcours.
- Des séances de coaching personnelle sont disponible chaque semaine pour les apprenants
- Chaque module est sanctionné un examen, corrigé à la main, pour validation
- Un projet fil-rouge, que vous allez devoir établir à partir de rien, représente environ 1/3 du temps alloué à votre formation: chaque semaine un point sera fait avec votre responsable de cohorte pour gérer l’avancement et la bonne compréhension des méthodes à mettre en pratique
Quelques compétences acquise à l’issue de la formation:
- Savoir représenter des problématiques et maîtriser la visualisation de données
- Créer des tableaux de bord, des tests d’hypothèses
- Utiliser des feuilles de calcul pour effectuer une analyse simple sur de petites quantités de données
- Utiliser SQL pour des analyses plus importante
Divisé en 6 blocs, la formation Data Analyst a été pensée pour répondre aux attentes métiers d’aujourd’hui, et créée avec les Chief Data Officer des plus grands groupes français.
1. Introduction à Python
Fondamentaux de python
- Découverte des différentes variables, listes et Tuples
- Présentation des divers opérateurs et structures de contrôle
- Initiation au concept de boucle et ses différents types
- Introduction aux fonctions et leurs documentations
- Instanciation de classes et utilisation de modules
NumPy
- Création et manipulation d’un Numpy array
- Présentation des opérations matricielles
- Création d’un indicateur statistique et applications
Pandas
- Chargement et première exploration d'un jeu de données
- Introduction au Data Cleaning
- Introduction au Data Processing
Data Quality (optionnel)
- Présentation des principes essentiels à la Data Quality
- Traitement des variables numériques et textuelles
- Introduction au nettoyage de données
- Initiation à la gestion des valeurs manquantes
2. Data Visualisation
Matplotlib
- Présentation de différents types de graphes:
Courbe
Graphique
Nuage de points
Histogrammes
- Introduction à la personnalisation de graphique
Seaborn
- Initiation à l'analyse de distribution
- Découverte de l'analyse statistique
- Initiation à l'analyse multivariée
Bokeh (facultatif)
- Formation à tous types de graphiques interactifs et intégrables sur page Web
Complément Matplotlib
- Présentation de graphiques avancés avec Matplotlib
- Création de figures avec classes et objets
3. Machine Learning
Algorithme et méthodologie de classification avec Scikit-Learn
- Présentation des algorithmes de classification ( Régression logistique, KNN, Arbre de décision, forêt aléatoire, SVM…)
- Initiation aux algorithmes de boosting et de Bagging
- Découverte des différents modèles et sélections
- Classification des données déséquilibrées
Méthode de réduction de dimension
- Introduction à l'analyse en composantes principales
- Présentation de l'algorithme T-SNE
- Introduction à l'analyse discriminante linéaire
- Découverte du clustering avec l'algorithme des K-means
Méthode de régression
- Introduction à la régression linéaire simple et multiple
- Introduction à la régression linéaire (ridge lasso, elastic-net)
4. Extraction et gestion de données textes
Text Mining
- Introduction aux expressions régulières
- Mise au point à la gestion de données textuelles
- Creation de Worldclouds
- Présentation de l'analyse de sentiments
WebScraping
- Introduction au langage web (HTML, CSS)
- Extraction de contenu Web avec BeautifulSoup
- Application du scrapping sur Google
5. Big Data / Database
Introduction au Data Engineering et Big Data
- Introduction aux 3V du Big Data (Volume, variété, vélocité)
- Présentation des bases de données et Architectures
- Mise en production de données
Data Processing et Machine Learning sur des grandes bases de données
- Introduction à PySpark
- Découverte des différentes fonctions de PySpark
Le Data Processing
Les Data Frames
La Régression avec PySpark
Le ML pipelines
Le Model Turning
6. Business Intelligence
Business Intelligence
- Introduction à la BI : concepts et usage
Power BI
- Connexion aux sources de données
- Data visualisation avec Power Query
- Relations et Modélisation de données transformées
- Introduction au langage DAX
- Création d’un tableau de bord approfondi et étude de cas
Tableau
- Connexion aux sources de données
- Mise en forme des données
- Présentation de la Data Visualisation
+ Le projet fil rouge
Formation diplômante
inscrite au RNCP
Financement facilité
CPF, OPCA, etc.
Professeur dédié
5 jours sur 7
Financement
Des solutions de financement pour vous aider
À propos du centre DATASCIENTEST
Leader français de la formation en Data Science, DataScientest offre un apprentissage d’excellence orienté emploi pour professionnels et particuliers.
Notre dispositif joui de plusieurs avantages qui expliquent ce succès:
Un système d’apprentissage hybride innovant:
Notre formation repose sur un dispositif reposant à la fois sur une plateforme full Saas de E-Learning et un accompagnement personnalisé de cours et coaching en distanciel (depuis la crise sanitaire). Le rapport est d’environ 85% et 15%. Ceci permet d’allier la flexibilité et rigueur qui assure un taux de satisfaction de 94% et de complétion de 99%.
Deux options de rythme:
Une formation en format Bootcamp, intensive sur une base de 35h par semaine idéale pour les reconversion et une formation continue d’environ 5/7h par semaine qui permet de conjuguer formation et projets professionnels ou personnels.Des professeurs-concepteurs maître de leurs disciplines:
Tous nos professeurs, issus des meilleures écoles d’ingénieur (Polytechnique, Centrale…), travaillent à temps plein pour DataScientest à la fois dans la conception de nouvelles formations, dans le coaching personnel des apprenants, la R&D… Nous ne ferons jamais appel à des prestataires externes pour une meilleure maîtrise des sujets abordés.
Ce dispositif explique qu’en l’espace de quatre ans, plus de 35 entreprises du CAC40 et de nombreux autres champions français et étrangers nous ont déjà fait confiance pour former quelque 1500 professionnels. Entre temps, et depuis le lancement de notre offre pour particuliers il y a un an, environ 2 cohortes sont lancées tous les mois.
Nous proposons trois formations aux data sciences aux prérequis plus ou moins exigeant: Data Analyst, Data Scientist, Data Engineer, toutes éligibles à une certification de l’Université Panthéon Sorbonne et de l'école MINES ParisTech.
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation



Formation au métier de Data Analyst (Power BI, SQL, certification...
