DATA ANALYSE
Le Data Analyst ou business analyst traite et analyse les données dans une optique de prise de décision Business, organisationnelle, Projet etc...
En suivant ce cursus, vous aurez toutes les clefs pour y parvenir. Les compétences en Python, DataViz, mais également Machine Learning SQL ou Business intelligence. Un programme exhaustif qui fera de vous un Data Analyst opérationnel à l'aise avec toutes les technos utilisées sur le matché.
Informations pratiques:
- Parcours de formation Hybride mêlant sessions de coaching en visio conférence et autoformation sur notre plateforme full saas prete à coder.
- Nos professeurs sont également concepteur du programme pour garantir une cohérence et un suivi homogène tout au long du parcours.
- Des séances de coaching personnelle sont disponible chaque semaine pour les apprenants
- Chaque module est sanctionné un examen, corrigé à la main, pour validation
- Un projet fil-rouge, que vous allez devoir établir à partir de rien, représente environ 1/3 du temps alloué à votre formation: chaque semaine un point sera fait avec votre responsable de cohorte pour gérer l’avancement et la bonne compréhension des méthodes à mettre en pratique
Quelques compétences acquise à l’issue de la formation:
- Savoir représenter des problématiques et maîtriser la visualisation de données
- Créer des tableaux de bord, des tests d’hypothèses
- Utiliser des feuilles de calcul pour effectuer une analyse simple sur de petites quantités de données
- Utiliser SQL pour des analyses plus importante
Divisé en 6 blocs, la formation Data Analyst a été pensée pour répondre aux attentes métiers d’aujourd’hui, et créée avec les Chief Data Officer des plus grands groupes français.
1. Introduction à Python
Fondamentaux de python
- Découverte des différentes variables, listes et Tuples
- Présentation des divers opérateurs et structures de contrôle
- Initiation au concept de boucle et ses différents types
- Introduction aux fonctions et leurs documentations
- Instanciation de classes et utilisation de modules
NumPy
- Création et manipulation d’un Numpy array
- Présentation des opérations matricielles
- Création d’un indicateur statistique et applications
Pandas
- Chargement et première exploration d'un jeu de données
- Introduction au Data Cleaning
- Introduction au Data Processing
Data Quality (optionnel)
- Présentation des principes essentiels à la Data Quality
- Traitement des variables numériques et textuelles
- Introduction au nettoyage de données
- Initiation à la gestion des valeurs manquantes
2. Data Visualisation
Matplotlib
- Présentation de différents types de graphes:
Courbe
Graphique
Nuage de points
Histogrammes
- Introduction à la personnalisation de graphique
Seaborn
- Initiation à l'analyse de distribution
- Découverte de l'analyse statistique
- Initiation à l'analyse multivariée
Bokeh (facultatif)
- Formation à tous types de graphiques interactifs et intégrables sur page Web
Complément Matplotlib
- Présentation de graphiques avancés avec Matplotlib
- Création de figures avec classes et objets
3. Machine Learning
Algorithme et méthodologie de classification avec Scikit-Learn
- Présentation des algorithmes de classification ( Régression logistique, KNN, Arbre de décision, forêt aléatoire, SVM…)
- Initiation aux algorithmes de boosting et de Bagging
- Découverte des différents modèles et sélections
- Classification des données déséquilibrées
Méthode de réduction de dimension
- Introduction à l'analyse en composantes principales
- Présentation de l'algorithme T-SNE
- Introduction à l'analyse discriminante linéaire
- Découverte du clustering avec l'algorithme des K-means
Méthode de régression
- Introduction à la régression linéaire simple et multiple
- Introduction à la régression linéaire (ridge lasso, elastic-net)
4. Extraction et gestion de données textes
Text Mining
- Introduction aux expressions régulières
- Mise au point à la gestion de données textuelles
- Creation de Worldclouds
- Présentation de l'analyse de sentiments
WebScraping
- Introduction au langage web (HTML, CSS)
- Extraction de contenu Web avec BeautifulSoup
- Application du scrapping sur Google
5. Big Data / Database
Introduction au Data Engineering et Big Data
- Introduction aux 3V du Big Data (Volume, variété, vélocité)
- Présentation des bases de données et Architectures
- Mise en production de données
Data Processing et Machine Learning sur des grandes bases de données
- Introduction à PySpark
- Découverte des différentes fonctions de PySpark
Le Data Processing
Les Data Frames
La Régression avec PySpark
Le ML pipelines
Le Model Turning
6. Business Intelligence
Business Intelligence
- Introduction à la BI : concepts et usage
Power BI
- Connexion aux sources de données
- Data visualisation avec Power Query
- Relations et Modélisation de données transformées
- Introduction au langage DAX
- Création d’un tableau de bord approfondi et étude de cas
Tableau
- Connexion aux sources de données
- Mise en forme des données
- Présentation de la Data Visualisation
+ Le projet fil rouge
Cette formation est temporairement suspendue.
Voici des formations similaires :
BUSINESS ANALYST - formation certifiante à distance
4390 €
Bootcamp Data Analyst - formation certifiante RNCP
4500 €
Formation au métier de Data Analyst (Power BI, SQL, certification TOSA incluse)
3300 €
BUSINESS ANALYST - formation certifiante à distance
4390 €
Bootcamp Data Analyst - formation certifiante RNCP
4500 €
Formation au métier de Data Analyst (Power BI, SQL, certification TOSA incluse)
3300 €
Formation Microsoft Fabric
2980 €
Gérer et comprendre la BDESE (Base de Données Économiques, Sociales et Environnementales) pour mieux l'exploiter
930 €
Microsoft Power BI (Microsoft Certified : Data Analyst Associate)
1500 €
Les formations les plus recherchées
Cette formation est temporairement suspendue.
Voir des formations similaires