Realiser ses analyses statistiques avec Python
Data Value
Non finançable CPF
Tout public
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
Nous contacter
Durée
Nous contacter
Localité
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
Objectifs
Apprendre à utiliser le langage Python pour analyser des données. Mettre en œuvre avec Python les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles.
Programme
- Introduction et mise en place de l'environnement
- Manipulation et nettoyage des données
- Analyses exploratoires des données (EDA)
- Introduction aux tests statistiques
- Régression linéaire et introduction à la modélisation
- Découvrir les principales méthodes d'analyse multidimensionnelle des données à l'aide de la bibliothèque Prince
- Installation et configuration des environnements (Anaconda, Jupyter Notebook)
- Présentation des bibliothèques Python clés pour les statistiques (Pandas, Matplotlib, Scipy, Statsmodels)
- Manipulation et nettoyage des données
- Chargement et exploration des données avec Pandas
- Lecture/écriture de fichiers CSV, Excel, JSON
- Traitement des données manquantes
- Gestion des types de données et transformations
- Analyses exploratoires des données (EDA)
- Calculs de statistiques descriptives
- Moyennes, médianes, quartiles, variance, écart-type
- Création de résumés statistiques groupés
- Visualisations avec Matplotlib et Seaborn
- Histogrammes, boxplots, nuages de points
- Introduction aux tests statistiques
- Bases des tests d'hypothèses
- Concepts : p-value, seuils de significativité, hypothèses nulle et alternative
- Tests courants avec SciPy
- Test t (indépendant et pairé)
- Tests de normalité (Shapiro-Wilk)
- Tests du chi-carré pour les tables de contingence
- Interprétation des résultats
- Régression linéaire et introduction à la modélisation
- Introduction aux modèles linéaires
- Régression linéaire simple avec Statsmodels
- Analyse des coefficients et des résidus
- Régression multiple
- Construction d'un modèle avec plusieurs variables explicatives
- Validation du modèle (tests de significativité, R²)
- Introduction à la régression logistique
- Concepts de base et mise en œuvre pour les données catégoriques
- Découvrir les principales méthodes d'analyse multidimensionnelle des données à l'aide de la bibliothèque Prince
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation
Ces formations peuvent vous intéresser
BUSINESS ANALYST - formation certifiante à distance
PARIS 11E
Finançable CPF
À distance / En centre / En entreprise
Tout public
DataBird
Power BI : Analyser des données et créer des rapports + Analyse et Modélisation avec le langage DAX
NANTES, STRASBOURG, BORDEAUX ET 8 AUTRE(S) LOCALITÉ(S)
Finançable CPF
À distance / En centre
Salarié en poste / Demandeur d'emploi / Entreprise
Dawan
Formation Power BI débutant
À DISTANCE
Finançable CPF
À distance / En entreprise
Salarié en poste / Demandeur d'emploi / Entreprise
Les formations les plus recherchées
Lyon
Toulouse
Marseille
Montpellier
Paris
Bordeaux
Dijon
Mâcon
Nantes
Rennes
Audit CPF
Audit en Ligne
Statisticien
Statisticien CPF
Statisticien en Ligne
Analyste de donnees
Auditeur qualite
Audit interne
Statisticien Alfortville
Statisticien Antony
Statisticien Argenteuil
Statisticien Asnières-sur-Seine
Statisticien Athis-Mons
Statisticien Aubervilliers
Statisticien Aulnay-sous-Bois
Statisticien Bagneux
Statisticien Bagnolet
Statisticien Beaumont-sur-Oise