Realiser ses analyses statistiques avec Python

Data Value

Non finançable CPF
Tout public
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
Nous contacter
Durée
Nous contacter
Localité
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
En savoir plus sur les localités en présentiel
Cette formation est disponible dans les centres de formation suivants:
  • 69 - Lyon 2e
Cette formation peut être dispensée dans votre entreprise dans les localités suivantes :
  • 01 - Ain
  • 03 - Allier
  • 07 - Ardèche
  • 15 - Cantal
  • 26 - Drôme
  • 38 - Isère
  • 42 - Loire
  • 43 - Haute-Loire
  • 63 - Puy-de-Dôme
  • 69 - Rhône
  • 73 - Savoie
  • 74 - Haute-Savoie
Objectifs


Apprendre à utiliser le langage Python pour analyser des données. Mettre en œuvre avec Python les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles.
Programme
- Introduction et mise en place de l'environnement

  • Installation et configuration des environnements (Anaconda, Jupyter Notebook)

  • Présentation des bibliothèques Python clés pour les statistiques (Pandas, Matplotlib, Scipy, Statsmodels)


- Manipulation et nettoyage des données

  • Chargement et exploration des données avec Pandas

    • Lecture/écriture de fichiers CSV, Excel, JSON

    • Traitement des données manquantes

    • Gestion des types de données et transformations




- Analyses exploratoires des données (EDA)

  • Calculs de statistiques descriptives

    • Moyennes, médianes, quartiles, variance, écart-type

    • Création de résumés statistiques groupés



  • Visualisations avec Matplotlib et Seaborn

    • Histogrammes, boxplots, nuages de points




- Introduction aux tests statistiques

  • Bases des tests d'hypothèses

    • Concepts : p-value, seuils de significativité, hypothèses nulle et alternative



  • Tests courants avec SciPy

    • Test t (indépendant et pairé)

    • Tests de normalité (Shapiro-Wilk)

    • Tests du chi-carré pour les tables de contingence



  • Interprétation des résultats


- Régression linéaire et introduction à la modélisation

  • Introduction aux modèles linéaires

    • Régression linéaire simple avec Statsmodels

    • Analyse des coefficients et des résidus



  • Régression multiple

    • Construction d'un modèle avec plusieurs variables explicatives

    • Validation du modèle (tests de significativité, R²)



  • Introduction à la régression logistique

    • Concepts de base et mise en œuvre pour les données catégoriques




- Découvrir les principales méthodes d'analyse multidimensionnelle des données à l'aide de la bibliothèque Prince

Envie d’en savoir plus sur cette formation ?

Documentez-vous sur la formation

Quelle est votre situation ?

Haut de page