Realiser ses analyses statistiques avec Python

Data Value

Non finançable CPF
Tout public
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
Nous contacter
Durée
Nous contacter
Localité
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
En savoir plus sur les localités en présentiel
Cette formation est disponible dans les centres de formation suivants:
  • 69 - Lyon 2e
Cette formation peut être dispensée dans votre entreprise dans les localités suivantes :
  • 01 - Ain
  • 03 - Allier
  • 07 - Ardèche
  • 15 - Cantal
  • 26 - Drôme
  • 38 - Isère
  • 42 - Loire
  • 43 - Haute-Loire
  • 63 - Puy-de-Dôme
  • 69 - Rhône
  • 73 - Savoie
  • 74 - Haute-Savoie
Objectifs


Apprendre à utiliser le langage Python pour analyser des données. Mettre en œuvre avec Python les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles.
Programme
- Introduction et mise en place de l'environnement

  • Installation et configuration des environnements (Anaconda, Jupyter Notebook)

  • Présentation des bibliothèques Python clés pour les statistiques (Pandas, Matplotlib, Scipy, Statsmodels)


- Manipulation et nettoyage des données

  • Chargement et exploration des données avec Pandas

    • Lecture/écriture de fichiers CSV, Excel, JSON

    • Traitement des données manquantes

    • Gestion des types de données et transformations




- Analyses exploratoires des données (EDA)

  • Calculs de statistiques descriptives

    • Moyennes, médianes, quartiles, variance, écart-type

    • Création de résumés statistiques groupés



  • Visualisations avec Matplotlib et Seaborn

    • Histogrammes, boxplots, nuages de points




- Introduction aux tests statistiques

  • Bases des tests d'hypothèses

    • Concepts : p-value, seuils de significativité, hypothèses nulle et alternative



  • Tests courants avec SciPy

    • Test t (indépendant et pairé)

    • Tests de normalité (Shapiro-Wilk)

    • Tests du chi-carré pour les tables de contingence



  • Interprétation des résultats


- Régression linéaire et introduction à la modélisation

  • Introduction aux modèles linéaires

    • Régression linéaire simple avec Statsmodels

    • Analyse des coefficients et des résidus



  • Régression multiple

    • Construction d'un modèle avec plusieurs variables explicatives

    • Validation du modèle (tests de significativité, R²)



  • Introduction à la régression logistique

    • Concepts de base et mise en œuvre pour les données catégoriques




- Découvrir les principales méthodes d'analyse multidimensionnelle des données à l'aide de la bibliothèque Prince

Envie d’en savoir plus sur cette formation ?

Documentez-vous sur la formation

Ces formations peuvent vous intéresser

Quelle est votre situation ?

Vous êtes ?

Veuillez choisir un lieu

Please fill out this field.

Please fill out this field.

Veuillez sélectionner un niveau de formation

Informez-vous gratuitement et sans engagement sur la formation.

Please fill out this field.

Please fill out this field.

Please fill out this field.

Veuillez saisir une adresse email

  • Vous voulez dire ?
  • ou plutôt ?

En cliquant sur "J'envoie ma demande", vous acceptez les CGU et déclarez avoir pris connaissance de la politique de protection des données du site maformation.fr

Haut de page