▷ Offre de Formation Python pour la data science avec Stat4decision | MaFormation.fr
Stat4decision

Python pour la data science

Stat4decision

Non finançable CPF
Salarie / Entreprise
En ligne
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Étudiant
Prix
2400 €
Durée
28 heures (4 jours) en présentiel ou en distanciel
Niveau visé
Niveau BAC + 3/4
Pré-requis
  • Connaissances de base en traitement de données (statistique et
    tables de données)
  • Pas de prérequis en python
Certifications
Datadock Qualiopi
Le plus de la formation
Découvrez le langage python pour des applications en data science
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
En savoir plus sur les localités en présentiel
Cette formation est disponible dans les centres de formation suivants:
  • 75 - Paris 12e
Cette formation peut être dispensée dans votre entreprise dans les localités suivantes :
  • 01 - Ain
  • 02 - Aisne
  • 03 - Allier
  • 04 - Alpes-de-Haute-Provence
  • 05 - Hautes-Alpes
  • 06 - Alpes-Maritimes
  • 07 - Ardèche
  • 08 - Ardennes
  • 09 - Ariège
  • 10 - Aube
  • 11 - Aude
  • 12 - Aveyron
  • 13 - Bouches-du-Rhône
  • 14 - Calvados
  • 15 - Cantal
  • 16 - Charente
  • 17 - Charente-Maritime
  • 18 - Cher
  • 19 - Corrèze
  • 21 - Côte-d'Or
  • 22 - Côtes-d'Armor
  • 23 - Creuse
  • 24 - Dordogne
  • 25 - Doubs
  • 26 - Drôme
  • 27 - Eure
  • 28 - Eure-et-Loir
  • 29 - Finistère
  • 2A - Corse-du-Sud
  • 2B - Haute-Corse
  • 30 - Gard
  • 31 - Haute-Garonne
  • 32 - Gers
  • 33 - Gironde
  • 34 - Hérault
  • 35 - Ille-et-Vilaine
  • 36 - Indre
  • 37 - Indre-et-Loire
  • 38 - Isère
  • 39 - Jura
  • 40 - Landes
  • 41 - Loir-et-Cher
  • 42 - Loire
  • 43 - Haute-Loire
  • 44 - Loire-Atlantique
  • 45 - Loiret
  • 46 - Lot
  • 47 - Lot-et-Garonne
  • 48 - Lozère
  • 49 - Maine-et-Loire
  • 50 - Manche
  • 51 - Marne
  • 52 - Haute-Marne
  • 53 - Mayenne
  • 54 - Meurthe-et-Moselle
  • 55 - Meuse
  • 56 - Morbihan
  • 57 - Moselle
  • 58 - Nièvre
  • 59 - Nord
  • 60 - Oise
  • 61 - Orne
  • 62 - Pas-de-Calais
  • 63 - Puy-de-Dôme
  • 64 - Pyrénées-Atlantiques
  • 65 - Hautes-Pyrénées
  • 66 - Pyrénées-Orientales
  • 67 - Bas-Rhin
  • 68 - Haut-Rhin
  • 69 - Rhône
  • 70 - Haute-Saône
  • 71 - Saône-et-Loire
  • 72 - Sarthe
  • 73 - Savoie
  • 74 - Haute-Savoie
  • 75 - Paris
  • 76 - Seine-Maritime
  • 77 - Seine-et-Marne
  • 78 - Yvelines
  • 79 - Deux-Sèvres
  • 80 - Somme
  • 81 - Tarn
  • 82 - Tarn-et-Garonne
  • 83 - Var
  • 84 - Vaucluse
  • 85 - Vendée
  • 86 - Vienne
  • 87 - Haute-Vienne
  • 88 - Vosges
  • 89 - Yonne
  • 90 - Territoire de Belfort
  • 91 - Essonne
  • 92 - Hauts-de-Seine
  • 93 - Seine-Saint-Denis
  • 94 - Val-de-Marne
  • 95 - Val-d'Oise
Objectifs

Python est devenu incontournable dans le domaine de la Data Science, grâce à sa simplicité, sa puissance et ses bibliothèques spécialisées pour l’analyse et la visualisation de données. Cette formation vous permettra de prendre en main rapidement ce langage afin d’acquérir des compétences concrètes et directement applicables dans vos projets d'analyse et de traitement de données.

À l'issue de la formation, vous serez capable de :

  • Maîtriser les fondamentaux du langage Python (syntaxe, structures de données, fonctions et modules).
  • Importer, manipuler et analyser efficacement vos données avec Python.
  • Automatiser vos tâches récurrentes de traitement et d'analyse de données grâce à des scripts Python.
  • Identifier et utiliser les principales bibliothèques Python dédiées à la Data Science (pandas, NumPy, matplotlib, seaborn, scikit-learn, etc.).
Programme

Jour 1 - Python aujourd’hui : bases et bonnes pratiques

  • Introduction au langage python
    • Pour qui ? Pour quoi faire ? Comment ?
    • Les consoles et le débogage en python
    • Le langage (la syntaxe, les structures (string, listes, dictionnaires…), les opérateurs et les fonctions)
    • Construction d’un outil de calcul de statistiques simples
    • Les classes, les objets et la création de bibliothèques
  • Python pour le traitement des données
    • Le processus de développement d’un outil en python pour la data science

Jour 2 – Manipulation et préparation des données avec pandas

  • Importation de données
    • CSV, Excel
    • Fichiers texte
    • Bases de données (SQL – principes, exemples)
    • Données issues du web (API, scraping léger)
  • Manipulation de données avec pandas
    • DataFrame : concepts fondamentaux
    • Sélection, filtrage, tri
    • Création et transformation de variables
    • Jointures et concaténations
    • Gestion des données manquantes
  • Préparation des données pour l’analyse
    • Nettoyage et contrôles de qualité
    • Typage des variables
    • Variables catégorielles
    • Travail sur les dates et les données textuelles
    • Agrégations (groupby, pivots)
  • Automatisation des traitements
    • Fonctions appliquées aux DataFrames
    • Chaînage des transformations
    • Atelier fil rouge : préparation complète d’un jeu de données

Jour 3 – Visualisation et analyse exploratoire

  • Principes de la data visualisation
    • Pourquoi visualiser ?
    • Erreurs classiques
    • Choisir le bon graphique pour la bonne question
  • Visualisation avec matplotlib & seaborn
    • Histogrammes, boxplots, scatter plots
    • Comparaison de groupes
    • Visualisations multivariées
    • Personnalisation minimale mais lisible
  • Analyse exploratoire (EDA)
    • Lire une distribution
    • Détecter des anomalies
    • Comprendre des relations entre variables
    • Interpréter sans sur-interpréter
  • Visualisation interactive (ou dashboards légers)
    • Introduction aux visualisations interactives
      • Plotly
      • Streamlit
    • Atelier : exploration visuelle complète d’un jeu de données

Jour 4 – Introduction au machine learning et mise en production 

  • Comprendre le machine learning (sans jargon inutile)
    • Apprentissage supervisé / non supervisé
    • Régression vs classification
    • Sur-apprentissage, biais, variance
    • Importance de la validation
  • Préparation des données pour le ML
    • Séparation train / test
    • Standardisation et encodage
    • Pipelines avec scikit-learn
  • Cas pratiques de machine learning
    • Régression (prévision, scoring)
    • Classification simple
    • Clustering (k-means, segmentation)
  • Industrialisation et bonnes pratiques
    • Pipelines complets (préparation + modèle)
    • Sauvegarde et rechargement de modèles
    • Automatisation de traitements
    • Discussion sur le passage à la production

Formations courtes

accessibles à tous

7 participants

maximum par sessions

Centre

À propos du centre Stat4decision

Stat4decision est un organisme de formation spécialisé dans la data. Si vous recherchez à acquérir des compétences dans le domaine de la data science ou de la business intelligence, nous avons des formations adaptées à vos besoins.

Nous proposons des formations en petits groupes en inter-entreprises dans nos salles de formations à Paris. Mais aussi en salle de classe virtuelle ainsi qu'en blended learning grâce à des outils novateurs. Nous proposons aussi des formations sur mesures pour vos équipes dans vos locaux.

Envie d’en savoir plus sur cette formation ?

Documentez-vous sur la formation

Certification Datadock
Certification Qualiopi

Quelle est votre situation ?

Haut de page