Pandas - avance
Data Value
Non finançable CPF
Tout public
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
2340 €
Durée
Nous contacter
Localité
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
Objectifs
Objectifs
Exploiter la librairie Pandas du langage Python pour traiter vos problématiques et projets en Data Science
Compétences visées
- Maîtriser la librairie Pandas pour l'analyse de données
- Connaître les subtilités des groupbys
- Savoir manipuler les tables pivots et les tableaux croisés
- Avoir des notions sur l'accélération des calculs avec Pandas
- Connaître les bonnes pratiques en Data Science
Exploiter la librairie Pandas du langage Python pour traiter vos problématiques et projets en Data Science
Compétences visées
- Maîtriser la librairie Pandas pour l'analyse de données
- Connaître les subtilités des groupbys
- Savoir manipuler les tables pivots et les tableaux croisés
- Avoir des notions sur l'accélération des calculs avec Pandas
- Connaître les bonnes pratiques en Data Science
Programme
- Tour d'horizon de la librairie Pandas
Vous utilisez Pandas pour vos analyses de données ou vos projets de Data Science, mais vous n'en maîtrisez pas tous les aspects ? Ce tour d'horizon vous permettra d'identifier toutes les possibilités qu'offre cette librairie. Par un exercice guidé, vous pourrez revoir les notions de bases pour l'utilisation de Pandas, des notions de visualisation de données avec Matplotlib, Pandas et Seaborn
Rappels sur les notions de bases de Pandas
Lecture de fichiers de données (csv, excel, SQL, parquet)
Description du jeu de données et analyse statistique simple
Implémenter des analyses et des visualisations différentes en fonction du type de données
Gestion des données manquantes
Manipulation de dates pour les Time Series
Gestion des chaînes de caractères
Mise en place des bonnes pratiques en Data Science
- Maîtriser les subtilités des groupbys
Les groupbys peuvent vous permettre de mieux appréhender les modalités dans votre jeu de données.
Groupby à simple indice avec les fonctions d'agrégations classiques
Personnalisation des fonctions d'agrégations
Groupby à multiples indices
Différence entre les fonctions apply et transform
Rappels sur les fonctions anonymes
- Tables pivots et tableaux croisés
Vous verrez par le biais de nombreux exemples et exercices, l‘intérêt des tables pivots et des tableaux croisés pour une représentation différente des jeux de données.
Fonctions d'agrégation et tables pivots
Matrice de contingence
Tableaux croisés
- Jointure de tables
Pour joindre des tables, il est possible de procéder par indice ou par colonne.
Notions d'axes
Concaténation
Merge selon une ou plusieurs clés
Jointure par rapport aux indices
- Atelier de mise en pratique sur une journée
Toutes les notions vues précédemment seront mises en pratique lors d'une journée de travaux pratiques sur un problème d'analyse de données complet mettant en oeuvre les bonnes pratiques à utiliser en Data Science.
- Accélération du calcul avec Pandas
Vous verrez quelles sont les librairies qui vous permettent de faire du multiprocessing avec Pandas
Boucler sur les lignes et les colonnes
Revenir aux basiques avec NumPy
Exemples avec la librairie Modin
Exemples avec la librairie Numba
Vous utilisez Pandas pour vos analyses de données ou vos projets de Data Science, mais vous n'en maîtrisez pas tous les aspects ? Ce tour d'horizon vous permettra d'identifier toutes les possibilités qu'offre cette librairie. Par un exercice guidé, vous pourrez revoir les notions de bases pour l'utilisation de Pandas, des notions de visualisation de données avec Matplotlib, Pandas et Seaborn
Rappels sur les notions de bases de Pandas
Lecture de fichiers de données (csv, excel, SQL, parquet)
Description du jeu de données et analyse statistique simple
Implémenter des analyses et des visualisations différentes en fonction du type de données
Gestion des données manquantes
Manipulation de dates pour les Time Series
Gestion des chaînes de caractères
Mise en place des bonnes pratiques en Data Science
- Maîtriser les subtilités des groupbys
Les groupbys peuvent vous permettre de mieux appréhender les modalités dans votre jeu de données.
Groupby à simple indice avec les fonctions d'agrégations classiques
Personnalisation des fonctions d'agrégations
Groupby à multiples indices
Différence entre les fonctions apply et transform
Rappels sur les fonctions anonymes
- Tables pivots et tableaux croisés
Vous verrez par le biais de nombreux exemples et exercices, l‘intérêt des tables pivots et des tableaux croisés pour une représentation différente des jeux de données.
Fonctions d'agrégation et tables pivots
Matrice de contingence
Tableaux croisés
- Jointure de tables
Pour joindre des tables, il est possible de procéder par indice ou par colonne.
Notions d'axes
Concaténation
Merge selon une ou plusieurs clés
Jointure par rapport aux indices
- Atelier de mise en pratique sur une journée
Toutes les notions vues précédemment seront mises en pratique lors d'une journée de travaux pratiques sur un problème d'analyse de données complet mettant en oeuvre les bonnes pratiques à utiliser en Data Science.
- Accélération du calcul avec Pandas
Vous verrez quelles sont les librairies qui vous permettent de faire du multiprocessing avec Pandas
Boucler sur les lignes et les colonnes
Revenir aux basiques avec NumPy
Exemples avec la librairie Modin
Exemples avec la librairie Numba
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation
Ces formations peuvent vous intéresser
Les formations les plus recherchées
Lyon
Toulouse
Marseille
Montpellier
Paris
Bordeaux
Dijon
Mâcon
Nantes
Rennes
Informatique CPF
Informatique en Ligne
Data science
Data science CPF
Data scientist
Technicien informatique
Technicien support informatique
Administrateur systeme
Consultant en informatique
Spark
Programmation
Technicien reseaux
Administrateur reseau
Hadoop
Data science Alfortville
Data scientist Alfortville
Data scientist Antony
Data science Antony
Data science Argenteuil
Data scientist Argenteuil
Data scientist Asnières-sur-Seine
Data science Asnières-sur-Seine
Data science Athis-Mons
Data scientist Athis-Mons