Python pour la data science
Data Value
Non finançable CPF
Tout public
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
3900 €
Durée
Nous contacter
Niveau visé
Non diplômante
Localité
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
Objectifs
Objectifs
Apprendre à utiliser le langage Python et ses principales librairies scientifiques pour traiter, visualiser et modéliser les données en Data Science
Compétences visées
- Identifier et utiliser les librairies incontournables de Python pour la data science : La Scipy Stack
- Identifier et utiliser les principales librairies de visualisation de données et notamment orientées cartographie
- Savoir manipuler des données volumineuses ne tenant pas en mémoire
- Avoir une bonne compréhension de l'écosystème scientifique de Python, savoir trouver ses librairies et juger de leur qualité
Apprendre à utiliser le langage Python et ses principales librairies scientifiques pour traiter, visualiser et modéliser les données en Data Science
Compétences visées
- Identifier et utiliser les librairies incontournables de Python pour la data science : La Scipy Stack
- Identifier et utiliser les principales librairies de visualisation de données et notamment orientées cartographie
- Savoir manipuler des données volumineuses ne tenant pas en mémoire
- Avoir une bonne compréhension de l'écosystème scientifique de Python, savoir trouver ses librairies et juger de leur qualité
Programme
-L'écosystème scientifique Python
Les incontournables: Numpy, Scipy, Pandas, Matplotlib et iPython qui sont le ciment de toutes les autres librairies scientifiques
Panorama des librairies et logiciels scientifiques par domaine
Les critères permettant de juger de la qualité d'une librairie
-Calculer avec des nombres réels: comprendre les erreurs de calculs
La représentation des nombres réels
Comprendre les erreurs de calculs et les contourner
-La scipy stack
Manipuler des tableaux de nombres: Numpy
o Différences avec les listes Python
o Création, sélection, filtres et principales fonctions
Visualiser ses données: Matplotlib
o Les concepts de la librairie
o Principaux graphiques: nuages de points, courbes, histogrammes, boxplot, ...
o Fonctionnalités avancées: 3D, légendes, colorbar, manipuler les axes, annotations, ...
Analyse de données: Pandas
o Les fondements de la librairie: Manipuler des données de type CSV et Excel
o Séries et Dataframes
o Index, sélection de données, filtres/recherche, agrégations, jointures et fonctions avancées
o Manipuler des séries temporelles
Les fonctions mathématiques avancées: Scipy
o Statistiques, optimisation, interpolations/régressions, traitement d'images
-Visualisation de données
Présentation de l'écosystème de visualisation de données de Python
Les librairies orientées Web: Bokeh, Altair et Plotly
Les "écosystèmes" PyViz et HoloViz
La visualisation de données volumineuses/big data avec DataShader
Les statistiques avec Seaborn
-Visualiser des données géospatiales
Convertir ses données d'un système de coordonnées à l'autre
Cartographie interactive "à la Open Street Map/Google Maps" avec Folium/iPyleaflet
Cartographie statique avec Cartopy
Autres librairies géospatiales
-Manipulation de données volumineuses
Les librairies h5py, pytables, netcdf4, xarray, iris, parquet permettant de lire vos fichiers scientifiques
Paralléliser ses calculs avec Dask
Paralléliser ses calculs avec CuDF
Manipuler des dataframes gigantesques avec Dask
-Personnalisation
Sous réserve de contraintes techniques ou de confidentialité, nous vous proposons de personnaliser la formation en réalisant des exercices directement sur vos données métiers.
Les incontournables: Numpy, Scipy, Pandas, Matplotlib et iPython qui sont le ciment de toutes les autres librairies scientifiques
Panorama des librairies et logiciels scientifiques par domaine
Les critères permettant de juger de la qualité d'une librairie
-Calculer avec des nombres réels: comprendre les erreurs de calculs
La représentation des nombres réels
Comprendre les erreurs de calculs et les contourner
-La scipy stack
Manipuler des tableaux de nombres: Numpy
o Différences avec les listes Python
o Création, sélection, filtres et principales fonctions
Visualiser ses données: Matplotlib
o Les concepts de la librairie
o Principaux graphiques: nuages de points, courbes, histogrammes, boxplot, ...
o Fonctionnalités avancées: 3D, légendes, colorbar, manipuler les axes, annotations, ...
Analyse de données: Pandas
o Les fondements de la librairie: Manipuler des données de type CSV et Excel
o Séries et Dataframes
o Index, sélection de données, filtres/recherche, agrégations, jointures et fonctions avancées
o Manipuler des séries temporelles
Les fonctions mathématiques avancées: Scipy
o Statistiques, optimisation, interpolations/régressions, traitement d'images
-Visualisation de données
Présentation de l'écosystème de visualisation de données de Python
Les librairies orientées Web: Bokeh, Altair et Plotly
Les "écosystèmes" PyViz et HoloViz
La visualisation de données volumineuses/big data avec DataShader
Les statistiques avec Seaborn
-Visualiser des données géospatiales
Convertir ses données d'un système de coordonnées à l'autre
Cartographie interactive "à la Open Street Map/Google Maps" avec Folium/iPyleaflet
Cartographie statique avec Cartopy
Autres librairies géospatiales
-Manipulation de données volumineuses
Les librairies h5py, pytables, netcdf4, xarray, iris, parquet permettant de lire vos fichiers scientifiques
Paralléliser ses calculs avec Dask
Paralléliser ses calculs avec CuDF
Manipuler des dataframes gigantesques avec Dask
-Personnalisation
Sous réserve de contraintes techniques ou de confidentialité, nous vous proposons de personnaliser la formation en réalisant des exercices directement sur vos données métiers.
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation
Ces formations peuvent vous intéresser
Les formations les plus recherchées
Lyon
Toulouse
Marseille
Montpellier
Paris
Bordeaux
Dijon
Mâcon
Nantes
Rennes
Audit CPF
Audit en Ligne
Analyste de donnees
Analyste de donnees CPF
Analyste de donnees en Ligne
Statisticien
Power bi
Qlikview
Data scientist
Big data
Business intelligence
Analyste de donnees Paris
Big data Paris
Business intelligence Paris
Data scientist Paris
Power bi Paris
Qlikview Paris
Statisticien Paris
Statisticien Paris 1er
Qlikview Évry-Courcouronnes
Power bi Évry-Courcouronnes