Python sur Spark avec Databricks
Data Value
Non finançable CPF
Tout public
Présentiel
Python sur Spark avec Databricks
Data Value
Salarié en poste
Demandeur d'emploi
Entreprise
Étudiant
En présentiel
Nous contacter
Nous contacter
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Étudiant
Prix
Nous contacter
Durée
Nous contacter
Localité
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
Objectifs
Maîtriser la librairie PySpark afin d'utiliser Apache Spark avec le langage de programmation Python sur un environnement Databricks.
Programme
- Présentation de Databricks
- Introduction à Spark
- Présentation de PySpark et l'API Pyspark RDD
- Utilisation de l'API Pyspark SQL
- Introduction au Machine Learning
- Machine Learning avec PySpark
- Historique
- Différence entre l'utilisation Administrateur et Utilisateur
- Comment mettre en place un projet sur Databricks/AWS
- Comment créer un cluster de calcul avec Databricks/AWS
- Gestion des notebooks, des utilisateurs et des ressources
- Introduction à Spark
- Rappels sur le Big Data
- Présentation de Spark: Spark RDD, Spark SQL, Spark MLlib, Spark GraphX
- Configurer un Spark Context et une Spark Session
- Gestion de la mémoire sous Spark
- Présentation de PySpark et l'API Pyspark RDD
- Présentation de Pyspark et fonctionnement avec les Java Virtual Machines
- Présentation de l'API Pyspark RDD et manipulation de données non structurées
- Mise en pratique avec des fichiers textes (comptage de mots, nettoyage d'un fichier texte structuré) et avec des opérations d'agrégation sur PairRDDs
- Utilisation de l'API Pyspark SQL
- Présentation de l'API Pyspark SQL
- Lecture de fichiers csv, json, parquet et sauvegarde de fichier
- Nettoyage et manipulation de données
- Groupby et agrégation
- Jointure de tables
- Lien entre SQL et Python
- Manipulation d'objets Row, et Window
- Manipulation de dates
- Utilisation de User Defined Function et de Pandas User Defined functions
- Présentation de Pyspark Pandas
- Nombreuses mises en pratique sur des jeux de données
- Introduction au Machine Learning
- Qu'est-ce que le Machine Learning? Apprentissages supervisé et non supervisé
- Compromis Biais Variance
- Modèles Linéaires
- Modèles Non Linéaires
- Modèles ensemblistes
- Modèles de clustering
- Métriques et évaluation des performances
- Machine Learning avec PySpark
- Différence entre MLlib SQL et MLlib RDD
- Les transformations de processing sur les données et notions de Pipeline
- Mise en pratique avec des modèles de Machine Learning sur des problématiques de clustering, de classification (données numériques et texte)
- Evaluation des performances avec Pyspark MLlib
- Utilisation de la librairie Xgboost sous un environnement Spark
- Utilisation de Pandas UDF pour faire tourner des modèles scikit-learn ou tensorflow en inférence
Ces formations peuvent vous intéresser
Introduction à C# - Visual Studio / POO
LA CELLE-SAINT-CLOUD
Non finançable CPF
2010 €
À distance / En centre / En entreprise
Salarié en poste / Entreprise
Digital Product Simulation
Perfectionnement en Python 3
ORSAY
Non finançable CPF
1500 €
À distance / En centre / En entreprise
Entreprise
CODE RECKONS
Introduction au Web Scraping avec Python
ORSAY
Non finançable CPF
1650 €
En centre / En entreprise
Entreprise
CODE RECKONS
Malheureusement, vous ne pouvez pas contacter ce centre via Maformation.
Voici des formations similaires :
FORMATION PYTHON - Les bases
PARIS
Finançable CPF
1500 €
À distance / En centre / En entreprise
Salarié en poste / Entreprise
Expert Python
Python pour le Machine Learning
ORSAY
Non finançable CPF
1650 €
En centre / En entreprise
Entreprise
CODE RECKONS
Introduction à Python - Algorithme et programmation orientée objet
LA CELLE-SAINT-CLOUD
Non finançable CPF
2010 €
À distance / En centre / En entreprise
Salarié en poste / Entreprise
Digital Product Simulation
Les formations les plus recherchées
Formation Toulouse
Formation Paris
Formation Nantes
Formation Strasbourg
Formation Lille
Formation Bordeaux
Formation Rennes
Formation Montpellier
Formation Angers
Formation Clermont-Ferrand
Formation Informatique CPF
Formation Informatique en ligne
Formation Python CPF
Formation Python en ligne
Formation Technicien support informatique
Formation Consultant en informatique
Formation Administrateur systeme
Formation Technicien informatique
Formation Spark
Formation Programmation
Formation Technicien reseaux
Formation Administrateur reseau
Formation Developpeur informatique
Formation Intelligence artificielle
Formation Spark Nantes
Formation Technicien support informatique Nantes
Formation Technicien informatique Nantes
Formation Administrateur systeme Nantes
Formation Consultant en informatique Nantes
Formation Technicien support informatique Paris
Formation Consultant en informatique Paris
Formation Administrateur systeme Paris
Formation Technicien informatique Paris
Formation Intelligence artificielle Paris