Python sur Spark avec Databricks
Data Value
Salarié en poste
Demandeur d'emploi
Entreprise
Étudiant
En ligne
En présentiel
Nous contacter
Nous contacter
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
Objectifs
Maîtriser la librairie PySpark afin d'utiliser Apache Spark avec le langage de programmation Python sur un environnement Databricks.
Programme
- Présentation de Databricks
Cette introduction permet de vous initier à l'environnement Databricks et ses outils- Historique
- Différence entre l'utilisation Administrateur et Utilisateur
- Comment mettre en place un projet sur Databricks/AWS
- Comment créer un cluster de calcul avec Databricks/AWS
- Gestion des notebooks, des utilisateurs et des ressources
- Introduction à Spark
Spark est un environnement de travail distribué qui permet d'effectuer des calculs sur des gros volumes de données- Rappels sur le Big Data
- Présentation de Spark: Spark RDD, Spark SQL, Spark MLlib, Spark GraphX
- Configurer un Spark Context et une Spark Session
- Gestion de la mémoire sous Spark
- Présentation de PySpark et l'API Pyspark RDD
Pyspark est l'API Python de Spark- Présentation de Pyspark et fonctionnement avec les Java Virtual Machines
- Présentation de l'API Pyspark RDD et manipulation de données non structurées
- Mise en pratique avec des fichiers textes (comptage de mots, nettoyage d'un fichier texte structuré) et avec des opérations d'agrégation sur PairRDDs
- Utilisation de l'API Pyspark SQL
L'API Pyspark SQL permet de manipuler des données structurées sous format de Dataframes avec du Python et du SQL- Présentation de l'API Pyspark SQL
- Lecture de fichiers csv, json, parquet et sauvegarde de fichier
- Nettoyage et manipulation de données
- Groupby et agrégation
- Jointure de tables
- Lien entre SQL et Python
- Manipulation d'objets Row, et Window
- Manipulation de dates
- Utilisation de User Defined Function et de Pandas User Defined functions
- Présentation de Pyspark Pandas
- Nombreuses mises en pratique sur des jeux de données
- Introduction au Machine Learning
Rappels des fondamentaux du Machine Learning- Qu'est-ce que le Machine Learning? Apprentissages supervisé et non supervisé
- Compromis Biais Variance
- Modèles Linéaires
- Modèles Non Linéaires
- Modèles ensemblistes
- Modèles de clustering
- Métriques et évaluation des performances
- Machine Learning avec PySpark
Les librairies associées à Pyspark MLlib permettent de faire tourner des modèles de Machine Learning dans un environnement de calcul distribuéCes formations peuvent vous intéresser
Avis du centre
VILLENEUVE-D'ASCQ
À distance / En centre / En entreprise
Salarié en poste / Demandeur d'emploi / Entreprise
Finançable CPF
Avis du centre
ORSAY
À distance / En centre / En entreprise
Entreprise
Non finançable CPF
1500 €
Malheureusement, vous ne pouvez pas contacter ce centre via Maformation.
Voici des formations similaires :
ORSAY
En centre / En entreprise
Entreprise
Non finançable CPF
1650 €
LA CELLE-SAINT-CLOUD
À distance / En centre / En entreprise
Salarié en poste / Entreprise
Non finançable CPF
2010 €
À DISTANCE
Salarié en poste / Demandeur d'emploi / Entreprise
Finançable CPF
1837 €
Avis du centre
Les formations les plus recherchées
Formation Toulouse
Formation Paris
Formation Nantes
Formation Saint-Étienne
Formation Lille
Formation Bordeaux
Formation Strasbourg
Formation Rennes
Formation Montpellier
Formation Angers
Formation Informatique CPF
Formation Informatique en ligne
Formation Python CPF
Formation Python en ligne
Formation Spark
Formation Programmation
Formation Cybersecurite
Formation Securite informatique
Formation Intelligence artificielle
Formation Growth hacking
Formation Machine learning
Formation Hadoop
Formation Git
Formation Vba
Formation Spark Nantes
Formation Intelligence artificielle Paris
Formation Spark Paris
Formation Machine learning Paris
Formation Programmation Nantes
Formation Vba Saint-Étienne
Formation Cybersecurite Paris
Formation Securite informatique Paris
Formation Spark Toulouse
Formation Hacking Paris
Cette formation est temporairement suspendue.
Voir des formations similaires
Haut de page