Python sur Spark avec Databricks

Data Value

Non finançable CPF
Tout public
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Étudiant
Prix
3900 €
Durée
Nous contacter
Localité
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
En savoir plus sur les localités en présentiel
Cette formation est disponible dans les centres de formation suivants:
  • 75 - Paris 12e
Cette formation peut être dispensée dans votre entreprise dans les localités suivantes :
  • 75 - Paris
  • 77 - Seine-et-Marne
  • 78 - Yvelines
  • 91 - Essonne
  • 92 - Hauts-de-Seine
  • 93 - Seine-Saint-Denis
  • 94 - Val-de-Marne
  • 95 - Val-d'Oise
Objectifs
Maîtriser la librairie PySpark afin d'utiliser Apache Spark avec le langage de programmation Python sur un environnement Databricks.


Compétences visées

- Connaître l'environnement Databricks

- Se familiariser avec la librairie PySpark afin d'utiliser Apache Spark avec le langage de programmation Python

- Savoir manipuler de grands volumes de données avec Pyspark

- Mettre en oeuvre des méthodes de Machine Learning avec Pyspark
Programme
Principaux thèmes abordés

- Présentation de Databricks

- Introduction à Spark

- Présentation de PySpark et l'API Pyspark RDD

- Utilisation de l'API Pyspark SQL

- Introduction au Machine Learning

- Machine Learning avec PySpark
Haut de page