Python sur Spark avec Databricks

Data Value

Non finançable CPF

Tout public

Présentiel

Public admis

Salarié en poste

Demandeur d'emploi

Entreprise

Étudiant

Prix

3900 €

Durée

Nous contacter

Localité

En présentiel

Découvrez les localités disponibles pour suivre cette formation en présentiel.

Objectifs

Maîtriser la librairie PySpark afin d'utiliser Apache Spark avec le langage de programmation Python sur un environnement Databricks.

Compétences visées

- Connaître l'environnement Databricks

- Se familiariser avec la librairie PySpark afin d'utiliser Apache Spark avec le langage de programmation Python

- Savoir manipuler de grands volumes de données avec Pyspark

- Mettre en oeuvre des méthodes de Machine Learning avec Pyspark

Programme

Principaux thèmes abordés

- Présentation de Databricks

- Introduction à Spark

- Présentation de PySpark et l'API Pyspark RDD

- Utilisation de l'API Pyspark SQL

- Introduction au Machine Learning

- Machine Learning avec PySpark

Ces formations peuvent vous intéresser