Big Data recolte et analyse de donnees volumineuses module Spark
Cegefos
Non finançable CPF
Tout public
En ligne
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
Nous contacter
Durée
Nous contacter
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
Objectifs
• Comprendre le besoin de Spark dans le traitement des données
• Comprendre l'architecture Spark et comment elle distribue des calculs aux nœuds du cluster
• Familiarisez-vous avec l'installation / configuration / mise en page de Spark
• Utilisez Spark pour des opérations interactives et ponctuelles
• Utilisez Dataset / DataFrame / Spark SQL pour traiter efficacement les données structurées
• Comprendre les notions de base des RDD (Resilient Distributed Datasets) et le partitionnement, le pipelining et les calculs de données
• Comprendre la mise en cache des données de Spark et son utilisation
• Comprendre les implications et les optimisations de performance lors de l'utilisation de Spark
• Familiarisez-vous avec Spark Graph Processing et l'apprentissage par machine Spark ML
• Comprendre l'architecture Spark et comment elle distribue des calculs aux nœuds du cluster
• Familiarisez-vous avec l'installation / configuration / mise en page de Spark
• Utilisez Spark pour des opérations interactives et ponctuelles
• Utilisez Dataset / DataFrame / Spark SQL pour traiter efficacement les données structurées
• Comprendre les notions de base des RDD (Resilient Distributed Datasets) et le partitionnement, le pipelining et les calculs de données
• Comprendre la mise en cache des données de Spark et son utilisation
• Comprendre les implications et les optimisations de performance lors de l'utilisation de Spark
• Familiarisez-vous avec Spark Graph Processing et l'apprentissage par machine Spark ML
Programme
Jour 1
Comprendre les fondamentaux de Spark et du développement Scala
* Scala Ramp up
* Introduction à Spark
* RDDs et Spark Architecture
Jour 2
Savoir créer une application spark et utilisez Dataset/ DataFrame/ Spark SQL pour traiter efficacement les données structurées
* DataSets/ DataFrames et Spark SQL
* Création d'application Spark
* Spark Streaming
Jour 3
Optimisation de Spark et utilisation des outils associés
* Caractéristiques de performance et optimisation
* (Facultatif): Aperçu de Spark GraphX
* (Facultatif): Apercu MLLib
Comprendre les fondamentaux de Spark et du développement Scala
* Scala Ramp up
* Introduction à Spark
* RDDs et Spark Architecture
Jour 2
Savoir créer une application spark et utilisez Dataset/ DataFrame/ Spark SQL pour traiter efficacement les données structurées
* DataSets/ DataFrames et Spark SQL
* Création d'application Spark
* Spark Streaming
Jour 3
Optimisation de Spark et utilisation des outils associés
* Caractéristiques de performance et optimisation
* (Facultatif): Aperçu de Spark GraphX
* (Facultatif): Apercu MLLib
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation
Ces formations peuvent vous intéresser
DATA ANALYSE
À DISTANCE

Finançable CPF
À distance / En entreprise
Salarié en poste / Demandeur d'emploi / Entreprise
Formation complète Microsoft - Power BI
À DISTANCE

Finançable CPF
À distance / En entreprise
Salarié en poste / Demandeur d'emploi / Entreprise
BUSINESS ANALYST - formation certifiante à distance
PARIS 11E

Finançable CPF
À distance / En centre / En entreprise
Tout public
DataBird
Les formations les plus recherchées
Aix-en-Provence
Lyon
Toulouse
Marseille
Montpellier
Paris
Bordeaux
Dijon
Mâcon
Nantes
Audit CPF
Audit en Ligne
Analyste de donnees
Analyste de donnees CPF
Analyste de donnees en Ligne
Statisticien
Auditeur qualite
Audit interne
Analyste de donnees Paris
Analyste de donnees Paris 10e
Analyste de donnees Paris 11e
Analyste de donnees Paris 12e
Analyste de donnees Paris 13e
Analyste de donnees Paris 14e
Analyste de donnees Paris 15e
Analyste de donnees Paris 16e
Analyste de donnees Paris 17e
Analyste de donnees Paris 18e