Spark
Réseau Formateurs
Non finançable CPF
Tout public
En ligne
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Étudiant
Prix
Nous contacter
Durée
Nous contacter
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
Objectifs
S'initier à Apache Spark
Comprendre le traitement de données batch avec Spark
Explorer le traitement en temps réel avec Spark Streaming
Découvrir le traitement de graphes avec Spark GraphX
Pratiquer l'apprentissage automatique avec Spark MLlib
Intégrer et déployer des applications Spark
Comprendre le traitement de données batch avec Spark
Explorer le traitement en temps réel avec Spark Streaming
Découvrir le traitement de graphes avec Spark GraphX
Pratiquer l'apprentissage automatique avec Spark MLlib
Intégrer et déployer des applications Spark
Programme
S'initier à Apache Spark
- Présenter Apache Spark et ses caractéristiques clés
- Examiner l'historique et l'évolution de Spark
- Décrire l'architecture de base de Spark et ses composants
- Comparer Spark avec d'autres systèmes de traitement de données
- Illustrer les cas d'utilisation courants de Spark dans différentes industries
- Expliquer l'écosystème Spark et ses projets connexes
Comprendre le traitement de données batch avec Spark
- Comprendre les concepts du traitement de données batch
- Manipuler les données avec les Resilient Distributed Datasets (RDD)
- Effectuer des opérations de transformation et d'action sur les RDD
- Utiliser Spark SQL pour le traitement de données structurées
- Optimiser les performances du traitement de données batch
- Intégrer des sources de données externes avec Spark
Explorer le traitement en temps réel avec Spark Streaming
- Découvrir le traitement en temps réel avec Spark Streaming
- Créer des flux de données en continu avec DStreams
- Utiliser les opérations de fenêtrage pour l'analyse en temps réel
- Gérer les fenêtres glissantes et temporelles
- Intégrer des sources de données en streaming
- Appliquer des pratiques de conception pour le traitement en temps réel avec Spark
Découvrir le traitement de graphes avec Spark GraphX
- Introduire le traitement de graphes avec Spark GraphX
- Représenter et manipuler les graphes avec GraphX
- Réaliser des calculs de graphes et explorer les algorithmes courants
- Utiliser GraphFrames pour l'analyse de graphes
- Examiner des applications pratiques du traitement de graphes dans divers domaines
- Optimiser les performances pour le traitement de graphes
Pratiquer l'apprentissage automatique avec Spark MLlib
- Présenter l'apprentissage automatique avec Spark MLlib
- Préparer et transformer les données pour l'apprentissage automatique
- Entraîner des modèles de régression, de classification et de clustering
- Utiliser des pipelines pour créer des flux de travail d'apprentissage automatique
- Évaluer et ajuster les modèles en utilisant des métriques de performance
- Intégrer des algorithmes d'apprentissage profond avec Spark
Intégrer et déployer des applications Spark
- Intégrer Spark avec des systèmes de stockage et de traitement de données
- Utiliser des outils de gestion de clusters pour déployer Spark
- Créer des applications Spark autonomes et distribuées
- Optimiser les ressources et configurer le cluster
- Surveiller et gérer les performances des applications Spark
- Déployer des applications Spark sur des environnements cloud
- Présenter Apache Spark et ses caractéristiques clés
- Examiner l'historique et l'évolution de Spark
- Décrire l'architecture de base de Spark et ses composants
- Comparer Spark avec d'autres systèmes de traitement de données
- Illustrer les cas d'utilisation courants de Spark dans différentes industries
- Expliquer l'écosystème Spark et ses projets connexes
Comprendre le traitement de données batch avec Spark
- Comprendre les concepts du traitement de données batch
- Manipuler les données avec les Resilient Distributed Datasets (RDD)
- Effectuer des opérations de transformation et d'action sur les RDD
- Utiliser Spark SQL pour le traitement de données structurées
- Optimiser les performances du traitement de données batch
- Intégrer des sources de données externes avec Spark
Explorer le traitement en temps réel avec Spark Streaming
- Découvrir le traitement en temps réel avec Spark Streaming
- Créer des flux de données en continu avec DStreams
- Utiliser les opérations de fenêtrage pour l'analyse en temps réel
- Gérer les fenêtres glissantes et temporelles
- Intégrer des sources de données en streaming
- Appliquer des pratiques de conception pour le traitement en temps réel avec Spark
Découvrir le traitement de graphes avec Spark GraphX
- Introduire le traitement de graphes avec Spark GraphX
- Représenter et manipuler les graphes avec GraphX
- Réaliser des calculs de graphes et explorer les algorithmes courants
- Utiliser GraphFrames pour l'analyse de graphes
- Examiner des applications pratiques du traitement de graphes dans divers domaines
- Optimiser les performances pour le traitement de graphes
Pratiquer l'apprentissage automatique avec Spark MLlib
- Présenter l'apprentissage automatique avec Spark MLlib
- Préparer et transformer les données pour l'apprentissage automatique
- Entraîner des modèles de régression, de classification et de clustering
- Utiliser des pipelines pour créer des flux de travail d'apprentissage automatique
- Évaluer et ajuster les modèles en utilisant des métriques de performance
- Intégrer des algorithmes d'apprentissage profond avec Spark
Intégrer et déployer des applications Spark
- Intégrer Spark avec des systèmes de stockage et de traitement de données
- Utiliser des outils de gestion de clusters pour déployer Spark
- Créer des applications Spark autonomes et distribuées
- Optimiser les ressources et configurer le cluster
- Surveiller et gérer les performances des applications Spark
- Déployer des applications Spark sur des environnements cloud
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation
Ces formations peuvent vous intéresser
Formation d'expertise data engineering
À DISTANCE
Finançable CPF
2200 €
À distance
Tout public
Avis du centre
.
DATAROCKSTARS
DATA ANALYST | Titre RNCP niveau 7 Bac +5 | co-certifiée école MINES Paris
À DISTANCE
Finançable CPF
6590 €
5931 €
10% de réduction
À distance / En entreprise
Salarié en poste / Demandeur d'emploi / Entreprise
Avis du centre
.
DATASCIENTEST
Data Management et Business Analytics - Master of Science
À DISTANCE
Non finançable CPF
23450 €
À distance
Salarié en poste / Demandeur d'emploi / Entreprise
EDHEC Business School – Online Programmes
Administrateur Cybersécurité | Administrateur d'infrastructures sécurisées
PUTEAUX
Finançable CPF
Nous contacter
À distance / En alternance / En entreprise
Salarié en poste / Demandeur d'emploi / Entreprise
Avis du centre
.
Cyber University
Formation Microsoft Fabric
À DISTANCE
Non finançable CPF
2980 €
À distance
Entreprise
ACCESS IT
Docker Intensif
À DISTANCE
Non finançable CPF
1490 €
À distance
Entreprise
Enix
Les formations les plus recherchées
Lyon
Toulouse
Marseille
Montpellier
Paris
Bordeaux
Dijon
Mâcon
Nantes
Rennes
Informatique CPF
Informatique en Ligne
Big data
Big data CPF
Big data en Ligne
Directeur des systemes d information
Data scientist
Technicien support informatique
Consultant en informatique
Administrateur systeme
Technicien informatique
Spark
Programmation
Technicien reseaux
Administrateur reseau
Big data Alfortville
Data scientist Alfortville
Data mining Alfortville
Directeur des systemes d information Alfortville
Directeur des systemes d information Antony
Data mining Antony
Data scientist Antony
Big data Antony
Big data Argenteuil
Data scientist Argenteuil