Spark
Réseau Formateurs
Non finançable CPF
Tout public
En ligne
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
Nous contacter
Durée
Nous contacter
Niveau visé
Non diplômante
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
Objectifs
S'initier à Apache Spark
Comprendre le traitement de données batch avec Spark
Explorer le traitement en temps réel avec Spark Streaming
Découvrir le traitement de graphes avec Spark GraphX
Pratiquer l'apprentissage automatique avec Spark MLlib
Intégrer et déployer des applications Spark
Comprendre le traitement de données batch avec Spark
Explorer le traitement en temps réel avec Spark Streaming
Découvrir le traitement de graphes avec Spark GraphX
Pratiquer l'apprentissage automatique avec Spark MLlib
Intégrer et déployer des applications Spark
Programme
S'initier à Apache Spark
- Présenter Apache Spark et ses caractéristiques clés
- Examiner l'historique et l'évolution de Spark
- Décrire l'architecture de base de Spark et ses composants
- Comparer Spark avec d'autres systèmes de traitement de données
- Illustrer les cas d'utilisation courants de Spark dans différentes industries
- Expliquer l'écosystème Spark et ses projets connexes
Comprendre le traitement de données batch avec Spark
- Comprendre les concepts du traitement de données batch
- Manipuler les données avec les Resilient Distributed Datasets (RDD)
- Effectuer des opérations de transformation et d'action sur les RDD
- Utiliser Spark SQL pour le traitement de données structurées
- Optimiser les performances du traitement de données batch
- Intégrer des sources de données externes avec Spark
Explorer le traitement en temps réel avec Spark Streaming
- Découvrir le traitement en temps réel avec Spark Streaming
- Créer des flux de données en continu avec DStreams
- Utiliser les opérations de fenêtrage pour l'analyse en temps réel
- Gérer les fenêtres glissantes et temporelles
- Intégrer des sources de données en streaming
- Appliquer des pratiques de conception pour le traitement en temps réel avec Spark
Découvrir le traitement de graphes avec Spark GraphX
- Introduire le traitement de graphes avec Spark GraphX
- Représenter et manipuler les graphes avec GraphX
- Réaliser des calculs de graphes et explorer les algorithmes courants
- Utiliser GraphFrames pour l'analyse de graphes
- Examiner des applications pratiques du traitement de graphes dans divers domaines
- Optimiser les performances pour le traitement de graphes
Pratiquer l'apprentissage automatique avec Spark MLlib
- Présenter l'apprentissage automatique avec Spark MLlib
- Préparer et transformer les données pour l'apprentissage automatique
- Entraîner des modèles de régression, de classification et de clustering
- Utiliser des pipelines pour créer des flux de travail d'apprentissage automatique
- Évaluer et ajuster les modèles en utilisant des métriques de performance
- Intégrer des algorithmes d'apprentissage profond avec Spark
Intégrer et déployer des applications Spark
- Intégrer Spark avec des systèmes de stockage et de traitement de données
- Utiliser des outils de gestion de clusters pour déployer Spark
- Créer des applications Spark autonomes et distribuées
- Optimiser les ressources et configurer le cluster
- Surveiller et gérer les performances des applications Spark
- Déployer des applications Spark sur des environnements cloud
- Présenter Apache Spark et ses caractéristiques clés
- Examiner l'historique et l'évolution de Spark
- Décrire l'architecture de base de Spark et ses composants
- Comparer Spark avec d'autres systèmes de traitement de données
- Illustrer les cas d'utilisation courants de Spark dans différentes industries
- Expliquer l'écosystème Spark et ses projets connexes
Comprendre le traitement de données batch avec Spark
- Comprendre les concepts du traitement de données batch
- Manipuler les données avec les Resilient Distributed Datasets (RDD)
- Effectuer des opérations de transformation et d'action sur les RDD
- Utiliser Spark SQL pour le traitement de données structurées
- Optimiser les performances du traitement de données batch
- Intégrer des sources de données externes avec Spark
Explorer le traitement en temps réel avec Spark Streaming
- Découvrir le traitement en temps réel avec Spark Streaming
- Créer des flux de données en continu avec DStreams
- Utiliser les opérations de fenêtrage pour l'analyse en temps réel
- Gérer les fenêtres glissantes et temporelles
- Intégrer des sources de données en streaming
- Appliquer des pratiques de conception pour le traitement en temps réel avec Spark
Découvrir le traitement de graphes avec Spark GraphX
- Introduire le traitement de graphes avec Spark GraphX
- Représenter et manipuler les graphes avec GraphX
- Réaliser des calculs de graphes et explorer les algorithmes courants
- Utiliser GraphFrames pour l'analyse de graphes
- Examiner des applications pratiques du traitement de graphes dans divers domaines
- Optimiser les performances pour le traitement de graphes
Pratiquer l'apprentissage automatique avec Spark MLlib
- Présenter l'apprentissage automatique avec Spark MLlib
- Préparer et transformer les données pour l'apprentissage automatique
- Entraîner des modèles de régression, de classification et de clustering
- Utiliser des pipelines pour créer des flux de travail d'apprentissage automatique
- Évaluer et ajuster les modèles en utilisant des métriques de performance
- Intégrer des algorithmes d'apprentissage profond avec Spark
Intégrer et déployer des applications Spark
- Intégrer Spark avec des systèmes de stockage et de traitement de données
- Utiliser des outils de gestion de clusters pour déployer Spark
- Créer des applications Spark autonomes et distribuées
- Optimiser les ressources et configurer le cluster
- Surveiller et gérer les performances des applications Spark
- Déployer des applications Spark sur des environnements cloud
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation
Ces formations peuvent vous intéresser

DATA SCIENTIST | Titre RNCP niveau 7 - Bac +5 | Co-certifiée école...
À DISTANCE
Avis du centre
Témoignages
Les formations les plus recherchées
Lyon
Toulouse
Marseille
Montpellier
Paris
Bordeaux
Dijon
Mâcon
Nantes
Rennes
Informatique CPF
Informatique en Ligne
Big data
Big data CPF
Big data en Ligne
Directeur des systemes d information
Data scientist
Intelligence artificielle
Machine learning
Vba
Growth hacking
Technicien informatique
Technicien support informatique
Administrateur systeme
Consultant en informatique
Big data Paris
Data scientist Paris
Data mining Paris
Directeur des systemes d information Villiers-le-Bel
Directeur des systemes d information Paris
Data mining Paris 1er
Data scientist Évry-Courcouronnes
Big data Évry-Courcouronnes
Big data Mantes-la-Ville
Data scientist Nanterre