Analyse de donnees en environnement Hadoop
Data Value
Non finançable CPF
Tout public
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Étudiant
Prix
2340 €
Durée
Nous contacter
Localité
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
Objectifs
Connaitre les fonctionnements d'Hadoop Distributed File System (HDFS) et YARN / MapReduce
Savoir explorer HDFS et suivre l'exécution d'une application YARN
Déterminer les fonctionnements et l'utilisation les différents outils de manipulation des données
Compétences visées
- Comprendre ce que sont Hadoop et YARN
- Connaître les différents outils et les Framework dans un environnement Hadoop
- Appréhender MapReduce
- Comprendre comment exécuter une tâche de MapReduce sur YARN
- Exécuter des modifications en masse avec PIG
- Savoir écrire des requêtes pour HIVE afin d'analyser ses données
- Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle
- Découverte d'autres briques : automatiser vos process avec Oozie
- Utiliser une base de données No-SQL (HBase)
Savoir explorer HDFS et suivre l'exécution d'une application YARN
Déterminer les fonctionnements et l'utilisation les différents outils de manipulation des données
Compétences visées
- Comprendre ce que sont Hadoop et YARN
- Connaître les différents outils et les Framework dans un environnement Hadoop
- Appréhender MapReduce
- Comprendre comment exécuter une tâche de MapReduce sur YARN
- Exécuter des modifications en masse avec PIG
- Savoir écrire des requêtes pour HIVE afin d'analyser ses données
- Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle
- Découverte d'autres briques : automatiser vos process avec Oozie
- Utiliser une base de données No-SQL (HBase)
Programme
- Hadoop
- Pig
- Hive
- Sqoop
- Optionnel : (sous réserve de temps)
- Comprendre Hadoop et son écosystème
- Quels impacts de l'arrivée d'Hadoop dans un SI traditionnel ?
- Le Hadoop Distributed File System (HDFS)
- Introduction aux données dans HDFS
- MapReduce Framework et YARN
- Pig
- Introduction à Pig
- Programmation Pig avancée
- Troubleshooting et optimisation avec Pig
- Résolution des problèmes avec Pig
- Utiliser l'UI Web d'Hadoop
- Démo optionnelle : résolution d'un « Failed Job » avec l'UI Web
- Echantillonnage de données et débogage
- Vue d'ensemble des performances
- Comprendre le plan d'exécution
- Astuces pour améliorer la performance de vos « Pig Jobs »
- Hive
- Programmation Hive
- Utilisation de HCatalog
- Programmation Hive avancée
- Etendre Hive
- Transformation de données avec des Scripts personnalisés
- Fonctions définies par l'utilisateur
- Paramétrer les requêtes
- Exercices « Hands-On » : transformation de données avec Hive
- Programmation Hive avancée (suite)
- Analyse de données et statistiques
- Sqoop
- Import/Export avec Sqoop (SGBDR <-> HDFS)
- Sqoop, fonctions avancées
- Définition de workflow avec Oozie
- Optionnel : (sous réserve de temps)
- Introduction à H-Base
- Exemple d'ingestion de données avec l'ETL Talend
- Créer son propre cluster Hadoop (plateforme de test)
Ces formations peuvent vous intéresser
Maitrise Power BI sur 8 jours (Pack formation + certification)
PARIS
Finançable CPF
3000 €
À distance / En centre / En entreprise
Salarié en poste / Entreprise
MYPE
DATA MANAGEMENT - formation certifiante à distance
PARIS 11E
Finançable CPF
1500 €
À distance / En centre / En entreprise
Tout public
Avis du centre
.
DataBird
Power BI : Analyser des données et créer des rapports + Analyse et Modélisation avec le langage DAX
NANTES, STRASBOURG, BORDEAUX ET 8 AUTRE(S) LOCALITÉ(S)
Finançable CPF
2300 €
À distance / En centre
Salarié en poste / Demandeur d'emploi / Entreprise
Dawan
Malheureusement, vous ne pouvez pas contacter ce centre via Maformation.
Voici des formations similaires :
Bootcamp Data Analyst - formation certifiante RNCP
À DISTANCE
Finançable CPF
4500 €
À distance
Tout public
Avis du centre
.
DATAROCKSTARS
Formation Microsoft Fabric
À DISTANCE
Non finançable CPF
2980 €
À distance
Entreprise
ACCESS IT
Power BI - comptabilite/gestion
À DISTANCE
Finançable CPF
Nous contacter
À distance / En entreprise
Salarié en poste / Demandeur d'emploi / Entreprise
Avis du centre
.
DATASCIENTEST
Les formations les plus recherchées
Lyon
Toulouse
Marseille
Montpellier
Paris
Bordeaux
Dijon
Mâcon
Nantes
Rennes
Audit CPF
Audit en Ligne
Analyste de donnees
Analyste de donnees CPF
Analyste de donnees en Ligne
Statisticien
Power bi
Qlikview
Data scientist
Big data
Business intelligence
Auditeur qualite
Audit interne
Analyste de donnees Alfortville
Big data Alfortville
Business intelligence Alfortville
Data scientist Alfortville
Power bi Alfortville
Qlikview Alfortville
Statisticien Alfortville
Statisticien Antony
Qlikview Antony
Power bi Antony