Analyse de donnees en environnement Hadoop

Data Value

Non finançable CPF
Tout public
En ligne
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
Nous contacter
Durée
Nous contacter
Niveau visé
Non diplômante
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
En savoir plus sur les localités en présentiel
Cette formation est disponible dans les centres de formation suivants:
  • 31 - Labège
Cette formation peut être dispensée dans votre entreprise dans les localités suivantes :
  • 09 - Ariège
  • 11 - Aude
  • 12 - Aveyron
  • 30 - Gard
  • 31 - Haute-Garonne
  • 32 - Gers
  • 34 - Hérault
  • 46 - Lot
  • 48 - Lozère
  • 65 - Hautes-Pyrénées
  • 66 - Pyrénées-Orientales
  • 81 - Tarn
  • 82 - Tarn-et-Garonne
Objectifs
Connaitre les fonctionnements d'Hadoop Distributed File System (HDFS) et YARN / MapReduce
Savoir explorer HDFS et suivre l'exécution d'une application YARN
Déterminer les fonctionnements et l'utilisation les différents outils de manipulation des données
Programme

- Hadoop

  • Comprendre Hadoop et son écosystème
  • Quels impacts de l'arrivée d'Hadoop dans un SI traditionnel ?
  • Le Hadoop Distributed File System (HDFS)
  • Introduction aux données dans HDFS
  • MapReduce Framework et YARN

- Pig

  • Introduction à Pig
  • Programmation Pig avancée
  • Troubleshooting et optimisation avec Pig
  • Résolution des problèmes avec Pig
  • Utiliser l'UI Web d'Hadoop
  • Démo optionnelle : résolution d'un « Failed Job » avec l'UI Web
  • Echantillonnage de données et débogage
  • Vue d'ensemble des performances
  • Comprendre le plan d'exécution
  • Astuces pour améliorer la performance de vos « Pig Jobs »

- Hive

  • Programmation Hive
  • Utilisation de HCatalog
  • Programmation Hive avancée
  • Etendre Hive
  • Transformation de données avec des Scripts personnalisés
  • Fonctions définies par l'utilisateur
  • Paramétrer les requêtes
  • Exercices « Hands-On » : transformation de données avec Hive
  • Programmation Hive avancée (suite)
  • Analyse de données et statistiques

- Sqoop

  • Import/Export avec Sqoop (SGBDR <-> HDFS)
  • Sqoop, fonctions avancées
  • Définition de workflow avec Oozie

- Optionnel : (sous réserve de temps)

  • Introduction à H-Base
  • Exemple d'ingestion de données avec l'ETL Talend
  • Créer son propre cluster Hadoop (plateforme de test)

Envie d’en savoir plus sur cette formation ?

Documentez-vous sur la formation

Ces formations peuvent vous intéresser

Quelle est votre situation ?

Vous êtes ?

Veuillez choisir un lieu

Please fill out this field.

Please fill out this field.

Veuillez sélectionner un niveau de formation

Informez-vous gratuitement et sans engagement sur la formation.

Please fill out this field.

Please fill out this field.

Please fill out this field.

Veuillez saisir une adresse email

  • Vous voulez dire ?
  • ou plutôt ?

En cliquant sur "J'envoie ma demande", vous acceptez les CGU et déclarez avoir pris connaissance de la politique de protection des données du site maformation.fr

Haut de page