Analyse de donnees en environnement Hadoop

Data Value

Voir des formations similaires

Public admis

Salarié en poste

Demandeur d'emploi

Entreprise

Étudiant

Modalités

En présentiel

Durée

Nous contacter

Prix

2340 €

Localité

En présentiel

Découvrez les localités disponibles pour suivre cette formation en présentiel.

Objectifs

Connaitre les fonctionnements d'Hadoop Distributed File System (HDFS) et YARN / MapReduce

Savoir explorer HDFS et suivre l'exécution d'une application YARN

Déterminer les fonctionnements et l'utilisation les différents outils de manipulation des données

Compétences visées

- Comprendre ce que sont Hadoop et YARN

- Connaître les différents outils et les Framework dans un environnement Hadoop

- Appréhender MapReduce

- Comprendre comment exécuter une tâche de MapReduce sur YARN

- Exécuter des modifications en masse avec PIG

- Savoir écrire des requêtes pour HIVE afin d'analyser ses données

- Savoir utiliser Sqoop pour transférer les données entre Hadoop et une base de données relationnelle

- Découverte d'autres briques : automatiser vos process avec Oozie

- Utiliser une base de données No-SQL (HBase)

Programme

- Hadoop

Comprendre Hadoop et son écosystème

Quels impacts de l'arrivée d'Hadoop dans un SI traditionnel ?

Le Hadoop Distributed File System (HDFS)

Introduction aux données dans HDFS

MapReduce Framework et YARN

- Pig

Introduction à Pig

Programmation Pig avancée

Troubleshooting et optimisation avec Pig

Résolution des problèmes avec Pig

Utiliser l'UI Web d'Hadoop

Démo optionnelle : résolution d'un « Failed Job » avec l'UI Web

Echantillonnage de données et débogage

Vue d'ensemble des performances

Comprendre le plan d'exécution

Astuces pour améliorer la performance de vos « Pig Jobs »

- Hive

Programmation Hive

Utilisation de HCatalog

Programmation Hive avancée

Etendre Hive

Transformation de données avec des Scripts personnalisés

Fonctions définies par l'utilisateur

Paramétrer les requêtes

Exercices « Hands-On » : transformation de données avec Hive

Programmation Hive avancée (suite)

Analyse de données et statistiques

- Sqoop

Import/Export avec Sqoop (SGBDR <-> HDFS)

Sqoop, fonctions avancées

Définition de workflow avec Oozie

- Optionnel : (sous réserve de temps)

Introduction à H-Base

Exemple d'ingestion de données avec l'ETL Talend

Créer son propre cluster Hadoop (plateforme de test)

Ces formations peuvent vous intéresser

Power BI Niveau 1 : concevoir et mettre en forme un tableau de bord

À DISTANCE

Salarié en poste / Entreprise

Non finançable CPF

750 €

Avis du centre

Formation Data Analytics : Apprenez à lire, comprendre et exploiter vos données !

À DISTANCE

Salarié en poste / Demandeur d'emploi / Entreprise

Finançable CPF

1740 €

Power BI - Créer des tableaux de bord avec Power BI Desktop

ORLÉANS, LE HAVRE…

À distance / En centre / En entreprise

Salarié en poste / Entreprise

Non finançable CPF

1850 €

Malheureusement, vous ne pouvez pas contacter ce centre via Maformation.

Voici des formations similaires :

Avis du centre

Bootcamp Data Analyst - formation certifiante RNCP

À DISTANCE

Tout public

Finançable CPF

-11.33%

4500 €

3991 €

Formation Data Engineering pour l'IA : RAG et vector databases

PARIS 8E

En entreprise

Entreprise

Non finançable CPF

1800 €

Avis du centre

Formation Data Analyst | Titre RNCP Niveau 6 | En ligne ou à Paris

PARIS 11E

À distance / En centre

Tout public

Finançable CPF

-13.06%

6890 €

5991 €

Les formations les plus recherchées

Formation Toulouse Formation Paris Formation Nantes Formation Lille Formation Strasbourg Formation Bordeaux Formation Rennes Formation Montpellier Formation Angers Formation Nancy Formation Audit CPF Formation Audit en ligne Formation Analyste de donnees CPF Formation Analyste de donnees en ligne Formation Statisticien Formation Auditeur qualite Formation Statisticien Toulouse Formation Statisticien Labège Formation Analyste de donnees Paris Formation Analyste de donnees Toulouse Formation Statisticien Nantes Formation Analyste de donnees Nantes Formation Statisticien Paris Formation Analyste de donnees Labège Formation Analyste de donnees Aix-en-Provence Formation Statisticien Rennes

Cette formation est temporairement suspendue.

Voir des formations similaires