Expert en infrastructures de donnees massives

KAISCHOOL

Non finançable CPF
Tout public
En ligne
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
Nous contacter
Durée
Nous contacter
Niveau visé
Niveau > BAC + 5
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
En savoir plus sur les localités en présentiel
Cette formation est disponible dans les centres de formation suivants:
  • 94 - Fontenay-sous-Bois
Cette formation peut être dispensée dans votre entreprise dans les localités suivantes :
  • 75 - Paris
  • 77 - Seine-et-Marne
  • 78 - Yvelines
  • 91 - Essonne
  • 92 - Hauts-de-Seine
  • 93 - Seine-Saint-Denis
  • 94 - Val-de-Marne
  • 95 - Val-d'Oise
Objectifs
Analyser l'expression d'un besoin en data dans une étude de faisabilité, en explorant les enjeux stratégiques et en échangeant avec les parties prenantes pour valider les orientations et sélectionner les hypothèses techniques avec les commanditaires.

Cartographier les données disponibles (sources, usages, métadonnées) afin de valider la faisabilité technique du projet.

Concevoir un cadre technique d'exploitation des données en tenant compte des contraintes techniques, des moyens mobilisables, du RGPD et d'une démarche éco-responsable.

Réaliser une veille technique et réglementaire en sélectionnant et en exploitant des sources fiables, afin de formuler des recommandations à jour avec l'état de l'art.

Planifier le projet data en définissant les étapes, les moyens, les livrables et les méthodes de suivi pour en organiser la mise en œuvre.

Superviser le projet en structurant les méthodes, outils et canaux de communication pour accompagner efficacement l'équipe vers les objectifs fixés.

Communiquer tout au long du projet sur ses orientations, ses livrables et leurs impacts à travers une stratégie et des supports adaptés à chaque partie prenante.

Automatiser l'extraction de données (web services, pages web, fichiers, bases de données, systèmes big data) via des scripts pour garantir une collecte fiable et durable.

Écrire des requêtes SQL d'extraction sur SGBD ou systèmes big data pour préparer les données utiles au projet.

Nettoyer et agréger les données issues de sources hétérogènes par script, en supprimant les données corrompues et en homogénéisant les formats.

Créer une base de données conforme au RGPD, à partir des données préparées, en modélisant les structures conceptuelles et physiques.

Partager les données via des interfaces logicielles ou API pour les rendre accessibles au développement du projet.

Modéliser la structure d'un entrepôt de données à partir des faits et dimensions pour optimiser l'analyse.

Créer un entrepôt de données en fonction des contraintes techniques, matérielles et des besoins du projet afin de soutenir la décision stratégique.

Intégrer des ETL en entrée/sortie pour garantir qualité et formatage des données selon les modélisations.

Gérer un entrepôt de données via des outils d'administration dans le respect du RGPD, en assurant sa maintenance et son évolutivité.

Implémenter les variations dans les dimensions de l'entrepôt selon les types de changements pour historiser les évolutions de l'activité.
Programme

  • Fondamentaux de la Data

  • Extraction et programmation des données

  • Stockage et bases de données avancées

  • Data Cleaning et intégration

  • Data Analyse & Business Intelligence

  • Machine Learning & Intelligence Artificielle

  • Gouvernance, sécurité et RGPD

  • Gestion de projet Data

  • Data Warehouse & ETL

  • Architecture Big Data & Data Lake

  • Mises en situations professionnelle

  • Préparation à la certification RNCP

Envie d’en savoir plus sur cette formation ?

Documentez-vous sur la formation

Quelle est votre situation ?

Haut de page