Data engineer

Data ScienceTech Institute

Non finançable CPF
Tout public
En ligne
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Étudiant
Prix
Nous contacter
Durée
Nous contacter
Niveau visé
Niveau > BAC + 5
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
En savoir plus sur les localités en présentiel
Cette formation est disponible dans les centres de formation suivants:
  • 75 - Paris 5e
Cette formation peut être dispensée dans votre entreprise dans les localités suivantes :
  • 75 - Paris
  • 77 - Seine-et-Marne
  • 78 - Yvelines
  • 91 - Essonne
  • 92 - Hauts-de-Seine
  • 93 - Seine-Saint-Denis
  • 94 - Val-de-Marne
  • 95 - Val-d'Oise
Objectifs

  •  Analyser le fonctionnement d'une organisation et ses flux de données à partir d'une cartographie des données et d'une étude préalable.

  • Décrire, en les formalisant, des cas d'usages du domaine de la Data en exploitant des méthodes d'idéation et en prenant en compte les spécificités de l'écosystème.

  • Elaborer un système de veille technologique et réglementaire propre au secteur du numérique avec une attention particulière sur les thèmes du cloud, du décisionnel et du Big Data.

  •  Initier une étude de faisabilité de l'architecture data en collaboration avec un Data Scientist ou un Data Analyst, en sélectionnant et en catégorisant les données à traiter.

  •  Elaborer un prototype de l'architecture data en utilisant la technologie retenue sur un périmètre fonctionnel réduit afin d'évaluer son opérationnalité et sa pertinence.

  • Rédiger les spécifications techniques et fonctionnelles générales de l'architecture d'analyse de données massives en analysant les besoins et les retours d'expérience du prototype afin de préparer la mise en œuvre du projet

  • Concevoir un processus de collecte et de traitement de données massives en déterminant le référentiel de données, en créant des procédures de sélection et d'extraction de données multiples ainsi que des solutions de stockages afin de préparer le paramétrage des outils d'extraction, de traitement et de chargement

  • Elaborer une doctrine de collecte et de traitement des données exhaustive et commune à l'organisation en décrivant les étapes et calculs de traitement et de visualisation des données dans le respect des normes juridiques et des procédures garantissant la sécurité des données et des systèmes afin de réduire les risques juridiques

  • Intégrer des donnés à la solution de traitement en extrayant les sources au préalable, en élaborant des circuits automatisant les flux de données et en transformant les données de différentes sources afin de les mettre en forme et les harmoniser avant de les stocker

  • Alimenter les environnements de stockage en lançant la procédure de chargement des données et en supervisant son bon fonctionnement afin d'avoir à disposition une base correctement structurée et des données actualisées et exploitables

  • Installer et paramétrer des solutions de stockage de données massives en structurant des bases de données NoSQL, en organisant des systèmes de fichiers distribués et de stockage répartis de données afin d'obtenir un environnement de stockage opérationnel et conforme aux spécifications

  • Mettre à disposition l'ensemble des données aux Data Scientists ou aux Data Analysts selon un format exploitable en s'appuyant sur les données de référence du système d'information afin de garantir la qualité de données et la consolidation des systèmes de stockage de données sur le cloud au sein de Data Warehouse/Data Lake...
Programme
Non renseigné

Envie d’en savoir plus sur cette formation ?

Documentez-vous sur la formation

Quelle est votre situation ?

Haut de page