
Formation DBT - Data Build Tool
SFEIR Institute
Non finançable CPF
Salarié en poste / Entreprise
En ligne
Présentiel
Voir des formations similaires
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
1400 €
Durée
2 jours - 14h à distance ou en présentiel
Taux de réussite
100%
Pré-requis
* Des connaissances pratiques de SQL équivalentes au cours SQL les fondamentaux [https://institute.sfeir.com/formations/data-analytics-and-ai/sql-les-fondamentaux/]
Certifications
OPQF
ICPF
Datadock
Qualiopi
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
Objectifs
* Comprendre les concepts clés, les avantages et l’architecture de dbt en tant qu’outil de transformation et de modélisation des données.
* Créer des modèles de données structurés avec dbt, et effectuer des transformations pour traiter et préparer les données en vue de l’analyse.
* Maîtriser les fonctionnalités avancées telles que les macros, les modèles Jinja, les variables et le contrôle de flux.
* Utiliser les instantanés (snapshots) dbt pour suivre les changements au fil du temps et gérer les données historiques, facilitant l’analyse des tendances historiques et les dimensions à changement lent.
* Mettre en œuvre des tests pour garantir la qualité et l’intégrité des données, permettant de valider les résultats des transformations et de détecter les anomalies.
* Créer des modèles de données structurés avec dbt, et effectuer des transformations pour traiter et préparer les données en vue de l’analyse.
* Maîtriser les fonctionnalités avancées telles que les macros, les modèles Jinja, les variables et le contrôle de flux.
* Utiliser les instantanés (snapshots) dbt pour suivre les changements au fil du temps et gérer les données historiques, facilitant l’analyse des tendances historiques et les dimensions à changement lent.
* Mettre en œuvre des tests pour garantir la qualité et l’intégrité des données, permettant de valider les résultats des transformations et de détecter les anomalies.
Programme
Jour 1
Module 1 : Évolution de la pile de données
* Évolution de la pile de données
* Comprendre les différences entre les approches d’intégration de données Extract-Transform-Load (ETL) et Extract-Load-Transform (ELT)
* Introduction à la pile de données moderne
Module 2 : Introduction à dbt
* Aperçu de dbt
* Installation de dbt et configuration de l’environnement de développement
* Créer un projet dbt
* Connexion aux sources de données
Lab : Mise en place d’un projet dbt
Module 3 : Travailler avec des modèles dbt
* Comprendre les modèles dbt
* Comment fonctionnent les modèles de dbt ?
* Options de matérialisation
* Configuration de la matérialisation
* Présentation de la fonctionnalité de tagging pour l’organisation des métadonnées
Atelier : Créer des modèles de données avec dbt
Module 4 : Sources et références dbt
* Introduction aux sources dbt
* Configuration des sources dbt
* Travailler avec des références dbt
Atelier : Configuration des sources dbt, référencement des données externes et gestion des dépendances du modèle
Module 5 : Amorçage de vos modèles de données
* Introduction aux seeds dbt
* Création et remplissage de données seed
* Avantages de l’utilisation de seeds pour l’initialisation des données
* Intégrer des seeds à vos modèles dbt
Atelier : Créer et intégrer des seeds dans vos projets dbt
Jour 2
Module 6 : Snapshots pour gérer les données historiques
* Comprendre les snapshots dans dbt
* Configuration et définition de snapshots
* Exécuter et gérer des snapshots
Atelier : Mise en œuvre d’une stratégie de snapshots
Module 7 : Transformation et contrôle avancés des données
* Comprendre les macros
* Jinja, un langage de modèles
* Utiliser des variables pour gérer la configuration du pipeline de données
Atelier : Transformation et contrôle avancés des données
Module 8 : Packages
* Introduction aux packages dbt
* Explorer le hub dbt
* Installation et utilisation de package dbt
Atelier : Explorer les packages dbt
Module 9 : Tests
* Mettre en évidence les risques potentiels dans le code
* Mise en place de tests automatisés
* Choisir le test approprié
* Implémentation des tests de données
Atelier : Implémentation de tests de données
Module 10 : Documentation
* Documenter les modèles de données
* Utiliser les fonctionnalités de documentation intégrées de dbt pour générer et maintenir une documentation de modèle accessible et à jour
* L’importance du lineage
Laboratoire : Documenter les modèles de DBT
Module 11 : Analyses, hooks et exposition (avancé)
* Effectuer une analyse des données
* Exécuter du code personnalisé avant et après l’exécution de dbt
* Créer des assets de données partageables et accessibles
Atelier : Créer une exposition
Module 12 : Exploiter les artefacts générés (avancé)
* Comprendre manifest.json
* Introduction de run_result.json
Module 13 : Conclusion
* Ressources sur les meilleures pratiques en matière de dbt
* À propos de l’examen de certification DBT
Module 1 : Évolution de la pile de données
* Évolution de la pile de données
* Comprendre les différences entre les approches d’intégration de données Extract-Transform-Load (ETL) et Extract-Load-Transform (ELT)
* Introduction à la pile de données moderne
Module 2 : Introduction à dbt
* Aperçu de dbt
* Installation de dbt et configuration de l’environnement de développement
* Créer un projet dbt
* Connexion aux sources de données
Lab : Mise en place d’un projet dbt
Module 3 : Travailler avec des modèles dbt
* Comprendre les modèles dbt
* Comment fonctionnent les modèles de dbt ?
* Options de matérialisation
* Configuration de la matérialisation
* Présentation de la fonctionnalité de tagging pour l’organisation des métadonnées
Atelier : Créer des modèles de données avec dbt
Module 4 : Sources et références dbt
* Introduction aux sources dbt
* Configuration des sources dbt
* Travailler avec des références dbt
Atelier : Configuration des sources dbt, référencement des données externes et gestion des dépendances du modèle
Module 5 : Amorçage de vos modèles de données
* Introduction aux seeds dbt
* Création et remplissage de données seed
* Avantages de l’utilisation de seeds pour l’initialisation des données
* Intégrer des seeds à vos modèles dbt
Atelier : Créer et intégrer des seeds dans vos projets dbt
Jour 2
Module 6 : Snapshots pour gérer les données historiques
* Comprendre les snapshots dans dbt
* Configuration et définition de snapshots
* Exécuter et gérer des snapshots
Atelier : Mise en œuvre d’une stratégie de snapshots
Module 7 : Transformation et contrôle avancés des données
* Comprendre les macros
* Jinja, un langage de modèles
* Utiliser des variables pour gérer la configuration du pipeline de données
Atelier : Transformation et contrôle avancés des données
Module 8 : Packages
* Introduction aux packages dbt
* Explorer le hub dbt
* Installation et utilisation de package dbt
Atelier : Explorer les packages dbt
Module 9 : Tests
* Mettre en évidence les risques potentiels dans le code
* Mise en place de tests automatisés
* Choisir le test approprié
* Implémentation des tests de données
Atelier : Implémentation de tests de données
Module 10 : Documentation
* Documenter les modèles de données
* Utiliser les fonctionnalités de documentation intégrées de dbt pour générer et maintenir une documentation de modèle accessible et à jour
* L’importance du lineage
Laboratoire : Documenter les modèles de DBT
Module 11 : Analyses, hooks et exposition (avancé)
* Effectuer une analyse des données
* Exécuter du code personnalisé avant et après l’exécution de dbt
* Créer des assets de données partageables et accessibles
Atelier : Créer une exposition
Module 12 : Exploiter les artefacts générés (avancé)
* Comprendre manifest.json
* Introduction de run_result.json
Module 13 : Conclusion
* Ressources sur les meilleures pratiques en matière de dbt
* À propos de l’examen de certification DBT
Cette formation est temporairement suspendue.
Voici des formations similaires :
Ces formations peuvent vous intéresser
Les formations les plus recherchées
Lyon
Toulouse
Marseille
Montpellier
Paris
Bordeaux
Dijon
Mâcon
Nantes
Rennes
Informatique CPF
Informatique en Ligne
Data scientist
Data scientist CPF
Data scientist en Ligne
Technicien informatique
Technicien support informatique
Administrateur systeme
Consultant en informatique
Spark
Programmation
Technicien reseaux
Administrateur reseau
Hadoop
Growth hacking
Data scientist Paris
Data scientist Évry-Courcouronnes
Data scientist Nanterre
Data scientist Créteil
Data scientist Issy-les-Moulineaux
Data scientist La Défense
Data scientist Orly
Data scientist Poissy
Data scientist Rungis
Data scientist Versailles
Cette formation est temporairement suspendue.
Voir des formations similaires