Stat4decision

Dataiku DSS - initiation

Stat4decision

Non finançable CPF
Salarié en poste / Entreprise
En ligne
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
1200 €
Durée
14 heures en présentiel ou en distanciel
Niveau visé
Niveau BAC + 5
Pré-requis
Connaissance de base en informatique et en traitement de données.
Certifications
Datadock Qualiopi
Le plus de la formation
Formation pratique, petits groupes, maîtrise de Dataiku DSS en 2 jours.
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
En savoir plus sur les localités en présentiel
Cette formation est disponible dans les centres de formation suivants:
  • 75 - Paris 12e
Cette formation peut être dispensée dans votre entreprise dans les localités suivantes :
  • 01 - Ain
  • 02 - Aisne
  • 03 - Allier
  • 04 - Alpes-de-Haute-Provence
  • 05 - Hautes-Alpes
  • 06 - Alpes-Maritimes
  • 07 - Ardèche
  • 08 - Ardennes
  • 09 - Ariège
  • 10 - Aube
  • 11 - Aude
  • 12 - Aveyron
  • 13 - Bouches-du-Rhône
  • 14 - Calvados
  • 15 - Cantal
  • 16 - Charente
  • 17 - Charente-Maritime
  • 18 - Cher
  • 19 - Corrèze
  • 21 - Côte-d'Or
  • 22 - Côtes-d'Armor
  • 23 - Creuse
  • 24 - Dordogne
  • 25 - Doubs
  • 26 - Drôme
  • 27 - Eure
  • 28 - Eure-et-Loir
  • 29 - Finistère
  • 2A - Corse-du-Sud
  • 2B - Haute-Corse
  • 30 - Gard
  • 31 - Haute-Garonne
  • 32 - Gers
  • 33 - Gironde
  • 34 - Hérault
  • 35 - Ille-et-Vilaine
  • 36 - Indre
  • 37 - Indre-et-Loire
  • 38 - Isère
  • 39 - Jura
  • 40 - Landes
  • 41 - Loir-et-Cher
  • 42 - Loire
  • 43 - Haute-Loire
  • 44 - Loire-Atlantique
  • 45 - Loiret
  • 46 - Lot
  • 47 - Lot-et-Garonne
  • 48 - Lozère
  • 49 - Maine-et-Loire
  • 50 - Manche
  • 51 - Marne
  • 52 - Haute-Marne
  • 53 - Mayenne
  • 54 - Meurthe-et-Moselle
  • 55 - Meuse
  • 56 - Morbihan
  • 57 - Moselle
  • 58 - Nièvre
  • 59 - Nord
  • 60 - Oise
  • 61 - Orne
  • 62 - Pas-de-Calais
  • 63 - Puy-de-Dôme
  • 64 - Pyrénées-Atlantiques
  • 65 - Hautes-Pyrénées
  • 66 - Pyrénées-Orientales
  • 67 - Bas-Rhin
  • 68 - Haut-Rhin
  • 69 - Rhône
  • 70 - Haute-Saône
  • 71 - Saône-et-Loire
  • 72 - Sarthe
  • 73 - Savoie
  • 74 - Haute-Savoie
  • 75 - Paris
  • 76 - Seine-Maritime
  • 77 - Seine-et-Marne
  • 78 - Yvelines
  • 79 - Deux-Sèvres
  • 80 - Somme
  • 81 - Tarn
  • 82 - Tarn-et-Garonne
  • 83 - Var
  • 84 - Vaucluse
  • 85 - Vendée
  • 86 - Vienne
  • 87 - Haute-Vienne
  • 88 - Vosges
  • 89 - Yonne
  • 90 - Territoire de Belfort
  • 91 - Essonne
  • 92 - Hauts-de-Seine
  • 93 - Seine-Saint-Denis
  • 94 - Val-de-Marne
  • 95 - Val-d'Oise
Objectifs
  • Comprendre l’environnement Dataiku DSS : découvrir l’interface, les notions de projet, de datasets, de recettes, et la logique des workflows visuels.
  • Acquérir les compétences clés en data management : apprendre à connecter des sources de données (fichiers, bases de données, APIs), à les explorer, à effectuer des jointures, des filtres et des enrichissements.
  • Maîtriser la préparation et la transformation des données : savoir structurer des pipelines de traitement (nettoyage, normalisation, agrégation), utiliser les fonctions avancées de Dataiku (formules, recettes Python ou SQL, fonctions window, etc.).
  • Automatiser les traitements et gérer les scénarios : construire des chaînes de traitement reproductibles, planifier des exécutions, intégrer des variables de projet et paramétrer des scénarios pour industrialiser vos flux.
  • Savoir créer et partager des analyses reproductibles : visualiser des résultats, construire des dashboards, et collaborer efficacement au sein d’un projet Dataiku.
Programme
Jour 1 – Prise en main de Dataiku et préparation des données

  • Découverte de l’interface et des fondamentaux
    • Présentation de l’environnement Dataiku DSS : projets, datasets, recettes, scénarios.
    • Tour d’horizon des principales briques : navigation, explorateur de données, schémas de flux
  • Connexion et importation des données
    • Connexion à diverses sources : fichiers plats (CSV, Excel), bases de données (SQL), S3, APIs.
    • Création et gestion de datasets : aperçu, échantillonnage, types de colonnes et métadonnées
  • Manipulation de données sans code
    • Nettoyage et enrichissement avec les recettes visuelles (filtre, tri, formules, fusion, pivot…).
    • Utilisation de jointures et d’unions pour croiser plusieurs sources de données.
    • Transformation de variables, création de colonnes conditionnelles, détection de doublons.
  • Travaux pratiques
    • Construction pas à pas d’un premier pipeline de préparation de données.
    • Cas concret : importation, nettoyage et enrichissement de données multi-sources.
Jour 2 – Approfondissement, automatisation et bonnes pratiques

  • Aller plus loin avec les recettes avancées
    • Utilisation des recettes SQL et Python pour répondre à des besoins spécifiques.
    • Découverte des fonctions window (rolling average, rangs, cumuls).
    • Création de variables projet pour automatiser les filtres et les chemins dynamiques.
  • Automatisation et gestion des scénarios
    • Introduction aux scénarios Dataiku : déclencheurs, étapes, monitoring.
    • Création d’un flux automatisé de traitement et export de résultats.
    • Gestion des erreurs, logs et documentation des pipelines.
  • Structuration de projets et collaboration
    • Organisation des projets : dossiers, versionnage, partage des objets.
    • Notions de reproductibilité et bonnes pratiques pour les équipes data.
    • Visualisation des résultats, mise en forme et publication de tableaux de bord simples.
  • Mise en pratique finale
    • Mini-projet guidé : structuration d’un dataflow complet, traitement automatisé et restitution.
    • Adaptation de l’environnement à vos cas d’usage concrets (bases de données, reporting, API…).

Formations courtes

accessibles à tous

7 participants

maximum par sessions

Centre

À propos du centre Stat4decision

Stat4decision est un organisme de formation spécialisé dans la data. Si vous recherchez à acquérir des compétences dans le domaine de la data science ou de la business intelligence, nous avons des formations adaptées à vos besoins.

Nous proposons des formations en petits groupes en inter-entreprises dans nos salles de formations à Paris. Mais aussi en salle de classe virtuelle ainsi qu'en blended learning grâce à des outils novateurs. Nous proposons aussi des formations sur mesures pour vos équipes dans vos locaux.

Envie d’en savoir plus sur cette formation ?

Documentez-vous sur la formation

Certification Datadock
Certification Qualiopi
Ces formations peuvent vous intéresser

Quelle est votre situation ?

Vous êtes ?

Veuillez choisir un lieu

Please fill out this field.

Please fill out this field.

Veuillez sélectionner un niveau de formation

Informez-vous gratuitement et sans engagement sur la formation.

Please fill out this field.

Please fill out this field.

Please fill out this field.

Veuillez saisir une adresse email

  • Vous voulez dire ?
  • ou plutôt ?

En cliquant sur "J'envoie ma demande", vous acceptez les CGU et déclarez avoir pris connaissance de la politique de protection des données du site maformation.fr

Haut de page