Fouille de donnees
Réseau Formateurs
Non finançable CPF
Tout public
En ligne
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Étudiant
Prix
Nous contacter
Durée
Nous contacter
Localité
En ligne
Vous pouvez suivre cette formation depuis chez vous ou depuis n’importe quel endroit à distance.
Objectifs
- S'initier aux fondements de la Fouille de Données
- Découvrir les techniques de classification
- Analyser le Clustering
- Analyser l'Association et des Séquences
- Découvrir les techniques avancées en Data Mining
- Découvrir les applications spécialisées et études de cas
Programme
S'initier aux fondements de la Fouille de Données
Découvrir les techniques de classification
Analyser le Clustering
Analyser l'Association et des Séquences
Découvrir les techniques avancées en Data Mining
Découvrir les applications spécialisées et études de cas
- Introduire les concepts de base de la fouille de données
- Préparer les types de données pour l'analyse
- Utiliser des méthodes de prétraitement : nettoyage, réduction de dimension, normalisation
- Sélectionner des caractéristiques pour une meilleure performance
- Évaluer les performances : précision, rappel, F-mesure
- Utiliser des bibliothèques et des outils de fouille de données
Découvrir les techniques de classification
- Maîtriser l'apprentissage supervisé et non supervisé en classification
- Exploiter des algorithmes de classification : Arbres de décision, k-plus proches voisins, SVM, réseaux de neurones
- Appliquer des techniques d'ensemble : Forêts aléatoires, Boosting, Bagging
- Traiter les données déséquilibrées en classification
- Optimiser les hyperparamètres pour des modèles de classification performants
- Analyser des études de cas en classification avec des données réelles
Analyser le Clustering
- Comprendre les concepts fondamentaux du clustering et du partitionnement de données
- Utiliser des algorithmes de clustering : K-Means, DBSCAN, Agglomératif, Mean Shift
- Valider et évaluer les clusters : indice de silhouette, critère d'Elbow
- Sélectionner le nombre optimal de clusters avec des techniques spécifiques
- Utiliser des techniques de visualisation pour l'analyse de clusters
- Examiner des études de cas en clustering avec des données multidimensionnelles
Analyser l'Association et des Séquences
- Extraire des règles d'association et d'items fréquents
- Appliquer l'algorithme Apriori et FP-Growth
- Explorer l'analyse de séquences : modèles de Markov cachés, GSP
- Appliquer l'analyse de l'association dans le marketing et la recommandation
- Analyser des études de cas en analyse de l'association et des séquences
Découvrir les techniques avancées en Data Mining
- Utiliser l'analyse en composantes principales (PCA) pour la réduction de dimension
- Calculer la similarité et la dissimilarité entre données
- Explorer les données textuelles et réaliser une analyse de sentiments
- Exploiter les techniques d'apprentissage non supervisé : réduction de dimension non linéaire, clustering hiérarchique spectral
- Maîtriser les méthodes d'ensemencement en apprentissage non supervisé
- Analyser des études de cas sur des données hétérogènes et complexes
Découvrir les applications spécialisées et études de cas
- Détecter des anomalies : utiliser des méthodes statistiques et basées sur les modèles
- Explorer la fouille de données temporelles et les séries chronologiques
- Appliquer la fouille de données en bioinformatique, finance, santé, etc.
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation
Ces formations peuvent vous intéresser
DATA ANALYST | Titre RNCP niveau 7 Bac +5 | co-certifiée école MINES Paris
À DISTANCE
Finançable CPF
6590 €
5931 €
10% de réduction
À distance / En entreprise
Salarié en poste / Demandeur d'emploi / Entreprise
Avis du centre
.
DATASCIENTEST
DATA ENGINEERING | Titre RNCP niveau 7 - Bac +5 | Co-certifiée école MINES Paris
À DISTANCE
Finançable CPF
7490 €
6741 €
10% de réduction
À distance / En entreprise
Salarié en poste / Demandeur d'emploi / Entreprise
Avis du centre
.
DATASCIENTEST
Programmation en langage R Niveau 1 - Utilisateur - Analyse de données
PARIS
Finançable CPF
2990 €
À distance / En centre
Salarié en poste / Entreprise
ThinkR
DATA Engineer - Alternance - Titre RNCP Niveau 7
TOULOUSE, NANCY, LILLE ET 12 AUTRE(S) LOCALITÉ(S)
Finançable CPF
Nous contacter
À distance / En alternance / En entreprise
Demandeur d'emploi / Étudiant
Avis du centre
.
DATASCIENTEST
Data Management et Business Analytics - Master of Science
À DISTANCE
Non finançable CPF
23450 €
À distance
Salarié en poste / Demandeur d'emploi / Entreprise
EDHEC Business School – Online Programmes
Machine Learning Engineering for Production (MLOps)
NANCY, TOULOUSE, CLERMONT-FERRAND ET 11 AUTRE(S) LOCALITÉ(S)
Finançable CPF
12990 €
11691 €
10% de réduction
À distance / En alternance / En entreprise
Salarié en poste / Demandeur d'emploi / Entreprise
Avis du centre
.
DATASCIENTEST
Les formations les plus recherchées
Lyon
Toulouse
Marseille
Montpellier
Paris
Bordeaux
Dijon
Mâcon
Nantes
Rennes
Informatique CPF
Informatique en Ligne
Data mining
Data mining CPF
Data mining en Ligne
Technicien support informatique
Consultant en informatique
Administrateur systeme
Technicien informatique
Spark
Programmation
Technicien reseaux
Administrateur reseau
Developpeur informatique
Intelligence artificielle
Data mining Alfortville
Data mining Antony
Data mining Argenteuil
Data mining Asnières-sur-Seine
Data mining Athis-Mons
Data mining Aubervilliers
Data mining Aulnay-sous-Bois
Data mining Bagneux
Data mining Bagnolet
Data mining Beaumont-sur-Oise