Realiser ses analyses statistiques avec le logiciel R

Data Value

Non finançable CPF
Tout public
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
1980 €
Durée
Nous contacter
Niveau visé
Non diplômante
Localité
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
En savoir plus sur les localités en présentiel
Cette formation est disponible dans les centres de formation suivants:
  • 75 - Paris 8e
Cette formation peut être dispensée dans votre entreprise dans les localités suivantes :
  • 75 - Paris
  • 77 - Seine-et-Marne
  • 78 - Yvelines
  • 91 - Essonne
  • 92 - Hauts-de-Seine
  • 93 - Seine-Saint-Denis
  • 94 - Val-de-Marne
  • 95 - Val-d'Oise
Objectifs
Objectifs :
Apprendre à utiliser le logiciel R pour analyser des données.
Mettre en oeuvre dans R les méthodes de statistique descriptive, décisionnelle, analyse de la variance, régression linéaire et analyse de données multidimensionnelles

Compétences visées :
- Importer, manipuler et analyser des données dans R
- Effectuer des analyses statistiques univariées
- Établir avec R des intervalles de confiance autour de paramètres comme moyenne, proportion et variance
- Réaliser les principaux tests d'hypothèses paramétriques et non paramétriques dans le logiciel
- Étudier numériquement et graphiquement la liaison entre 2 variables quantitatives, qualitatives ou de chaque nature
- Mettre en oeuvre des analyses de la variance à un ou plusieurs facteurs pour la comparaison de moyennes de population
- Élaborer un modèle établissant une relation linéaire entre une variable à expliquer et une (régression simple) ou plusieurs (régression multiple) variables explicatives.
- Découvrir les principales méthodes d'analyse multidimensionnelle des données à l'aide du package FactoMineR
Programme
- Statistiques descriptives
Gestion d'un jeu de données - dataframe
Importation, caractérisation, sélection, sous-ensembles
Premières analyses d'un jeu de données
Premières vérifications, valeurs manquantes, recodage
Résumé d'une variable quantitative - numeric
Indicateurs numériques, représentations graphiques
Résumé d'une variable qualitative - factor
Indicateurs numériques, représentations graphiques

- Intervalle de confiance
Le raisonnement à partir d'un échantillon
Généralités, échantillonnage, estimation d'un paramètre
Intervalle de confiance d'une moyenne
Intervalle de confiance d'une proportion
Intervalle de confiance d'une variance

- Tests d'hypothèses
Qu'est-ce qu'un test d'hypothèse ?
Généralités, règle de décision, risques d'erreur, puissance
Les tests de conformité ou de comparaison à une norme
Conformité d'une moyenne, d'une proportion
Les tests de comparaison de deux populations
Comparaison de deux moyennes, de deux proportions
Test d'ajustement à une loi de probabilité normale
Le test de Shapiro-Wilk
Introduction aux tests non paramétriques
Test de Wilcoxon, Mann et Whitney, Kruskal Wallis, Friedman

- Liaisons entre deux variables
Liaison entre deux variables quantitatives
Nuage de points, intensité de la liaison, significativité
Liaison entre deux variables qualitatives
Tableau de contingence, intensité et significativité du lien de dépendance : test du khi2
Liaison entre une variable qualitative et quantitative
Comparaison de plusieurs populations, le rapport de corrélation
Liaisons entre plusieurs variables
Approches graphiques : matrice de nuages de points, treillis
Caractériser des sous-populations par plusieurs variables

- L'analyse de la variance - Anova
Analyse de la variance à un facteur
Variabilité inter, intra, totale - Rapport de corrélation - Le test de Fisher
Comparaisons multiples de moyennes
Analyses post hoc, la procédure de Tukey
Analyse de la variance à deux facteurs et interaction
Extensions de l'Anova
Modèle à effet fixe ou aléatoire, modèle hiérarchisé

- Régression linéaire simple et multiple
De la corrélation à la régression
L'intérêt d'un modèle - Variables à expliquer, explicatives, erreur
La régression linéaire simple
Ajustement par la méthode des moindres carrés - Tests et validation du modèle
La régression linéaire multiple
Choix d'un modèle de régression
Pourquoi sélectionner un sous-ensemble de variables explicatives ?
Les différentes approches et critères de sélection d'un modèle

- Analyse de données multidimensionnelles
Un panorama des méthodes multidimensionnelles
Analyses factorielles, classification - Le package FactoMineR
ACP : Analyse en Composantes principales
AFC : Analyse Factorielle des Correspondances
ACM : Analyse des correspondances Multiples
CAH : Classification Ascendante Hiérarchique

Envie d’en savoir plus sur cette formation ?

Documentez-vous sur la formation

Ces formations peuvent vous intéresser

Quelle est votre situation ?

Vous êtes ?

Veuillez choisir un lieu

Please fill out this field.

Please fill out this field.

Veuillez sélectionner un niveau de formation

Informez-vous gratuitement et sans engagement sur la formation.

Please fill out this field.

Please fill out this field.

Please fill out this field.

Veuillez saisir une adresse email

  • Vous voulez dire ?
  • ou plutôt ?

En cliquant sur "J'envoie ma demande", vous acceptez les CGU et déclarez avoir pris connaissance de la politique de protection des données du site maformation.fr

Haut de page