R pour la data analyse

Data Value

Non finançable CPF
Tout public
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Étudiant
Prix
1980 €
Durée
Nous contacter
Localité
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
En savoir plus sur les localités en présentiel
Cette formation est disponible dans les centres de formation suivants:
  • 75 - Paris 12e
Cette formation peut être dispensée dans votre entreprise dans les localités suivantes :
  • 75 - Paris
  • 77 - Seine-et-Marne
  • 78 - Yvelines
  • 91 - Essonne
  • 92 - Hauts-de-Seine
  • 93 - Seine-Saint-Denis
  • 94 - Val-de-Marne
  • 95 - Val-d'Oise
Objectifs
S'approprier les outils, et les méthodes permettant de rendre son processus d'analyse de données sous R, aisé, reproductible, et performant.


Compétences visées

- Adopter une organisation efficace de son travail sous R

- Importer et nettoyer ses données avant analyse

- Simplifier la manipulation de données avec le package dplyr

- Manipuler aisément les champs catégoriels (package forecats), textuels (package stringr) et de date (package lubridate)

- Assembler des tables par jointure (par colonnes) et par fusion (par lignes)

- Construire des graphiques élaborés grâce au package ggplot2

- Réaliser des documents automatisés à l'aide de Quarto
Programme
Programme

- Organisation de son travail sous R

  • Création de projet R

  • Architecture du projet R

  • Versionnage des scripts en local avec git


- Importations et nettoyage

  • Accélération et automatisation des importations

  • Uniformisation des noms des variables

  • Création de labels

  • Suppression des espaces

  • Gestion des doublons

  • Nettoyage et corrections diverses


- Manipulations avancées des data frame

  • Introduction au package tidyverse

  • Création de subsets, ajout de variables, transformation de variables

  • Création de tables aggrégées par groupe

  • Autres manipulations utiles

  • Jointure de tables à l'aide d'une clé primaire

  • Assemblage de tables de même structure

  • Passage en format long et wide


- Gestion des variables de type factor avec forecats

  • Afficher et renommer les niveaux

  • Modifier l'ordre des niveaux manuellement et automatiquement

  • Réaliser des regroupements de niveaux automatiquement


- Gestion des variables de types chaînes de caractères

  • Découpage, recherche, suppression, remplacement de pattern avec le package stringr

  • Création de chaîne de caractères complexes avec le package glue

  • Initiation aux expression régulières


- Gestion des données de dates et d'heures avec lubridate

  • Conversion d'une chaîne de caractères en date

  • Extraction de différents éléments d'une date

  • Diverses manipulations : calcul de délais, arrondi, ...


- Initiation au reporting avec Quarto

  • Principe

  • Premiers éléments : titre, texte, code, graphiques, tables

  • Améliorations : numérotation, table des matières, légende et renvois


- Réalisation de graphiques avec ggplot2

  • Principe du package

  • Premiers graphiques de type scatterplot

  • Gestion des couleurs, forme, taille, courbe de tendance

  • Division en plusieurs sous fenêtre

  • Autres types de graphiques
Haut de page