R pour la data analyse
Data Value
Non finançable CPF
Tout public
Présentiel
Public admis
Salarié en poste
Demandeur d'emploi
Entreprise
Etudiant
Prix
1980 €
Durée
Nous contacter
Niveau visé
Non diplômante
Localité
En présentiel
Découvrez les localités disponibles pour suivre cette formation en présentiel.
Objectifs
Objectif :
S'approprier les outils, et les méthodes permettant de rendre son processus d'analyse de données sous R, aisé, reproductible, et performant
Compétences visées :
- Adopter une organisation efficace de son travail sous R
- Simplifier la manipulation de données avec le package dplyr
- Manipuler aisément les champs catégoriels (package forecats), textuels (package stringr) et de date (package lubridate)
- Assembler des tables par jointure (par colonnes) et par fusion (par lignes)
- Construire des graphiques élaborés grâce au package ggplot2
- Réaliser des documents automatisés à l'aide du package Rmarkdown
- Découvrir la programmation fonctionnelle au travers du package purrr
S'approprier les outils, et les méthodes permettant de rendre son processus d'analyse de données sous R, aisé, reproductible, et performant
Compétences visées :
- Adopter une organisation efficace de son travail sous R
- Simplifier la manipulation de données avec le package dplyr
- Manipuler aisément les champs catégoriels (package forecats), textuels (package stringr) et de date (package lubridate)
- Assembler des tables par jointure (par colonnes) et par fusion (par lignes)
- Construire des graphiques élaborés grâce au package ggplot2
- Réaliser des documents automatisés à l'aide du package Rmarkdown
- Découvrir la programmation fonctionnelle au travers du package purrr
Programme
- Organiser son travail sous R (2h)
Travailler en projet R : notion de working directory, workspace, history
Architecture de son projet R : data, plots, images, scripts, ...
Bonnes pratiques pour la création de fichiers de données
Importation et exportation de fichiers avec le package here
Mettre à jour ses packages
Mettre à jour R et R Studio
- Manipuler facilement ses données avec le package dplyr (3h)
Introduction au package tidyverse et à la notion de pipe
Filtrer des lignes avec la fonction filter()
Sélectionner des colonnes (variable) avec la fonction select()
Création de nouvelles variables avec la fonction mutate()
Renommer ses variable avec la fonction rename()
Calcul de paramètres par sous groupes : fonctions group_by() et summarise()
Passage du format wide au format long
Exercices
- Manipulation des variables catégorielles avec le package forecats (1h)
Inspecter les variables catégorielles avec les fonctions levels(), fct_count et fct_unique
Modifier l'ordre des modalités
Modifier le nom des modalités
Exercices
- Manipuler les chaînes de caractères avec le package stringr (1h)
Détection de patterns
Découpage
Gestion des longueurs
Remplacement
Exercices
- Manipuler des données de date : utilisation du package lubridate (1h)
Convertir les données au format YYYY-MM-DD et HH:MM:SS
Décomposer les éléments d'année, de mois et de jour
Calculer des différences de dates et les exprimer en jours ou heures
Exercices
- Assemblage de tables (2h)
Les différentes jointures (par colonne): left join, right join, inner join et full join
Assemblage par lignes
Exemple d'applications pour l'analyse de données
Exercices
- Réaliser des représentations graphiques performantes avec le package ggplot2 (4h)
Le principe des couches successives de ggplot2
Réalisation des graphiques de base : scatterplot, barplots, line plot, boxplots
Gestion des couleurs, titres, axes et légendes
Représentation des séries temporelles
Utilisation du format long et facetting
Ajouter du texte sur un graphique (ex : équation)
Exporter son graphique : format et résolution
Utilisation des addins esquisse et Colour Picker
- Générer dynamiquement son rapport d'analyse avec rmarkdown (4h)
Principe, formats de sorties (html, docx, pdf)
Les différents éléments d'un fichier Rmd : en-tête, chunk, ...
Gestion des éléments de texte : gras, italique, titre
Gestion des tables
Gestion des images
Gestion des graphiques
Gestion des options des éléments de code
Gestion de la table des matières et numérotation
Les rapports paramétrés : automatisation des rapports d'analyse par sous groupe
- Introduction à la programmation fonctionnelle avec le package purrr (2h)
Les list
Les fonctions map()
Nested data
Exercices
Travailler en projet R : notion de working directory, workspace, history
Architecture de son projet R : data, plots, images, scripts, ...
Bonnes pratiques pour la création de fichiers de données
Importation et exportation de fichiers avec le package here
Mettre à jour ses packages
Mettre à jour R et R Studio
- Manipuler facilement ses données avec le package dplyr (3h)
Introduction au package tidyverse et à la notion de pipe
Filtrer des lignes avec la fonction filter()
Sélectionner des colonnes (variable) avec la fonction select()
Création de nouvelles variables avec la fonction mutate()
Renommer ses variable avec la fonction rename()
Calcul de paramètres par sous groupes : fonctions group_by() et summarise()
Passage du format wide au format long
Exercices
- Manipulation des variables catégorielles avec le package forecats (1h)
Inspecter les variables catégorielles avec les fonctions levels(), fct_count et fct_unique
Modifier l'ordre des modalités
Modifier le nom des modalités
Exercices
- Manipuler les chaînes de caractères avec le package stringr (1h)
Détection de patterns
Découpage
Gestion des longueurs
Remplacement
Exercices
- Manipuler des données de date : utilisation du package lubridate (1h)
Convertir les données au format YYYY-MM-DD et HH:MM:SS
Décomposer les éléments d'année, de mois et de jour
Calculer des différences de dates et les exprimer en jours ou heures
Exercices
- Assemblage de tables (2h)
Les différentes jointures (par colonne): left join, right join, inner join et full join
Assemblage par lignes
Exemple d'applications pour l'analyse de données
Exercices
- Réaliser des représentations graphiques performantes avec le package ggplot2 (4h)
Le principe des couches successives de ggplot2
Réalisation des graphiques de base : scatterplot, barplots, line plot, boxplots
Gestion des couleurs, titres, axes et légendes
Représentation des séries temporelles
Utilisation du format long et facetting
Ajouter du texte sur un graphique (ex : équation)
Exporter son graphique : format et résolution
Utilisation des addins esquisse et Colour Picker
- Générer dynamiquement son rapport d'analyse avec rmarkdown (4h)
Principe, formats de sorties (html, docx, pdf)
Les différents éléments d'un fichier Rmd : en-tête, chunk, ...
Gestion des éléments de texte : gras, italique, titre
Gestion des tables
Gestion des images
Gestion des graphiques
Gestion des options des éléments de code
Gestion de la table des matières et numérotation
Les rapports paramétrés : automatisation des rapports d'analyse par sous groupe
- Introduction à la programmation fonctionnelle avec le package purrr (2h)
Les list
Les fonctions map()
Nested data
Exercices
Envie d’en savoir plus sur cette formation ?
Documentez-vous sur la formation
Ces formations peuvent vous intéresser

DATA SCIENTIST | Titre RNCP niveau 7 - Bac +5 | Co-certifiée école...
À DISTANCE
Avis du centre
Témoignages

Formation au métier de Data Analyst (Power BI, SQL, certification...
LILLE, GRENOBLE, MARSEILLE ET 11 AUTRE(S) LOCALITÉ(S)
Offre spéciale
Avis du centre
Les formations les plus recherchées
Lyon
Toulouse
Marseille
Montpellier
Paris
Bordeaux
Dijon
Mâcon
Nantes
Rennes
Audit CPF
Audit en Ligne
Analyste de donnees
Analyste de donnees CPF
Analyste de donnees en Ligne
Statisticien
Power bi
Qlikview
Data scientist
Big data
Business intelligence
Analyste de donnees Paris
Big data Paris
Business intelligence Paris
Data scientist Paris
Power bi Paris
Qlikview Paris
Statisticien Paris
Statisticien Paris 1er
Qlikview Évry-Courcouronnes
Power bi Évry-Courcouronnes