Introduction :
A l’issue de ce module de formation, les stagiaires seront en capacité d’utiliser R et ses packages pour réaliser les opérations courantes d’accès aux données du SNDS, de manipulation et de représentation de ces données.
Programme :
Jour 1 : Acquisition des bases du langage R et de l’utilisation du logiciel RStudio.
À l’issue de cette journée, les stagiaires ont les bases du langage R et du logiciel RStudio et savent importer les données.
-
Les opérateurs essentiels
-
Importations de données
-
Bonnes pratiques et outils nécessaires
-
Importation de fichiers (textuels, excel, sas et spss)
-
Connexion directe à une base de données et utilisation du SQL
Jour 2 : Réalisation des opérations de manipulation de données telles que les filtrages, les tris, les agrégations, les jointures et la restructuration.
À l’issue de cette journée, les stagiaires savent nettoyer et structurer des données et sont en mesure de réaliser des traitements de faible ou moyenne complexité avec le langage R. C’est aussi l’occasion d’apprendre à interroger des bases de données depuis R.
-
Présentation du format tidy
-
Enchaînements des opérations (piping)
-
Restructurer les données avec tidyr
-
Manipulation simple des données avec dplyr
-
Manipulation avancée des données avec dplyr
-
Gestion des dates avec lubridate
-
Gestion des chaînes de caractères avec stringr
-
Utilisation de dbplyr avec une base de données
-
Programmation avec dplyr et tidyr
Jour 3 : Production des graphiques de qualité depuis R avec le package ggplot2. La journée permet de couvrir différents thèmes tels que l’exploration graphique de données ou encore la personnalisation des rendus. Les exercices mobilisent également les stagiaires sur les concepts vus lors des journées précédentes.
-
Les types usuels
-
Les fonctions statistiques
-
Les extensions disponibles
-
Maîtrise des axes et des légendes
-
Ventilation des graphiques par axes
-
Les annotations
-
Les thèmes et la personnalisation des graphiques
-
Les outils à maîtriser
-
Combinaisons de graphiques
-
Optimisations du placement des textes