SNIIRAM : Utiliser R pour l’analyse des données des bases du SNDS

Objectifs de la formation ou Objectifs pédagogiques 

  • Utiliser R et RStudio pour importation de données
  • Structurer des données et réaliser des traitements avec le langage R.
  • Réaliser des graphiques avec R

Introduction :

A l’issue de ce module de formation, les stagiaires seront en capacité d’utiliser R et ses packages pour réaliser les opérations courantes d’accès aux données du SNDS, de manipulation et de représentation de ces données. 

Programme : 

Jour 1 : Acquisition des bases du langage R et de l’utilisation du logiciel RStudio.

À l’issue de cette journée, les stagiaires ont les bases du langage R et du logiciel RStudio et savent importer les données.

  • Introduction à l’écosystème R
  • Présentation du système R à travers le logiciel RStudio
  • Les bases de R
  • Le langage
  • Les packages
  • Les structures de contrôles (if/for/…)
  • Les opérateurs essentiels
  • Importations de données
  • Bonnes pratiques et outils nécessaires
  • Importation de fichiers (textuels, excel, sas et spss)
  • Connexion directe à une base de données et utilisation du SQL
  • Exportation de données
  • Fichiers textes
  • Fichiers binaires
  • Normes et conventions R avec Rstudio
  • Organisation des projets RStudio
  • Gestion du code
  • Les ressources communautaires et leurs utilisations

Jour 2 : Réalisation des opérations de manipulation de données telles que les filtrages, les tris, les agrégations, les jointures et la restructuration.

À l’issue de cette journée, les stagiaires savent nettoyer et structurer des données et sont en mesure de réaliser des traitements de faible ou moyenne complexité avec le langage R. C’est aussi l’occasion d’apprendre à interroger des bases de données depuis R.

  • Présentation du format tidy
  • Enchaînements des opérations (piping)
  • Restructurer les données avec tidyr
  • Manipulation simple des données avec dplyr
  • Manipulation avancée des données avec dplyr
  • Gestion des dates avec lubridate
  • Gestion des chaînes de caractères avec stringr
  • Utilisation de dbplyr avec une base de données
  • Programmation avec dplyr et tidyr
  • Utilisations avec un nombre important de dimensions
  • Industrialisation des traitements

 

Jour 3 : Production des graphiques de qualité depuis R avec le package ggplot2. La journée permet de couvrir différents thèmes tels que l’exploration graphique de données ou encore la personnalisation des rendus. Les exercices mobilisent également les stagiaires sur les concepts vus lors des journées précédentes.

 

  • Introduction
  • Le système graphique
  • Les base graphics
  • Paradigmes de ggplot2
  • La galaxie des types de graphiques
  • Les types usuels
  • Les fonctions statistiques
  • Les extensions disponibles
  • Maîtrise des axes et des légendes
  • Ventilation des graphiques par axes
  • Les annotations
  • Les thèmes et la personnalisation des graphiques
  • Les outils à maîtriser
  • Combinaisons de graphiques
  • Optimisations du placement des textes
  • Les extensions

 

Info covid :

Pendant la crise sanitaire, des sessions sont proposées en version distancielle (FOAD), via Zoom. Elles sont dispensées sur 2x2,5h de classe virtuelle, sur 1 journée ou 2 demi-journées consécutives. 

Financement :

Pour toute information concernant le financement nous vous invitons à cliquer sur le lien « Retrouvez l'ensemble des informations sur les conditions, l'accessibilité et la qualité de nos prestations » disponible sur la page d'accueil du Portail d'inscription.

Conditions d'accès aux stagiaires porteurs d'un handicap :

Pour toute information concernant les conditions d’accès aux stagiaires porteurs d’un handicap nous vous invitons à cliquer sur le lien « Retrouvez l'ensemble des informations sur les conditions, l'accessibilité et la qualité de nos prestations » disponible sur la page d'accueil du Portail d'inscription.

Délai d'accès à la prestation :

Si aucune session planifiée n'est proposée ou si toutes les sessions planifiées sont complètes nous vous invitons à cliquer sur le lien « Retrouvez l'ensemble des informations sur les conditions, l'accessibilité et la qualité de nos prestations » disponible sur la page d'accueil du Portail d'inscription.

Informations générales liées à nos prestations :

Pour retrouver nos CGV, le règlement intérieur applicable aux stagiaires et le règlement des formations du Régime général de la Sécurité Sociale nous vous invitons à cliquer sur le lien « Retrouvez l'ensemble des informations sur les conditions, l'accessibilité et la qualité de nos prestations » disponible sur la page d'accueil du Portail d'inscription.

Tarif INTER : 1220€

Tarif intra : 7315 €

Merci d'adresser votre demande à l'adresse mail suivante : DO-Supports-RH@institutquatredix.fr

Méthodes pédagogiques

  • Alternance de théorie et de manipulations sur des cas pratiques pour interroger les données individuelles du SNDS (DCIR) avec l’interface R

 

 Public :  

  • Toute personne appartenant à un organisme autorisé à interroger DCIRS-DCIR ou EGBS sur autorisation pérenne ou par projet

 

 Prérequis : 

  • L’utilisateur aura suivi la formation DCIR : REQ-172(accès permanents); ou EGBS : REQ-086; ou Données d’extraction : REQ-256, (accès sur projet)

 

Informations

  • 3.0 jour(s) (21.0 h)
Référence: LI-REQ-280-AM-INST
Demander un INTRA
OF: Métiers des ressources humaines

Prochaines sessions

Réf : AF_INTER_030001

Du 27 octobre 2021 au 29 octobre 2021


  • Site de PARIS I4.10
Plus de places disponibles
OF: Métiers des ressources humaines

Réf : AF_INTRA_022604

Du 15 novembre 2021 au 17 novembre 2021


  • Site de PARIS I4.10
Plus de places disponibles
OF: Métiers des ressources humaines

Réf : AF_INTER_030011

Du 30 novembre 2021 au 2 décembre 2021


  • Site de PARIS I4.10
Plus de places disponibles
OF: Métiers des ressources humaines

Réf : AF_INTER_030021

Du 13 décembre 2021 au 15 décembre 2021


  • Site de PARIS I4.10
3 places disponibles
OF: Métiers des ressources humaines
Waiting...