Analyse statistique avec R
Session 3. Statistiques pour les données à haut-débit / RStudio et rapport Rmarkdown
Session 4. Analyse en composantes principales / Exploration des données multidimensionelles
Session 6. Classification non-supervisée / Analyse d’enrichissement
The aim of this module is to provide you with the bases of R programming and to present you some statistical concepts for high-throuput data.
To follow this course, prior knowledge is expected on:
Doc | Description | URL |
---|---|---|
Git pages | Web site of the course (to see the supports) | https://du-bii.github.io/module-3-Stat-R/stat-R_2021/ |
Git repo | Repository enabling to download or clone the teaching material on your computer | https://github.com/DU-Bii/module-3-Stat-R |
Serveur Jupyter Hub IFB | Python but also R! | https://jupyterhub.cluster.france-bioinformatique.fr/ |
RStudio at IFB cluster | link to RStudio on th IFB cluster | https://rstudio.cluster.france-bioinformatique.fr/ |
Slack | forum pour échanges et discussions | https://dubii.slack.com |
Slides: Slides for the whole session
Questions: lien wooclap et proposition de solution
Tutorial:
Practical:
Data:
shared/projects/dubii2021/trainers/module3/data/pavkovic/1.datainit
Contrôles de flux: boucles versus vectorisation, excutions conditionnelles
Fonctions: implémentation
Paquets/librairies: installation et troubleshooting, chargement, utilisation
Figures à façon avec R base
Introduction au Tidyverse: ggplot2, dplyr, tidyr
Slides:
Tutorial:
Practical:
Date: 11/03/2021 de 9h00 à 12h00
Analyse en composantes principales (ACP)
Comprendre le principe de base de l’analyse en composantes principales, ainsi que les objectifs de cette méthode.
Réaliser une ACP avec R, obtenir des visualisations graphiques pour aider à l’interprétation (cercle des corrélations, biplot, contribution des variables et des individus).
Exploration de données multi-omiques multidimensionelles
Slides: Cours sur l’ACP visualisable ici
Practicals:
Correction du TD sur l’ACP, visualisable ici
Exercice : application de l’ACP aux données multi-omiques de Pavkovicz (2019)
self_contained
en indiquant yes
Topics | Support | Formats |
---|---|---|
The TCGA BIC study case | Intro | [pdf] |
Data loading and exploration | Tutorial (optional) | [html] [Rmd] |
Principes du clustering | Cours | [html] [Rmd] |
Tutorial + practical | [html] [Rmd] | |
Analyse d’enrichissement fonctionnel | Cours | [html] |
Tutorial | [html] [Rmd] | |
Practical | [html] [Rmd] | |
Correction | [html] [Rmd] | |
Supervised classification | Slides | |
Tutorial + practical | [html] [Rmd] |
Après la Session 1
Après la Session 2
Après la Session 3
Après la session 4
Mini-projet
Le but de ce travail est de mettre en oeuvre les méthodes vues dans le module 3 “R et statistiques” pour explorer le jeu de données de Pavkovic, et de rendre un rapport d’analyse au format .Rmd
. Nous vous fournissons le fichier Prenom-NOM_m3-stat-R_mini-projet.Rmd
à ce lien avec une trame des principales sections attendues. Certaines contiennent déjà du code. Vous devrez en compléter d’autres. Sentez-vous libres d’adapter cette trame ou d’y ajouter des analyses complémentaires si elles vous aident à interpréter vos résultats. La date limite pour rendre se travail est fixée au 26/05/21 minuit dans votre repertoire: /shared/projects/dubii2021/[login]/m3-stat-R/mini-projet
L’activité atelier est annulée due à la charge de travail déjà importante.
Doc | Description | URL |
---|---|---|
Cheet sheats | RStudio Cheet sheats | https://rstudio.com/resources/cheatsheets/ |
Tutorial | Tutorial for Beginners by E. Paradis - English version | https://cran.r-project.org/doc/contrib/Paradis-rdebuts_en.pdf |
Tutorial | Tutorial for Beginners by E. Paradis - French version | https://cran.r-project.org/doc/contrib/Paradis-rdebuts_fr.pdf |
R style guide | Google’s R Style Guide | https://google.github.io/styleguide/Rguide.html |
Another reference for R style guide | tidyversesStyle Guide | https://style.tidyverse.org/ |
Category | Title | Description | Link |
---|---|---|---|
Coding | The tidyverse R style guide | Style recommendations for R code | https://style.tidyverse.org/ |
Coding | Tidyverse cheat sheet | One-poage summary of basic tidyverse syntax | https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Tidyverse+Cheat+Sheet.pdf |
Versioning | Happy Git and GitHub for the useR | How to manage versioning of R code on a github repository | https://happygitwithr.com/ |
Functions | R Documentation | List of R packages and functions | https://www.rdocumentation.org/ |
Functions | QuickR | List R functions for stats and plotting | https://www.rdocumentation.org/ |
Statistics and DataViz | STDHA | Statistical tools for high-throughput data analysis | http://www.sthda.com/english/ |
Basic stats explained to biologists | Points of Significance | Nature Methods collection | https://www.nature.com/collections/qghhqm/pointsofsignificance |
DataViz | R Graph gallery | How to display your data | http://www.r-graph-gallery.com/all-graphs/ |
DataViz | DEFAKATOR | Détecter des graphiques trompeurs | https://www.youtube.com/watch?v=crTt-QIyS-o |
DataViz | Using color sin R | Explains available packages for colors in R | https://www.stat.ubc.ca/~jenny/STAT545A/block14_colors.html#using-colors-in-r |
DataViz | Using colors in R | How to do a high resolution figure with R base | https://danieljhocking.wordpress.com/2013/03/12/high-resolution-figures-in-r/ |
DataViz | DataViz | link tto the book | https://clauswilke.com/dataviz/ |
Ce contenu est mis à disposition selon les termes de la licence Creative Commons Attribution - Partage dans les Mêmes Conditions 4.0 International (CC BY-SA 4.0). Consultez le fichier LICENSE pour plus de détails.