La cirrhose du foie est une maladie très fréquente à travers le monde ; en France, 700 000 cas étaient répertoriés en 2012. Les principales causes connues de cette maladie sont l’obésité, les infections virales (hépatites) et l’alcool. Selon la gravité de la cirrhose, celle-ci peut conduire à un cancer, voire à un arrêt du fonctionnement du foie, ce qui nécessite une transplantation. Les signes et symptômes de la cirrhose ou de ses complications sont nombreux et variés. Nombre d’entre eux ne sont pas spécifiques et peuvent se produire en l’absence de cirrhose. Réciproquement, leur absence ne permet pas d’exclure définitivement le diagnostic. Pendant une période plus ou moins longue, dite non compliquée, seul un examen clinique ou biologique peut mettre en évidence la maladie. Aujourd’hui, le diagnostic de la maladie se fait essentiellement à l’aide d’une biopsie du foie qui représente certaines contraintes (hospitalisation, méthode invasive parfois contre-indiquée).
Une étude a été menée pour chercher à caractériser les populations bactériennes de l’intestin chez les patients ayant une cirrhose du foie (Qin et al. ”Alterations of the human gut microbiome in liver cirrhosis.” Nature, 2014). Pour cela, le microbiote (ensemble des gènes bactériens de l’intestin) de 237 individus a été analysé. La moitié (123 individus) étaient atteints d’une cirrhose du foie et l’autre (114 individus) étaient sains. La méthodologie suivie pour obtenir les données a été la suivante :
La matrice d’abondance est contenue dans le fichier microbiota.abundance.log.RDS
, les métadonnées associées à ce jeu de données sont dans le fichier metadata.RDS
.
Le fichier microbiota.abundance.RDS
contient l’abondance (transformée en log) des 523 espèces bactériennes (colonnes) pour les 237 individus (lignes).
Le fichier metadata.RDS
contient les informations suivantes :
Age
: l’âge des patientsGender
: le genre des patientsBMI
(body mass index) : l’indice de masse corporelle, exprimé en kg/m\(^2\)status
: statut clinique du patient, sain (healthy) ou malade (liver)INR
(international normalized ratio) : mesure dérivée du taux de prothrombine utilisée pour évaluer la coagulation sanguineCrea
: taux de créatinine mesurée dans le sang (indication de la capacité de filtration rénale)Alb
: taux d’albumine mesurée dans le sangTB
: taux de bilirubine (pigment jaune produit par la dégradation de l’hémoglobine)PT
: taux de prothrombineCTP
(Child-Turcotte-Pugh score) : score qui permet la classification en groupes de gravité croissante selon le degré d’insuffisance hépato-cellulaireMELD
(Model for End-Stage Liver Disease) : système de notation pour évaluer la gravité d’une cirrhose du foieGC
(gene count) : Nombre de gènes différents dénombrésEnterotype
: Un entérotype est un groupe de composition bactérienne intestinale spécifique chez l’homme. Il en existe trois types bien distincts liés au régime alimentaire :
# Charger les library
library(tidyverse)
library(FactoMineR)
library(factoextra)
# Charger les jeux de données
microbiota.abundance = readRDS(file = "microbiota.abundance.log.RDS")
metadata = readRDS(file = "metadata.RDS")
metadata
microbiota.abundance