Exemple de rapport d'analyse Mikrobiomo 16S

Contenu

Ⅰ. Vision générale
Ⅱ. Flux de travail
1 Préparation et séquençage
2 Analyse des données et procédures
Ⅲ. Résultats
1 Traitement des données de séquençage
2 Analyse OTU et annotation des espèces
     2.1 Identification et annotation OTU
     2.2 Analyse de la composition des espèces
3 Analyse de la diversité alpha
     3.1 Indices de diversité alpha
     3.2 Courbes de diversité des espèces
     3.3 Diagramme de Flor et Venn
4 Données de processus
Ⅳ. Méthodes
Ⅴ. Références
Ⅵ. Annexe

I. Vision générale

La séquence d'ARN ribosomique 16S (ARNr) est composée de neuf régions hypervariables entrecoupées de régions conservées. Le gène bactérien 16S contient neuf régions hypervariables (V1-V9) allant d'environ 30 à 100 paires de bases de longueur qui sont impliquées dans la structure secondaire de la petite sous-unité ribosomique. Le degré de conservation varie considérablement entre les régions hypervariables, avec des régions plus conservées corrélées avec une taxonomie de rang supérieur et des régions moins conservées avec des rangs inférieurs, tels que le genre et l'espèce. Pour la classification taxonomique, il suffit de séquencer les individus régions hypervariables plutôt que le gène entier.De plus, le gène 16S contient des séquences hautement conservées entre les régions hypervariables, permettant la conception d'amorces universelles. Avec le développement de plateformes de séquençage à haut débit, la variation de séquence dans le gène 16S est largement utilisée pour caractériser diverses communautés microbiennes.[1,2,3].

Basé sur des algorithmes de fin de paire, le séquençage des amplicons est réalisé sur la plateforme Illumina.

II. Flux de travail

1 Préparation et séquençage

Des échantillons d'ADN bruts aux données finales, chaque étape, y compris les tests d'échantillons, la PCR, la préparation de la bibliothèque et le séquençage, influence la qualité des données, et la qualité des données a un impact direct sur les résultats de l'analyse. Pour maintenir la fiabilité des données, le contrôle qualité (QC ) est effectuée à chaque étape de la procédure. Le workflow est le suivant :

2 Analyse des données et procédures

Pour la précision de l'analyse des données de séquençage, les données brutes seraient fusionnées et filtrées pour des données propres. Les données effectives sont utilisées pour effectuer des annotations de groupe et d'espèce OTU pour la séquence respective de chaque OTU. être analysé avec la diversité alpha, la diversité bêta, Venn ou Flower Graph et al. De plus, la sélection OTU, la construction d'affectation taxonomique d'arbres phylogénétiques par une analyse post-statistique expliquent les différences de construction communautaire entre les échantillons ou entre les groupes via PCoA, PCA et NMDS.Méthodes statistiques tels que T-test, MetaStat, LEfSe, Anosim et MRPP pourraient tester l'importance de la composition de la communauté et des différences de structure entre les groupes. Pendant ce temps, le résultat de l'analyse combine CCA/RDA pour explorer les principaux facteurs environnementaux. Le flux de travail d'analyse des données est présenté ci-dessous. :

Remarques : Si le nombre d'échantillons est inférieur à 3, la diversité bêta, le test de signification de la communauté, la différence de construction entre les groupes et l'analyse de l'association environnementale ne peuvent pas continuer. Le test de signification de la différence de construction communautaire entre les groupes et l'association environnementale ne peut pas continuer sans groupement, ou lorsque la répétition est inférieure à 3.Environmental Association. L'analyse a besoin des données du facteur environnemental offertes par les clients.

III. Résultats

1 Traitement des données de séquençage

L'amplicon était séquencé sur la plate-forme d'extrémité appariée Illumina pour générer une lecture brute d'extrémité appariée de 250 pb (RAW PE), puis assemblé et prétraité pour obtenir des étiquettes propres. Les séquences chimériques dans les balises propres ont été détectées et supprimées pour obtenir finalement les marqueurs efficaces. La sortie des données a été présentée dans le tableau 1.

Table 1. Statistiques du CQ

Remarques : PE brut signifie lectures PE ; Les balises brutes désignent les balises fusionnées à partir des lectures PE ; Nettoyer les balises signifie balises après filtrage ; Etiquettes effectives désigne les étiquettes après filtrage de la chimère ; Base désigne le nombre de base d'étiquettes effectives ; AvgLen signifie la longueur moyenne des étiquettes effectives ; Q20 et Q30 désignent le pourcentage de base dont la qualité est supérieure à 20 et 30 ; GC (%) signifie contenu GC dans les balises effectives ; Efficace (%) signifie le pourcentage de balises efficaces dans Raw PE.

2 Analyse OTU et annotation des espèces

Pour analyser la diversité des espèces dans chaque échantillon, toutes les étiquettes efficaces ont été regroupées par 97 % de similarité de séquence d'ADN dans les OTU (Operating Taxonomic Units)

2.1 Identification et annotation OTU

2.1.1 Annotation d'analyse statistique

Lors de la construction des OTU, des informations de base ont été collectées à partir de différents échantillons, tels que des données de balises efficaces, des données de balises à basse fréquence et des données d'annotation de balises. L'ensemble de données statistiques est présenté ci-dessous dans la figure 2.1.1 (Pour voir l'image en taille réelle, cliquez sur ici).

Sample_Tags-OTUs_dis.png

Figure 2.1.1 Analyse statistique des étiquettes et du nombre d'OTU de chaque échantillon

Remarques (de gauche à droite) : L'axe Y1 intitulé « Nombre d'étiquettes » signifie le nombre d'étiquettes ; "Total tags" (barres rouges) signifie le nombre de tags effectifs ; "Étiquettes de taxon" (barres bleues) désigne le nombre d'étiquettes annotées ; « Balises non classées » (barres vertes) désigne le nombre de balises non classées ; Les "étiquettes uniques" (barres oranges) signifient le nombre d'étiquettes avec une fréquence de 1 et n'apparaissent que dans un échantillon. L'axe Y2 intitulé "Nombre d'OTU" signifie le nombre d'OTU indiqués par "OTU" (barres violettes) dans l'image ci-dessus pour identifier le nombre d'OTU dans différents échantillons.

2.1.2 Vue interactive des annotations des espèces

La carte thermique affiche une vue interactive de la composition et de l'abondance des espèces entre différents échantillons sur la page Web en direct Cliquez ici . Un exemple d'image montre ce qui suit :

Figure 2.1.2 Un exemple de carte thermique de la table OTU, montrant le mappage de taxonomie pour chaque OTU.

Remarques : Les décomptes sont colorés en fonction du pourcentage de contribution de chaque OTU au nombre total d'OTU dans un échantillon (bleu : contribue à un faible pourcentage d'UTO dans l'échantillon ; rouge : contribue à un pourcentage élevé d'UTO). En gardant la valeur du filtre inchangée et en cliquant sur le bouton "Sample ID", un graphique sera généré comme dans l'exemple ci-dessus. Cliquez sur ici pour plus de détails..

2.1.3 Arbre de taxonomie:

Des espèces spécifiques (affichant par défaut les 10 principaux genres en abondance relative élevée) ont été sélectionnées pour créer l'arbre taxonomique[4] par un logiciel de R&D indépendant. L'arbre de taxonomie dans un seul échantillon illustré à la figure 2.1.3-1 (pour voir l'image en taille réelle, veuillez click).

Figure 2.1.3-1 Arbre taxonomique dans un seul échantillon.

Notes : Les différentes couleurs représentent différentes gammes taxonomiques. La taille des cercles représente l'abondance relative des espèces. Le premier chiffre sous le nom taxonomique représente le pourcentage dans l'ensemble du taxon, tandis que le deuxième chiffre représente le pourcentage dans le taxon sélectionné.

2.1.4 Affichage de la KRONA

KRONA [5] affiche visuellement le résultat de l'analyse des annotations d'espèces .Circles de l'intérieur vers l'extérieur représentent différentes gammes taxonomiques, et la zone de secteur signifie la proportion respective des différents résultats d'annotation OTU.

Figure 2.1.4 Affichage de la KRONA

2.2 Analyse de la composition des espèces

2.2.1 Abondance relative des taxons

Les 10 premiers taxons dans les différentes gammes taxonomiques ont été sélectionnés pour former l'histogramme de distribution d'abondance relative. La distribution dans le phylum a été présentée comme suit (pour voir l'image en taille réelle, veuillez cliquer ici) :

Figure 2.2.1 Abondance relative des espèces du phylum

Remarques : Tracé par "Abondance relative" sur l'axe Y et "Noms d'échantillons" sur l'axe X. "Autre" représente une abondance relative totale de tous les autres phylums en plus des 10 principaux phylums.

2.2.2 L'arbre évolutif du genre.

Les 100 meilleurs genres ont été sélectionnés et l'arbre évolutif dessiné à l'aide des séquences représentatives alignées. L'abondance relative de chaque genre est également montrée à travers le genre dans la figure 2.2.2:

Genus 100 Tree

Figure 2.2.2 L'arbre évolutif du genre.

Remarques : Les différentes couleurs des branches représentent différents tranchants. L'abondance relative de chaque genre dans chaque groupe a été indiquée à l'extérieur du cercle et les différentes couleurs représentent différents groupes.

3 Analyse de la diversité alpha

La diversité alpha est largement utilisée pour évaluer la diversité microbienne au sein de la communauté[6], y compris les boîtes à moustaches d'accumulation d'espèces, les courbes de diversité des espèces et les indices d'analyse statistique.

3.1 Indices de diversité alpha

De manière générale, les OTU générées avec une identité de séquence de 97 % sont considérées comme homologues dans les espèces. Les indices statistiques de diversité alpha lorsque le seuil de regroupement est de 97 % sont résumés ci-dessous : (Nombre de lectures choisies pour la normalisation : seuil = 88996. La signification de chaque indice de diversité alpha est répertoriée dans l'analyse de la diversité alpha de la méthode-données).

Table 3.1 Statistiques des indices de diversité alpha

3.2 Courbe de diversité des espèces

Les courbes de raréfaction et les courbes d'abondance de rang sont largement utilisées pour indiquer la biodiversité des échantillons. La courbe de raréfaction est créée en sélectionnant au hasard une certaine quantité de données de séquençage à partir des échantillons, puis en comptant le nombre d'espèces qu'elles représentent. Si la courbe est raide, de nombreuses espèces restent à découvrir. Si la courbe s'aplatit, c'est qu'un nombre crédible d'échantillons a été prélevé, ce qui signifie qu'il ne reste plus que des espèces rares à échantillonner.

La courbe de rang d'abondance est utilisée pour montrer l'abondance relative des espèces. Il peut également être utilisé pour visualiser la richesse et l'uniformité des espèces. Il pallie les carences des indices de biodiversité qui ne peuvent présenter le rôle que les variables ont joué dans leur évaluation[7].

Courbe de diversité des espèces (Pour voir l'image en taille réelle, veuillez cliquer) :

      Figure 3.2-1 Courbes de raréfaction                        Figure 3.2-2 Abundance Rank Curves

Remarques : Pour les courbes de raréfaction, chaque courbe représente un échantillon et peut être colorée et façonnée par chaque nom d'échantillon fourni dans le fichier de mappage. Le nombre de séquences est sur l'axe des x et le nombre d'OTU observées est sur l'axe des y. Pour les courbes de rang-abondance, chaque courbe représente un seul échantillon, tracé par l'abondance relative des OTU sur l'axe des y et le rang de l'abondance des OTU sur l'axe des X, qui peut être coloré et façonné par chaque nom d'échantillon fourni dans le fichier de mappage.

4 Données de processus

Le séquençage des amplicons d'ADNr 16S (ADNr 18S, ITS) est largement utilisé pour comparer les communautés microbiennes entre des échantillons provenant de divers environnements naturels ou endozoïques. tels que le sol, l'eau, l'intestin de l'hôte, etc. Pour atteindre ces objectifs, plusieurs résultats importants devaient être très concernés.

Tout d'abord, les résultats de l'annotation des groupes et des espèces OTU sont résumés dans le résultat/02.OTUanalysis/. Les étiquettes sont regroupées à 97 % d'identité, toutes les étiquettes représentées pour chaque OTU sont répertoriées dans result/02.OTUanalysis/OTUs.fasta. Ces OTU sont ensuite notés et collectés dans result/02.OTUanalysis/OTUs.tax_assignments.txt. L'abondance des espèces est affichée dans deux répertoires importants : Absolute/ (contenant la composition absolue des espèces dans différentes gammes taxonomiques), Evenabs/ (contenant la composition absolue des espèces après normalisation) et Relative/ (contenant l'abondance de chaque échantillon après normalisation, qui sont principalement résumés pour une analyse ultérieure de la diversité alpha et de la diversité bêta). Par exemple, le répertoire Relative/ contient l'abondance relative des espèces de chaque échantillon dans différentes gammes taxonomiques (royaume, phylum, classe, ordre, famille, genre, espèce). À partir de ces résultats, nous pouvons visualiser la composition en espèces de divers échantillons et nous concentrer sur certaines espèces en question ou des espèces très différentes entre les échantillons (ou groupes) pour corréler avec nos certains objectifs de recherche.

La répartition des espèces dominantes parmi les échantillons est visualisée dans le répertoire result/02.OTUanalysis/top10 (avec bargraph et tableau de profil en p, c, o, f, g) afin de pouvoir localiser les espèces prédominantes notables dans un ordre plus manière précise. rapidement et facilement, puis procédez à l'analyse de l'abondance et aux tests de différence.

Les résultats sur la complexité de l'échantillon sont principalement inclus dans le répertoire result/03.AlphaDiversity/ avec six indices de diversité alpha différents (Observed Species, Asset Coverage, Chao1, ACE, Shannon, Simpson).

Concernant la comparaison des différences de communautés microbiennes entre les échantillons, les résultats sont présentés dans le répertoire result/04.BetaDiversity. Tout d'abord, la distance Unifrac entre les échantillons par paires est affichée sous forme de carte thermique pour mesurer et afficher le degré de dissemblance, le résultat est représenté dans result/04.BetaDiversity/beta_div_heatmap. La dissemblance est ensuite calculée avec une analyse de gradient et affichée avec des diagrammes de classement (PCA, PCoA, etc.), des échantillons avec une structure de communauté microbienne similaire ont tendance à être collectés, et vice versa. UPGMA pourrait alors regrouper les échantillons en fonction de la matrice de distance acquise et les afficher dans result/04.BetaDiversity/Tree/. À partir de ces résultats, nous pouvons déterminer les différences de complexité entre les échantillons et expliquer les différences entre les échantillons (ou groupes) en les combinant avec des problèmes biologiques sous-jacents spécifiques. Par exemple, nous pouvons expliquer les résultats des grappes d'échantillons UPGMA en considérant les taxons à forte abondance pour obtenir les facteurs moteurs sous-jacents.

Lorsqu'il y a plus de deux groupes, une analyse plus poussée peut être effectuée.

Pour les différences d'espèces, nous pouvons utiliser Metastats pour obtenir l'importance de toutes les espèces entre les groupes et sélectionner différentes espèces évidentes entre les groupes dans diverses gammes taxonomiques (p, c, o, f, g, s) pour une analyse plus approfondie, ou choisir l'analyse LefSE pour découvrir des biomarqueurs statistiquement significatifs entre les groupes.

L'analyse Anosim et MRPP pourrait être utilisée pour déterminer si la structure de la communauté diffère significativement entre les groupes, ou pour comparer les différences entre les groupes et au sein des groupes.

L'analyse NMDS pourrait être sélectionnée comme méthode complémentaire avec des résultats inattendus par PCA et PCoA, car elle est basée sur un modèle non linéaire (PCA et PCoA sont basées sur un modèle linéaire), et elle peut offrir une meilleure explication de la non- structure linéaire dans les ensembles de données écologiques.

Pour une analyse exploratoire, si plusieurs facteurs environnementaux sont impliqués, nous pouvons sélectionner une analyse CCA ou RDA pour extraire des gradients environnementaux à partir d'ensembles de données écologiques et trouver des facteurs environnementaux qui influencent le développement de certaines communautés microbiennes.

Ⅳ. Méthodes

Préparation du séquençage

1 Extraction de l'ADN du génome

L'ADN du génome total des échantillons a été extrait par la méthode CTAB/SDS. La concentration et la pureté de l'ADN ont été surveillées sur des gels d'agarose à 1 %. Selon la concentration, l'ADN a été dilué à 1 ng/μL avec de l'eau stérile.

2 Génération d'amplicons

Différentes régions des gènes ARNr 16S (16SV3, 16SV4), ARNr 18S (18SV4, 18SV9) et ITS (ITS1, ITS2) ont été amplifiées avec une amorce et un code barre spécifique pour chacune d'elles. Toutes les réactions de PCR ont été réalisées à l'aide de Phusion® High Fidelity Master Mix (New England Biolabs).

3 Quantification et qualification des produits PCR

Une dilution 1:1 des produits de PCR et du tampon de chargement 1X est réalisée pour charger le gel d'agarose à 2 %. Après avoir terminé l'électrophorèse, les échantillons d'une taille de 400-450 bp sont sélectionnés pour d'autres expériences.

4 Mélange et purification des produits PCR

Les produits PCR ont été mélangés en proportions égales et le mélange a été purifié avec le kit d'extraction de gel Qiagen (Qiagen, Allemagne).

Les bibliothèques générées avec le kit de préparation de bibliothèques d'ADN NEBNext® UltraTM pour Illumina et quantifiées via Qubit et Q-PCR sont analysées par la plateforme Illumina.

Analyse des informations

1 Traitement des données de séquençage

Les lectures appariées ont été attribuées aux échantillons en fonction de leur code-barres unique et tronquées en coupant le code-barres et la séquence d'amorce. Les lectures correspondantes ont été fusionnées à l'aide de FLASH (V1.2.7) [8], un outil d'analyse très rapide et précis, conçu pour fusionner les lectures de fin correspondantes lorsqu'au moins certaines des lectures se chevauchent avec la lecture générée à partir de l'extrémité opposée du même fragment d'ADN, et les séquences d'épissage ont été appelées étiquettes brutes. Le filtrage de qualité sur les balises brutes a été effectué dans des conditions de filtrage spécifiques pour obtenir des balises propres de haute qualité [9] selon le processus de contrôle de qualité Qiime (V1.7.0) [10] . Les balises ont été comparées à la base de données de référence (base de données Gold) à l'aide de l'algorithme UCHIME (algorithme UCHIME)[11] pour détecter les séquences chimères ET ensuite les séquences chimères ont été supprimées [12] . Donc, finalement, les balises effectives ont été obtenues.


2 Groupe OTU et annotation d'espèces

L'analyse de séquence a été effectuée par le logiciel Uparse (Uparse v7.0.1001)[13] en utilisant toutes les balises efficaces. Les séquences présentant une similarité ≥ 97 % ont été attribuées aux mêmes OTU. La séquence représentative de chaque OTU a été examinée pour une annotation supplémentaire. Pour chaque séquence représentative, le logiciel Mothur a été comparé à la base de données d'ARNr SILVA SSU[14] pour l'annotation des espèces dans chaque plage taxonomique (seuil : 0,8 ~ 1).[ 15] (royaume, phylum, classe, ordre, famille, genre, espèce). Pour obtenir la relation phylogénétique de toutes les séquences OTU représentatives, MUSCLE [16](Version 3.8.31) peut rapidement comparer plusieurs séquences. Les informations sur l'abondance de l'OTU ont été normalisées à l'aide d'un standard de numéro de séquence correspondant à l'échantillon avec le moins de séquences. D'autres analyses de la diversité alpha et de la diversité bêta ont été effectuées sur la base de cette sortie de données normalisée.


3 Alpha Diversité

La diversité alpha est appliquée dans l'analyse de la complexité de la diversité des espèces pour un échantillon à travers 6 indices, qui comprennent Espèces observées, Chao1, Shannon, Simpson, ACE, Bonne couverture. Tous ces indices dans nos échantillons ont été calculés avec QIIME (Version 1.7.0) et affichés avec le logiciel R (Version 2.15.3).

Indices de diversité alpha

Indices de richesse communautaire :

Chao - L'estimateur Chao1

ACE - L'estimateur ACE

Indices de diversité communautaire :

Shannon - L'indice de Shannon

Simpson - L'indice Simpson

L'indice de profondeur de séquençage :

Couverture - La couverture du bien

L'indice de diversité phylogénétique :

PD_whole_tree - Index PD_whole_tree


4 Diversité bêta

L'analyse de la diversité bêta a été utilisée pour évaluer les différences d'échantillon dans la complexité des espèces. La diversité bêta unifrac pondérée et non pondérée a été calculée à l'aide du logiciel QIIME (version 1.7.0). L'analyse de cluster a été précédée d'une analyse en composantes principales (ACP), qui a été appliquée pour réduire la dimension des variables d'origine à l'aide du package FactoMineR et du package ggplot2 dans le logiciel R (version 2.15.3). L'analyse des coordonnées principales (PCoA) a été effectuée pour obtenir les coordonnées principales et visualiser des données multidimensionnelles complexes. Une matrice de distance unifrac pondérée ou non pondérée entre les échantillons obtenus ci-dessus a été transformée en un nouvel ensemble d'axes orthogonaux, dans lequel le facteur de variation maximal est représenté par la première coordonnée principale, le deuxième maximum par la deuxième coordonnée principale, etc. L'analyse PCoA a été présentée à l'aide du package WGCNA, des packages stat et du package ggplot2 dans le logiciel R (version 2.15.3). Méthode de groupe par paires non pondérée avec moyens arithmétiques (UPGMA) Le regroupement a été effectué comme un type de méthode de regroupement hiérarchique pour interpréter la matrice de distance à l'aide du lien moyen et a été effectué par le logiciel QIIME (version 1.7.0).

L'analyse LEfSe a été effectuée avec le logiciel LEfSe. Les métastats ont été calculés à l'aide du logiciel R. La valeur p a été calculée à l'aide de la méthode du test de permutation, tandis que la valeur q a été calculée à l'aide de la méthode Benjamini and Hochberg False Discovery Rate[17] . Anosim, MRPP et Adonis ont été réalisés avec le logiciel R (package vegan : fonction anosim, fonction mrpp et fonction adonis). AMOVA a été calculé par mothur en utilisant la fonction amova. T_test et le dessin ont été réalisés par le logiciel R.

Ⅴ. Références

[1] Caporaso, J. Gregory, et al. Global patterns of 16S rRNA diversity at a depth of millions of sequences per sample. Proceedings of the National Academy of Sciences 108.Supplement 1 (2011): 4516-4522.
[2] Youssef, Noha, et al. Comparison of species richness estimates obtained using nearly complete fragments and simulated pyrosequencing-generated fragments in 16S rRNA gene-based environmental surveys. Applied and environmental microbiology 75.16 (2009): 5227-5236.
[3] Hess, Matthias, et al. Metagenomic discovery of biomass-degrading genes and genomes from cow rumen. Science 331.6016 (2011): 463-467.
[4] DeSantis, T. Z., et al. NAST: a multiple sequence alignment server for comparative analysis of 16S rRNA genes. Nucleic acids research 34.suppl 2 (2006): W394-W399.
[5] Ondov, Brian D., Nicholas H. Bergman, and Adam M. Phillippy. Interactive metagenomic visualization in a Web browser. BMC bioinformatics 12.1 (2011): 385.
[6] Li, Bing, et al. Characterization of tetracycline resistant bacterial community in saline activated sludge using batch stress incubation with high-throughput sequencing analysis. Water research 47.13 (2013): 4207-4216.
[7] Lundberg, Derek S., et al. Practical innovations for high-throughput amplicon sequencing.Nature methods 10.10 (2013): 999-1002.
[8] Magoč, Tanja, and Steven L. Salzberg. FLASH: fast length adjustment of short reads to improve genome assemblies. Bioinformatics 27.21 (2011): 2957-2963.
[9] Bokulich, Nicholas A., et al. Quality-filtering vastly improves diversity estimates from Illumina amplicon sequencing. Nature methods 10.1 (2013): 57-59.
[10] Caporaso, J. Gregory, et al. QIIME allows analysis of high-throughput community sequencing data. Nature methods 7.5 (2010): 335-336.
[11] Edgar, Robert C., et al. UCHIME improves sensitivity and speed of chimera detection. Bioinformatics 27.16 (2011): 2194-2200.
[12] Haas, Brian J., et al. Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons. Genome research 21.3 (2011): 494-504.
[13] Edgar, Robert C. UPARSE: highly accurate OTU sequences from microbial amplicon reads. Nature methods 10.10 (2013): 996-998.
[14] Wang, Qiong, et al. Naive Bayesian classifier for rapid assignment of rRNA sequences into the new bacterial taxonomy. Applied and environmental microbiology 73.16 (2007): 5261-5267.
[15] Quast C, Pruesse E, et al.The SILVA ribosomal RNA gene database project: improved data processing and web-based tools. Nucl. Acids Res. (2013) : D590-D596.
[16] MUSCLE: multiple sequence alignment with high accuracy and high throughputEdgar, 2004
[17] White, James Robert, Niranjan Nagarajan, and Mihai Pop. Statistical methods for detecting differentially abundant features in clinical metagenomic samples. PLoS computational biology 5.4 (2009): e1000352.

Ⅵ. Annexe

Méthodes: Méthodes_Rapport_MIKROBIOMO.pdf.

Remarques : Il est fortement recommandé de scanner ce rapport dans la boîte de Firefox, car divers navigateurs, comme IE, peuvent désactiver l'affichage des tableaux. Plus de vectogrammes et de données statistiques sont fournis dans l'annuaire de livraison.