肠道菌群宏基因组测序(Gut Microbiome Metagenomic
Sequencing)是一种无需培养、无偏倚、高分辨率的技术,用于全面解析人类或动物肠道中全部微生物(细菌、病毒、真菌、古菌)的物种组成、功能基因、代谢通路、耐药基因及菌株水平变异。相比16S
rRNA扩增子测序,它能提供种/株水平分类和功能潜力全景图,是微生态研究的“金标准”。
步骤详解
1. 样本采集与保存(成败关键)
方法:使用专用保存管(含DNA稳定液)或立即液氮冷冻,以z大限度保持DNA完整性和菌群原始状态。
避免:反复冻融、长时间室温放置。
2. DNA提取
挑战:破壁困难(如厚壁菌、孢子),宿主DNA污染(人类上皮细胞),DNA片段化。
要求:使用经过验证的试剂盒,确保对革兰氏阳性/阴性菌、古菌等均有高效裂解能力,并评估DNA得率、纯度和片段大小。
3. 文库构建与测序
主流平台:Illumina NovaSeq/HiSeq(短读长,高精度,低成本,适用于物种和基因丰度分析)。
新兴平台:PacBio SMRT或Oxford Nanopore(长读长,可用于获得更完整的微生物基因组,但错误率较高或成本高)。
策略:通常进行双端测序,数据量一般建议每样本6-10 Gb以上。
4. 生物信息学分析(核心)
A. 质控与去宿主
使用Fastp、Trimmomatic等剔除低质量读段、接头。
使用Bowtie2等比对到人类基因组,去除宿主污染序列。
B. 两大主流分析策略:
基于读段的分析:直接将质控后的读段与数据库比对。速度快,但分辨率有限。
物种注释:使用Kraken2、MetaPhlAn等工具,比对到微生物参考基因组数据库(如NCBI RefSeq、GTDB)。
功能注释:使用HUMAnN3等流程,将读段比对到功能数据库(如KEGG、EggNOG、MetaCyc),得到通路和基因家族丰度。
基于组装的分析:对全部读段进行从头组装,获得更长的contigs/scaffolds,甚至完整的微生物基因组。
组装:使用MEGAHIT、metaSPAdes等宏基因组专用组装器。
分箱:使用MetaBAT2、MaxBin2等工具,将contigs聚类成宏基因组组装基因组(MAGs),这相当于“重建”了样本中单个微生物的基因组草图。高质量的MAG是深入研究的宝贵资源。
对MAGs进行物种分类和功能注释。
C. 核心分析内容与可视化:
物种组成:门、纲、目、科、属、种水平的相对丰度柱状图、热图。
Alpha多样性:反映单个样本内菌群的丰富度和均匀度(如Chao1, Shannon指数)。箱线图比较。
Beta多样性:反映不同样本间菌群结构的差异(如PCA、PCoA、NMDS图)。使用Bray-Curtis、UniFrac距离。
差异分析:
物种/功能差异:使用LEfSe(寻找生物标志物)、DESeq2(寻找差异丰度特征)。
关联分析:与临床表型(如BMI、生化指标)进行Spearman/ Pearson相关性分析,生成相关性热图。
功能潜力分析:代谢通路(如短链脂肪酸合成、胆汁酸代谢、氨基酸代谢)的丰度与分布。
来源:网络