高通量测序平台的出现彻底改变了对复杂微生物群落的研究。最常见的是,标记基因(例如16S rRNA和18S rRNA基因)的扩增和测序,提供定性和定量(即相对丰度)数据。可用于进行标记基因分析的方法多种多样。
从抽样到数据分析的每个方法阶段都会引入偏差。这种误差可能会通过引入观察到的相对丰度的变化而改变数据集,并且会影响菌群多样性的认知。
本文总结了当前文献中关于样品收集、样品储存和处理、测序和数据分析的关键信息,尤其是专门用于细菌16S rRNA基因扩增子测序的研究。通过整理这些领域的基础研究,旨在确保进入这一领域的研究者能够更好地了解16srRNA基因测序研究的实验设计。
1
- SAMPLE COLLECTION -
样品采集
采样方法取决于样本类型,可能导致偏差的因素在不同类型的微生物组研究之间也会有所不同。
采 样 点
首先,采样点非常重要。微生物细菌群落在不同的生态位和环境点的丰度构成都不太相同,例如,在胃肠道内(不同位点)和呼吸道不同,不同深度的土壤等。
个体间差异的大小在很大程度上取决于采样位点,这可能对实验结果产生重要影响,最好同一个研究平行样本能采用一致的采样点。
收 集 方 法
其次,关于不同样本收集方法所引入的变化,文献中存在矛盾的结果。例如,有人试图用微创方法代替有创取样;在比较来自人体肠道的拭子和活检样本、呼气冷凝液和肺刷时,以及通过口腔胃管和瘘管获得的瘤胃液样本发现微生物种群存在显著差异。
然而,其他研究与这些发现相矛盾,两项研究表明,当使用各种取样方法研究牛的瘤胃微生物群时,没有统计学上的显著差异。此外,在鼻腔拭子和活检样本和直肠拭子和粪便样本的比较中,微生物组成没有明显差异。文献中这种冲突的结果并不少见,这导致缺乏共识和标准化。
均 质 化
最后要考虑的是样品是否应均质化,这在肠道含量和土壤研究中似乎最为关键,因为在不同的粪便组分和不同粒径的土壤中观察到了不同的微生物组成。尽管有关抽样方法的文献通常存在冲突,但重要的是要考虑应避免比较使用不同方法获得的数据。
2
- SAMPLE STORAGE -
样品储存
不同的储存条件是否会对微生物群落研究产生影响,存在着相互矛盾的证据。从新鲜样本中提取DNA通常是不实际的;因此,在提取DNA之前,样本一般要存放不同的时间。
理论上快速冷冻至−80°C是最佳选择,但这并不适用于所有研究设计,例如,在没有低温存储的偏远站点。本节将对已经开展的几项研究进行总结,以评估储存条件对研究结果的影响。
新鲜的冷冻样品
一些研究表明,与新鲜样品相比,冷冻样品的厚壁菌/拟杆菌的比率增加。相反,在Fouhy等人的研究中,新鲜和速冻粪便样品之间唯一差异表达的细菌是Faecalibacterium和Leuconostoc属,在门或科上没有显著差异。
在提取DNA之前冷藏24 h或72 h的粪便样品中,未观察到对微生物组成或多样性的显著影响。
各种研究也探讨了贮藏时间的影响。Lauber 等人,在不同温度下储存土壤、粪便和皮肤样本,发现储存时间对细菌群落结构或多样性没有显著影响。
在−80°C下保存2年的样品中,乳酸杆菌和杆菌的丰度增加,而OTU的总数减少了。
一般来说,用文献中提供的数据处理新鲜样品是最好的方法,但如果无法做到这一点,则应将样品冷冻不同时间,并在一个批次中进行处理,或者冷冻相同时间并分多个批次进行处理。
无论采用何种处理方法,都应记录储存时间和DNA提取批次,以便在后面的分析过程中考虑到这一变量。
低温保护剂的使用
McKain等人探索了使用冷冻保护剂(即甘油/磷酸盐缓冲盐水)存储瘤胃消化液样品的效果,通过定量PCR检测16srRNA基因检查,发现不加冷冻保护剂的冷冻样品的拟杆菌(Bacteroidetes)显著下降。因此,作者认为,简单地在没有低温保护剂的情况下储存样本,并在以后进行DNA提取,会影响有关古细菌和细菌群落组成结果。
Choo等人探索了使用几种常见防腐剂缓冲液的效果(例如, RNAlater, OMNIgene.GUT, and Tris-EDTA)相较于在−80°C下干燥储存的粪便微生物群组成的样品。储存在OMNIgene.GUT缓冲液中的样品与在-80°C下干燥储存的样品差异最小,而从Tris-EDTA中提取的样品的结果差异最大,与Escherichia-Shigella 大肠杆菌、Citrobacter 柠檬酸杆菌、肠杆菌 等重要菌群的相对丰度变化有关。
此外,RNAlater 先前已被证明不适合储存进行微生物群落分析的样品,储存在RNAlater中的样品与新鲜样品和在−80°C下立即冷冻的样品最不相似。因此,在考虑使用冷冻保护剂进行存储时,重要的是要确保所有样品都以相同的方式存储。
3
- DNA EXTRACTION -
DNA提取
在提取DNA的过程中,重要的是要考虑到某些微生物细胞对裂解的抵抗力更高,例如细菌内生孢子和革兰氏阳性细菌,它们会对DNA提取效率产生影响。
抑制剂inhibitors 的存在会直接影响DNA的提取效率(例如,环境样品中的碎屑以及土壤和粪便中的有机物),并且会影响下游的PCR效率。
常见的抑制剂包括无机材料(例如钙离子),大多数抑制剂是有机物,例如腐殖酸,胆汁盐和多糖。这些问题将根据样本类型而有所不同。因此,作为16S rRNA基因扩增子实验的一部分,应优化基质特异性DNA提取方案。
4
- SEQUENCING STRATEGY -
测序策略
引物选择和文库构建
由于无法使用short-read 第二代测序平台对16S rRNA整个基因全长进行测序,因此必须选择该基因的一小片段用于PCR扩增和测序。目前尚没有关于最合适的可变区片段的共识,并且已经进行了数项研究来确定每种片段的优缺点。
重要的是,高变区的选择和“通用” PCR引物的设计对系统发育的解析有影响。事实上,没有一套引物是真正通用的。
目前针对扩增子测序可选择的测序平台和方案很多,不同平台的读长和适用的测序区段以及优势各有不同。
16s测序主要的测序区段包括v4、v3v4,v1v2,v6,此外还有全长等不同的区段选择,不同可变区或全长由于引物的不同以及不同种属相应区段内的变异多样性差异,对菌属的丰度评估会有一定的差异。
从长度来看,全长16s长度为1.5kb左右,单菌落的16s全长sanger一代测序仍然是菌种鉴定的主要手段,纳米孔和pacbio的三代测序可以高通量的获得全长序列,对于希望更高分辨率的分析菌种的研究有一定优势。
三代的测序准确度目前逐渐改进,直接测序准确度可以在90%以上,纠错后可以提高到97~99%以上,已足够提供高精度的分类。三代目前主要问题在于建库成本相对较高,通过使用barcode可以降低部分但仍然偏高,此外普遍测序深度相对于二代测序要低许多。
目前最主要的可变区选择是V4区和V3V4区,V4区长度为256bp左右,加上两侧引物长度为290bp左右,使用双端2x250bp或2x150bp可以测通,此外如454、life、illumina hiseq 4000的测序平台读长也可以主要涵盖该区段读长。例如采用illumina hiseq测序平台对该项目进行双端测序(paired-end),测序得到了fastq格式的原始数据(样本对应一对序列s_1.fastq和s_2.fastq)。
再配对拼接成单条序列。其引物通用性相对是所有可变区中最高的,大量的大规模菌群调查研究都采用v4区作为检测区域,包括人体菌群研究如:HMP,肠道菌群如美国肠道计划AGP,欧洲的FGFP等,以及全球土壤菌群调查,目前仍然是国际研究中使用最广泛和认可的检测区域。
PCR 酶
由于存在PCR抑制剂(如上文DNA提取中所述),PCR循环数和高保真聚合酶的使用也会对结果产生影响,因此在PCR扩增过程中可能会引入其他偏差。当最高浓度的不完全延伸引物与原始引物竞争时,嵌合体的形成发生在随后的PCR周期中。因此,通过减少PCR循环的数量可以降低嵌合体形成的可能性。
先前发现细菌丰富度随着PCR循环数的增加而增加,但是该循环数对群落结构没有显着影响。
与标准聚合酶相比,使用高保真聚合酶时发现的PCR伪影数量较少。使用不同的聚合酶会显着影响特定细菌群和总体细菌群落结构的PCR效率。
最后,PCR中输入DNA的数量对观察到的细菌群落结构有重要影响。
总之,没有用于16S测序的“金标准”的可变区片段,但重要的是要考虑到PCR试剂和PCR条件应在整个研究过程中进行优化并保持一致。
测序平台
Illumina技术(主要是MiSeq系统)已成为16S rRNA基因元条形码的最常见测序平台。因为MiSeq系统通常可产生最准确的最长读取,并且比其他平台具有更高的通量,从而可以以更高的深度或更低的成本对更多样品进行测序。
事实上,在很长一段时间里,罗氏454测序仪是16S研究中最常用的平台。这种技术潜在的更长的读长有一些优点;但是,由于罗氏(Roche)在2013年淘汰了该产品,因此该产品现已不再可用。不幸的是,454测序仪由于聚合物的错配而导致错误率上升。
PacBio和牛津纳米孔技术能够对16S基因的全长进行测序,这当然非常强大。但是,两种技术的错误率仍然是一个问题,范围在5%到15%之间,这可能会导致后续分析中的后续错误。尽管长读长的单分子测序系统的错误率很高,但研究似乎开始显示它们可用于16S rRNA基因测序。
例如,Schloss等能够将PacBio数据的V1到V9区域的观察到的错误率从0.69降低到0.027%,这与Illumina,454和Ion Torrent系统的相差无几。PacBio技术的缺点之一是它的通量,即可以在平台上同时以合理的成本运行的样品数量要比MiSeq系统低得多。
illumina的miseq提供了长达2x300bp以及hiseq2500和最近的novoseq提供有2x250bp的测序方案,为进一步利用读长,目前有相当一部分研究选择v3v4区,该区段长度在460bp左右,相较于v4度多出了v3区段约100bp左右的片段,在少部分菌属中可以增加一定分辨率。
经过对比,v3v4区的检测结果和v4区在绝大部分菌属中的丰度一致,但由于引物不同,在少量菌属中丰度会有不同偏向,v3v4从OTU层面上并未发现较v4区有明显增加。引物的选择和提取、储存方法是影响菌群检测丰度构成的主要因素,不同研究之间的比较需要考虑到实验方案的一致,相同的方案可以直接比较。
测序数据量
在计划16S测序研究时,三个关键的考虑因素是序列数据的质量、测序的成本和生成的读长的长度。最后一个因素是每次测序运行可以分析的样品数量。使用Illumina平台时,可以通过实现唯一的单索引或双索引(或条形码)引物用于文库制备。
如果每次运行的样本数增加,则与每个样本的覆盖率较低(或生成的序列数)相关。如果每个样品的覆盖率太低,则被研究的微生物群落的多样性可能会被低估,因为会漏掉该群落中的稀有成员。因此,应从小型试验研究(以及观察所得稀疏曲线)或已发表的文献中获得有关每次运行中样本数量的指导。在较大型的研究中,可能需要进行多个测序操作。
另一个关键考虑因素是测序覆盖率及其与要运行的样品数量的关系。在研究微生物群落的核心构成时,通过增加测序过程中的样本数量来降低覆盖率可能是降低成本的有效方法。然而,如果一个样本中包括比较稀有的成员感兴趣,那么较低的样本数量更大的测序深度可能更合适。
一般研究中,测序序列理论上越多越好,不过一般达到饱和之后数据量增加的价值就没那么大,绝大部分的物种构成或基因的信息已经获得,更高的测序深度可能检出非常低丰度的物种序列,但受限于测序本身的错误率,非常高的测序深度也可能引入更多的测序错误,一般会选择合适的测序深度。另外在数据分析时也会过滤极低丰度的测序序列。
5
- MOCK BACTERIAL COMMUNITIES -
细菌群落模型
作为16S微生物组研究的一部分,包括一个模拟群落对照是有用的,该对照由来自不同细菌物种的预定比例的DNA组成。这不仅可以量化测序误差,还可以识别在采样和文库准备过程中引入的偏差。例如,模拟菌群可以用来计算这些分类法在样本中的代表性是否可能过高或过低。
与模拟群落类似,标准峰值spike-in standards也可用于分析偏差和方法的可重复性。但是,与模拟群落不同,这些标准是直接添加到样本中的。因此,可以在每个样本的基础上执行质量控制。
但是,标准中所含的16S rRNA基因序列与样品中的16S rRNA基因序列之间可能存在交叉的风险。因此,必须注意选择在目标样品中极不可能发生的细菌,或者是经过计算机设计的并且与16S数据库中发现的序列不同的细菌。
有多种来源可提供模拟细菌群落供研究使用。但是,一些研究人员选择在内部创建自己的模拟群落,以更准确地反映出感兴趣的细菌和具有科学重要性的细菌。预先准备的细菌群落有两种不同的形式:DNA模拟群落: DNA mock communities和全细胞模拟群落 whole-cell mock communities。全细胞模拟群落可用于确定DNA提取步骤的效率,而DNA模拟群落将仅评估PCR,纯化,测序和分析步骤的效率。
6
- ANALYSIS STRATEGY -
分析策略
比较流程
对大型和复杂的16S rRNA基因测序数据集的分析需要使用生物信息学工具。有许多流程可用于处理和分析16S rRNA基因测序数据,包括常用的QIIME,MG-RAST,UPARSE和mothur。
这些软件包包含用于从质量控制到操作分类单位(OTU)聚类的16S rRNA基因数据完整分析的工具集。它们的不同之处主要在于对具有有限计算知识的用户的可访问性以及文档的可用性。
Nilakanta等比较了七个不同的程序包(mothur,QIIME,WATERS,RDPipeline,VAMPS,Genboree和SnoWMan),并得出结论,尽管所有这些程序包都提供了有效的16S rRNA基因分析流程,但mothur和QIIME随附的大量文档为他们提供了优势超过其他包装。
Plummer等使用QIIME,mothur和MG-RAST对单个数据集进行了分析,发现关于分类学分类和多样性的结果几乎没有差异。但是,每个软件包的易用性和分析所需的时间有所不同,QIIME是最快的分析软件包(大约1小时),而MG-RAST是最慢的分析软件包(大约2天),这是由于需要用于手动质量控制,以删除多个注释)。
作者确实指出,尽管MG-RAST是最慢的分析方法,但它可能是最适合没有命令行经验的用户的软件包。最终,将根据用户在生物信息学方面的经验水平以及用户所在机构的可用资源来选择分析软件包。
质量控制、比对和分类分配
必须进行质量过滤,以除去长度超出预期,均聚物较长,碱基不明确或与正确的16S rRNA基因区域不对齐的DNA序列。至关重要的是,随后应筛选嵌合体序列,因为嵌合序列的存在会影响最终数据集的解释,并可能例如过度夸大对群落多样性的认识。
已经开发了多种工具来去除嵌合序列,例如UCHIME和Chimera Slayer。通过在测序过程中包括一个模拟细菌群落,由于已知其中的真实序列,因此可以计算出嵌合序列的数量。
然后应使用序列分类器(例如RDP分类器)将序列与参考序列比对,或分配给合适的参考,该序列分类器使用基于8-mers的朴素贝叶斯方法。
Schloss指出,比对质量会显着影响多样性,并且会人为地增加细菌OTU的数量,并建议不要使用未考虑16S基因二级结构的比对。在由二级结构指导的三个最常用的比对中(即Greengenes,RDP和SILVA),观察到Greengenes比对的质量较差,导致显着更大的丰富度和多样性估计。
排列后、序列和otu根据它们与训练集的相似性来继续分类,这些训练集通常是从Greengenes、RDP和SILVA数据库中构建的。这些数据库中由测序/PCR错误或不正确的序列标记引起的错误可能会导致序列的错误识别。
依靠数据库进行分类分配时,另一个问题是它们偏向于与人类临床相关的细菌,这意味着研究非人类宿主或环境样品的研究人员可能难以将它们的序列进行分类。例如,在对蜜蜂肠道菌群的研究中,在进行分类任务后,上面列出的三个数据库之间发现了分歧。
在属水平上,这三个数据库仅在13%的序列分配中是一致的。通过在训练集中包括蜜蜂特异性的全长16S rRNA基因序列,改善了序列的分类,突出了需要包括来自更多栖息地的更具代表性的序列。
Werner等人强调了序列分类的这种改进,他建议使用最大和最多样化的数据库。该小组还发现,将参考序列修饰至目标引物区域可改善分类深度。
然而,在更广泛研究的环境中,例如人体肠道,Ritari等人研究发现,建立一个仅包含已知栖息于该生态位的细菌物种的个性化参考数据库会导致较低的分类学水平分配增加,这可能是由于序列之间的竞争比大型数据库少。
操作性分类学方法
操作分类单元(OTU)是微生物组16S或标记基因研究的通用工具。该术语最初是由Sokal和Sneath创造的,在更一般的用法中,它仅指紧密相关的生物群。定义OTU的主要方法有两种:reference-based的和de novo。
在基于参考的聚类中 reference-based clustering,,根据已知的参考数据库对来自群落的序列进行聚类,在从头聚类中 de novo clustering,根据成对距离度量对序列进行聚类。基于参考的OTU有时被称为系统型)。
与微生物组分析的许多领域一样,关于两种方法中哪种方法最好的证据也不尽相同。已经发现从头开始的方法在OTU分配的质量方面表现更好。
Sul等发现基于参考的技术产生的结果与使用de novo方法的结果相似。事实上,基于参考的方法和基于从头开始的方法之间的主要区别可能是,基于从头开始的方法具有明显更大的计算成本和时间,需要以最简单的形式将每个序列与其他序列进行比较。
即使在聚类工具中,参数的选择也已显示对结果有关键影响。尽管97%的阈值已成为标准。研究表明,与99%相似的16S rRNA基因序列可以代表功能不同的微生物,这意味着功能多样的物种将聚集在97%的阈值上。但是,这可能取决于准确的序列,如果不存在这些序列,则97%的阈值可以帮助避免高估生物多样性。考虑到聚类序列的争议和潜在的偏见,一些人提出了使用单个序列来表示OTUS的方法和模型。
基因拷贝数的校正
不同的细菌物种也有不同的16S rRNA基因拷贝数,这可能会导致在比较细菌OTU的丰度时产生误解,或者试图构建一个样本内微生物群落的“真实”描述。在16S rRNA基因研究中,准确了解所有已发现的OTU的拷贝数是不寻常的。
因此,已经开发出了工具,该工具试图使用序列数据库和系统发育信息来校正拷贝数变异,以给出这些OTU的相对丰度的更准确的信息。其中包括Copyrighter,rrNDB,picante R软件包和pplacer中的函数以及PICRUSt软件包的一部分。由于这些技术依赖于数据库,因此存在与分类识别相同的问题。
原则上讲,研究较少的细菌分类法不太可能出现。同样重要的是要注意,在样本之间而不是样本内部比较OTU(例如,在比较治疗效果时),拷贝数变化的影响会降低,因为只要使用相同的方法,OTU的低代表性或高代表性在不同样本之间是一致的。
7
- CONTAMINATION ISSUES -
污染问题
在研究低微生物生物量样品时,DNA提取试剂盒,PCR试剂和实验室环境引起的微生物DNA污染可能会产生特别大的影响。Salter等发现DNA提取试剂盒中的污染不仅因制造商而异,而且因批次而异,并且在单独的实验室中处理的样品含有不同类型的污染性DNA。
由于缺乏可预测性,因此作者建议在所有16S rRNA研究中都应与样品同时使用“阴性”(或仅试剂)对照。如果不包括仅试剂的对照,则可能导致对结果的曲解。当Salter 等分析了一个数据集,比较了两个时间点儿童的鼻咽微生物群样本,他们发现,虽然时间点似乎是单独聚集的,但这种影响主要是由于所用提取试剂盒的污染所引起的偏差。
在处理之前对样本进行随机化可能有助于避免引入这种类型的偏差。污染还可能导致对实际上不存在的微生物群落的错误识别,并且可能会影响我们对临床样品中细菌相关的理解。
也许可以通过使用引物延伸PCR避免从PCR试剂中扩增背景污染物,但这不会对源自其他来源的污染产生影响。已经提出了几种去除试剂和实验室环境中污染性DNA的方法,包括紫外线和伽马射线;DNA嵌入通过8-甲氧基补骨脂,单叠氮乙锭,并且单叠氮丙啶; 酶处理; 二氧化硅基膜过滤;氯化铯密度梯度离心;漂白/铜-双-(菲咯啉)硫酸盐/ H 2 O 2(CoPA)溶液处理。这些方法已显示出对污染水平和PCR灵敏度的不同影响,仍然建议在这些去污措施的旁边添加纯试剂对照。
来自纯试剂对照的测序数据应如何处理仍在争论中。通常不宜简单地去除对照中发现的所有细菌OTU,因为它们可能与可以在样品中真正发现的OTU重叠。已经提出了其他方法,这些方法考虑了OTU的丰度来预测源自污染的序列读数的可能性。这些措施包括适应中性群落模型以及将定量PCR数据与OTU相对丰度数据结合起来,以比较对照和样品中污染OTU的绝对丰度。
但是,该领域正在迅速达成共识,即由于污染问题,不包括仅试剂的控制可能会对序列数据的质量控制产生负面影响。计划进行16S研究时,建议包括仅试剂的对照(即DNA提取试剂盒和PCR对照)。
8
- CONCLUSIONS -
总 结
使用高通量测序平台对复杂微生物群落的研究,使人们可以更好地了解各种生物系统以及各种条件(例如疾病状态)对宿主微生物组的影响。从文献来看,很明显,可以在从采样到生物信息分析的所有方法学阶段将偏见引入微生物群研究。
在设计微生物群研究时要记住的主要因素是一致性。在整个研究过程中使用一致的方法以最大程度地减少可能导致虚假结果的潜在偏差。
试图为微生物组实验过程的各个阶段定义最佳实践的确实很难,并且在本文中,我们仅涵盖了一些文献。可以看出几乎没有共识,并且进一步的研究不太可能找到任何共识。
现实情况是,本文中描述的许多偏见都是针对具体情况和环境而定的,尽管个别研究在其上下文环境中可能是正确的,但其结论可能无法转移到其他研究中。
试图在文献中找到共识是具有挑战性的,许多研究针对实验过程中各个步骤的影响产生了相互矛盾的证据。因此,必须在研究中保持一致性,并且必须接受研究之间可能无法进行比较。
总之,如果可能,就从新鲜样品中提取DNA。如果不行,则应以一致的方式存储样本(即,在相同的温度,相同的持续时间,并在有或没有冷冻保护剂的情况下),并记录适当的元数据。建议使用机械裂解步骤,以最大程度地减少由于某些微生物细胞对裂解的抵抗力而引起的潜在偏差。
根据样本和研究目的,选择合适的引物,但必须注意,即使是通用引物也不会扩增给定样品中的所有细菌。对模拟细菌群落和“阴性” /仅试剂的对照进行测序对于确定背景污染和测序错误率很重要,并且至少在每次测序运行中都应包括在内。
最后,要重申一下,在每个步骤都可能存在偏差的情况下,良好的实验设计至关重要。记录和发布所有实验性元数据对于理解微生物组研究至关重要。
参考文献:
联系客服