

病原体基因组学在公共卫生领域的应用 Pathogen Genomics in Public Health

在全国范围使用二代测序方面,英国公共卫生部门是早期引领者,尤其是在结核病5,6及细菌性食源性疾病监测方面7,8。在美国,疾病控制和预防中心(CDC)采纳二代测序的时间比较晚9,但现在已广泛应用该技术,其原因很大程度上是美国国会于2013年设立,每年投资达到3,000万美元的先进分子检测(Advanced Molecular Detection)项目,该项目旨在通过二代测序和其他创新实验室技术(首先在CDC采用,之后在全国各州和地方公共卫生部门采用)应对传染病的威胁。



1. 推动公共卫生领域采纳二代测序的该技术特性



PulseNet如今已经从脉冲场凝胶电泳过渡到全基因组测序12,29。这一工作的合作伙伴包括美国食品药品管理局(创建了GenomeTrakr系统30,31,用于对食物和环境分离株进行全基因组测序)、美国农业部(Department of Agriculture)和美国国家生物技术信息中心(National Center for Biotechnology Information)。


图1. 通过测序检测和调查疾病暴发的例子


在本图中,我们用示意图显示了一种食源性病原体的监测数据,即美国一个地区在2018年报道的肠道沙门菌肠炎血清型(Salmonella enterica serovar Enteritidis);2018年时,该地区的一些州已经开始对沙门菌分离株进行实时测序,而另外一些州尚未开始。在这三幅图中,每个点代表一例由肠道沙门菌肠炎血清型引起的胃肠炎。灰点代表后来被确定为“散发”(即与疾病暴发无关)的病例,彩色圆点代表最终确定与疾病暴发相关的病例。这些暴发中最大的一次(红点)最初表现为与两个不同州的餐馆相关的两个病例集群。全基因组测序在这两个集群之间发现了关联,并且在他们与该地区以外的数个病例之间发现了关联。




自20世纪90年代以来,一些DNA指纹技术已被证明可用于结核分枝杆菌的亚型分型34。如果可以识别出密切相关的菌株,卫生部门调查人员将可以发现与近期疾病传播相关的病例集群,即需要更深入调查且可能需要干预的病例35。利用全基因组测序进行亚型分型可达到比旧技术更高的分辨率,因此推断病例之间的关系时也更有信心。在选择性应用全基因组测序数年之后,美国结核病控制项目的调查人员如今已经扩大了这一程序的规模,可以对全国所有经培养证实的病例的分离株进行测序。在加利福尼亚州,公共卫生工作者已经可以通过全基因组测序否定一半以上最初通过传统基因分型方法确定的疑似暴发,从而节省了时间和资源(Shaw T,加利福尼亚公共卫生部[California Department of Public Health]:个人通信)。英国5、加拿大36,37和荷兰38的结核病项目取得的早期经验也证实,全基因组测序能够通过以下方式支持对疾病暴发的有效调查:更准确地定义疾病暴发5,36,38,解释疾病传播的动力学39,有时提示存在之前未发现的病例或应优先隔离并治疗的“超级传播者”5,36。全基因组测序还可表明复发病例是由复活还是由再感染引起,而这些信息在评估结核病项目的效果时很有用40


与此同时,一种中间策略已经在高收入国家得到了应用:直接对早期阳性培养物中的细菌进行全基因组测序,这一方法可早于传统检测结果数周提供药物易感性信息43。纽约州卫生部(New York State Department of Health)和英格兰公共卫生部(Public Health England)42的实验室均获得了监管部门批准,对于全基因组测序预测对全部四种一线药物均敏感的分离株(占所有分离株的70%~80%),这些实验室可不进行传统药物敏感性测试42











在美国,圆孢子虫(cyclospora cayetanensis)每年都会引起食源性腹泻的暴发。圆孢子虫的基因型变异性有限,且无法在实验室中繁殖,因而妨碍我们开发用于监测疾病暴发的有效的基因分型方法。CDC开发出了直接从粪便中提取圆孢子虫的方法,并将提取物用于产生多个分离株的全基因组64。几个有前景的基因分型靶点已经确定,这些靶点有望转化成实用且具有鉴别能力的基因分型工具65








先进分子检测(Advanced Molecular Detection)项目已经开展了6年,二代测序如今在监测、控制和预防传染病的美国公共卫生项目中居核心地位。目前有几个领域需要取得进展。





幸运的是,学术研究人员正在解决这一难题92,他们开发出了工具,例如Microreact(https://microreact.org)93、Nextstrain(https://nextstrain.org)94和Interactive Treeof Life(https://itol.embl.de),用于同时显现和分析流行病学和系统发生数据95。更广泛而言,新兴的数据科学领域为整合、分析和显现日益多样化的公共卫生数据提供了新方法31,96




微生物学家和流行病学家的人才转型虽然可能是最明显的障碍,但在某种程度上而言却是最易解决的问题,因为他们对基因组学充满热情。即使在招募和保留生物信息学家方面也没有最初预想的那么困难。虽然身处竞争激烈的市场中,但在公共卫生实验室学会-CDC生物信息学专科培训项目(Association of Public Health Laboratories-CDC Bioinformatics Fellowship)最初招募的27名工作人员中,有19人(70%)仍在公共卫生领域工作。留在公共卫生部门的人通常会把握这一机会,成为对社会产生积极影响的重要推动者。

成本是一个更加难以解决的问题。目前,测序的成本通常高于传统的亚型分型。此外,为了降低每个样本的检测成本,MiSeq平台(Illumina)等测序技术可能需要每批检测15个或更多样本,这样可能导致返回结果所需的时间超过测序本身所需的36小时。在快速发展的疾病暴发期间,我们显然不希望有这样的延迟。由于其便携性,单分子大片段测序技术(最著名的是MinION[Oxford Nanopore Technologies])已经在公共卫生领域找到一定用武之地,而且该技术有可能每批检测的样本数量和返回结果所需的时间82


在学术界和公共卫生领域,病原体基因组学正开启数据开放的新时代。在美国,地方、州和联邦机构正在将细菌性食源性病原体31、流感50和其他病原体数据上传到国家生物技术信息中心(National Center for Biotechnology Information)负责的公共数据库中(www.ncbi.nlm.nih.gov/pathogens),使这些数据几乎实现了实时发布。这些机构还为其他全球性数据库做出了贡献,如关系TB测序知识库(Relational TB Sequencing Knowledgebase,ReSeqTB)数据平台(www.reseqtb.org)和全球共享所有流感数据创议(Global Initiative on Sharing All Influenza Data,GISAID;www.gisaid.org),这些数据库旨在促进序列和其他数据的国际交换。除了使数据能够二次使用之外,数据开放还鼓励公共卫生组织、学术界和工业界之间的合作。然而,我们不可能实现数据的无条件完全开放:公共卫生机构一直是数据保密方面的谨慎守护者,病原体基因组数据只有在仔细考虑风险之后才能公布91,97,98



图2. 典型的病原体基因组学工作流程



Gregory L. Armstrong, M.D., Duncan R. MacCannell, Ph.D., Jill Taylor, Ph.D., Heather A. Carleton, M.P.H., Ph.D., Elizabeth B. Neuhaus, Ph.D., Richard S. Bradbury, Ph.D., James E. Posey, Ph.D., and Marta Gwinn, M.D., M.P.H. 
From the National Center for Emerging and Zoonotic Infectious Diseases (G.L.A., D.R.M., H.A.C.), the National Center for Immunization and Respiratory Diseases (E.B.N.), the Center for Global Health (R.S.B.), and the National Center for HIV/AIDS, Viral Hepatitis, STD, and TB Prevention (J.E.P.), Centers for Disease Control and Prevention, and CFOL International (M.G.) — all in Atlanta; and the Wadsworth Center, New York State Department of Health, Albany (J.T.). Address reprint requests to Dr. Armstrong at the Centers for Disease Control and Prevention, 1600 Clifton Rd., NE, Atlanta, GA 30329, or at garmstrong@cdc.gov.


