打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
队列研究和高通量测序不得不说的故事

2015年初,美国总统奥巴马宣布“精准医疗计划”之后,“精准医疗”一词迅速引爆全球。随后,中国在十三五计划开局之年,正式启动精准医学重点专项,其中,人群队列研究就占了很大一部分,如:华中区域常见慢性非传染性疾病前瞻性队列研究、罕见病临床队列研究,京津冀区域自然人群队列研究等。然而如何做到精准呢,基础在于基因测序,那么队列研究和测序之间如何契合?他们又有哪些不得不说的故事呢?且听小编给大家一一道来:


那么在故事开始之前,小编先带大家了解下人群队列研究的有利条件和意义: 


1提供有力的政策支持

2016年初和2017年初,国家分别启动了两批国家重点研发计划“精准医学”专项评审工作,共审批96个项目383个课题,落实安排到人群队列研究经费共计6亿余元(占专项经费50%以上);不仅如此,《精准医疗国家指南》还提出了以“队列研究、精准医疗”等作为重点的研究方向,在2030年前,计划在精准医疗领域投入600亿元。不仅体现了中国政府要开展队列研究的决心,还为科研人员提供了经费上的支持。


2减少人群分层的干扰

由于种群迁徙、配对模式等导致不同的人种和病种会呈现不同的突变谱,使得混杂人群的关联研究结果偏倚, 产生假阳性或假阴性的结果(如:在美国黑人和高加索人中高血压的发病率有很大差异,在黑人中流行比例要更高,因此两者进行关联研究时, 黑人中一些等位基因频率显著高于白人(control),这些基因被认为可能与疾病有关,但实际上与该疾病毫不相关[1])。有了同种人群参考,可有效减少假阳性的概率,保留可能和疾病相关的有害或致病突变。


3建立丰富的遗传资源库

弗莱明汉心脏队列研究(Framingham Heart StudyFHS)、UKBiobank 等成熟的队列都会收集血样、尿样或 DNA 等样本资源,不仅供本身研究所需,也可作为后续研究的参考或者验证队列,因此,人群队列不仅对疾病研究贡献巨大,也是一种遗传资源库。


4产出多项重大的研究成果

1948年美国创立了 FHS 队列,已经确定了心血管疾病(CVD)的主要危险因素,直至今日 FHS 队列还在进行随访和跟踪,以期探明 CVD 生理特征和遗传因素的关系,其对医学的和人类疾病研究的贡献可见一斑。UKBiobank 作为目前世界上规模最大的人类遗传队列样本库,已有超过400个研究成果发表在不同学术领域的顶级国际期刊上,引用量逾3700次,对整个人类疾病和遗传学研究来说意义重大。


随着科研水平的提高,用高通量测序讲述队列研究的故事已成为新的趋势。


队列研究+高通量测序强强联合

1
正常/自然人群队列


针对正常人群队列,通过高通量测序可以建立健康人群的突变频率数据库,用于同种人群的突变频率注释(如:诺禾自建 Novo-Zhonghua 数据库用于中国人群的频率注释);另一方面,可获取遗传性表型(长寿等表型)的特定遗传图谱,可以帮助我们进一步挖掘人类基因组的奥秘。



【案例1】

日本人群遗传图谱:Rare variant discovery by deep whole-genome sequencing of 1,070 Japanese individuals [2]

发表期刊:Nature Communication  

影响因子:12.353  

发表时间:2015.8


该研究采用 PCR-free 的文库进行全基因组测序(平均深度32.4x),构建了由1070名健康日本人组成的 1KJPN 数据库;本研究的亮点在于,利用了 1KJPN 数据库对烟雾病(MMD)GWAS 分析的数据进行填补,并与其他数据库的填补效果进行对比(图1a-c),从图中可以看出使用 1KJPN 数据能显著提高填补精度,有效消除假阳性的干扰,说明构建人口特定参考队列的重要性。(该数据库网站[长按复制于浏览器内进行查阅]:https://jmorp.megabank.tohoku.ac.jp/201811/)


图1(a)四个参考数据库的填补估算表现的比较,X轴表示 MAF;(b)MMD 的 GWAS 分析;原始数据集和填补的 SNV 位点分别为品红色和灰色。(c)MMD 的 GWAS 的 Loucs Zoom 图;原始(未填补上图)和填补后(下图)


【案例2】

长寿队列:Whole-Genome Sequencing of a Healthy Aging Cohort [3]

发表期刊:Cell   

影响因子:31.398  

发表时间:2016.5


本研究选择了600例80-105岁的无慢性疾病且未服用过慢性病药物的健康长寿老人(WGS,56x)和1,507例20-44岁的成年人(WGS,55x),进行健康老龄化的遗传物质基础研究,通过常见、罕见突变的关联分析,发现了健康长寿队列特有的 COL25A1 突变,可调节 A𝛽 原纤维累积来破坏 AD 的致病性,为阻止或治疗 AD 而靶向 COL25A1 提供了潜在的遗传支持。该项研究也为利用 WGS 数据,进行罕见和常见突变关联分析,探讨多基因影响的复杂表型提供了证据。


图2   A.实验和对照组人群的主成分分析;

B.QQ plot;

C.常见突变的 GWAS Manhattan 图


2
疾病人群队列


针对疾病人群队列,通过高通量测序:a. 可探索特定疾病的变异频率情况,来建立病种数据库(如糖尿病种数据库等);b. 经典的 Case/Control 关联分析(较多研究使用该方法)鉴定特定疾病的易感基因;c. 通过整合基因突变信息和临床数据,分析基因与临床数量性状相关性,找到特定性状的遗传关联。



【案例1】

2型糖尿病基因结构:The genetic architecture of type 2 diabetes [4]

发表期刊:Nature  

影响因子:41.577 

发表时间:2016.3

该研究完成了超过2600个人的全基因组测序(WGS,5x),13000人的外显子测序(WES,83x),并辅以11万人(欧洲,南亚和东亚,美洲和非洲)的基因组或外显子数据。从大规模的人群中探索了 T2D 的风险突变,帮助我们更全面地认识了 T2D 的遗传结构,得到了影响 T2D 风险的最完整的变异数量及遗传特征,为治疗或预防 T2D 提出了一些有前景的途径。


图3 . (a)6,504例和6,436对照的非洲裔美国人、东亚人、欧洲人、西班牙人和南亚人的祖先外显子 GWAS(b); 28 305例和51549例欧洲血统的芯片数据 GWAS (c) 结合外显子芯片和外显子组测序的 meta 分析


【案例2】

易感基因筛查-多组学:A transcriptome-wide association study identifies PALMD as a susceptibility gene for calcific aorticvalve stenosis [5] 

发表期刊:Nature Communication 

影响因子:12.353 

发表时间:2018.2

本研究首先对1009例 Cases 和1017例 Controls 进行 GWAS 分析,再利用基因组和转录组的数据进行 eQTL 分析后进行 TWAS 分析。找到了显著性的 rs6702619 位点(PeQTL=5.82×10-33;PGWAS=6.12×10-5),在瓣膜组织中,该位点与 PALMD 基因的表达水平降低有关(图4)。而 PALMD 基因的表达降低会增加主动脉瓣膜狭窄症(CAVS)的风险。作者再通过 GTEx 和 Western-blot 验证该风险突变可通过下调主动脉瓣组织中的 PALMD 表达而导致对 CAVS 易感,最后结合 UKBiobank 重复队列(大队列)验证,确定了 PALMD 为 CAVS 的易感基因。


图4 左:GWAS 和 TWAS 分析的 Manhattan 图;右:a. GWAS(上)和瓣膜 eQTL(下)的 locus Zoom 图(1p21);b. PALMD 基因表达量与 rs6702619 基因型的关系;c.1p21.2易感位点的散点图


队列研究是国家精准医学战略计划最重要的一环,诺禾致源作为测序行业的一份子,不仅拥有全球最大的测序通量平台和集群存储空间,还有丰富的大样本量数据处理和建立数据库的经验,自建的中国正常人群数据库——Novo-Zhonghua Genomes 已服务于多个科研项目,诺禾致源真诚期待和各位科研工作者一道为精准医学战略计划贡献力量。


全球范围内的人群队列的研究正如火如荼的进行,开展这样一个大型研究,除了大规模的样本量和详尽的流行病学资料,更需要深入了解每个队列的特点,找准方向,后续我们将对出生、长寿、心血管疾病等队列的研究设计进行介绍,期待能给各位科研人员带来帮助。

-未完待续



参考文献:

[1]Lander E S, Schork N J. Genetic dissection of complex traits[J]. Science, 1994, 265(5181): 2037-2048. 

[2]Nagasaki M, Yasuda J, Katsuoka F, et al. Rare variant discovery by deep whole-genome sequencing of 1,070 Japanese individuals[J]. Nature communications, 2015, 6: 8018.

[3] Erikson G A,Bodian D L, Rueda M, et al. Whole-genome sequencing of a healthy agingcohort[J]. Cell, 2016, 165(4): 1002-1011.

[4]FuchsbergerC, Flannick J, Teslovich T M, et al. The genetic architecture of type 2diabetes[J]. Nature, 2016, 536(7614): 41.

[5]ThériaultS, Gaudreault N, Lamontagne M, et al. A transcriptome-wide association studyidentifies PALMD as a susceptibility gene for calcific aortic valvestenosis[J]. Nature communications, 2018, 9(1): 988



疾病研究部   王秋实丨文案

孙津津丨编辑





为你读文献

为你分享资源

为你分析研究思路

为你提供最前沿的科研动态

学霸,逗逼,科学家,文艺青年同在!

诺禾致源丨提供领先的基因组学解决方案

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
Nature | 迄今为止最大规模GWAS研究绘制身高基因图谱,揭示1.2万个与人类身高相关的SNP
多组学新玩法——eQTL来帮你
GWAS十年回顾及展望,未来全基因组测序将成基础
基因组学技术在卒中研究中的应用进展
中国百万人群大队列,何去何从?
GWAS深度分析的策略
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服