打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
如何使用Exomiser来进行临床遗传病诊断和新基因发现

  

  全外显子测序(WES)是指对大量外显子序列进行平行检测。 WES在鉴定新的单基因遗传病致病基因方面取得了巨大的成功,并且最近几年开始用于临床辅助诊断。WES使用杂交方法来富集(“捕获”)感兴趣的序列,代表了几乎所有蛋白质编码基因的外显子序列,这些序列可以另外包括miRNA序列或其他感兴趣的基因组区域。常用接头引物以在单个PCR中扩增靶序列,并使富集的片段进行测序。这一策略的潜在假设是绝大多数单基因遗传疾病的突变位于编码外显子区或附近。


   WES大大加快了发现疾病相关基因的速度,但是WES的分析仍然充满挑战。 至少有7,000种单基因疾病,但迄今为止,只有大约一半的疾病突变的基因已被鉴定。与基因组参考序列相比,每个人外显子区通常具有超过30,000个变异,其中约10,000个变异会导致非同义氨基酸取代,保守剪接位点改变或小的碱基插入或缺失。即使排除掉常见的变异,也需要额外的方法来预测可能具有严重的功能性的变异,并将其筛选出来以进行下一步的验证。已存在许多方法来预测哪些变异可能有害,这些方法基于诸如保守性,野生型和变体氨基酸的物理化学性质以及其他蛋白质特征的特征。然而,每个人的基因组被认为约有100个真正的功能丧失型变异,导致其中约20个基因完全失去功能。这意味着仅仅根据发现的变异的正常人群频率和预测的致病性对候选基因进行排序将不会使WES数据中疾病相关基因得到良好鉴定。因此,业界开发了许多用于连结疾病表型与基因型的不同方法,其目的在于整合复杂和异构的数据集,包括表达数据,基因序列,功能注释,蛋白质 - 蛋白质相互作用网络以及来自医学文献的信息以便得到一个高低排名的基因列表,为那些需要进一步研究的基因提供线索。

 

在这里,我们介绍Exomiser分析流程,它包含几种算法,整合临床表型数据,小鼠模型生物表型数据,以及蛋白质相互作用来对候选致病基因进行优先级排序。Exomiser已被用于多个疾病致病基因发现和诊断项目,美国国立卫生研究院(NIH)未确诊疾病项目(UDP)已经将Exomiser纳入其WES分析中,并用它来帮助鉴定新的疾病-基因关联以及诊断已知遗传性疾病。PhenomeCentral门户网站(https://phenomecentral.org/)使用Exomiser帮助临床医生从深度表型和WES数据中找到类似的罕见疾病患者,并将Exomiser的基因优先顺序整合到匹配算法中。



Exomiser分析概述


Exomiser的输入文件是由罕见疾病患者的外显子组测序得到的保存变异信息的vcf文件,最好包括有家族成员受影响和未受影响的个体。Exomiser使用一个命令分析这些VCF文件,首先筛选变异,然后优先考虑与临床表型相似的候选基因,以帮助研究人员确定致病变异。筛选步骤至关重要,该步骤将典型外显子组中出现的3万多种变异减少到更易处理的大小。然而,这通常会留下很多的候选位点(高达1,000)需要人工手动评估,所以需要通过优先级算法对位点进行排序。

图1总结了Exomiser的过滤和优化步骤背后的基本原理,并说明了Exomiser中包含的四个优先级划分算法。



图例说明

Exomiser由四套算法组成,用于NGS临床诊断或在罕见疾病领域发现新的疾病基因。 作为输入,Exomiser需要一个包含患者变异的VCF文件。如果VCF文件包含多个家庭成员的样本,则还需要PED文件(存储家系成员亲缘关系、性别及患病情况)。Exomiser首先使用Jannovar对变异进行注释,然后删除非目标区域的变异和比用户设置的人群频率更高的变异,然后根据预测的致病性对剩余的变异进行打分排序。最后,使用三种表型驱动的算法(PHIVE,PhenIX或hiPHIVE)中的一种或通过随机游走算法来评估携带这些变异的基因的临床相关性。用户需要为表型驱动算法提供HPO词条,或为ExomeWalker提供代表疾病基因家族的种子基因列表。



筛选


Exomiser执行的第一步是使用Jannovar软件库注释每个变异。 该注释描述了转录本内或转录本之间的位置,变异的类型(错义,无义,基因间等)以及变异在蛋白质编码序列上的预测结果。默认情况下,Exomiser删除任何脱离目标(基因间,内含子,上下游非翻译区)或同义的变异,虽然这可以关闭。由于寻找罕见疾病候选基因位点,用户通常指定Exomiser频率过滤器MAF的上限,高于这一频率的将会被过滤掉,其他可选过滤条件包括允许用户删除VCF文件QUAL列中的低于特定质量的变异,或者忽略那些不在预定义的基因组或基因组区间内的变异(详细见文章中BOX1)。



优先排序


Exomiser套件包含许多基于蛋白质-蛋白质相互作用和/或患者表型与现有人类疾病数据库和模型生物体之间的表型比较的变异优先排序的不同方法。




图例说明

如果想鉴定疾病新基因,则可以使用一组种子基因来分析。 例如,许多在视网膜色素变性(RP)中突变的基因已被鉴定。 如果怀疑患者可能在RP的新基因中有突变,那么Exomiser可以与ExomeWalker优先方法一起运行,需要提供已知参与RP基因的NCBI Entrez基因ID列表(例如,6121 对于RPE65,130557对于ZNF513等)。或者,Exomiser可以使用基于表型相似性的算法(PHIVE,PhenIX或hiPHIVE)运行。在这里,用户需要输入患者观察到的临床表现的HPO术语列表,优先方法和参数的选择将取决于是临床诊断还是研究目的。PhenIX将只查询已知的孟德尔疾病基因,并且将仅使用人表型数据来计算表型相似性。PHIVE将使用小鼠表型数据来确定候选基因位点。最后,hiPHIVE可以使用小鼠,斑马鱼和人类临床数据,并且可以在分析蛋白质-蛋白质相互作用网络的基础上整合进一步提供候选基因排序。



使用Exomiser作为独立的应用或分析流程一部分


Exomiser可以作为一个独立的应用程序来运行,它将输出一个总结分析结果的HTML页面,对于hiPHIVE方法的小批量或演示使用,可以使用http://www.sanger.ac.uk/science/tools/exomiser的在线版本代替本文详述的流程(游侠提示该网站已不支持在线分析)。如果需要,Exomiser也可用于更大的分析流程。 为此,Exomiser输出制表符分隔值(TSV)和VCF文件,其中包含有关分析结果的详细信息,其形式可以很容易地用作其他可视化软件的输入,用于专门分析或将结果存储在数据库。


图例说明

Exomiser将其分析结果输出为可在任何Web浏览器中打开的HTML页面。 如果需要,等效但更详细的结果可以作为文本文件输出。结果显示为单个基因,并且包括已知由该基因中的突变引起的疾病列表,与人和模型生物体的表型相似性匹配,以及蛋白质相互作用网络中进一步与表型相似的基因。结果显示了受影响的转录物的列表和预测的变体的致病性。完整的输出有一个排序的基因列表,每个基因都提供有这些信息。



游侠点评:Exomiser软件非常好用,不但准确性高而且速度非常快,分析一个单人全外显子数据不到一分钟就出结果,它的优势在于基于位点水平进行排序更加方便,可惜的是没有一个在线的网站让大家可以测试,该程序需要在linux系统下运行,本公众号将推出网络直播Exomiser使用教程,感兴趣的朋友记得关注本公众号哦!



本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
这才叫数据挖掘:31,499个RNAseq公共数据分析建模型
一起学NGS数据分析之基因位点注释
赛福基因公开课第五节《全外显子组数据分析简介》
神经发育障碍不能确诊?AI来帮忙
家系分析软件汇总
基因检测中如何看懂遗传学意义分析?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服