打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
由于染色体外随机序列导致的冤假错案
    跟我们经常合作的一位客户主要研究纤毛病,并且送给我们分析case的阳性率非常高,但是最近我们碰到了一些“麻烦”。
 
客户:那个XXX caseHYDIN基因上有没有突变?
游侠:这个患者已经在SPAG1基因上找到个两个候选致病突变,查了一下注释后的表格未发现在HYDIN基因上存在罕见的非同义突变。
客户:可是这个样本之前在其他地方做过基因检测,在HYDIN基因上检测到突变了啊?
游侠心想:一般来说,检测水平再怎么样,突变应该不会搞错,大概率是搞混样本了。
游侠:额….,估计搞混样本了吧,如果你不相信的话,我们可以在这个样本上做一下这个位点的一代验证。
客户:好的,到时候看结果
 

已发现的候选致病位点一个为剪切突变位点,一个为缺失引起移码,都为烈性突变
 

客户提供的其他机构检测结果,显示在HYDIN上存在两个罕见位点

 
一周以后,一代测序的结果发给了客户,但是这个样本居然在第一个位点上(chr16:71007809)存在双峰,而且母亲也携带,父亲不携带,第二个位点(chr1671127814)三人都为野生型,事实胜于雄辩!客户问我们到底怎么回事,游侠一时不知道怎么回答,难道确实是我们搞错了?
 
一代测序图如下

 
这个位点为什么我们在表格中没有发现?第一个原因猜测是因为质量太低被过滤了,赶紧在IGV中查看一下bam

IGV中查看chr16:71007809,测序深度很高,未发现突变)
 
第二个猜测原因是SNP是过滤掉了,在annovar中手动注释该位点发现该位点确实是罕见的非同义突变,但是注释出来与基因组其他区域存在高度同源性,那么究竟和基因组哪里同源呢?游侠把这一段序列复制后,在ucsc进行blat,结果如下:
 


从比对结果上看,除了比对上16号染色体外,还与1号染色体的random也比对上了,只有一个碱基的不同,我们来看一下究竟是哪个碱基呢?
 

 
大家看到没有,就是检测到的这个碱基不一样,换句话说,这根本就不是变异,而是基因组上其他位置的一段野生型碱基而已,至此问题已经解决了大部分,但还有两个小问题没有解决。
 
为什么我们在IGV中没有看到这个假突变,而别人确检测到这个假突变?
 
游侠分析这主要是因为使用的参考基因组不同导致的,我们所用的参考基因组包括random序列,而别人没有包括这一段序列,这就导致本来应该比对到random序列上的reads错误地比对到了16号染色体上,从而检测到这个假突变。为了验证游侠的这个想法,我们将参考基因组中random片段全部去掉,只保留1-22X,Y参考基因组,结果在IGV中就看到了这个假突变如下图,并且突变reads占总reads的比例为34%58/111.
 

重新建立参考基因组,假突变出现了
 
 
为什么父亲没有携带这个假突变?
 
一般来说如果是基因组上同源序列导致的假突变,基本上所有人都会携带这个假突变,为什么这个情况会是个例外,而这就与random序列相关了,首先我们来看一下ucsc是怎么描述random序列的。
 

 
简单来说,random序列可能是虽然确定染色体编号还未确定具体位置的一段序列或是单体型,单体型大家比较好理解的是6号染色体的HLA单体型,不同的人有不同的单体型组合。
游侠结合二代测序的比例及一代测序的峰比例,再加上UCSC基于random序列的解释,大胆作出这样的假设,人群中有些人携带有一份拷贝的这个random序列(可以解释为什么是34%),有些人不携带(可以解释父亲不携带)。为了进一步验证这个假突变是多态性而非罕见的,游侠非常豪气地让一代测序公司随机测10个样本,结果有2个人携带这个假突变。
 

随机测了10个样本显示两个人携带假突变
 
同时,游侠将之前其他样本也与去除random序列的参考基因组比对,同样发现有不少样本携带这个假突变,至此,这个“麻烦”终于搞清楚了。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
回顾问过Jimmy的8个问题
直播我的基因组(第一阶段)完整目录
【软件介绍】IGV软件的安装和基本介绍
如何下载注释文件并查看基因结构
文献解析之完整人类X染色体的端粒-端粒组装
如何可视化的阅读基因组数据,寻找突变、比对和基因?
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服