打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
本地化适应是怎么发生的?

随着IlluminaX-Ten测序仪的普及,重测序价格毫无疑问会继续越来越平民化。重测序已经是工具了,这意味着我们手头有什么诱人的材料都可以拿来测一测。


既然比拼测序规模已经慢慢失去价值,而我们大部分人也不是数学/统计学家,没有能力去比拼或开发新的算法。那么相同的测序技术,大同小异的分析方法,我们的研究要如何从茫茫同质化的研究中脱颖而出呢?


其实最终,比拼的还是实验设计和数据挖掘解读能力。其实验设计的高度和数据挖掘解读能力,本质上还是决定于我们对相关生物问题的理解程度以及对各种数据分析方法的理解程度。任何缺乏广泛性验证的结论都是耍流氓,未来从大群体数据中挖掘关键信息,将是越来越常用的方法。所以,在接下来一系列文章中,我们继续来讨论群体重测序。



种群适应的过程,如何对基因组产生影响,这是个很有意思的问题。这里主要参考Outi Savolainen et al 的一篇综述文章[1],当然中间会大量加入我个人的观点。首先我们需要回答两个问题:


  问题1:在什么条件下,本地化适应会发生?


实际上,进化和适应是整个生物学世界的核心问题。我们看到的任何动物、植物、人的任何形态(除了你实验室刚刚制造出来的突变体),其实大部分都是适应选择的结果。正因为适应多种多样的地球环境,才造就了这五彩缤纷的世界。北极熊仅仅是60万年前从棕熊的一个分支演化而来的,而形态各异的汪星人其实只是狼的1个亚种。达尔文的发现无处不在,在微观层面,人体内的癌细胞其实也是无时不刻上演着适应选择的过程,随时妄图统治我们的身体。


图 1:适应选择创造了五彩缤纷的世界


重要的是,演化是一个流动渐进的过程,过去在已慢慢发生,未来也不会停止。而我们现在看到的任何形态,其实都是漫长进化史的一个快照。所以,我们需要解答的问题是:什么情况下会发生适应性选择,以及适应性选择背后的原因上什么。


要观测到基因受本地化适应的痕迹,关键的因素是实验设计,尤其是群体的选择。其中1个很关键的因素就是:不同群体间是否存在迁徙,因为本地化适应往往与某种程度的群体隔离相关(无论是人为还是自然导致的隔离)。其中地理隔绝导致的亚群分化是比较容易理解的,例如一座高山挡住两个亚群相互迁徙的可能。


那么,在非地理隔绝的群体如何产生亚群呢?在这样的群体中,本地化适应是选择和迁徙平衡的结果。这里不得不提到1个概念:antagonistic pleiotropy,好像翻译为“拮抗性基因多效性”比较合理。这个概念实际上说的是,很多情况下,适应是有代价的:即以损失在其他环境下的适应性为代价,获得更强的本地适应能力。


如下图,假设N是南方种,S是北方种,Y轴是适应性,X轴是地点。我们可以看到S在南方具有最高的适应性,到了北方却吃瘪了。这个道理其实非常容易懂,北极熊在北极的冰天雪地是霸主;如果到了针叶林,这一身高贵的白毛,保证耗子都抓不到。

图 2:拮抗性基因多效性


antagonisticpleiotropy的意义在于在某种程度上也降低了种群的迁徙能力(地头蛇一到外地分分钟变菜鸡),从而强化了本地化适应。这也解释了人类育成的作物、畜禽某种程度上都比较娇贵,对人类提供的环境非常依赖,在自然条件下毫无适应性。实际上就是人类育种选择过程中,追求高产带来的代价。


如果不是antagonisticpleiotropy,某个优势基因型在任何环境下都非常强势,其就可能慢慢占领其他的生态位,导致这个基因座逐渐固定(英文翻译为fixed,指的是群体中仅仅保留一种基因型,其他基因型被淘汰)而失去了多样性。


绝大部分我们关注的性状(尤其是动植物的生产性状)都与适应选择有关。如何定位筛查这些与适应性性状相关的基因,一直是基因组研究的热点。


  问题2:适应与分化既然已经发生,我们如何来定位相关的基因?


适应当然很大程度上由基因决定的。如果全凭心情决定,也就没有广大分子生物学家什么事情了。所以,除了探讨适应与那些性状特性有关,更重要的是这种形态的发现由什么基因驱动的。例如,谷类作物在人类驯化选择过程中,那些不易发生自然脱粒的个体更容易被选择保留。而水稻中不易发生脱粒的这个性状,是由qSH1基因发生突变所致。


图 3:qSH1基因,控制水稻脱粒


要解开这些现象背后的原因,我们就可能要使用各类统计分析的方法。目前来看主要包括QTL定位(包含GWAS)和群体遗传(选择压力分析)。这里的QTL定位是广义上的QTL定位,包括经典的连锁分析和关联分析。这两大类方法,在后续的文章中我们会详细介绍。


总体而言,QTL定位是一类依赖表型鉴定的方法。我们需要精确衡量所有个体的表型,然后通过表型和基因型的相关性分析(有多种模型供选择),定位与性状相关的QTL。随着测序价格的不断下降,QTL定位的核心问题实际上是表型鉴定。个体表型鉴定的准确性受多种因素的影响,其准确性直接影响了QTL定位的效果。因为某些表型,必须在某种环境条件下才能表现(例如,抗旱能力必须在干旱条件下才可以被观察),所以要求个体必须要被严格控制在相似的环境条件下进行检测。


对于人类这种可以主动配合实验的物种来说,表型鉴定往往还相对容易。但对动物植物来说,要想进行精确的表型鉴定,则意味着这个物种是已经被驯化的。只有在人工驯化的环境下,控制生存环境,精确的表型鉴定才能成为可能。


图 4 :在大田条件下可以精确鉴定物种表型


但在某些研究中,由于生物学、法律、伦理学等的原因,进行精确的表型鉴定是不可能的。例如,如果你要定位东北虎种群中的抗寒相关基因。理想条件下,你要抓至少几百只东北虎,然后关在虎园里。好吃好喝之后,再各种低温胁迫,测定各种表型指标,然后就可以开心地开展GWAS分析了。


但这个实验设计至少有2个bug:1)费用高昂2)违法


对于这种无法人工驯化进行精确表型鉴定的物种,目前常用的是一个退而求次的方法:选择压力分析。选择压力分析的逻辑是:既然我们观察到物种,已经在不同的地域环境下发生了分化。那么,即使我们不知道它们精确的表型,也可以断定不同地域的个体在基因序列上会发生分化。那么,这些在DNA水平分化的基因,应该就是与适应性相关的基因。


这里,我们需要达成一个共识:在生物学群体遗传研究中,对方法的定义本质上根据实验设计来分类的,而不是根据使用哪一种数学方法来分类。


例如,QTL定位中的连锁分析和关联分析,其核心区别是所研究群体的特性不同,但两种分析方法在统计学上几乎没有本质区别。而QTL定位和选择压力分析,本质上也是实验设计的不同。在后续的文章中,我们将会详细讨论这几类方法实验设计的特点和具体的统计学方法。


图 5:选择压力分析直接利用自然条件下的分类信息开展分分析

 

当然,现在的群体遗传研究,已经不仅仅局限在DNA水平。转录调控、表观遗传越来越被证明在进化适应过程中,也起着非常重要的作用。在聊完DNA层面的问题,我们还可以拓展到更广的课题。

Tips:

今天是 “适应性进化与功能基因定位” 系列专题文章的第一篇,接下来内容有:突变、分化与适应性选择, 连锁分析的方法原理,GWAS分析方法等等,周老师将以他独特的视角为大家描绘群体重测序的新世界。接下来的一段时间里,每周都会有周老师的文章,千万别走丢哦~


参考文献

Savolainen O, Lascoux M, Merilä J. Ecological genomics of localadaptation[J]. Nature Reviews Genetics, 2013, 14(11): 807-820.


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
吃瓜的正确姿势 : GBS高密度遗传图谱助力甜瓜“好吃”性状QTL定位 | 群体遗传
混合样本测序,这些“坑”记得跳过!
OmicShare Forum 专业的生物信息学论坛
PBJ 长文综述| 植物基因组测序、基因编辑等前沿技术的持续突破助力现代农业迅速发展
基迪奥客户BSA文章--梨皮颜色基因定位
浅谈数量性状的定位
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服