打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
会算Fst还不够,还得知道它的用途

每当我听到这首音乐的时候,我总会想起遥远的高三的某一个下午,想到我的后后座,想到台中门口的三叶草奶茶,想到我曾经当着电灯泡,陪着我同学去见他的女朋友然后居然还一起去网吧通宵,想到所有已经历的瞬间都会过去,念念不忘的总将忘记,只好期待着明天,不敢回首过去。

昨天写完我会计算$F_{ST}$后,有人留言看不懂。这很正常,因为我也是刚刚接触群体遗传学,目前也就刚刚接触到门槛,还没有跨过去。因此我要接着写,只有我能让别人明白,我才算懂这个概念。

本篇文章感谢粉丝zhongru推荐的一篇文献:'Genetics in geographically structured populations: defining, estimating and interpreting $F_{ST}$'

这篇文献里用到了一些符号,例如$F{ST}$在微信上难以渲染成图片,

$F{ST}$(分化系数)是群体遗传学中一个非常重要的统计值,是美国群体遗传学家莱特(S. Wright)于1922年提出的三个F统计值($F{IT}$,$F{ST}$,$F{IS}$)的其中一个。为了说明它的意义,我们需要一个栗子,不对,是一个例子

我们都知道由于遗传漂变,自然选择等因素,不同区域的人在遗传上肯定存在着差异,那么这个差异有多大呢?Li等在2008用370个短串联重复座位和60万个SNP位点作为分子标记分析了几个主要地区的人群的群体差异,发现仅仅只有5~10%的遗传多样性(genetic diversity)是可以由遗传差异(genetic differences)解释。也就说不同地理区域的人群之间差异是比较小的。

好了,那么问题来了,这个结论是怎么得出来的呢?难道是老夫夜观天象,看着那么多分子标记计算数据掐指一算,得到的5~10%吗?

肯定不是,这背后的依据是根据对不同区域抽样得到的数据估计$F{ST}$,微卫星标记数据的估计值为0.04,SNP数据估计值为0.10. 大众一看,原来是有数据支持的呀,虽然不知道$F{ST}$是啥,但是一副很厉害的样子呀,这就是典故不明觉厉的由来。但是对于我们这群知识分子而言,肯定要进一步搞懂$F{ST}$呀,为什么用$F{ST}$,而不是$\phi_{ST}$呢。

$F_{ST}$的用途

我们得知道$F{ST}$有啥用途,成年人都比较实际,时间比较宝贵,不能浪费大量时间去学那些注定用不到的知识,当我们知道$F{ST}$的使用范围后,就可用根据和目前的工作的联系度决定要不要进行进一步的深入

情况一:最开始莱特提出的$F_{ST}$是描述群体中的遗传分化和一些重要进化过程(如迁移、突变和遗传漂变)之间的关系,显然一个非常大的群体即便有有几个遗传组成不太一样的个体迁移到群体中,他们受到的影响也不会太大,他们的分化情况也就没那么明显。因此它可以用作群体和进化遗传学的描述统计值,了解群体遗传分化情况

情况二:$F_{ST}$能够衡量同一个物种两个群体之间的同一个位点等位基因频率差异程度或者说相似程度。如果它比较小,说明两个物种在该基因座位上的等位基因频率相似,反之则说明存在差异。如果自然筛选更偏向某一类基因型的话,那么在该位点上,自然筛选后的个体和没有自然筛选的个体相比,理论上会存在差异。

情况三:$F{ST}$可用作人类疾病的关联分析和法医鉴定中。假如你通过全基因组关联分析找了某个和疾病相关联的SNP,那么这个SNP的可靠性有多高呢?比如说你选择是来自于同一个群体的对照组和实验组,这个群体从理论上讲是经历了相同的演化过程,如果选择的两个组在这个位点上$F{ST}$不存在差异,这说明这个位点被找到可能仅仅是偶尔因素,自然演化中对这个位点没有偏好性。

看到这里,你应该可以知道$F_{ST}$有什么作用了,希望你能用得到。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
全基因组重测序基础及高级分析知识汇总
群体遗传学知识点归纳
统计遗传学:第三章,群体遗传
分子遗传学入门知识简答(三)
一个让我百思不得其解的遗传学难题(转)
综述| Plant Communications :植物物种形成的基因组学
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服