自我介绍一下,我是医学院的,现在博士在读,研究方向是遗传流行病。接触R完全是拜我研究生师兄所赐。我们科室有几个数学系的学生,老板招他们是想提高我们研究组的统计能力。R也是他们其中的一位介绍给我的。
我接触R的时间算是不短了,已经两年多了。期间断断续续的看了些R网站上的材料。现在已经习惯了用R做数据分析了,并且越来越喜欢用R来做分析了。之前我用过SAS,SPSS也试过Stata,但是这三个软件都没有专门的遗传统计模块(至少国内流行的盗版里没有)。所以和其它专业相比,我想R对我们也许更有用些。
COS论坛里提到R在genetic statistics里的应用的帖子很少。我在这里写一些我平时用到的遗传统计方面的package的说明,一来算是个人小结再者算是抛砖引玉吧,希望COS论坛里的各位多写些相关的东西。
Introduction. CRAN Task View: Statistical Genetics
CRAN Task View当中有一个单独的Genetics部分,里面列出了40个遗传统计相关的Package和相关链接。这足可以看出R在遗传统计学当中的影响和作用。
里面核心的core package有以下三个: genetics, gap, 和haplo.stats。还有一个我经常用到的包是DGCgenetics,算是对genetics包的扩展。以后我会提到以上几个包里面的一些函数。
大致包括以下几方面的内容:
1. 以上几个package对数据格式的要求;
2. 多态位点的基本信息(MAF等);
3. Hardy-Weinberg平衡检验;
4. LD的计算;
5. 关联研究常用检验方法;
6. Power的计算;