最近收到果粉的一些私信,对GEO数据标准化提出了一些问题,今天小果就果粉提出的几个主要些问题进行答疑。 问题一 是不是所有的GEO数据都需要标准化,芯片数据标准化的方法有哪些? 答:不是所有的GEO数据都需要标准化。数据标准化数据四分位数标准化,均值标准化,log2标准化和TMM标准化。 问题二 哪些GEO数据不需要进行数据标准化? 答:GEO数据库有些数据是进行标准化的数据,比如说Series Matrix File(s)格式的文件和MINiML formmatted family file就是标准化之后的文件。这里小果分别对两个数据进行了截图。Series Matrix File(s)格式文件的表达矩阵: MINiML formmatted family file格式文件的表达矩阵: 小伙伴可以观察到这两种数据的基因表达矩阵中的表达丰度值均在50之内,可以判断为是经过标准化的结果。 问题三 哪些GEO数据需要进行数据标准化? 答:上述说的这个标准不是绝对的,有时会遇到的基因表达矩阵是未经过标准化的,需要查看基因表达矩阵的表达丰度值来,有的基因表达矩阵中的表达丰度值在大于50,或者几百之间,甚至更大,此时就需要进行标准化。比如下面小果附上一个MINiML formmatted family file格式的基因矩阵,如下图 这时可以看到基因表达矩阵中的表达丰度值均在几千之间,这时就需要进行数据标准化。 另外就是对于原始的GEO数据,必须要进行数据标准化。总体来说,GEO数据标准具体要视情况而定,不能一概而论。 好了,至此答疑就结束了。小伙伴快去学起来吧。
联系客服