1、xlsx文件转为txt分隔符存储('datExp.txt');
2、dat = read.table('datExp.txt',header=T,sep='\t') #读取数据;
3、dat1 = dat[,-1] #删除dat的第一列,赋予dat1
4、rownames(dat1) = dat[,1] #把dat中第一列作为dat1的行名
注意:行名是独一无二的,所以原始文件series matrix文件中的基因名称是不能有重复的!(有的话需要取该基因的平均值处理),我给你数据运行后发现GOLGA6有2个重复,我进行删除后就行了
5、dat.exp = log(dat1,2);#
6、View(head(dat.exp)) #查看处理后的数据
联系客服