简介
无论是什么格式的数据首先要做的是告诉R你的工作路径,或者你工作的文件夹的路径是什么。有很多方式可以做到这一点,这里我只介绍一种。代码如下:
setwd(choose.dir())#选择工作路径
#输入以上代码然后快捷键“ctrl+enter”就会弹出选择工作路径的窗口,选择数据所在的“工#作盘(如E盘,D盘等)”和对应的“文件夹”点击确定即可。
导入txt格式的数据
#txt格式的数据导入
dat_txt <-read.table("1-bac.txt",sep = '\t',header=T,check.names = FALSE,row.names=1)
head(dat_txt[,1:6])#查看前6行和前6列数据
csv格式的数据导入
dat_csv <-read.csv("1-bac.csv",header=T,sep=",",row.names = 1)
head(dat_csv[,1:6])#查看前6行和前6列数据
xlsx格式的数据导入
#xlsx格式的数据需要用到"readxl"安装包
#若没有需要使用install.packages("readxl")下载之后再加载
install.packages("readxl")
library(readxl)
dat_xlsx <-read_excel("1-bac.xlsx",sheet = 1,col_names = T)
head(dat_xlsx[,1:6])
#其中sheet=1表示xlsx文件中的第几个sheet;在本示例中sheet2为分类信息,
#若想导入则代码修改为如下:
dat_xlsx2 <-read_excel("1-bac.xlsx",sheet = 2,col_names = T)
head(dat_xlsx2[,1:6])
Biom格式的数据导入
什么是biom数据?
Biom数据是一种生物矩阵数据,类似于xlsx数据(这种表述虽然不太准确但是更容易理解)和list格式的数据它同时包含了“测序数据”、“分类信息”和“tree”等信息。这种格式的数据是一种高度压缩的数据,便于数据的传输和交流。一般使用测序平台(如QIIME 2)下机后会产生这类格式的数据,也可以使用R语言生成该格式的数据。
该类格式的数据虽然可以在R语言中进行分析但是很依赖电脑的配置(主要是电脑运存)。像我给出的例子“1-emp.biom”尽管只有38M,但是导入R解压后有9.4GB;所以如果电脑运存过小则可能在导入时直接报错。
#导入biom数据
#若想使用R导入biom数据需要下载相应的安装包,代码如下:
devtools::install_github("joey711/biomformat")
#若以上代码报错,检查是否下载了devtools包,若没有则需先下载该包再运行以上代码
library(biomformat)
dat.b<-read_biom("1-emp.biom")
show(dat.b)#展示数据格式和规模
biom_shape(dat.b)#数据的规模
otu_info<-observation_metadata(dat.b)#物种分类信息
otu<-biom_data(dat.b)#OTU 测序数据
#rownames(otu)#行名称
#rownames(otu_info)#行名称
otu<-otu[rownames(otu_info),]#按照otu_info重新对otu排序
otu1<-data.matrix(otu)
bac<-cbind(otu1[1:1000,],otu_info[1:1000,])#包含测序数据和分类信息的前1000条outs数据
write.csv(bac,"1-bac.csv")#导出数据
联系客服