上一期我们展示了tidyverse主要内容的目录(R语言 | 第5期. 你知道如何快速筛选你的变量和观测样本吗?)。本期按照计划,我们将学习变量名、变量类型、因子水平的修改以及连续变量转分类变量。
一、变量名修改
公式:data %>% rename()
举例:将mtcars数据中cyl的变量名更改为cyl_new
data <- mtcars ## 加载内置数据集mtcars
mtcars
data2 <- data %>%
rename(cyl_new = cyl)
更改前
更改后
二、变量类型修改
公式:data %>% mutate()
class(data$cyl)
data3 <- data %>%
mutate(cyl = as.factor(cyl))
class(data3$cyl)
三、因子水平修改
公式:data %>% mutate(name = fct_relevel(name, c()))
举例:将data3中的cyl变量的因子水平设置为6,8,4
data3$cyl
data4 <- data3 %>%
mutate(cyl = fct_relevel(cyl, c('6','8','4')))
data4$cyl
更改后
四、连续变量转分类变量
公式:data %>% mutate(name =if_else())
举例:为data添加一个名为level的新变量,如果disp小于200,则level为low,否则level为high
data5 <- data %>%
mutate(level = if_else(disp <200, 'low', 'high'))
这就是本期的全部内容啦,你学会了吗?下一期,我们将讲解数据合并操作,敬请期待!大家对于推送内容有任何问题或建议可以在公众号菜单栏“更多--读者的话”栏目中提出,我们会尽快回复!
写在最后
“观科研”(点击进一步了解我们吧)是由一群北京协和医学院(清华大学医学部)的博士开创的公众号,初心是让医学科研有迹可循,帮助一线的医学科研人员更快地成长,希望大家支持与关注!
联系客服