打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
一行代码解决大部分基本统计分析!

EasyDescribe,一行代码,一个函数,解决大部分基本统计分析!

根据输入数据类型,自动分组统计描述,自动选择合适的统计学方法!

我们的日常统计分析中,经常需要对变量进行统计描述和分组统计描述,而且还要对不同组间是否有差异进行比较与检验。然而,作为专门为统计而生的R语言,R的描述性统计的方法却“选择多得简直让人尴尬!”(《R语言实战·第二版》134页作者如是说),这对于许多初学者、统计学小白以及选择困难症患者来说,简直就是噩梦:每当要进行一项简单的统计分析时,就需要在多得让人头秃的方法与函数中进行对比与挑选,想想就让人头大。

救星来了:

为了解决这一问题,作者开发了EasyDescribe这个包,用一行代码一个函数解决大部分常见基本统计分析,让R程序员不再选择困难!

接下来介绍一下EasyDescribe包的使用逻辑:

    为了杜绝选择,EasyDescribe仅有fundescribe()这一个函数,不需要你再选择!那这一个函数是如何包办这些基本统计分析的呢?

fundescribe(x, y, data = NULL, na.rm = TRUE, norm.t =NULL)

fundescribe()存在两个基本参数:xy

x就是你想分析的基本变量y就是对x进行分组的分组变量

 数据类型可以基本分成三大类:连续型变量、有序分类变量和无序分类变量,我们在做基本统计分析时进行方法选择,实际上大部分情况下就是在根据数据类型进行方法选择。而fundescribe()函数就是自动根据你输入xy的数据类型自动进行方法选择。

 比如,你单纯输入了一个连续型变量fundescribe(data$age),函数就会自动输出均值、标准差、中位数、四分位数等等,而且还会输出一个直方图和QQ图方便你了解数据的正态性与分布情况:

  

  

 如果你单纯输入一个分类变量fundescribe(data$gender),函数就会自动输出各个分类数量与占比:

 所以,我们可以看到,fundescribe()函数的使用逻辑就是极简,不需要你操心输入的数据类型,它会根据你输入的变量类型进行自动方法选择。

 上面是仅输入x的情况,如果同时输入xyfundescribe()同样可以自动识别xy的数据类型进行自动选择所对应的基本统计方法:

1x连续型变量,y无序分类变量:

fundescribe(data$age, data$gender)

2x连续型变量,y有序分类变量:

fundescribe(age,income, data=data)

3x无序分类变量,y无序分类变量:

fundescribe(gender,exercise, data=data)

4x无序分类变量,y无序分类变量:

fundescribe(data$drink, data$gender)

5x无序分类变量,y有序分类变量:

fundescribe(data$gender, data$income)

 从上面五个例子,我想用户已经可以基本管中窥豹,对EasyDescribe这个包和fundescribe()函数有所了解了,目前EasyDescribe包已经在CRAN更新到0.1.1版,老用户需要更新一下了,可以直接使用install.packages("EasyDescribe")命令直接安装和更新,后面作者还会对这个包继续维护和更新,欢迎大家使用,更欢迎大家提出建议与意见,谢谢。

 这个Nie R Language微信公众号后续也会对这个包中用到的基本统计方法进行解读,欢迎关注。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
自学R语言(八)-plyr包的学习
R语言Data Frame数据框常用操作
R语言 data.frame 大全
练习Stata:字符串转换为数值型变量
MetaboAnalyst 3.5 --自己动手的代谢组学分析
多元统计分析介绍
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服