一行代码解决大部分基本统计分析！

EasyDescribe，一行代码，一个函数，解决大部分基本统计分析！

根据输入数据类型，自动分组统计描述，自动选择合适的统计学方法！

我们的日常统计分析中，经常需要对变量进行统计描述和分组统计描述，而且还要对不同组间是否有差异进行比较与检验。然而，作为专门为统计而生的R语言，R的描述性统计的方法却“选择多得简直让人尴尬！”（《R语言实战·第二版》134页作者如是说），这对于许多初学者、统计学小白以及选择困难症患者来说，简直就是噩梦：每当要进行一项简单的统计分析时，就需要在多得让人头秃的方法与函数中进行对比与挑选，想想就让人头大。

救星来了：

为了解决这一问题，作者开发了EasyDescribe这个包，用一行代码一个函数解决大部分常见基本统计分析，让R程序员不再选择困难！

接下来介绍一下EasyDescribe包的使用逻辑：

为了杜绝选择，EasyDescribe仅有fundescribe()这一个函数，不需要你再选择！那这一个函数是如何包办这些基本统计分析的呢？

fundescribe(x, y, data = NULL, na.rm = TRUE, norm.t =NULL)

fundescribe()存在两个基本参数：x和y，

x就是你想分析的基本变量，y就是对x进行分组的分组变量。

数据类型可以基本分成三大类：连续型变量、有序分类变量和无序分类变量，我们在做基本统计分析时进行方法选择，实际上大部分情况下就是在根据数据类型进行方法选择。而fundescribe()函数就是自动根据你输入x和y的数据类型自动进行方法选择。

比如，你单纯输入了一个连续型变量fundescribe(data$age)，函数就会自动输出均值、标准差、中位数、四分位数等等，而且还会输出一个直方图和QQ图方便你了解数据的正态性与分布情况：

如果你单纯输入一个分类变量fundescribe(data$gender)，函数就会自动输出各个分类数量与占比：

所以，我们可以看到，fundescribe()函数的使用逻辑就是极简，不需要你操心输入的数据类型，它会根据你输入的变量类型进行自动方法选择。

上面是仅输入x的情况，如果同时输入x和y，fundescribe()同样可以自动识别x和y的数据类型进行自动选择所对应的基本统计方法：

例1、x连续型变量，y无序分类变量：

fundescribe(data$age, data$gender)

例2、x连续型变量，y有序分类变量：

fundescribe(age,income, data=data)

例3：x无序分类变量，y无序分类变量：

fundescribe(gender,exercise, data=data)

例4：x无序分类变量，y无序分类变量：

fundescribe(data$drink, data$gender)

例5：x无序分类变量，y有序分类变量：

fundescribe(data$gender, data$income)

从上面五个例子，我想用户已经可以基本管中窥豹，对EasyDescribe这个包和fundescribe()函数有所了解了，目前EasyDescribe包已经在CRAN更新到0.1.1版，老用户需要更新一下了，可以直接使用install.packages("EasyDescribe")命令直接安装和更新，后面作者还会对这个包继续维护和更新，欢迎大家使用，更欢迎大家提出建议与意见，谢谢。

这个Nie R Language微信公众号后续也会对这个包中用到的基本统计方法进行解读，欢迎关注。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。