用R进行差异检验之t检验

t检验t检验是用t分布理论来推论差异发生的概率，是通过统计检验分析两个群体差异的方法之一。

t检验分为单样本检验和双样本检验两种。

1.单样本检验

其中，单样本t检验是指已知总体平均数、样本数据的均值和标准差，以及样本分布正态。

在R中t检验的函数为t.test

其格式为t.test(x, y = NULL,alternative = c('two.sided', 'less', 'greater'),mu = 0, paired = FALSE, var.equal = FALSE,conf.level = 0.95, ...)

##其中，x，y为数据名称，alternative为检验方式(单侧还是双侧)，mu为总体平均数，当为配对样本时paired设置为TURE，var.equal为样本方差情况(FALSE为默认情况，即样本方差不相等；TURE为认为样本方差相等)，conf.level为置信区间。

本次以嫉妒研究中的数据进行单因素t检验。

首先，对嫉妒进行简单的描述性统计。了解其均值、标准差和分布情况。

在这里我们可以看到嫉妒的偏度和峰度都<>，可以认为其分布为正态分布。

下面进行单样本t检验

假设嫉妒的总体平均数为2.5，那么其t检验如下：

t.test(mydata2$jealou, alternative = 'two.sided', mu = 2.5)

其中，t＝－10.421，df＝491，p<>。表明样本嫉妒水平要显著低于总体平均水平。

2.双样本t检验

其零假设为两个正态分布的总体的均值之差为某实数，例如检验二群人的身高之平均是否相等。但具体而言，只有两个总体的方差是相等的情况下，才称为student t检验；否则，有时被称为Welch t检验。

另外，双样本t检验又可以分为独立双样本t检验和配对样本t检验

2.1独立双样本t检验

例如，我们需要研究嫉妒的男女性别差异，这种双个独立的样本(男性样本vs女性样本)比较均值的情况就可以说是独立双样本t检验

其代码如下：

t.test(jealou~gender,mydata2)#其中jealou为变量名称，gender为性别，mydata2为变量所在的数据集

其中，t=－2.1264,df=488.02,p=0.03397。说明嫉妒存在着性别差异，具体而言，由于在数据在赋予男性的值为1，女性的值为2，因此，男性的嫉妒水平要显著低于女性。

此外，在默认条件下，t.test不会假设独立双样本具有相同的方差，因此该函数默认地调用Welch t检验方法而不是student t检验。可以看到在上文的Welch t检验中，自由度df＝488.02，这是由于方法内对于可能存在的非均等方差的调整。

如果我们要调用student t检验方法，那么我们需要设置参数var.equal=TRUE。

t.test(jealou~gender,mydata2,var.equal=TRUE)

可以看到两者有相似的结果。

2.2配对样本t检验

检验同一统计量的两次测量值之间的差异是否为零。举例来说，我们使用 Statistics: The Exploration & Analysis of Data书中的数据，研究问题为“青少年母亲在断奶期骨质钙含量是否大于哺乳期的骨质钙含量？”

x <- data.frame(mother="">

b=c(1928, 2549, 2825, 1924, 1628, 2175, 2114, 2621, 1843, 2541),

p=c(2126, 2885, 2895, 1942, 1750, 2184, 2164, 2626, 2006, 2627))

t.test(x$p, x$b, paired=T, alternative='greater')

其中，t=3.2188,df=9,p=0.005255。表明青少年母亲的骨质钙含量在断奶期大于哺乳期。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。