t检验t检验是用t分布理论来推论差异发生的概率,是通过统计检验分析两个群体差异的方法之一。
t检验分为单样本检验和双样本检验两种。
1.单样本检验
其中,单样本t检验是指已知总体平均数、样本数据的均值和标准差,以及样本分布正态。
在R中t检验的函数为t.test
其格式为t.test(x, y = NULL,alternative = c('two.sided', 'less', 'greater'),mu = 0, paired = FALSE, var.equal = FALSE,conf.level = 0.95, ...)
##其中,x,y为数据名称,alternative为检验方式(单侧还是双侧),mu为总体平均数,当为配对样本时paired设置为TURE,var.equal为样本方差情况(FALSE为默认情况,即样本方差不相等;TURE为认为样本方差相等),conf.level为置信区间。
本次以嫉妒研究中的数据进行单因素t检验。
首先,对嫉妒进行简单的描述性统计。了解其均值、标准差和分布情况。
在这里我们可以看到嫉妒的偏度和峰度都<>,可以认为其分布为正态分布。
下面进行单样本t检验
假设嫉妒的总体平均数为2.5,那么其t检验如下:
t.test(mydata2$jealou, alternative = 'two.sided', mu = 2.5)
其中,t=-10.421,df=491,p<>。表明样本嫉妒水平要显著低于总体平均水平。
2.双样本t检验
其零假设为两个正态分布的总体的均值之差为某实数,例如检验二群人的身高之平均是否相等。但具体而言,只有两个总体的方差是相等的情况下,才称为student t检验;否则,有时被称为Welch t检验。
另外,双样本t检验又可以分为独立双样本t检验和配对样本t检验
2.1独立双样本t检验
例如,我们需要研究嫉妒的男女性别差异,这种双个独立的样本(男性样本vs女性样本)比较均值的情况就可以说是独立双样本t检验
其代码如下:
t.test(jealou~gender,mydata2)#其中jealou为变量名称,gender为性别,mydata2为变量所在的数据集
其中,t=-2.1264,df=488.02,p=0.03397。说明嫉妒存在着性别差异,具体而言,由于在数据在赋予男性的值为1,女性的值为2,因此,男性的嫉妒水平要显著低于女性。
此外,在默认条件下,t.test不会假设独立双样本具有相同的方差,因此该函数默认地调用Welch t检验方法而不是student t检验。可以看到在上文的Welch t检验中,自由度df=488.02,这是由于方法内对于可能存在的非均等方差的调整。
如果我们要调用student t检验方法,那么我们需要设置参数var.equal=TRUE。
t.test(jealou~gender,mydata2,var.equal=TRUE)
可以看到两者有相似的结果。
2.2配对样本t检验
检验同一统计量的两次测量值之间的差异是否为零。举例来说,我们使用 Statistics: The Exploration & Analysis of Data书中的数据,研究问题为“青少年母亲在断奶期骨质钙含量是否大于哺乳期的骨质钙含量?”
x <- data.frame(mother="">->
b=c(1928, 2549, 2825, 1924, 1628, 2175, 2114, 2621, 1843, 2541),
p=c(2126, 2885, 2895, 1942, 1750, 2184, 2164, 2626, 2006, 2627))
t.test(x$p, x$b, paired=T, alternative='greater')
其中,t=3.2188,df=9,p=0.005255。表明青少年母亲的骨质钙含量在断奶期大于哺乳期。
联系客服