对于坐标点呈直线趋势的两个变数,如果并不需要由X来估计Y,而仅需了解X和Y是否确有相关以及相关的性质(正相关或负相关),则首先应算出表示X和Y 相关密切程度及其性质的统计数 —— 相关系数。一般以
设有一X,Y均为随机变量的双变数总体,具有N对(X,Y)。若在标有这N个(X,Y)坐标点的直角坐标平面上移动坐标轴,将X轴和Y轴分别平移到
在象限Ⅰ, (X-
在象限Ⅲ, (X-
(X,Y)总体呈正相关时,落在象限 Ⅰ,Ⅲ的点一定比落在 象限 Ⅱ,Ⅳ 的多,
同时落在象限 Ⅰ,Ⅲ的点所占的比率愈大,此正值愈大。
(X,Y)总体呈负相关时,落在象限 Ⅱ,Ⅳ 的点一定比落在 象限 Ⅰ,Ⅲ 的多,
同时落在象限 Ⅱ,Ⅳ 的点所占的比率愈大,此负值愈大;
(X,Y)总体无相关,则落在Ⅰ,Ⅱ,Ⅲ,Ⅳ的点是均匀分散的,正负相消,
以上说明,
双变数总体的相关系数
此时
样本相关系数:
上述结果可由回归分析得出:
y 的平方和
上式说明,当散点图上的点完全落在回归直线上时,Q=0,U=
y变异和x完全无关时,U=0,Q=
双变数的相关程度决定于|r|,|r|越接近于1,相关越密切,越接近于0,越可能无关。
r的显著与否与自由度有关,自由度越大,受抽样误差的影响越小,r达到显著水平
r和b的分母总为正值,分子部分SP,相关系数和回归系数的正负一致。
定义为由x不同而引起的平方和
也可定义为由y不同而引起的x的平方和
决定系数和相关系数的区别:
(1)除掉r=0和|r|=1的情况,
(2)r可正可负,
在相关分析中将两者结合起来是可取的,r的正负表示相关的性质,
测验一个样本相关系数r所来自的总体相关系数
由于抽样误差,从
在
对于同一资料来说,线性回归的显著性和线性相关的显著性一定等价,不是偶然巧合而是必然结果。所以在实践应用上,回归的显著性已测验,相关的显著性就无需测验,反之亦然。
r的临界值:
测验一个实得的相关系数r与某一指定的或理论的相关系数C是否有显著差异,统计假设为:
测验两个样本相关系数
由于r转换成z后才近似正态分布,,需进行z转化,两个z值的差数标准误为:
若原假设被接受,应将
合并的方法是将两样本的平方和和乘积和分别带入
代表两个样本有共同的相关系数r。
联系客服