打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【算法系列】主成分分析的几何意义

书接上文:

【算法系列】主成分分析的数学模型

主成分分析的几何意义

设有N个样品,每个样品有两个观测变量X1,X2,这样,在由变量X1,X2组成的坐标空间中,N个样品散布的情况如带状,如下图。

上图中的N个样本点,无论沿着X1轴方向还是X2轴方向,都有较大的离散性,其离散程度可以分别用观测变量X1的方差或X2的方差测定。 

当只考虑X1和X2中的任何一个时,原始数据中的信息将会有较大的损失。 

考虑X1和X2的线性组合,使原始样品数据可以由新的变量Y1和Y2来刻画,在几何上表示就是将坐标轴按逆时针方向旋转

,得到新坐标轴Y1和Y2 。


其矩阵形式为

U为旋转变换矩阵,且

,即是正交矩阵。

经过这样的旋转之后,N个样品在Y1轴上的离散程度最大(方差最大),变量Y1代表了原始数据的绝大部分信息,即使不考虑变量Y2,信息损失也不多。而且, Y1、 Y2不相关。只考虑Y1时,二维降为一维。

因此,经过上述旋转变换就可以把原始数据的信息集中到Y1轴上,对数据中包含的信息起到了浓缩的作用,进行主成分分析的目的就是找出转换矩阵U,而进行主成分分析的作用与几何意义也就很明了了。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
如何通俗易懂地理解PCA主成分分析
主成分分析PCA(含有详细推导过程以及案例分析matlab版)
讲道理 | 特征值和特征向量意义
《spss统计分析与行业应用案例详解》主成分分析与因子分析案例研究
聚类分析、判别分析、主成分分析、因子分析
多元统计分析介绍
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服