主成分分析(PCA),用Matlab和SAS、SPSS结果不一样,后二者一样.但三者的特征值一样,特征向量正负不一

问题描述:

主成分分析(PCA),用Matlab和SAS、SPSS结果不一样,后二者一样.但三者的特征值一样,特征向量正负不一
特征向量的结果:
原始数据:(18样本*6变量)
92 77 80 95 99 126
97 75 77 80 95 125
95 80 70 78 89 120
75 75 73 88 98 110
92 68 72 79 88 113
90 85 80 70 78 103
72 93 75 77 80 100
88 70 76 72 81 102
64 70 69 85 93 105
70 73 70 87 84 100
78 69 75 73 89 97
78 72 71 68 75 96
75 64 63 76 73 92
84 66 77 55 65 76
70 64 51 60 67 88
58 72 75 62 52 75
82 73 40 50 48 61
45 65 42 47 43 60
三种方法特征根都是一样的:
3.9829 0.8314 0.6630 0.4120 0.0640 0.0466
但特征向量不一样:
SAS、SPSS的结果(特征向量矩阵):
0.342794 0.071053 0.882724 0.118374 0.287588 0.039016
0.253554 0.914051 -.200006 0.233780 -.020130 0.071834
0.403902 0.112564 -.045051 -.906119 0.006436 -.032695
0.446693 -.234003 -.405320 0.201942 0.711506 -.185481
0.472785 -.263329 -.120036 0.154394 -.296973 0.762033 0.481670 -.150637 0.008555 0.213692 -.567814 -.614127
Matlab的结果(特征向量矩阵):
-0.3428 0.0711 -0.8827 0.1184 0.2876 0.0390
-0.2536 0.9141 0.2000 0.2338 -0.0201 0.0718
-0.4039 0.1126 0.0451 -0.9061 0.0064 -0.0327
-0.4467 -0.2340 0.4053 0.2019 0.7115 -0.1855
-0.4728 -0.2633 0.1200 0.1544 -0.2970 0.7620
-0.4817 -0.1506 -0.0086 0.2137 -0.5678 -0.6141

第一主成分和第三主成分的特征向量的正负号正好是相反的.从结果直观分析,sas、spss的结果应该更好,即,第一主成分的特征向量理论上应该是正的.
为什么有如此差异?有什么方法可以解决?
谢谢!
1个回答 分类:数学 2014-11-09

问题解答:

我来补答
主成份分析本质上是一种降维技术,要将多个变量通过旋转在少数维度(最好是2个)上表示出来,并据此分类.但是旋转的方法不同,投射出来的结果也是不一样的,因此你会看到特征向量数值绝对值相同,但符号相反.就好比一种旋转方法将点投影到了X轴之上,而另一种方法恰好投影到了X轴之下.在使用时你只要能确定变量和主成份之间的关系就可以了,解释时用最方便解释得结果.
 
 
展开全文阅读
剩余:2000
上一页:周五
下一页:责任的事实论据
也许感兴趣的知识