關閉→
當前位置:知科普>IT科技>主成分分析與因子分析及SPSS實現實例討論

主成分分析與因子分析及SPSS實現實例討論

知科普 人氣:2.29W
SPSS沒有提供單獨的主成分分析方法,而是混在因子分析當中,下面通過一個例子來討論主成分分析與因子分析的實現方法及相關問題。

主成分分析與因子分析及SPSS實現實例討論

方法

(一)問題提出
男子十項全能比賽包含100米跑、跳遠、跳高、撐杆跳、鉛球、鐵餅、標、400米跑、1500米跑、110米跨欄十個項目,總分為各個項目得分之和。為了分析十項全能主要考察哪些方面的能力,以便有針對性的進行訓練,研究者收集了134個頂級運動員的十項全能成績單,將通過因子分析來達到分析目的。

(二)分析過程
變量視圖:

主成分分析與因子分析及SPSS實現實例討論 第2張

數據視圖(部分):

主成分分析與因子分析及SPSS實現實例討論 第3張

菜單選擇(分析->降維->因子分析):

主成分分析與因子分析及SPSS實現實例討論 第4張

打開因子分析的主界面,將十項成績選入”變量“框中(不要包含總分),如下:

主成分分析與因子分析及SPSS實現實例討論 第5張

點擊”描述“按鈕,打開對話框,選中”係數“和”KMO和Bartlett球形度檢驗“,如圖。

下圖相關解釋:
”係數“:為變量之間的相關係數陣列,可以直觀的分析相關性。
”KMO和Bartlett球形度檢驗“:用於定量的檢驗變量之間是否具有相關性。

主成分分析與因子分析及SPSS實現實例討論 第6張

點擊”繼續“,回到主界面,點擊”抽取“,打開對話框。”方法“ =>”主成分“,”輸出“=>”未旋轉的因子解“和”碎石圖“,”抽取“=>”基於特徵值“,其餘選擇默認。


解釋:

①因子抽取的方法:選取默認的主成分法即可,其餘方法的計算結果可能有所差異。

②輸出:”未旋轉的因子解”極為主成分分析結果。碎石圖有助於我們判斷因子的重要性(詳細介紹見後面)。

③抽取:為抽取主成分(因子)的方法,一般是基於特徵值大於1,默認即可。

點擊”繼續“,回到主界面,點擊”確定“,進入分析。

主成分分析與因子分析及SPSS實現實例討論 第7張

輸出的主要表格如下:
(1)相關性檢驗
因子分析要求變量之間有相關性,所以首先要進行相關性檢驗。首先輸出的是變量之間的相關係數矩陣:

主成分分析與因子分析及SPSS實現實例討論 第8張

可以直觀的看到,變量之間有相關性。但需要檢驗,接着輸出的是相關性檢驗,如圖。圖中有兩個指標:第一個是KMO值,一般大於0.7就説明不了之間有相關性了。第二個是Bartlett球形度檢驗,P值<0.001。綜合兩個指標,説明變量之間存在相關性,可以進行因子分析。否則,不能進行因子分析。

主成分分析與因子分析及SPSS實現實例討論 第9張

(2)提取主成分和公因子
接下來輸出主成分結果,如圖。這就是主成分分析的結果,表中第一列為10個成分;第二列為對應的”特徵值“,表示所解釋的方差的大小;第三列為對應的成分所包含的方差佔總方差的百分比;第四列為累計的百分比。一般來説,選擇”特徵值“大於1的成分作為主成分,這也是SPSS默認的選擇。
在本例中,成分1和2的特徵值大於1,他們合計能解釋71.034%的方差,還算不錯。所以我們可以提取1和2作為主成分,抓住了主要矛盾,其餘成分包含的信息較少,故棄去。

主成分分析與因子分析及SPSS實現實例討論 第10張

下面,輸出碎石圖,如下圖。碎石圖來源於地質學的概念。在巖層斜坡下方往往有很多小的碎石,其地質學意義不大。碎石圖以特徵值為縱軸,成分為橫軸。前面陡峭的部分特徵值大,包含的信息多,後面平坦的部分特徵值小,包含的信息也小。由圖直觀的看出,成分1和2包含了大部分信息,從3開始就進入平台了。

主成分分析與因子分析及SPSS實現實例討論 第11張

接下來,輸出提取的成分矩陣。表中的數值為公因子與原始變量之間的相關係數,絕對值越大,説明關係越密切。公因子1和9個運動項目都正相關(注意跑步運動運動的計分方式,時間越短,分數越高),看來只能稱為“綜合運動”因子了。公因子2與鐵餅、鉛球正相關,與1500米跑、400米跑負相關,這究竟代表什麼意思呢?看來只能成為“不知所云”因子了。

主成分分析與因子分析及SPSS實現實例討論 第12張

(三)因子旋轉
前面提取的兩個公因子一個是大而全的“綜合因子”,一個不知所云,得到這樣的結果,無疑是分析的失敗。不過,不要灰心,我們可以通過因子的旋轉來獲得更好的解釋。在主界面中點擊“旋轉”按鈕,打開對話框,“方法”=>“最大方差法”,“輸出”=>“旋轉解”。

主成分分析與因子分析及SPSS實現實例討論 第13張

點擊“繼續”,回到主界面點擊“確認”進行分析。輸出結果如下圖。這是選擇後的成分矩陣。經過旋轉,可以看出:公因子1得分越高,所有的跑步和跨欄成績越差,而跳遠、撐杆跳等需要助跑類項目的成績也越差,所以公因子1代表的是奔跑能力的反向指標,可稱為“奔跑能力”。公因子2與鐵餅和鉛球的正相關性很高,與標、撐杆跳等需要上肢力量的項目也正相關,所以該因子可以成為“上肢力量”。經過旋轉,可以看出公因子有了更合理的解釋。

主成分分析與因子分析及SPSS實現實例討論 第14張

(四)結果的保存
在最後,我們還要將公因子儲存下來供後續使用。點擊“得分”按鈕,打開對話框,選中“保存為變量”,方法採用默認的“迴歸”方法,同時選中“顯示因子得分系數矩陣”。

主成分分析與因子分析及SPSS實現實例討論 第15張

SPSS會自動生成2個新變量,分別為公因子的取值,放在數據的最後。同時會輸出一個因子係數表格:

主成分分析與因子分析及SPSS實現實例討論 第16張

由上圖,我們可以寫出公因子的表達式(用F1、F2代表兩個公因子,Z1~Z10分別代表原始變量):
F1 = -0.16*Z1+0.161*Z2+0.145*Z3+0.199*Z4-0.131*Z5-0.167*Z6+0.137*Z7+0.174*Z8+0.131*Z9-0.037*Z10
F2同理,略去。
注意,這裏的變量Z1~Z10,F1、F2不再是原始變量,而是標準正態變換後的變量。

TAG標籤:#實例 #spss #因子分析 #