PSK 510 Research Methods and Advanced Statistics Lecture 09: PCA and FA Doğan Kökdemir, PhD http://www.kokdemir.info dogan@kokdemir.info 1
İstatistik Las Meninas - Picasso 2
Gerçek Las Meninas - Diego Velazquez 3
Bileşenleri Bulmak Las Meninas - Picasso 4
PCA Neden Kullanılır? 1. Herhangi bir istatistik kullanmaya yönelik istek, merak, zorunluluk ya da moda çekiciliğine sahip olduğu için. 2. Tek bir değişkenmiş gibi görünen bir kavramın gerçekten tek olup olmadığını anlamak için (Spearman, 1904). 3. Ölçüm araçlarının yapı geçerliğini (construct validity) sınamak amacıyla. {construct validity = factorial validity} 4. Kuram oluşturmak için (örn., Guilford, 1967). {tümevarım} 5. Daha sonraki analizlerde daha basit (parsimonious) bir ölçüm aracına sahip olmak için {Tip II Hatası azalır} 6. Dünyayı daha anlamlı kılmak için. 7. Eninde sonunda bir şey bulursunuz. PRINCIPAL COMPONENT ANALYSIS - TEMEL BİLEŞENLER ANALİZİ 5
FA Neden Kullanılır? 1. 1. Herhangi bir istatistik kullanmaya yönelik istek, merak, zorunluluk ya da moda çekiciliğine sahip olduğu için. 2. 2. Çok boyuttan oluştuğu iddia edilen bir gizil (latent) değişkenin gerçekten çok olup olmadığını anlamak için. 3. 3. Ölçüm araçlarının yapı geçerliğini (construct validity) sınamak amacıyla. {construct validity = factorial validity} 4. 4. Kuramı sınamak için {tümdengelim} 5. 5. Daha sonraki analizlerde daha basit (parsimonious) bir ölçüm aracına sahip olmak için {Tip II Hatası azalır} 6. 6. Anlamlı olduğunu düşündüğünüz dünyayı gerçekten anlamlı görmek için. 7. 7. Eninde sonunda bir şey bulursunuz. FACTOR ANALYSIS - FAKTÖR ANALİZİ 6
Tehlike I: Kuram kuram oluşturma denence oluşturma veri toplama bilgi toplama PCA Tehlike? veri analizi gözlem FA çıkarım Hypothetico Deductive Method (K. Popper) 7
PCA Efsaneleri Nasıl olsa bileşenler (faktörler) çıkar, aklıma gelen her maddeyi anketime ekleyeyim. Birbirine benzeyen maddeleri çıkarayım ki katılımcılar boşuna yorulmasın. Ben kuram oluşturmaya çalışıyorum, bileşenleri önceden belirlemeye gerek yok. 100 kişi, bilemedin 150 kişi yeter; daha ne olacak? Hadi bakalım rasgele; SPSS de faktör sayısı 2 den başlayalım analizlere. Varimax yaptım olmadı bir de Oblimin yapayım (bunlar ne demekse?). O kadar madde kullandım, hepsini bileşenlerin içine yerleştirmeliyim. Diğer analizlere hangisi uyuyorsa o yapıyı seçeyim. LISREL güzel, LISREL bence en iyisi. Hele bir veriyi toplayayım da Onlar 5 faktör bulmuş Pilot mu? PCA in pilotu mu olur? Zaten katılımcı bulmakta zorlanıyoruz. SPSS çözer. 8
Matris Dünyası Yakışıklı Güzel Çirkin Akıllı Zeki Aptal D1 6 5 4 8 6 2 D2 8 7 2 7 5 3 D3 9 8 1 9 7 1 D4 5 4 5 9 7 1 D5 4 3 6 9 7 1 D6 7 6 3 7 5 3 D7 3 2 7 7 5 3 Ort. 6.00 5.00 4.00 8.00 6.00 2.00 SS 2.16 2.16 2.16 1.00 1.00 1.00 Ham Veri Matris işlemlerini elde yapmak ya da matris işlemlerinin tüm teknik detayını bilmeye gerek olmaması çok rahatlatıcı. 9
Matris Dünyası Yakışıklı Güzel Çirkin Akıllı Zeki Aptal Yakışıklı 1.0 1.0-1.0.0.0.0 Güzel 1.0 1.0-1.0.0.0.0 Çirkin -1.0-1.0 1.0.0.0.0 Akıllı.0.0.0 1.0 1.0-1.0 Zeki.0.0.0 1.0 1.0-1.0 Aptal.0.0.0-1.0-1.0 1.0 Korelasyon Matrisi Matris işlemlerini elde yapmak ya da matris işlemlerinin tüm teknik detayını bilmeye gerek olmaması gerçekten çok rahatlatıcı. 10
Soru Yakışıklı Güzel Çirkin Akıllı Zeki Aptal Yakışıklı 1.0 1.0-1.0.0.0.0 Güzel 1.0 1.0-1.0.0.0.0 Çirkin -1.0-1.0 1.0.0.0.0 Akıllı.0.0.0 1.0 1.0-1.0 Zeki.0.0.0 1.0 1.0-1.0 Aptal.0.0.0-1.0-1.0 1.0 SAYI DÜNYASI r 2 ler neyi gösterir? ALAN DÜNYASI 11
PCA İçin Ön Hazırlık 12
Pilot Çalışma Ön İzleme 13
Öklid Uzayındaki Maddeler 14
Madde Silmek Madde şu veya bu nedenle hatalı ise, Herhangi bir görünen boyut açısından önem taşımıyorsa, Güvenirlik analizinde toplam puanla arasındaki korelasyon.20 nin altına düşüyorsa, Araştırmacı bu maddeyi çıkarmak istiyorsa, maddeler, PCA uygulamasına dahil edilmeyebilirler. 15
PCA ve FA Adımları 1. Değişkenlerin (maddelerin) seçilmesi ve sürekli değişken olarak ölçülmesi ( Likert Type ve bir problem). 2. Değişkenler arası korelasyon matrisinin hesaplanması. 3. Bileşen (faktör) sayısının belirlenmesi. 4. Yorum gücünü artırmak amacıyla rotasyon işleminin yapılması (çok büyük ihtimalle gerekecektir). 5. Sonuçların yorumlanması. A good PCA or FA makes sense. (Tabacnick and Fidell, 2001) 16
Matris Dünyası 1. Observed Correlation Matrix (Gözlenen Korelasyon Matrisi) 2. Reproduced Correlation Matrix (Üretilmiş Korelasyon Mat.) 3. Residual Correlation Matrix (Hata Korelasyon Matrisi) 4. Loading Matrix (Faktör Yükü Matrisi) {orthogonal} 5. Structure Matrix and Pattern Matrix {oblique} 17
Dikkat Edilmesi Gerekenler 1. 1. Çoğunlukla PCA ve FA sonuçları kuramsal değil pragmatik amaçlar çerçevesinde yorumlanır. 2. 2. Marker Variables PCA ve FA boyutlarının daha net çıkmasına yardımcı olur. 3. 3. Kompleks değişkenlerden kaçının. 4. 4. Aynı deneklerden kaçının. 5. 5. Farklı örneklemleri kullanın. (Cinsiyet, SES, kültür, din, yaş, ) 6. 6. Denek sayısının azlığı, Outlies, Missing Values, Skewed Variables, hem PCA hem de FA açısından problem yaratabilir. 18
PCA, FA ve Diğerleri PCA Amacı, mümkün olduğunca az ve bağımsız bileşenle veri setindeki varyansın çoğunluğunu açıklamak. FA Amacı, mümkün olduğunca az ve bağımsız faktörle korelasyon matrisine yakın bir matris elde etmek. Alpha Factoring Amacı, farklı örneklemlerdeki ortak ve tutarlı faktörleri bulmak. Maximum Likelihood Amacı, populasyon değerlerini tahmin etmek. Image Factoring Amacı, PCA ve FA ya ek olarak değişkenlerin birbirleri ile olan ilişkisine de bakmak. 19