Korelasyon ve Regresyon Kazanımlar 1 2 3 4 5 6 Değişkenlerin ilişkisini açıklamak ve hesaplamak için Pearson korelasyon katsayısı Örneklem r ile evren korelasyonu hakkında hipotez testi yapmak Spearman korelasyonunu açıklamak ve hesaplamak point biserial ve phi katsayısını hesaplamak Y değerlerini yordayan lineer regresyon eşitliğini açıklamak ve hesaplamak Regresyon eşitliğinin anlamlılığını değerlendirmek 1
Korelasyon ve regresyona giriş İki değişken arasındaki ilişkiyi ölçer ve tanımlar İlişkinin özelliklerini Yön (negatif veya pozitif) Şekil (genellikle lineer) güç Korelasyon verisi Saçılım grafiği 2
Pozitif ve negatif ilişkiye örnekler Lineer ilişkinin değişik değerlerine örnekler 3
Pearson korelasyonu İki değişken arasındaki doğrusal ilişkinin yönünü ve derecesini ölçer. Mükemmel doğrusal ilişkide r X teki her bir değişime karşılık Y de bir değişim mevcuttur. Korelasyon 1.00 veya +1.00 olur X ve Y nin ortak değeğişi X ve Y nin ayrı ayrı değeğişkenkleri Çarpımlar Toplamı (ÇT) İki değişken arasındaki ortak değişimin miktarını ölçer. ÇT ( X X )( Y Y ) 4
ÇT Hesaplama Formülü Hesaplama formülü daha kolay işlemlerle aynı sonucu verir ÇT XY X Y n Pearson korelasyon katsayısının hesabı ÇT, çarpımlar toplamı: X ve Y nin ortak değişimi r KT ÇT X KT Y 5
Figure 15.4 Example 15.3 Scatterplot Pearson korelasyonu ve z-puanları Pearson korelasyon formulü z puanlarıyla ilişkili olarak ifade edilebilir ilişkili olarak ifade edilebilir. z X z Örneklem : r n 1 z X zy Evren : r n 1 Y 6
Soru A scatterplot shows a set of data points that are clustered loosely around a line that slopes down to the right. Which of the following values would be closest to the korelasyon for these data? A B C D 0.75 0.35 0.75 0.35 Cevap A scatterplot shows a set of data points that are clustered loosely around a line that slopes down to the right. Which of the following values would be closest to the korelasyon for these data? A B C D 0.75 0.35 0.75 0.35 7
Doğru Yanlış Aşağıdaki ifadelerin doğru mu yanlış mı olduklarına karar veriniz. i D/Y D/Y n = 10 çift X ve Y puanlarının ΣX = ΣY = ΣXY = 20. buna göre, SP = 20 Eğer Y değişkeninin değerleri azalırken X değişkenine ait değerleder azalıyorsa aralarındaki korelasyon is negatiftir Cevap Doğru SP (20)(20) 20 20 40 20 10 Yanlış Değişim ğ ş aynı yöndedir, korelasyon pozitiftir 8
Pearson korelasyonunun yorumu ve kullanımı korelasyon yordama amacıyla kullanılır Geçerlik Güvenirlik Teori doğrulama Örnek 9
Korelasyonun Yorumlanması korelasyon nedensellik göstermez Korelasyonun değeri eldeki verilerin ranjından etkilenir Uç değerler outliers korelasyonu etkiler Korelasyonun karesi ortak değişimi gösterir Sınırlı ranj ve korelasyon 10
Uç noktaların korelasyona etkisi katsayı Detarminasyon katsayısı, bir değişkendeki değişimin diğer değişken ile açıklanan oranının ölçüsünü verir. Coefficient of Determination 2 r 11
Doğrusal ilişkinin derecesi Pearson korelasyonu ile Hipotez testi Pearson korelasyonu genellikle örneklem verisi için hesaplanır, ancak evrendeki ilişkileri test etmek için kullanılır. Evrendeki korelasyon rho (ρ) Yunan harfi ile ifade edilir Yönsüz: H 0 : ρ = 0 and H 1 : ρ 0 Yönlü: H 0 : ρ 0 and H 1 : ρ > 0 12
Örneklem korelasyonu ve Evren Korelasyon ile Hipotez Testi Örneklem korelasyonu evren ρ yu test için kullanılır kll l Serbestlik derecesi (df) = n 2 Hipotez testi t veya F kullanılarak hesaplanır. Kritik değerler hesaplanır ± Kritik Değerlerinin ötesindeki örneklem korelasyonları pek olası değildir (very unlikely) ± Kritik Değerlerinin ötesindeki örneklem korelasyonları yokluk hipotezinin reddi ile sonuçlanır. 13
Kısmi korelasyon Kısmi korelasyon, üçüncü bir değişkenin etkisini sabit tutarak iki değişken arasındaki ilişkinin ölçüsünü verir. r xy z r xy (1 r 2 xz ( rxy r yz )(1 ) r 2 yz ) Üçüncü değişkenin etkisini sabit tutmak 14
Pearson korelasyonuna Alternatif Pearson korelasyonu lineer ilişkiler Eşit aralık ve oranlı ölçekler için hesaplanır Diğer korelasyon katsayıları non-lineer veriler Diğer ölçek türleri için hesaplanır Spearman korelasyon Pearson korelasyon formula is used with data from an ordinal scale (ranks) Used when both variables are measured on an ordinal scale Used when relationship is consistently directional but may not be linear 15
Nonlineer pozitif ilişki Puanlarını ve sıralarını gösteren saçılım grafiği 16
Sıralama puanları Spearman korelasyonu Sıra atamak için kullanılan metod Puanlar en küçükten en büyüğe listelenir Listedeki her konumua bir sıra numarası verilir Eğer iki veya daha fazla puan aynı sırada ise, onların sıralarının ortalaması hesaplanır ve bu ortalama değer her birine sıra numarası olarak verilir. Spearman korelasyon formülü Puanların sıraları tamsayılardır Use D as the difference between the X rank and the Y rank for each individual to compute the r s statistic r s 6 1 2 n( n D 2 1) 17
Nokta-Çiftserili korelasyon İki değişken arasındaki ilişkinin ölçüsüdür Değişkenlerden biri sadece iki değer alabilir (ikili değişken) İlişkisiz örneklem t-testindeki aynı durum söz konusudur Nokta çift serili r 2 t istatistiğindeki hesaplanan r 2 ile aynıdır t-istatistiği anlamlılığı değerlendirir r istatistiği onun gücünü ölçer Phi katsayısı Her iki değişkende (X ve Y) iki kategorilidir Her iki değişkende 0 ve 1 diye kodlanır Hesabında Pearson formülü kullanılır 18
Soru Bir çalışmada katılımcılar sabahçılar veya akşamcılar olarak sınıflandırılırlar ve daha sonra 50 puanlık vicdan sahibi olma ölçeğiyle 50 puan üzerinden puanlanırlar. Bu iki değişken arasındaki ilişkiyi ölçmek için hangi korelasyon katsayısı kullanılmalıdır? Pearson korelasyon A B Spearman korelasyon C D Nokta çiftserili korelasyon Phi katsayısı Cevap Participants were classified as morning people or evening people then measured on a 50-point conscientiousness scale. Which korelasyon should be used to measure the relationship? Pearson korelasyon A B Spearman korelasyon C D Nokta çiftserili korelasyon Phi katsayı 19
Soru Aşağıdaki ifadelerin doğru veya yanlış olduklarını belirtiniz. i D/y Spearman korelasyonu dichotomous (ikili) verilerde kullanılır D/Y Korelasyonun anlamlılığını test ederken, yokluk hipotesi korelasyonun sıfır olduğunu belirtir. Cevap Yanlış Spearman korelasyonu sıralı verilerde hesaplanır Doğru 20
Lineer regresyon Pearson korelasyonu iki değişken arasındaki doğrusal ilişkiyi ölçer Verilerden geçen doğru İlişkiyi görmeyi kolaylaştırır İlişkiideki merkezi eğilimi gösterir Yordama amacıyla kullanılabilir Figure 15.13 regresyon doğrusu 21
Lineer eşitlikler Bir doğruyu gösteren genel eşitlik Eşitlik: Y = bx + a X vey değişkenlerdir a ve b sabit değerlerdir lineer eşitliğin grafiği 22
Regresyon Regresyon bir veri setinden geçen en iyi uyum doğrusunu bulma yöntemidir. Bu doğruya regresyon doğrusu denir. Ŷ regresyon eşitliğindeki her bir X değeri için Y nin yordanan değeridir (Y- Ŷ) ) her bir veri noktasının regresyon doğrusundan uzaklığıdır: yordama hatası regresyon hataların karelerinin toplamını minimum yapar Veri noktası ile yordanan nokta arasındaki mesafe 23
regresyon eşitlikleri regresyon doğrusu: Ŷ = bx + a Doğrunun eğimi, b, aşağıdaki gibi hesaplanır b X,Y ÇT KT X veya r s s Y X a Y bx Figure 15.16 X ve Y noktaları ve regresyon doğrusu 24
korelasyon ve standard hata Y puanlarındaki yordanan değişkenlik: KT =r regresyon 2 KT Y Y puanlarındaki yordanmayan değişkenlik: KT residual = (1 - r 2 ) KT Y 25
Kestirimin Standard Hatası regresyon eşitliği bir yordamada bulunur Kestirimin doğruluğu (presicion) kestirimin standard hatası ile belirlenir KT df residual ( Y Yˆ) n 2 2 Testing significance of regresyon Analysis of regresyon Similar to Analysis of Variance Uses an F-ratio of two Mean Square values Each MS is a SS divided by its df 26
Ortalamaların kareleri (OK) ve F- oranı OK regression KT regression df regression OK residual KT df residual residual F OK OK regression residual Regresyon analizinde KT ve df in bölüşümü 27
Figure 15.19 Plot of data in Demonstration 15.1 Learning Check A linear regresyon has b = 3 and a = 4. What is the predicted d Y for X = 7? A B C D 14 25 31 Cannot be determined 28
Learning Check - Answer A linear regresyon has b = 3 and a = 4. What is the predicted d Y for X = 7? A B C D 14 25 31 Cannot be determined Learning Check Decide if each of the following statements is True or False. T/F T/F It is possible for the regresyon equation to have none of the actual data points on the regresyon line. If r = 0.58, the linear regresyon equation predicts about one third of the variance in the Y scores. 29
Answer True The line is an estimator. True When r =.58, r 2 =.336 30