7.Sunum Yrd. Doç. Dr. Sedat ŞEN 1
Bağımlı Değ. Bağımsız Değ. Analiz Sürekli İki kategorili t-testi, Wilcoxon testi Sürekli Kategorik ANOVA, linear regresyon Sürekli Sürekli Korelasyon, doğrusal regresyon İki kategorili Sürekli Lojistic regresyon İki kategorili İki kategorili Ki-Kare testi Yrd. Doç. Dr. Sedat ŞEN 2
Buraya kadar olan konularda (t-testi, ANOVA vb.) bağımlı değişkenin gruplar arasında anlamlı bir fark gösterip göstermediğini test ettik. Bu sunumumuzda farklı bir araştırma sorusunu cevaplamak yeni bir yöntem kullanacağız. Bu sunumda fark yerine ilişki durumuna korelasyon yöntemi ile bakacağız. Korelasyon temel anlamda iki değişken arasındaki ilişkiyi göstermek için kullanılır. Yrd. Doç. Dr. Sedat ŞEN 3
Aşağıdaki formül vasıtasıyla iki değişkene ait değerler kullanılarak hesaplanan değere «Pearson Momentler Çarpımı Korelasyon Katsayısı» denir. Karl Pearson tarafından geliştirildiği için Pearson korelasyonu adını almıştır. Yrd. Doç. Dr. Sedat ŞEN 4
Tablodaki iki değişkene ait kovaryans değerinin 4.25 olarak hesaplandığını biliyorsak. Bu değeri iki değişkenin standart sapmasına bölersek korelasyon katsayısını (r) hesaplayabiliriz. Korelasyon değeri r harfi ile gösterilmektedir. Katılımcı 1 2 3 4 5 Ar. Ortalama İzlenen Reklam Sayısı St. Sapma Varyan s 5 4 4 6 8 5.4 1.67 2.80 Alınan Ürün 8 9 10 13 15 11.0 2.92 8.50 r = 4.25/(1.67x2.92) r = 0.871 İki değişken arasında pozitif yönde yüksek bir ilişki olduğunu söyleyebiliriz. Yrd. Doç. Dr. Sedat ŞEN 5
Korelasyon (ilişki), iki değişkenin birlikte değişiminin bir ölçüsüdür. Boy uzunluğu ile kilo arasındaki ilişki, yaş ile boy arasındaki ilişki, çalışma saati ve sınav puanı arasındaki ilişki, hava sıcaklığı ve doğalgaz tüketimi arasındaki ilişki eğer sayısal veriler varsa korelasyon katsayısı cinsinden gösterilebilir. Korelasyon katsayısı matematiksel olarak -1 ile +1 arasında değerler alır. Yrd. Doç. Dr. Sedat ŞEN 6
Korelasyonun büyüklüğü (0-1) iki değişken arasındaki ilişkinin gücünü gösterirken işareti (+,-) değişkenlerin aynı yönde (+) artıp azaldığını ya da zıt yönlerde (-) artış ve azalış gösterdiğini belirtir. Hava sıcaklığı ve doğalgaz tüketimi arasındaki ilişki NEGATİF Çalışma saati ve sınav puanı arasındaki ilişki POZİTİF olabilir. Eğer iki değişken arasında hiç ilişki yoksa korelasyon katsayısı sıfır ya da sıfıra yakın bulunur. Eğer iki değişken birbiriyle yüzde yüz oranında ilişkili ise korelasyon maksimum (1) değeri (mükemmel ilişki) alır. Yrd. Doç. Dr. Sedat ŞEN 7
İki değişken arasında hesaplanan korelasyon (r) değeri: r<0.20 ve sıfıra yakın değerler ilişkinin olmadığı ya da çok zayıf ilişkiyi işaret eder. 0.20-0.39 arasında ise zayıf ilişki 0.40-0.59 arasında ise orta düzeyde ilişki 0.60-0.79 arasında ise yüksek düzeyde ilişki 0.80-1.0 ise çok yüksek ilişki olduğu yorumu yapılır. Yrd. Doç. Dr. Sedat ŞEN 8
Korelasyon katsayısını yorumlarken neden-sonuç ilişkisinden bahsetmek doğru değildir. Çünkü korelasyon bize iki değişken arasındaki ilişkinin büyüklüğünü gösterirken neden-sonuç ilişkisine dair bir şey söylememektedir. A değişkeni B değişkeni etkiliyor olabilir ya da B değişkeni A değişkenini etkiliyor olabilir. Başka bir alternatif de iki A ile B değişkenleri arasında neden-sonuç ilişkisi olmayabilir. Korelasyon değeri nedensonuç ilişkisinin yönünü vermemektedir. Korelasyon değerine bakarak neden-sonuç ilişkisinden bahsedemememizin başka sebebi de üçüncü bir değişkenin etkisidir. İki değişkenin arasındaki neden-sonuç ilişkisini diğer değişkenlerin etkisinden bağımsız düşünemeyiz. Yrd. Doç. Dr. Sedat ŞEN 9
T-testi ve ANOVA analizlerinde gördüğümüz gibi araştırmacılar bu analizleri kullanarak bir hipotezi test edebilmektedir. Korelasyonu kullanarak bir sıfır hipotez test edilebilmektedir. Korelasyonda test edilen sıfır hipotezi iki değişken arasında bir ilişki olmadığını (r = 0) belirtmektedir(ilişki YOK). Alternatif hipotez ise iki değişken arasında bir ilişki olduğunu belirtir (İLİŞKİ VAR). Burada da elde edilen p-değerine bakarak sıfır hipotezini reddedip edemeyeceğimizi söyleyebiliriz. Örneğin p-değeri 0.05 ten küçük bulunduğunda sıfır hipotezini reddedip alternatif hipotezi kabul edebiliriz. Yani iki değişken arasında anlamlı bir ilişki bulunmaktadır diyebiliriz. Yrd. Doç. Dr. Sedat ŞEN 10
Pearson korelasyonu hesaplaması için değişkenlerin sürekli olması yani en azında eşit aralıklı ölçek düzeyinde olması gerekmektedir. Eğer Pearson korelasyon katsayısının anlamlılığından bahsetmek istiyorsak örneklem dağılımının normal olması varsayımının yerine getirilmesi gerekmektedir. Normalliğin nasıl kontrol edileceğine önceki sunumlardan bakabilirsiniz. Değişkenlerin normal dağılıma sahip olmadığı durumlarda Spearman Sıra korelasyon katsayısı tercih edilir. Yrd. Doç. Dr. Sedat ŞEN 11
Açılan SPSS ekranında bivariate (ikili) ve Partial (kısmi) olmak üzere iki korelasyon türü karşımıza çıkmaktadır. İkili (bivariate) korelasyon iki değişken arasındaki korelasyonu gösterirken kısmi (partial) korelasyon iki değişken arasındaki ilişkiyi gösterirken diğer değişkenlerine etkisini kontrol etmek için kullanılır. Pearson korelasyon ve Spearman korelasyon katsayıları ikili korelasyonlar arasındadır. Yrd. Doç. Dr. Sedat ŞEN 12
Açılan SPSS ekranında bivariate (ikili) Pearson korelasyon ve Spearman korelasyon katsayıları ikili korelasyonlar arasındadır. Yrd. Doç. Dr. Sedat ŞEN 13
Sunumun başında önce varyans ve kovaryans sonra da korelasyon değerlerini hesapladığımız veriyi SPSS ile korelasyon değeri hesaplamada kullanacağız. Veride katılımcıların izledikleri reklam sayıları ile aldıkları ürün sayıları içeren iki değişken verilmektedir. Yrd. Doç. Dr. Sedat ŞEN 14
Yan taraftaki ekranda aralarında ilişki olup olmadığını merak ettiğimiz iki değişkeni ekraın sağ tarafına attıktan sonra Pearson kutucuğunu işaretledikten sonra OK tuşuna basabiliriz. Burada iki yönlü hipotez için iki kuyruklu (two-tailed) seçilir. Yrd. Doç. Dr. Sedat ŞEN 15
Options menüsünde ortalama ve standart sapma gibi betimleyici istatistiklerin yanında kovaryans istatistiği de elde edebiliriz. Eğer verimizde kayıp veri var ise nasıl müdahale edilmesi gerektiğini (pairwise ya da listwise) de seçebiliriz. Yrd. Doç. Dr. Sedat ŞEN 16
Options Menüsünde işaretlememize göre betimleyici istatistik değerleri elde edebiliriz. Bu tablodaki değerler sunumun başındaki hesaplamalarımız ile aynıdır. Yrd. Doç. Dr. Sedat ŞEN 17
Korelasyon analizi sonucunda elde ettiğimiz yandaki tabloda korelasyon değerinin yanında, bu değerin anlamlılığı (pdeğeri), çapraz çarpımlar, kovaryans ve örneklem büyüklüğü (N) değerleri elde edilir. Yrd. Doç. Dr. Sedat ŞEN 18
Yandaki tabloda dikkat etmemiz gereken şey ise aynı değerlerin 2 kez rapor edilmesidir. Bunun sebebi A-B arasındaki her hesaplamanın B-A arasındaki hesaplamalara eşit olmasıdır. Burada tablonun alt ya da üst kısımlarından birine odaklanmak yeterlidir. Yrd. Doç. Dr. Sedat ŞEN 19
Yandaki tabloya göre 5 değere sahip reklam ve 5 değere sahip ürün değişkenleri arasındaki korelasyon değeri 0.871 olarak hesaplanmıştır. Sıfır hipotezini reddedemeyeceğimizi söyleyen 0.054 p-değerine göre anlamlı bir ilişki bulunmamaktadır. Ayrıca kovaryans değeri 4.25 olarak bulunmuştur. Bu değerleri sunumun başında SPSS kullanmadan hesaplamıştık. Burada bir değişkenin kendi ile olan kovaryansı varyanstır ve daha önce hesapladığımız (2.8 ve 8.5) varyans değerleri ile aynıdır. Yrd. Doç. Dr. Sedat ŞEN 20
Yrd. Doç. Dr. Sedat ŞEN 21
Yrd. Doç. Dr. Sedat ŞEN 22
İki nicel değişken arasındaki ilişkiyi göstermek için Pearson korelasyon katsayısını hesaplayabiliriz. Aşağıdaki tabloda kitap okuma sayısı ile öğrenci yaşı arasındaki korelasyon değeri (r=.069) gösterilmektedir. Yrd. Doç. Dr. Sedat ŞEN 23
Okunan kitap sayısı ile final notu arasındaki ilişki için yandaki korelasyon işlemi uygulanır. Yrd. Doç. Dr. Sedat ŞEN 24
Okunan kitap sayısı ile final sınavında alınan puan arasında 0 a yakın bir korelasyon vardır (.03). Yrd. Doç. Dr. Sedat ŞEN 25
Aynı anda bir çok değişken arasında hesaplanan ikili korelasyonlara bakabiliriz. Yrd. Doç. Dr. Sedat ŞEN 26
Yrd. Doç. Dr. Sedat ŞEN 27
Spearman s sıra korelasyonu Pearson korelasyon katsayısının parametrik olmayan versiyonudur. Parametrik varsayımların sağlanmadığı normal olmayan verilerde kullanılır. Verilerin önce sıralanması daha sonra da Pearson eşitliğinin kullanılmasıyla elde edilir. İki tane sıralanmış değişken arasındaki Pearson korelasyon değeridir diyebiliriz. Spearman s rho olarak da adlandırılır. Pearson korelasyonunda doğrusal (linear) ilişki söz konusu iken Spearman korelasyonda monotonik (monotonic) ilişkiden bahsedilir. Yrd. Doç. Dr. Sedat ŞEN 28
Matematik Fizik 56.0 66.0 75.0 70.0 45.0 40.0 71.0 60.0 61.0 65.0 64.0 56.0 58.0 59.0 80.0 77.0 76.0 67.0 61.0 63.0 Yukarıdaki Spearman rho formülü ile yandaki 2 değişken arasındaki korelasyon değerini hesaplayabilmek için önce iki değişkendeki her puan için sıralamada kaçıncı olduklarını, sonra bu sıralamalar arasındaki farkları daha sonra da bu farkların karesini hesaplamak gerekmektedir. Bu işlemler SPSS te otomatik olarak yapılmaktadır. SPSS ile bulmadan önce elle nasıl hesaplandığını göstereceğiz. Yrd. Doç. Dr. Sedat ŞEN 29
Yan tarafta bir grup öğrencinin matematik ve fizik derslerinden aldığı puanlar verilmektedir. Bu iki değişken arasında Spearman sıra korelasyonu katsayısı hesaplanacaktır. Yrd. Doç. Dr. Sedat ŞEN 30
SPSS te Spearman korelasyonu Pearson korelasyonu ile aynı menüde yer almaktadır. Burada tek yapmanız gereken Spearman kutucuğunu seçmektir. Yrd. Doç. Dr. Sedat ŞEN 31
Hesaplamalarımızda bulduğumuz gibi Spearman sıra korelasyon katsayısı aşağıdaki SPSS tablosunda 0.669 olarak sunulmaktadır. Yrd. Doç. Dr. Sedat ŞEN 32
IQ TV 105 6 88 0 99 26 100 49 98 27 104 28 96 19 117 11 111 5 108 16 Bireylerin IQ puanı ile haftalık TV izleme saatleri arasındaki ilişkiyi parametrik olmayan Spearman s sıra korelasyonu ile incelemek istersek önce bu 2 değişkendeki her bir değerin kaçıncı sırada olduğunu göstermek sonra da Spearman ın formülünü kullanarak hesaplama yapmamız gerekir. SPSS te bunları yapmadan tek tuşla Pearson korelasyonunu hesapladığımız gibi Spearman sıra korelasyonunu da hesaplayabiliriz. Yrd. Doç. Dr. Sedat ŞEN 33
Aynı Pearson korelasyonda olduğu gibi Analyze>Correlate >Bivariate kısmına giriyoruz. Yrd. Doç. Dr. Sedat ŞEN 34
Açılan ekranda ilişkileri merak edilen değişkenleri Variables kısmına giriyoruz ve Correlation Coefficients kısmında Spearman kutucuğunu seçiyoruz. Yrd. Doç. Dr. Sedat ŞEN 35
Tabloda görüldüğü üzere Spearman s sıra korelasyon değeri -.176 olarak hesaplanır. Bu tablo kullanılarak Pearson korelasyondakine benzer yorumlar yapılabilir. Yrd. Doç. Dr. Sedat ŞEN 36
Korelasyon neden-sonuç ilişkisini işaret etmez Yrd. Doç. Dr. Sedat ŞEN 37