7.Sunum. Yrd. Doç. Dr. Sedat ŞEN 1

Benzer belgeler
KORELASYON. 7.Sunum. Yrd. Doç. Dr. Sedat ŞEN

Korelasyon, Korelasyon Türleri ve Regresyon

Korelasyon. Korelasyon. Merkezi eğilim ve değişim ölçüleri bir defada sadece bir değişkenin özelliklerini incelememize imkan tanır.

Kategorik Veri Analizi

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

İstatistik ve Olasılık

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

5.HAFTA. Yrd. Doç. Dr. Sedat ŞEN Harran Üniversitesi

REPEATED MEASURES ANOVA (Tekrarlı Ölçümler ANOVA )

Yrd. Doç. Dr. Sedat ŞEN 2

1

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz.

Ortalamaların karşılaştırılması

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

Tekrarlı Ölçümler ANOVA

Multivariate ANOVA (MANOVA) 11.Sunum

BÖLÜM 13 HİPOTEZ TESTİ

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Parametrik Olmayan Testler. İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Merkezi Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

GİRİŞ. Bilimsel Araştırma: Bilimsel bilgi elde etme süreci olarak tanımlanabilir.

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

Korelasyon testleri. Pearson korelasyon testi Spearman korelasyon testi. Regresyon analizi. Basit doğrusal regresyon Çoklu doğrusal regresyon

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

Prof. Dr. Aydın Yüksel MAN 504T Yön. için Finansal Analiz & Araçları Ders: Risk-Getiri İlişkisi ve Portföy Yönetimi I

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları II (19 Nisan 2012)

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

T TESTİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ. Yrd. Doç. Dr. C. Deha DOĞAN

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

Ölçme ve Değerlendirme

Korelasyon ve Regresyon

Tek Yönlü Varyans Analizi (ANOVA) Kruskal Wallis H Testi

Korelasyon ve Regresyon

REGRESYON. 9.Sunum. Yrd. Doç. Dr. Sedat ŞEN

Verilerin Özetlenmesinde Kullanılan Sayısal Yöntemler

TANIMLAYICI İSTATİSTİKLER

Prof.Dr.İhsan HALİFEOĞLU

Parametrik İstatistiksel Yöntemler (t testi ve F testi)

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

Sık kullanılan istatistiksel yöntemler ve yorumlama. Doç. Dr. Seval KUL Gaziantep Üniversitesi Tıp Fakültesi

PARAMETRİK ve PARAMETRİK OLMAYAN (NON PARAMETRİK) ANALİZ YÖNTEMLERİ.

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

SÜREKLĠ OLASILIK DAĞILIMLARI

M d a d dd e A l na i li i z

SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER. Abdullah Can

BİYOİSTATİSTİK. Uygulama 6. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Yrd. Doç. Dr. Sedat Şen 9/27/2018 2

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS DERS NOTLARI I 5 Nisan 2012

Non-Parametrik İstatistiksel Yöntemler

Appendix B: Olasılık ve Dağılım Teorisi

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

TEMEL EĞİTİMDEN ORTAÖĞRETİME GEÇİŞ ORTAK SINAV BAŞARISININ ÇEŞİTLİ DEĞİŞKENLER AÇISINDAN İNCELENMESİ

ÖRNEK BULGULAR. Tablo 1: Tanımlayıcı özelliklerin dağılımı

CEVAPLAR. n = n 1 + n 2 + n 3 + n 4 + n 5 + n 6 + n 7 = = 11 dir.

TEMEL İSTATİSTİK BİLGİSİ. İstatistiksel verileri tasnif etme Verilerin grafiklerle ifade edilmesi Vasat ölçüleri Standart puanlar

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik

Korelasyon ve Regresyon

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

İçindekiler. Ön Söz... xiii

BİYOİSTATİSTİK Uygulama 7 Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Merkezi Yığılma ve Dağılım Ölçüleri

Merkezi Eğilim ve Dağılım Ölçüleri

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

Olasılık ve Normal Dağılım

3.SUNUM. Yrd. Doç. Dr. Sedat Şen

SIRADAN EN KÜÇÜK KARELER (OLS)

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

KİTABIN HARİTASI AÇIKLAMALAR BÖLÜMÜ

İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

Pazarlama Araştırması Grup Projeleri

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1

İÇİNDEKİLER ÖN SÖZ...

BÖLÜM 14 BİLGİSAYAR UYGULAMALARI - 3 (ORTALAMALARIN KARŞILAŞTIRILMASI)

Prof.Dr.İhsan HALİFEOĞLU

MATE 211 BİYOİSTATİSTİK DÖNEM SONU SINAVI

Çalıştığı kurumun prestij kaynağı olup olmaması KIZ 2,85 ERKEK 4,18

Evren (Popülasyon) Araştırma kapsamına giren tüm elemanların oluşturduğu grup. Araştırma sonuçlarının genelleneceği grup

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir

Statistical Package for the Social Sciences

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları III (3 Mayıs 2012)

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

SPSS (Statistical Package for Social Sciences)

Transkript:

7.Sunum Yrd. Doç. Dr. Sedat ŞEN 1

Buraya kadar olan konularda (t-testi, ANOVA vb.) bağımlı değişkenin gruplar arasında anlamlı bir fark gösterip göstermediğini test ettik. Bu sunumumuzda farklı bir araştırma sorusunu cevaplamak yeni bir yöntem kullanacağız. Bu sunumda fark yerine ilişki durumuna korelasyon yöntemi ile bakacağız. Korelasyon temel anlamda iki değişken arasındaki ilişkiyi göstermek için kullanılır. Yrd. Doç. Dr. Sedat ŞEN 2

Korelasyon konusunu anlatmadan önce ilk olarak kovaryans terimini inceleyeceğiz. İki değişkenin ilişkili olup olmadığını öğrenmenin en basit yolu bu iki değişkenin birbirlerine göre değişimini gösteren kovaryans değerini hesaplamaktır. Kovaryansı daha iyi anlamak için betimsel istatistiklerde bahsettiğimiz varyans formülüne bakmakta fayda vardır. Yrd. Doç. Dr. Sedat ŞEN 3

Bir değişkenin varyansı verinin aritmetik ortalamadan ortalama uzaklığını temsil eder. Katılımcı 1 2 3 4 5 Ar. Ortalama İzlenen Reklam Sayısı Alınan Ürün 8 9 1 0 St. Sapma Varyan s 5 4 4 6 8 5.4 1.67 2.80 1 3 1 5 11.0 2.92 8.50 Yukarıdaki formülü kullanarak varyans değerleri 2.80 ve 8.50 olarak hesaplanır. Yrd. Doç. Dr. Sedat ŞEN 4

Yandaki grafikte iki değişken için de her bir değerin ortalamadan farkı (sapmalar) gösterilmektedir. Şimdi iki değişkenin birlikte değişimini bulabilmek için her bir değerin ortalamadan farkının çarpımını bulacağız. Bu işleme kovaryans hesaplaması denir. Yrd. Doç. Dr. Sedat ŞEN 5

Yandaki grafikteki sapmaları ve üstteki formülü kullanarak aşağıdaki işlemlerle kovaryans değerini hesaplarız. Sapmaların çarpımları hep pozitif olduğu için pozitif bir kovaryans değeri yani pozitif bir ilişki beklenebilir. Yrd. Doç. Dr. Sedat ŞEN 6

Kovaryans değerini hesaplayarak iki değişkenin birbirlerine göre değişimi yani ilişkisi gösterilebilir. Bir değişkenin değerleri ortalamanın üzerinde iken diğer değişkenin değerleri de ortalamanın üzerinde ise bu iki değişken arasında pozitif bir ilişki vardır diyebiliriz. Bu durumda iki değişken arasında pozitif bir ilişki vardır diyebiliriz. Biri ortalamanın altında iken diğeri de ortalamanın altında değerler gösteriyorsa genelde kovaryans negatif çıkar. Bu durumda iki değişken arasında negatif bir ilişki vardır diyebiliriz. Fakat kovaryans kullanmadaki problem kovaryansın değişkenlerin birimine bağlı olmasıdır. Eğer iki değişken farklı birimler ile ölçülüyorsa (kg vs. km) bu durumda kovaryansın değerini yorumlamada zorluk yaşarız. Büyük ya da küçük olmasının ne anlama geldiğini söylemek zorlaşır. Yrd. Doç. Dr. Sedat ŞEN 7

Kovaryanstaki birim probleminden kurtulmak için kovaryans değerini standartlaştırmamız gerekmektedir. Bir şekilde her türlü birimi ortak bir değere çevirebilmemiz lazım. Bunu yapabilmek için standart sapma kullanmamız gerekmektedir. Aynı standart z puanlarının hesaplanmasında yaptığımız gibi her hangi bir değerin ortalamadan sapmasını standart sapmaya böldüğümüzde standart bir ölçek elde ederiz. Kovaryans formülünü standart sapma değerleri ile böldüğümüzde elde edeceğimiz değerin adı korelasyon olacaktır. Yrd. Doç. Dr. Sedat ŞEN 8

Aşağıdaki formül vasıtasıyla iki değişkene ait değerler kullanılarak hesaplanan değere «Pearson Momentler Çarpımı Korelasyon Katsayısı» denir. Karl Pearson tarafından geliştirildiği için Pearson korelasyonu adını almıştır. Yrd. Doç. Dr. Sedat ŞEN 9

Önceki slaytlarda verdiğimiz iki değişkene ait kovaryans değerini 4.25 olarak hesaplamıştık. Bu değeri iki değişkenin standart sapmasına bölersek korelasyon katsayısını (r) hesaplayabiliriz. Korelasyon değeri r harfi ile gösterilmektedir. Katılımcı 1 2 3 4 5 Ar. Ortalama İzlenen Reklam Sayısı Alınan Ürün 8 9 1 0 St. Sapma Varyan s 5 4 4 6 8 5.4 1.67 2.80 1 3 1 5 11.0 2.92 8.50 r = 4.25/(1.67x2.92) r = 0.871 İki değişken arasında pozitif yönde yüksek bir ilişki olduğunu söyleyebiliriz. Yrd. Doç. Dr. Sedat ŞEN 10

Korelasyon (ilişki), iki değişkenin birlikte değişiminin bir ölçüsüdür. Boy uzunluğu ile kilo arasındaki ilişki, yaş ile boy arasındaki ilişki, çalışma saati ve sınav puanı arasındaki ilişki, hava sıcaklığı ve doğalgaz tüketimi arasındaki ilişki eğer sayısal veriler varsa korelasyon katsayısı cinsinden gösterilebilir. Korelasyon katsayısı matematiksel olarak -1 ile +1 arasında değerler alır. Korelasyonun büyüklüğü (0-1) iki değişken arasındaki ilişkinin gücünü gösterirken işareti (+,-) değişkenlerin aynı yönde (+) artıp azaldığını ya da zıt yönlerde (-) artış ve azalış gösterdiğini belirtir. Hava sıcaklığı ve doğalgaz tüketimi arasındaki ilişki NEGATİF Çalışma saati ve sınav puanı arasındaki ilişki POZİTİF olabilir. Eğer iki değişken arasında hiç ilişki yoksa korelasyon katsayısı sıfır ya da sıfıra yakın bulunur. Eğer iki değişken birbiriyle yüzde yüz oranında ilişkili ise korelasyon maksimum (1) değeri (mükemmel ilişki) alır. Yrd. Doç. Dr. Sedat ŞEN 11

İki değişken arasında hesaplanan korelasyon (r) değeri: r<0.20 ve sıfıra yakın değerler ilişkinin olmadığı ya da çok zayıf ilişkiyi işaret eder. 0.20-0.39 arasında ise zayıf ilişki 0.40-0.59 arasında ise orta düzeyde ilişki 0.60-0.79 arasında ise yüksek düzeyde ilişki 0.80-1.0 ise çok yüksek ilişki olduğu yorumu yapılır. Yrd. Doç. Dr. Sedat ŞEN 12

Korelasyon değeri standartlaştırılmış bir değer olduğu için etki boyutu büyüklüğü olarak da kullanılabilir. ±.1 arasındaki değerler küçük etki, (±.1) ve (±.3) arasındaki değerler orta büyüklükteki etki ve (±.3) ve (±.5) arasındaki değerler ile daha üstteki değerler büyük etki şeklinde yorumlanabilir. Yrd. Doç. Dr. Sedat ŞEN 13

Korelasyon katsayısını yorumlarken neden-sonuç ilişkisinden bahsetmek doğru değildir. Çünkü korelasyon bize iki değişken arasındaki ilişkinin büyüklüğünü gösterirken neden-sonuç ilişkisine dair bir şey söylememektedir. A değişkeni B değişkeni etkiliyor olabilir ya da B değişkeni A değişkenini etkiliyor olabilir. Başka bir alternatif de iki A ile B değişkenleri arasında neden-sonuç ilişkisi olmayabilir. Korelasyon değeri nedensonuç ilişkisinin yönünü vermemektedir. Korelasyon değerine bakarak neden-sonuç ilişkisinden bahsedemememizin başka sebebi de üçüncü bir değişkenin etkisidir. İki değişkenin arasındaki neden-sonuç ilişkisini diğer değişkenlerin etkisinden bağımsız düşünemeyiz. Yrd. Doç. Dr. Sedat ŞEN 14

T-testi ve ANOVA analizlerinde gördüğümüz gibi araştırmacılar bu analizleri kullanarak bir hipotezi test edebilmektedir. Korelasyonu kullanarak bir sıfır hipotez test edilebilmektedir. Korelasyonda test edilen sıfır hipotezi iki değişken arasında bir ilişki olmadığını (r = 0) belirtmektedir(ilişki YOK). Alternatif hipotez ise iki değişken arasında bir ilişki olduğunu belirtir (İLİŞKİ VAR). Burada da elde edilen p-değerine bakarak sıfır hipotezini reddedip edemeyeceğimizi söyleyebiliriz. Örneğin p-değeri 0.05 ten küçük bulunduğunda sıfır hipotezini reddedip alternatif hipotezi kabul edebiliriz. Yani iki değişken arasında anlamlı bir ilişki bulunmaktadır diyebiliriz. Yrd. Doç. Dr. Sedat ŞEN 15

Pearson korelasyonu hesaplaması için değişkenlerin sürekli olması yani en azında eşit aralıklı ölçek düzeyinde olması gerekmektedir. Eğer Pearson korelasyon katsayısının anlamlılığından bahsetmek istiyorsak örneklem dağılımının normal olması varsayımının yerine getirilmesi gerekmektedir. Normalliğin nasıl kontrol edileceğine önceki sunumlardan bakabilirsiniz. Değişkenlerin normal dağılıma sahip olmadığı durumlarda Spearman Rank korelasyon katsayısı tercih edilir. Yrd. Doç. Dr. Sedat ŞEN 16

Açılan SPSS ekranında bivariate (ikili) ve Partial (kısmi) olmak üzere iki korelasyon türü karşımıza çıkmaktadır. İkili (bivariate) korelasyon iki değişken arasındaki korelasyonu gösterirken kısmi (partial) korelasyon iki değişken arasındaki ilişkiyi gösterirken diğer değişkenlerine etkisini kontrol etmek için kullanılır. Pearson korelasyon ve Spearman korelasyon katsayıları ikili korelasyonlar arasındadır. Yrd. Doç. Dr. Sedat ŞEN 17

Açılan SPSS ekranında bivariate (ikili) Pearson korelasyon ve Spearman korelasyon katsayıları ikili korelasyonlar arasındadır. Yrd. Doç. Dr. Sedat ŞEN 18

Sunumun başında önce varyans ve kovaryans sonra da korelasyon değerlerini hesapladığımız veriyi SPSS ile korelasyon değeri hesaplamada kullanacağız. Veride katılımcıların izledikleri reklam sayıları ile aldıkları ürün sayıları içeren iki değişken verilmektedir. Yrd. Doç. Dr. Sedat ŞEN 19

Yan taraftaki ekranda aralarında ilişki olup olmadığını merak ettiğimiz iki değişkeni ekraın sağ tarafına attıktan sonra Pearson kutucuğunu işaretledikten sonra OK tuşuna basabiliriz. Burada iki yönlü hipotez için iki kuyruklu (two-tailed) seçilir. Yrd. Doç. Dr. Sedat ŞEN 20

Options menüsünde ortalama ve standart sapma gibi betimleyici istatistiklerin yanında kovaryans istatistiği de elde edebiliriz. Eğer verimizde kayıp veri var ise nasıl müdahale edilmesi gerektiğini (pairwise ya da listwise) de seçebiliriz. Yrd. Doç. Dr. Sedat ŞEN 21

Options Menüsünde işaretlememize göre betimleyici istatistik değerleri elde edebiliriz. Bu tablodaki değerler sunumun başındaki hesaplamalarımız ile aynıdır. Yrd. Doç. Dr. Sedat ŞEN 22

Korelasyon analizi sonucunda elde ettiğimiz yandaki tabloda korelasyon değerinin yanında, bu değerin anlamlılığı (pdeğeri), çapraz çarpımlar, kovaryans ve örneklem büyüklüğü (N) değerleri elde edilir. Yrd. Doç. Dr. Sedat ŞEN 23

Yandaki tabloda dikkat etmemiz gereken şey ise aynı değerlerin 2 kez rapor edilmesidir. Bunun sebebi A-B arasındaki her hesaplamanın B-A arasındaki hesaplamalara eşit olmasıdır. Burada tablonun alt ya da üst kısımlarından birine odaklanmak yeterlidir. Yrd. Doç. Dr. Sedat ŞEN 24

Yandaki tabloya göre 5 değere sahip reklam ve 5 değere sahip ürün değişkenleri arasındaki korelasyon değeri 0.871 olarak hesaplanmıştır. Sıfır hipotezini reddedemeyeceğimizi söyleyen 0.054 p-değerine göre anlamlı bir ilişki bulunmamaktadır. Ayrıca kovaryans değeri 4.25 olarak bulunmuştur. Bu değerleri sunumun başında SPSS kullanmadan hesaplamıştık. Burada bir değişkenin kendi ile olan kovaryansı varyanstır ve daha önce hesapladığımız (2.8 ve 8.5) varyans değerleri ile aynıdır. Yrd. Doç. Dr. Sedat ŞEN 25

Yrd. Doç. Dr. Sedat ŞEN 26

Yrd. Doç. Dr. Sedat ŞEN 27

İki nicel değişken arasındaki ilişkiyi göstermek için Pearson korelasyon katsayısını hesaplayabiliriz. Aşağıdaki tabloda kitap okuma sayısı ile öğrenci yaşı arasındaki korelasyon değeri (r=.069) gösterilmektedir. Yrd. Doç. Dr. Sedat ŞEN 28

Okunan kitap sayısı ile final notu arasındaki ilişki için yandaki korelasyon işlemi uygulanır. Yrd. Doç. Dr. Sedat ŞEN 29

Okunan kitap sayısı ile final sınavında alınan puan arasında 0 a yakın bir korelasyon vardır (.03). Yrd. Doç. Dr. Sedat ŞEN 30

Aynı anda bir çok değişken arasında hesaplanan ikili korelasyonlara bakabiliriz. Yrd. Doç. Dr. Sedat ŞEN 31

Yrd. Doç. Dr. Sedat ŞEN 32

Spearman s sıra korelasyonu Pearson korelasyon katsayısının parametrik olmayan versiyonudur. Parametrik varsayımların sağlanmadığı normal olmayan verilerde kullanılır. Verilerin önce sıralanması daha sonra da Pearson eşitliğinin kullanılmasıyla elde edilir. İki tane sıralanmış değişken arasındaki Pearson korelasyon değeridir diyebiliriz. Spearman s rho olarak da adlandırılır. Pearson korelasyonunda doğrusal (linear) ilişki söz konusu iken Spearman korelasyonda monotonik (monotonic) ilişkiden bahsedilir. Yrd. Doç. Dr. Sedat ŞEN 33

Matematik Fizik 56.0 66.0 75.0 70.0 45.0 40.0 71.0 60.0 61.0 65.0 64.0 56.0 58.0 59.0 80.0 77.0 76.0 67.0 61.0 63.0 Yukarıdaki Spearman rho formülü ile yandaki 2 değişken arasındaki korelasyon değerini hesaplayabilmek için önce iki değişkendeki her puan için sıralamada kaçıncı olduklarını, sonra bu sıralamalar arasındaki farkları daha sonra da bu farkların karesini hesaplamak gerekmektedir. Bu işlemler SPSS te otomatik olarak yapılmaktadır. SPSS ile bulmadan önce elle nasıl hesaplandığını göstereceğiz. Yrd. Doç. Dr. Sedat ŞEN 34

Matematik Fizik Mat Sıralama 56.0 66.0 9,00 75.0 70.0 3,00 45.0 40.0 10,00 71.0 60.0 4,00 61.0 65.0 6,50 64.0 56.0 5,00 58.0 59.0 8,00 80.0 77.0 1,00 76.0 67.0 2,00 61.0 63.0 6,50 Yrd. Doç. Dr. Sedat ŞEN 35

Matematik Fizik Mat Sıralama Fizik Sıralama 56.0 66.0 9,00 4,00 75.0 70.0 3,00 2,00 45.0 40.0 10,00 10,00 71.0 60.0 4,00 7,00 61.0 65.0 6,50 5,00 64.0 56.0 5,00 9,00 58.0 59.0 8,00 8,00 80.0 77.0 1,00 1,00 76.0 67.0 2,00 3,00 61.0 63.0 6,50 6,00 Yrd. Doç. Dr. Sedat ŞEN 36

Matematik Fizik Mat Sıralama Fizik Sıralama Farklar 56.0 66.0 9,00 4,00 5,00 75.0 70.0 3,00 2,00 1,00 45.0 40.0 10,00 10,00 0,00 71.0 60.0 4,00 7,00-3,00 61.0 65.0 6,50 5,00 1,50 64.0 56.0 5,00 9,00-4,00 58.0 59.0 8,00 8,00 0,00 80.0 77.0 1,00 1,00 0,00 76.0 67.0 2,00 3,00-1,00 61.0 63.0 6,50 6,00 0,50 Yrd. Doç. Dr. Sedat ŞEN 37

Matematik Fizik Mat Sıralama Fizik Sıralama Farklar Farkların Karesi 56.0 66.0 9,00 4,00 5,00 25 75.0 70.0 3,00 2,00 1,00 1 45.0 40.0 10,00 10,00 0,00 0 71.0 60.0 4,00 7,00-3,00 9 61.0 65.0 6,50 5,00 1,50 2,25 64.0 56.0 5,00 9,00-4,00 16 58.0 59.0 8,00 8,00 0,00 0 80.0 77.0 1,00 1,00 0,00 0 76.0 67.0 2,00 3,00-1,00 1 61.0 63.0 6,50 6,00 0,50 0,25 Farkların Karesi Toplamı=54,5 Yrd. Doç. Dr. Sedat ŞEN 38

Yan tarafta bir grup öğrencinin matematik ve fizik derslerinden aldığı puanlar verilmektedir. Bu iki değişken arasında Spearman sıra korelasyonu katsayısı hesaplanacaktır. Yrd. Doç. Dr. Sedat ŞEN 39

SPSS te Spearman korelasyonu Pearson korelasyonu ile aynı menüde yer almaktadır. Burada tek yapmanız gereken Spearman kutucuğunu seçmektir. Yrd. Doç. Dr. Sedat ŞEN 40

Hesaplamalarımızda bulduğumuz gibi Spearman sıra korelasyon katsayısı aşağıdaki SPSS tablosunda 0.669 olarak sunulmaktadır. Yrd. Doç. Dr. Sedat ŞEN 41

IQ TV 105 6 88 0 99 26 100 49 98 27 104 28 96 19 117 11 111 5 108 16 Bireylerin IQ puanı ile haftalık TV izleme saatleri arasındaki ilişkiyi parametrik olmayan Spearman s sıra korelasyonu ile incelemek istersek önce bu 2 değişkendeki her bir değerin kaçıncı sırada olduğunu göstermek sonra da Spearman ın formülünü kullanarak hesaplama yapmamız gerekir. SPSS te bunları yapmadan tek tuşla Pearson korelasyonunu hesapladığımız gibi Spearman sıra korelasyonunu da hesaplayabiliriz. Yrd. Doç. Dr. Sedat ŞEN 42

Aynı Pearson korelasyonda olduğu gibi Analyze>Correlate >Bivariate kısmına giriyoruz. Yrd. Doç. Dr. Sedat ŞEN 43

Açılan ekranda ilişkileri merak edilen değişkenleri Variables kısmına giriyoruz ve Correlation Coefficients kısmında Spearman kutucuğunu seçiyoruz. Yrd. Doç. Dr. Sedat ŞEN 44

Tabloda görüldüğü üzere Spearman s sıra korelasyon değeri -.176 olarak hesaplanır. Bu tablo kullanılarak Pearson korelasyondakine benzer yorumlar yapılabilir. Yrd. Doç. Dr. Sedat ŞEN 45

Kendall Tau korelasyon değeri de Spearman s sıra korelasyonu gibi parametrik korelasyondur. Kendall sıralı korelasyon katsayısı iki değişkenin istatistiksel olarak birbirine bağımlı olup olmadığını test etmek için de kullanılabilir. Spearmanın hesaplanmasında olduğu gibi öncelikle sürekli değişken değerlerine sıra numarası verilmesini ya da sıralı verilere sahip olunmasını gerektirir. Daha sonra her bir çift değerin hem A değişkeninde hem de B değişkeninde artıp azalmasına göre concordance ve discordance sayıları hesaplamayı gerektirir. Yrd. Doç. Dr. Sedat ŞEN 46

concordant (uyumlu) eğer (x i > x j ve y i > y j ) veya (x i < x j ve y i < y j ) Bu şartlara uyan her bir çift için +1 discordant (uyumsuz) eğer (x i > x j ve y i < y j ) veya (x i < x j ve y i > y j ) bu şartları sağlayan her bir çift için -1 yazılır. İkisine de uymayan durum x i = x j veya y i = y j. Yrd. Doç. Dr. Sedat ŞEN 47

Öğrenci Not IQ Ahmet 1 1 Ayşe 2 4 Mehmet 5 2 Fatma 3 3 Mustafa 4 5 Yukarıda beş öğrencinin notlarına ve IQ puanlarına göre kaçıncı oldukları verilmiştir. Bu durumda notlarının ve IQ puanlarının ne olduğunu bilmemize gerek yoktur. Eğer notları ve IQ puanları var ise biz sıralama değerleri verebiliriz. Daha sonra her bir öğrenci çiftini (Ahmet-Ayşe, Ahmet-Mehmet, Ahmet-Fatma, Ahmet- Mustafa,..Fatma-Mustafa) hem Not hem de IQ puanındaki sıralamalar açısından karşılaştırırız. Anlatımda kolaylık olması açısından bir sonraki slaytta öğrenci isimlerini harflerle sembolleştirdik. Yrd. Doç. Dr. Sedat ŞEN 48

Öğrenci Not IQ Ahmet a 1 1 Ayşe b 2 4 Fatma c 3 3 Mustafa d 4 5 Mehmet e 5 2 Yrd. Doç. Dr. Sedat ŞEN 49

(a,b) çifti hem NOT hem IQ için a<b olduğu için +1 (a,c) çifti hem NOT hem IQ için a<c olduğu için +1 (a,d) çifti hem NOT hem IQ için a<d olduğu için +1 (a,e) çifti hem NOT hem IQ için a<e olduğu için +1 (b,c) çifti hem NOT hem IQ için b<c olmadığı için -1 (b,d) çifti hem NOT hem IQ için b<d olduğu için +1 (b,e) çifti hem NOT hem IQ için b<e olmadığı için -1 (c,d) çifti hem NOT hem IQ için c<d olduğu için +1 (c,e) çifti hem NOT hem IQ için b<d olmadığı için -1 (d,e) çifti hem NOT hem IQ için d<e olmadığı için -1 Tüm değerleri topladığımızda 6-4=2 olur. Tüm kombinasyonların sayısı da Nx(N-1)/2 den 10 bulunur. Kendall s tau değeri = 2/((1/2)x(5x4))=0.2 bulunur. Yrd. Doç. Dr. Sedat ŞEN 50

SPSS te Kendall tau değeri hesaplamak için yanda sıralı şekilde verilmiş ders notu ve IQ puanı değişkenleri kullanılmıştır. Yrd. Doç. Dr. Sedat ŞEN 51

SPSS te Pearson korelasyon katsayısının hesaplandığı yer olan bivariate (ikili) korelasyon menüsü seçilebilir. Yrd. Doç. Dr. Sedat ŞEN 52

Elde edilen Kendall s tau değeri ve test istatistiği aşağıdaki tabloda görülebilir. Yrd. Doç. Dr. Sedat ŞEN 53

Çift Serili (Biserial) ve Nokta Çift Serili (point biserial) Korelasyonları iki değişkenden birinin sürekli diğerinin de iki kategorili (dichotomous) olduğu durumlarda kullanılır. Çift-serili ve nokta çift-serili korelasyon arasındaki fark iki kategorili değişkenin aslının gerçekten iki kategorili olup olmamasına bağlıdır. Örneğin ölü ya da yaşıyor olmak, kız ya da erkek olmak kendiliğinden iki kategorilidir ama kaldı ya da geçti demek için sürekli dağılıma sahip not değerleri kullanılır. Nokta çift-serili korelasyon değeri süreksiz değişkenlerin (kız-erkek) olduğu durumlarda çiftserili korelasyon ise sürekli değişkenin iki kategoriye indirildiği durumlarda (kaldı-geçti) kullanılır. Yrd. Doç. Dr. Sedat ŞEN 54

Yan taraftaki veride bir sürekli değişken (zaman) ve bir süreksiz iki kategorili değişken (cinsiyet) olduğu için nokta çift serili korelasyon hesaplaması yapacağız. Bu işlemi SPSS te Pearson korelasyonu yaptığımız yerden yapabiliriz. Yrd. Doç. Dr. Sedat ŞEN 55

Yrd. Doç. Dr. Sedat ŞEN 56

Kadın=0, Erkek=1 kodlandığında Yrd. Doç. Dr. Sedat ŞEN 57

Kadın=1, Erkek=0 kodlandığında Yrd. Doç. Dr. Sedat ŞEN 58

Burada kadına 1 erkeğe 0 dediğimizde korelasyon değeri -0.378 çıkarken; kadına 0 erkeğe 1 değeri verdiğimizde korelasyom katsayısı 0.378 çıkmaktadır. Burada cinsiyet ile zaman arasındaki ilişkinin büyüklüğü 0.378 çıkmıştır deyip yönü göz ardı edebiliriz. İlişkiyi yorumlarken R-kare değeri hesaplayıp (0.378*0.378=0.142) cinsiyet değişkeni zaman içerisindeki değişimin %14 ünü açıklamaktadır diyebiliriz. Yrd. Doç. Dr. Sedat ŞEN 59

Yandaki formül ve normal dağılım tablosundan elde edilen p, q, ve y değerleri kullanılarak Nokta Çift Serili Korelasyondan Çift Serili Korelasyon Elde Edilebilir. Yrd. Doç. Dr. Sedat ŞEN 60

P,q ve y değerlerini normal dağılım tablosundan bulabilmek için cinsiyet değişkeninin frekans değerlerini bilmek gerekmektedir. Kadın = %53.33, Erkek=%46.7 olduğuna göre 0.533 e denk gelen p,q ve y değerleri yandaki tablodan elde edilebilir. Yrd. Doç. Dr. Sedat ŞEN 61

Bir önceki slayttaki değerleri dönüştürme formülünde yerine koyarak aşağıdaki hesaplamalarla çift serili korelasyon değerini 0.475 olarak elde ederiz. Yrd. Doç. Dr. Sedat ŞEN 62

Pearson korelasyon her iki değişkeninde sürekli olduğu durumlarda Spearman s korelasyon değişkenlerin sıralı olduğu durumlarda Kendall s korelasyon değişkenlerin sıralı olduğu durumlarda (küçük örneklemlerde daha uygun) Nokta çift serili korelasyon bir sürekli değişken ile gerçek iki kategorili bir değişken arasında Çift serili korelasyon bir sürekli değişken ile sonradan iki kategoriye indirilmiş iki kategorili bir değişken arasında Yrd. Doç. Dr. Sedat ŞEN 63

Korelasyon neden-sonuç ilişkisini işaret etmez Yrd. Doç. Dr. Sedat ŞEN 64