Korelasyon ve Regresyon

Benzer belgeler
Korelasyon ve Regresyon

Korelasyon, Korelasyon Türleri ve Regresyon

Regresyon. Regresyon korelasyon ile yakından ilişkilidir

Korelasyon. Korelasyon. Merkezi eğilim ve değişim ölçüleri bir defada sadece bir değişkenin özelliklerini incelememize imkan tanır.

Korelasyon ve Regresyon

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

Kazanımlar. Z puanları yerine T istatistiğini ne. zaman kullanacağını bilmek. t istatistiği ile hipotez test etmek

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

1

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

İSTATİSTİK-II. Korelasyon ve Regresyon

7.Sunum. Yrd. Doç. Dr. Sedat ŞEN 1

İstatistik ve Olasılık

19. BÖLÜM BİRBİRİYLE İLİŞKİLİ OLAN İKİ DEĞİŞKENDEN BİRİSİNDEKİ DEĞİŞİME GÖRE DİĞERİNİN ALACAĞI DEĞERİ YORDAMA (KESTİRME) UYGULAMA-I

CHAPTER 6 SIMPLE LINEAR REGRESSION

KORELASYON. 7.Sunum. Yrd. Doç. Dr. Sedat ŞEN

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

MAK 210 SAYISAL ANALİZ

Örneklem Dağılımları & Hipotez Testleri Örneklem Dağılımı

Appendix B: Olasılık ve Dağılım Teorisi

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

İki İlişkili Örneklem için t-testi. Tekrarlı ölçümler için t hipotez testine uygun araştırma çalışmalarının yapısını anlamak.

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

SANAYİ İŞÇİLERİNİN DİNİ YÖNELİMLERİ VE ÇALIŞMA TUTUMLARI ARASINDAKİ İLİŞKİ - ÇORUM ÖRNEĞİ

İÇİNDEKİLER. Birinci Bölüm UYGULAMA VERİLERİ

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

Parametrik Olmayan Testler. İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi

BÖLÜM 3 KURAMSAL ÇATI VE HİPOTEZ GELİŞ

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

ortalama ve ˆ ˆ, j 0,1,..., k

Merkezi Eğilim ve Dağılım Ölçüleri

PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz.

Pazarlama Araştırması Grup Projeleri

Korelasyon testleri. Pearson korelasyon testi Spearman korelasyon testi. Regresyon analizi. Basit doğrusal regresyon Çoklu doğrusal regresyon

ÖNGÖRÜ TEKNĐKLERĐ ÖDEV 5 (KEY)

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1

YILLARI ARASINDA GÜNEY CAROLINA DA OKUL İÇİ ŞİDDET İSTATİSKLERİ ANALİZİ (Bir Önceki Projeden Devam Edilecektir)

BİYOİSTATİSTİK PARAMETRİK TESTLER

EME 3117 SİSTEM SIMÜLASYONU. Girdi Analizi. Özet İstatistikler ve Histogram (Minitab)(1) Örnek: Eczane İçin Servis Süreleri

Test İstatistikleri AHMET SALİH ŞİMŞEK

KORELASYON VE TEKLİ REGRESYON ANALİZİ-EN KÜÇÜK KARELER YÖNTEMİ

Hipotez. Hipotez Testleri. Y. Doç. Dr. İbrahim Turan Nisan 2011

MATE 211 BİYOİSTATİSTİK DÖNEM SONU SINAVI

BÖLÜM 13 HİPOTEZ TESTİ

BİYOİSTATİSTİK. Uygulama 6. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

DAĞILMA YADA DEĞİ KENLİK ÖLÇÜLERİ (MEASURE OF DISPERSION) Prof.Dr.A.KARACABEY Doç.Dr.F.GÖKGÖZ

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları III (3 Mayıs 2012)

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER. Abdullah Can

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

Değişken Türleri, Tanımlayıcı İstatistikler ve Normal Dağılım. Dr. Deniz Özel Erkan

İÇİNDEKİLER ÖN SÖZ...

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

Kalitatif Veri. 1. Kalitatif random değişkenler sınıflanabilen yanıtlar vermektedir. Örnek: cinsiyet (Erkek, Kız)

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1


TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

ANADOLU ÜNİVERSİTESİ REGRESYON KATSAYILARININ GÜVEN ARALIĞI = + REGRESYON KATSAYILARININ GÜVEN ARALIĞI

Copyright 2004 Pearson Education, Inc. Slide 1


Olasılık ve Normal Dağılım

Nedensel Modeller Y X X X

ÇOKLU REGRESYON MODELİ. Bir bağımlı değişkene etki eden çok sayıda bağımsız değişkeni analize dahil ederek çoklu regresyon modeli uygulanabilir.

TANIMLAYICI İSTATİSTİKLER

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

M d a d dd e A l na i li i z

OLS Klasik Varsayımlar. Çoklu Regresyon. Çoklu Regresyon Modellemesi. Çoklu Regresyon Modeli. Multiple Regression

LOJİSTİK REGRESYON ANALİZİ

BİLİMSEL ARAŞTIRMA YÖNTEMLERİ. Bazı Temel Kavramlar

Bölüm 3. Tanımlayıcı İstatistikler

İÇİNDEKİLER. Önsöz... iii İçindekiler... v

İLERİ ARAŞTIRMA SORU HAVUZU

BİYOİSTATİSTİK Uygulama 7 Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

GİRİŞ. Bilimsel Araştırma: Bilimsel bilgi elde etme süreci olarak tanımlanabilir.

İSTATİSTİK MHN3120 Malzeme Mühendisliği

ÖRNEK BULGULAR. Tablo 1: Tanımlayıcı özelliklerin dağılımı

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları II (19 Nisan 2012)

Tek yönlü varyans analizi kısaltılmış olarak ANOVA (Analysis of Variance) bilinen

Kategorik Veri Analizi

Öğr. Elemanı: Dr. Mustafa Cumhur AKBULUT

ise, genel bir eğilim (trend) gösteriyorsa bu seriye uygun doğru ya da eğriyi bulmaya çalışırız. Trend orta-uzun dönemde her iniş, çokışı

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

BÖLÜM 12 STUDENT T DAĞILIMI

İLERİ BİYOİSTATİSTİK KURSU

İÇİNDEKİLER 1. GİRİŞ...

2. BASİT DOĞRUSAL REGRESYON 12

Transkript:

Korelasyon ve Regresyon Kazanımlar 1 2 3 4 5 6 Değişkenlerin ilişkisini açıklamak ve hesaplamak için Pearson korelasyon katsayısı Örneklem r ile evren korelasyonu hakkında hipotez testi yapmak Spearman korelasyonunu açıklamak ve hesaplamak point biserial ve phi katsayısını hesaplamak Y değerlerini yordayan lineer regresyon eşitliğini açıklamak ve hesaplamak Regresyon eşitliğinin anlamlılığını değerlendirmek 1

Korelasyon ve regresyona giriş İki değişken arasındaki ilişkiyi ölçer ve tanımlar İlişkinin özelliklerini Yön (negatif veya pozitif) Şekil (genellikle lineer) güç Korelasyon verisi Saçılım grafiği 2

Pozitif ve negatif ilişkiye örnekler Lineer ilişkinin değişik değerlerine örnekler 3

Pearson korelasyonu İki değişken arasındaki doğrusal ilişkinin yönünü ve derecesini ölçer. Mükemmel doğrusal ilişkide r X teki her bir değişime karşılık Y de bir değişim mevcuttur. Korelasyon 1.00 veya +1.00 olur X ve Y nin ortak değeğişi X ve Y nin ayrı ayrı değeğişkenkleri Çarpımlar Toplamı (ÇT) İki değişken arasındaki ortak değişimin miktarını ölçer. ÇT ( X X )( Y Y ) 4

ÇT Hesaplama Formülü Hesaplama formülü daha kolay işlemlerle aynı sonucu verir ÇT XY X Y n Pearson korelasyon katsayısının hesabı ÇT, çarpımlar toplamı: X ve Y nin ortak değişimi r KT ÇT X KT Y 5

Figure 15.4 Example 15.3 Scatterplot Pearson korelasyonu ve z-puanları Pearson korelasyon formulü z puanlarıyla ilişkili olarak ifade edilebilir ilişkili olarak ifade edilebilir. z X z Örneklem : r n 1 z X zy Evren : r n 1 Y 6

Soru A scatterplot shows a set of data points that are clustered loosely around a line that slopes down to the right. Which of the following values would be closest to the korelasyon for these data? A B C D 0.75 0.35 0.75 0.35 Cevap A scatterplot shows a set of data points that are clustered loosely around a line that slopes down to the right. Which of the following values would be closest to the korelasyon for these data? A B C D 0.75 0.35 0.75 0.35 7

Doğru Yanlış Aşağıdaki ifadelerin doğru mu yanlış mı olduklarına karar veriniz. i D/Y D/Y n = 10 çift X ve Y puanlarının ΣX = ΣY = ΣXY = 20. buna göre, SP = 20 Eğer Y değişkeninin değerleri azalırken X değişkenine ait değerleder azalıyorsa aralarındaki korelasyon is negatiftir Cevap Doğru SP (20)(20) 20 20 40 20 10 Yanlış Değişim ğ ş aynı yöndedir, korelasyon pozitiftir 8

Pearson korelasyonunun yorumu ve kullanımı korelasyon yordama amacıyla kullanılır Geçerlik Güvenirlik Teori doğrulama Örnek 9

Korelasyonun Yorumlanması korelasyon nedensellik göstermez Korelasyonun değeri eldeki verilerin ranjından etkilenir Uç değerler outliers korelasyonu etkiler Korelasyonun karesi ortak değişimi gösterir Sınırlı ranj ve korelasyon 10

Uç noktaların korelasyona etkisi katsayı Detarminasyon katsayısı, bir değişkendeki değişimin diğer değişken ile açıklanan oranının ölçüsünü verir. Coefficient of Determination 2 r 11

Doğrusal ilişkinin derecesi Pearson korelasyonu ile Hipotez testi Pearson korelasyonu genellikle örneklem verisi için hesaplanır, ancak evrendeki ilişkileri test etmek için kullanılır. Evrendeki korelasyon rho (ρ) Yunan harfi ile ifade edilir Yönsüz: H 0 : ρ = 0 and H 1 : ρ 0 Yönlü: H 0 : ρ 0 and H 1 : ρ > 0 12

Örneklem korelasyonu ve Evren Korelasyon ile Hipotez Testi Örneklem korelasyonu evren ρ yu test için kullanılır kll l Serbestlik derecesi (df) = n 2 Hipotez testi t veya F kullanılarak hesaplanır. Kritik değerler hesaplanır ± Kritik Değerlerinin ötesindeki örneklem korelasyonları pek olası değildir (very unlikely) ± Kritik Değerlerinin ötesindeki örneklem korelasyonları yokluk hipotezinin reddi ile sonuçlanır. 13

Kısmi korelasyon Kısmi korelasyon, üçüncü bir değişkenin etkisini sabit tutarak iki değişken arasındaki ilişkinin ölçüsünü verir. r xy z r xy (1 r 2 xz ( rxy r yz )(1 ) r 2 yz ) Üçüncü değişkenin etkisini sabit tutmak 14

Pearson korelasyonuna Alternatif Pearson korelasyonu lineer ilişkiler Eşit aralık ve oranlı ölçekler için hesaplanır Diğer korelasyon katsayıları non-lineer veriler Diğer ölçek türleri için hesaplanır Spearman korelasyon Pearson korelasyon formula is used with data from an ordinal scale (ranks) Used when both variables are measured on an ordinal scale Used when relationship is consistently directional but may not be linear 15

Nonlineer pozitif ilişki Puanlarını ve sıralarını gösteren saçılım grafiği 16

Sıralama puanları Spearman korelasyonu Sıra atamak için kullanılan metod Puanlar en küçükten en büyüğe listelenir Listedeki her konumua bir sıra numarası verilir Eğer iki veya daha fazla puan aynı sırada ise, onların sıralarının ortalaması hesaplanır ve bu ortalama değer her birine sıra numarası olarak verilir. Spearman korelasyon formülü Puanların sıraları tamsayılardır Use D as the difference between the X rank and the Y rank for each individual to compute the r s statistic r s 6 1 2 n( n D 2 1) 17

Nokta-Çiftserili korelasyon İki değişken arasındaki ilişkinin ölçüsüdür Değişkenlerden biri sadece iki değer alabilir (ikili değişken) İlişkisiz örneklem t-testindeki aynı durum söz konusudur Nokta çift serili r 2 t istatistiğindeki hesaplanan r 2 ile aynıdır t-istatistiği anlamlılığı değerlendirir r istatistiği onun gücünü ölçer Phi katsayısı Her iki değişkende (X ve Y) iki kategorilidir Her iki değişkende 0 ve 1 diye kodlanır Hesabında Pearson formülü kullanılır 18

Soru Bir çalışmada katılımcılar sabahçılar veya akşamcılar olarak sınıflandırılırlar ve daha sonra 50 puanlık vicdan sahibi olma ölçeğiyle 50 puan üzerinden puanlanırlar. Bu iki değişken arasındaki ilişkiyi ölçmek için hangi korelasyon katsayısı kullanılmalıdır? Pearson korelasyon A B Spearman korelasyon C D Nokta çiftserili korelasyon Phi katsayısı Cevap Participants were classified as morning people or evening people then measured on a 50-point conscientiousness scale. Which korelasyon should be used to measure the relationship? Pearson korelasyon A B Spearman korelasyon C D Nokta çiftserili korelasyon Phi katsayı 19

Soru Aşağıdaki ifadelerin doğru veya yanlış olduklarını belirtiniz. i D/y Spearman korelasyonu dichotomous (ikili) verilerde kullanılır D/Y Korelasyonun anlamlılığını test ederken, yokluk hipotesi korelasyonun sıfır olduğunu belirtir. Cevap Yanlış Spearman korelasyonu sıralı verilerde hesaplanır Doğru 20

Lineer regresyon Pearson korelasyonu iki değişken arasındaki doğrusal ilişkiyi ölçer Verilerden geçen doğru İlişkiyi görmeyi kolaylaştırır İlişkiideki merkezi eğilimi gösterir Yordama amacıyla kullanılabilir Figure 15.13 regresyon doğrusu 21

Lineer eşitlikler Bir doğruyu gösteren genel eşitlik Eşitlik: Y = bx + a X vey değişkenlerdir a ve b sabit değerlerdir lineer eşitliğin grafiği 22

Regresyon Regresyon bir veri setinden geçen en iyi uyum doğrusunu bulma yöntemidir. Bu doğruya regresyon doğrusu denir. Ŷ regresyon eşitliğindeki her bir X değeri için Y nin yordanan değeridir (Y- Ŷ) ) her bir veri noktasının regresyon doğrusundan uzaklığıdır: yordama hatası regresyon hataların karelerinin toplamını minimum yapar Veri noktası ile yordanan nokta arasındaki mesafe 23

regresyon eşitlikleri regresyon doğrusu: Ŷ = bx + a Doğrunun eğimi, b, aşağıdaki gibi hesaplanır b X,Y ÇT KT X veya r s s Y X a Y bx Figure 15.16 X ve Y noktaları ve regresyon doğrusu 24

korelasyon ve standard hata Y puanlarındaki yordanan değişkenlik: KT =r regresyon 2 KT Y Y puanlarındaki yordanmayan değişkenlik: KT residual = (1 - r 2 ) KT Y 25

Kestirimin Standard Hatası regresyon eşitliği bir yordamada bulunur Kestirimin doğruluğu (presicion) kestirimin standard hatası ile belirlenir KT df residual ( Y Yˆ) n 2 2 Testing significance of regresyon Analysis of regresyon Similar to Analysis of Variance Uses an F-ratio of two Mean Square values Each MS is a SS divided by its df 26

Ortalamaların kareleri (OK) ve F- oranı OK regression KT regression df regression OK residual KT df residual residual F OK OK regression residual Regresyon analizinde KT ve df in bölüşümü 27

Figure 15.19 Plot of data in Demonstration 15.1 Learning Check A linear regresyon has b = 3 and a = 4. What is the predicted d Y for X = 7? A B C D 14 25 31 Cannot be determined 28

Learning Check - Answer A linear regresyon has b = 3 and a = 4. What is the predicted d Y for X = 7? A B C D 14 25 31 Cannot be determined Learning Check Decide if each of the following statements is True or False. T/F T/F It is possible for the regresyon equation to have none of the actual data points on the regresyon line. If r = 0.58, the linear regresyon equation predicts about one third of the variance in the Y scores. 29

Answer True The line is an estimator. True When r =.58, r 2 =.336 30