İSTATİSTİK-II. Korelasyon ve Regresyon

Benzer belgeler
İSTATİSTİK-II. Korelasyon ve Regresyon

Korelasyon ve Regresyon

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

Korelasyon, Korelasyon Türleri ve Regresyon

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

Korelasyon ve Regresyon

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

İçindekiler. Ön Söz... xiii

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

İÇİNDEKİLER ÖN SÖZ...

Appendix B: Olasılık ve Dağılım Teorisi

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

İstatistik ve Olasılık

Ekonometri I VARSAYIMLARI

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

Yatırım Analizi ve Portföy Yönetimi 6. Hafta

Korelasyon ve Regresyon

Korelasyon ve Regresyon

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

Regresyon. Regresyon korelasyon ile yakından ilişkilidir

ortalama ve ˆ ˆ, j 0,1,..., k

VERİ KÜMELERİNİ BETİMLEME

İSTATİSTİK MHN3120 Malzeme Mühendisliği

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

SIRADAN EN KÜÇÜK KARELER (OLS)

İstatistik ve Olasılık

İSTATİSTİKSEL VERİ ANALİZİ

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

EME 3117 SİSTEM SIMÜLASYONU. Girdi Analizi. Özet İstatistikler ve Histogram (Minitab)(1) Örnek: Eczane İçin Servis Süreleri

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

İSTATİSTİK II. Hipotez Testleri 1

BİYOİSTATİSTİK. Uygulama 6. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

6.6. Korelasyon Analizi. : Kitle korelasyon katsayısı

LOJİSTİK REGRESYON ANALİZİ

İstatistik ve Olasılık

UYGULAMALAR. Normal Dağılımlılık

Nedensel Modeller Y X X X

BASİT REGRESYON MODELİ

MAK 210 SAYISAL ANALİZ

ANADOLU ÜNİVERSİTESİ REGRESYON KATSAYILARININ GÜVEN ARALIĞI = + REGRESYON KATSAYILARININ GÜVEN ARALIĞI

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları II (19 Nisan 2012)

Öğr. Elemanı: Dr. Mustafa Cumhur AKBULUT

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

ÜSTEL DÜZLEŞTİRME YÖNTEMİ

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

4. TAHMİN SONUÇLARININ DEĞERLENDİRİLMESİ Katsayıların Yorumu

OLS Yönteminin Asimptotik (Büyük Örneklem) Özellikleri SIRADAN EN KÜÇÜK KARELER (OLS) Asimptotik Özellikler: Tutarlılık. Asimptotik Özellikler

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

KORELASYON VE TEKLİ REGRESYON ANALİZİ-EN KÜÇÜK KARELER YÖNTEMİ

ISTATISTIK VE OLASILIK SINAVI EKİM 2016 WEB SORULARI

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

MATH Ýþletme Ýstatistiði II

Mühendislikte İstatistiksel Yöntemler

istatistik El 10 1_ ve 2_ sorular a Ş3 gldakl bilgilere göre Al 4 Bl 6 cı 7 Dl 8 Al 5 B) 12 CL 27 D) 28 E) 35 2Q 10 BS 4200-A

YATIRIM. Ders 7: CAPM ve APT. Bölüm 2: Uygulamalar ve Sınamalar

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

ARALIK TAHMİNİ (INTERVAL ESTIMATION):

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

İLERİ ARAŞTIRMA SORU HAVUZU

BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

OLASILIK ve KURAMSAL DAĞILIMLAR

TANIMLAYICI İSTATİSTİKLER

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

Ch. 5: SEKK (OLS) nin Asimptotik Özellikleri

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

BİYOİSTATİSTİK Uygulama 7 Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

AKT201 Matematiksel İstatistik I Yrd. Doç. Dr. Könül Bayramoğlu Kavlak

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

9. ARDIŞIK BAĞIMLILIK SORUNU (AUTOCORRELATION) 9.1. Ardışık Bağımlılık Sorunu Nedir?

ÇOKLU REGRESYON MODELİ. Bir bağımlı değişkene etki eden çok sayıda bağımsız değişkeni analize dahil ederek çoklu regresyon modeli uygulanabilir.

T TESTİ: ORTALAMALAR ARASI FARKLARIN TEST EDİLMESİ. Yrd. Doç. Dr. C. Deha DOĞAN

Öğrenim Kazanımları Bu programı başarı ile tamamlayan öğrenci;


İLERİ BİYOİSTATİSTİK KURSU

Veriye Dayalı Karar Verme (Bölüm 2) Can Akkan

Bir Normal Dağılım Ortalaması İçin Testler

Risk ve Getiri : Portföy Teorisi ve Varlık Fiyatlandırma Modelleri

MATE 211 BİYOİSTATİSTİK DÖNEM SONU SINAVI

DOĞRUSAL ve DOĞRUSAL OLMAYAN SINIRLAMALAR DOĞRUSAL OLMAYAN SINIRLAMALARIN TESTİ

REGRESYON ANALĐZĐ. 1

Ch. 12: Zaman Serisi Regresyonlarında Ardışık Bağıntı (Serial Correlation) ve Değişen Varyans

İÇİNDEKİLER. Ön Söz Saymanın Temel Kuralları Permütasyon (Sıralama) Kombinasyon (Gruplama) Binom Açılımı...


PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz.

Kantitatif Tahmin Yöntemleri. Yrd.Doç.Dr. S.Kerem AYTULUN

Matris Cebiriyle Çoklu Regresyon Modeli

10. Bir ana kütle oranının tahmininde α = 0,05 ise kullanılan Z değeri nedir? A) 1,64 B) 1,84 C) 1,96 D) 2,28 E) 3,08

taşinmaz DEĞERLEME- DE İSTATİKSEL ANALİZ

TOBB Ekonomi ve Teknoloji Üniversitesi İKT351 Ekonometri I, Ara Sınavı

Copyright 2004 Pearson Education, Inc. Slide 1

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

Mühendislikte İstatistik Yöntemler

Transkript:

İSTATİSTİK-II Korelasyon ve Regresyon 1

Korelasyon ve Regresyon Genel Bakış Korelasyon Regresyon Belirleme katsayısı Varyans analizi Kestirimler için aralık tahminlemesi 2

Genel Bakış İkili veriler aralarında bir ilişki var mıdır? varsa bu ilişki bir eşitlik ile temsil edilebilir mi? bu eşitliğin kestirimler (öngörümler) için kullanılması 3

Korelasyon 4

Tanım Korelasyon bir değişkenin değeri değişirken diğer bir değişken bununla doğrusal ilişkili olarak değişiyorsa korelasyon vardır denebilir. 5

Varsayımlar 1. (x,y) ikili verilerden oluşan örnek bir şans örneğidir. 2. x ve y lerin dağılışı normaldir. 6

Tanım Saçılma diyagramı yatay eksen x, dikey eksen y olmak üzere, (x,y) ikili örnek verilerinin işaretlendiği bir grafiktir. Her bir (x,y) ikilisi tek bir noktadır. 7

Örnek Bir firma bünyesindeki satış personeli sayısı ile satış gelirleri arasındaki ilişkiyi bilmek istemektedir. Yıllar Satış Personeli Sayısı (x) Satış Gelirleri (yüz bin $) (y) 1999 15 1,35 2000 18 1,63 2001 24 2,33 2002 22 2,41 2003 25 2,63 2004 29 2,93 2005 30 3,41 2006 32 3,26 2007 35 3,63 2008 38 4,15 8

İkili Verilerin Saçılma Diyagramı 4,5 Scatterplot of satış geliri vs personel sayısı 4,0 3,5 satış geliri 3,0 2,5 2,0 1,5 1,0 15 20 25 30 personel sayısı 35 40 9

Pozitif Korelasyon y y y (a) Pozitif x (b) Güçlü pozitif x (c) Mükemmel pozitif x 10

Negatif Korelasyon y y y (d) Negatif x (e) Güçlü negatif x (f) Mükemmel negatif x 11

y y x (g) Korelasyon yok (h) Doğrusal olmayan güçlü ilişki x 12

Tanım Korelasyon Katsayısı r Bir örnekteki x ve y ikili değerleri arasındaki doğrusal ilişkinin gücünü ölçmektedir. r = n xy - ( x)( y) n( x 2 ) - ( x) 2 n( y 2 ) - ( y) 2 13

Korelasyon Katsayısı r nin Özellikleri 1. -1 r 1 2. Mükemmel pozitif doğrusal ilişki olduğunda r = 1 olur. 3. Mükemmel negatif doğrusal ilişki olduğunda r = -1 olur. 4. Doğrusal ilişki yok ise r = 0 olur. 14

Korelasyon ile ilgili hatalar 1. Nedensellik: Korelasyon değişkenler arasındaki sebep sonuç ilişkilerini açıklamaz. 2. Doğrusallık: x ile y arasında anlamlı bir korelasyon olmadığı halde, aralarında farklı şekilde bir ilişki olabilir. (Bakınız izleyen slayt) 15

y Korelasyon ile ilgili hatalar 250 200 150 100 50 0 0 1 2 3 4 5 6 7 8 x 16

Örnek Verileri İçin Korelasyon Yıllar Satış Personeli Sayısı (X) Hesaplamaları Satış Gelirleri (yüz bin $) (Y) X 2 Y 2 XY 1999 15 1,35 225 1,8225 20,25 2000 18 1,63 324 2,6569 29,34 2001 24 2,33 576 5,4289 55,92 2002 22 2,41 484 5,8081 53,02 2003 25 2,63 625 6,9169 65,75 2004 29 2,93 841 8,5849 84,97 2005 30 3,41 900 11,6281 102,3 2006 32 3,26 1024 10,6276 104,32 2007 35 3,63 1225 13,1769 127,05 2008 38 4,15 1444 17,2225 157,7 Toplamlar 268 27,73 7668 83,8733 800,62 17

Örnek Verileri İçin Korelasyon Hesaplamaları r = n XY - ( X)( Y) n( X 2 ) - ( X) 2 n( Y 2 ) - ( Y) 2 r = (10)(800,62) - (268)(27,73) (10)(7668) - (268) 2 (10)(83,8733) - (27,73) 2 r = 0,987 Güçlü pozitif korelasyon 18

Anakütle Korelasyon Katsayısının Testi = Anakütle korelasyon katsayısı H 0 : = (anlamlı bir korelasyon yoktur) H 1 : (anlamlı bir korelasyon vardır) 19

Test İstatistiği t Test istatistiği: t = r 1 - r 2 n - 2 Kritik değerler serbestlik derecesi = n - 2 olan tablo değerleri dikkate alınarak karar verilir. 20

Ret Bölgeleri 21

Anakütle Korelasyon Katsayısının Testi = Anakütle korelasyon katsayısı H 0 : = (satış personeli sayısı ile satış gelirleri arasında anlamlı bir korelasyon yoktur) H 1 : (satış personeli sayısı ile satış gelirleri arasında anlamlı bir korelasyon vardır) 22

Test istatistiği: Test İstatistiği t t = r 1 - r 2 n - 2 0,987 = = 17,39 1 0,987 2 10-2 Kritik değer serbestlik derecesi = n - 2 = 10 2 = 8, a = 0,05 için t 0,025, 8 = 2,31 < 17,39 Karar: H 0 ret. Korelasyon anlamlıdır. 23

Regresyon X bağımsız değişken (açıklayıcı değişken) Y bağımlı değişken (cevap = yanıt değişkeni) Y = 0 + 1 X + e Basit doğrusal regresyon modeli 1 = eğim 0 = kesen 24

Regresyon Regresyon Eşitliği Verilen bir ikili veriler topluluğu için regresyon eşitliği, Y = b 0 + b 1 X iki değişken arasındaki ilişkiyi tanımlamaktadır. b 1 = eğim Regresyon Doğrusu b 0 = kesen Regresyon eşitliğinin grafiğidir. 25

Regresyon Doğrusu 4,5 Scatterplot of satış geliri vs personel sayısı 4,0 3,5 satış geliri 3,0 2,5 2,0 1,5 1,0 15 20 25 30 personel sayısı 35 40 26

Notasyon Anakütle Parametresi Örnek istatistiği Regresyon eşitliğinde kesen 0 b 0 Regresyon eşitliğinin eğimi 1 b 1 Regresyon modeli ve eşitliği Y = 0 + 1 X + e Y = b 0 + b 1 X 27

Artıklar ve En Küçük Kareler Yöntemi Artıklar e = (Y- Y) En Küçük Kareler Yöntemi e 2 yi minimum yapan b 0 ve b 1 değerlerinin bulunmasıdır. Yi nb0 b 1 X i Normal Eşitlikler 2 X iyi b0 X i b1 X i 28

0 and 1 için En Küçük Kareler Tahminleyicileri X Y XY (1) n 2 2 (2) X iyi b0 X i b1 X i X i 2 X i i i i i i i b0 X i b1 n n b1 2 X X n Y i 29

Önce b 1 bulunursa, ardından b 0 = Y- b 1 X 30

Satış geliri için regresyon b 1 = b 1 = eşitliğinin tahminlenmesi n( xy) - ( x) ( y) n( x 2 ) - ( x) 2 10(8,62) - (268) (27,73) 10(7668) - (268) 2 b 1 = 0,118 b 0 = y - b 1 x = 2,773 (0,118)(26,8) = 0,398 31

Kestirimler (Öngörümler) Verilen bir x değeri için y nin değeri ne olur?.. Eğer anlamlı bir korelasyon varsa, en iyi öngörülen y değeri, x değerinin regresyon eşitliğinde yerine konulmasıyla bulunur. Önemli Not: Regresyon doğrusu yalnızca tahminlemede kullanılan x uzayı içinde geçerlidir. Mevcut x lerden uzak bir noktada öngörümleme yapılmamalıdır. 32

30 satış personeli çalıştığında satış gelirinin kestirilmiş değeri nedir? ^ y = - 0.398 + 0.118 (30) ^ y = 3.1516, 315160 $ 33

Toplam Değişkenlik, Açıklanan Değişkenlik ve Açıklanamayan Değişkenlik 20 19 18 17 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 y Toplam değişkenlik (y - y) y ^ = 3 + 2x (5, 19) (5, 13) (5, 9) 0 1 2 3 4 5 6 7 8 9 y = 9 Açıklanamayan değişkenlik ^ (y - y) Açıklanan değişkenlik ^ (y - y) x 34

(toplam değişkenlik) = (açıklanan değişkenlik) + (açıklanamayan değişkenlik) (Y - Y)= (Y -Y) + (Y - Y) (toplam değişkenlik) = (açıklanan değişkenlik) + (açıklanamayan değişkenlik) (Y -Y) 2 = (Y -Y) 2 + (Y - Y) 2 (Genel kareler toplamı) = (regresyon kareler toplamı) + (artık kareler toplamı) 35

Tanım Belirleme Katsayısı y deki değişkenliğin ne kadarının regresyon doğrusu tarafından açıklanabildiğini söyler. r 2 = Regresyon kareler toplamı Genel kareler toplamı r 2 = (Y -Y) 2 = (Y -Y) 2 RKT GKT 36

r 2 = (Y -Y) 2 (Y - Y) 2 = b 12 X 2 ( X) 2 /n) Y 2 ( Y) 2 /n 0,118 2 7668 (268) 2 /10) r 2 = = %97,4 83,873 (27,73) 2 /10 y deki değişmelerin %97,4 ü regresyon doğrusu ile açıklanabilmektedir. 37

Hata Varyansının Tahmini s 2 = (y - y)2 = Artık Kareler n - 2 ^ Ortalaması Tahminin Standart Hatası s = (y - y) 2 n - 2 ^ 38

Anakütle Regresyon Katsayısılarının Testi 1 = Anakütle regresyon katsayısı (X 1 için) H 0 : 1 = ( 1 anlamsızdır) H 1 : 1 ( 1 anlamlıdır) 39

Test İstatistiği t Test istatistiği: t = b 1 S b 1 S b 1 = b 1 in standart hatasıdır. S b 1= S ( x 2 ( x) 2 /n) 40

Kritik değerler serbestlik derecesi = n - 2 olan tablo değerleri dikkate alınarak karar verilir. t > t a/2, n 2 ise H 0 RET. 41

Anakütle Regresyon Katsayısılarının Testi (Satış Gelirleri Örneği) 1 = Anakütle regresyon katsayısı (X 1 için) H 0 : 1 = ( 1 anlamsızdır) H 1 : 1 ( 1 anlamlıdır) 42

Test İstatistiği t Test istatistiği: t = b 1 S b 1 = 0,118 0,006804 = 17,39 S b 1 = b 1 in standart hatasıdır. S b 1= S ( X 2 ( X) 2 /n) 0,1499 = =0,006804 (7668 (268) 2 /10) 43

Kritik değerler serbestlik derecesi = n - 2 olan tablo değerleri dikkate alınarak karar verilir. a = 0,05 olsun. 17,39 > t a/2, n 2 = t 0,025, 8 = 2,306 H 0 RET. 1 anlamlıdır. Basit doğrusal regresyonda t 2 = F olmaktadır. 44

Anakütle Regresyon Katsayısılarının Testi 0 = Anakütle regresyon modelinde sabit terim H 0 : 0 = ( 0 anlamsızdır) H 1 : 0 ( 0 anlamlıdır) 45

Test İstatistiği t Test istatistiği: t = b 0 S b 0 S b 0 = b 0 in standart hatasıdır. S b 0= S X 2 n( X 2 ( X) 2 /n) 46

Kritik değerler serbestlik derecesi = n - 2 olan tablo değerleri dikkate alınarak karar verilir. t > t a/2, n 2 ise H 0 RET. 47

Anakütle Regresyon Katsayısılarının Testi (Satış Gelirleri Örneği) 0 = Anakütle regresyon modelindeki sabit terim H 0 : 0 = ( 0 anlamsızdır) H 1 : ( 0 anlamlıdır) 48

Test İstatistiği t Test istatistiği: t = b 0 S b 0 = - 0,398 0,1884 = - 2,11 S b 1= S x 2 = (0,1499) (7668) n( x 2 ( x) 2 /n) (10)(7668 (268) 2 /10) =0,1884 49

Kritik değerler serbestlik derecesi = n - 2 olan tablo değerleri dikkate alınarak karar verilir. a = 0,05 olsun. - 2,11 < t a/2, n 2 = t 0,025, 8 = 2,306 H 0 REDDEDİLEMEZ. 0 anlamsızdır. 50

E(y) Değeri İçin Kestirim Aralığı ^ y - E < E(y) < y + E ^ Burada E = t a 2,n - 2 s 1 n + n(x 0 - x) 2 n( x 2 ) - ( x) 2 x 0, x in verilen bir değeridir. Karekök içindeki ifade ile S nin çarpımı ise x 0 daki y ^ değeri için standart hatadır. Standart hata en düşük değerini x 0 = x olduğunda alır. 51

E(y) Değeri İçin Kestirim Aralığı x 0 = 30 personel için satışların beklenen değeri %95 güven ile hangi aralıkta gerçekleşir? 3.1516 - E < E(y) < 3.1516 + E E = (2,306)(0,1499) 1 + (10)(30-26,8) 2 10 (10)(7668) - (268) 2 E = (2,306)(0,01815) = 0,04186 3,1097 < E(y) < 3,1935 52