Korelasyon ve Regresyon 1
Korelasyon Analz İk değşken arasında lşk olup olmadığını belrlemek çn yapılan analze korelasyon analz denr. Korelasyon; doğrusal yada doğrusal olmayan dye kye ayrılır.
Korelasyon İk değşken arasında br lşk var mıdır? lşk doğrusal mıdır, değl mdr? (varsa) lşknn yönü nedr? lşknn gücü nedr? lşknn büyüklüğü nedr? 3
Varsayımlar 1. (X, Y) sürekl tesadüf değşkenlerdr.. X ve Y lern dağılımı normal olmalıdır. 4
Serplme Dyagramı İk değşken arasındak lşknn; olup olmadığını, bçmn (doğrusal mı değl m), yönünü ve gücünü belrlemenn en kolay yolu serplme dyagramını çzektr. 5
Örnek Br frma bünyesndek satış personel sayısı le satış gelrler arasındak lşky blmek stemektedr. Yıllar Satış Personel Sayısı (X) Satış Gelrler (yüz bn $) (Y) 1999 15 1,35 000 18 1,63 001 4,33 00,41 003 5,63 004 9,93 005 30 3,41 006 3 3,6 007 35 3,63 008 38 4,15 6
satış gelr Serplme Dyagramı 4,5 Scatterplot of satış gelr vs personel sayısı 4,0 3,5 3,0,5,0 1,5 1,0 15 0 5 30 personel sayısı 35 40 7
Poztf Korelasyon y y y (a) Poztf x (b) Güçlü poztf x (c) Tam poztf x 8
Negatf Korelasyon y y y (d) Negatf x (e) Güçlü negatf x (f) Tam negatf x 9
y y x (g) Korelasyon yok (h) Doğrusal olmayan güçlü lşk x 10
Doğrusal Korelasyon Katsayısı r Br örnektek X ve Y gb k değşken arasındak doğrusal lşknn büyüklüğünü ölçmektedr. 11
Doğrusal Korelasyon Katsayısı r nn Özellkler -1 r 1 r = 1 Tam poztf doğrusal lşk r = -1 Tam negatf doğrusal lşk r = 0 Doğrusal 1,00-0,90 Çok kuvvetl 0,70-0,89 Kuvvetl 0,50-0,69 Orta 0,30-0,49 Düşük 0,00-0,9 Zayıf 1
Korelasyon le lgl hatalar 1. Nedensellk: Korelasyon değşkenler arasındak sebep sonuç lşklern açıklamaz.. Doğrusallık: X le Y değşkenler arasında anlamlı br doğrusal korelasyon olmadığı halde, aralarında doğrusal olmayan ya da farklı br lşk olablr. 13
Örnek Verler İçn Korelasyon Yıllar Satış Personel Sayısı (X ) Hesaplamaları Satış Gelrler (yüz bn $) (Y ) 1999 15 1,35 000 18 1,63 001 4,33 00,41 003 5,63 004 9,93 005 30 3,41 006 3 3,6 007 35 3,63 008 38 4,15 Toplamlar 68 7,73 14
Örnek Verler İçn Korelasyon Hesaplamaları Yıllar Satış Personel Sayısı (X ) Satış Gelrler (yüz bn $) (X ) ( X X ) ( Y Y ) ( X X )( Y Y ) ( X X ) ( Y Y ) 1999 15 1,35-11,8-1,4 16,76 139,4,0 000 18 1,63-8,8-1,14 10,03 77,44 1,3 001 4,33 -,8-0,44 1,3 7,84 0,19 00,41-4,8-0,36 1,73 3,04 0,13 003 5,63-1,8-0,14 0,5 3,4 0,0 004 9,93, 0,16 0,35 4,84 0,03 005 30 3,41 3, 0,64,05 10,4 0,41 006 3 3,6 5, 0,49,55 7,04 0,4 007 35 3,63 8, 0,86 7,05 67,4 0,74 008 38 4,15 11, 1,38 15,46 15,44 1,9 Toplamlar 68 7,73 57,46 485,6 6,98 15
16 Örnek Verler İçn Korelasyon Hesaplamaları r = 0,98 Personel sayısı le satış gelrler arasında poztf yönlü 0,98 büyüklüğün güçlü korelasyon vardır. ) ( ) ( ) )( ( y x y x Y Y X X Y Y X X r
Regresyon Y X bağımsız değşken (açıklayıcı değşken, etkleyen) bağımlı değşken (cevap, yanıt değşken, etklenen) Y 0 1 X e Bast doğrusal 1 = eğm katsayısı regresyon model 0 = sabt (kesen) katsayı 17
Regresyon Model Tahmn Bast doğrusal regresyon denklem, Ŷ a bx Bağımsız değşkenn bağımlı değşken üzerndek etksn gösterr. a = sabt b = eğm 18
satış gelr Regresyon Doğrusu 4,5 Scatterplot of satış gelr vs personel sayısı 4,0 3,5 3,0,5,0 1,5 1,0 15 0 5 30 personel sayısı 35 40 19
Notasyon Anakütle Parametres Örnek statstğ Regresyon denklemnde sabt 0 a Regresyon denklemnde eğm 1 b Regresyon model ve eştlğ Y = 0 + 1 X + e ^ Y = a + b X Y a bx ê 0
Hata termler (Artıklar) ve En Küçük Kareler Yöntem Hata termler (Artıklar) eˆ ( Y Yˆ ) En Küçük Kareler Yöntem eˆ y mnmum yapan a ve b değerlernn bulunmasıdır. 1
0 ve 1 çn En Küçük Kareler Tahmnleycler b ( X X )( Y Y ) x y ( X X ) x a Y bx
Örnek Verler İçn Regreyon Katsayılarının Hesaplanması Yıllar Satış Personel Sayısı (X ) Satış Gelrler (yüz bn $) (Y ) 1999 15 1,35 000 18 1,63 001 4,33 00,41 003 5,63 004 9,93 005 30 3,41 006 3 3,6 007 35 3,63 008 38 4,15 Toplamlar 68 7,73 3
Regreyon Katsayılarının Hesaplanması Yıllar Satış Personel Sayısı (X ) Satış Gelrler (yüz bn $) (X ) ( X X ) ( Y Y ) ( X X )( Y Y ) ( X X ) 1999 15 1,35-11,8-1,4 16,76 139,4 000 18 1,63-8,8-1,14 10,03 77,44 001 4,33 -,8-0,44 1,3 7,84 00,41-4,8-0,36 1,73 3,04 003 5,63-1,8-0,14 0,5 3,4 004 9,93, 0,16 0,35 4,84 005 30 3,41 3, 0,64,05 10,4 006 3 3,6 5, 0,49,55 7,04 007 35 3,63 8, 0,86 7,05 67,4 008 38 4,15 11, 1,38 15,46 15,44 Toplamlar 68 7,73 57,46 485,6 4
Satış gelrnn personel sayısı le açıklandığı regresyon denklem katsayılarının (a, b) tahmn edlmes Y = - 0,17 + 0,11 X b = 0,11 Personel sayısında br brmlk br artış olduğunda satış gellernde 0,11 (xyüzbn Dolar) brmlk artış olur. a = - 0,17 Personel sayısı sıfır olduğunda satış gelrler -0,17 (xyüzbn Dolar) olur. Yan 17000 Dolarlık br zarar olur. 5
Tahmn Verlen br X değer çn denklemden tahmn edlen nn (teork, tahmn edlen) değer ne olur?.. Eğer anlamlı br korelasyon varsa, en y tahmn edlen Yˆ değer, X değernn regresyon denklemnde yerne konulmasıyla bulunur. 6
Denklemden satış gelrnn tahmn edlmes ^ Y = - 0,17 + 0,11 X ^ Y =? Denklemden Hata termlern (Artıklar) tahmn edlmes eˆ ( Y Yˆ )? 7
0 19 18 17 16 15 14 13 1 11 10 9 8 7 6 5 4 3 1 0 Y Toplam Değşkenlk, Açıklanan Değşkenlk ve Açıklanamayan Değşkenlk Toplam değşkenlk Y Y ^ Y = 3 + X (5, 19) (5, 13) (5, 9) 0 1 3 4 5 6 7 8 9 Y = 9 Açıklanamayan değşkenlk Açıklanan değşkenlk X Y - Ŷ Ŷ Y (Toplam değşkenlk) = (Açıklanan değşkenlk) + (Açıklanamayan değşkenlk) Y Y ( Yˆ Y ) ( Y Yˆ ) (Genel kareler toplamı) = (Regresyon kareler toplamı) + (Artık kareler toplamı) Y ) ( Yˆ ) ( ˆ Y Y Y ) (Y 8
Tahmn Edlen Teork Yˆ ve ê değerler Yˆ e ê ˆ 1,48-0,13 1,81-0,18,47-0,14,5 0,16,58 0,05 3,0-0,09 3,13 0,8 3,35-0,09 3,68-0,05 4,01 0,14 0,0169 0,034 0,0196 0,056 0,005 0,0081 0,0784 0,0081 0,005 0,0196 Toplam 0,137 9
Belrllk Katsayısı Y dek (bağımlı değşkendek) değşkenlğn ne kadarının bağımsız değşkenlerdek (regresyon doğrusu) değşm tarafından açıklanabldğn gösterr. Bast doğrusal regresyon modellernde belrllk katsayısı, doğrusal korelasyon katsayısının r nn karesne eşttr. r =Belrllk katsayısı. Çoklu regresyon modellernde belrllk katsayısı aşağıdak formülle hesaplanır. r ( Yˆ (Y Y ) Y ) 1 (Y e Y ) RKT GKT 30
Örnek Verler İçn Belrllk Katsayısı Satıs gelrlerndek (Y dek) değşmn %97,4 ü, personel sayısındak (X dek) değşm tarafından açıklanablmektedr. r ( Yˆ (Y Y ) Y ) 1 (Y e Y ) RKT GKT r = %96,04 31
Korelasyon Katsayısının Anlamlılığının Test =Anakütle korelasyon katsayısı H 0 : = (anlamlı br korelasyon yoktur) H 1 : (anlamlı br korelasyon vardır) 3
Test İstatstğ t Test statstğ: t hesap = r- 1 - r n - Krtk değerler serbestlk dereces = n - olan tablo değerler dkkate alınarak karar verlr. 33
Ret Bölgeler 34
Örnek Verler İçn Anakütle Korelasyon Katsayısının Test (t Test) =Anakütle korelasyon katsayısı H 0 : = (satış personel sayısı le satış gelrler arasında anlamlı br korelasyon yoktur) H 1 : (satış personel sayısı le satış gelrler arasında anlamlı br korelasyon vardır) t hesap = Test statstğ: r- 0,987-0 = = 17,39 1 - r n - 1 0,987 10 - Krtk değer serbestlk dereces = n - = 10 = 8, a = 0,05 çn t 0,05, 8 =,31 < 17,39 Karar: H 0 red. Korelasyon anlamlıdır. 35
Regreyon Katsayılarının ve Regreyon Modelnn Anlamlılığının Test Regreyon katsayılarının (t test) ve regreyon modelnn anlamlılığının test (F test) n yapablmek çn öncelkle standart hataların hesaplanması gerekmektedr. 36
Standart Hataların Hesaplanması Tahmnn Standart Hatası S e ˆ (ˆ e ) ( n - k) Sabt Katsayının (a) Standart Hatası S a S e ˆ 1 n ( X X - X) Eğm Katsayının (b) Standart Hatası S b S (X eˆ - X) 37
Regresyon Katsayısılarının Test (t Test) 1ve Anakütle regresyon katsayıları 1çn çn H 0 : 1= H 0 : = (1 anlamsızdır) ( anlamsızdır) H 1 : 1 H 1 : (1 anlamlıdır) ( anlamlıdır) b- 1 a-0 t hes = t hes = Sb Sa Krtk değerler serbestlk dereces = n - k olan tablo değerler dkkate alınarak karar verlr. (modelde hesaplanacak katsayı aded) t hesap > t a/, n k se H 0 Red. 38
Standart Hatalar S e ˆ = Tahmnn Standart Hatası S e ˆ (ˆ e ) ( n - k) 0,10685 Sb = b 1 n standart hatasıdır. S b S (X eˆ - X) 1 X Sa = a nın standart hatasıdır. S S a e ˆ n ( X - X) 39
katsayısı Örnek Verler le Regresyon Katsayısılarının Test (t Test) 1=Anakütle regresyon (X1 çn) H 0 : 1= (1 anlamsızdır) H 1 : 1 (1 anlamlıdır) 40
Test statstğ: Test İstatstğ t t = b-1 Sb = 0,11 = 16,16 0,006804 S b S (X eˆ - X) =0,006804 Krtk değerler serbestlk dereces = n - k olan tablo değerler dkkate alınarak karar verlr. a = 0,05 olsun. 16,16 > t a/, n = t 0,05, 8 =,306 H 0 Red. 1 anlamlıdır. 41
B 0 İçn 0=Anakütle regresyon modelnde sabt term H 0 : 0= (0 anlamsızdır) H 1 : 0 (0 anlamlıdır) 4
Test İstatstğ t Test statstğ: t = Sa a- 0 = - 0,17 0,1884 = - 0,90 S a S e ˆ 1 n X ( X - X) =0,1884 Krtk değerler serbestlk dereces = n - olan tablo değerler dkkate alınarak karar verlr. a = 0,05 olsun. - 0,90 < t a/, n = t 0,05, 8 =,306 H 0 REDDEDİLEMEZ. 0 anlamsızdır. 43
F - Test H 0 : 1... k (Model anlamsızdır) H 1 : en az br çn (Model anlamlıdır) Test İstatstğ = F oranı (F hesap ) = ( Yˆ ( Y Y ) Yˆ ) RKO AKO Bast doğrusal regresyonda t = F olmaktadır. Ret Bölges = F hesap > F a, k-1, (n k) se H 0 RET. (k modelde hesaplanacak katsayı aded) 44
F Test (Satış Gelrler Örneğ İçn) H 0 : 1 (Model anlamsızdır) H 1 : En az brs sıfırdan farklı (Model anlamlıdır) Test İstatstğ F hes 6,798 0,05 30,41 Karar = F hes = 30,41 > F0,05, 1, 8 = 5,3 H 0 RET. 45