Doğrusal Korelasyon ve Regresyon En az k değşken arasındak lşknn ncelenmesne korelasyon denr. Kşlern boyları le ağırlıkları, gelr le gder, öğrenclern çalıştıkları süre le aldıkları not, tarlaya atılan gübre le elde edlen verm arasındak lşk korelasyona örnektr. Bu örneklerde br bağımsız değşken ( ), dğer bağımlı değşken ( ) olmak üzere 2 değşken vardır. 1
Değşkenler arasındak lşknn derecesn gösteren katsayıya se korelasyon katsayısı denr ve «r» le gösterlr ve bu katsayı -1 le +1 arasında değerler alır. r = 0 se değşkenler arasında lşk yoktur. r < 0 se değşkenler arasında negatf yönlü lşk vardır. an değşkenlerden br artarken dğer azalmaktadır. r > 0 se değşkenler arasında doğru yönde lşk olduğunu gösterr. r değer, 0.00-0.25 Çok zayıf lşk 0.26-0.49 Zayıf lşk 0.50-0.69 Orta lşk 0.70-0.89 üksek lşk 0.90-1.0 Çok yüksek lşk 2
Bağımsız değşken (Independent Varable), (neden): Araştırmacının kontrolünde olan ve araştırmacının değştrdğ durum yada başka br değşken tarafından etklenmeyen ama nn neden olan yada onu etkledğ düşünülen (açıklayıcı) değşkendr. Bağımlı Değşken (Dependent Varable), (sonuç): Genellkle le gösterlr. değşkenne bağlı olarak değşeblen yada ondan etklenen (açıklanan) değşkendr yada ölçülen davranıştır. 3
4
y y 3 10 10 80 15 10 r = 0 r = 0 10 18 20 50 23 10 12 20 40 40 18 10 15 35 60 30 37 10 20 40 75 15 30 10 x x y y r > 0 r < 0 y r = 0 x x x 5
Korelasyon Katsayısı ( r ) nn Hesabı : Bast Korelasyon (Pearson Korelasyon Katsayısı) En az k değşken arasındak lşknn derecesn gösteren r standart sapma (S) ve artmetk ortalama ( ) blnyorsa ; n r 1 ( ( n 1) S )( x. S ) y Bağıntısı le hesaplanmaktadır., : Artmetk ortalamalar S x, S y : Standart sapmalardır. Not: Verler Teork Normal Dağılıma uygun dağılmıyorsa; Pearson korelasyon katsayısı yerne Sperman Sıra Korelasyon Katsayısı hesaplanır. (Pearson korelasyon katsayısı, k değşkenn de sürekl olmasını ve değşkenlern brlkte normal dağılım göstermesn gerektrmektedr.) 6
7 y x n S S n r. 1) ( ) )( ( 1 n n n r 1 1 2 2 1 ) (. ) ( ) )( ( Korelasyon katsayısı hesabı le lgl formüller:
Örnek : - - ( - ) 2 ( - ) 2 ( - ) ( - ) 2 5 2-5= -3-2 9 4 6 5 4 0-3 0 9 0 3 7-2 0 4 0 0 7 8 2 1 4 1 2 8 11 3 4 9 16 12 ve değşkenler arasındak lşknn derecesn gösteren korelasyon katsayısını hesaplayınız. 26 30 20 8
9 5 5 25 7 5 35 1 5 26 1 5 30 1) (5 20. 1) ( ) )( ( 1 x S S n r y x n 0.7161 4.(2.7386)(2.5495) 20 r VEA 0.7161 30.26 20 ) (. ) ( ) )( ( 1 1 2 2 1 n n n r r = 0.7161 > 0 olması 2 değşken arasında doğru yönde lşk olduğunu gösterr.
Korelasyon Tablosu Su mktarı Buğday üretm 5-6 dan az 6-7 den az 7-8 den az 8-9 dan az Toplam 4-5 den az 1 1 5-6 dan az 2 2 6-7 den az 1 1 7-8 den az 1 1 Toplam 1 2 1 1 5 Buğday üretm le harcanan su değerlern çeren tabloya k vasıf arasındak lşky gösterdğ çn korelasyon tablosu adı da verlmektedr. Tablo çersndek sayılar frekansları göstermektedr. Frekanslar sol üst köşeden sağ alt köşeye doğru toplandığı çn lşk poztftr. Aks durumda lşknn negatf olduğu, br değşkenn değer artarken dğernn azaldığı ortaya çıkacaktır. 10
Örnek: Öğrenclern statstk dersnde ara sınavdan aldıkları notlarla dönem sonu sınavından aldıkları notlar arasında br lşk olduğu düşünülmektedr. Bu lşknn yönünü ve derecesn belrleynz. Toplam 11
Öğrenclern, statstk dersyle lgl, ara sınav notlarıyla dönem sonu sınav notları arasında, poztf yönde, kuvvetl olmayan (zayıf) br lşk söz konusudur. 12
Örnek: r= -0.989 13
Örnek: Poztf yönde çok yüksek lşk vardır. 14
Korelasyon katsayısı, sadece doğrusal lşknn gücü şeklnde yorumlanmalıdır. Korelasyon katsayısı le lgl yaygın br yanlış, bu katsayının nedensellğ fade ettğ varsayımıdır. Bu her zaman doğru olmayablr. Mesela boy uzunluğu le br dakkada okunan kelme sayısı arasında br lşk ararsak ve sonunda da yüksek br korelasyon yakalarsak bu doğru mu olur? Tabk, yanlış olur; çünkü okuma hızı le yaş ve dolayısıyla eğtm sevyes arasında lşk vardır. Durumu çocuklar arasında ölçersek, eğtm düzey yüksek çocuklar yaşları ve doğal olarak boyları da büyük çocuklar olurlar. Dolayısıyla k değşken arasında yüksek br lşk bulunduğunda, bunlar arasında hemen br neden-sonuç bağlantısına gdlmemeldr. Korelasyon katsayısından hemen br nedensellk kararı çıkartılmamalıdır. 15
Regresyon Analz En az k değşken arasındak lşknn matematksel br model le açıklanmasına regresyon analz denr. Regresyon denklem bağımsız değşkendek ( ) br brmlk değşmeye karşılık bağımlı değşkende ( ) meydana gelecek değşklğ açıklamaktadır. Bast doğrusal regresyonda bast kelmes 2 değşken arasındak lşknn ncelendğn, doğrusal kelmes se değşkenler arasındak lşky açıklamak çn kullanılacak matematksel metodun doğrusal olduğunu fade etmektedr. Değşkenlerden brndek br brm artışa karşılık, dğernde sabt olmayan br değşklk meydana gelyorsa, bu değşkenler arasında doğrusal olmayan (nonlneer) br lşk vardır. y = a + bx doğru denklemnde a : doğrunun y eksenn kestğ nokta b : doğrunun eğmdr. b r Sy Sx a y bx y r Sy Sx x 16
b r Sy Sx b n 1 ( n 1 ( )( ) 2 ) 17
Mevcut formüller x, y değşken değerlernn arasından geçen ve en küçük kareler doğrusu adı verlen br teork doğrunun parametrelernn tahmn değerlern verr (Deneysel noktalar br doğrunun üzernde bulunmasalar ble, En Küçük Kareler öntem le, deneysel noktaları en y temsl eden regresyon doğrusu hesaplanablr). En küçük kareler yöntem, serplme grafğndek noktalar le bu noktaları temsl çn çzlmş doğru arasındak farkların mnmum olması prensbn kullanır. e6 e8 e9 e10 e4 e5 e7 e1 e3 e2 18
Not: Korelasyon katsayısının hesaplanmasında değşkenlerden br, dğer olarak alınablr, bağımlı, bağımsız değşken ayrımı yoktur. Regresyon analznde se değşkenlerden hangsnn bağımsız değşken, hangsnn bağımlı değşken olduğu önemldr ( ve nn seçm). Konunun Önem: Gelştrlen regresyon denklem le bağımlı değşkenn alableceğ değerler araştırmak, gözlem, deney vb. htyaç duymaksızın önceden tahmn edeblmek. 19
Örnek: Br üretm merkeznde üretlen malzemenn sertlk ve dayanıklılık bakımından lşks araştırılmaktadır. Bu amaç çn üretlen malzemeler arasından 10 parça seçlerek sertlk ve dayanıklılık test yapılmıştır. Verler tabloda verlmş olup; ve arasındak lşkye at regresyon denklemn bulunuz. 20
Parça No Sertlk (Bağımsız) Dayanım ( - ) ( - ) ( - ) ( - ) ( - ) 2 ( - ) 2 1 7 10 0 1 0 0 1 2 9 12 2 3 6 4 9 3 5 6-2 -3 6 4 9 4 8 9 1 0 0 1 0 5 6 8-1 -1 1 1 1 6 9 11 2 2 4 4 4 7 7 10 0 1 0 0 1 8 4 5-3 -4 12 9 16 9 8 10 1 1 1 1 1 10 7 9 0 0 0 0 0 70 90 30 24 42 21
90 10 9 r 30 24.42 0.945 70 10 7 b r Sy Sx 42 / 9 0,945. 1,25 24 / 9 b n ( a )( y bx ) veya 30 24 1 n 2 ( ) 1 1,25 91,25.7 0,25 y = 0.25 + 1.25 x Dayanım=0.25+1.25 Sertlk 22
Örnek: 12-14 yaş grubu çocukların boy uzunluğu le kulaç uzunluğu arasında lşk olup olmadığını ncelemek çn 10 çocuk üzernde br araştırma planlanmıştır. Her çocuğun boy uzunluğu le brlkte duvara yaslandırılarak ve kolları açtırılarak her k ellernn orta parmakları arasındak mesafe (kulaç uzunlukları) ölçülmüştür. Burada amaç; çocukların kulaç uzunluğundan boy uzunluklarını tahmn etmek çn br model oluşturmaktır. Bu durumda; Bağımlı Değşken (y): Boy uzunluğu Bağımsız Değşken (x): Kulaç uzunluğu 23
Çocuk No Boy uzunluğu (cm) () Kulaç uzunluğu (cm) () 1 165 162 2 161 163 3 156 158 4 158 156 5 163 161 6 166 166 7 154 153 8 156 154 9 161 161 10 159 157 24
25 10 1 10 1 1591 1599 x y 10 1 2 10 1 2 255825 253285 y x 10 1 254538 y x 1 159. 10 1591 159.9 10 1599 x y
Boy Uzunluğu=20.847+0.874 Kulaç uzunluğu Kulaç uzunluğu 1 brm arttığında boy uzunluğu ortalama 0.874 brm artmaktadır. 26
İk ya da daha çok değşken arasında lşk olup olmadığını, lşk varsa yönünü ve gücünü nceleyen korelasyon analz le değşkenlerden brs belrl br brm değştğnde dğernn nasıl br değşm gösterdğn nceleyen regresyon analz sağlık blmlernde de çok kullanılan statstksel yöntemlerdr. Örnek olarak; Hastalığın başlangıcıyla doktora başvurma arasında geçen süre le yleşme süres arasındak, yne lacın dozu le yleşme süres arasındak lşklerden yararlanılarak tedavye başlama, dozunu ayarlama ve tedavy btrmeye karar verlmes, Sgara çme le koroner kalp hastalığına yakalanma arasında nedensel br lşk saptanırsa sgara çme önlenerek koroner kalp hastalığına yakalanmanın ortadan kaldırılablmes, Değşkenler arasındak lşklerden yararlanılarak gelştrlecek matematksel modeller yardımıyla tahmnler yapılablmes sayılablr. Bu matematksel modellemelerden örneğn; yaş le boy arasında br model gelştrleblrse br çocuğun belrl yaşlarda boyunun kaç cm. olacağı, belrl br hastalıkta kullanılan br lacın dozu le yleşme süres arasında br model gelştrleblrse verlen doza göre hastanın ne kadar sürede 27 yleşebleceğ tahmn edleblr.
KAR Örnek: Br holdng 11 fabrkasında 2007 yılı tbaryle elde ettğ karları le fabrkada o yıl kullanılan kapaste arasında br lşk olup olmadığını araştırmaktadır. Aşağıdak verlerden yararlanarak soruyu cevaplayınız. Ve kapaste %65 olduğu zaman elde edlecek karı tahmn ednz. 14 12 BAĞIMLI DEĞİŞKEN () : KAR BAĞIMSIZ DEĞİŞKEN () : KAPASİTE 10 8 Sonuç: r =0,859 Kar ve kapaste arasında doğru orantılı (poztf) ve güçlü br lşk vardır. 6 KAR=0,585+0,129*KAPASİTE 4 2 20 30 40 KAPASITE 50 60 70 80 90 100 KAPASİTE %65 olursa elde edlecek Kar? 8,97 mlyar ( 8 mlyar 970 mlyon) 28
Örnek: 29
30
Ödev: Br fabrkada taşıma şler çn kullanılan tırların yaşı le bakım harcamaları arasındak lşkye at verler tabloda görülmektedr. Burada bağımsız değşken yaş, bağımlı değşken se bakım harcamalarıdır, çünkü yaş değştkçe bakım harcamaları değşklk göstermektedr. Pratklk olması açısından yaş ve bakım harcaması arasındak lşknn br doğru şeklnde olduğu varsayılarak regresyon denklemn bulunuz. yaş (yıl) bakım harcaması 2.0 2500 4.5 9200 4.5 4950 4.0 4400 5.0 7900 5.5 10500 5.0 9700 0.5 1950 6.0 8000 1.0 2025 1.0 3700 3.0 6800 31
Ödev: Br endüstrdek 12 frmanın aylık satışları le aynı aylar çnde yaptıkları reklam harcamaları tabloda görülmektedr. Regresyon denklemn bulup, korelasyon katsayısını hesaplayınız. 32