OnkncBölüm KorelasyonveRegresyon Hedefler Buünteyçalktansonra; k deken arasnda lk olup olmad arar, lknn anlaml olup olmad belrler, Anlaml br lk varsa lknn modeln formüle eder, Dekenlerden br le dern tahmn eder, Tahmnn bell br olask düzeyne göre srlar çzer, Elde ett sonucu yorumlar. Anahtar Kavramlar Anlamllk Korelasyon Regresyon Serplmegraf Baml-Bamsdeken çndekler 1.Korelesyon 1.1lkkonusuvenedenler 10.1.1lknn Yönü Dereces ve Fonksyonel ekl 1.Korelasyonkatsay 10..1Korelâsyon Katsayn Özellkler 1.3Spermanrakorelasyonu 10.3.1ra Korelâsyonun Kullanld Yerler 1.4Bast(Dorusal)regresyon 1.5Regresyondenklemletahmn
Korelasyon ve Regresyon 1. KORELASYON Buraya kadark konularda genel olarak ana kütlenn sadece tek br vasf ele alan statstk yöntemler kullanld. Gözlem yaplan brmlern sahp olduklar k veya daha fazla vasf (deken) arasnda lk olup olmad merak edlen ve skça sorulan br konudur. Brmlern k vasfa göre nasl daldklar gösteren serlere "blek ser" ad verld serler bölümünde bahsedlmt. Blek serlern yaplarna göre tasnf edlmem, tasnf edlm ve gruplarm blek serler olmak üzere üç farkl eklde gösterldn blyoruz. 1.1 KONUSU VE NEDENLER k veya daha çok sayda deken arasnda br lk olup olmad, lk varsa bu lknn derecesnn ne olduu statstk ararmalarda sk karlalan br konudur. statstk anlamda k deken arasndak lk, bunlarn karkl demeler arasndak bak eklnde anlar. Ana kütley meydana brmler üzernde yaplan ölçümlerde, deken deerler derken, buna ba olarak Y dekennn deerler de deyorsa bu k deken arasnda br lknn bulunduu söyleneblr. Örnen; nsanlarda boy uzunluu le rln artmas, üretm mktarn artmasyla brm malyetn azalmas, gelr sevyesnn artmasyla tasarruflarn artmas, br ürünün reklâm masraflar artarken satlarn da artmas gb lkler buna br örnektr. Bu lk yeter kadar kuvvetl se ve matematk br fonksyonla fade edleblrse, dekenlerden brne at deerler blndnde derne at deerler tahmn edeblme mkân doablr. Frmalar Üretm mktar (adet) Brm malyet (TL) A 4 6 B 8 6 C 6 5 D 10 5 E 0 4 F 5 3 G 30 H 35
statstk 3 Görülece gb k deken (,Y) arasndak lk, br sebep sonuç lksdr. Fakat bazen dekenler arasnda br sebep sonuç lks olmayablr veya açk bçmde görülemeyeblr. Bu lknn dereces le ölçüleblr. Ksaca k deken arasnda statstksel açdan br sebep sonuç lks aranmamalr. ve Y gb k dekenn aldklar deerlern demeler karlar ve aralarnda br paralellk veya terslk olduu görülürse bu k deken arasnda br lknn olduu söyleneblr. Yan dekenlerden br azalp çoalrken der de azalp çoalyorsa bunlar arasnda br lknn varlndan söz edlemez. 1.1.1 lknn Yönü Dereces ve Fonksyonel ekl lknn yönü le açklanmak stenen konu, aralarnda br lknn olup olmad aralan k dekenn ayn yönde m yoksa zt yönlerde m detklernn aralmasr. Br azalrken der de azalyorsa veya br artarken der de artyorsa lk poztf, br azalrken der artyorsa veya tersnde lk negatftr. Yukarda verlen örneklerden görüldüü gb, reklam harcamalar le satlar arasnda poztf br lk varken, üretm mktar le brm malyet arasnda negatf br lk vardr. 1. KORELASYON KATSAYISI ve Y aralarnda dorusal statstk br lk bulunmas stedmz k rasgele deken olduuna göre, ayn gözlemde ölçülen, Y deer çftlern -Y düzlemnde brer nokta le aretleyelm. Elde edlen noktalarn br doru çzg çevresnde küçük br yaylma le dalmalar le Y arasnda br lk olduunu gösterr. Ancak k rasgele deken arasnda anlamal br lk bulunup bulunmadna karar vermek çn sadece gözlenm deer çftlern aretlemek yeterl olmaz.. Korelâsyon katsayn sr olmas le Y arasnda dorusal br lknn olmad gösterr. Yne korelasyon katsayn mutlak deernn 1 olmas veya 1'e yaklamas dekenler arasndak lknn kuvvetlendn gösterr. k deken arasndak lknn nasl olduunu anlamak çn eldek verlern ( ve Y deerlernn) serplme dyagram çzmek gerekldr. Serplme dyagram yalnz lknn olup olmad ve fonksyonel ekln göstermekle kalmaz, ayn zamanda lknn derecesn de gösterr. Gerçekten, dyagramda noktalar arasndan br doru veya er geçrldnde noktalarn bu doru veya er etrafndak damlar, uzaklklar ne kadar çoksa lk o kadar zayf, ne kadar az se lk o kadar kuvvetldr. Örnen ekl 1 ve ekl de görülen serplme dyagramlarnda noktalar br doru üzernde sralanmakta, bu se dekenler arasnda tam br lk olduuna aret etmektedr.
4 Korelasyon ve Regresyon Noktalarn adan yukarya doru sralanmas dekenler arasndak lknn ayn yönde, yukardan aya doru sralanmas se ters yönde br lknn varlna aret eder. Korelasyon katsay () se olumlu yan ayn yönde br lk, () se olumsuz yan zt yönlü lk var demektr. Grafk üzerndek noktalar, br doru etrafnda dam gösterrse, dekenler arasndak lknn dorusal olduu anlar. Noktalarn da doru etrafnda del, br er etrafnda dzlmler se ersel lk var demektr. Dekenler arasndak lknn dorusal olduu durum dersmzn konusunu oluturacaktr.
statstk 5 Noktalarn aral ne kadar dar se, baka br fade le noktalar doruya ne kadar yakn dalm se lk o kadar kuvvetl demektr. Bu durumu adak ekller fade edtmektedr. Dekenler arasnda lk yoksa noktalar oldukça dak br formda görülür.
6 Korelasyon ve Regresyon Grafk üzerndek noktalar br doru üzernde sralanm se, dekenler arasnda tam br lk var demektr. Dorunun em lknn yönünü de gösterr. Örnek 1 Br frmann 003-01 yllar arasndak yapt reklam (100 TL) le gerçekleen sat mktarlar (1000 TL) ada verlmtr. Bu gözlem deerlernden hareketle reklamla sat arasnda br lk olup olmad, varsa bunun yönünü ve derecesn belrlemeye çalalm. Bunun çn gözlem deerlern kullanarak ve Y dekenler çn serplme dyagram çzelm. llar Reklam Sat Y 003 1 5 004 5 005 3 10 006 4 10 007 4 15 008 5 0 009 5 30 010 8 30 011 8 35 01 10 40
statstk 7 ekl 7 Reklam ve sat çn serplme dyagram Korelâsyon hesabnda, dekenlern ortalamadan sapmalar dkkate alnarak demeler buna göre bulmak da mümkündür. Bu takdrde önce ortalamadan sapmalar hesaplanrsa, Y Y y ve y sapmalarn ayn yönde demeler halnde aretler ayn olacak, aretler t se dekenlern zt yönde detkler sonucuna varlacaktr. Ortalamadan sapmalara göre bulunacak korelasyon katsay se u formül yardyla hesaplanr: r ( ( )( Y ) Y ) ( Y Y ) r y y ve y semboller korelasyon formülünü daha da bastletrr.
8 Korelasyon ve Regresyon llar Reklam Sat Y ( ) Y Y ( y ) y y 003 1 5-4 -15 60 16 5 004 5-3 -15 45 9 5 005 3 10 - -10 0 4 100 006 4 10-1 -10 10 1 100 007 4 15-1 -5 5 1 5 008 5 0 0 0 0 0 0 009 5 30 0 10 0 0 100 010 8 30 3 10 30 9 100 011 8 35 3 15 45 9 5 01 10 40 5 0 100 5 400 50 00 0 0 315 74 1500 Ortalama 5 0 r y y 315 741500 0.945 Bulunan sonuca göre, reklam harcamalar le satlar arasnda poztf (ayn yönde) ve çok kuvvetl br korelasyon (lk) bulunduu r 0. 945 büyüklüündek korelasyon katsayndan anlalmaktadr. Baka br fade le reklam harcamalar artkça buna ba olarak satlarn da artaca söyleneblr. 1..1 Korelâsyon Katsayn Özellkler a) Korelâsyon katsay lknn dorusal olduu kabul edlerek kullanlan br ölçüdür. lk ersel se korelasyon katsay yerne korelasyon ndeks kullanr. b) Serde a deerlern bulunmas, yan deerlern büyük deklkler gösterd durumlarda korelasyon katsay büyük ölçüde etklenr. Bu gb durumlarda bu a deerler düzeltlmel veya sra korelasyon kullanlmalr. c) k deken arasnda mantkl br lknn olup olmad konusu üzernde durulmalr. Zra aralarnda mantkl br lknn bulunmayan serler çn de tesadüfen korelasyon katsay yüksek çkablr.
statstk 9 1.3 SPERMAN SIRA KORELASYONU ve Y dekenlernn gerçek deerler arasndak korelasyonu hesaplamak yerne her k serdek deerlere büyüklüklerne göre sra numaras verlr. Bu sra numaralar arasnda br korelasyon ararsa buna sra korelasyonu denr. Bazen verler brmlern k özelle göre sralar gösterrler. Bu taktrde korelasyon hesab sadece ra korelasyonuna göre yaplablr. Brmlern k dekene göre ald gerçek deerler blnyorsa, küçükten büyüe veya büyükten küçüe doru sraladktan sonra sra korelasyon hesaplanablr. Sra korelasyon katsayn hesabnda en çok kullanlan yöntem Sperman metodudur ve formülü öyle yazlablr. r s 6 n( n 1 D 1) D : Deerlern sralar arasndak farklar n : Gözlem say ra korelasyonunun deer de korelasyon katsay gb (-1) le (+1) arasnda der. Sonucun (-1) çkmas, k deken arasnda tam negatf br lk, (+1) çkmas, dekenler arasnda tam poztf br lk, sr çkmas halnde se dekenler arasnda hçbr lk bulunmadna karar verlr. Gerçekte karlalan sra korelasyon deer 1 rs 1 dr. llar Reklam Sat Y ralar D Y 003 1 5 1 1.5-0.5 0.5 004 5 1.5 0.5 0.5 005 3 10 3 3.5-0.5 0.5 006 4 10 4.5 3.5 1 1 007 4 15 4.5 5-0.5 0.5 008 5 0 6.5 6 0.5 0.5 009 5 30 6.5 7.5-1 1 010 8 30 8.5 7.5 1 1 011 8 35 8.5 9-0.5 0.5 01 10 40 10 10 0 0 Toplam 50 00 0 0 0 4.5 Y D
10 Korelasyon ve Regresyon ra korelasyonu hesaplanrken her k dekene göre sra numaralar toplamlarn ra et olmas esastr Y 0. Bazen dekenler tekrar eden ayn deerlere sahp olablr. Bu durumda deerlere sra numaras verlrken hangsnn öncek, hangsnn sonrak srada yer alaca bell olmayan k veya daha fazla brm var demektr. Böyle durumlarda bunlara kark gelen sra numaralarn artmetk ortalamas alnarak bu brmlerden her brne sra numaras olarak verlr. Frmann sat ve reklam deerler çn sra korelasyon hesab: r s 6 n( n D 6 4.5 1 1) 10(10 1) 1 0.97 Dkkat edlrse, sra korelasyon katsay ayn örnek çn hesaplanan korelasyon katsayna oldukça yakn çkmr. 1.3.1 Sra Korelâsyonun Kullanld Yerler a) ve Y' nn gerçek deerler yerne sadece sra numaralar blnd taktrde sra korelasyonu kullanmak zorunludur. Bu yüzden sra korelasyonu parametrk olmayan br ölçüdür. b) rann önem gerçek deerden daha fazla olduunda sra korelasyonu kullanr. c) En küçük kareler yöntem le regresyon ve korelasyon hesab noktalarn regresyon dorusu etrafnda normal dald kabulüne dayanr. Oysa, sra korelasyonunda böyle br kabul yoktur. Burada dekenlerden br ble bu normal damdan uzaklayorsa korelasyon katsay yerne sra korelasyon katsay kullanr. d) Serde a br deern varl gerçek deerlerden hesaplanacak olan korelasyon katsayna büyük ölçüde etkled halde, sra korelasyonuna tesr etmez. te böyle hallerde de yne sra korelasyon katsay kullanr. 1.4 BAST (DORUSAL) REGRESYON Regresyon k deken arasndak lknn matematk br fonksyonla fades, korelasyon se lknn derecesn gösterr. Serplme dyagramnda noktalarn durumu ve genel damlar k deken arasnda br lknn olup olmad ve varsa lknn hang fonksyon tpne uyduunu açkça gösterr. ekl 1 le ekl 6 arasndak serplme dyagramlar çetl durumlar ve lk ekllern temsl etmektedr. Bast regresyon modelnde, regresyon denklem
statstk 11 Y a b eklnde yazlablr. Burada daha önce de belrttmz gb Y baml, se bamsz dekendr. a ve b se denklemn parametrelerdr ve bunlarn hesaplanmas gerekr. Regresyon denklemndek a parametres dorunun Y eksenn nerede kestn gösterr. Bu durumda 0, Y a dr. b parametres se, regresyon dorusunun emdr ve regresyon katsay olarak da adlandr. Dorunun em olan b, ' tek 1 brm demeye (art veya azal) Y' de beklenen deme mktarr. Regresyon katsayn aret ayn zamanda lknn yönünü de belrler. Dorunun em negatf arete sahp se, dekenler arasnda ters yönde br lk olduu, yan br artarken dernn azald gösterr. aretn poztf olmas se dekenlern ayn yönde detklern gösterr. Regresyon analz çn serplme dyagram sr orjnne göre çzeblecemz gb k sernn de ortalamalarn tayn ett noktay orjn kabul ederek de çzeblrz. Yan koordnat sstemnde orjn ortalamalarn tayn ett noktaya tayablrz. Böyle yapld takdrde her ne kadar noktalarn ve regresyon dorusunun konumu demese de noktalarn yen orjne göre konumlar der. r orjne göre ve Y olan koordnatlar, ortalamalar orjnne göre y Y Y yan ortalamalardan sapmalar halne gelr. ve Bu durumda yen koordnat sstemne göre noktalar ve deerlern ortalamalardan sapmalar toplam sr olduuna göre toplam da sr olur. ( ) 0 y ( Y Y ) 0 b y y eklndedr. Br serde ve y deerler
1 Korelasyon ve Regresyon Bu durumda regresyon dorusu koordnatlar dekenlern ortalamalar olan M (, Y ) orjnden geçer ve Y' nn ' e göre regresyon dorusu ad alr. Çünkü Y a b eklndek ' n br fonksyonu olarak elde edlmektedr. b' ye de Y' nn ' e göre regresyon katsay denr ve b y y eklnde yazr. Görüldüü gb ortalamalar orjn kabul edldnde b parametresn ksa yoldan hesaplamak ve orjne göre regresyon denklemn yazmak çok kolay olur. Regresyon katsay b' y bu eklde yazdktan sonra, regresyon dorusunu sr orjne göre yazmak çn a parametresnn hesaplanmas gerekr. Regresyon dorusu M (, Y ) noktasndan geçt çn: Buradan Y a b a Y b y y bulunur.
statstk 13 Örnek Ayn endüstr kolunda faalyet yapan 5 frmann üretm mktarlar le brm malyetler da verld gbdr. Üretm mktar le brm malyet arasnda lk olup olmad Fsher'n korelasyon katsay le belrledkten sonra regresyon katsaylar ve regresyon denklemn bulmaya çalalm: Frmalar Üretm mktar (adet) Brm malyet (TL) ( ) Y Y ( y ) y y A 1 5-4 -8 16 4 B 3 4-1 - 4 1 C 5 3 0 0 0 0 0 D 7-1 - 4 1 E 9 1 4 - -8 16 4 Toplam 5 15 0 0-0 40 10 Ortalama = 5 Y = 3 Tablo 1 Üretm mktarlar ve brm malyetler b y y 0 40 0,5 r orjnne göre regresyon dorusunu yazablmek çn denklemlern Y eksenn kest noktann ordnat a parametresn hesaplamak gerekr. Gerekl lemler yaprsa: Y a b y a Y b y a 3 ( 0,5)(5) 5,5 Y nn e göre regresyon dorusu Bulunur. Y ' 5,5 0,5
14 Korelasyon ve Regresyon 1.5 REGRESYON DENKLEM LE TAHMN Fl deerlern tahmnnde sr orjnne göre hesaplanan regresyon denklemler kullanr. deerlerne göre Y' deerlern tahmn edeblmek çn ada verlen regresyon denklemnde deerlern yerne koyarak Y' deerler tahmn edlr. Y ' 5,5 0,5 Tablo 3 üretm mktar le brm malyet arasndak lk Frmalar Üretm Brm Malyet Y! A 1 5 Y ' 5,5 0,5 (1) 5, 0 B 3 4 Y ' 5,5 0,5 (3) 4, 0 C 5 3 Y ' 5,5 0,5 (5) 3, 0 D 7 Y ' 5,5 0,5 (7), 0 E 9 1 Y ' 5,5 0,5 (9) 1, 0 Toplam 5 15 15 Üretm mktar = 10 olursa brm malyet tahmn edelm: Y ' 5,50,5 regresyon denklemnde yerne 10 alrsa: Y ' 5,5 0,5(10) 5,5-5 0,5 Bulunur.
statstk 15 DeerlendrmeSorular 1. dak grafk hang ser çn çzlmtr? (a) Bast ser, (b) Blek ser, (c) Gruplanm ser, (d) Tasnf edlm ser, (e) Kümülatf. dak ekle göre dekenler arasndak lk nasldr? (a) Ayn yönde kuvvetl lk vardr, (b) Ters yönde kuvvetl lk vardr, (c) Negatf çok kuvvetl lk vardr, (d) Poztf çok kuvvetl lk vardr, (e) lk yoktur 3. ve Y' nn gerçek deerler yerne sadece sra numaralar blnd takdrde dekenler arasndak lky ölçmek çn adak yöntemlerden hangs kullanr? (a) Fsher korelasyon katsay, (b) Kontenjans katsay, (c) Sperman korelasyon katsay, (d) Durbn lksel korelasyon katsay, (e) Demng korelasyon döngüsü
16 Korelasyon ve Regresyon 4. Üretm mktar le brm malyet arasndak lk çok kuvvetl ve ayn yönde se korelasyon katsay deer nasldr? (a) r = - 1 (b) r = - 3 (c) r = 0,85 (d) r = (e) r = 3 5. dak ekle göre, üretm mktar artarsa brm malyette nasl br deme beklenr? (a) Art (b) Azal (c) Deme olmaz (d) Büyüme (e) Hçbr 6. Üretm mktar le brm malyet arasndak r = 1 se lk nasldr? (a) ( + ) ve tam (b) ( - ) ve tam (c) ( + ) ve kuvvetl (d) ( - ) ve kuvvetl (e) ( + ) ve zayf 7. Üretm mktar le brm malyet arasndak lk hang katsay le ölçüleblr? (a) Pearson katsay (b) Determnant katsay (c) Korelasyon katsay (d) Regresyon katsay (e) Heps 8. Üretm mktar le brm malyet arasnda anlaml br lk varsa, baml deken hangs olur? (a) Üretm mktar, (b) Brm malyet, (c) Her ks de olur, (d) Tüketm mktar, (e) Hçbr
statstk 17 9. dak ekle göre reklamla sat arasndak lk nasldr? sat 30 5 0 15 10 5 0 0 4 6 Reklam (a) Poztf tam (b) Negatf kuvvetl (c) Poztf kuvvetl (d) Dalgal kuvvetl (e) Negatf tam 10. dak ekle göre reklamla sat arasndak lk nasldr? sat 50 40 30 0 10 0 (a) Poztf (b) Negatf (c) Düzgün (d) Dalgal (e) lk yok 0 4 6 8 Reklam 11. k deken arasnda korelasyon katsayn 1.75 çkmas ne anlama gelr? (a) Ayn yönde çok kuvvetl lk gösterr, (b) Ters yönde çok kuvvetl lk gösterr, (c) Negatf çok kuvvetl lk gösterr, (d) Poztf çok kuvvetl lk gösterr, (e) Hçbr ey fade etmez 1. Korelasyon katsay r = 0.60 se bu nedr? (a) Ayn yönde kuvvetl lk gösterr, (b) Ters yönde kuvvetl lk gösterr, (c) Negatf çok kuvvetl lk gösterr, (d) Poztf çok kuvvetl lk gösterr, (e) Hçbr ey fade etmez
18 Korelasyon ve Regresyon Kaynakça Özkan, Ylmaz (008), Uygulamalstatstk II, Sakarya Yaynck, Sakarya.