ASTROİSTATİSTİK 12. KONU Hazırlaya: Doç. Dr. Tolgaha KILIÇOĞLU 12. KORELASYON Bir deeyi veya gözlemi soucuda elde edile iki değişke arasıda bir ilişki olup olmadığı ortaya komak isteebilir. Aşağıda birbirleri arasıda ilişki araa durumlara ilişki birkaç örek verilmektedir; Sigara kullama miktarı ile yaşam süresi Öğrecileri televizyo izleme miktarı ile üiversite sıavıdaki başarısı Bir isaı IQ puaı ile kazadığı maaş Bilgisayar kullama seviyesi ile ALES sıavıda alıa ot İsaları kiloları ve boyları Bir lisede matematik sıavıda alıa otlar ile Türkçe sıavıda alıa otlar Ae-babaı ortalama IQ puaı ile çocuğu IQ puaı Belirli bir türde ağaçları yaşları ve boyları Otomobilleri ağırlıkları ile bezi tüketimi Yıldızları kütleleri ile ışıım güçleri Galaksileri dikie hızları ile kırmızıya kaymaları Değişe yıldızları pulsasyo döemleri ve parlaklıkları vb... İki değişke arasıdaki olması muhtemel ilişkiye korelasyo adı verilir. İki değişke arasıda bir korelasyo olup olmadığıı ortaya koulması içi matematiksel bir yöteme ihtiyaç vardır. Bu bölümde korelasyoa ilişki ifadeleri asıl hesaplaacağıı ve yorumlaacağıı göreceğiz. 12.1 Değişkeleri Görsel Olarak İrdelemesi İki değişke arasıda ilişki olup olmadığı irdeleirke öcelikle değişkeleri bir grafiğe aktarılması faydalı olacaktır. Buu içi geellikle bir saçılma grafiği kullaılır. Aralarıda korelasyo olup olmadığı belirleecek iki değişkede biri saçılma grafiğii x ekseie diğeri ise saçılma grafiğii y ekseie yerleştirilir. Öreği Şekil 12.1'de parlak 9 aakol yıldızıı kütleleri ve yarıçapları bir saçılma grafiği üzeride gösterilmektedir. Şimdi kouya devam etmede bu saçılma grafiğii iceleyerek aakolda bulua yıldızları kütleleri ile yarıçapları arasıda bir ilişki olup olmadığıı tartışıız.
Şekil 12.1 Bazı aakol yıldızlarıı kütleleri ile yarıçaplarıı saçılma grafiği 12.2 Korelasyo Katsayısı (r) ve Alamı İki değişke arasıda doğrusal bir ilişkii olup olmadığı korelasyo katsayısı kullaılarak ortaya koabilmektedir. Korelasyo katsayısı (r) -1 ile 1 arasıda değerler almaktadır. Bu katsayıı asıl hesapladığıa geçmede öce aldığı değerleri e alama geldiğii tartışalım. r = 0 Durumu: Eğer korelasyo katsayısı sıfıra eşitse (veya çok yakısa) iki değişke arasıda bir ilişki olmadığı eğer varsa da bu ilişkii zayıf olması gerektiği söyleebilir. Acak bu yorum yapılırke dikkatli olumalıdır. Çükü ele alıa verileri sayısıı yetersiz olması, yeterli aralığa dağılmamış olması ve/veya hatalarıı yüksek olması da iki değişke arasıda mevcut ola bir ilişkii tespit edilmeside egel teşkil ediyor olabilir. Şekil 12.2'de korelasyo katsayısı sıfır ola iki değişkei saçılma grafiği gösterilmektedir. Şekil 12.2 Korelasyo katsayısı sıfır olduğu hesaplaa iki değişkei saçılma grafiği 0 < r < 1 Durumu: Eğer korelasyo katsayısı 0 ile 1 arasıda bir değere sahipse bu durum iki değişe arasıda pozitif bir ilişki olduğuu işaret eder. Bir başka deyişle, değişkelerde birii değeri arttıkça diğeri de artmaya eğilimlidir. Bu ilişkii e kadar et şekilde ortaya koabildiği r'i değerie bağlıdır. Eğer r'i değeri 1'e yakısa iki değişke arasıdaki ilişki iyi bir şekilde ortaya koabilmektedir. Acak r'i değeri 0'a doğru yaklaştıkça iki değişke arasıda yalızca zayıf bir ilişkii olabileceği veya eldeki verileri (veya verileri duyarlılığıı) böyle bir ilşkiyi ortaya koymada yetersiz olduğu söyleebilir.
-1 < r < 0 Durumu: Eğer korelasyo katsayısı 0 ile 1 arasıda bir değere sahipse bu durum iki değişe arasıda egatif bir ilişki olduğuu işaret eder. Burada öceki durumu tersie, değişkelerde birii değeri arttıkça diğeri azalmaya eğilimlidir. Yie bezer şekilde r'i değerii 0'a yakı olması ilişkii olmadığı veya mevcutsa da zayıf olduğu soucuu işaret ederke 1'e yakı olması da ilişkii varlığıı daha belirgi olduğuu göstermektedir. r=1 veya r= 1 Durumu: Korelasyo katsayısıı tam 1'e veya 1'e eşit olması (veya bu değerlereçok yakı olması) iki değişkei birbirlerie tamame bağlı olduğuu gösterir. r=1 olması durumuda pozitif bir ilişki olduğu, r= 1 içi ise egatif bir ilşkii olduğu görülür. Acak gerçek hayatta iki değişke arasıda böyle bir ilşkii olması çok olası değildir. Şekil 12.3'de farklı korelasyo katsayılarıa sahip ola değişke çiftlerii saçılma grafikleri verilmektedir. Şekil 12.3 Çeşitli değişkeleri saçılma grafikleri ile hesaplaa r korelasyo katsayıları
12.3 Korelasyo Katsayısı ile Temsil Edilmeye Durumlar Korelasyo katsayısı birbiriyle ilişkili ola iki değişkei şaçılma grafiğide oluşa eğrii eğimide bağımsızdır. Şekil 12.4'ü orta satırıda farklı eğime sahipola saçılma grafikleri gözükmektedir. Sol üç saçılma grafiğii korelasyo katsayısıı r = 1 sağ üç grafiği ise r = 1 olduğu görülmektedir. Görüldüğü gibi korelasyo katsayısı eğimde etkilememiştir. Bu gerçekte korelasyo katsayısıı e güçlü özellikleride biridir. Çükü ele aldıığımız değişkeleri birbirleri bağımlılıkları hep ayı eğime sahip olmak zoruda değildir. Korelasyo katsayısı bu alamda sadece saçılma grafiğii e kadar saçıldığıı temsil etmektedir. Şekil 12.4'ü e alt satırıa bakıldığıda birbirlerie sıradışı şekilde bağımlı bazı değişkeleri saçılma grafikleri verilmektedir. Bu değişkeler birbirlerie bağımlı olmalarıa karşı korelasyo katsayıları hesapladığıda r = 0 olduğu görülür. Bu durum dağılımdaki ilişkii eğrisel olmasıda (solda 1. ve 4. grafik), eş dağılımlı olmasıda (solda 2. ve 3. grafik) veya simetrik yapıda (5., 6. ve 7. grafik) olmasıda kayaklamaktadır. Bu gibi verilerde başka tür korelasyo belirteçlerii kullaılması gerekmektedir. Bu gibi sıradışı dağılımları olup olmadığıı kotrol edilmesi içi değişkeleri saçılma grafiklerii aalizi başıda çizdirilmesi oldukça öemlidir. Şekil 12.4 Birbirleriyle farklı şekillerde ilişkili ola değişkeleri saçılma grafikleri ve r korelasyo katsayıları Kayak: https://e.wikipedia.org/wiki/correlatio_ad_depedece#/media/file:correlatio_examples2.svg So olarak korelasyo katsayısı bir yüzde gibi düşüülmemelidir. Öreği, korelasyo değerii %85 olması iki değişkei birbiriyle %85 oraıda uyumlu olduğu alamıa gelmez. 12.4 Dağılımları Farklı Korelasyou Ayı Olduğu Durumlar Şimdi Şekil 12.5'te verile saçılma grafiklerii iceleyerek korelasyo katsayılarıı tahmi etmeye çalışı.
Şekil 12.5 Dört farklı değişke setii saçılma grafiği Kayak: https://e.wikipedia.org/wiki/correlatio_ad_depedece#/media/file:ascombe%27s_quartet_3.svg Şekil 12.4'te verile her grafik içi farklı korelasyo katsayıları tahmi etmiş olabilirsiiz. Acak bu dört grafiği de korelasyo katsayısı r = 0.816 dır! Şimdi bu grafiklerde karşımıza çıka durumları tek tek irdeleyelim; i) Sol üstte yer ala grafikte verileri homoje ve doğrusal olarak dağıldığı klasik bir saçılma grafiği gözükmektedir. Bu grafikteki değişkeleri arasıdaki ilşkii ortaya koması içi korelasyo katsayısı oldukça iyi bir ölçüttür. ii) Sağ üstteki grafikte ise değişkeleri birbirlerie eğrisel olarak bağımlı olduğu görülmektedir. Acak, korelasyo katsayısı sadece doğrulsal korelasyou tespit edebildiğide bu eğrisel değişimi sadece doğrusal bileşeideki uyumu ölçebilmiştir. İlişkii eğrisel olduğu düşüüldüğüde gerçekte bu iki değişke arasıda oldukça iyi bir korelasyo bulumaktadır. iii) Sol alttaki grafikte ise verileri birbirleriyle sıkı ilişkili olduğu görülmekle birlikte sadece tek bir aykırı değer korelasyo katsayısıı 1 yerie 0.816 çıkmasıa ede olmaktadır. Astroomide baze bu grafiğe bezer durumlar ile karşılaşılabilmektedir. Eğer veride tek bir değeri büyük bir sapma gösterdiği görülüyorsa korelasyo hakkıda yorum yapmada öce verii gerçekte doğru olup olmadığıı, bu farkılığı gözlemdeki bir hatada kayaklaıp kayaklamadığıı tespit edilmesi gerekir. iv) Sağ alttaki grafikte de bir grup verii ayı x değişkeide topladığı görülmektedir. Bu grafiğe bezer durumlar da astroomide oldukça yaygıdır. Öreği bir hava kütlesi hesabıda kullaılacak gözlemler güü belirli saatleride yapıldıysa verileri belirli hava kütlesi değerleride yoğulaştığı görülür. Korelasyo katsayısı burada yie veriler ışığıda uyumu e kadar olup olmadığıı olabilecek e iyi ihtimalle vermektedir. Acak ilşkii olup olmadığıı daha et şekilde ortaya koması daha geiş bir "x" aralığıda veri alımasıı gerektirir.
12.5 Korelasyo Katsayısıı Matematiksel İfadesi Korelasyo katsayısıı e alama geldiğii ve asıl yorumlaması gerektiğii açıkladığımıza göre artık asıl hesapladığıda söz edebiliriz. Bu hesaplama içi öcelikle Fark Kareler Toplamı ( KT ) ve Fark Çarpımlar Toplamı (ÇT ) ifadelerii taımlayalım. x ve y bir veride korelasyou iceleecek değişkeler olmak üzere; KT x = (x i x )2 KT y = ( y i y )2 ÇT xy = (xi x )( y i y ) Bir veri içi yukarıda verile ifadeler hesapladığıda iki değişke arasıdaki korelasyo katsayısı aşağıdaki gibi hesaplaır; r= ÇT xy KT x KT y Bu korelasyo katsayısı Pearso Korelasyo Katsayısı olarak da isimledirilir. 12.6 Bir Örek Veri İçi Korelasyo Katsayısıı Belirlemesi Şimdi bu kouu e başıda verdiğimiz aakol yıldızlarıı kütleleri ile yarıçapları değişkeleri içi korelasyo katsayısıı hesaplayalım. Çizelge 12.1'de dokuz parlak aakol yıldızıı kütle ve yarıçap değerleri suulmaktadır. Çizelge 12.1 Seçilmiş bazı parlak aakol yıldızlarıı kütleleri ve yarıçapları Yıldız Adı Kütle (M/M ) Yarıçap (R/R ) Spica 11.43 7.47 Bellatrix 8.60 5.75 Acherar 6.70 7.30 2 Lac 5.00 3.78 Vega 2.14 2.36 Procyo 1.50 2.05 Güeş 1.00 1.00 Alpha Cetauri B 0.91 0.86 61 Cyg A 0.70 0.66
Öcelikle ortalamaları hesaplayalım; xi x = i=0 = 11.43+ 8.60+ 6.70+5.00+2.14+ 1.50+ 1.00+0.91+0.70 =4.22 9 yi y = i=0 = 7.47 +5.75+7.30+3.78+2.36+2.05+1.00+ 0.86+0.66 =3.47 9 Şimdi fark kareler toplamlarıı ve fark çarpım toplamıı hesaplayalım; KT x = (x i x )2=(11.43 4.22)2 +...+(2.14 4.22)2+...+(0.70+ 4.22)2=123.367 =1 KT x = (x i x )2=(7.47 3.47)2 +...+(2.36 3.47)2 +...+(0.66 +3.47)2=60.021 =1 ÇT xy = (xi x )( y i y )=(11.43 4.22)(7.47 3.47)+...+(0.70 4.22)(0.66 3.47)=81.2215 Artık korelasyo katsayısıı hesaplamaya hazırız: r= ÇT xy 81.2215 = =0.94 KT x KT y 123.367 60.021 olarak elde edilir. Burada şu yoruma gidilebilir: İcelediğimiz aakol yıldızlarıı kütleleri ile yarıçapları arasıda belirgi bir pozitif ilişki olduğu saptamıştır. Aakoldaki yıldızları kütleleri arttıkça yarıçapları da artma eğilimidedir. Acak burada sadece 9 yıldızda bu souca vardığımızı ve bu uutmayı. Bu geellemeyi doğrulayabilmek içi gerçekte galaksii farklı bölgeleride gözlemiş çok daha fazla yıldızı gözlemie ihtiyaç vardır.