Doç. Dr. Mehmet AKSARALI www.mehmetaksarayl İstatstksel araştırmalarda k yada daha çok değşke arasıdak lşk celemes ç e çok kullaıla yötemlerde brs regresyo aalzdr. Değşkeler arasıdak lşk matematksel br modelle açıklaableceğ gb, lşk dereces ve yöü br br katsayı le de ortaya koyulablr. Bu da korelasyo aalz le sağlaablr. Değşkeler arasıdak lşklere bazı örekler vermek gerekrse; -İsaları boyları le kloları -Futbol takımlarıı çalışma süreler ve maç skorları toplamları -Öğrecler çalışma mktarları ve sıav otları -Br malı fyatı ve talep mktarı -Br ürüü verm ve verle gübre mktarı, vb.
Değşkeler arasıdak lşkler aşağıdak gb sııfladırılablr: Belrleyc (determstk lşkler arı belrleyc lşkler Deeysel (amprk lşkler arı belrleyc ve deeysel lşkler celemes regresyo aalz kapsamıa grmektedr. Regresyo aalzde değşkeler k grup altıda celer: - Bağımsız değşkeler (açıklayıcı değşkeler - Bağımlı değşkeler Bzm kotrol edebldğmz yada edemedğmz bağımsız değşkelerde meydaa gele değşklkler, bağımlı değşkelere etk ederek oları değer değştrmese ede olurlar. Öreğ kşler gelrler değşmes, harcama mktarlarıı da değşmese ede olur. Bu durumda gelr bağımsız değşke, harcama mktarı se bağımlı değşkedr. Regresyo aalzde geellkle bağımsız değşkeler (, bağımlı değşkeler ( le gösterlrler. 3 Bast doğrusal regresyodak bast kelmes k değşke arasıdak lşky açıklamak ç kullaılmasıda, doğrusal kelmes se kurula model parametreler açısıda doğrusal br model olmasıdadır. İk değşke arasıdak e bast lşk, br doğru le açıklaable lşkdr. y Geel olarak br doğruu matematk gösterm: = + şekldedr. Burada, x eğmdr ve tek brmlk değşme de yaptığı değşklğ gösterr. se değer olduğuda almış olduğu değerdr ve ekse kesme oktası olarak smledrlr. 4
Resm şu ada görütüleemyor. Br fabrkada taşıma şler ç kullaıla tırları yaşı le bakım harcamaları arasıdak lşky ele alalım. Verler grafğ çzldğde tam olarak düz br doğruu üzerde olmadıkları, fakat tırlar eskdkçe bakım harcamalarıı da arttığı görülmektedr. Burada bağımsız değşke yaş, bağımlı değşke se bakım harcamalarıdır, çükü yaş değştkçe bakım harcamaları değşklk göstermektedr. Pratklk olması açısıda yaş ve bakım harcaması arasıdak lşk br doğru şeklde olduğuu varsayarsak, bu model matematk gösterm: Bakım e Hata term harcaması yaş yaş-bakım harcaması grafğ bakım harcaması 9 8 7 6 5 4 3... 3. 4. 5. 6. 7. yaş 5 yaş-bakım harcaması grafğ bakım harcaması 9 8 7 6 5 4 3... 3. 4. 5. 6. 7. yaş e hata term, traktörler ç yapıla harcamaı, lşky açıklaya doğruda e kadar saptığıı gösterr. Tırları yaşı le yapıla bakım harcamaları arasıdak gerçek lşky belrleye model heüz belrlemş değldr. Buu ç modelde bulua parametreler ( ve blmes gerekr. ve brer parametre olduklarıda, gerçek değerler buluması ç taşıma şde kullaıla tüm tırları (populasyou bakım harcamaları ve yaşlarıı blmes gerekmektedr. Bu da çoğu zama mkasız olduğuda elmzdek öreğ kullaarak parametreler tahmlerz veya başka br fade şeklyle grafktek oktalara e y uya br doğruyu buluruz. 6 3
4 7 EN KÜÇÜK KARELER (EKK ÖNTEMİ İLE BİR DOĞRUNUN UUMU Gözlemler e y açıklaya doğruu belrlemes ç çeştl yötemler ler sürüleblr fakat güümüzde e çok kullaıla yötem E Küçük Kareler adı verle yötemdr. Bu yötem gözlemler belrlee doğruda uzaklıklarıı (hata termler kareler toplamıı e küçük yapılmasıa dayaır. e modelde hata term: e olarak yazılablr. Bu fade kares alııp tüm gözlemler ç toplaırsa: e İfades elde edlr. EKK yöteme göre bu fadey mmze ede b ve b değerler ve tahmcler olur. 8 e İfades mmze ede parametre tahmcler değerler bulablmek ç eştlğ ve e göre türevler alııp a eştler. e e Her k deklem de a eştlersek; b b b b... b b b b a göre türev alıırsa; e göre türev alıırsa;
b b.. b b b b Paratezler açarsak;. b b b b b b. Bu deklemlere doğruu NORMAL DENKLEMLERİ der. Normal deklemler alt alta yazılıp brlkte çözüldüklerde b ve b tahmcler buluur. (.(. b b b ( b b b b şekldek formüller yardımıyla da tahmcler buluablr. 9 Böylece ver oktalarımızda geçe e y doğru deklem: ˆ b b Gerçek tahmcs Traktör öreğmz ç gereke hesaplamaları yapıp ormal deklemler oluşturalım:. b b x y xy b b yaş (yıl (x bakım harcaması (y. 5 4 65 5 4.5 9.5 8464 44 4.5 495.5 455 75 4. 55 6 35 5. 79 5 64 395 5.5 5 3.5 5 5775 5. 97 5 949 485.5 95.5 385 975 6. 8 36 64 48. 5 465 5. 37 369 37 3. 68 9 464 4 toplam 4. 775. 88. 544565. 355. ortalama 3.5 66.4-775 = b +4b 355= 4b +88b 35*(775 = b +4b 355= 4b +88b 54537.5 =4b +47b 355 = 4b + 88b -56988 = -4b b =39 5
775 =b +4b 775 =b +4*39 b = 95 Tahmcler elde etmek ç ormal deklemler yere formüller kullaılırsa da ayı souçlar elde edlr. Doğruu deklem: ˆ 95 39 Hesaplaa bu deklem kullaılarak yaşıı bldğmz br traktör ç yapılacak ortalama bakım masrafıı tahm edeblrz. Öreğ x=4 yaşıdak br traktör ç bakım masrafları: ˆ 95 39 ˆ 95 (39(4 6755 olarak buluur. Tahmlee Regresyou Duyarlılığı Regresyo deklem tahmledkte sora bu deklem lşky e derece açıkladığı ve bu deklem kullaılarak yapılacak tahmler e derece hassas olacağıı araştırılması gerekr. Buu ç gözlee değerler le tahm değerler arasıdak farkı yazıp y ler ortalamasıı bua ekleyp çıkarırsak aşağıdak fadey elde ederz. Bu fade grafksel karşılığı şeklde görülmektedr. ( ( ( Gözlem değer ( e ( tahm değer ( ˆ ( ˆ Regresyo doğrusu b b ortalama doğrusu ˆ 6
( ( ( Daha sora her k tarafı kareler alııp tüm gözlemler ç toplaırsa; ( ( İfade tekrar düzelerse: ( Ortalama etrafıdak kareler toplamı (geel KT Gözlem değer ( ( ( ˆ ( ˆ tahm değer Regresyo kareler toplamı Regresyo doğrusu ˆ b b ortalama doğrusu ( ( ( Regresyoda sapmalar (hata kareler toplamı 3 Eğer gözlee değerler heps tahm edle doğru üzerde olsaydı, hata kareler toplamı olacak ve uyumu çok y olduğu söyleeblecektr. Bu blgy kullaarak, regresyo doğrusuu e derece y tahmlemş olduğuu regresyo kareler toplamıı ortalama etrafıdak kareler toplamıa oraıa bakarak söyleyeblrz. Bu oraa BELİRLEME KATSAISI adı verlr ve R le gösterlr. R regresyo kareler toplamı ( geel kareler toplamı ( R e yaklaşa değerler bze uyumu y olduğuu belrtr. (<R < Gözlem değer ( ( ( ˆ ( ˆ tahm değer Regresyo doğrusu ˆ b b ortalama doğrusu Şeklde de görüldüğü gb, regresyo kareler toplamıı büyümes, gözlem değer tahmlemş regresyo doğrusua yaklaşması alamıa gelmektedr ve bu da belrleme katsayısıı arttırır. 4 7
Hesaplama kolaylığı açısıda kareler toplamları formüller aşağıdak şeklde de kullaılablr: Geel kareler toplamı (GKT Regresyo kareler toplamı (RKT Hata kareler toplamı (HKT ( ( ( b ( / ( lk ks farkı / 5 Korelasyo Katsayısı Korelasyo katsayısı, regresyo model le bulua tahm değerler, gerçek değerlere uyguluğuu ölçmede kullaılır. Korelasyo katsayısı - le arasıda değşr. Katsayıı - çıkması, k değşke arasıda ters yölü tam br lşk olduğuu, çıkması se doğru yölü tam br lşk olduğuu fade eder. Katsayıı - e doğru yaklaşması,değşkeler arasıda ters yölü kuvvetl br lşky gösterrke, e yaklaşması değşkeler arasıda doğru yölü kuvvetl br lşky fade eder. Korelasyo katsayısıı şaret, regresyo doğru veya eğrse at eğm katsayısıı şaretdr. Korelasyo katsayısıı kares, belrleme katsayısıı determasyo katsayısıı verr. 6 8
Sıırlı sayıda ver üzerde hesaplaa korelasyo katsayısı br statstktr ve r le gösterlr.bu statstğ aakütle parametres olarak karşılığı dur. ( ˆ Korelasyo katsayısı ç geel formül; r ( yada r Bu formülde; xy ( ( x ( xy ( y x ( y ( 7 Bütü bu değerler katsayısı le çarpılırsa souç değşmez ve korelasyo katsayısı; r ( ( ( ( Test statstğ, mutlak olarak krtk değerde büyük çıktığıda le değşkeler arasıda öeml br lşk olduğuu söyleyeblrz. Buula brlkte bu değşkeler arasıda matık br lşk buluması şarttır. Baze hç alakası olmaya değşkeler arasıda da yüksek br korelasyo çıkablmektedr. Bu tp korelasyolara sahte korelasyo der. 8 9
ÖRNEK Br süper market yöetcs tesadüf olarak seçle br saatlk sürelerde kasaya gele müşter sayısıı ve ödedkler toplam para mktarıı aşağıdak gb kaydetmştr. MüşterSayısı 5 5 35 4 Ödee Para.5.4 5.3. 4. ( TL 9 Müşter sayısıı bağımsız (, kasalara ödee para mktarıı bağımlı değşke olarak kabul ederek, doğrusal korelasyo katsayısı; ( ( r ( ( formülü le kolayca hesaplaablr. Toplam 5.5 3.5 65 56..4 8 4 8. 5 5.3 65 5 64.9 35. 77 5 48.4 4 4. 964 6 58.8 7 9.5 3456. 5 635 893. 3
r 5(3456.5 7(9.5 5(635 7 5(893.3 (9.5.9669 Örek:996-5 yıllarıdak Türkye turzm gelrler le Türkye ye gele turst sayısı tabloda verlmştr. ıllar Turzm Gelrler abacı Zyaretç Sayısı 996 5.65 8.64 997 7.8 9.689 998 7.77 9.75 999 5.93 7.464 7.636.4 8.9.569 8.48 3.47 3 9.677 4.3 4.5 7.57 5 3.99.
Turzm Gelrler le abacı Zyaretç Sayısı verler arasıdak dağılma dyagram Turzm Gelrler 6 4 8 6 4 3 4 5 6 7 8 9 3 4 5 6 7 8 9 abacı Zyaretç Sayısı 3 Doğrusal tüketm foksyouu ormal deklemler yoluyla tahm: Tablo : Verler ormal deklemler le çözüm ç düzelemes * 5.65 8.64 48.669 74. 7.8 9.689 67.95 93.8767 7.77 9.75 69.99 95.5 5.93 7.464 38.765 55.73 7.636.4 79.56 8.497 8.9.569 93.593 33.848 8.48 3.47.3478 75.483 9.677 4.3 35.7683 96.849.5 7.57.3936 36.845 3.99. 94.83 446.388 =84.96 6 =3.46 =53.38 =686.45 4
Doğrusal tüketm foksyouu ormal deklemler yoluyla tahm: = b. + b. = b. + b. 84.96 = b. + b. 3.4 53.3= b.3.4 + b. 686.4 b =.597 b =.64 ˆ.597. 64 abacı zyaretç sayısı arttıkça turzm gelr artmaktadır. 5 Doğrusal tüketm foksyouu formülde tahm: bˆ (686.45*(84.966 (3.46*(53.38 *(686.45 (3.46 (.597 bˆ *(53.38 (3.46*(84.966 *(686.45 (3.46.64 6 3
Doğrusal gelr foksyouu ortalamada farklara göre tahm y x yx x y -.8466-3.776.69 3.895 8.3 -.4886 -.656 3.9486 7.36.59 -.396 -.5896 3.47 6.76.743-3.336-4.8776 6.36 3.799.937 -.866 -.996.666 3.733.746 -.466 -.776.34.5969.653 -.56.954 -.4.897..84.6884.999.856.3933 3.684 5.754 8.7784 6.7847 3.65 5.434 8.784 47.6986 77.954 9.59 y=. x=. yx=4.5 x =63.99 y =67.949 9 7 b yx x 4.5 63.99 b b 8.4966 (.64*.346.59 8 4
R R Belrllk Katsayısı: RKT bˆ regresyo kareler toplamı ( geel kareler toplamı ( ( ( 66.8873.9844 67.9499 (3.46 (.64 686.45 GKT ( ( 66.8873 / 789.87 79.9 67.9499 ORUM: Bu souç bze, turzm gelrlerdek değşkelğ (varyasyou %98.44 üü gele zyaretç sayısı le açıklaabldğ göstermektedr. Korelasyo Katsayısı r.98.44.99 Turzm gelr le gele zyaretç değşkeler arasıda poztf yöde kuvvetl br lşk vardır. 9 (3.46 RKT (.64 686.45 HKT e.5 GKT ( ( 66.8873 / 789.87 79.9 67.9499 3 5
ÖRNEK: süre (x ot (y x kare x.y y kare 5 4. 5.5 6.8 3 3.5 9.5.5 4 6 4.5 36 7.5 4.9 49 4. toplam 5 9 7 9 77.3 ort 5 3.8 İstatstk ders sıavıa çalışmak ç 5 öğrec etk olarak harcadıkları süreler ve sıav souçları aşağıda verlmştr. Bu verler ışığıda çalışıla süre le sıav otu arasıdak lşky çzz, deklem tahm edz. Belrleme katsayısıı hesaplayarak yorumlayıız. Daha sora varyas aalz tablosuu hazırlayarak belrledğz doğruu eğm olup olmadığıı kotrol edz. Ayı hpotez t test le tekrar kotrol edz ve bulgularıızı karşılaştırıız. 3 ot 6 5 4 3 3 4 5 6 7 8 9 süre 9-5. b - 5b = 9-5b -5*.3= b =.3 Formülle hesaplarsak: b. b b b 9-5. b - 5b = 9-5b - 7b = 5*(9-5b - 5b = 9-5b - 7b = 95-5b - 5b = - 9-5b - 7b = -4 + 46b = b =.3 (.( 5*9 9 5 4 b.3 b b 3.8.3*5. 3 ( 65 7 46 3 5 6
Böylece doğruu deklem: ˆ b b.3. 3 ( ( ˆ b ( / 77.39 /55. ( /.3 7 5 /5 4. 4 R ˆ regresyo kareler toplamı ( geel kareler toplamı ( 4.4.8 5. ORUM: Bu souç bze, sıavda alıa otları değşkelğ (varyasyouu %8 çalışıla saatler arasıdak farklılıklar le açıklaabldğ göstermektedr. 33 7