İSTATİSTİK ANABİLİM DALI

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "İSTATİSTİK ANABİLİM DALI"

Transkript

1 ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ Yekta Stara KOÇ ROBUST TAHMİN EDİCİLERİ VE ÖZELLİKLERİ İSTATİSTİK ANABİLİM DALI ADANA, 007

2 ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ROBUST TAHMİN EDİCİLERİ VE ÖZELLİKLERİ Yekta Stara KOÇ YÜKSEK LİSANS TEZİ İSTATİSTİK ANABİLİM DALI Bu tez 5/ 09 / 007 Tarhde Aşağıdak Jür Üyeler Tarafıda Oybrlğ/ Oyçokluğu İle Kabul Edlmştr. İmza İmza.. İmza Prof.Dr. Fkr AKDENİZ Prof.Dr. Hamza EROL Prof.Dr. H.AltaÇABUK DANIŞMAN ÜYE ÜYE Bu tez Esttümüz İstatstk Aablm Dalı da hazırlamıştır. Kod No: Prof.Dr. Azz ERTUNÇ Esttü Müdürü İmza ve Mühür Not: Bu tezde kullaıla özgü ve başka kayakta yapıla bldrşler, çzelge, şekl ve fotoğrafları kayak gösterlmede kullaımı, 5846 sayılı Fkr Eserler Kauudak hükümlere tabdr.

3 ÖZ YÜKSEK LİSANS TEZİ ROBUST TAHMİN EDİCİLERİ VE ÖZELLİKLERİ Yekta Stara KOÇ ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ İSTATİSTİK ANABİLİM DALI Daışma: Prof. Dr. Fkr AKDENĠZ Yıl: 007, Sayfa: 0 Jür: Prof.Dr. Fkr AKDENĠZ Prof.Dr. Hamza EROL Prof.Dr. H. Alta ÇABUK Robust tahm edcler, ver kümesde güvel gözlemler homoje dağılmaması durumuda güvel souçlar bulmak ve sapa değerler etks azaltmak amacıyla kullaılır. Tez temel amacı; klask regresyo aalzde sapa gözlemler varlığı edeyle stadart varsayımları sağlamaması durumuda e küçük kareler yöteme alteratf olarak suula robust regresyo yötemler celemesdr. Bu çalıģmada öce sapa değerler, kırılma oktası ve etk foksyou kavramları ele alıacak, sora robust bast regresyo ve çoklu regresyodak tahm edcler celeecektr. Öreklerle bu tahm edcler, e küçük kareler tahm edcsyle karģılaģtırılacaktır. Aahtar kelmeler: E küçük kareler tahm edc, E küçük medya kareler tahm edc, Kırılma oktası, Robust tahm edc, Sapa değer I

4 ABSTRACT MSc.THESIS ROBUST TAHMİN EDİCİLERİ VE ÖZELLİKLERİ Yekta Stara KOÇ DEPARTMENT OF STATISTICS INSTITUTE OF NATURAL AND APPLIED SCIENCES UNIVERSITY OF ÇUKUROVA Supervsor: Prof. Dr. Fkr AKDENĠZ Year: 007, Sayfa: 0 Jury: Prof.Dr. Fkr AKDENĠZ Prof.Dr. Hamza EROL Prof.Dr. H.Alta ÇABUK Robust estmators are used for reducg the effects(weghts) of outlyg observatos the data set to get more relable ad stable estmators. The am of ths thess s to propose robust regresso procedures as a alteratve method to Least Squares procedure whch s wdely used classcal regresso aalyss ad very sestve to outlyg observatos. I ths thess, frstly outler ad breakg pot cocepts wll be troduced, secodly a geeral overvew of estmators for robust smple ad multple regresso wll be gve ad fally these estmators wll be compared wth classcal Least Squares estmators ad examples wll be provded. Keywords: Breakg Pot,, Least meda squares estmator, Least squares estmator, Outler, Robust estmator, II

5 TEŞEKKÜR Bu tez hazırlaması esasıda değerl blgler ve kayaklarıı bemle paylaģa daıģmaım sayı Prof.Dr. Fkr AKDENĠZ e; yardımlarıı esrgemeye Ġstatstk bölümü öğretm elemalarıa teģekkürlerm suarım. Ayrıca eğtm ve öğretm hayatım boyuca madd ve maev katkılarıı esrgemeye aleme teģekkürü br borç blrm. III

6 İÇİNDEKİLER SAYFA ÖZ. I ABSTRACT.II TEġEKKÜR III ĠÇĠNDEKĠLER...IV TABLOLAR DĠZĠNĠ...V ġekġller DĠZĠNĠ...VII.GĠRĠġ.. Kırılma oktası (Breakdow pot).. Etk foksyou (Ifluece fucto).. ÖNCEKĠ ÇALIġMALAR VE REGRESYON ANALĠZĠNDE SAPAN DEĞERLER BASĠT REGRESYON 3.. GrĢ E Küçük Medya Kareler Doğrusuu Hesaplaması Örekler Tam Model Özellkler Br Öreğ Orjde Geçe Bast Regresyo Bast Regresyo Ġç Dğer Robust Tekkler 5 4. ÇOKLU REGRESYON 4.. GrĢ Çoklu Regresyoda E Küçük Medya Kareler Hesaplaması Örekler LMS,LTS ve S-Tahm Edcler Özellkler ĠzdüĢüm Aramayla ĠlĢk Robust Çoklu Regresyoua Dğer YaklaĢımlar.9 5.SONUÇLAR VE ÖNERĠLER...0 KAYNAKLAR.0 ÖZGEÇMĠġ..0 IV

7 TABLOLAR DİZİNİ Tablo3.. Plot-Plat Vers 4 Tablo3.. Belçka da Yapıla Uluslar arası Arama Sayısı...8 Tablo3.3.CYG OB Yıldız Kümes Hertzprug-Russell Dyagramıı Verler..9 Tablo3.4. Ġlk Kelme-Gesell Adaptasyo Skor Vers 40 Tablo Arasıda Belçka da Yagı Ġhbarlarıı Sayısı..4 Tablo Arası Srebest Ç dek Aa ġehrlerde Yıllık Ortalama Fyat ArtıĢı...43 Tablo Hayvaı Vücut ve Bey Ağırlıkları 46 Tablo3.8. Bey ve Vücut Ağırlıkları Vers Ġç StadartlaĢtırılmıĢ EKK ve RLS Rezdüler...48 Tablo3.9. Segel Ver Kümes...50 Tablo4.. Yığı Kaybı Vers.58 Tablo4.. Orta Atlas ve Ye Ġgltere Bölgesde 0 Okulu Blgs Ġçere Colema Ver Kümes...6 Tablo4.3. Colema Vers: Tahm EdlmĢ Sözlü Sıav Souçlarıı Ortalaması ve EKK ve LMS Model ç Ortak Rezdüler...6 Tablo4.4. Colema Vers: EKK ve RLS Modellere Göre t Değerler...63 Tablo4.5. Tuzluluk Vers...64 Tablo4.6. Mayıs 973 ç Hava Kaltes Vers Kümes..67 Tablo4.7. Hava Kalte Vers: Tahm Yaıt ve StadartlaĢtırılmıĢ Souçlarla EKK Model 68 Tablo4.8. Hava Kaltes Vers: LMS ye Dayalı RLS Model...69 Tablo4.9. Hawks, Bradu Ve Kass ı Yapay Ver Kümes..7 Tablo4.0. Br sıvıı bulaıklık vers.73 Tablo4.. Bulaık Nokta Vers: EKK ve RLS Regresyouyla Tahm Eğm ve Kese le t Değerler...76 Tablo4.. Bulaık Nokta Vers: Özet Değerlerle. Derecede Model Ġç EKK ve RLS Tahmler...79 Tablo4.3. Kalp sodası vers...80 V

8 Tablo4.4. Kalp Sodası Vers: EKK ve RLS Souçları..80 Tablo4.5. Kalp Soda Vers:DeğĢkeler Arasıdak Korelasyo.83 Tablo4.6. Eğtm Gderler Vers 87 Tablo4.7. Eğtm Harcamaları Vers EKK ve RLS Souçları: Katsayılar, Stadart Hatalar,ve t-değerler...89 Tablo4.8.. p bazı değģkeler ç * / p değer 96 VI

9 ŞEKİLLER DİZİNİ ġekl.. (a) beģ oktalı orjal ver kümes ve EKK regresyo doğrusu. (b) se (a) dak ver le ayı fakat y-yöüde sapa var...7 ġekl.. (a) BeĢ oktalı orjal ver kümes ve EKK regresyo doğrusu. (b) se (a) dak ver le ayı fakat x-yöüde sapadır ( kaldıraç oktası )..9 ġekl.3. (x k,y k ) oktası x k sapa olduğu ç br kaldıraç oktasıdır. Fakat. (x k,y k ) br regresyo sapaı değldr çükü dğer ver kümeleryle brlkte modele uyuyor....0 ġekl.4. Regresyo ver kümes (x,x ) açıklayıcı değģkeler grafğ... ġekl.5. (a) L regresyouu y-yöüdek sapmaya karģı robustlığı (dayaıklılığı). (b) L regresyouu x-yöüdek sapaa karģı hassaslığı( kaldıraç oktası )....4 ġekl.6. LMS regresyouu y-yöüde (a) da y-yöüdek sapaa ve (b) de x- yöüdek sapaa karģı dayaıklılığı...0 ġekl3.. EKK ve LMS modelyle Plot-Plat vers..5 ġekl3.. ġekl dek le ayı ver fakat tek sapaı var. Keskl doğru EKK modele karģılık gelr. Düz çzgl doğru se oktaları yarısıı çere e dar Ģertle çevrlr....6 ġekl3.3. Belçka da yılları arasıdak uluslar arası telefo aramaları sayısıı EKK ve LMS model...7 ġekl3.4. CYG OB yıldız kümes Hertsprug-Russell dyagramıı EKK ve LMS model ġekl3.5. Ġlk kelmedek yaģıa göre Gesell adaptasyo skoruu saçılım grafğ 40 ġekl yıllarıda Belçka dak yagı hbarıı sayısı...4 ġekl tae hayva ç logartmk vücut ağırlıklarıa göre logartmk bey ağırlıklarıı EKK ve RLS model...47 ġekl3.8. Tam model öreğ. Segel ver kümes EKK ve LMS model saçılım grafğ...49 ġekl3.9. Bulaıklık Vers Saçılım Grafğ...50 VII

10 ġekl3.0. Lbby ve Newgate tek su debs saçılım grafğ EKK ve LMS model....5 ġekl3.. Altı yötem kullaılarak yapay ver ç regresyo doğruları. (RLS, LMS e dayalı yede ağırlıkladırılmıģ e küçük kareler; EKK, e küçük kareler; M,Huber M tahm edcs; GM, Mallows u ve Schweppe M tahm edcler; RM, tekrarlı medya...54 ġekl4.. Yığı kaybı vers: EKK ye göre deks grafğ 59 ġekl4.. Yığı kaybı vers: LMS ye göre deks grafğ 59 ġekl4.3. Tuzluluk vers: EKK modele göre rezdü grafğ...65 ġekl4.4. Tuzluluk vers: LMS modele göre rezdü grafğ 66 ġekl4.5. Hawks-Bradu-Kass vers: EKK regresyoua göre deks grafğ.7 ġekl4.6. Hawks-Bradu-Kass vers: LMS regresyoua göre deks grafğ...7 ġekl4.7. Bulaık okta vers: saçılım grafğ...75 ġekl4.8. Bulaık okta vers. EKK ye göre rezdü grafğ.75 ġekl4.9. Bulaık okta vers. LMS ye göre rezdü grafğ...77 ġekl4.0. Bulaık okta vers: Kuadratk model ç EKK rezdü grafğ..77 ġekl4.. Bulaık okta vers: Kuadratk model ç RLS rezdü grafğ...77 ġekl4.. Kalp sodası vers. çocuğu boylarıa karģı uygu sodaı uzuluğu 8 ġekl4.3. Kalp soda vers: çocuk ç ağırlığa karģı uygu soda uzuluğuu saçılım grafğ...88 VIII

11 . GİRİŞ Yekta Stara KOÇ.GİRİŞ Regresyo aalzde amaç; gözlee değerlere uya e y deklem oluşturmaktır. Brçok regresyo tekğ olmasıa karşı bularda e kullaışlı; olaı klasklğ ve hesaplama kolaylığıda dolayı e küçük kareler (EKK) tahm edcsdr. Fakat bu tahm edc sapa değerlere karşı çok hassastır. Bu probleme çözüm bulmak amacıyla sapalar değerlerde çok etklemeye ye statstksel tekkler gelştrld. Böylece robust (dayaıklı) tahm edcler ortaya çıktı. Bu yötem ver çoğuluğua uygu br model tasarlamaya çalışır. Ya, ver kümes küçük br bölümü sapa değerlerde oluşsa ble kala büyük bölüm güvelr souçlar verr. Bu çalışmada bast regresyo ve çoklu regresyo olmak üzere k aa başlık altıda robust tahm edcler ele alımış ve buları souçları örekler aracılığıyla klask EKK aalzyle karşılaştırılmıştır. Kouu daha y alaşılması ç bazı taımlar bu kısımda verlmştr... Kırılma Noktası (Breakdow Pot) tae ver oktasıda oluşa herhag br öreklem alalım: Z {( x,..., x p, y),..., ( x,..., xp, y )} (.) T br regresyo tahm edcs olsu. Ya Z öreklemde T ye başvurularak ˆ regresyo katsayılarıı br vektörü elde edlr. T(Z)= (.) dr. Orjal ver oktalarıı herhag m taes keyf değerlerle değştrls. Böylece Z öreklem Z bas (m;t,z) le fade edlr ve bas (m;t,z) = sup Z e döüştürülür. Bu durumda maksmum yalılık T ( Z ) T( Z) (.3)

12 . GİRİŞ Yekta Stara KOÇ olarak taımlaır. Burada bas (m;t,z), sosuz se ya m sapa değer T üzerde geş br etkye sahpse bu tahm edc kırılması olarak açıklaır. Bu edele, örektek T tahm edcs kırılma oktası solu öreklem ç * m ( T, Z) m ; bas( m; T, Z) sosuz (.4) şeklde taımlaır. Dğer br fadeyle bu T (Z) de uzaktak keyf değerler ç T tahm edcs ede olduğu bozulmaı e küçük kırılmasıdır. Dkkat edlrse bu taım, dağılımları olasılığıı çermez! EKK ya göre bütü sıırlar üzerde T y taşımak ç br sapa değer yeterl olduğu görülür. Bu edele kırılma oktası, * ( T, Z) * dr. Burada öreklem geşlğ arttıkça ( T, Z ) fades 0 a yaklaşır. Bu edele EKK, % 0 lık kırılma oktasıa sahptr delr. Bu EKK yötem sapa değerlere karşı aşırı hassaslığıı da gösterr... Etk Foksyou ( Ifluece fucto=if) Kırılma oktası, güverlğ evresel br ölçüsüyke; etk foksyou, tahm edc üzerdek so derece küçük etkler ölçer. F dağılımıda T tahm edcs etk foksyou, IF(z;T,F) = lm 0 T. F. z T( F) dr. Örek uzayı tüm z oktalarıda lmt vardır. z term, z oktasıdak bütü yığııı olduğu olasılık dağılımıdır. Etk foksyou, ver kümesde sapa değerler etkledğ yalılığı fade eder. Homoje olmaya verler dağılımıda bu fade, tahm edc,

13 . GİRİŞ Yekta Stara KOÇ T F z T( F) IF z; T, F şekldek br yaklaşımıı verr. Solu öreklemlerle çalışıldığıda zama etk foksyouu keskl tp kullaablr. Bua hassas eğr (sestvty curve=sc) der. Hassas eğr, SC(z) = T. F z T ( F ) IF z; T, F le taımlaır. Burada F, Z z,..., x, y,..., z x,..., x p, y,..., x p le oluşturulmuş deeysel br dağılımdır. Eğer br gözlem le z sapa değer yer değştrlrse T z,..., z, z T( F ) SC z fades buluur. Hatta gözlemler olasıdır. Bu durumda da m/ küçük br kırılmasıyla yer değştrmes T m z,..., z, z T( F ) IF( z; T, F) fades elde edlr. Bütü tahm edcler br kırılma oktasıa sahptr. Buula brlkte mutlaka br etk oktasıa sahp olması gerekmez. 3

14 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ.ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Regresyo aalzde amaç; gözlee değerlere e y uya deklemler oluşturmaktır. Klask leer model, y = x +. x e =,,, (.) p p dr. Burada öreklem geşlğ, x,, x p açıklayıcı değşkeler, y yaıt değşkedr. e hatalarıı se 0 ortalamalı ve blmeye varyaslı ormal dağılıma sahp olduğu varsayılır. Blmeye parametre vektörü ya.. p, (.) verde tahm edlr. Ver ç değşkeler olaylar x. x. x... x p... x p... x p y. y. y (.3) matrs gösterm kullaılsı. Böyle br ver kümese regresyo tahm edcs uyguladığıda. p (.4) 4

15 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ elde edlr. Burada j tahmler, regresyo katsayıları olarak adladırılır. Gerçek blmemese rağme j tahm edcler le açıklayıcı değşkeler çarpılarak j y x... x p p (.5) tahm edle değerler elde edlr. Bu durumda -c olayı r rezdüsü, y gözlemş değerler le ŷ tahm edle değer farkı olarak taımlaır. Ya, r = y - y (.6) dır. E popüler regresyo tahm, edcs Gauss ve Legedre tarafıda buludu. Bu tahm edc, r m (.7) fadese karşılık gelr. Bu tahm edc amacı (.7) le verle fadey mmum yaparak model e y duruma getrmektr. Bu yötem çok y ble e küçük kareler yötemdr (EKK). Bu yötem, statstğ öeml br köşe taşıdır. Popüler olmasıı ede se alaşılmasıı kolaylığıdır. 800 lü yıllarda buluduğuda blgsayarlar yoktu ve EKK tahm edcs verde belrl br matrs cebr le kolayca hesaplaablrd. Güümüzde ble brçok statstksel paket program hala geleeksellğ ve hesaplama hızıda dolayı ayı tekğ kullamaktadır. Ye de tek boyutlu durumda (.7) de verle EKK krter gözlemler artmetk ortalamasıı verr k o zama da e uygu koum tahm edcs olduğu görülür. Sorada Gauss EKK yı e y duruma getre hata dağılımı olarak ormal dağılımı (Gaussa Dağılımı ) öerd. Böylece güzel br matematk teors oldu. Oda sora Gaussa varsayımları ve EKK ı kombasyou, statstk tekkler üretlmes ç stadart br mekazma oldu. ( Öreğ Çoklu yer, Varyas Aalz, Mmum varyas sııflaması gb) 5

16 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ Daha yakı zamalarda brçok araştırmacı, gerçek verler klask varsayımları tamame sağlamadığıı farketmeye başladı. ( Studet 97, Pearso 93, Box 953 ve Tukey 960). Bast doğrusal regresyo modelde sapa değerler etkler celeyelm. y x e (.8) bast doğrusal regresyo modelde eğm ve sabt tahm edlmeldr. Bu (.) dek fadede p = özel durumudur. Çükü x = x ve x tüm =,.. ç olur. Geelde açılayıcı değşke olması sabt terml regresyou elde etmek ç kullaıla stadart br yoldur. Bast doğrusal regresyo modelde saçılım grafğ olarak adladırıla (x, y ) grafğ oluşturulur. p geel hal ç çoklu regresyo modelde bu mümkü olmaz. İşlemler görsel olarak açıklamak amacıyla bast doğrusal regresyo model kullamak daha ydr. Şekl.(a) (x, y ),, ( x 5, y 5 ) oktalarıı saçılım grafğ olsu. Burada bu oktalar doğrusal olarak uzaıyorlar. Böylece grafkte, y x olur. EKK doğrusuda görülebleceğ gb EKK çözümü verye çok y uyar. Fakat kopyalarke ya da taşırke y4 değer öreğ odalıklı kısmıı hatalı alıdığıı varsayalım. Bu durumda ( x 4, y4 ) değer deal doğruda uzaklaşacaktır. Şekl.(b), 4.oktaı.(keskl çzgyle yuvarlak çe alıa okta) orjal durumuda uzaklaştığıı ve yukarı doğru hareket ettğ gösteryor. Bu okta y-yöüde sapa değer olarak adladırılır. Bu se şekl.(a) dak EKK de oldukça farklı ola EKK doğrusu üzerde oldukça geş br etkye sahptr. Bu olayı lteratüre öeml katkısı 6

17 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ Şekl.. (a) beş oktalı orjal ver kümes ve EKK regresyo doğrusu. (b) se (a) dak ver le ayı fakat y-yöüde sapa var. olmuştur. Çükü geelde y gözlemler olarak, x,..., x p ler de sabt sayılar olarak düşüülür. Böyle sapa değerler geş poztf rezdülere ya da geş egatf rezdülere sahp olur. Gerçekte bu örekte 4.okta doğruda e uzak koumdadır. 7

18 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ Bu edele (.6) le verle r s şüphel br bçmde geştr. p geşlğdek (.) çoklu geel regresyoda ble k bu durumda very gözümüzde caladıramayız böyle sapalar rezdüler lstesde veya rezdü grafklerde buluablr. Fakat geelde x,..., xp açıklayıcı değşkeler rasgele değşkelğe bağlı olarak gözlemş celklerdr. Gerçekte de brçok uygulamada br yaıt değşke ve bazı açıklayıcı değşkelerde seçlmek zoruda ola değşkeler br lstes alıır. Bu edele y yaıt değşkede sadece kötü oktaları (gross errors) ede meydaa geleceğ br sebeb yoktur. Bazı durumlarda p geel olarak de büyük olduğu ç x,..., xp açıklayıcı değşkelerde brde sapa olması ble daha muhtemeldr ve bu edele br şeye yalış gtmek ç daha fazla fırsat vardır. Böyle br sapaı etks ç Şekl. dek bast regresyou br öreğ celeyelm: Şekl.a, EKK doğrusua y uya (x, y ),, ( x 5, y 5 ) oktalarıı çeryor.x hatalı grersek Şekl.b y elde ederz.o zama bu oktaya x yöüde sapa derz.bu okta EKK doğrusuu eğdğ ç EKK doğrusu üzerdek etks çok geştr.bu edele şeklb dek ( x, y ) oktası kaldıraç oktası olarak adladırılır. EKK tahm edcs üzerdek bu çekm şu şeklde açıklaablr: x orjal doğruda uzaklaştığı ç orjal doğrudak r rezdüsü çok büyük br değer 5 alır. r katkısıyla çok daha büyük olur. Bu edele orjal doğru EKK yöüde seçlemez ve gerçekte şeklb doğrusu r termler azar azar artsa ble,..., r5 r geşlğ azaltarak eğdğ ç e küçük r 5 ye sahp olur. Geelde ( x k, yk ) gözlem her e zama k x öreklemdek gözlemş x yığııda uzaklaşırsa kaldıraç oktası olarak adladırılır. k k y k bu durumda hesaba alımaz. Bu edele ( x, y ) oktası muhakkak br regresyo sapaı olmak 8

19 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ Şekl.. (a) Beş oktalı orjal ver kümes ve EKK regresyo doğrusu. (b) se (a) dak ver le ayı fakat x-yöüde sapadır ( kaldıraç oktası ). zoruda değldr. ( x, y k k ) ver çoğuluğu tarafıda taımlaa regresyo doğrusua yaklaştığıda Şekl.3 te görüldüğü gb y br kaldıraç oktası olarak düşüüleblr. Bu edele ( x, y ) ı br kaldıraç oktası olduğuu söylemek k k 9

20 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ uzaktak x bleşee göre sadece güçlü br bçmde etkl ˆ ve ˆ regresyo k katsayılarıa göre gücüü söylemek demektr. Fakat bu durum ( x, y ) gerçekte ˆ ve ˆ üzerde çok geş br etkye sahp olması alamıa gelmek zoruda değldr. Çükü ( x k, yk ) dğer verlere göre eğm kümese tamame uyablr ( Böyle br durumda kaldıraç oktası bazı güve bölgeler daraltacağıda oldukça yararlı ble olablr. ) k k Şekl.3. (x k,y k ) oktası x k sapa olduğu ç br kaldıraç oktasıdır. Fakat. (x k,y k ) br regresyo sapaı değldr çükü dğer ver kümeleryle brlkte modele uyuyor. Çoklu regresyoda ( x,..., xp ) p boyutlu br uzayda uzaır. ( Baze faktör uzayı olarak adladırılır. ) O zama kaldıraç oktası br ver kümesde ( x,..., x e göre uzakta kala ( x k,..., xkp ) ç ( x k,..., xkp Öcede, böyle kaldıraç oktaları esas, k p ) y ) olarak ye taımlaır. y k değere bağlı olarak EKK regresyo katsayıları üzerde güçlü geş br etkye sahpt fakat bu durumda kaldıraç oktalarıı taımlamak daha da zordur. Çükü boyut daha büyüktür. Gerçekte 0 tae açıklayıcı değşke olduğuda böyle br oktayı bulmak çok zor olablr. Buu gözümüzde caladıramayız. 0

21 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ Bu problem bast br öreğ Şekl3.4 te verlyor. Burada x, x ye karşı belrl br ver kümese göre verlyor. Bu grafkte tae kaldıraç oktasıı kolayca görürüz. Fakat x ve x ayrı düşüüldüğüde bu oktalar görülemez. Gerçekte {, x,..., x x }tek boyutlu öreklem sapalar çermez ve { x, x,..., x }de çermez. Geel olarak her değşkee ayrı ayrı bakmak ya da bütü değşke çftlere bakmak ble yeterl değldr. Uzaktak ( x,..., xp ) y belrlemek oldukça zor br problemdr. Fakat bz çoğulukla regresyo sapalarıda bahsedeceğz. Ya ( x,..., xp, y ) eş zamalı olarak hem yaıt hem de açıklayıcı değşkeler göz öüe alarak ver çoğuluğua göre leer lşkde ayrıla durumları takp eder. Şekl.4. Regresyo ver kümes (x,x ) açıklayıcı değşkeler grafğ. İk kaldıraç oktası var(keskl yuvarlak çde). Burada koordatları ks de sapa değl. Brçok sa EKK rezdülere bakarak regresyo sapalarıı keşfedlebldğ tartışır. Maalesef sapalar kaldıraç oktaları olduğuda bu doğru olamaz. Öreğ tekrar Şekl.(b) ye dkkat edelm. Kaldıraç oktası ola durum o doğruya oldukça yakı olsu dye EKK doğrusuu eğer. Souç olarak r y rezdüsü egatf küçük br sayıdır. Dğer tarafta r ve r5 rezdüler y oktalara karşılık gelmese rağme bu rezdüler daha geş mutlak değerlere sahptr. Eğer e yˆ

22 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ geş EKK rezdülü oktaları slme gb br kurula başvurulacaksa y oktalar lk başta slmeldr. Tab k böyle tek değşkel br ver kümese bakılabldğ ç böyle değşkel br ver kümesde gerçekte tümüyle problemszdr. Fakat EKK rezdüler dkkatl aalzlere rağme ble sapaları görülemedğ brçok çok değşkel ver kümeler vardır. Souç olarak regresyo sapalar ( hem x de hem y de ) stadart EKK aalzlerde cdd br rsk oluşturur. Esas olarak bu problem çıkış yolu vardır. İlk ve muhtemele e çok ble regresyo dagostkler yapmak ç br yaklaşımdır. Dagostkler etk oktalarıı belrlemek amacıyla verde hesaplaa bell celklerdr. Bu sapalar kaldırıldıkta ya da düzeltldkte sora kala olaylara EKK aalz yapılır. Tek br sapa olduğuda bu yötemlerde bazıları bell br zama dlmde sle br oktaı etkse bakılarak oldukça y çalışır. Maalesef dagostk sapalarıda brkaç tae olduğuda sapaları teşhs etmek çok daha zor olur ve böyle çoklu sapalar ç dagostkler oldukça gerekldr ve sıklıkla geş hesaplamaları artışıı sağlar. (bütü mümkü alt kümeler sayısı oldukça büyüktür. ) Br dğer yaklaşım robust regresyoudur. Bu yaklaşım sapalar tarafıda çok güçlü br bçmde etklemeye tahm edcler tasarlamaya çalışır. Bell belrsz robustlık fkre sahp brçok statstkç robustlığı amacıı bast br bçmde sapaları hmal etmek olduğua adı fakat bu doğru değldr. Akse sapaları taımlaabldğ robust regresyouda rezdülere bakılır k burada geelde EKK rezdüler yoluyla yapılamaz. Bu edele dagostkler ve robust regresyou gerçekte de sadece şu basamaklarda ayı amaca sahptr: Dagostk araçları kullaıdığıda lk olarak sapaları slmese çalışılır ve o zama EKK le y verye uygulaır. Akse robust aalz lk olarak ver çoğuluğuu br regresyoa uydurmak ster ve o zama robust çözümüde geş rezdülere sahp oktalar olarak sapaları keşfeder. Sorak basamak ortaya çıkarıla yapı hakkıda düşümektr. Mesela orjal ver kümese ger döüleblr ve kou sebep blgs sapalar çalışması ç kullaılır ve orjler açıklaır. Ye de eğer sapmalar model başarısızlığı ç belrt olup

23 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ olmadığı araştırılması gerekr. Öreğ belrl br döüşüm yapmak ya da kc derecel ( kuadratk )br term ekleyerek tahm edleblr. Dagostkler kadar robust tahm edcler de vardır ve ks brbrde ayırt etmek amacıyla e kadar etkl olduklarıı ölçmek gerekr. İkc kısımda bazı robust metotlarıda sapaları sayısı hesaplaarak kıyaslaacaktır. Alt bölümlerde temz ver kümeler kadar bozuk ver kümeler de aalz edleceğ brçok robust yöteme başvurulacaktır. Daha robust br regresyo tahm edcse doğru lk adım 887 de Edgeworth de geld. Edgeworth (.7) de r rezdüler kares alıdığı ç sapaları EKK üzerde çok geş br etkye sahp olduğuu celed. Bu edele e küçük mutlak değerler regresyo tahm edcs ler sürdü. Bu tahm edc şu şeklde taımlaır: ˆ m r (.9) Bu tekk geelde L regresyou olarak blr, EKK se L regresyou olarak blr. Oda öce Laplace bast medyaı elde etmek ç (.9) krter kullamıştı. Medya gb L regresyo tahm edcs tamame tek değldr. (Harter 977 ve Getle 977) tek değşkel medya ı kırılma oktası % 50 kadar yüksektr. Maalesef L regresyou kırılma oktası hala % 0 da daha y değldr. Nede görmek ç Şekl.5 e bakalım: Şekl.5 L regresyou da sapaları etks şematk br özet verr. Şekl.5(a), y-yöüdek sapaları etks gösteryor. EKK ı akse L regresyo doğrusu böyle br sapaa karşı robusttır. Yaklaşık olarak L regresyou 4. gözlem hala düzgü kaldığıda ve hala kala oktalara y br bçmde uyarke ayı şeklde kalır. Bu edele L uzaktak dolayı y ye karşı bz korur ve bu hususta EKK da 3

24 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ Şekl.5. (a) L regresyouu y-yöüdek sapmaya karşı robustlığı (dayaıklılığı). (b) L regresyouu x-yöüdek sapaa karşı hassaslığı( kaldıraç oktası ). terch edleblr. So yıllarda L yaklaşımıı statstğe belrl br yer kazadırdığı görülür. (Bloomfeld ve Steger 980,983; Narula ve Wellgto 98; Devroye ve Gyorf 984 ) Fakat L regresyou uzaktak x e karşı korumaz. Bu durum şekl 5b de görüleblr. Burada kaldıraç oktasıı etks şekldek EKK doğrusu üzerdekde ble daha güçlüdür. Bu kaldıraç oktası yeterce uzağa gttğde 4

25 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ ortaya çıkar. L doğrusu ou arasıda sağa geçer. Bu edele bast hatalı br gözlem tamame L tahm edcs yere geçeblr. Bu edele solu örekl kırılma oktası hala / dr. Bu yöde sorak adım Huber (973 s.800,98) bulduğu M tahm edcler kullaımıdır. Bular r rezdüler başka br foksyouyla (.7) de k r karelemş rezdüler yer değştrmes fkre dayaıyor. m ˆ p( r ) (.0) Burada p smetrk br foksyodur [p(-t)=p(t), t ç] ve 0 da tek mmuma sahptr. ˆ regresyo katsayılarıa göre bu fade farkı ( r ) x = 0 (.) verr. Burada, p türev ve vektörüdür: x -c durumdak açıklayıcı değşke satır x ( x,..., xp ) 0 = (0,,0) (.) Bu edele (.) gerçekte p tae deklem br sstemdr. Çözümüü bulmak her zama çok kolay değldr. Pratk olarak yede ağırlakladırılmış EKK (Hollad ve Welsch 977) ya da H-algortması dye adladırıla (Huber ve Dutter 974, Maraz 980) yötemlere dayaa plalar tekrar kullaılır. (.7) ya da (.9) u akse (.) çözümü y ekse büyütülmese azara uygu br şekle döüştürülemez. Bu edele ı belrl br tahm le rezdüler stadartlaştırmak zorudayız. Ya 5

26 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ ( r / ˆ) x = 0 (.3) yazılmalıdır. Burada ˆ eş zamalı tahm edlmeldr. Mmax asmtotk varyas tartışmalarıa ede olduğu ç Huber şu foksyou kullamayı ler sürdü: ( t) m( c,max( t, c)) (.4) (.4) lü M-tahm edcler statstksel açıda L regresyouda daha etkldr. (Normal dağılımlı br modelde) Ayı zamada uzaktak y lere göre hala daha robusttır. Fakat kırılma oktaları uzaktak x etks yüzüde hala / dr. Kaldıraç oktalarıı bu yaralaablrlğ yüzüde geelleştrlmş M-tahm edcler ler sürüldü..mallows (975) suduğu bu tahm edc belrl br ağırlık foksyou aracılığıyla uzaktak x sapalarıı etks sıırladırmak esas amacıdır. Mallows (.3) yere şu eştlğ kulladı: w( x ) ( r / ˆ) x 0 (.5) Schwepp (Hll 977 e bakıız.), Mallows u akse şuu kulladı: w( x ) ( r / w( x ) ˆ) x 0 (.6) Bu tahm edcler br tek sapa gözlem etks sıırladırmak umuduyla yapıldı. Buları etks etk foksyou (Hampel 974) dye adladırıla foksyolar aracılığıyla ölçüleblr. Böyle br krtere dayaarak ve w u e y seçmler 978 de Hampel, 980 de Krasker, 98 de Krasker ve Welsch, 985 te Rochett ve Rousseeuw ve ye 985 de Samarrow, 986 da Hampel so araştırması yapıldı. Bu edele karşılık gele GM (Geelleştrlmş M) tahm edcler geel olarak şu a sıırladırılmış etk tahm edcler olarak adladırılacaktır. Burada şu souç çıkar: 6

27 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ Bütü GM tahm edcler kırılma oktası p br foksyou gb azala br değerde daha y olmayablr. Burada p ye regresyo katsayılarıı sayısıdır. Bu çok yeterl değldr. Çükü bu arta boyutla brlkte kırılma oktasıı azalması alamıa gelr. Burada sapaları meydaa gelmes ç daha fazla fırsat vardır. Ayrıca Maroa Bustos Yoha üst sıırıa ulaşıp ulaşılmadığı açık değldr. Eğer ulaşılırsa GM tahm edcs bu amacı başarmış olableceğ kousuda açık değldr. Bölüm 3 ü 6. kısmıda bast regresyo durumuda (p=) küçük br kıyaslama çalışması gösterlecektr. Bu çalışma ayı kırılma oktasıa ulaşmış bütü GM tahm edcler göstermeyecektr. Fakat elbette k esas problem daha yüksek boyutlulardadır. Çeştl başka tahm edcler öerld. Mesela Wald (940) ı metodu, Nar ve Shrvastava (94), Bartlett (949), ve Brow ve Mood (95) ı metotları; eş yölü eğmler medyaı (Thel 950, Adche 967, Se 968); dayaıklı doğru (Tukey 970/97, Vellema ve Hoogl 98, Johstoe ve Vellema 985b); R tahm edcler (Jureckova 97, Jaeckel 97); L tahm edcler (Bckel 973, Koeker ve Bassett 978; Adrews 974 ü yötem). Maalesef bast regresyoda bu oktaları hçbr %30 luk kırılma oktasıa ulaşamadı. Üstelk oları çoğu p> ç ble taımlaamadı. Bütü bular yüksek kırılma oktalı robust regresyouu tamame mümkü olup olmadığı hakkıdak soruları arttırdı. Buu doğrulayıcı cevabı Segel(98) tarafıda verld. Segel %50 kırılma oktalı tekrarlı medya tahm edcs ler sürdüler. Gerçekte %50 bekleeblecek e y kırılma oktasıdır. (Bozulmaı daha geş mktarları ç öreğ y ve kötü kısmıı ayırt etmek ç mümkü olmaz. Segel tahm edcs aşağıdak gb taımlaablr: Herhag p gözlem ç x y,..., x, y, p p olsu. Bu oktalara tam olarak uya parametre vektörü hesaplaır. Bu vektörü j-c koordatı ˆ j med (...( med ( med j(,..., )))...) p (.7) p p dır. Bu tahm edc kolayca hesaplaablr fakat p gözlem bütü altkümeler sayısı ster. Bu se çok fazla zama alır. Küçük p-l problemlere başarılı br 7

28 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ bçmde uygulaır. Fakat dğer regresyo tahm edcler akse koordat yöüdek yapısı sayesde tekrarlı medya x leer döüşümler ç eşdeğşkel (equvarat) değldr. Yüksek kırılmalı regresyo yötemler ve equvaratları düşüelm. Buları taımak ç (.7) ye döelm. EKK yötem tam sm kareler e küçük toplamıdır.fakat açık olarak brkaç kş poztf sayı le yapılacak tek makul şey oları eklemek olacakmış gb toplam kelmes slmese karşılar.belk de tarhsel sm br soucu olarak brkaç kş bu tahm edc kare ya da başka br şey yere robust yapmaya çalışıyor.medya le toplamı yer değştrerek daha robust yapablrz. Ya; m med r ˆ (.8) dır. Bua e küçük kareler medyaı (the least meda of squares) tahm edcs der. Buu Rousseeuw 984 te buldu. Bu öer aslıda Hampel ı(975,s.380) fkre dayaıyordu. Bu tahm edc x sapalarıa olduğu kadar y dek sapalara karşı da çok sağlam olduğu ortaya çıkar. LMS (.5) rezdüler kulladığı ç açıklayıcı değşkeler üzerde leer döüşümlere karşı equvarattır. Maalesef LMS asmtotk etk görüüşüdek oktada yetersz br bçmde uygulaır. Buu tekrar etmek ç Rousseeuw(983,984) e küçük budamış kareler(the least trmmed squares) yötem sudu. Bu durum; m ˆ ( r ) : (.9) eştlğyle verlr. Burada ( r ) :... ( r ) : kares alıarak sıralamış rezdülerdr. (.6) formülü EKK ya çok bezer. Tek farkı sapalarda uzakta kalması ç modele uymasıa z vermes suretyle e geş kares alımış rezdüler toplamda kullaılmamasıdır. LMS gb bu tahm edc de x leer döüşümler ç uygu döüşümlüdür ve zdüşüm takbe bağlıdır. E 8

29 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ sağlam oralar h / olduğuda başarıldı.bu ora da kırılma oktasıı %50 ye ulaşması durumudur. LMS ve LTS her ks de rezdüler saçılımıı robust ölçümüü mmze ederek taımlaır. Buu geelleştrrsek Rousseeuw ve Yoha (984) S-tahm edcs dye adladırıla m ˆ S ( ) (.0) le fade edle tahm edcy buldular. Burada S( ) fades, r ( ),..., r ( ) rezdüler ölçümüü robust M-tahm bell br çeşddr. Burada karışık sabtler uygu br seçmyle kırılma oktası %50 ye de ulaşablr. Buda başka S- tahm edcler aslıda M-tahm edcler gb ayı asmtotk performasa sahp olduğu ortaya çıkar. Şekl.6 bu ye tahm edcler y de ve x dek sapalara karşı sağlamlıklarıı gösteryor. Yüksek kırılma oktaları yüzüde bu tahm edcler ayı zamada brkaç sapala ble başa çıkablr. Bu dayaıklılık açıklayıcı değşke sayısı ola p de de bağımsızdır. Bu edele LMS ve LTS çok değşkel durumlarda regresyo sapalarıı keşfetmek ç kullaılable aaltk araçları vers güvelr olması gerekr. LMS ve LTS esas kuralı robust modelde uzaklaşa oktalar olarak sapaları belrleyebldkte ya poztf ya da egatf rezdü durumlarıı belrleyebldkte sora ver çoğuluğuu modellemesdr. Şekl.6a da 4.durum öeml br rezdüye sahptr. Hatta Şekl.6b brc durumuda daha da açık görüüyor. Fakat geelde y ve dolayısıyla rezdüler ölçümü herhag br brmde olablr. Bu edele r rezdüsüü geş olup olmadığıa karar vermek amacıyla hata ölçeğ ˆ tahm le ou kıyaslamamız gerekr. Elbette k bu ˆ ölçüm tahm ked çde sağlam olmalıdır. Bu edele sadece y br verye bağlıdır ve sapa değer(değerler) tarafıda yukarıya çıkarılmaz. LMS regresyou ç 9

30 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ Şekl.6. LMS regresyouu y-yöüde (a) da y-yöüdek sapaa ve (b) de x- yöüdek sapaa karşı dayaıklılığı. ˆ C med r (.) 0

31 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ tahm edcs kullaablrz. Burada r LMS modele göre -c durumu rezdüsüdür. C sabt sadece ormal dağılımda uyguluğa ulaşmak ç kullaıla br faktördür. Bular küçük örekler ç br düzeltme yapar. LTS ç ˆ C (.) h ( r ) : gb br kural kullaablrz. C se başka br düzeltme faktörüdür. Her durumda - c durumu acak ve acak r / ˆ geş se br sapa olarak taımlaır. (Şuu belrtelm k bu ora orjal ölçüm brme bağlı değldr.) Bu bz başka br fkre getrr. İşlememş LMS ve LTS çözümler gelştrmek amacıyla ve t değerler, güve aralıkları, vb stadart celkler hesaplamak amacıyla sapaları belrlemese dayaa ağırlıkladırılmış e küçük kareler aalze başvurablrz. Öreğ ; w, 0 r ˆ /.5 r / ˆ.5 (.3) ağırlığıı kullaablrz. Ya c durumu LMS rezdüsü orta küçüklükte se ağırlıkladırılmış EKK da tutulacaktır fakat eğer br sapasa hmal edlecektr..5 sıırı, tabî k keyf olarak,.5 ˆ de daha geş brkaç rezdüü olacağı ormal dağılım durumuda oldukça makuldur. (.0.) dek gb sapaları reddedlmes zorluğu yere drekt redde de başvurulablr. Öreğ çft bölgel z verldğ suretyle r / ˆ ı sürekl foksyou kullaılarak r / ˆ 3 l oktaları 0 le arasıda ağırlıkları verleblr. Nasıl olursa olsu aşağıdak gb taımlaa ağırlıkladırılmış e küçük karelere başvuracağız: m ˆ w r (.4)

32 . ÖNCEKİ ÇALIŞMALAR VE REGRESYON ANALİZİNDE SAPAN DEĞERLER Yekta Stara KOÇ Bu fade hızlı br bçmde hesaplaablr. Souçlamış tahm edc ormal dağılım altıda hala yüksek kırılma oktasıa sahptr fakat statstksel alamda daha etkldr ve regresyo katsayılarıı varyas-kovaryas matrs ve belrleyclk katsayısı R gb e küçük karelerle çalışıldığıda aşkar olua bütü stadart çıktıyı verr. Sorak bölüm bast regresyodak robust yötemler uygulaması şleecektr. EKK, LMS ve yede ağırlıkladırılmış EKK açıklaacaktır

33 3. BASİT REGRESYON Yekta Stara KOÇ 3. BASİT REGRESYON 3.. Grş Bast regresyo model y x e =,, (3.) İk boyutlu ver kümes bölüm de bazı problemlerde gördük. Bazı saçılım grafkler yardımıyla ekk üzerde x ve y yöüde sapaları etkler gösterdk. Bu bölümde bu problemlerle başa çıkableceğmz yüksek kırılmalı regresyo tekklere başvuracağız. Bast regresyo fades baze de sabt term olmada ya; y x e =,, (3.) olarak da kullaılıyor. Bu model açıklayıcı değşke sıfırke yaıt değşke sıfır olması gerektğ varsayımıı olduğu sırada uygulamalarda kullaılablr. Grafğ çzlecek olursa orjde geçe br doğrudur. Şmd sağlam regresyo tekğe ola htyacı göstermek amacıyla Tablo3. de verle Plot-Plat (Dael ve Wood 97) vers celeyelm: Burada yaıt değşke ttrasyola belrlee ast mktarı, açıklayıcı değşke se çekme ve tartma le belrlee orgak ast mktarıdır. Yale ve Farsythe (976) da bu ver kümes aalz ettler ve saçılım grafğ açıklayıcı değşke ve yaıt değşke arasıda çok güçlü br statstksel lşk olduğuu gördüler. Ver EKK le çözümüde y ˆ 0,3x 35,458 buluur. E küçük kareler meydaıda (LMS) se y ˆ 0,3x 36,59 buluur. 3

34 3. BASİT REGRESYON Yekta Stara KOÇ Tablo 3.. Plot-Plat Vers Gözlem Çekme Ttrasyo () ( x ) (y ) Kayak: Dael ve Wood(97). dır. Grafkte görüldüğü gb örekte sapa değer yoktur. Böyle br olayda umulacağı gb sadece EKK ve sağlam tahm edcler arasıda marjal farklar olduğudur Kabul edelm k br değer yalış grls öreğ 6. x-gözlemde 37 yere 370 alısı. Bu hata x-yöüde br sapaa ede olur. O zama modeller tekrar oluşturduğumuzda ekk model; y ˆ 0,08x 58,939 olur.e küçük kareler medyaı se; y ˆ 0,34x 36,343 bçmde elde edlr. Burada da görüldüğü gb EKK yötem tek br sapada oldukça etklerke sağlam model ola LMS, ver büyük çoğuluğua y br 4

35 3. BASİT REGRESYON Yekta Stara KOÇ model olarak sapada uzak durmayı başardı. Ayrıca LMS doğrusu, bozulmamış verye Şekl 3.. EKK (keskl doğru) ve LMS (düz doğru) modelyle Plot-Plat vers EKK tahm uyguladığıdak doğruya yaklaştı. Robust tekkler sapaları hmal eder deym yalış olduğuu ortaya koydu. Akse LMS böyle oktaları varlığıı ortaya çıkarır. Kesel bast regresyou LMS çözümü ; mṋ ˆ, med y ˆ x ( ˆ ) (3.3) şeklde olur. Geometrk olarak bu gözlemler yarısıı çe ala e dar şerd bulmayı fade eder. (Buradak yarısı kavramıda kasıt [/]+ tam kısmıdır. Buula beraber 5

36 3. BASİT REGRESYON Yekta Stara KOÇ Şekl 3.. Şekl dek le ayı ver fakat tek sapaı var. Keskl doğru EKK modele karşılık gelr. Düz çzgl doğru se oktaları yarısıı çere e dar şertle çevrlr. bu şerd kalılığı düşey yöde ölçüleblr.) LMS doğrusu bu badı tam ortasıda uzaır. Şuu fade etmelyz k bu otasyou salara alatmak EKK taımıda daha kolaydır aslıda. Bozulmuş Plot-Plat vers ç bu şert Şekl 3. de çzlmştr. Bu örektek sapa yapaydır fakat bu tür hatalarla gerçek verlerde sık sık karşılaştığımızı fark etmek öemldr. Ver oktalarıı sapması; gözlemler kaydederkek hatalar, aktarmada ya da taımlamadak hatalar ya da celee olayda harç tutula olaylar yüzüde öreklemde mevcut olablr. boyutlu durumda(yukarıdak örekte olduğu gb sadece gözlemler grafkte çzerek farklı(alışılmamış) değerler ortaya çıkarmak oldukça kolaydır. Bu görüşü zlemek daha yüksek boyutlulara geldğde artık mümkü olmaz. Bu edele pratkte sapaları etks azaltable br yöteme htyaç vardır ve dolayısıyla rezdü grafklerde sapaları ortaya çıkar. Bua ek olarak sapa meydaa gelmedğ zama alteratf yötem soucu EKK çözümüde adre farklı olur. Burada LMS regresyouu buları gerekllğ karşılayacağı ortaya çıkar. 6

37 3. BASİT REGRESYON Yekta Stara KOÇ Şekl 3.3. Belçka da yılları arasıdak uluslar arası telefo aramaları sayısıı EKK (keskl doğru ) ve LMS model ( düz doğru ) Şmd de sapa değer olduğu bazı gerçek ver öreklere bakalım. Ekoom Bakalığı tarafıda yayılaa Belçka statstksel celemesde uluslar arası yapıla telefo görüşmeler toplam sayısıı çere br ver kümes bulduk. Grafk yıllar arttıkça arama sayısıı arttığıı göstermektedr. Fakat bu zama serler 964 de 969 a yoğu br krleme çermektedr. Araştırma üzere 964 te 969 a kadar arama dakkalarıı toplam sayısıı vere başka br kayıt sstem kullaıldığı ortaya çıktı.(963 ve 970 yıllarıda da kısme etkleld çükü geçşler ye yılda tam olarak olmadı.bu edele bazı aylardak arama sayısı kala aylardak dakka sayısıa ekled.)bu se y- yöüde sapaları geş br kırılmasıa sebep oldu.bu ver tablo de lstelemş ve şekl 3 te gösterlmştr. Bu ver ç EKK çözümü y ˆ 0.504x 6.0 dır. Bu model grafğ se Şekl 3.3 te keskl oktalarla gösterlmştr. Bu keskl doğru yılları arasıdak y değerlerde çok fazla etklemş. Souç 7

38 3. BASİT REGRESYON Yekta Stara KOÇ Tablo 3.. Belçka da Yapıla Uluslararası Arama Sayısı Yıl Arama Sayısı (x ) (y ) Mlyo yere o sayısı kullaılmış. olarak EKK doğrusu geş br eğme sahptr ve y ya da kötü oktalara uymuyor. Bu se verlere cdd br şeklde bakmayarak ve rut br şeklde EKK metodua başvurarak elde edleblecek br yoldur.aslıda y gözlemler bazıları(97 gb) kötü değerler bazılarıı EKK rezdülerde daha geş olur. Şmd de LMS yötem uygulayalım:o zama model; y ˆ 0.5x 5.60 olur. (Şekl 3.3 te tam çzgyle gösterlmştr.) Görüldüğü gb sapalarda uzak durmuştur. Bastçe grafktek ver oktalarıa bakıldığıda model ortaya çıktığı görüle öreğe dek gelr. Açıkça bu doğru ver çoğuluğua uyar.(bu br leer 8

39 3. BASİT REGRESYON Yekta Stara KOÇ model ster stemez e y model olacağıı ma etmez. Çükü daha fazla ver toplamak lşk daha karmaşık türüü ortaya çıkarablr.) Tablo 3.3. CYG OB Yıldız Kümes Hertzprug Russell Dyagramıı Verler Yıldız logt e log L / L0 Yıldız logt e log L / L0 İdeks (x ) (y ) İdeks (x ) (y ) ,38 5, ,4 4, ,9 4, ,39 4, , 4, ,48 6, ,38 4, ,56 5, ,45 5, ,49 6, ,3 4, ,6 5, ,53 5, ,45 5, ,53 5, ,43 5, ,38 4, ,45 5, ,50 5, ,45 5, ,55 5, ,45 4, ,4 4, Dğer br örek astroomde. CYG OB yıldız sııfıı Hertzsprug-Russell dyagramıdak ver Tablo 3.3 te verlyor. Bu yıldız sııfı Cygus yöüde 47 yıldız çeryor. Burada x yıldız yüzeydek sıcaklık etks (T ) logartması, y se e yıldızı ışık şddet( L / Lo )logartmasıdır. Bu sayılar bze Humphreys(978)de 9

40 3. BASİT REGRESYON Yekta Stara KOÇ ham ver alaı ve Vasa ve De Greve(98) ye göre şleye. C.Doom(kşsel kouşmayla) tarafıda verld. Hertzsprug-Russell dyagramı Şekl 3.4 te gösterlmştr. Sağda sola doğru grafklemş x logartma sıcaklık değer olduğu bu oktaları dağılımıdır.grafkte oktaları k grubu görülüyor.ver çoğuluğu ş aşağı br yokuş oluşturarak kümelemş,4 yıldız se yukarda sağ köşede kalmış.dyagramı bu kısımları astroomde y blr: 43 yıldız esas sırada uzadığı söyler buu akse kala 4 yıldız se devler olarak adladırılır.(devler,0,30 ve 34 deksl oktalardır.) Şekl 3.4. CYG OB yıldız kümes Hertsprug-Russell dyagramıı EKK (keskl doğru) ve LMS (düz doğru) model. Bu ver kümesyle LMS tahm edcse başvurmak esas dzye y br bçmde uya y ˆ 3.898x.989 model verr(düz çzgyle gösterlmştr.)dğer tarafta EKK çözümü y ˆ 0.409x

41 3. BASİT REGRESYON Yekta Stara KOÇ olur. Bu da 4 dev yıldızla çekle(bu 4 yıldız modele y uymaz) şekl4 tek keskl çzgyle gösterle doğruya tekabül eder. Bu sapalar kaldıraç oktasıdır ama olar hata değldr. Daha özel br fadeyle açıklarsak eğer verler k farklı popülasyoda gelyor. Bu k grup LMS rezdüler temelde kolayca ayrılablr.(geş rezdüler dev yıldızlara tekabül eder.)akse EKK rezdüler oldukça homoje ve devler aa dzde ayırmamız ç bze z vermyor. 3.. E Küçük Medya Kareler Doğrusuu Hesaplaması Blgsayar desteğ olmaksızı yüksek kırılmalı regresyo tahmler hesaplamak asla mümkü olmaz. Gerçekte LMS, EKK de kullaıldığı gb açık br formüle sahp değl. Yüksek kırılmalı regresyou ede ucuz br bçmde hesaplaamadığıı der sebepler görülür. Yukarıdak örekte, ver boyutluydu bu edele grafkledrlebld. Saçılım grafğdek br okta br rakamla gösterlr. Bu rakam, yaklaşık olarak ayı koordatlara sahp oktaları sayısıa dek gelr. 9 da fazla rakam çakıştığıda, ( * ) şaret yazar. Bast regresyoda, EKK tahm edcler üzerde oldukça güçlü br etkye sahp olable oktalar böyle br grafkte heme ortaya çıkar. O zama her j-c değşke m medyaı hesaplaır. Yukarıdak Plot-Plat çıktısıda gösterldğ gb medya extracto değer 07 ve medya ttrasyo değer 69 a eşttr. Dğer / sorak doğruda her değşke stadart sapmasıı br robust versyou gb düşüüleble s değer verr. Stadartlaştırılmış gözlemler br lstes alalım. Ya her x j le x j s j m j (3.4) yerler değştlerecek (yaıt değşke ayı yötemle stadartlaştırılacak.) Souç tablosuu sütularıı her br varyasıa ve 0 medyaıa sahptr. Bu, herhag tek br değşkede sapaları ortaya çıkarmamızı mümkü kılar. Gerçekte, stadartlaştırılmış gözlem mutlak değer geşse (ya.5 da fazla se) o zama bu değşke ç br sapadır. Plot-Plat çıktısıda bz bu şeklde olay 6 ı geş 3

42 3. BASİT REGRESYON Yekta Stara KOÇ exracto ölçümüe sahp olduğuu keşfettk (satadartlaştırılmış değer 3,73 tü. Bu da sırada br durum değl. Baze stadartlaştırılmış değerler, br sütudak dağılımı çarpıklığıı söyleyeblr Şmd, parametrk olmaya (o parametrk) sperma korelasyo katsayıları gb değşkeler arasıdak Pearso (product momet) korelasyo katsayılarıı verd. Robust tahmler vermede öce EKK souçlarıyla başlayalım. Stadart hataları yer aldığı tahm edlmş katsayılarla br tablo yazılsı. J-c EKK regresyo katsayısıı stadart hatası ( X ) X le bulua EKK regresyo katsayılarıı varyas kovaryas matrs j-c dagoal elemet kareköküdür. Burada X matrs X= x... x... x x... x.... x p p p X -c satırı, -c gözlemdek p tae açıklayıcı değşkede oluşa x vektörüe eşttr. Blmeye, S r p (3.5) le tahm edlr. Burada r -c rezdüdür. Tahm edlmş S ( X ) X varyaskovaryas matrs de hesaplaablr. Bast regresyo ç kese term olmadığıda p=,dğer durumlarda p= dr. Ölçek tahmyle gösterle mktar ortalamalı S S dr. j parametreler ç güve aralıkları oluşturmak ç hata termler 0 varyaslı bağımsız ormal dağılıma sahp olduğu varsayılmalıdır. Bu koşullar altıda -p serbestlk derecel Studet dağılımıa sahp 3

43 3. BASİT REGRESYON Yekta Stara KOÇ ˆ j S (( X X ) ) j JJ j=,,p (3.6) elde edlr.mktarları her br y blr. t p, / le bu dağılımı - / mktarıı fade edelm. O zama j gb herhag br regresyo katsayısıı öemllk test ç de kullaılablr. ˆ j t p s x x ˆ (( ) ) jj, j t p s (( x x), /, / ) jj (3.7) Ayı souç, test ç de kullaılablr. ˆ j gb herhag br regresyo katsayısıı öemllk ( sgfcece) H 0 ( sıfır hpotez ) : 0 j H 0 ( alteratf hpotez ) (3.8) : j Böyle br test j c değşke modelde slp slemeyeceğ açıklamaya yardımcı olablr. Eğer ı belrl br değer ç (3.5) tek sıfır hpotez kabul edleblre bu durum j c yaıt değşke açıklayıcı değşkee çok katkısı olmadığıı gösterr. Bu hpotez ç test statstğ ˆ s (( x x) ) j jj, j =,,p (3.9) dır. Bu ora çıktıda t değere karşılık gelr. Sıfır hpotez t mutlak değer t de büyük olduğuda sevyesde reddedlr. Bu durumda j-c p, / regresyo katsayısıı öeml br bçmde 0 da farklı olduğu söyler. Şmdk örekte =0 ve p= dr. = %5 olduğu ç -p=8 serbestlk derecel studet dağılımıı %97,5,0 e eşttr. Bu yüzde EKK eğm ortak t değer.79 olduğu ç öeml br farkı olmadığı soucu çıkarılablr. Dğer tarafta kese t değer 8,9 olup oldukça öemldr. p değer gerçekte elde edle t 33

44 3. BASİT REGRESYON Yekta Stara KOÇ değerde daha büyük ola -p serbestlk derecel studet dağılımlı rastgele değşke olasılığıdır. p değer 0,05 te küçük olduğuda karşılık gele regresyo katsayısı %5 alamlılık sevyesde öemldr. Yukarıdak çıktıda EKK eğm p değer 0,074 e eşttr. Bu edele öeml değldr. Buu akse EKK kese % 0, alamlılık sevyesde ble 0,000 olup model çok alamlı yapar. Yazılmış p değerler hpotez testler yapmak çok kolaydır. Çükü olasılık tabloları artık gerekl değldr. Buula brlkte (3.6) tamame robust olmadığı ç dkkatl bçmde kullaılmalıdır. Bu statstğ dağılım teorem geelde sadece hataları takp edldğ ve pratkte adre karşılaşıla ormal dağılımda koruur. Bu edele sapaları varlığıı mümkü olduğuu farkıda olduğumuz ç robust modelde lk bakışta görülür. Ver kümes etkl oktaları çerdğ görüldüğüde aşağıda verlecek ola RLS çözümüü t değere gdlmes gerekr. Yaıt değşke le açıklayıcı değşke(ler) arasıdak leer lşk dayaıklılığıyla lgl br fkr elde etmek ç belrleyclk katsayısı (R ) çıktıda görülür. R regresyo tarafıda açıklaa toplam çeştllğ oraıı ölçer. Tam br formül ç sabt terml regresyo le sabt termsz regresyou ayırmamız gerek EKK regresyou ç R aşağıdak gb hesaplaır: R SSE SST, sabt termsz modelde R SSE SST m, sabt terml modelde Burada; SSE=Rezdü hatalarıı kareler toplamı = ( y yˆ ) 34

45 3. BASİT REGRESYON Yekta Stara KOÇ SST=Bütü kareler toplamı ve = y SST m Ortalamaya göre bütü düzeltlmş kareler toplamı = ( y y) Burada y y dr. Sabt terml bast regresyo durumuda belrleyclk katsayı ve y arasıdak Pearso korelasyo katsayısıı karese eşttr. Plot-plat vers ç EKK ya karşılık gele R y açıklaya x R değer 0,4 e eşttr. Buu alamı bast regresyo modelde y sadece %4, açıkladı. Burada sıfıra eşt olması hpotez test etmek de düşüüleblr. Formüle edersek; R H : 0 (sıfır hpotez) 0 R H : 0 (alteratf hpotez) (3.0) R olur. Bu hpotezler sabt term olmadığı model harç bütü regresyo katsayılarıı vektörüü sıfıra eşt olup olmadığı teste dektr. Ya (3.0) aşağıdake dektr: H 0 Bütü kesesz j ler heps sıfırdır. H H 0 doğru değldr. (3.) 35

46 3. BASİT REGRESYON Yekta Stara KOÇ Burada katsayılar brlkte düşüüldüğüde tek br regresyo katsayısı üzerde yukarıdak t testde oldukça farklıdır. Eğer zama aşağıdak statstkler F dağılımıa sahptr: e ormal dağılımlı se o ( R /( p ) ( SSTm SSE) /( p ) ~ F p, p, sabt terml regresyo R ) /( p) SSE /( p) ç ( R / p R ) /( p) ( SST SSE) / p SSE /( p) ~ F p, p, dğer durumlarda Eğer uygu statstğ hesaplamış değer ortak F değer (- )-ıcı sıklık derecesde daha az se o zama H 0 kabul edleblr. Eğer değlse H 0 reddedleblr. p değer F değer aşmış uygu serbestlk derecel br F dağılımıda rasgele değşm olasılığıdır. Bozulmuş Plot-Plat vers ç ve 8 serbestlk derecel F değer,955 elde ettk. Uygu p değer 0,03 dür ve bu edele %5 sevyesde alamlı değldr. Souç olarak H 0 reddedlemedğ ç alamlılık yöüde açıklayıcı değşke yaıt değşke gerçekte açıklamadığı EKK tahm edclerde görüldüğü söyleleblr. t-test, R ve F-test yorumu bölüm4 te görülecek ola çok boyutlu ver kümeler ç hala doğru olacaktır. Şekl 3. celedğde durum 6 EKK doğrusuu güçlü br bçmde çektğ ve s y de yukarı çektğ ç stadartlaştırılmış rezdüsü sadece -.6 dr. Bu değer heyeca verc br yöde olmadığı heme heme açıktır. LMS regresyouu souçları aşağıdak gbdr: İlk başta regresyo parametreler tahmler ve buula brlkte karşılık gele ölçüm tahm verlr. Bu ölçüm tahm de robust şeklde taımlaır. Bu amaçla lk ölçüm tahm s 0 hesaplaır. s 0, ve p ye bağlı br düzeltme çarpaıı solu br öreklemle çarpılmasıda oluşa objektf foksyouu br değere dayaır. 36

47 3. BASİT REGRESYON Yekta Stara KOÇ s med 0 5,486 r p Bu ölçek tahmyle stadartlaştırılmış 0 r / s rezdüler hesaplaır ve aşağıdak gb -c gözlem w ağırlığıı taımlamada kullaılır. w 0, r / s, d. h 0,5 (3.) LMS regresyou ç ölçek tahm o zama şu şeklde verlr: * w w r p (3.3) * ı %50lk kırılma oktasıa sahp olduğua dkkat edelm.ya krleme %50 de azı ç * * veya 0 olmaz.şmdk örekte başlagıçta hesaplaa EKK ölçümü ola s=5,6 da daha küçüktür. * =.33 dr. Bu değer LMS ayı zamada y dek gözlemş değşm uygu model asıl y açıkladığıı taımlamak ç br ölçüdür. Klask yöteme bezer şeklde R belrleyclk katsayısıa dyeceğz. Sabt terml regresyo durumuda; med r R (3.4) mad( y ) sabt (kese) term olmadığıda se; med r R (3.5) med y dr. Burada mad=medyaı mutlak sapması (meda absolute devato) ı kısaltmasıdır ve 37

48 3. BASİT REGRESYON Yekta Stara KOÇ mad ( y ) y med y dr. Plot-Plat çıktısıda robust belrleyclk katsayısı 0,996 dır.ya ver büyük çoğuluğua oldukça y br model olmuştur. LMS ç de gözlemş y,tahm edlmş ŷ,r rezdüsü ve * r / stadartlaştırılmış rezdülü br tablo verlr.bu da açıkça gösteryor k * r 6 / değer -78,50 gb çok büyük br değere eşt olduğu ç durum6 br sapadır. Bu çıktıı e so kısmı yede ağırlıkladırılmış e küçük kareler regresyou(rls) le lgldr. Rezdüler kareleryle toplamıı mmum yapmaya dektr. w ağırlığıı çarpımlarıı m w r (3.6) ˆ w ağırlıkları s 0 yere * so ölçüm tahmyle brlkte (3.6) dak LMS çözümüde taımlaır. Sadece 0 ve değerler alable bu ağırlıkları etks w sıfıra eşt olduğu durumlardak slmeye bezerdr. (3.6) le lgl ölçek tahm s w w r p (3.7) dr. (Bütü durumlar ç w = yazıldığıda sırada EKK ç ölçek tahm tekrar buluur.) Bu edele RLS sadece sıfırda farklı br değer ala öyle gözlemlerde oluşa azaltılmış ver kümel klask EKK gb görüleblr. Bu azaltılmış ver kümes artık regresyo sapalarıı çermedğ ç statstkler ve souçlar bütü ver kümesdek EKK lı brleşmlerde daha güvelrdr. Ağırlıklar karmaşık br bçmde verye bağlı olduğu ç vurgulaa dağılım teors tamame gerekl 38

49 3. BASİT REGRESYON Yekta Stara KOÇ değldr. Fakat bu dağılım hala e y br yaklaşım gb e de bazı Mote-Carlo deemeleryle doğrulamış gb kullaışlı değldr. Şmdk örekte durum6 harç bütü w ler e eşttr. Burada durum6 gerçekte br sapadır. RLS le elde edle regresyo katsayıları LMS lk basamağıda taımlaalarla güçlü br bezerlk gösterr. Dkkat edelm k sapalar olmada eğm tahm sıfırda öeml derecede farklıdır. RLS ç belrleyclk katsayısı EKK e bezer br bçmde taımlaır. Fakat bütü termler w ağırlıklarıyla çarpılır. Bu örek ç bu durum so derece öemldr. Çükü F değer çok büyüktür ve bu edele karşılık gele p değer sıfıra yakıdır. EKK ve RLS souçları gerçekte tamame farklı olduğuda sapaları taımlamak (RLS aracılığıyla) ve bular üzerde çalışmak doğru olacaktır. Bazı salar buu yere EKK ve RLS arasıda seçm yapmak düşücese yatkılar ve geelde daha alamlı t değerler ve F değerler tahmler terch edecekler ve geelde yüksek ola R y e y regresyo varsayıyorlardı. Bu artık yapılmıyor. Çükü EKK souçları sapalara karşı çok hassastır. Burada R k şeklde etkleeblr. Gerçekte de herhag br ver EKK ya at R s br ya da daha fazla kaldıraç oktasıyla e yaklaşablr. Geelde RLS çoğuluğu R s tamame çok yüksek olmadığı soucua uygu bçmde ve yüksek R de sorumlu sapaları gösterr. (ya da bazı ler sıfırda alamlı br şeklde farklı buluablr Örekler Burada gerçek ver örekleryle sağlaa souçları daha fazla açıklayacağız. Örek 3.3. : İlk kelme-gesell adaptasyo skor vers 39

50 3. BASİT REGRESYON Yekta Stara KOÇ Tablo 3.4. İlk Kelme-Gesell Adaptasyo Skor Vers Çocuk Ayca Yaşı Gesell Skor () (x ) (y ) Kayak : Mckey (967) Şekl 3.5. İlk kelmedek yaşıa göre Gesell adaptasyo skoruu saçılım grafğ Bu k boyutlu ver kümes Mkey de gelr ve geş br bçmde gösterlr. Açıklayıcı değşke br çocuğu lk kelmes söyledğdek yaşı ve yaıt değşke 40

51 3. BASİT REGRESYON Yekta Stara KOÇ se buu Gesell adaptasyo değerdr. Bu ver çocuk ç Tablo 3.4 görülüyor ve şekl5 te grafklemştr. Mckey 9 gözlem br sapa olduğua basamak regresyouda sapaları arama yaklaşımı le karar verd.bu örekte 9. deks durumu sıfır ağırlığıı aldı.gerçekte de bu durum LMS modelde geş rezdülere sahp olduğu ç sapa olarak taımlaıyor.ekk ve RLS deklemler bu ver kümes ç çok farklı değldr. ve 8 okta çft EKK yı y br yöde çekyor.bu oktalar y kaldıraç oktalarıdır ve küçük EKK rezdüler gb küçük LMS rezdülere sahptrler (Bu oktaları herhag br ya da her ks slmes güve aralıklarıı geşlğde öeml br etkye sahptr.)bu ver kümes ve 8 oktalarıı slmes x ve y arasıdak leer lşky çok fazla bırakmayacağı ç bu ver kümes leer regresyouu y br öreğ olmadığı söyleeblr. Örek 3.3.: Yılları Arasıdak Yagı Sayısı Tablo 3.5 te verle bu ver kümes Belçkalı yagı sgorta şrketlere bldrle yagı hbarlarıı 980e kadar gdşatıı göstermektedr.(belçkalı sgorta şrket yıllık raporuda alımıştır. Bu örekte çok az okta vardır) Tablo arasıda Belçka da yagı hbarlarıı sayısı YIL ( x ) YANGIN SAYISI 76 6,694 77,7 78, , ,874 Şekl 3.6 da saçılım grafğe bakıldığıda yıllar üzerde haff yukarı doğru br eğlm olduğu dkkat çekyor. Buula brlkte 976 dak sayı oldukça yüksektr. Buu sebeb o yıl yaz döem oldukça sıcak ve kuruydu. ( Belçka stadartlarıyla kıyaslaırsa ) Bu durum doğada kayaklı olarak ağaçları ve çalıları yamasıa sebep oldu. Bu durumda 4

52 3. BASİT REGRESYON Yekta Stara KOÇ Şekl yıllarıda Belçka dak yagı hbarıı sayısı EKK ç, y ˆ 387,5x 4480,8 (keskl çzg) LMS ç, y ˆ 534,3x 883,3 (düz çzg) buluur. Tahmler çok farklı olduğu göze çarpıyor. EKK verye azala eğmle uyarke akse LMS doğrusu artarak uyum sağlıyor. Sapa değer x mezl dışıda uzaır ve kötü br bçmde yaramaya EKK e sebep olur. Hatta bu sapa e geş EKK rezdüsüe sahp olmaz. Bu örek tekrar gösteryor k EKK rezdüler celemes sapa(lar)ı ortaya çıkarmak ç yeterl değdr. Elbette k, böyle küçük br ver kümesde herhag br güçlü statstksel souçlar çzemeyz fakat EKK ve LMS esase e zama farklı souçlar vereceğ ver kümes hakkıda dkkatl düşüülmes gerektğ gösterr. Örek 3.3.3: Ç de Fyatları Artmasıı Yıllık Oraı 4

53 3. BASİT REGRESYON Yekta Stara KOÇ Tablo 3.6, 940 da 948 e (Smk 978) kadar Ç dek aa şehrler de ortalama fyatları yıllık büyüme oraıı çeryor mesela 940 da fyatlar % 6 yükselmş br öceke kıyasla. 948 de çok fazla hükümet harcamaları soucuda büyük br sıçrama meydaa gelmş ve bu hper eflasyo olarak adladırılmış. LMS regresyo deklem, y ˆ 0,0x,468 dır. Bua karşılık EKK tahm, y ˆ 4,845 x 049,468 dır. Bu k modelde brbrde tamame farklıdır. EKK da sayılar daha büyük çıkmıştır. Bu doğrularda hags daha y model vereceğ göstermek ç tablo 6 her k yötemle tahm edlmş değerler göstermektedr. So k yıl harç LMS ver çoğuluğua doğru br yaklaşım sağlamıştır. Dğer tarafta EKK model her yerde kötüdür. Burada tahm edlmş ŷ lk 3 yıl egatftr, 948 harç sorak yıllarda çok geşledğ ve kıyaslaamadığı görülür. EKK bütü sütu üzere Tablo Arası Serbest Ç dek Aa Şehrlerde Yıllık Ortalama Fyat Artışı Yıl Büyüme Artışı Tahm Büyüme ( x ) ( y ) LMS EKK 40,6,6-55,67 4,63,7-30,8 4,90,8-5,98 43,64,9 8,87 44,05,0 43,7 45,3, 68,56 46,94, 93, ,50,33 8, ,00,43 43,09 Kayak: Smk (978) 43

54 3. BASİT REGRESYON Yekta Stara KOÇ orjal ver doğrusal olmamasıı etks karıştırırke bua karşı LMS ver çoğuluğua uyar. Çıktıda 8. ve 9. gözlemler brer sapa olduğua dkkat edelm. Bu durum stadartlaştırılmış ver. sütuuda gösterlyor. Yede Spearma Rak korelasyou, Pearso korelasyouda daha yüksektr. Çükü sapalar değşkeler arasıda eredeyse br mootoluğa uyarke leer şeklde dağılmıştır. Rezdü grafklere bakarsak bular stadartlaştırılmış rezdülere karşılık tahm edlmş yaıt değşke gösterr. Her k grafkte de keskl doğru 0 a doğru çzlyor ve [ -.5,.5 ] aralığıda düşey şert gösteryor. Bu doğrular souçları yorumuu kolaylaştırır. Gözlemş y değerler, tahm edlmş ŷ değerlere eşt olduğuda o zama souçlamış rezdü 0 olur. Bu 0 doğrusuu komşuluğudak oktalar modele e y uyalardır. Rezdüler ormal dağılımlı se stadartlaştırılmış rezdüler % 98 [ -.5,.5 ] aralığıda uzaacağı bekleeblr. Bu edele düşey şertte uzakta yerleşmş ola stadartlaştırılmış rezdüler olduğu gözlemler uzakta olarak taımlaablr. Yukarıdak çıktıda lk rezdü grafğ EKK modelde kötü oktayı asıl gzledğ gösterr. EKK da sapalar çekp koparılıyor ve ölçek tahm y olmadığıı gösteryor. Sapalarla ortak EKK rezdüsü ble düşey şert çersde uzaır. Bu etk yüzüde EKK tahm edcse uygu br rezdü grafğ yorumu tehlkeldr. LMS rezdü grafğ de sapa şertte çok uzaktadır. Robust tahm edclere karşılık gele rezdü grafkler bölüm 4e de gösterleceğ gb bazı değşkelerle ola problemlerde daha kullaışlı ble olablr. Bu grafksel araçlar uzaktak gözlemler belrlemek ç çok uygudur. EKK soucu Robust ve Robust olmaya regresyo yötemler her ks rezdü grafkler yaklaşık olarak uyuşuyorsa güvelrdr. Sapaları taımlamada başka rezdü grafğ model yeterllğ ölçmek ve döüşümler bulmak ç br dagostk araç sağlar. Yeterl br model ve y davraışlı br ver rezdü grafğ e deal öreğ sabt düşey saçılımlı oktaları yatay gölgesdr. Rezdü öreğdek aormallkler olayı bazı yölere götürür öreğ grafk rezdüler varyası, ŷ veya dğer değşke artarke bu değer artar ya da azalır. 44

55 3. BASİT REGRESYON Yekta Stara KOÇ Bu heteroscedatcty olarak adladırılır. Klask model akse homoscedatcty kouşulduğu durumda hatalar sabt varyasa sahptr. Bu problem hem açıklayıcı hem de yaıt değşke uygu br döüşümüe başvurarak yaklaşılablr. Örek 3.3.4: Bey Ve Ağırlık Vers Tablo3.7, 8 hayvaı vücut ağırlıklarıı (kg) ve bey ağırlıklarıı (gr) veryor. Bu örek Wesberg 980 ve Jerso 973 te geş ver kümelerde alıdı. Bey e kadar büyükse o kadar ağır br vücudu yöetmes gerekp gerekmedğ araştırıldı. Bu ölçümler logartmaları arasıdak lşk temz br görütüsü şekl 7 de gösterlyor. Bu logartmk döüşüm ster daha küçük ster daha büyük ölçümler yer tutmada yetersz ola orjal ölçümler grafklemek ç gerekldr. Gerçekte de her k orjal değşke de brkaç öem sırasıı üzerde sıralaıyor. Bu döüştürülmüş ver leer model bey ağırlığı (y) ve vücut ağırlığı (x) arasıdak deklem y ˆ x ˆ bçmdek lşkye dek olacaktır. Şekl3.7 ye bakılırsa buu döüşümü daha leer yaptığı görülür. EKK model, log y ˆ 0,7509log x 0,8694 le verlr. Eğmle brleştrlmş stadart hata 0,078 ye eşttr ve kese term 0,794 tür. Bölüm 4te blmeye regresyo parametreler ç güve aralıklarıı asıl oluşturacağımızı açıklayacağız. Şmdk örek ç = 8 ve p = dr. Bu edele 6 serbestlk derecel t dağılımı kullaarak,0555 e eşttr. EKK souçlarıı kullaarak eğm ç % 95 lk güve aralığı [0.3353; ] olarak verlr. RLS şekl 7 de düz çzg le verlyor. Burada model daha dktr. 45

56 3. BASİT REGRESYON Yekta Stara KOÇ Tablo Hayvaı Vücut ve Bey Ağırlıkları İdeks Çeştler Vücut Ağırlığı (kg) Bey Ağırlığı (gr) ( ) ( x ) ( y ) Kuduz,350 8,00 İek 465,00 43,00 3 Bozkurt 36,330 9,500 4 Keç 7,660 5,00 5 Kobay,040 5,500 6 Dplodocus 700,000 50,000 7 Asya Fl 547, ,000 8 Eşek 87,00 49,000 9 At 5, ,000 0 Potar Maymuu 0,000 5,000 Ked 3,300 5,600 Zürafa 59, ,000 3 Gorl 07, ,000 4 İsa 6,000 30,000 5 Afrka Fl 6654,000 57,000 6 Trceratops 9400,000 70,000 7 Rhesus Maymuu 6,800 79,000 8 Kaguru 35,000 56,000 9 Hamster 0,0,000 0 Fare 0,03 0,400 Tavşa,500,00 Koyu 55,500 75,000 3 Jaguar 00,000 57,000 4 Şempaza 5,60 440,000 5 Brachosaurus ,400 6 Sıça 0,80,900 7 Köstebek 0, 3,000 8 Domuz 9,000 80,000 Kayak: Wesberg (980) ve Jerso (973) log y ˆ 0,7509.log x 0,8694 RLS tekğ le tahm edlmş eğm EKK model le ortak %95 güve aralığıı dışıda kalablr. RLS dek regresyo katsayılarıı stadart hatası EKK le kıyasladığıda dkkate değer şeklde azalmıştır. Ya eğm 0.038, sabt term se dr. Blmeye eğm ç %95 lk güve aralığı şmd [ , 0.87 ] olarak verlr. Buradak aralık EKK de verle güve aralığıda daha dardır. RLS regresyo katsayıları le ortak t değerler çok geştr. Bu, eğm ve kese 0 da 46

57 3. BASİT REGRESYON Yekta Stara KOÇ öeml derecede farklı olmasıı gerektrr. Buda başka R belrleyclk katsayısı (model her yerde y olduğuu özet ölçümü) EKK ç de, RLS ç te artar. Bu örek acak bütü EKK souçları le sadece EKK regresyo katsayılarıı sapaları varlığıda şüpheye düşmedğ gösterr. Tablo 3.8 stadartlaştırılmış EKK ve RLS rezdüler ve LMS temelde taımlamış w y lstelyor. RLS de dolayı sırada olmaya gözlemler ortaya çıkarması kolaydır ve olara özel br öem verr. Gerçekte de w 0 ola beş durumua bakılırsa oları ede sapa olarak düşüülmek zoruda olduğu kolayca alaşılır. E belrg RLS rezdüler (büyük olasılıkla egatf olalar) durum 6, 6 ve 5 tr. Burada EKK model düşük eğmde bu hatalar sorumludur. 3 tae dazor var ve buları her br ağır br vücutla kıyaslaırsa küçük br beye sahptr. Bu kouda ver de kala dğer memellerle kıyasladı LMS regresyou da durum 4 ve 7 ç 0 ağırlığıı gösterd. Ya sa ve rhesus maymuu. Olar ç esas bey ağırlığı leer modeldek bekleede daha yüksektr. Dazorları akse rezdüler bu edele poztftr. Souç olarak dazorlar, salar ve rhesus maymuları ver çoğuluğuu zledğ gb ayı eğme uymadığı söyleleblr. Şekl tae hayva ç logartmk vücut ağırlıklarıa göre logartmk bey ağırlıklarıı EKK (keskl doğru) ve RLS (düz doğru) model. 47

58 3. BASİT REGRESYON Yekta Stara KOÇ Tablo 3.8. Bey ve Vücut Ağırlıkları Vers İç Stadartlaştırılmış EKK ve RLS Rezdüler İdeks Türler S ta dartlaşartılmış S ta dartlaşartılmış w EKK Re zdüler RLSRe zdüler Kuduz -0,40-0,7 İek 0,9 -,3 3 Bozkurt 0,9 0,7 4 Keç 0,36 0,50 5 Kobay -0,57-0,65 6 Dplodocus -,5-0,9 0 7 Asya Fl,30,08 8 Eşek 0,58 0, 9 At 0,54-0,43 0 Potar Maymuu 0,68,0 Ked 0,06 0,68 Zürafa 0,56-0,37 3 Gorl 0,53 0,00 4 İsa,69 4,5 0 5 Afrka Fl,3 0,08 6 Trceratops -,86-9,0 0 7 Rhesus Maymuu,0 3, Kaguru -0,9 -,9 9 Hamster -0,98-0,8 0 Fare -,04-0,7 Tavşa -0,34-0,39 Koyu 0,40 0,9 3 Jaguar 0,4-0,80 4 Şempaza,0, 5 Brachosaurus -,06-0, Sıça -0,84-0,80 7 Köstebek -0,7,35 8 Domuz 0,0 -, Tam Model Özellkler Br Öreğ Tam model sözcüğü gözlemler geş br yüzdes bell br leer dekleme tam olarak uydurma durumu alamıa gelr. Öreğ bast regresyoda bu ver çoğuluğu düz br doğru üzerde tam uzaıyorsa olur. Böyle br durumda br robust regresyo yötem o doğruyu yleştreblr. Bu se tam model özellğ olarak adladırılır. Öreğ tekrarlı medya bu özellğ sağlıyor. Gözlemler e azıda [ / ] + ayı doğru üzerde uzadığıda bu doğruu deklem LMS çözümü olacaktır. 48

59 3. BASİT REGRESYON Yekta Stara KOÇ Şekl 3.8. Tam model öreğ. Segel ver kümes EKK (keskl doğru) ve LMS (düz doğru) model saçılım grafğ Tablo 3.9 dak ver Emerso ve Hoogl ( 983, s.39 ) da geld. Bu verler şekl 7 dek saçılım grafğ celeyelm Emerso ve Hoogl uygu gelecek özet 0 eğmle doğru olacağıı ler sürdüler. Gerçekte 9 oktaı dışıda 6 taes aslıda 0 eğml ve 0 kesel doğrusu üzerde uzaır. Tam model durumları gerçek verde de meydaa gelr Orjde Geçe Bast Regresyo Kese term 0 olduğu öcede bldğde o zama model bua zorlamak durumuda kalıır. Aff ve Aze (979, s.5) Tablo 3.0 da k öreğ verdler. Burada böyle br model uygudur. Ver kadak laktk ast mktarıı ölçe br alet kalbrasyou (doğru ölçüp ölçmedğ) le lgldr. x doğru kosatrasyo le y mktarı kıyaslaıyor. Bu verdek açıklayıcı değşke düzelemştr ya değer öcede tespt edlmştr. Souç olarak böyle br ver kümes kaldıraç oktalarıı çermez. Şekl 3.9 da k saçılım grafğ kabaca değşke arasıdak leer lşky gösterr. Gerçekte bu örek ç EKK ve LMS heme heme ayıdır. Bua rağme lteratür sapalarla brlkte kalbrasyo vers de çerr. 49

60 3. BASİT REGRESYON Yekta Stara KOÇ Tablo 3.9. Segel Ver Kümes x y Kayak: Emerso ve Hoagl (983) Şekl 3.9. Tablo 3.0 dak ver saçılım grafğ. Kese term olmada br model kullaıldı. Keskl çzgye karşılık gele EKK tahm edcs ve düz doğruya karşılık gele LMS modeldr. Şmd de Hampel kulladığı verye bakalım. Burada Tablo 3. de yede yapıldı. Olar farklı oktada su akışıı ölçtüler. Her j değşke ç; s, 486med x (3.8) j j 50

61 3. BASİT REGRESYON Yekta Stara KOÇ Şekl 3.0. Lbby ve Newgate tek su debs saçılım grafğ EKK (keskl doğru) ve LMS (düz doğru) model. Bu yüzde 0 da farklı sapmalar düşüülmes matıklıdır. Ayı ede ç ver her x j y stadartlaştırarak x s j j (3.9) bçmde yapıyor Bast Regresyo İç Dğer Robust Tekkler So 50 yıla kadar brçok tekk bast regresyo modelde tahm edle eğm ve kese ler sürmüştür. Buları çoğu % 30 luk kırılma oktasıa ulaşmadı. Emerso ve Hoogl (983) tarh br celeme verdler. Bu celeme Wald (940), Nar ve Shrvastava (94), Bartlett (949) ve Brow ve Mood (95) tekkler hakkıda bazı açıklamalar çerr. Bu regresyo yötemler tamame ver kümesde ayrılma fkre dayaıyor ve o zama her grup ç özet değer olarak taımlaıyor. Olar EKK regresyouu robust olmayışıı merakı le lgl kaıyı doğruladılar. Fakat sadece bast regresyoa başvurablrler. 5

62 3. BASİT REGRESYON Yekta Stara KOÇ Tukey (970/97) sağlam doğru yötem robust tahme lk yaklaşımları br değşmdr. Tek değşkel verye göre modellemş br doğru ç bu kalem ve kağıt tekğ heme heme eşt geşlkte 3 parça çde ver kümes bölümesde başlar. Bu pay ayrımı e küçük, orta ve e geş değerlere göre uygulaır. X değerlere bağlı olarak ayı grup seçlr. O zama robust eğm taımlaır. Öyle k e dıştak gruplarda dektr. Ya med y ˆ x ) med( y ˆ x ) (3.0) ( L R Burada L left (sol), R rght (sağ) ı smgeler. Burada kese değer her k grubu medya rezdüsüü 0 yapmak ç seçlr. Bu tekkle sapalara karşı var ola korumaı e kötü durum sıırlaması /6 dır. Çükü her k grup ç de kırılma oktası ½ ola medya kullaılır. Vellema ve Hoogl (98) sağlam doğruları bulmak ç br algortma ve portatf program sağladılar. Bu tahm edc üzere bazı teork ve Mote Carlo souçları Johstoe ve Vellema (985b) tarafıda sağladı. Brow ve Mood (95) tekğ ayı şeklde taımlaır fakat grup yere 3 grupla verlmştr. Souç olarak bu tekk ç kırılma oktası ¼ e artar. Adrews (974) elde edle düz br doğru model ç başka br medyaa dayalı yötem gelştrd. O, x değerler e küçükte e büyüğe doğru sıralayarak başladı, sora c değerlerde e küçük ve e büyükler bell br sayısıı eled ve de bu değerler bell sayıda k medya (x değer ) komşuluklarıdak değer x değerler kala k kümesde medyaları hesapladı. (med x ve med x ). y değere göre de medyalar hesapladı. (med y ve med y ). Model eğm o zama şu şeklde taımlaır: ˆ medy medx medy medx Bu yötem kırılma oktası e fazla %5 tr. Çükü her k ver kümes yarısı modellemş doğruyu açıklayablyor. Adrews bu tekğ çoklu regresyoa geelled ve bua süpürme operasyou ded. Ya her tme de br değşke dğere 5

63 3. BASİT REGRESYON Yekta Stara KOÇ bağımlılığı değşke e erke aşamada taımlaa br katı tarafıda bell br değşkee uyarlaması le kaldırılır. Ayı fkr robust doğruya geellemek ç kullaılır. Bast regresyo tahm edcler dğer br grubu, ver kümesde ayırmaksızı oları taımıda yapı taşları gb eğm çftler kullaılır. Thel 950, c eğmler ˆ meydaıı şu şeklde taımladı. med y y ˆ j (3.) j x j x Bu tahm edcs yüksek asmtotk etkye sahptr. Se(968) x ler arasıdak lşkler dare etmek ç bu tahm edcy gelştrd. Bu tekkler kırılma oktasıı yaklaşık %9,3 olduğu ortaya çıktı.bu değer şu sebeple açıklaablr:iy br eğm oraı e azıda ½ olmak zoruda olduğu ç e az ½ ola (- ) fadese htyaç vardır.burada verdek sapaları kırılmasıdır.buda dolayı şu fade yazılır: / / 0,93. (3.) Daha yakılarda Segel (98) so gelşmelerle kırılma oktasıı % 50 ye arttırdı. Bu da bz tekrarlı medya tahm edcse götürür. Bu yötemle (3.) dek tek medya yere eğm çftler medyaıı k aşamada hesaplamak zoruda kalıdı. Eğm ve kese aşağıdak gb taımladı: ˆ ˆ med med med j ( y ˆ x ) y x j j y x (3.3) Bast regresyo tekkler br kısmı da bölüm 4 te verlecektr. Farklı regresyo tekkleryle elde edle modeller krlemeye karşı kıyaslamak amacıyla 53

64 3. BASİT REGRESYON Yekta Stara KOÇ yapay br örek düşüelm: 30 tae y gözlem leer lşkye göre meydaa getrld ve y,0x, 0 e (3.4) şeklde modelled. Burada x,[,4] aralığıda hep ayı şeklde dağılır ve e, 0 ortalamalı ve 0, stadart sapmalı ormal dağılımlıdır. O zama 0 kötü gözlem br sııfı ekled. Bular 7, ortalamalı ve 0,5 stadart sapmalı tek değşkel ormal dağılıma sahptr. Bu se brleştrlmş örektek krleme %40 olduğuu verr. Bu da çok yüksektr. Aslıda bu mktar eğer bast regresyo ç tahm edcler çoğuu kırılma oktasıı yukarı çekyorsa e olduğuu göstermek ç seçlr. Şmd de hag tahm edc ver çoğuluğuu model açıklayacağıı e ys başaracağıı görelm. Klask EKK yötem ˆ =-0,47 ve ˆ =5,6 y verr. İy ve kötü oktalara uymaya çalıştığı ç buu başarısız olduğu açıktır. Şekl 3.. Altı yötem kullaılarak yapay ver ç regresyo doğruları. (RLS, LMS e dayalı yede ağırlıkladırılmış e küçük kareler; EKK, e küçük kareler; M,Huber M tahm edcs; GM, Mallows u ve Schweppe M tahm edcler; RM, tekrarlı medya).kayak: Rousseeuw (984). 54

65 3. BASİT REGRESYON Yekta Stara KOÇ 3 robust tahm edcs uyguladı: Huber ( x ) m(.5, max(.5, x)) M-tahm edcs, Hampel ağırlıklarıyla Mallows u geelleştrlmş M-tahm edcs Hampel Krasker ağırlıklarıyla Schweppe geelleştrlmş M-tahm edcs (Mallows ve Schweppe tahm edcler ayı Huber foksyouu kulladılar ). Ye de bu 3 yötem EKK çözümüde erdeyse ayırt edlemez souçlar verr. Bazı M-tahm edcler şulardır: Huber mmax : t ; t b ( t) b,sabttr. bsg( t) ; t b Ie mmax : t ; t a ( t) bsg( t).tah 0 b( c t ; a ; d. y t c a,b ve c sabtler Hampel : t ; t a ( t ) asg( t) c t / c b asg( t) ; a ; b t t b c 0 ; d. y. a,b ve c sabtler Adrew : 55

66 3. BASİT REGRESYON Yekta Stara KOÇ ( t) s( t) 0 ; ; d. y. t Tukey : ( t) t 0 t / c ; t c ; d. y dır. 56

67 4. ÇOKLU REGRESYON Yekta Stara KOÇ 4. ÇOKLU REGRESYON 4..Grş Çoklu regresyoda y yaıt değşke modeldek p tae x,..., xp açıklayıcı değşkelere bağlıdır. y x... xp p e ( =,, ) (4.) Bast regresyodak gb blmeye,..., p parametreler tahm ç EKK tekğ sapaları varlığıa oldukça hassastır. Böyle oktaları buluması, saçılım grafğde etk oktalarıı belrlemes artık mümkü olmadığı ç daha zor olur. Bu edele böyle oktaları belrleye br araca sahp olmak öemldr. So brkaç 0 yıldır, brçok statstkç robust regresyoua öem verd. Bua karşılık dğerler dkkatler regresyo dagostklere çevrdler. Her k yaklaşım da heme heme ayı k öeml yaygı amaca dayaır. Ya sapaları ve model yeterszlğ belrlemek. Fakat olar farklı br yöde lerledler. Regresyo dagostkler br regresyo model uygulamada öce ver kümesde slmş ola oktaları belrlemek ç uğraştı. Robust regresyou se bu problemler ters br basamakta ele alarak dğer durumlarda oldukça yüksek etkl ola oktaları etks azaltmayı tasarlayarak yapılır. Br robust yötem ver çoğuluğuu br modele uydurmaya çalışır. İy oktalarla bçmlemş modelde uzakta yerleşe kötü oktalar souç olarak robust modelde geş rezdülere sahp olacaktır. Bu edele sapaları hassas olmayışıa ek olarak br robust regresyo tahm edcs bu oktaları bulumasıı kolay br ş olarak yapar. Elbette EKK dak rezdüler bu amaçla kullaılamazlar çükü sapalar çok küçük EKK rezdülere sahpke EKK model bu sapa oktaları çok fazla çekeblr. EKK ya alteratf br robust a htyacı göstermek ç bazı öreklere bakalım. İlk öce Browlee (965) tarafıda bulua ve e y ble stackloss (yığı kaybı) ver kümesdr. Bz bu öreğ gerçek verler br kümes olduğu ç ve brçok yötemle çok sayıda statstkç tarafıda celedğ ç seçtk. 57

68 4. ÇOKLU REGRESYON Yekta Stara KOÇ Ver tablo de lstelee 4 ölçekl gözlemde oluşur. Ver amoyağı trk aste oksdasyou ç br btkdek şlem taımlıyor. Yığı Kaybı (y), x ora şlem, x soğutulmuş suyu grş sıcaklığı ve x 3 ast kosatrasyou le açıkladı. Özetle lteratür atıf almış buluşları gösterdğ,3,4 ve. gözlemler sapa olduğu soucuu brçok saı çıkardığı söyleeblr. Bazılarıa göre. gözlem de br sapadır. EKK regresyou şu deklem verr: y ˆ 0,76 x,95 x 0,5 x3 39,9, Tablo 4. Yığı Kaybı Vers (Stackloss Data) İdeks Ora Sıcaklık Ast Kosatrasyou Yığı Kaybı ( ) ( x ) ( x ) ( x 3 ) ( y ) Kayak: Browlee (965) EKK gösterge grafğ Şekl 4. de gösterlyor. Rezdüler stadartlaştırılması rezdüler her br kısmıa modele uygu ölçek tahm le uygulaır. Yatay şert.5 le.5 arasıda stadartlaştırılmış rezdüler etrafıı çevryor. Böyle Şekl 4. de olduğu gb sapa göze çarpmıyor. EKK gösterge grafğde stadartlaştırılmış EKK rezdüler şerd çe tamame düştüğü ç 58

69 4. ÇOKLU REGRESYON Yekta Stara KOÇ ver kümes sapa çermedğ soucua varılır. Fakat Şekl 4. ye bakarsak e küçük medya kareler ( LMS ) le lşkl ola gösterge grafğ y ˆ 0,74 x 0,357 x 0,000 x3 34,5, Bu grafk robust modele dayaır ve gerçekte zararlı oktaları varlığıı ortaya çıkarır. Bu gösterge grafğde, 3, 4 ve. gözlemler e uzakta olduğu Şekl 4.. Yığı kaybı vers: EKK ye göre deks grafğ Şekl 4.. Yığı kaybı vers: LMS e göre deks grafğ 59

70 4. ÇOKLU REGRESYON Yekta Stara KOÇ ve. gözlem sapaları olduğu bölge sıırıda olduğu ç arada olduğu heme açık br bçmde görülür. Bu durum robust regresyo tekğmz bu very tek br hamlede asıl aalz edebldğ gösteryor. Bular ayı ver kümes lk aalzlerde zahmetl ve uzu ola bazılarıyla kıyaslaır. Bu örek sadece EKK rezdülere bakılmasıdak tehlkey br kere daha gösteryor. Her regresyo aalzde EKK ve robust yötem her ks stadartlaştırılmış rezdüler kıyaslamaı gerekl olduğuu söyleyeblrz. Eğer k yötemde souçları heme heme ayı se o zama EKK güvelr olablr. Eğer farklı se robust yötem sapaları ortaya çıkarmak ç uygu br araç olarak kullaılablr. Burada o zama sapalar tamame araştırılablr ve belk düzeltleblr (eğer orjal ölçülere göre br yakısa) ya da sleblr. Başka br olasılık se model değştrmektr ( öreğ kareler ekleyerek ya da ters çarpım termler ekleyerek ve / veya yaıt değşke değştrerek ). Bu şeklde Atkso (985, s.9-36) x, x x ve x aracılığıyla log (y) y açıklaya modeller kurarak yığı kaybı x, vers aalz ett. Sorak örek sosyal blmde gelyor. Bu ver kümes orta atlas okyausu ve ye İgltere bölgesde 0 tae okulu blgs çeryor. Colema tarafıda celee br populasyoda alımıştır (966). Mosteller ve Tukey (977) 6 farklı değşke üzerdek ölçümlerde oluşa bu öreğ aalz ettler bularda br yaıt değşke olarak alıdı ve aşağıdak gb taımladı. x = Kş başı düşe persoel maaşı x = Memur babaları yüzdes x 3 = Sosyo ekoomk statüde sapma durumları: Ale servet, ale zarar görmüşlüğü, babaı eğtm durumu, ae eğtm durumu ve ev eşyaları. x 4 = Öğretmeler sözlü sıav pualarıı ortalaması x 5 = Ae eğtm sevye ortalaması (her brm okul yılıdır.) y = Sözlü sıav ortalaması Sırada EKK regresyou le 0 okul ç model 60

71 4. ÇOKLU REGRESYON Yekta Stara KOÇ y ˆ,79 x 0,044 x 0,556 x3,x4,8x5 9,9, olarak verlr. E küçük medya kareler regresyouu model se y ˆ 0,580 x 0,058 x 0,637 x3 0,740 x4,3 x5 5, olarak verlr. Tablo 4.3 ü sol kısmı EKK tahmler ve ortak rezdüler lstelyor. Bu souçlar EKK deklem 3 ve okulları ç yaıtı braz altıdak tahm ve 8 okulu ç se tahm üstüde olduğuu ortaya çıkardı. Sadece EKK soucuu Tablo 4.. Orta Atlas ve Ye İgltere Bölgesde 0 Okulu Blgs İçere Colema Ver Kümes İdeks x x x 3 x 4 x 5 3,83 8,87 7,0 6,60 6,9 37,0,89 0,0 -,7 4,40 5,7 6,5 3,86 69,05,3 5,70 7,04 36,5 4,9 65,40 4,8 5,70 7,0 40,70 5 3,06 9,59 6,3 5,40 6,5 37,0 6,07 44,8 6,6,60 6,4 33,90 7,5 77,37,70 4,90 6,86 4,80 8,45 4,67-0,7 5,0 5,78 33,40 9 3,3 65,0 9,85 6,60 6,5 4,0 0,44 9,99-0,05 8,0 5,57 37,0,09,0 -,86 3,5 5,6 3,30,5,55 0,9 3,60 5,34 35,0 3, 4,30 4,77 4,5 5,80 34,90 4,67 3,79-0,96 5,80 6,9 33,0 5,7,60-6,04 5,0 5,6,70 6 3,4 68,47 0,6 5,0 6,94 39,70 7 3,54 4,64,66 5,0 6,33 3,80 8,5 6,70-0,99 4,80 6,0 3,70 9,68 86,7 5,03 5,5 7,5 43,0 0,37 76,73,77 4,5 6,96 4,0 y Kayak: Mosteller ve Tukey (977) celeyerek 3, ve 8 okullarıı leer modelde e uzak kala okullar olduğu soucu elde edlr. Fakat Tablo 4.3 ü sağ kısmıdak okulu robust modelde tamame sapmadığı görülür. 6

72 4. ÇOKLU REGRESYON Yekta Stara KOÇ Robust regresyou 3, 7 ve 8 okullarıı geş stadartlaştırılmış rezdülere ayırarak sapalar olarak seçt. Sorada bu stadartlaştırılmış rezdüler mutlak stadartlıştırılmış (.5 ta daha geş olalar) rezdüye sahp bütü gözlemlere göre 0 ağırlığıı vere ağırlıkları hesaplamak ç kullaılır. Colema ı ver kümese buu yapmak tablo 3 te so sütuu verr. Bu ağırlıklar yede ağırlakladırılmış EKK aalz (RLS) kulladırır. ağırlıklı sadece 7 oktayı çere ver kümese EKK regresyo uygulayarak ayı şeye varılır. Modellemş deklemde ve ortak rezdülerde ayrı olarak sapalarda t ye Tablo 4.3. Colema Vers: Tahm Edlmş Sözlü Sıav Souçlarıı Ortalaması ve EKK ve LMS Model ç Ortak Rezdüler EKK Souçları LMS Souçları Tahm edlmş Stadartlaştırılmış Tahm edlmş Stadartlaştırılmış İdeks yaıt rezdüler yaıt rezdüler ağırlıklar 36,66 0,7 38,883 -,59 6,860-0,7 6,57-0,0 3 40,460 -,90 4,73-4, ,74-0,3 4,05 -,8 5 36,39 0,38 37,7-0,0 6 33,986-0,04 33,97-0,0 7 4,08 0,35 4,68 0,5 8 33,834-0, 3,9 0,4 9 40,386 0,30 4,59-0, ,990 0,0 34,847,00 5,580 -,06 3,69 0, 33,454 0,84 33,54, ,949-0,5 34,97-0,0 4 33,446-0,7 3,59 0,43 5 4,479-0,86,77-0,0 6 38,403 0,63 40,04-0,9 7 33,40-0,69 35, -, ,698,4 4,98 5, ,977 0,54 4,66 0, ,747 0,3 4,07-0,0 dayalı alamlılık sevyelerde etklemştr. Bu durum güve aralıklarıı oluşturulmasıda ve regresyo katsayılarıı hpotez testler ç öemldr. Colema ı testler ç regresyo katsayılarıı alamlılığıı EKK model ve RLS modeldekde oldukça farklı olduğu ortaya çıktı. Tablo 4.4 tek t değerl sıfır hpotez H : 0, alteratf hpoteze 0 x değşkeler x = % 5 0 j H j 3 ve x4 6

73 4. ÇOKLU REGRESYON Yekta Stara KOÇ ç öeml derecede 0 da farklı EKK regresyo katsayılarıa sahptr. Çükü t değerler 4 (= -p) serbestlk derecel Studet dağılımıı,448 değerde büyüktür ve bu edele p değerler 0,05 altıdadır. Şmd de bu ver RLS l aalz yapalım. Bu Tablo 4.4 ü sağ yaıdak katsayılara ve t değerlere sebep olur. Temzlemş ver ç şaşırtıcı ola durum şmd bütü açıklayıcı değşkeler = % 5 alamlılık sevyesde 0 da Tablo 4.4. Colema Vers: EKK ve RLS Modellere Göre t Değerler EKK Souçları RLS Souçları Değşke Katsayı t Değer p Değer Katsayı t Değer p Değer x -,793 -,454 0,680 -,03 -,539 0,075 x 0,044 0,89 0,467 0,08 4,47 0,0009 x 3 0,556 5,979 0,0000 0,659 9,4 0,0000 x 4,0,559 0,07,098 7,89 0,0000 x 5 -,80-0,893 0,3868-3,898-5,77 0,0003 St Term: 9,949,464 0,65 9,750 6,95 0,000 St: sabt öeml derecede farklı regresyo katsayılarıa sahp olmasıdır. ( serbestlk derecel t dağılımıı % a eşttr. Bu edele bütü p değerler 0,05 te azdır). Brçok örekte bazı EKK regresyo katsayılarıı öemllğe sadece sapalar ede olur ve o zama karşılık gele RLS katsayıları artık 0 da öeml derecede farklı değldr. Sırada EKK yötem gzlemş etkye karşı sağlam değldr. Ya br veya daha fazla etkl oktaı slmesde sora başka br gözlem lk başta görülmeyp sora etkl olarak çıkablr. Bu edele yüksek kırılmalı regresyo yötem (LMS gb) kullaımı ağırlıkları taımlaması ç zoruludur. Br örek olarak Ruppert 63

74 4. ÇOKLU REGRESYON Yekta Stara KOÇ ve Carroll (980) ı tablo 5 te lstee tuzluluk vers düşüelm. Sudak tuzu ve kuzey Carola ı Pamlco Boğazıda akıtısı tutulmuş ehr (öreğ tuz kosatrasyou) ölçüm kümesdr. haftaya kadar gerde kala tuzluluğa ( x ) karşılık gerde kalmış tuzluluğu olduğu br model oluşturacağız. Burada eğm ya bahar mevsm başlagıcıda ber geçe şer haftalık peryodları sayısıdır ( x ). x 3 se ehr hacm boğazdak boşalmasıdır. Carroll ve Ruppert (985) ver fzksel altyapısıı taımladılar. Durum 5 ve 6 ı çok ağır boşaltma Tablo 4.5. Tuzluluk Vers İdeks Kala Tuz Meyl Boşalma Tuzluluk () ( x ) (x ) (x 3 ) (y) 8, 4 3,005 7,6 7,6 5 3,873 7,7 3 4,6 0 6,47 4,3 4 4,3 4,868 5,9 5 5,9 9,895 5,0 6 5,0 3 4,00 6,5 7 6,5 4 3,5 8,3 8 8,3 5,86 8, 9 0, 0,74 3, 0 3, 3,830,6,6 5,44 0,4 0,4 3,430 0,8 3 0,8 4,785 3, 4 3, 5,380,3 5 3,3 0 3,97 0,4 6 0,4 33,443 0,5 7 0,5 4,859 7,7 8 7,7 3,686 9,5 9 0,0 0,789,0 0,0,04,6, 4,033 3,6 3,6 5,005 4, 3 5,0 0 5,865 3,5 4 3,5 6,90,5 5,5,93,0 6,0 3,33 3,0 7 3,0 4 0,769 4, 8 4, 5,393 5, Kayak: Ruppert ve Carroll(980) 64

75 4. ÇOKLU REGRESYON Yekta Stara KOÇ peryotlarıa karşılık geldğ gösterdler. Yaptıkları aalzler 5. gözlem sadece 3. ve 6. durumları slmesde sora etkl olduğu hatırlaabld. Bu gzl etk br öreğdr. Dğer tarafta LMS bu doğal olayda etklemed ve tek hamlede 5 ve 6 yı sapa olarak belrled. EKK model şu şeklde verlr. y ˆ 0,777 x 0,06 x 0,95 x3 9,59, Bua karşılık LMS model şu şeklde verr: y ˆ 0,356 x 0,073 x,30 x3 36,7, EKK a karşılık gele rezdü grafğ Şekl 4.3 te vardır. Bu şeklde stadartlaştırılmış rezdüler tahm edlmş yaıt değşkee karşılık grafklemştr.şekl 4.4 te böyle br rezdü gafğ LMS ç verlmştr. Şekl 4.3 te görülüyor k modelde br yalışlık yoktur. Fakat sadece kaldıraç oktaları yüzüde küçük EKK rezdüler üretmeye meyll kaldıraç oktaları olduğu akılda tutulmalıdır. Şekl 4.4 uzaktak gözlemler varlığıa taıklık edyor. Çükü bazı oktalar şertte uzağa düştü. Bu örekte EKK rezdü grafğ robust modele göre olada çok daha fazla farklı olduğu ç güvelr değldr. Şekl 4.3. Tuzluluk vers: EKK modele göre rezdü grafğ 65

76 4. ÇOKLU REGRESYON Yekta Stara KOÇ Şekl 4.4. Tuzluluk vers: LMS modele göre rezdü grafğ Öcede söyledğmz gb rezdü grafkler modellemş değerler yöüde model foksyouda olası kusurları da göstereblr.br rezdü grafğ,öreğ yaıtı mooto foksyou ola varyas model,gösterr.eğer model foksyoel kısmı belrl değlse o zama grafktek stadartlaştırılmış LMS rezdüler ŷ ya yapısız dye bakıla oktaları düşey şerdde br artışı verr. Ye de modeldek aormallkler modeldek değşkeler döüşümü ler süreblr. Öreğ br rezdü grafğde eğr model alması şe souçlaır ( log y veya y bazı foksyoları tarafıda yer y bell br gücü arttırır ). 4..Çoklu Regresyoda E Küçük Medya Kareler Hesaplaması Bu kısımda başarısız modeller yleştrmek ç rezdü grafkler kullaımıı göstereceğz. Çoklu regresyola brlkte yapıla etkleşm döem tamame bezerdr. Kayıp değerl ver kümes özel br şlem heüz yapılmadı. Bu durumda etk grş braz uzu olur. New York ulusal hava koruma ve ulusal hava durumu servsde hava kaltes vers bölümü ç bu durumu göstereceğz. Bu verler tamame Chambers te rapor edlmştr (983). Bütü ver kümes mayıs 973 te 30 eylül 973 e kadark hava kaltes değerler gülük okumasıda oluşuyor. Değerler Roosevelt adasıda 300 de 500 saate kadar ozo 66

77 4. ÇOKLU REGRESYON Yekta Stara KOÇ yoğuluğuu ortalaması (mlyarda br, Ozoe ppb), merkez parkta 0800 de 00 saate kadar A 0 frekas badıda Loglays te solar radyasyo (Solar Tablo 4.6. Mayıs 973 ç Hava Kaltes Vers Kümes İdeks Solar Radyasyo Rüzgar Hızı Sıcaklık Ozo ppb () x ) ( x ) ( x 3 ) (y) ( 90 7, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , x 9999 değer kayıp ölçüler gösterr. y 999 sayısı kayıp değere karşılık gelr. Kayak: Chamblers (983) Rad), ortalama rüzgar hızı (saattek ml), La Guarda hava alaıda 0700 ve 000 saat arası ortalama rüzgar hızı (Wdspeed) ve maksmum gülük sıcaklık (Fahreayt derecesde, Temperature) La Guarda hava alaıda. Ver Tablo 4.6 da gösterlyor. 67

78 4. ÇOKLU REGRESYON Yekta Stara KOÇ Bu aalz amacı dğer değşkeler amacıyla ozo kosatrasyouu açıklamaktır. Tablo 4.6 da ozoe ppb ve / veya solar radyasyo ölçümler (uzu br gü ç kaydedle ölçümler). Araştırmacıları açtığı lk yol kayıp ola e az br değşke kayıp olduğu durumları elemektr. Bu e eşt ola kayıp değer seçeeğ ayarlayarak başarılablr. Hava kaltes vers ç 9999 le solar radyasyo ve ozoe ppb y 999 le değşkeler kayıp değerler kodlayacağız. Bu kodlar değşkeler gözlemedğ ç kabul edleblr. Şmd bu ver kümes ç etk çıktısıı lstese bakalım: Tablo 4.7. Hava Kalte Vers: Tahm Yaıt ve Stadartlaştırılmış Souçlarla EKK Model Değşke Katsayı Stadart Hata t Değer Solar Rad. -0,0868-0,0368-0,550 Rüzgar Hızı -,99577,409 -,7496 Sıcaklık,9633 0,66368,9583 Sabt Değer -79, ,8654 -,70864 İdeks Tahm Ozo ppb Stadartlaştırılmış Rezdüler 33,3 0,43 43,95-0, ,36 -,4 4,933 0,8 7 4,873-0,0 8 6,45 0,70 9-0,700 0,48 3,334-0,85 3 5,807-0,8 4 6,639-0,70 5 6,3 0,65 6 6,468-0,4 7 9,90 0,78 8-6,63 0,68 9 4,545 0,30 0,55-0,59 6,335-0,85 4, -0,73 3 9,944-0,89 4 4,0 0,99 8 7,357-0,4 9 44,59 0, ,567 3, ,38-0,68 Azaltılmış ver kümes EKK aalz Tablo 4.7 de yazılmıştır. Modellemş ozoe ppb değerler bazıları (9 ve 8) egatftr k bu fzksel olarak mkasızdır. 68

79 4. ÇOKLU REGRESYON Yekta Stara KOÇ Bu model tuhaf davraışı Tablo 4.8 dek robust aalz le kıyasladığıda kolayca alaşılır. Bularda lk her k model deklem esase brbrde farklıdır. Tablo 4.8 dek stadartlaştırılmış rezdüler çe ala sütuda 30 durumu br sapa olarak çıkar. Bu tek sapa EKK hperdüzlem eğdğ ç EKK model kötü br durumudur. Bu yüzde dğer oktalar EKK tarafıda artık y modelleemyor. Elbette egatf tahm değerler leer deklem her e zama modellerse bekleleblr. Gerçekte de regresyo yüzey yatay olmadığı zama tahm Tablo 4.8. Hava Kaltes Vers: LMS ye Dayalı RLS Model Değşke Katsayı Stadart Hata t Değer Solar Rad. 0, ,03 0,555 Rüzgar Hızı -0, ,749 -,04745 Sıcaklık 0,9935 0,498,3438 Sabt Değer -37,563 8,9547 -,957 İdeks Tahm Ozo ppb Stadartlaştırılmış Rezdüler 4,57,5 8,686 0,68 3 7,40 -,4 4 7,0 0,07 7,94 0,07 8,3 0,7 9 8,43-0,0 5,04-0,85 3,788 -,09 4 3,43-0,87 5 0,587 0,69 6 9,35-0,49 7 0,786, 8 5,77 0,0 9 3,3 0,63 0 7,065-0,56 3,883 -,9 4,369 -,4 3 5,965 -, 4 4,67,6 8 0,37 0,6 9 33,0, ,950 7,3 3 34,00 0,8 69

80 4. ÇOKLU REGRESYON Yekta Stara KOÇ ŷ egatf olduğuda x vektörler dama vardır. Br x kaldıraç oktasıda egatf br ŷ le kolayca karşılaşılablecek robust regresyou hala doğrudur. Fakat yukarıdak örekte EKK tahmler y gözlemlerde egatfdr. 4.3.Örekler Öcek bölümlerde yüksek kırılmalı modeller daha fazla düşüülmes gerektğ gördük. Özellkle robust modele bağlı stadartlaştırılmış rezdüler güçlü dagostk araçlar verd. Öreğ rezdü grafklerde görüleblr. Bu grafkler uzaktak sapa değerler bulumasıı ve model başarısızlığıa dkkat çekmey kolaylaştırır. Ye de rezdüler her okta ç br ağırlık taımlama da kullaılablr. Böyle ağırlıklar RLS ç sapaları etks sıırlamayı mümkü kılar. Yede ağırlıkladırılmayla gele model ver çoğuluğu tarafıda takp edle eğm taımlar. Modele bağlı statstkler (F ve T değerler gb) EKK regresyouyla hesaplaalarda daha güvelrdr. Örek 4.3.: Hawks Bradu Kass vers Robust tekğ mezyetler bazılarıı göstermek ç Hawks, Bradu ve Kass (984) tarafıda üretle very kulladı. Böyle yapay br ver e azıda kötü oktaları durumuu tam olarak blmes avatajıı suar. Burada gerçek ver aalzlerde doğal oluşlarıda dolayı tartışmaları bazılarıda kaçıılır. Bu şeklde bu yötem etkllğ ölçüleblr. Ver kümes tablo 9 da lsteleyor ve 4 ölçekl 75 gözlemde oluşuyor. ( yaıt ve 3 açıklayıcı değşke ) lk 0 gözlem kötü kaldıraç oktalarıdır. ( sapadır fakat karşılık gele x ler y ler modele oldukça y uyar ). Bz robust regresyou le EKK yı kıyaslayacağız. Hawks (984) de, M tahm edcler beklee souçları üretemedğde bahsedlyor. Çükü sapalar (kötü kaldıraç oktaları) gzleld ve 4 y kaldıraç oktası modele göre geş rezdülere sahp olduğu ç sapa olarak görüldü. Bu bz şaşırtmamalı çükü M tahm edcler kaldıraç oktaları olduğuda dolayı erke bozulur. Hawks temel kümeler bell br 70

81 4. ÇOKLU REGRESYON Yekta Stara KOÇ Tablo 4.9. Hawks, Bradu Ve Kass ı Yapay Ver Kümes İdeks x x x 3 y İdeks x x x 3 y 0, 9,6 8,3 9,7 39, 0,0, -0,7 9,5 0,5 8,9 0, 40 0,5,0, -0,5 3 0,7 0, 3,0 0,3 4 3,4,6,9-0, 4 9,9,5 3,7 9,5 4 0,3,0,7-0,7 5 0,3, 3, 0,0 43 0, 3,3 0,9 0,6 6 0,8 0,4 9, 0,0 44,8 0,5 3, -0,7 7 0,5 0,9 9, 0,8 45,9 0, 0,6-0,5 8 9,9 9,6 8,8 0,3 46,8 0,5 3,0-0,4 9 9,7 0,7 3,0 9,6 47 3,0 0, 0,8-0,9 0 9,3 9,7 30,3 9,9 48 3,,6 3,0 0,,0 4,0 35,0-0, 49 3,,5,9 0,9,0 3,0 37,0-0,4 50,,8,9-0,4 3,0 6,0 34,0 0,7 5,3,5 0,4 0,7 4,0 34,0 34,0 0, 5 3,3 0,6, -0,5 5 3,4,9, -0,4 53 0,3 0,4 3,3 0,7 6 3,, 0,3 0,6 54, 3,0 0,3 0,7 7 0,0,6 0, -0, 55 0,5,4 0,9 0,0 8,3,6,0 0,0 56,8 3, 0,9 0, 9 0,8,9,6 0, 57,8 0,7 0,7 0,7 0 3, 3,4, 0,4 58,4 3,4,5-0,,6,,9 0,9 59,6, 3,0-0,3 0,4 3,,9 0,3 60 0,3,5 3,3-0,9 3,0,3 0,8-0,8 6 0,4 3,4 3,0-0,3 4,3,3 0,5 0,7 6 0,9 0, 0,3 0,6 5,0 0,0 0,4-0,3 63,,7 0, -0,3 6 0,9 3,3,5-0,8 64,8 3,0,9-0,5 7 3,3,5,9-0,7 65,0 0,7,7 0,6 8,8 0,8,0 0,3 66 0,,8 0,8-0,9 9, 0,9 0,8 0,3 67,6,0, -0,7 30, 0,7 3,4-0,3 68 0, 0,0, 0,6 3 3,,4,0 0,0 69,0 0,6 0,3 0, 3 0,5,4 0,3-0,4 70,0,,9 0,7 33,5 3,,5-0,6 7,,5,3 0, 34 0,4 0,0 0,7-0,7 7 0,6,0,5-0, 35 3,,4 3,0 0,3 73 0,3,7, 0,4 36,,,7 -,0 74 0,0,,6-0,9 37 0, 3,0,6-0,6 75 0,3 0,4,6 0, 38,5, 0, 0,9 değşm dagostkç sapaları yer tam olarak belrler fakat bu tekk krleme daha geş br kırılması le başa çıkamaz. 7

82 4. ÇOKLU REGRESYON Yekta Stara KOÇ Şmd EKK ve LMS y tartışmayla sıırlayalım EKK ya bağlı deks grafğde (Şekl 4.5 e bakıız) 7.5 şerd dışıa düştüğü ç.,. ve 3. Şekl 4.5. Hawks-Bradu-Kass vers: EKK regresyoua göre deks grafğ Şekl 4.6. Hawks-Bradu-Kass vers: LMS regresyoua göre deks grafğ gözlemler sapa olduğu görülüyor. Maalesef öcek modelde buları y gözlem olduğu blyor. Kötü kaldıraç oktaları EKK model yöüde tamame çıkarıp eğerler. Bu edele lk 0 okta küçük stadartlaştırılmış EKK rezdülere sahptr. ( M tahm edclere göre deks grafkler EKK ı kde çok daha küçüktür.) Dğer tarafta LMS deks grafğ (Şekl 4.6) lk 0 oktayı etkl gözlemler 7

83 4. ÇOKLU REGRESYON Yekta Stara KOÇ olarak açıklıyor. 4 y kaldıraç oktası 0 dolaylarıda keskl doğruu komşuluğua düşer. Ya bu oktalar LMS modele y uymuşlardır. Açıkçası LMS deks grafğde çzle souç ver yapısıyla uyuşuyor. Dğer örek model çeştllğ ç rezdü grafkler kullaımıı gösteryor. Örek4.3.: Bulaık okta vers Tablo 4.0 br sıvıı bulaıklık oktasıyla alakalı ölçümler br kümes gösteryor. Bu bulaık okta br yığıdak krstalleştrme sevyes br ölçüsüdür ve kırıcı deksle ölçüleblr. Tablo 4.0. Br sıvıı bulaıklık vers İdeks I-8 oraı Bulaıklık oktası () (x) (y) 0, 4,5 3 6, , , 6 5 8, , , ,4 0 0,9 6, 4 8, , , , 6 0, , , ,8 Kayak: Draper ve Smth (969,s.6) 73

84 4. ÇOKLU REGRESYON Yekta Stara KOÇ Şekl4.7. Bulaık okta vers: saçılım grafğ Burada amaç bulaık okta ç br tahm olarak kullaılable aa yığıda I-8 yüzdes olduğu br model oluşturmaktır. Ver sadece k değşke çerdğ ç saçılım grafğde bu değşkeler arasıdak lşky araştırması mümküdür. Tablo 4.0 dak saçılım grafğ Şekl 4.7 de buluablr. Şekl 4.7 de eğr/kavsl modelde bast leer br model yeterl olmadığı gösterlyor. Şmd leer modeldek rezdü grafğ buu öerp öermedğ celeyeceğz. Şekl 4.8 dek EKK doğrusuu rezdü grafğde rezdüler sıfır doğrusu cvarıda rasgele dağılmadığı görüldüğü ç doğru model kusurlu olduğu açıktır Bu model sapaları varlığıa sebep olmadığıa em olmak ç RLS doğrusudak (Şekl 4.9) rezdü grafğ şekl8 le kıyaslayacağız. Leerlkte ayrılış bu grafkte büyüdü ve,5 şerd çdek rezdüler parabolk takp etmeye eğlmldr. Durum,0 ve 6 ya bağlı olalar şerd dışıa düşerler k bu RLS doğrusuda dolayı geş rezdülere sahp olduğuu gösterr. EKK ve RLS doğrularıı her ks eğmler brbrde öeml derecede farklı olması gerçeğe rağme (Tablo 4.0 da k t-değerlere bakıız.) leer model uygu değldr. 74

85 4. ÇOKLU REGRESYON Yekta Stara KOÇ Buda başka model yeterllk ölçümü ola R değer yüksektr. EKK ç R =0.955 tr. RLS ç se R =0.977 dr. Bu da gösteryor k yaıt değşkedek toplam değşm %97.7 s açıklayıcı değşke açıklıyor. Elbette R sadece tek model foksyoel bçmdek bütü olası bütü kusurlarıı gösteremez. Geş br R ver y modellemes garatlemez. Dğer yada rezdü grafkler model foksyoel yaıı somutlaştırmaz. Bu edele bu grafkler gözde geçrlmes R geş ya da t-değerler öemllğ durumuda ble regresyo aalz zorulu br parçasıdır. Bu grafksel gösterm beklemedk br model ortaya çıkardığıda modele uyarak hasarı oarmalıdır. Rezdüler öreğde aykırılıklara bağlı olduğuda açıklayıcı değşke lave edleblr veya modeldek bazı değşkeler çıkarılablr. Bütü düzeltlmş modeller katsayıları leerlkler sıırladırmak zorudadır ya da leer regresyo kısmıda çıkarırız. Fakat bazı leer olmaya foksyolar uygu br döüşüm kullaılarak leerleştrleblr. Şekl 4.8. Bulaık okta vers. EKK ye göre rezdü grafğ 75

86 4. ÇOKLU REGRESYON Yekta Stara KOÇ Şekl.4.9. Bulaık okta vers: LMS e dayalı LMS e göre rezdü grafğ Tablo 4.. Bulaık Nokta Vers: EKK ve RLS Regresyouyla Tahm Eğm ve Kese le t Değerler EKK Souçları RLS Souçları Değşke ˆ Stadart t-değerler ˆ Stadart t-değerler Hata Hata I-8 Yüzdes,05 0,055 8,9 0,89 0,036 4,7 Sabt 3,35 0,97 78,7 4,37 0, 5, R 0,955 R 0, 977 Şekl 4.9 gb br eğr grafğ oleerlğ göstermek ç tek yoldur. Bu görüürdek eğrlğ hesaplamak ç alışılmış yaklaşım y 3 x x e (4.) Şeklde br kc derecede model kullaımıdır. Bu model ç EKK ve RLS tahm edcler bazı özet statstkler boyuca Tablo 4. de verlyor. 76

87 4. ÇOKLU REGRESYON Yekta Stara KOÇ EKK ve RLS her ks R değer br parça artıyor. Bua karşılık regresyo katsayılarıı t-değerler heme heme değşmed. Her k model ç katsayılar % 5 sevyesde sıfırda öeml derecede farklıdır. EKK ve RLS ye göre rezdüler dağılımıa Şekl 4.0 ve Şekl 4. de bakablrz. Şekl 4.0. Bulaık okta vers: Kuadratk model ç EKK rezdü grafğ Şekl 4.. Bulaık okta vers: Kuadratk model ç RLS rezdü grafğ EKK rezdü grafğ celedğde eklemş kares alımış term rezdü dağılımıı oarılması tamame başarılamadı. Model tamame yasız değldr. 77

88 4. ÇOKLU REGRESYON Yekta Stara KOÇ Model tekrar değştrmeye karar vermede öce RLS rezdü grafğde sağlaa blgy aalz edelm. Bu grafkte bazı sapalar göze çarpar.,0 ve 5 gözlemler yatay şerd dışıda kalıp LMS modelde sıfır ağırlığıı elde eder.sıfır ağırlıklarıa rağme sapalar grafkte hal görüür.bu oktaları varlığı EKK tahm edcler etkler çükü EKK bütü rezdüler (sapaları rezdüler ble) tahm artması pahasıa küçültmeye çalışır.dğer tarafta uzaktak gözlemler geş br rezdü elde ede RLS tahm edclere göre hareket etmez.dğer gözlemlere göre Şekl 4. de şerd çe düşe rezdüler değşm sstematk br öreğ göstermyor. Şekl 4.0 ve Şekl 4. de varıla özetle kc derecede deklem bast br doğruda başka uygu br model taımladığı soucua varılır.buda başka RLS kc derecede model rezdü grafğ 3 gözlem değer gösterr.bular EKK kc derecede model rezdü grafğde bçm boza değerlerdr. Sapaları varlığı veya uygu br model seçm regresyo aalz tek problem değldr. İk veya daha fazla değşke arasıdak heme heme leer bağımlılık tahm edlmş regresyo görütüsüü cdd br bçmde de bozablr ya da regresyo katsayılarıı açıklayamayablr. Bu olay çoklu leerlk(multcollearty )dye adladırılır. Faktör uzayıda değşkeler arasıda lşk olmaması deal br durum olacaktır. Bu durumda karşılık gele dğer değşkeler sabtke açıklayıcı değşke tek br geşledğde yaıttak değşm mktarı ç br regresyo katsayısıı yorumlamak kolaydır.çoklu leerlk verde mevcut olduğuda regresyo dekleme tek br açıklayıcı değşke katkısıı tahm etmek zordur. Çoklu leerlğ saptamak çok karışık olablr. Sadece değşke olduğuda o zama çoklu leerlk Pearso korelasyouu yüksek mutlak değere ya da alteratf(daha robust) Spearma rak korelasyo katsayısıa götürür. Daha yüksek ölçekl faktör uzaylarıda çoklu leerlk brkaç değşke çerebldğ ç kşer kşer korelasyo katsayıları çoklu leerlğ keşfetmek ç dama yeterl değldr. Bu yüzde kala x değerler üzerde x j regresyouu kares alımış çoklu regresyo katsayıları R J,dğer açıklayıcı değşkelere bağlı herhag x j dereces ölçmek ç dagostkler mümküdür. 78

89 4. ÇOKLU REGRESYON Yekta Stara KOÇ Tablo 4.. Bulaık Nokta Vers: Özet Değerlerle. Derecede Model İç EKK ve RLS Tahmler EKK Souçları RLS Souçları Değşke ˆ Stadart t-değerler ˆ Stadart t- Değerler Hata Hata I-8 Yüzdes,67 0,099 6,9,57 0,084 8,8 (I-8 Yüzdes) -0,07 0,00-6,6-0,07 0,009-7,5 Sabt,56 0,98 3,7,99 0,7 33,7 R 0,955 R 0, 977 Örek4.3.3: Kalp sodası vers Tablo 4.3 tek kalp sodası vers çoklu leerlğ sebep olduğu etks bell br kısmıı gösterr. Soda bütü kalça kemğ bölgesde toplardamarı veya atardamarı çde geçrlyor ve kalb çe hareket edyor. Soda kalp foksyouyla lgl blg sağlamak ç özel br bölge çde hareket edeblyor. Bu tekk baze doğuşta kalb kusurlu çocuklara uygulaır. Söylele bu sodaı uygu uzuluğu doktorlar tarafıda belrlemeldr. çocuk ç uygu soda uzuluğu(y) fluoroskop(rötge perdes) le kotrol edlerek taımlaır. Bu alet soda ucua uygu durum ç ulaştırılır. Soda uzuluğu ve hastaı boyu( x ) ve hastaı klosu ( x ) arasıdak lşky taımlamak amacımızdır. RLS dek hesaplar gb EKK ı k ç de model y x x 3 Tablo 4.4 te verlmştr. e 79

90 4. ÇOKLU REGRESYON Yekta Stara KOÇ Tablo 4.3. Kalp sodası vers İdeks Boy Ağırlık Soda uzuluğu () (x ) (x ) (y) 4,8 40, ,5 93, ,5 35, ,5 30, ,5 5, ,5 7, ,0 38,5 37 8,5 8, ,0 33, ,5 9, ,0, ,0 79,0 47 Hastaı boyu ç, ağırlığı lbre(453 gr)ve soda uzuluğu satmetre olarak verlmştr. Kayak: Wesberg(980,s.8) Her k regresyo ç F-değer geşlğ yeterce büyüktür. Bu da ˆ ve ˆ ı brlkte yaıt değşke tahme katkısı vardır soucua götürür. Her regresyo katsayısı ç t-teste bakılırsa EKK ı ˆ % 5alamlılık sevyesde sıfırda öeml derecede farklı değldr. Ayı şey ˆ ç de söyleleblr. Fakat F- statstğde tümüyle görüle k x değşke öeml olduğu görülür. RLS model ç ˆ sıfırda öeml derecede heüz farklı değldr. Ya karşılık gele açıklayıcı Tablo 4.4. Kalp Sodası Vers: EKK ve RLS Souçları EKK Souçları RLS Souçları Değşke ˆ t - değer p -Değer ˆ t - değer p - Değerler Yükseklk 0, 0,6099 0,5570-0,73 -,094 0,0900 Ağırlık 0,9,074 0,58 0,54 3,750 0,0099 Sabt 0,38,498 0, ,0 4,799 0,0030 R,67 (p=0,0004) R 3, 086 (p=0,0006) 80

91 4. ÇOKLU REGRESYON Yekta Stara KOÇ değşke modele çok az katkısı vardır. Üstelk ˆ şaret metde br alamı yoktur. Böyle olaylar geelde çoklu leerlğ olduğu durumlarda meydaa gelr. Gerçekte Tablo 4.5 değşkeler arasıdak yüksek lşky gösteryor. Boy ve klo arasıdak korelasyo çok yüksektr. Burada her k değşke eredeyse tamame dğer açıklar. Buda başka regresyo katsayıları ç düşük t- değer doğruluyor k açıklayıcı değşkelerde herhag br modelde hmal edleblr. Kalp sodası vers ç bz ağırlık değşke atacağız ve tepedek soda uzuluğuu bast regresyoua bakacağız. Bu k ölçekl ver kümes saçılım grafğ EKK ve RLS modelleryle Şekl 4. de verlyor. uzaıyor. EKK ç y ˆ 0,6x, 48 (şekl de keskl çzg le verlyor.) RLS ç y ˆ 0,64x, ( ˆ şmd poztftr.) EKK a yakı RLS modele azara uzakta kala oktalar 5, 6, 8,0 ve dr. Çükü RLS doğrusuu yukarısıda ve aşağısıda tamame degelemşler. EKK ve RLS doğruları bu örekte aşkar br bçmde farklı değllerdr. Şekl 4.. Kalp sodası vers. çocuğu boylarıa karşı uygu sodaı uzuluğu 8

92 4. ÇOKLU REGRESYON Yekta Stara KOÇ Alteratf seçm, boy yere ağırlığı kullamak olacaktır.soda uzuluklarıı ölçümler hastaı ağırlığıa karşı ola grafk Şekl 4.3 te gösterlyor. Bu saçılım grafğ br leer model yaklaşımıı akla getrmyor.br döüşümü gerekllğ açıktır. Fzksel zemde leerlğ elde etmek amacıyla ağırlığı keds yere ağırlığı küp köküü kullamaya çalışablrz. Hatta çoklu leerlk ç kaıt olmadığı zama açıklayıcı değşkeler tüm kümes modelde tamame kullaarak çok geş yapılablr.ilk öce taımlaa şleyş bçm alatmak ç çok sayıda değşke kullamak buu zorlaştırır.buula brlkte bu durum mümkü olduğu kadar yaıttak değşm açıklamadak objektf le brleşmes gerekr. Şekl 4.3. Kalp soda vers: çocuk ç ağırlığa karşı uygu soda uzuluğuu saçılım grafğ Bu se daha fazla açıklayıcı değşke öeme götürür.fakat statstksel yöde model tamlığıı yleştrmek ç baze değşkeler azaltılmasıı söyleyeblrz. Gerçekte sıfırda öeml derecede farklı olmaya regresyo katsayılarıa karşılık gele açıklayıcı değşkeler tahmler varyasıı arttırablr. Dğer tarafta deklemlerde e uyguua karar vermek ç özel olay blgs yeterldr. Dğer tarafta değşkeler uygu br altkümes bulmak ç statstksel br yötem uygulamak zorudadır.bu problem değşke seçm dye adladırılır. Bu 8

93 4. ÇOKLU REGRESYON Yekta Stara KOÇ se model çeştllğ probleme sıkı sıkıya bağlıdır. Gerçekte de değşke seçm problem dekleme hag bçmde açıklayıcı değşke grmes gerekr(kares alımış term,logartmk term,, vb.) sorusuu çerr. Tablo 4.5. Kalp Soda Vers:Değşkeler Arasıdak Korelasyo Pearso Korelasyo Katsayısıları Yükseklk,00 Ağırlık 0,96,00 Soda uzuluğu 0,89 0,90,00 Yükseklk Ağırlık Soda uzuluğu Spearma Rak Korelasyo Katsayıları Yükseklk,00 Ağırlık 0,9,00 Soda uzuluğu 0,80 0,86,00 Yükseklk Ağırlık Soda uzuluğu Bast olarak her k problem eş zamalı olarak şleyşde baret fakat çözülmes zor ola deal yaklaşımıda kaçımak amacıyla ayrı olarak bu problemlere geelde bakılır. İster y de ster x te ola sapaları varlığı çok olsa ble güçleştryor. Bu yüzde gözlemler ağırlıklarıı açıklamak amacıyla değşkeler tüm kümesde yüksek kırılmalı regresyo aalz başlamasıı tavsye edelm. O zama lk yaklaşım olarak temzlemş örekte değşke seçm ç klask br yötem kullaılablr. Böyle değşke seçm yötemler lteratürde geş br bçmde araştırılmış. Soda değşkeler kümes çok geş olduğu zama bu kümede başlaya bütü olası modeller düşüüleblr. Bu se tüm altkümeler regresyou yötemdr.bu bz mevcut acklayc degske says kadar farklı modele götürür. Bu sayı çok hızlı br bçmde artar. İlg EKK tahm eds üzere odaklasa ble(ya da lk kez yapılacak çok robust br yötem varsayarak RLS ) bu sayı tamame uygulaamaz. Bu durum brçok saı daha etkl algortmalar gelştrmeye tt ve böylece başarılı altkümeler ç EKK tahmler hesaplayarak sayısal yötemlere başvurdular. Geelde bu yötemler Gauss Jorda 83

94 4. ÇOKLU REGRESYON Yekta Stara KOÇ drgemes ya da süpürme ( sweep ) yöteme dayaır. Her e zama deklemler modellemesdek çeşt br yok edlmes se e y model vere değşkeler alt kümese karar vermek ç br krtere htyaç vardır. Hockg (976) ortalama karelemş hata, açıklayıcılık katsayısı ve C p statstğ çere bu amaçtak farklı ölçümler tarf etmştr. Bütü alt kümeler araştırılmasıı e y kümey üreteceğ sezlmese rağme hesaplama malyet yüzüde kullaıla e yaygı yötem değldr. Açıklayıcı değşke brer brer ekleyerek ya da slerek oluşa sözde stepwse (merdves) yötemler her hususta kullaılması terch edlr. Ö seçm ve arka eleme merdves yötemler ve her ks kombasyou brbrde ayrılır. Bu çeştlerdek değşmler BMDP, SAS ve SPSS gb brçok statstksel paketlerde uygulaır. Ö seçmde açıklayıcı değşke yaıtla e y lşk çde ola değşke olduğu bast br regresyola başlaır. O zama sorak gele her aşama ç modele br değşke ekler. Herhag br aşamada seçle x j değşke sodalar arasıda e geş F j oraıı etek üretedr. F j SSE k ˆ k SSE ( j) k ( j) Şeklde taımlaır. Burada kareler toplamıdır ve SSE k k-terml modele karşılık gele rezdü hatalarıı SSE k ( j ) se x j ekledğ modele karşılık gelr. Eğer F j öcede belrtlmş değerde daha geş se x j değşke deklem çerr. Bu öcede belrlemş değer geelde durdurucu kural olarak fade edlr. Bu değer tam br akışla çalışacak br yötemdr. Her geşlğ br alt kümes elde edleceğ br yoldur. Buda başka bu alt kümeler e ys seçmek ç br krter kullaılmalıdır. Arkadak seçm metotlarıda (ters yöde çalışıla) bütü değşkeler çere br deklemde başlar. Her aşamada e kötü değşke eler Tab e küçük üretldğde F j oraı 84

95 4. ÇOKLU REGRESYON Yekta Stara KOÇ öreğ x j değşke şmdk modelde eleecek br soda olacaktır (bu model k tae termde oluşuyor). F j SSE k ( j) ˆ k SSE k Tekrar ler kısım ç olalara bezer brkaç durdurucu kural öerld. Efroymso (960) her k fkr brleştrd: Metodu bast olarak ler kısım tpyd. Fakat her aşamada br değşke elemes de mümküdü. Br değşke seçm problem le karşı karşıya kalımasıda dolayı mevcut tekklerle zayıf oktaları farkıa varmak zorudayız. Öreğ merdves yötemler verle geşlkte mutlaka e y alt kümey vermez. Buda başka bu tekkler pratkte sıklıkla yalış yerde kullaıla açıklayıcı değşkeler sıralaışıı çerr. Slme veya dahl edlme basamağı çok aldatıcıdır. Çükü arka elemedek sle lk değşke (ayı şeklde ö seçmde lk eleeler) mutlak br bçmde e kötü (ya da e y) olmak zoruda değldr. Öreğ ö seçmde gre lk değşke dğer değşkeler varlığıda gerekl olablr. Ye de ö ve arka merdves (stepwse) tekkler değşkeler e y alt kümelerde tamame farklı souçlaablr. Berg (978) bütü alt kümeler regresyouda merdves yötemler kıyasladı. Eğer ö eleme her alt küme geşlğde tüm alt kümeler regresyouyla ayı fkrdeyse o zama arka elemede her alt küme geşlğ ç bütü alt kümeler regresyouyla da ayı fkrde olacaktır buu ters de doğrudur. Tüm alt kümeler regresyou ye de merdves tekkler dezavatajlarıda kaçmak ç deal br yol değldr. Gerçekte bütü mümkü alt kümeler değerledrlmes geş br bçmde kullaıla krtere bağlıdır. Buda başka tüm alt kümeler yötem her alt küme geşlğ ç e y kümey üretmese rağme bütü populasyoda bu durum mutlaka olmayacaktır. O sadece bu örekte e ys Gorma ve Toma (966) tarafıda yapıla gözlem değşke seçm kousuu btrmek ç belk de uygudur: Tek br e y alt küme olduğu farklıdır fakat az çok brkaç tae ys var. 85

96 4. ÇOKLU REGRESYON Yekta Stara KOÇ Örek 4.3.4: Eğtm Gderler Vers Bu örek bu örek heteroscedastcty lgç br öreğ verr. Bu ver Amerka dak 50 tae eyalet eğtm harcamalarıda oluşur. Ver Tablo 4.6 da yede oluşturuldu. Tablo 4.6 dak y değşke br eyalettek halk eğtmde kş başıa düşe gderdr (975 ç tasarlamıştır). Burada amaç y y x açıklayıcı değşke (970 te kete otura her 000 kşye düşe ev sayısı), x (973 te kş başıa düşe gelr) ve x 3 (974 te 8 yaşıı altıda her 000 kşye karşılık gele ev sayısı). Geelde br gözlem deks zamaa bağlıdır. Bu şeklde br deks grafğ öreğ zamaa karşı rezdüler yayılmasıı değşm gösterr. Fakat rezdüler büyüklüğü ŷ le veya br açıklayıcı değşkele veya zama sırasıda başka durumları dğer sıralamasıyla sstematk br bçmde değştrlebleceğ görülür. Şmdk ver kümes objektflğ durumları uzaydak sıralaması le lşkler değşmezlğ aalz edecek. Tablo 4.6 dak ver coğraf bölgelerle grupladırılmıştır. 4 gruba ayrılır: Kuzeydoğu eyaletler (-9 le gösterlr), kuzey merkez eyaletler (0- le gösterlr), güey eyaletler (-37 le gösterlr) ve batı eyaletler (38-50 le gösterlr). Bu ver kümes ç klask olarak EKK başvurma Tablo 4.7 dek katsayıları verr. Burada bu katsayılar LMS ye dayalı yede ağırlıkladırılmış EKK ı souçlarıı da çerr. Şmd EKK deks grafğ (Şekl 4.4a) le RLS deks grafğ (Şekl 4.4b) kıyaslayalım. Temel farkları durum 50 dr. Durum 50 (Alaska) RLS grafğde br sapa olarak taımlaırke akse EKK grafğde açıkça göze çarpmıyor (Alaska dak eğtm harcamalarıı x, x ve x 3 ü tek başlarıa populasyo karakterstkler esasıda bekleede çok daha yüksektr.). Dğer tarafta her k grafkte farklı coğraf bölgelerdek değşklkler rezdüler dağılımıda görüldüğüü gösteryor. Bu olay heteroscedastcty ç br tp örektr. Buradak eksklk 4 ayrı sııfı ele alarak yleştrleblr. Fakat o zama durum sayısı bu örek ç çok sıırlı olur. 86

97 4. ÇOKLU REGRESYON Yekta Stara KOÇ Tablo 4.6. Eğtm Gderler Vers KB: Kuzeybatı, KM: Kuzey Merkez, G: Güey, B:Batı İdeks Yer x x y x 3 ME NH VT MA KB RI CT NY NJ PA OH IN H MI WI MN KM IA MO ND SD NB KS DE MD VA WV NC SC GA FL GÜNEY DY TN AL MS AR LA OK TX MT HD WY CO NM AZ UT BATI NV WA OR CA AK HI Kayak: Chatterjee ve Prce (977) 87

98 4. ÇOKLU REGRESYON Yekta Stara KOÇ (a) (b) Şekl 4.4. Eğtm harcamaları vers: (a) EKK e göre deks grafğ. (b) LMS e dayalı RLS e göre deks grafğ Chatterjee ve Prce (977) ağırlıkladırılmış EKK regresyouu dğer br çeşd kullaarak bu very aalz ettler. Olar karelemş rezdüler ağırlıkları toplamıı hesaplamak amacıyla 4 bölge her br ç ağırlıkları ayırdı. Bu ağırlıklar klask EKK da souçlamış rezdüler kareler ortalamasıı (bell br 88

99 4. ÇOKLU REGRESYON Yekta Stara KOÇ bölge çdek) kullaarak lk eyalette tahm edlr.chatterjee ve Prce de br sapa olarak Alaska yı düşüdü ve hmal etmeye karar verd. Tablo4.7. Eğtm Harcamaları Vers EKK ve RLS Souçları: Katsayılar, Stadart Hatalar,ve t-değerler EKK Souçları RLS Souçları Stadart Stadart Değşke ˆ Hata t-değer ˆ Hata t-değer x -0,004 0,05-0,08 0,075 0,04,76 x 0,07 0,0 6,4 0,038 0,0 3,49 x,55 0,35 4,93 0,756 0,9,59 3 Sabt -556,6 3, - 4,5-97,3 7,5 -, LMS, LTS ve S-Tahm Edcler Özellkler Bu bölüm bası teork souçları çerr ve sadece robust regresyou uygulamasıyla le lglee kşler tarafıda atlaablr ve matematksel yöüyle lglemez. LMS tahm edcsyle lgl lk kısım ˆ m med (4.3) le verlr. (p+)-ölçekl satır vektörler leer uzayıı at gözlem ( x y ) ( x,..., xp, y ) olsu. Blmeye parametres p boyutlu t,..., p ) sütu vektörüdür. ( stf bozmaya ) leer model N (0, ) ye göre dağılımlı e ç y x e y gösterr. Her durumda bu bölümde Çükü x = 0 olduğu bütü gözlemler sldğ varsayılır. ç hçbr blg verlmyor. Eğer model kesere sahpse bu durumu otomatkma / kedlğde sağlar. Çükü o zama her x e so koordatı e 89

100 4. ÇOKLU REGRESYON Yekta Stara KOÇ eşttr. Buda başka x ) (p+) boyutlu uzayıda / gözlemde daha ( y fazlasıı çere 0 da dolayı düşey hper düzlem yoktur. (Böyle br hperdüzlem (0,,0) ve (0,,0,) çere p ölçekl br alt uzaydır. Bu alt uzaya hper düzlem dyeceğz. Bu tüm uzayı boyutuda daha azdır. [ q ] otasyou q ya eşt ya da daha az ola e büyük tam sayıya karşılık gelr.) 4.5. İzdüşüm Aramayla İlşk İzdüşüm arama (PP) yötemler amacı daha düşük ölçekl uzayda bu ver z düşümüü alarak çok değşkel ver kümesde yapıyı keşfetmek. Böyle tekkler orjal olarak Roy (953), Kruskal (969) ve Swtzer (970) tarafıda buludu. İzdüşüm arama sm Fredma ve Tukey (974) tarafıda buludu. Olar algortmayı başarılı br bçmde gelştrdler. Esas problem y zdüşümler bulmaktır. Çükü keyf zdüşümler belrg br bçmde çok öğretc değldr. Fredma ve Stuetzle (98) güçlü yapılarla oluşa oktaları bazı örekler verdler. Burada yapıı olmadığı yerde zdüşüme sahp olduğu görüldü. Bu edele PP, e lgç olaıı araştırma da bell br objektf foksyouu sayısal olarak e elverşl hale getrerek yüksek boyutlu okta kümesde düşük boyutlu br çok zdüşüm deer (objektf foksyou, zdüşüm deks olarak ta adladırılır. Bazı öeml uygulamaları PP sııflaması (Fredma ve Stuetzle, 980), PP regresyou (Fredma ve Stuetzle, 98), robust temel bleşeler (Ruymgaart 98) ve PP yoğuluk tahm (Fredma 984). Şmd robust regresyou ve PP arasıdak lşk varlığıı gösterelm. Bua bakmak ç ( x y ) (p + ) boyutlu uzayıı düşüelm. Burada x so bleşe sabt terml regresyo durumuda e eşttr. Bu uzayda leer modeller şu şeklde taımlaır: 0 x, y 0 (4.4) 90

101 4. ÇOKLU REGRESYON Yekta Stara KOÇ bell br p ölçekl sütu vektörü ç y br ˆ bulmak amacıyla herhag br ç t (, ) e ortogoal şeklde y eksede okta kümes zdüşümleyerek başlarız. Ya her x ), (, r ( ) ) üzere zdüşümler. Burada r ( ) y x zleldğde ( y s r ( ),..., r ( ) (4.5) dağılımıda böyle herhag br zdüşümü farklılığıı ölçerz. Burada s objektf br ölçek equvarat (eşt değşke)tır. r = s r,..., r s r,..., her ç (4.6) Fakat döüşüm değşmez. PP tahm ˆ, o zama (4.5) deks zdüşümüü mmumlaştırarak elde edlr. Eğer s r,..., r r se bu e farklı ˆ sade br bçmde EKK katsayılarıı vektörüdür. / verr ve Bezer br bçmde s r,..., r r / fades L tahm edcs r q / fades mmumlaştırmak L q tahm edcs (Getlema 965, Sposto 977) verr. Çok robust ola S y kullamak yüksek kırılmalı regresyo tahm edcler ger getrr: / s med r LMS y verr. h r : / s / LTS y verr ve ölçümü robust M tahm edcse eşt ola s y koyarak S tahm edcler elde ederz. Dkkat edlmeldr k (4.6) ü sağlaya herhag br s mmumlaştırılası regresyo, ölçek ve bezer eşt değşke (affe equvarat) ola br regresyo tahm edcs verr. Bu edele PP alese at regresyo tahm edcler tam br sııfıı elde edldğ s y değştrerek y br s regresyo tahm edcs br çeşd taımlar. Bu edele PP usuru leer regresyo model kapsamayı ve her k klask yötem ve yüksek kırılmalı yötemler sormaya devam eder. 9

102 4. ÇOKLU REGRESYON Yekta Stara KOÇ Şu aa kadar ble (LMS, LTS ve S tahm edcler) sadece bezer eşt değşkel yüksek kırılmalı regresyo tahm edcler PP ye bağlı olduğu görülür. (GM tahm edcler yüksek kırılmalı değldr ve tekrarlı medya bezer eşt değşkel değldr.) Yüksek kırılma ve bu PP arasıdak görüe lşk br sebeb vardır. Gerçekte de Dooho, Rousseeuw ve Stahel tam model durumlarıı yakı davraışlarıyla taımlaa kırılma oralarıı buldular: Bular ver çoğuluğuu regresyo hperdüzlemde tam olarak uzaması durumlarıdır. Böyle geel durumlar kes olarak ver çoğuluğuu başarısızlığa uğradığı oktadak zdüşüme sahptrler. Dğer br bçmde yüksek kırılma zdüşümler bazı özel çeştler olduğu durumlardak br tahm edc davraışıa bağlı olduğu görülür. Esas olarak PP böyle zdüşümler araştırmada kullaılabldğ ç yüksek kırılmalı yötemler setezlemesde PP kullaılışlığı şaşırtıcı değldr. Fakat PP yüksek kırılmalı eşt değşke elde etmek ç mecbur tek yol değldr. E azıda Rousseeuw (983) ü ver e az yarısıı çere elpsod mmal ses öreğde çoklu durumda vardı. Ye de bezer eşt değşke tahm edcse dayaa her PP yüksek kırılmaya sahp olmayacaktır. 4.6.Robust Çoklu Regresyoua Dğer Yaklaşımlar Gerçektek durumları adre karşılaya optmal EKK ölçüsüü altıdak durumları göreceğz. Daha robust regresyo alteratfler taımlamak amacıyla brçok statstkç çok büyük değerler bast meydaıı dayaıklılığıı çürüttü. Öreğ;L ölçüsü tek değşkel medyaı geellemes olarak görülür.çükü y ˆ ı mmumlaştırılması y gözlem meydaı olarak taımlaır.regresyo problemde L tahm edcs r m (4.7) ˆ olarak verlr. 9

103 4. ÇOKLU REGRESYON Yekta Stara KOÇ Kares alma yere mutlak değer koyma robustlıkta öeml br kazaca götürür. Fakat kırılma oktasıı termlerde L gerçekte EKK da daha y değldr. Çükü L ölçüsü y yöüde sapalara karşı robusttır fakat hala kaldıraç oktaları yaralaablr. Üstelk Wlso(978) artarke L tahm edcs etks azaldığıı gösterd.görütüü sayısal br oktasıda (4.7) mmumlaştırılması leer programı çözümüe eşttr: m ˆ u v sıırı altıda y p k k x k u v, u 0 ve v 0 Rezdüler q ç L q ormuu mmumlaştırılması Getlema (965), Forsythe (97) ve Sposto (977) tarafıda düşüüldü. Bu kşler doğruu L q model ç br algortma verdler. Dodge(984) L L ormlarıı koveks kombasyoua dayaa şu şeklde br tahm edc ler sürdü: r m r, 0 ˆ Maalesef k bütü bu öerle tahm edcler sıfır kırılma oktasıa sahptr. Bölüm3 ü 6.kısmıda medyaa da dayalı bast regresyo ç bazı tahm edcler sıraladı. Oları çoğu süpürme yötem aracılığıyla çoklu regresyoda üretlyor Thel (950) tahm edcs arkasıdak fkr yayılmalar ve değşklkler kayağıdır.bu tahm edc bütü çftl eğmler meydaıa bakmakta oluşur.so öerle fkr Oja ve Nmaa (984) da gelr.p deksler çere {,,,} J={,...,, p } her altkümes ç j,,..., p (4.8) 93

104 4. ÇOKLU REGRESYON Yekta Stara KOÇ İfades taımladılar. x,, y,..., xp yp p tae okta le tam olarak gelecek hperdüzleme karşılık gele parametre vektörü olarak. Bu j lere yapay gözlemler olarak smledrdler ve p C ler vardır. Fkrler şmd bütü bu j ler(p boyutlu uzayda) çok değşkel yer tahm edcs hesaplamaktır. j bell ağırlıkladırılmış ortalaması EKK yı verr fakat elbette robust çok değşkel br tahm edc çe koymak styor. Eğer ˆ med her j=,,p (4.9) j j j j hesaplaırsa (Bütü J altkümeler üzere koordatlamış medya) o zama bezer eşt değşkel olamaya br regresyo tahm edcs elde edlr. Bast regresyo ç (4.9) gerçekte Thel-Se tahm edcs verr. Bezer eşt değşkel regresyo tahm edcs elde etmek amacıyla çok değşkel yer tahm edc T ye başvurulur. Burada T,ked kede bezer eşt değşkeldr. Ya, T z A b,..., zk A b T z,..., zk A b (4.0) p boyutlu satır vektörüü {z,..., zk } herhag br öreğ ç sgüler olmaya karesel A matrs ç ve herhag p-boyutlu b vektörü ç taımlaır. Bu amaçla geelleştrlmş medyaı uygulamayı amaçladılar. Bezer eşt değşkel ola Oja ı marfetl br yapısıdır. Maalesef geelleştrlmş medyaı hesaplamasıı karmaşıklığı çok büyüktür.(ve kümes uygulamak zorudadır.) j vektörler çok geş br (6.3) koordatsal medyaı uyguladığıda ble Oja-Nmaa regresyo tahm edcler p C yapay gözlemler sayesde hesaplama zamaı düşüülmeldr. Her k durumda tüm j ler düşümek mkasızdır. Bu edele yapay gözlemler rasgele br alt popülasyouu düşümek kullaışlı olablr. 94

105 4. ÇOKLU REGRESYON Yekta Stara KOÇ Şmd bu tekğ kırılma oktasıı düşüelm. Sadece x,, y,..., xp yp p oktaı heps y olduğuda j,...,, p yapay gözlem y olduğua em olacağız. Orjal verde sapaları br kırılması varsa o zama y yapay gözlemler oraıda sadece em olacağız. Bu edele çok değşkel yer tahm edcs mümkü e y kırılma oktası %50 olduğu ç (4.) e sahp olmalıyız. Ya y yapay gözlemler hala %50 se htyaç vardır. (4.) formülü orjal ver kümesde z verle ya; * / p (4.) Bozulmaı üst sıırıı verr. p= ç Thel tahm edcs kırılma oktası tekrar buluacaktır.(4.) dak * değer Tablo 4. de gösterldğ gb p le çok hızlı azaldı. M-tahm edcs(huber 973) robust tahmde lerlemede öeml br aşamaya dkkat çeker. Brçok araştırmacı dğer tarafta mümkü olduğu kadar robust ola M-tahm edclere uygu böyle p ve yapısal foksyolara odakladılar. Fakat dğer tarafta açıkça etkl değldr(ormal hata durumuda).ekk da (t)=t le br M-tahm edcdr k L regresyou (t)=sg(t) ye bağlıdır. Huber(964) aşağıdak foksyouu ler sürdü: ( t ) t bsg( t), t, t b b (4.3) Burada b sabttr. Bu tahm edc asmtotk oraları Huber (973) de tartışıldı. Hampel (974) uzaktak gözlemlere karşı daha da güçlü br şeklde model koruyor. 95

106 4. ÇOKLU REGRESYON Yekta Stara KOÇ t, t a asg( t), a t b t (4.4) ( c t ) /( c b) assg( t), b t c 0, d. y. tp Bu foksyoa 3 parçalı drgemş M tahm edcs delr. Şekl 4.9 her k foksyolarıı gösteryor. Tablo 4.8. p bazı değşkeler ç * / p değer p * p * %50 6 % %9 7 % 9 3 % 8 % 8 4 %6 9 % 7 5 %3 0 % 7 Elbette k ye tahm edcler taımlamak ve asmtotk oralarıa çalışmak yeterl değldr. Buu yaıda tahm edcler hesaplamak ç br yötem gelştrmek gerekr. M tahm edcler çözümü geelde tme yötem le uygulaır. Her aşamada katsayıları tahm ve eşzamalı ölçümüü yapmak zorudayız. Fakat y br başlagıç değer le tmeye başlamak çok öemldr. Ya hala robust ola yeterl br tahm edcdr. Bu tedbr olmaksızı beklee robust çözümüe tamame uymaya yerel mmumda kolayca btrleblr. Dutter (977), M tahm edclere göre sayısal problemler çözümü ç bazı algortmalar ler sürdü. GM tahm edcler veya sıırladırılmış etk tahm edcler hesaplaması bezer problemler gösterr. M ve GM tahm edcler kırılma oktasıı oldukça farklı olduğua dkkat edelm. Kaldıraç oktalarıı yaralaablrlğ yüzüde M tahm edcler ç * tekrar % 0 olduğuda GM tahm edcler 0 olmaz. P sosuza gderke GM - 96

107 4. ÇOKLU REGRESYON Yekta Stara KOÇ tahm edcler kırılma oktası % o a düşer. Yoha (985) y kaldıraç oktalarıı varlığıda çok düşük etkye sahp bazı GM tahm edcler celed. GM tahm edcler tam kırılma oktaları Mart (987) tarafıda hesapladı. Robust regresyoua dğer br yaklaşım rezdüler rakıa dayaıyor. Tek değşkel yer çatısıda bu R tahm edcler Hodges ve Lehma (963) sayesdedr. Rak statstkler kullama fkr Adche (967), Jureckova (97) ve Jaeekel (97) tarafıda çoklu regresyo alaıa geşletld. Jaeekel öers aşağıdak taıma götürdü: Eğer R, r r y x ı rakı se o zama objektf m a ( R ) r, (4.5) ˆ Burada a () skor foksyou mootodur ve a ( ) 0 eştlğ sağlar. a () skoru ç bazı olasılıklar Wlcox u skorları: ( ) ( ) / a Va der Waerde skorları: ( ) ( /( )) Medya skorları : sg( ( ) / a a ( ) Sıırladırılmış Normal Skorlar: ( ) m( c max / ) a c Kesel regresyo durumuda ayrı olarak sabt term tahm etmek gerekr. Çükü objektf foksyou keselere karşı sabttr. Bu, rezdüler robust yer tahm kullaarak yapılablr. R tahm edcler M tahm edclere kıyasla öeml br avatajı otomatk olarak ölçümüü eşt değşml olmasıdır. Bu edele eş zamalı ölçüm tahm edcse bağlı değller. Bua rağme Jureckova (977) R tahm edcler asmtotk olarak M tahm edclere dek olduğuu gösterd. Heler ve Wllers (979), Jureckova tarafıda yaptırılalarda daha zayıf koşullar altıda R tahm edcler asmtotk ormallğ spatladı. Lecher (980) R tahm edcler ç br algortma gelştrd ve tamamladı. Bu algortmada (4.5) mmumlaştırılması Rosebrock u bulduğu algortmayla gerçekleştrld. Cheg ve 97

108 4. ÇOKLU REGRESYON Yekta Stara KOÇ Hettmasperger (983) (4.5) u çözümü ç tekrarlı yede ağırlıkladırılmış e küçük karaler algortmasıı ler sürdü. L - tahm edcler sııfı robust tek değşkel yerde belrg br rol de oyar. Olar sıralı statstkler leer br kombasyoua dayaıyor ve popülarteler bast hesaplamaları esasıa dayaır. Bckel (973) regresyo ç tek aşamalı L tahm edcler br sııfıı ler sürdü. Bu ı lk tahme dayaır. Koeker ve Bassett (978) L tahm edcler dğer br öers formüle ett. Bu öer leer regresyo ç örek celkler bezerlğ kullaarak yapılır. ˆ çözümü olarak - regresyo celğ (quatte) özellğ taımlıyorlar. Burada P ( r ) ( r ) r r r 0 0 (x = 0.5 ç L - tahm edcs elde edlr. ) Koeker ve Bassett o zama bu ˆ ı leer kombasyolarıı hesaplamayı ler sürdü. Portoy (983) bu tahm edcler bazı asmtotk oralarıı spatladı. Fakat kırılma oktalarıı hala sıfır olduğua dkkat edlmeldr. Ruppert ve Carroll 'ı (980) budamış e küçük kareler tahm edclerde L-tahm edclerdr. Olar y ble yer L-tahm edcler budamış ortalamalarıa karşılık gelr. Olar budamış ola gözlemler seçmek ç k yol ler sürdüler. Bularda br regresyo özellkler düşüces kullaır. Bua karşılık dğer başlagıç tahm edcsde rezdüler kullaır. Leer regresyo ç M-,L- ve R-tahm edcler hakkıda bezer çalışmaları souçlarıı taımlaır. Farklı tasarımlar ve hata dağılımları ç tahm edcler sııflarıı davraışı kıyasladı. Geelleştrlmş örekler oldukça küçük, 40 ve p 3 ve kaldıraç oktalarıı yapıladırılmadığıa dkkat etmek öemldr. Bu çalışmadak souç aşağıdak gb özetler: Normallkte sapmalar çok haff olsa ble EKK çok yeterszdr. Redescedg foksyolu M-tahm edcler oldukça y ş olduğu meydaa çıktı. Wlcoxo skorlarıyla R-tahm edcler,k bular ölçüm eşt değşke olma avatajıa sahptrler,(ve öcede sabt 98

109 4. ÇOKLU REGRESYON Yekta Stara KOÇ olmak zoruda olduğu ç kullaımıı kolaylığı)y br alteratf L-tahm edcler daha az yeterl souçları başardı. Maksmum kırılma oktalı lk regresyo tahm edcs Segel(98) sayesde tekrarlı medyadır. Yukarıda söylee Oja ve Nmaa (984) ı öers gb p oktalarıı bütü alt kümelere dayaıyor. Herhag p gözlem x,, y,..., xp yp tek parametre vektörüü taımlıyor. Bu parametre vektörü j,,..., p l fade j-c koordatıdır. O zama tekrarlı medya aşağıdak gb koordatsal fade edlr: ˆ j med... med p med p j,..., p... (4.6) Bu tahm edc kolay br bçmde hesaplaablr. Gerçekte %50 kırılma oktalı tahm edcy vere medyalar sıralı olarak hesaplaır. Burada Oja-Nmaa ı öersde geş br bçmde daha ydr. Maalesef k dezavatajı vardır: Eşt değşkel olmasıı yokluğu ve altkümeler geş sayısı.fakat kc problemde oları tüm kaçıılablr. p C ler kullamak yere rasgele bazı altkümeler seçerek So zamalarda Yoha (985) LMS ve LTS gb yüksek kırılmalı tahm edcler ç daha yüksek etkye karşı ye br gelşmey getrd. Bu ye sııfı MM tahm edcler olarak smledrd. Yoha tahm edcler 3 aşamada taımlaır. İlk açama da yüksek kırılmalı tahm edc * hesaplaır. Bu amaçla robust tahm edcs etks olmasıa gerek yoktur. O zama & 50 kırılmalı s ölçümüü M tahm robust modelde r ( * ) rezdüler üzerde hesaplaır. So olarak ˆ MM tahm edcs; ( r ( ) / s ) x 0 İfades herhag br çözümü olarak fade edlyor. Bu fade s ( ) s( * ) 99

110 4. ÇOKLU REGRESYON Yekta Stara KOÇ sağlar. Burada s( ) P( r ( ) / s ) dr. Yoha lk aşamaı %50 kırılma oktasıı MM tahm edclerde geçtğ ve tam model özellğe de sahp olduğuu gösterd. Bua rağme hatalar ormal dağılımlı olduğuda MM tahm edcler yüksek etkye sahp olduğuu spatladı. Küçük sayısal br çalışmada GM tahm edcleryle elverşl olarak kıyasladıklarıı gösterd. Yüksek etkyle yüksek kırılmaı brleşmes durumuda Yoha ve Zamar (986) m s ˆ p r s, tarafıda taımlaa T tahm edcler düşüdüler. Burada tekrar p, s ölçek tahmde farklı olablr. Bu yötem r ( ) rezdülere uygulaır. Asmtotk olarak, bu yapıda kullaıla T tahm edcs tae p foksyouu ağırlıkladırılmış ortalamasıı M tahm edcs gb davraır. Heüz araştırmadığımız dğer olasılık r ( ) k S ( ) (4.7) İfades objektf foksyouu mmum yapmaktır. Burada ks mmumuu fade eder. k> ve S ( ) r ( ),..., r ( ) rezdüler üzerdek ölçümü yüksek kırılmalı tahm edcsdr. S ( ), med r ( ) veya / r ( ) ı br katı olablr veya S ( ) ölçümü uygu br M tahm edcsdr. (4.7) mmumlaştırılması yüksek kırılmalı br oktayla yüksek asmtotk etk brleşeceğ görülür. Çükü e sık lk parça (EKK) y br bçmde kullaılır bua karşılık. parça kötü şekllerde korur. Fakat bu tahm edc esas davraışıı bastçe y tamamlamak ç yeterl olup olmayacağıı doğrulamak gerye kalıyor. : 00

111 5. SONUÇLAR VE ÖNERİLER Yekta Stara KOÇ 5. SONUÇLAR VE ÖNERİLER Bu çalışma 4 aa başlık altıda toplamaktadır. Brc bölümde sapalarla beraber bazı kavramlar açıklamıştır. İkc bölümde tahm edcler tarhsel süreçlerde bahsedlp tahm edcler sapalarda asıl etkledğ öreklerle açıkladı. Üçücü bölümde bast regresyo başlığı altıda LMS ve RLS tahm edcler EKK tahm edcsyle karşılaştırıldı. Dördücü bölümde çoklu regresyo başlığı altıda LMS, LTS, L,S, M ve GM tahm edcler EKK ve brbrleryle kıyasladı ve e y kırılma oktasıa S tahm edcs ulaştı. LMS tahm edcs dğerlere kıyasla daha kolay hesaplaablmesde dolayı daha kullaışlı olduğu ortaya çıktı. Bu tez çalışmasıda hareketle buda sora verlerle br şleme başlamada öce sapa değerler bulmak amacıyla robust tahm edclerde herhag br kullaılması öerleblr. 0

112 KAYNAKLAR ADICHIE, J.N., 967. Estmato of regresso coeffcets based o rak tests, A. Math. Stat., 38, AFIFI, A.A., ve AZEN, S.P., 979. Statstcal Aalyss, A Computer Oreted Approach, d ed., Academc Pres, New York. ANDREWS, D.F., 974. A robust method for multple lear regresso, Techometrcs, 6, ATKINSON,A.C., 985. Plots, Trasformatos, ad Regresso, Claredo Press, Oxford. BARTLETT, M.S.,949. Fttg a stragh le whe both varables are subject to error. Bometrcs, 5, 07-. BERK, K.N., 978. Comparg subset regresso procedures, Techometrcs, 0, -6. BICKEL, P.J., 973. O some aalogues to lear combato of order statstcs the lear model, A. Stat.,, BLOOMFIELD, P., ve STEIGER, W.L.,980. Least Absolute Devatos Curve- Fttg. SIAM J. Sc. Stat. Comput.,, BLOOMFIELD, P., ve STEIGER, W.L.,983. Least Absolute Devatos: Theory,Applcatos ad Algorthms, Brkhauser Verlag, Bosto. BOX, G.E., 953. No-ormalty ad tests o varaces, Bometrca, 40, BROWN, G.W., ad MOOD, A.M., 95. O meda tests for lear hypotheses, Proceedgs of the d Berkeley Symposum o Mathematcal Statstcs ad Probablty, edted by J. Neyma, Uversty of Calfora Press Berkeley ad Los Ageles, pp BROWNLEE, K.A., 965. Statstcal Theory ad Methodology Scece ad Egeerg, d ed., Joh Wley & Sos, New York. CARROLL, R.J., ve RUPPERT, D., 985. Trasformatos regresso: A robust aalyss, Techometrcs, 7, -. CHAMBERS, J.M., CLEVELAND, W.S., KLEINER, B., ve TUKEY, P.A., 983. Graphcal Methods for Data Aalyss, Wadsworth Iteratoal Group, Belmot, CA. 0

113 CHATTERJEE, S., ve PRICE, B., 977. Regresso Aalyss by Example, Joh Wley & Sos, New York. CHENG, K.S., ad HETMANSPERGER, T.P., 983.Weghted least-squares rak estmates, Commu.Stat. (Theory ad Methods),, COLEMAN, J., et al., 966. Equalty of Educatoal Opportuty, two volumes, Offce of Educato, U.S. Departmet of Health, Washgto, D.C. DANIEL, C., ve WOOD, F.S., 97. Fttg Equatos to Data, Joh Wley & Sos, New York. DEVROYE, L., ve GYORFI, L., 984. Noparametrc Desty Estmato: The L Vew, Wley-Iterscece, New York. DODGE, Y., 984. Robust estmato of regresso coeffcets by mmzg a covex combato of least squares ad least absolute devatos, Computatoal Statstcs Quarterly,, DONOHO, D.L., 984. Hgh Breakdow Made Smple, subtalk preseted at the Oberwolfach Coferece o Robust Statstcs, West Germay, 9-5 September. DONOHO, D.L., JOHNSTONE, L., ROUSSEEUW, P.J., ve STAHEL, W., 985. Dscusso o Projecto Pursut of P. Huber, A. Stat., 3, DRAPER, N.R., ad SMITH, H., 969. Appled Regresso Aalyss, Joh Wley & Sos, New York. DUTTER, R., 977. Numercal soluto of robust regresso problems: Computatoal aspects, a comparso, J. Stat. Comput. Smulato, 5, EDGEWORTH, F.Y.,887. O observatos relatg to several quattes, Hermathea, 6, EFROYMSON, M.A., 960. Multple regresso aalyss, Mathematcal Methods for Dgtal Computers, edted by A. RALSTON ve H.S. WILF, Joh Wley & Sos, New York, pp EMERSON, J.D., ve HOAGLIN, D.C., 983. Resstat les for y versusu x, Uderstadg Robust ad Explaratory Data Aalyss, edted by D. Hoagl, 03

114 F. Mosteller, ve J. Tukey, Joh Wley & Sos, New York, pp EZEKIEL, M., ve FOX, K.A., 959. Methods of Correlato ad Regresso Aalyss, Joh wley & Sos, New York. FORSYTHE, A.B., 97. Robust estmato of straght le regresso coeffcets by mmzg p-th power devatos, Techoometrcs, 4, FRIEDMAN, J.H., ve STUETZLE, W., 980. Projecto pursut classfcato, upublshed mauscrpt. FRIEDMAN, J.H., ve STUETZLE, W., 98. Projecto pursut regresso, Am. Stat. Assoc., 76, FRIEDMAN, J.H., ve STUETZLE, W., 98. Projecto pursut methods for data aalyss, Moder Data Aalyss, edted by R. LAUNER ad A.F. SIEGEL, Academc Pres, New York. FRIEDMAN, J.H., STUETZLE, W. ve SCHROEDER, A., 984. Projecto pursut desty estmato, J. Am. Stat. Assoc., 79, FRIEDMAN, J.H., ad TUKEY, J.W., 974. A projecto pursut algorthm for exploratory data aalyss, HEE Tras. Comput., C-3, GENTLEMAN, W.M., 965. Robust Estmato of Multvarate Locato by Mmzg p-th Power Trasformatos, Ph.D. dssertato, Prceto Uversty, ad Bell Labaratores memoradum M GORMAN, J.W., ve TOMAN, R.J., 966. Selecto of varables for fttg equatos to data, Techometrcs, 8, 7-5. HEİKKİLA, J.H.,005. Robust regresso, Graduate course o Advaced statstcal sgal processg, Iformato processg laboratory,departmet of Electrcal Egeeerg, pages: 3-38, P.O. Box 4500, 9004 Uversty of Oulu,[email protected], Flad. HAMPEL, F.R., 974. The fluece curve ad ts role robus estmato, J. Am. Stat. Assoc., 69, HAMPEL, F.R., 975. Beyod locato parameters: Robust cocepts ad methods, Bull. It. Stat. Ist., 46, HAMPEL, F.R., 978. Optmally boudg the gross errors sestvty ad the fluece of posto factor space, Proceedgs of the Statstcal 04

115 Computg Secto of the Amerca Statstcal Assocato, ASA, Washgto, D.C., HAMPEL, F.R., Rochett, E.M., Rousseeuw, P.J., ve Stahel, W.A., 986. Robust Statstcs: The Approach Based o Ifluece Fuctos, Joh Wley & Sos, New York. HAWKINS, D. M., BRADU, D., KASS, G.V., 984. Locato of several outlers multple regresso data usg elematal sets, Techometrcs, 6, HEILER, S., ve WILLERS, R., 979. Asymptotc Normalty of R-Estmates the Lear Model, Forschugsbercht No. 79/6, Uverstat Dortmud, Germay. HILL, R.W., 977. Robust Regresso Whe There Are Outlers the Carrers, upublshed Ph.D. dssertato, Harvard Uversty, Bosto, MA. HOCKING, R.R., 976. The aalyss ad selecto of varables lear regresso, Bometrcs, 3, -49. HODGES, J. L., Jr., ve LEHMANN, E.L.,963. Estmates of locato based o rak tests, A. Math. Stat., 34, HOLLAND, P.W., ve WELSCH, R.E., 977. Robust Regresso Usg Iteratvely Reweghted Least Squares, Commu. Stat. (Theory ad Methods), 6, HUBER, P.J., 964. Robust estmato of a locato parameter, A. Math. Stat., 35, HUBER, P.J., 973. Robust Regresso: Asymptotcs, Cojectures Ad Mote Carlo, A. Stat.,, HUBER, P.J., 98. Robust Statstcs, Joh Wley & Sos, New York. HUBER, P.J., ve DUTTER, R., 974. Numercal Solutos Of Robust Regresso Problems, : COMPSTAT 974, Proceedgs Computatoal Statstcs, edted by G. Bruckma, Physka Verlag, Vea. HUMPHREYS, R.M., 978. Studes of lumous stars earby galaxes. I. Supergats ad O stars the mlky way, Astrophys. J. Suppl. Ser., 38, JAECKEL, L.A., 97. Estmatg regresso coeffcets by mmzg the dsperso of resduals, A. Math. Stat., 5,

116 JERISON, H.J., 973. Evoluto of the Bra ad Itellgece, Academc Pres, New York. JOHNSTONE, I.M., ve VELLEMAN, P.F., 985b. The resstat le ad related regresso methods, J. Am. Stat. Assoc., 80, JURECKOVA, J., 97. Noparametrc estmate of regresso coeffcets, A. Math. Stat., 4, JURECKOVA, J., 977. Asymptotc relatos of M-estmates ad R-estmates lear regresso model, A. Stat., 5, KOENKER, R., ve BASSETT, G.J., 978. Regresso Quatles, Ecoometrca, 46, KRASKER, W.S., 980. Estmato lear regresso models wth dsparate data pots, Ecoometrca, 48, KRASKER, W.S., ve Welsch, R.E., 98. Effcet bouded-fluece regresso estmato, J. Am. Stat. Assoc., 77, KRUSKAL, J.B., 969. Toward a practcal method whch helps ucover the structure of a set of multvarate observatos by fdg the lear trasformato whch optmzes a ew dex of codesato, Statstcal Computato, edted by R.C. Mlto ad J.A. Nelder,Academc Press, New York. LECHER, K., 980. Uthersuchug vo R-Schatzer m Leare Modell mt Smulatoe, Dplomarbet, Abt. Statstk, Uversty of Dortmud, West Germay. MALLOWS, C.L., 975. O Some Topcs Robustess, Upublshed Memoradum, Bell Telephoe Laboratores, Murray Hll, NJ. MARAZZI, A., 980. ROBERTH, A Subroute Lbrary For Robust Statstcal Procedures, COMPSTAT 980, Proceedgs Computatoal Statstcs, Physca Verlag, Vea. MARTIN, R.D., YOHAI, V., ve ZAMAR, R., 987. Mmax bas robust regresso estmato, Techcal Report, preparato. MOSTELLER, F., ad TUKEY, J.W., 977. Data Aalyss ad Regresso, Addso-Wesley, Readg. MA. 06

117 NAIR, K.R., ve SHRIVASTAVA, M.P., 94. O a smple method of curve fttg. Sakhya, 6, -3. NARULA, S.C., ve WELLINGTON, J.F., 98. The Mmum Sum Of Absolute Errors Regresso: A State Of The Survey, It. Stat. Rev.,50, OJA, H., ve NIINIMAA, A., 985. Asymptotc propertes of the geeralzed meda the case of multvarate ormalty, J. R. Stat. Soc. Ser. B, 47, PEARSON, E.S., 93, The aalyss of varace cases of o-ormal varato, Bometrca, 3, PLACKETT, R.L.,97. Studes the hstory of probablty ad statstcs XXIX: The dscovery of the method of least squares. Bometrka, 59, PORTNOY, S., 983. Tghtess of the sequece of emprc c.d.f. processes defed from regresso fractles, Research Report. Dvso of Statstcs. Uversty of Illos. RONCHETTI, E., ve ROUSSEEUW, P.J., 985. Chage-of-varace sestvtes regresso aalyss, Z. Wahrsch. Verw. Geb., 68, ROSENBROCK, H.H., 960. A automatc method for fdg the greatests or lowest value of a fucto, Comput. J., 3, ROUSSEEUW, P.J., 983. Multvarate Estmato Wth Hgh Breakdow Pot, paper preseted at Fourth Paoa Symposum o Mathematcal Statstcs ad Probablty, Bad Tatzmadorf, Austra, September 4-9, 983. Abstract IMS Bull., 983,, p.34. Appeared (985), Mathematcal Statstcs ad Applcatos, Vol. B., edted by W. Grossma, G. Pflug, I. Veze, ve W. Wertz, Redel, Dordrecht, The etherlads, pp ROUSSEEUW, P.J., 984. Least Meda of Squares Regresso, J. Am. Stat. Assoc., 78, ROY, S.N., 953. O a heurstc method of test costructo ad ts use a multvarate aalyss, A. Math. Stat., 4, RUPPERT, D.,ve CARROLL, R.J., 980. Trmmed least squares estmato the lear model,j. Am. Stat. Assoc., 75, RUYMGAART, F.H., 98. A robust prcpal compoet aalyss, J. Multvar. Aal.,,

118 SAMAROV, A.M., 985. Bouded-fluece regresso va local mmax mea square error, J. Am. Stat. Assoc., 80, SEN, P.K., 968. Estmates of the regresso coeffcet based o Kedall s tau, J. Am. Stat. Assoc., 63, SIEGEL, A.F., 98. Robust regresso usg repeated medas, Bometrca, 69, SIMKIN, C.G.F., 978. Hyperflato ad Natoalst Cha, Stablty ad Iflato, A Volume of Essays to Hoour the Memory of A.W.H. Phlps, Joh Wley & Sos, New York. SPOSITO, V.A., KENNEDY, W.J., ve GENTLE, J.E., 977. L p orm ft of a straght le, Appl. Stat., 6, 4-6. STEELE, J.M. ve STEIGER, W.I., 986. Algorthms ad complexty for least meda of squares regresso, Dscrete Appl. Math., 4, STİGLER, S.M., 98. Gauss ad the verto of least squares, A. Stat.,9, STUDENT, 97. Errors of route aalyss, Bometrca, 9, SWITZER, P., 970. Numercal classfcato, Geostatstcs, Pleum, New York. THEIL, H., 950. A rak-varat method of lear ad polyomal regresso aalyss (Parts -3), Ned. Akad. Wetesch. Proc. Ser. A. 53, , 5-55, TUKEY, J.W.,960. A survey of samplg from cotamated dstrbutos. Cotrbutos to Probablty ad Statstcs, edted by I. Olk, Staford Uversty Pres, Staford. CA. TUKEY, J.W., 970/97. Exploratory Data Aalyss (Lmted Prelmary Edto), Addso-Wesley, Readg, MA. VANSINA, F., ve DE GREVE, J.P., 98. Close bary systems before ad after mass trasfer, Astrophys. Space Sc., 87, VELLEMAN, P.F., ve WELSH, R.E., 98. Effcet computg of regresso dagostcs, Am. Stat., 35, WALD, A., 940. The fttg of straght les f both varables are subject to error: A. Math. Stat.,,

119 WEISBERG, S., 980. Appled Lear Regresso, Joh Wley & Sos, New York. WILSON, H.C., 978. Least squares versus mmum absolute devatos estmato lear models, Decso Sc., YALE, C., ve FORSYTHE, A.B., 976. Wsorzed Regresso, Techometrcs, 8, YOHAI, V.J., 985. Hgh breakdow-pot ad hgh effcecy robust estmates for regresso, to appear A. Stat. 09

120 ÖZGEÇMİŞ 98 yılıda Adaa da doğdum. İlk öğremm Ömer Haluk Özuçak İlkokulu da tamamladım. Ortaokul öğremm Ramazaoğlu İlköğretm Okulu da, Lse öğremm Şeht Temel Cgöz Lses de tamamladım. Şeht Temel Cgöz Lses de 999 yılıda mezu olup ayı yıl Gaz Üverstes Fe Edebyat Fakültes Matematk Bölümüü kazadım. Dört yıllık lsas eğtmde sora 003 yılıda mezu oldum. Ayı yıl Çukurova Üverstes Fe Blmler Esttüsü İstatstk Aablm Dalı da yüksek lsas yapmaya başladım. 0

ROBUST TAHMİN EDİCİLERİ VE ÖZELLİKLERİ * Robust Estimators and Properties

ROBUST TAHMİN EDİCİLERİ VE ÖZELLİKLERİ * Robust Estimators and Properties Ç.Ü Fe Blmler Esttüsü Yıl:2008 Clt:7-5 ROBUST TAHMİN EDİCİLERİ VE ÖZELLİKLERİ * Robust Estmators ad Propertes Yekta Stara KOÇ İstatstk Aablm Dalı Fkr AKDENİZ İstatstk Aablm Dalı ÖZET Robust tahm edcler,

Detaylı

Regresyon ve Korelasyon Analizi. Regresyon Analizi

Regresyon ve Korelasyon Analizi. Regresyon Analizi Regresyo ve Korelasyo Aalz Regresyo Aalz Regresyo Aalz Regresyo aalz, aralarıda sebep-souç lşks bulua k veya daha fazla değşke arasıdak lşky belrlemek ve bu lşky kullaarak o kou le lgl tahmler (estmato)

Detaylı

YER ÖLÇÜLERİ. Yer ölçüleri, verilerin merkezini veya yığılma noktasını belirleyen istatistiklerdir.

YER ÖLÇÜLERİ. Yer ölçüleri, verilerin merkezini veya yığılma noktasını belirleyen istatistiklerdir. YER ÖLÇÜLERİ Yer ölçüler, verler merkez veya yığılma oktasıı belrleye statstklerdr. Grafkler bze verler yığılma oktaları hakkıda ö blg vermede yardımcı olurlar. Acak bu değerler gerçek değerler değldr,

Detaylı

İki veri setinin yapısının karşılaştırılması

İki veri setinin yapısının karşılaştırılması İk ver set yapısıı karşılaştırılması Dağılım: 6,6,6 Ortalama: 6 Medya: 6 Mod: 6 td. apma: 0 Dağılım: 0,6,1 Ortalama: 6 Medya: 6 Mod: çoklu mod td: apma: 6 Amaç: Görüe Ötese Bakablmek Verler değşkelk durumuu

Detaylı

MERKEZİ EĞİLİM ÖLÇÜLERİ

MERKEZİ EĞİLİM ÖLÇÜLERİ MERKEZİ EĞİLİM ÖLÇÜLERİ Gözlee ver düzeleerek çzelgelerle, graklerle suulması çoğu kez yeterl olmaz. Geel durumu yasıtacak br takım ölçülere gereksm vardır. Bu ölçüler verler yalızca özlü br bçmde belrtmekle

Detaylı

= k. Aritmetik Ortalama. Tanımlayıcı İstatistikler TANIMLAYICI İSTATİSTİKLER. Sınıflanmış Seriler İçin Aritmetik Ortalama

= k. Aritmetik Ortalama. Tanımlayıcı İstatistikler TANIMLAYICI İSTATİSTİKLER. Sınıflanmış Seriler İçin Aritmetik Ortalama TANIMLAYICI İSTATİSTİKLER Taımlayıcı İstatstkler MERKEZİ EĞİLİM ÖLÇÜLERİ Dr. Mehmet AKSARAYLI D.E.Ü. İ.İ.B.F..B.F. EKONOMETRİ BÖLÜMÜ mehmet.aksarayl [email protected] Yer Ölçüler (Merkez Eğlm Ölçüler)

Detaylı

Tanımlayıcı İstatistikler

Tanımlayıcı İstatistikler Taımlayıcı İstatstkler Taımlayıcı İstatstkler br değerler dzs statstksel olarak geel özellkler taımlaya ölçülerdr Taımlayıcı İstatstkler Yer Göstere Ölçüler Yaygılık Ölçüler Yer Göstere Ölçüler Br dağılımı

Detaylı

Polinom İnterpolasyonu

Polinom İnterpolasyonu Polom İterpolasyou (Ara Değer Bulma Br foksyou solu sayıdak, K, R oktalarıda aldığı f (, f (,, f ( değerler bls (foksyou keds blmyor. Bu oktalarda geçe. derecede br tek, P a + a + a + + a (... polumu vardır

Detaylı

Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyon. Dr. Musa KILIÇ

Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyon. Dr. Musa KILIÇ Değşkeler Arasıdak İlşkler Regresyo ve Korelasyo Dr. Musa KILIÇ http://ks.deu.edu.tr/musa.klc 1. Grş Buda öcek bölümlerde celedğmz koular, br tek değşke ç yorumlamalar yapmaya yöelk statstk yötemler üzerde

Detaylı

Zaman Skalasında Box-Cox Regresyon Yöntemi

Zaman Skalasında Box-Cox Regresyon Yöntemi Dokuz Eylül Üverstes İktsad ve İdar Blmler Fakültes Dergs, Clt:7, Sayı:, Yıl:0, ss.57-70. Zama Skalasıda Bo-Co Regresyo Yötem Atlla Özur İŞÇİ Sbel PAŞALI GÖKTAŞ ATMACA 3 M. Nyaz ÇANKAYA 4 Özet Hata term

Detaylı

BEKLENEN DEĞER VE VARYANS

BEKLENEN DEĞER VE VARYANS BEKLEE DEĞER VE VARYAS.1. İadel ve adesz öreklemede tüm mümkü örekler.. Beklee değer.3. Varyas.4. İk değşke ortak dağılımı.5. İstatstksel bağımsızlık.6. Tesadüf değşkeler doğrusal kombasyolarıı beklee

Detaylı

Tanımlayıcı İstatistikler

Tanımlayıcı İstatistikler Taımlayıcı İstatstkler Br veya brde fazla dağılışı karşılaştırmak ç kullaıla veya ayrıca örek verlerde hareketle frekas dağılışlarıı sayısal olarak düzeleye değerlere taımlayıcı statstkler der. Aalzlede

Detaylı

Giriş. Değişkenlik Ölçüleri İSTATİSTİK I. Ders 5 Değişkenlik ve Asimetri Ölçüleri. Değişkenlik. X i ve Y i aşağıdaki gibi iki seri verilmiş olsun:

Giriş. Değişkenlik Ölçüleri İSTATİSTİK I. Ders 5 Değişkenlik ve Asimetri Ölçüleri. Değişkenlik. X i ve Y i aşağıdaki gibi iki seri verilmiş olsun: Grş İSTATİSTİK I Ders Değşkelk ve Asmetr Ölçüler Ortalamalar, serler karşılaştırılmasıda her zama yeterl ölçüler değldr. Ayı ortalamayı sahp serler arklı dağılım göstereblrler. Bu edele serler karşılaştırılmasıda,

Detaylı

ÖLÇÜM, ÖLÇÜM HATALARI ve ANLAMLI RAKAMLAR

ÖLÇÜM, ÖLÇÜM HATALARI ve ANLAMLI RAKAMLAR ÖLÇÜM, ÖLÇÜM HATALARI ve ANLAMLI RAKAMLAR Ölçme, her deeysel blm temel oluşturur. Fzk blmde de teorler sıaması ç çeştl deeyler tasarlaır ve bu deeyler sırasıda çok çeştl ölçümler yapılır. Br fzksel celğ

Detaylı

Doç. Dr. Mehmet AKSARAYLI

Doç. Dr. Mehmet AKSARAYLI Doç. Dr. Mehmet AKSARALI www.mehmetaksarayl İstatstksel araştırmalarda k yada daha çok değşke arasıdak lşk celemes ç e çok kullaıla yötemlerde brs regresyo aalzdr. Değşkeler arasıdak lşk matematksel br

Detaylı

Tahmin Edicilerin ve Test Đstatistiklerinin Simülasyon ile Karşılaştırılması

Tahmin Edicilerin ve Test Đstatistiklerinin Simülasyon ile Karşılaştırılması . Ders ĐSTATĐSTĐKTE SĐMÜLASYON Tahm Edcler ve Test Đstatstkler Smülasyo le Karşılaştırılması Đstatstk rasgelelk olgusu çere olay süreç ve sstemler modellemesde özellkle bu modellerde souç çıkarmada ve

Detaylı

Parametrik Olmayan İstatistik Çözümlü Sorular - 2

Parametrik Olmayan İstatistik Çözümlü Sorular - 2 Parametrk Olmaya İstatstk Çözümlü Sorular - Soru Böbrek hastalarıa at Kreat (KRT) değerlere lşk br araştırma yapılmak stemektedr. Buu ç rasgele seçle hastaya at Kreat değerler aşağıdak gb elde edlmştr

Detaylı

TALEP TAHMİNLERİ. Y.Doç.Dr. Alpagut YAVUZ

TALEP TAHMİNLERİ. Y.Doç.Dr. Alpagut YAVUZ TALEP TAHMİNLERİ Y.Doç.Dr. Alpagut YAVUZ Yöetm e temel foksyolarıda br ola plalama, e kaba taımıyla, şletme geleceğe yöelk alıa kararları br bleşkesdr. Geleceğe yöelk alıa kararları başarısı yöetcler yaptıkları

Detaylı

=... 29 İÇİNDEKİLER. E(X) = k... 22. 3.5. Pascal (Negatif Binom) Dağılımı... 22 1. 3.6. Hipergeometrik Dağılım... 22. N y= ... 24

=... 29 İÇİNDEKİLER. E(X) = k... 22. 3.5. Pascal (Negatif Binom) Dağılımı... 22 1. 3.6. Hipergeometrik Dağılım... 22. N y= ... 24 İÇİNDEKİLER SİMGE LİSTESİ... KISALTMA LİSTESİ... v ÇİZELGE LİSTESİ... v ŞEKİL LİSTESİ... v ÖNSÖZ... v ÖZET... x ABSTRACT... x GİRİŞ... BÖLÜM : OLASILIK DAĞILIMLARI VE OLASILIK YOĞUNLUKLARI... BÖLÜM : OLASILIK

Detaylı

6. Uygulama. dx < olduğunda ( )

6. Uygulama. dx < olduğunda ( ) . Uygulama Hatırlatma: Rasgele Değşelerde Belee Değer Kavramı br rasgele değşe ve g : R R br osyo olma üzere, ) esl ve g ) ) < olduğuda D ) sürel ve g ) ) d < olduğuda g belee değer der. c R ve br doğal

Detaylı

Tanımlayıcı İstatistikler (Descriptive Statistics) Dr. Musa KILIÇ

Tanımlayıcı İstatistikler (Descriptive Statistics) Dr. Musa KILIÇ Taımlayıcı İstatstkler (Descrptve Statstcs) Dr. Musa KILIÇ TANIMLAYICI ÖRNEK İSTATİSTİKLERİ YER ÖLÇÜLERİ (Frekas dağılışıı abss eksedek durumuu belrtr.) DEĞİŞİM ÖLÇÜLERİ ( Frekas dağılışıı şekl belrtr.).

Detaylı

Sayısal Türev Sayısal İntegrasyon İnterpolasyon Ekstrapolasyon. Bölüm Üç

Sayısal Türev Sayısal İntegrasyon İnterpolasyon Ekstrapolasyon. Bölüm Üç Sayısal Türev Sayısal İtegrasyo İterpolasyo Ekstrapolasyo Bölüm Üç Bölüm III 8 III-. Pvot Noktaları Br ( ) oksyouu değer, geellkle ekse üzerdek ayrık oktalarda belrler. Bu oktalara pvot oktaları der. Bu

Detaylı

ÖRNEKLEME YÖNTEMLERİ ve ÖRNEKLEM GENİŞLİĞİ

ÖRNEKLEME YÖNTEMLERİ ve ÖRNEKLEM GENİŞLİĞİ 03.05.013 ÖRNEKLEME YÖNTEMLERİ ve ÖRNEKLEM GENİŞLİĞİ 1 Nede Örekleme? Öreklemde çalışmak ktlede çalışmakta daha kolaydır. Ktle üzerde çalışmak çok daha masraflı olablr. Çoğu durumda tüm ktleye ulaşmak

Detaylı

Tanımlayıcı İstatistikler

Tanımlayıcı İstatistikler Taımlayıcı İstatstkler Br veya brde azla dağılışı karşılaştırmak ç kullaıla ve ayrıca örek verlerde hareket le rekas dağılışlarıı sayısal olarak özetleye değerlere taımlayıcı statstkler der. Aalzlerde

Detaylı

denklemini sağlayan tüm x kompleks sayılarını bulunuz. denklemini x = 64 = 2 i şeklinde yazabiliriz. Bu son kompleks sayıları için x = 2iy

denklemini sağlayan tüm x kompleks sayılarını bulunuz. denklemini x = 64 = 2 i şeklinde yazabiliriz. Bu son kompleks sayıları için x = 2iy Ders Sorumlusu: Doç. Dr. Necp ŞİMŞEK Problem. deklem sağlaya tüm kompleks sayılarıı buluu. Çöüm deklem şeklde yaablr. Bu so y kompleks sayıları ç y yaalım. Bu taktrde deklemde, baı y ( ) y elde edlr. Burada

Detaylı

Tanımlayıcı İstatistikler

Tanımlayıcı İstatistikler Taımlayıcı İstatstkler Br veya brde azla dağılışı karşılaştırmak ç kullaıla ve ayrıca örek verlerde hareket le rekas dağılışlarıı sayısal olarak özetleye değerlere taımlayıcı statstkler der. Aalzlerde

Detaylı

Bir KANUN ve Bir TEOREM. Büyük Sayılar Kanunu

Bir KANUN ve Bir TEOREM. Büyük Sayılar Kanunu Br KANUN ve Br TEOREM Büyük Türkçe Sözlük kau Đg. law Doğa olaylarıı oluş edeler ortaya koya ve gelecektek olayları öcede kestrme olaağı vere bağıtı; Newto kauu, Kepler kauları. (BSTS / Gökblm Termler

Detaylı

Tanımlayıcı İstatistikler

Tanımlayıcı İstatistikler TANIMLAYICI İSTATİSTİKLER MERKEZİ EĞİLİM ÖLÇÜLERİ Dr. Mehmet AKSARAYLI D.E.Ü. İ.İ.B.F. EKONOMETRİ BÖLÜMÜ [email protected] Taımlayıcı İstatstkler Yer Ölçüler (Merkez Eğlm Ölçüler) Duyarlı Ortalamalar

Detaylı

1. GAZLARIN DAVRANI I

1. GAZLARIN DAVRANI I . GZLRIN DRNI I İdeal Gazlar ç: lm 0 RT İdeal gazlar ç: RT Hacm() basıçla() değşk sıcaklıklarda değşm ekl.. de gösterlmştr. T >T 8 T T T 3 asıç T 4 T T 5 T 7 T 8 Molar Hacm ekl.. Gerçek br gazı değşk sıcaklıklardak

Detaylı

ÇOKLU REGRESYON MODELİ, ANOVA TABLOSU, MATRİSLERLE REGRESYON ÇÖZÜMLEMESİ,REGRES-YON KATSAYILARININ YORUMU

ÇOKLU REGRESYON MODELİ, ANOVA TABLOSU, MATRİSLERLE REGRESYON ÇÖZÜMLEMESİ,REGRES-YON KATSAYILARININ YORUMU 6.07.0 ÇOKLU REGRESON MODELİ, ANOVA TABLOSU, MATRİSLERLE REGRESON ÇÖZÜMLEMESİ,REGRES-ON KATSAILARININ ORUMU ÇOKLU REGRESON MODELİ Ekonom ve şletmeclk alanlarında herhang br bağımlı değşken tek br bağımsız

Detaylı

TOBB Ekonomi ve Teknoloji Üniversitesi İKT351 Ekonometri I, Ara Sınavı

TOBB Ekonomi ve Teknoloji Üniversitesi İKT351 Ekonometri I, Ara Sınavı TOBB Ekoom ve Tekoloj Üverstes İKT351 Ekoometr I, Ara Sıavı Öğr.Gör.: Yrd. Doç. Dr. A. Talha YALTA Ad, Soyad: Açıklamalar: Bu sıav toplam 100 pua değerde 4 soruda oluşmaktadır. Sıav süres 90 dakkadır ve

Detaylı

Örnek A. Benzer tipteki 40 güç kaynağının dayanma süreleri aşağıdaki gibidir. Genişletilmiş frekans tablosu oluşturunuz;

Örnek A. Benzer tipteki 40 güç kaynağının dayanma süreleri aşağıdaki gibidir. Genişletilmiş frekans tablosu oluşturunuz; Öre A. Bezer pe 40 güç ayağıı dayama süreler aşağıda gbdr. Geşlelmş reas ablosu oluşuruuz;, 4,7 3, 3,4 3,3 3, 3,9 4, 3,4 4, 3,8 3,7 3,6 3,8 3,7 3,0,,6 3, 3,,6,9 3, 3,0 3,3 4,3 3, 4, 4,6 3, 3,3 4,4 3,9,9

Detaylı

HĐPERSTATĐK SĐSTEMLER

HĐPERSTATĐK SĐSTEMLER HĐPERSTATĐK SĐSTELER Taım: Bütü kest zorları, şekldeğştrmeler ve yerdeğştrmeler belrlemes ç dege deklemler yeterl olmadığı sstemlere hperstatk sstemler der. Hperstatk sstemler hesabı ç, a) Dege deklemlere,

Detaylı

Đst201 Đstatistik Teorisi I

Đst201 Đstatistik Teorisi I Đst20 Đstatstk Teors I DERSĐN TÜRÜ Zorulu DERSĐN DÖNEMĐ Yaz DERSĐN KREDĐSĐ Ulusal Kred: (4, 0, 0 ) 4 KTS: 7 DERSĐN VERĐLDĐĞĐ Bölüm: Đstatstk 200/20 Öğretm Yılı DERSĐN MCI Đstatstğ matematksel temeller

Detaylı

ĐÇI DEKILER 1. TEMEL ĐSTATĐSTĐK KAVRAMLAR VE OTASYO LAR 1

ĐÇI DEKILER 1. TEMEL ĐSTATĐSTĐK KAVRAMLAR VE OTASYO LAR 1 ĐÇI DEKILER Sayfa. TEMEL ĐSTATĐSTĐK KAVRAMLAR VE OTASYO LAR.. Grş.. Đstatstk.3. Populasyo.4. Örek.5. Brm.6. Parametre.7. Değşke 3.8. Ver ve Ver Tpler 3.9. Toplama Sembolü 4 ÇALIŞMA PROBLEMLERĐ 6. VERĐLERĐ

Detaylı

değerine bu matrisin bir girdisi(elemanı,bileşeni) denir. Bir sütundan (satırdan) oluşan bir matrise bir sütun (satır) matrisi denir.

değerine bu matrisin bir girdisi(elemanı,bileşeni) denir. Bir sütundan (satırdan) oluşan bir matrise bir sütun (satır) matrisi denir. Bölüm 2 Matrsler aım 2.1 F br csm, m, brer doğal sayı olsu. a F ( 1,.., m; j 1,..., ) olmak üzere, a11... a1 fadese m satır sütuda oluşa (veya m tpde) br F matrs der. am 1... a m Böyle br matrs daha sade

Detaylı

YÖNEYLEM ARAŞTIRMASI III. Dinamik Programlama. Örnek 3: Tıbbi Müdahale Ekiplerinin Ülkelere Dağıtımı

YÖNEYLEM ARAŞTIRMASI III. Dinamik Programlama. Örnek 3: Tıbbi Müdahale Ekiplerinin Ülkelere Dağıtımı YÖNEYLEM ARAŞTIRMASI III Hafta Determstk Damk Programlama (devam) Damk Programlama Geçe derste küçük ölçekl problemler damk programlamayla yelemel olarak asıl çözüldüğüü gördük. Bu derste, öreklere devam

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık Ders 3: MERKEZİ EĞİLİM VE DAĞILMA ÖLÇÜLERİ Prof. Dr. İrfa KAYMAZ Taım Araştırma souçlarıı açıklamasıda frekas tablosu ve poligou isteile bilgiyi her zama sağlamayabilir. Verileri

Detaylı

TEZ ONAYI Nur ÇELİK tarafıda hazırlaa ANOVA Modellerde Çarpık Dağılımlar Kullaılarak Dayaıklı İstatstksel Souç Çıkarımı ve Uygulamaları adlı tez çalış

TEZ ONAYI Nur ÇELİK tarafıda hazırlaa ANOVA Modellerde Çarpık Dağılımlar Kullaılarak Dayaıklı İstatstksel Souç Çıkarımı ve Uygulamaları adlı tez çalış ANKARA ÜNİVERSİTESİ EN BİLİERİ ENSTİTÜSÜ DOKTORA TEZİ ANOVA MODELLERİNDE ÇARPIK DAĞILIAR KULLANILARAK DAYANIKLI İSTATİSTİKSEL SONUÇ ÇIKARIMI VE UYGULAMALARI Nur ÇELİK İSTATİSTİK ANABİLİM DALI ANKARA 0

Detaylı

ISF404 SERMAYE PİYASALARI VE MENKUL KIYMETYÖNETİMİ

ISF404 SERMAYE PİYASALARI VE MENKUL KIYMETYÖNETİMİ 8. HAFTA ISF404 SERMAYE PİYASALARI VE MENKUL KIYMETYÖNETİMİ PORTFÖY YÖNETİMİ II Doç.Dr. Murat YILDIRIM [email protected] Geleeksel Portföy Yaklaşımı, Bu yaklaşıma göre portföy bir bilim değil,

Detaylı

TAHMİNLEYİCİLERİN ÖZELLİKLERİ Sapmasızlık 3.2. Tutarlılık 3.3. Etkinlik minimum varyans 3.4. Aralık tahmini (güven aralığı)

TAHMİNLEYİCİLERİN ÖZELLİKLERİ Sapmasızlık 3.2. Tutarlılık 3.3. Etkinlik minimum varyans 3.4. Aralık tahmini (güven aralığı) 3 TAHMİNLEYİCİLERİN ÖZELLİKLERİ 3.1. Sapmasızlık 3.. Tutarlılık 3.3. Etkilik miimum varyas 3.4. Aralık tahmii (güve aralığı) İyi bir tahmi edici dağılımı tahmi edilecek populasyo parametresie yakı civarda

Detaylı

Elektrik Akımı, Potansiyel Fark ve Direnç Testlerinin Çözümleri

Elektrik Akımı, Potansiyel Fark ve Direnç Testlerinin Çözümleri Elektrk Akımı, Potansyel Fark ve Drenç Testlernn Çözümler 1 Test 1 n Çözümü. 1. Soruda verlen akım-potansyel farkı grafğnn eğmnn ters drenc verr. 8 X 5 8 8 Z Ohm kanunu bağıntısıyla verlr. Bu bağın- k

Detaylı

BÖLÜM 4 KLASİK OPTİMİZASYON TEKNİKLERİ (KISITLI OPTİMİZASYON)

BÖLÜM 4 KLASİK OPTİMİZASYON TEKNİKLERİ (KISITLI OPTİMİZASYON) BÖÜM 4 KASİK OPTİMİZASYON TEKNİKERİ KISITI OPTİMİZASYON 4. GİRİŞ Öcek bölülerde de belrtldğ b optzaso probleler çoğuluğu kısıtlaıcı oksolar çerektedr. Kısıtlaasız optzaso problelerde optu değer ede oksou

Detaylı

Genelleştirilmiş Ortalama Fonksiyonu ve Bazı Önemli Eşitsizliklerin Öğretimi Üzerine

Genelleştirilmiş Ortalama Fonksiyonu ve Bazı Önemli Eşitsizliklerin Öğretimi Üzerine Geelleşrlmş Oralama Foksyou ve Bazı Öeml Eşszlkler Öğrem Üzere Gabl ADİLOV, Gülek TINAZTEPE & Serap KEALİ * Öze Armek oralama, Geomerk oralama, Harmok oralama, Kuvadrak oralama ve bular arasıdak lşk vere

Detaylı

4/16/2013. Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

4/16/2013. Ders 9: Kitle Ortalaması ve Varyansı için Tahmin 4/16/013 Ders 9: Kitle Ortalaması ve Varyası içi Tahmi Kitle ve Öreklem Öreklem Dağılımı Nokta Tahmii Tahmi Edicileri Özellikleri Kitle ortalaması içi Aralık Tahmii Kitle Stadart Sapması içi Aralık Tahmii

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık Ders 3: MERKEZİ EĞİLİM VE DAĞILMA ÖLÇÜLERİ Prof. Dr. İrfa KAYMAZ Taım Araştırma souçlarıı açıklamasıda frekas tablosu ve poligou isteile bilgiyi her zama sağlamayabilir. Verileri

Detaylı

Korelasyon ve Regresyon

Korelasyon ve Regresyon Korelasyon ve Regresyon 1 Korelasyon Analz İk değşken arasında lşk olup olmadığını belrlemek çn yapılan analze korelasyon analz denr. Korelasyon; doğrusal yada doğrusal olmayan dye kye ayrılır. Korelasyon

Detaylı

Ki- kare Bağımsızlık Testi

Ki- kare Bağımsızlık Testi PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER Prof. Dr. Ali ŞEN Ki- kare Bağımsızlık Testi Daha öceki bölümlerde ölçümler arasıdaki ilişkileri asıl iceleeceğii gördük. Acak sıklıkla ilgileile veriler ölçüm

Detaylı

Quality Planning and Control

Quality Planning and Control Qualty Plag ad Cotrol END 3618 KALİTE PLANLAMA VE KONTROL Prof. Dr. Mehmet ÇAKMAKÇI Dokuz Eylül Üverstes Edüstr Mühedslğ Aablm Dalı 1 Qualty Maagemet İstatstksel Proses Kotrol Kotrol Kartları 2 END 3618

Detaylı

KUVVET SİSTEMLERİ KUVVET. Vektörel büyüklük. - Kuvvetin büyüklüğü - Kuvvetin doğrultusu - Kuvvetin uygulama noktası - Kuvvetin yönü. Serbest vektör.

KUVVET SİSTEMLERİ KUVVET. Vektörel büyüklük. - Kuvvetin büyüklüğü - Kuvvetin doğrultusu - Kuvvetin uygulama noktası - Kuvvetin yönü. Serbest vektör. İ.T.Ü. aka akültes ekak Aa Blm Dalı STATİK - Bölüm KUVVET SİSTELEİ KUVVET Vektörel büyüklük - Kuvvet büyüklüğü - Kuvvet doğrultusu - Kuvvet uygulama oktası - Kuvvet yöü S = (,,..., ) = + +... + = Serbest

Detaylı

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ Pel İYİ GENETİK ALGORİTMA UYGULANARAK VE BİLGİ KRİTERLERİ KULLANILARAK ÇOKLU REGRESYONDA MODEL SEÇİMİ İSTATİSTİK ANABİLİM DALI ADANA, 006

Detaylı

Kİ-KARE TESTLERİ. şeklinde karesi alındığında, Z i. değerlerinin dağılımı ki-kare dağılımına dönüşür.

Kİ-KARE TESTLERİ. şeklinde karesi alındığında, Z i. değerlerinin dağılımı ki-kare dağılımına dönüşür. Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ Örnekleme yoluyla elde edlen rakamların, anakütle rakamlarına uygun olup olmadığı; br başka fadeyle gözlenen değerlern teork( beklenen) değerlere uygunluk

Detaylı

Orkun COŞKUNTUNCEL a Mersin Üniversitesi

Orkun COŞKUNTUNCEL a Mersin Üniversitesi Kuram ve Uygulamada Eğtm Blmler Educatoal Sceces: Theory & Practce - 3(4) 39-58 03 Eğtm Daışmalığı ve Araştırmaları İletşm Hzmetler Tc. Ltd. Şt. www.edam.com.tr/kuyeb DOI: 0.738/estp.03.4.867 Sosyal Blmlerde

Detaylı

ETKİN SINIR VE BETA KATSAYI KISITLI PORTFÖY SEÇİM MODELİ ÜZERİNE BİR UYGULAMA

ETKİN SINIR VE BETA KATSAYI KISITLI PORTFÖY SEÇİM MODELİ ÜZERİNE BİR UYGULAMA İstabul Tcaret Üverstes Fe Blmler Dergs Yıl: 11 Sayı: Güz 01 s. 19-35 ETKİN SINIR VE BETA KATSAYI KISITLI PORTFÖY SEÇİM MODELİ ÜZERİNE BİR UYGULAMA Cası KAYA 1, Oza KOCADAĞLI Gelş: 30.05.01 Kabul: 14.1.01

Detaylı

PARÇALI DOĞRUSAL REGRESYON

PARÇALI DOĞRUSAL REGRESYON HAFTA 4 PARÇALI DOĞRUSAL REGRESYO Gölge değşkenn br başka kullanımını açıklamak çn varsayımsal br şrketn satış temslclerne nasıl ödeme yaptığı ele alınsın. Satış prmleryle satış hacm Arasındak varsayımsal

Detaylı

Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ

Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ Kİ-KAR TSTLRİ A) Kİ-KAR DAĞILIMI V ÖZLLİKLRİ Örnekleme yoluyla elde edlen rakamların, anakütle rakamlarına uygun olup olmadığı; br başka fadeyle gözlenen değerlern teork( beklenen) değerlere uygunluk gösterp

Detaylı

Sağlam Ridge Regresyon Analizi ve Bir Uygulama

Sağlam Ridge Regresyon Analizi ve Bir Uygulama Dokuz Eylül Üverstes İktsad ve İdar Blmler Fakültes Dergs, Clt:5, Sayı:, Yıl:010, ss.137-148. Sağlam Rdge Regresyo Aalz ve Br Uygulama Özlem ALPU 1 Hatce ŞAMKAR Ekrem ALTAN 3 Özet Çoklu regresyo aalzde

Detaylı

5.1 Olasılık Tarihi. 5.2. Temel Olasılık Kavramları

5.1 Olasılık Tarihi. 5.2. Temel Olasılık Kavramları 5 OLSILIK 5.. Olasılık Tarh 5.. Temel Olasılık Kavramları 5.3. Deeysel Olasılık 5.4. Temel olasılık Teoremler 5.5. Olasılığı Tolaablrlk Kuralı: 5.6. Olasılığı çarım kuralı: 5.7. Değl ağıtısı: 5.8. Koşullu

Detaylı

REGRESYON ANALİZİNDE KULLANILAN EN KÜÇÜK KARELER VE EN KÜÇÜK MEDYAN KARELER YÖNTEMLERİNİN KARŞILAŞTIRILMASI

REGRESYON ANALİZİNDE KULLANILAN EN KÜÇÜK KARELER VE EN KÜÇÜK MEDYAN KARELER YÖNTEMLERİNİN KARŞILAŞTIRILMASI FEN DEGİSİ (E-DEGİ). 8, 3() 9-9 EGESYON ANALİZİNDE KULLANILAN EN KÜÇÜK KAELE VE EN KÜÇÜK MEDYAN KAELE YÖNTEMLEİNİN KAŞILAŞTIILMASI Özlem GÜÜNLÜ ALMA, Özgül VUPA Dokuz Eylül Üverstes, Fe-Edebyat Fakültes,

Detaylı

Operasyonel Risk İleri Ölçüm Modelleri

Operasyonel Risk İleri Ölçüm Modelleri Bakacılar Dergs, Sayı 58, 006 Grş Operasyoel Rsk İler Ölçüm Modeller Çalışma k bölümde oluşmaktadır. İlk bölümde operasyoel rskler ölçülmes kapsamıda hag ler ölçüm modeller kullaılması gerektğ, söz kousu

Detaylı

HAFTA 13. kadın profesörlerin ortalama maaşı E( Y D 1) erkek profesörlerin ortalama maaşı. Kestirim denklemi D : t :

HAFTA 13. kadın profesörlerin ortalama maaşı E( Y D 1) erkek profesörlerin ortalama maaşı. Kestirim denklemi D : t : HAFTA 13 GÖLGE EĞİŞKENLERLE REGRESYON (UMMY VARIABLES) Gölge veya kukla (dummy) değşkenler denen ntel değşkenler, cnsyet, dn, ten reng gb hemen sayısallaştırılamayan ama açıklanan değşkenn davranışını

Detaylı

BÖLÜM 6 6. REGRESYON MODELİNİN TEMEL KONTROLÜ

BÖLÜM 6 6. REGRESYON MODELİNİN TEMEL KONTROLÜ BÖLÜM 6 6. REGRESYON MODELİNİN TEMEL KONTROLÜ Bu bölüde regresyo odel üzerde gerçekleştrlecek teel kotrol yöteler celeecektr. Bu kısıda açıklaacak ola tekkler sadece doğrusal regresyo ç değl doğrusal olaya

Detaylı

DEĞİŞİM ÖLÇÜLERİ 4. TAŞINMAZ GELİŞTİRME TEZSİZ YÜKSEK LİSANS PROGRAMI. Ünite: 4 DEĞİŞİM ÖLÇÜLERİ. Doç. Dr. Yüksel TERZİ İÇİNDEKİLER İÇİNDEKİLER

DEĞİŞİM ÖLÇÜLERİ 4. TAŞINMAZ GELİŞTİRME TEZSİZ YÜKSEK LİSANS PROGRAMI. Ünite: 4 DEĞİŞİM ÖLÇÜLERİ. Doç. Dr. Yüksel TERZİ İÇİNDEKİLER İÇİNDEKİLER TAŞINMAZ GELİŞTİRME Üte: DEĞİŞİM ÖLÇÜLERİ Doç. Dr. üksel TERZİ TAŞINMAZ GELİŞTİRME TEZSİZ ÜKSEK LİSANS PROGRAMI İÇİNDEKİLER.1. GİRİŞ.. DEĞİŞİM ÖLÇÜLERİ..1. Değşm Geşlğ... Kartller Arası fark... Ortalama

Detaylı

BAZI YARIGRUP AİLELERİ ve YAPILARI İÇİN SONLULUK KOŞULLARI ve ETKİNLİK *

BAZI YARIGRUP AİLELERİ ve YAPILARI İÇİN SONLULUK KOŞULLARI ve ETKİNLİK * BAZI YARIGRUP AİLELERİ ve YAPILARI İÇİN SONLULUK KOŞULLARI ve ETKİNLİK * Fteess Codtos For Soe Segroup Fales ad Costructos ad Effcecy Basr ÇALIŞKAN Mateatk Aabl Dalı Hayrullah AYIK Mateatk Aabl Dalı ÖZET

Detaylı

Tümevarım_toplam_Çarpım_Dizi_Seri. n c = nc i= 1 n ca i. k 1. i= r n. Σ sembolü ile bilinmesi gerekli bazı formüller : 1) k =1+ 2 + 3+...

Tümevarım_toplam_Çarpım_Dizi_Seri. n c = nc i= 1 n ca i. k 1. i= r n. Σ sembolü ile bilinmesi gerekli bazı formüller : 1) k =1+ 2 + 3+... MC formülüü doğruluğuu tümevarım ilkesi ile gösterelim. www.matematikclub.com, 00 Cebir Notları Gökha DEMĐR, [email protected] Tümevarım_toplam_Çarpım_Dizi_Seri Tümevarım Metodu : Matematikte kulladığımız

Detaylı

İleri Teknoloji Bilimleri Dergisi Journal of Advanced Technology Sciences ISSN:2147-3455

İleri Teknoloji Bilimleri Dergisi Journal of Advanced Technology Sciences ISSN:2147-3455 İler Tekoloj Blmler Dergs Joural of Advaced Techology Sceces ISSN:47-3455 GÜÇ SİSTEMLERİNDE HARMONİKLERİN KRİTİK DEĞERLERE ETKİSİ Yusuf ALAŞAHAN İsmal ERCAN Al ÖZTÜRK 3 Salh TOSUN 4,4 Düzce Üv, Tekoloj

Detaylı

PAMUKKALE ÜNİVERSİTESİ. Mühendislik Fakültesi, Makine Mühendisliği Bölümü. Zekeriya Girgin DENİZLİ, 2015 OTOMATİK KONTROL DERS NOTLARI

PAMUKKALE ÜNİVERSİTESİ. Mühendislik Fakültesi, Makine Mühendisliği Bölümü. Zekeriya Girgin DENİZLİ, 2015 OTOMATİK KONTROL DERS NOTLARI PAMUKKALE ÜNİVERSİTESİ Mühedlk Fakülte, Make Mühedlğ Bölümü Zekerya Grg DENİZLİ, 05 OTOMATİK KONTROL DERS NOTLARI Ööz Mühedlkte vermeye başladığım Otomatk Kotrol der daha y alaşılablme ç bu otlar hazırlamaya

Detaylı

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ Ayça Hatce TÜRKAN GÜVENİLİRLİK ANALİZİNDE KULLANILAN İSTATİSTİKSEL DAĞILIM MODELLERİ İSTATİSTİK ANABİLİM DALI ADANA, 007 ÇUKUROVA ÜNİVERSİTESİ

Detaylı

SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ DOĞRUSAL OLMAYAN POISSON REGRESYON M. Kazım KÖREZ YÜKSEK LİSANS İSTATİSTİK Aablm Dalı Ağustos- KONYA Her Hakkı Saklıdır ÖZET YÜKSEK LİSANS DOĞRUSAL OLMAYAN

Detaylı

Biyoistatistik (Ders 9: Korelasyon ve Regresyon Analizi)

Biyoistatistik (Ders 9: Korelasyon ve Regresyon Analizi) KORELASYON ve REGRESYON ANALİZLERİ Yrd. Doç. Dr. Üal ERKORKMAZ Sakarya Üverstes Tıp Fakültes Byostatstk Aablm Dalı [email protected] SİSTEM, ALT SİSTEM ve SİSTEM DİNAMİKLERİ Doğa br aa sstemdr.

Detaylı

PORTFÖY OPTİMİZASYONUNDA ORTALAMA MUTLAK SAPMA MODELİ VE MARKOWITZ MODELİNİN KULLANIMI VE İMKB VERİLERİNE UYGULANMASI

PORTFÖY OPTİMİZASYONUNDA ORTALAMA MUTLAK SAPMA MODELİ VE MARKOWITZ MODELİNİN KULLANIMI VE İMKB VERİLERİNE UYGULANMASI Süleyma Demrel Üverstes İktsad ve İdar Blmler Fakültes Dergs Y.2008, C.3, S.2 s.335-350. Suleyma Demrel Uversty The Joural of Faculty of Ecoomcs ad Admstratve Sceces Y.2008, vol.3, No.2 pp.335-350. PORTFÖY

Detaylı

X = 11433, Y = 45237,

X = 11433, Y = 45237, A.Ü. SBF, IV Malye EKONOMETRİ I ARA SINAVI 4..006 Süre 90 dakkadır..,. ve 3. sorular 0 ar, 4. ve 5. sorular 30 ar pua, ödev 0 pua değerdedr. Tüm formüller ve şlemlerz açıkça gösterz. ) Y = Xβ + u doğrusal

Detaylı

T.C. SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

T.C. SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ T.C. SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ BAZI DAĞILIMLAR İÇİN EN ÇOK OLABİLİRLİK VE FARKLI KAYIP FONKSİYONLARI ALTINDA BAYES TAHMİN EDİCİLERİNİN PERFORMANSLARININ KARŞILAŞTIRILMASI Gülca GENCER

Detaylı

Kİ KARE ANALİZİ. Doç. Dr. Mehmet AKSARAYLI Ki-Kare Analizleri

Kİ KARE ANALİZİ. Doç. Dr. Mehmet AKSARAYLI  Ki-Kare Analizleri Kİ KAR ANALİZİ 1 Doç. Dr. Mehmet AKSARAYLI www.mehmetaksarayl K-Kare Analzler OLAY 1: Genelde br statstk sınıfında, öğrenclern %60 ının devamlı, %30 unun bazen, %10 unun se çok az derse geldkler düşünülmektedr.

Detaylı

(DERS NOTLARI) Hazırlayan: Prof.Dr. Orhan ÇAKIR. Ankara Üniversitesi, Fen Fakültesi, Fizik Bölümü

(DERS NOTLARI) Hazırlayan: Prof.Dr. Orhan ÇAKIR. Ankara Üniversitesi, Fen Fakültesi, Fizik Bölümü FİZ433 FİZİKTE BİLGİSAYAR UYGULAMALARI DERS NOTLARI Hazırlaya: Pro.Dr. Orha ÇAKIR Akara Üverstes, Fe Fakültes, Fzk Bölümü Akara, 7! İÇİNDEKİLER. LİNEER OLMAYAN DENKLEMLERİN KÖKLERİNİN BULUNMASI I/II. LİNEER

Detaylı

İSTATİSTİK 2. Tahmin Teorisi 07/03/2012 AYŞE S. ÇAĞLI. [email protected]

İSTATİSTİK 2. Tahmin Teorisi 07/03/2012 AYŞE S. ÇAĞLI. aysecagli@beykent.edu.tr İSTATİSTİK 2 Tahmi Teorisi 07/03/2012 AYŞE S. ÇAĞLI [email protected] İstatistik yötemler İstatistik yötemler Betimsel istatistik Çıkarımsal istatistik Tahmi Hipotez testleri Nokta tahmii Aralık

Detaylı

DOGRUSAL REGRESYONDA SAGLAM TAHMiN EDiciLER VE BiR UYGULAMA Meral Candan ÇETiN1, Aynur ORSOY1

DOGRUSAL REGRESYONDA SAGLAM TAHMiN EDiciLER VE BiR UYGULAMA Meral Candan ÇETiN1, Aynur ORSOY1 ANADOLU ÜNvERSTES BlM VE TEKNOLOJ DERGS ANADOLU UNIVERSITY JOURNAL OF SCIENCE AND TECHNOLOGY CltNol.:2 - Sayı/No: 2 : 265-270 (2001) ARAŞTIRMA MAKALESIRESEARCH ARTICLE DOGRUSAL REGRESYONDA SAGLAM TAHMN

Detaylı

Önceki bölümde özetlenen Taylor metodlarında yerel kesme hata mertebesinin yüksek oluşu istenilen bir özelliktir. Diğer taraftan

Önceki bölümde özetlenen Taylor metodlarında yerel kesme hata mertebesinin yüksek oluşu istenilen bir özelliktir. Diğer taraftan III.5.RUNGE-KUTTA METODLARI Öcek bölümde özelee Talor meodlarıda erel kesme aa merebes üksek oluşu sele br özellkr. Dğer araa ürevler buluma ve esaplaması pek çok problem ç karmaşık ve zama alıcı olduğuda

Detaylı

Olabilirlik Oranı Yöntemine Dayalı, Yapısal Homojen Olmayan Varyans Testlerinin Piyasa Modeli İçin Karşılaştırılması

Olabilirlik Oranı Yöntemine Dayalı, Yapısal Homojen Olmayan Varyans Testlerinin Piyasa Modeli İçin Karşılaştırılması Dokuz Eylül Üverstes İktsad ve İdar Blmler Fakültes Dergs, Clt:6, Sayı:, Yıl:011, ss.135-144 Olablrlk Oraı Yöteme Dayalı, Yaısal Homoje Olmaya Varyas Testler Pyasa Model İç Karşılaştırılması Flz KARDİYEN

Detaylı

10. SINIF KONU ANLATIMLI. 2. ÜNİTE: ELEKTRİK VE MANYETİZMA 2. Konu ELEKTRİK AKIMI, POTANSİYEL FARK VE DİRENÇ ETKİNLİK ve TEST ÇÖZÜMLERİ

10. SINIF KONU ANLATIMLI. 2. ÜNİTE: ELEKTRİK VE MANYETİZMA 2. Konu ELEKTRİK AKIMI, POTANSİYEL FARK VE DİRENÇ ETKİNLİK ve TEST ÇÖZÜMLERİ 10. SINIF ONU NTII. ÜNİTE: EETİ E NYETİZ. onu EETİ II, POTNSİYE F E DİENÇ ETİNİ ve TEST ÇÖZÜEİ Ünte Elektrk ve anyetzma 1.. Ünte. onu (Elektrk kımı) nın Çözümler ampul 3. Şekl yenden aşağıdak gb çzeblrz.

Detaylı

1. BÖLÜM GİRİŞ. 1.1. İstatistiğin kökeni ve tanımı

1. BÖLÜM GİRİŞ. 1.1. İstatistiğin kökeni ve tanımı . BÖLÜM GİRİŞ.. İstatstğ köke ve taımı İstatstk kelmes lk defa km tarafıda kullaılmış olması tartışma kousu olmakla brlkte, bazı blm adamlarıa göre lk defa Almaya da Achewall (79-79) tarafıda kullaıldığı,

Detaylı

Sürekli Olasılık Dağılım (Birikimli- Kümülatif)Fonksiyonu. Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK

Sürekli Olasılık Dağılım (Birikimli- Kümülatif)Fonksiyonu. Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK Sürekl Olasılık Dağılım Brkml- KümülatFonksyonu Yrd. Doç. Dr. Tjen ÖVER ÖZÇELİK [email protected] Sürekl olasılık onksyonları X değşken - ;+ aralığında tanımlanmış br sürekl rassal değşken olsun. Aşağıdak

Detaylı

Regresyon Analizi Basit Do rusal Regresyon Analizi En Küçük Kareler Tekni i Varyans n(v 2 ) Tahmini Basit Do rusal Regresyonda Aral k Tahmini

Regresyon Analizi Basit Do rusal Regresyon Analizi En Küçük Kareler Tekni i Varyans n(v 2 ) Tahmini Basit Do rusal Regresyonda Aral k Tahmini 5 STAT ST K-II Amaçlar m z Bu ütey tamamlad kta sora; k de flke aras dak lflky aç klaya do rusal model kurablecek, k de flke aras dak lflk dereces belrleyeblecek blg ve becerlere sahp olacaks z. Aahtar

Detaylı

BÖLÜM 3 YER ÖLÇÜLERİ. Doç.Dr. Suat ŞAHİNLER

BÖLÜM 3 YER ÖLÇÜLERİ. Doç.Dr. Suat ŞAHİNLER BÖLÜM 3 YER ÖLÇÜLERİ İkici bölümde verileri frekas tablolarıı hazırlaması ve grafikleri çizilmesideki esas amaç; gözlemleri doğal olarak ait oldukları populasyo dağılışıı belirlemek ve dağılışı geel özelliklerii

Detaylı

LİNEER OLMAYAN DENKLEMLERİN SAYISAL ÇÖZÜM YÖNTEMLERİ-2

LİNEER OLMAYAN DENKLEMLERİN SAYISAL ÇÖZÜM YÖNTEMLERİ-2 LİNEER OLMAYAN DENKLEMLERİN SAYISAL ÇÖZÜM YÖNTEMLERİ SABİT NOKTA İTERASYONU YÖNTEMİ Bu yötemde çözüme gitmek içi f( olarak verile deklem =g( şeklie getirilir. Bir başlagıç değeri seçilir ve g ( ardışık

Detaylı

BÖLÜM 5 İKİ VEYA DAHA YÜKSEK BOYUTLU RASGELE DEĞİŞKENLER İki Boyutlu Rasgele Değişkenler

BÖLÜM 5 İKİ VEYA DAHA YÜKSEK BOYUTLU RASGELE DEĞİŞKENLER İki Boyutlu Rasgele Değişkenler BÖLÜM 5 İKİ VEYA DAHA YÜKSEK BOYUTLU RASGELE DEĞİŞKENLER 5.. İk Boyutlu Rasgele Değşkenler Br deney yapıldığında, aynı deneyle lgl brçok rasgele değşkenn aynı andak durumunu düşünmek gerekeblr. Böyle durumlarda

Detaylı

Bir Alışveriş Merkezinde Hizmet Sektörü Đçin En Kısa Yol Problemi ile Bir Çözüm

Bir Alışveriş Merkezinde Hizmet Sektörü Đçin En Kısa Yol Problemi ile Bir Çözüm Br Alışverş Merkezde Hzmet Sektörü Đç E Kısa Yol Problem le Br Çözüm Pıar Düdar, Mehmet Al Balcı, Zeyep Örs Yorgacıoğlu Ege Üverstes, Matematk Bölümü, Đzmr Yaşar Üverstes, Matematk Bölümü, Đzmr [email protected],

Detaylı

Matematik olarak normal dağılım fonksiyonu. 1 exp X 2

Matematik olarak normal dağılım fonksiyonu. 1 exp X 2 Matematk olarak ormal dağılım foksyou f ( ) ep ( ) Şeklde fade edlr. Burada μ artmetk ortalama, σ se stadart sapma değer gösterr ve dağılım foksyou N(μ, σ) otasyou le gösterlr. Bu deklem geometrk görütüsü

Detaylı

İSTATİSTİK DERS NOTLARI

İSTATİSTİK DERS NOTLARI Balıkesir Üiversitesi İşaat Mühedisliği Bölümü [email protected] İSTATİSTİK DERS NOTLARI Yrd. Doç. Dr. Umut OKKAN idrolik Aabilim Dalı Balıkesir Üiversitesi İşaat Mühedisliği Bölümü Bölüm 5 Örekleme

Detaylı

ÖZET Yüksek Lsas Tez NORMAL DAĞILIM VE NORMAL DAĞILIMLA İLGİLİ ÇIKARIMLAR Şeol ÇELİK Akara Üverstes Fe Blmler Esttüsü İstatstk Aablm Dalı Daışma : Doç

ÖZET Yüksek Lsas Tez NORMAL DAĞILIM VE NORMAL DAĞILIMLA İLGİLİ ÇIKARIMLAR Şeol ÇELİK Akara Üverstes Fe Blmler Esttüsü İstatstk Aablm Dalı Daışma : Doç ANKARA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ NORMAL DAĞILIM VE NORMAL DAĞILIMLA İLGİLİ ÇIKARIMLAR Şeol ÇELİK İSTATİSTİK ANABİLİM DALI ANKARA 006 Her hakkı saklıdır ÖZET Yüksek Lsas Tez

Detaylı

IŞIĞIN KIRILMASI. 1. Ortamların kırılma indisleri n K. , n M. , n L. arasındaki ilişki aşağıdaki gibidir. > n L. > n K. n M. > n M. n L. n K.

IŞIĞIN KIRILMASI. 1. Ortamların kırılma indisleri n K. , n M. , n L. arasındaki ilişki aşağıdaki gibidir. > n L. > n K. n M. > n M. n L. n K. BÖÜ ŞĞ RAS AŞTRAAR ÇÖZÜER ŞĞ RAS Ortamları kırılma dsler,, arasıdak lşk aşağıdak gbdr 9 > > > > > > 6 0 > > > > > > 7 > > > > > > 0 7 0 0 > > > > > 76 OPTİ 7 0 0 > > > > > > 0 θ θ > > > > > > 9 0 O > >

Detaylı

İşlenmemiş veri: Sayılabilen yada ölçülebilen niceliklerin gözlemler sonucu elde edildiği hali ile derlendiği bilgiler.

İşlenmemiş veri: Sayılabilen yada ölçülebilen niceliklerin gözlemler sonucu elde edildiği hali ile derlendiği bilgiler. OLASILIK VE İSTATİSTİK DERSLERİ ÖZET NOTLARI İstatistik: verileri toplaması, aalizi, suulması ve yorumlaması ile ilgili ilkeleri ve yötemleri içere ve bu işlemleri souçlarıı probabilite ilkelerie göre

Detaylı

RANKI 2 OLAN SERBEST LIE CEBİRLERİNİN OTOMORFİZM GRUPLARININ SUNUMLARI 1 Reports Of Free Groups Otomorfizm Rank 2 Lie Algebras

RANKI 2 OLAN SERBEST LIE CEBİRLERİNİN OTOMORFİZM GRUPLARININ SUNUMLARI 1 Reports Of Free Groups Otomorfizm Rank 2 Lie Algebras RANKI OLAN SERBEST LIE CEBİRLERİNİN OTOMORFİZM GRUPLARININ SUNUMLARI Reports Of Free Groups Otomorfzm Rak Le Algebras Özge ÖZTEKİN Matematk Aa Blm Dalı Name EKİCİ Matematk Aa Blm Dalı ÖZET Bu çalışmada,

Detaylı

BİR KARMAŞIK SİSTEMİN GÜVENİLİRLİK BLOK DİYAGRAMI İÇİN OLASILIK YOĞUNLUK FONKSİYONUNUN OLUŞTURULMASI VE İSTATİSTİKSEL GÜVENİLİRLİK HESAPLAMALARI*

BİR KARMAŞIK SİSTEMİN GÜVENİLİRLİK BLOK DİYAGRAMI İÇİN OLASILIK YOĞUNLUK FONKSİYONUNUN OLUŞTURULMASI VE İSTATİSTİKSEL GÜVENİLİRLİK HESAPLAMALARI* BİR KARMAŞIK SİSTEMİN GÜVENİLİRLİK BLOK DİYAGRAMI İÇİN OLILIK YOĞUNLUK FONKSİYONUNUN OLUŞTURULMI VE İSTATİSTİKSEL GÜVENİLİRLİK HESAPLAMALARI* Costructo O Probablty Desty Fucto For The Relablty Block Dagram

Detaylı

BÖLÜM 2 OLASILIK TEORİSİ

BÖLÜM 2 OLASILIK TEORİSİ BÖLÜM OLSILIK TEORİSİ İstatstksel araştırmaları temel koularıda br souu öede kes olarak blmeye bazı şasa bağlı olayları (deemeler) olası tüm mümkü souçlarıı hag sıklıkla ortaya çıktığıı belrleyeblmektr.

Detaylı

BETONARME YAPILARIN DEPREM PERFORMANSININ DEĞERLENDİRİLMESİ. M.Emin ÖNCÜ 1, Yusuf CALAYIR 2

BETONARME YAPILARIN DEPREM PERFORMANSININ DEĞERLENDİRİLMESİ. M.Emin ÖNCÜ 1, Yusuf CALAYIR 2 BETONARME YAPILARIN DEPREM PERFORMANSININ DEĞERLENDİRİLMESİ M.Em ÖNCÜ, Yusuf CALAYIR [email protected], [email protected] Öz: Çalışmada, betoarme yapıları Türk Deprem Yöetmelğde (ABYYHY,998) verle talep

Detaylı

GRİ MARKOV KESTİRİM MODELİ KULLANILARAK DÖVİZ KURU TAHMİNİ

GRİ MARKOV KESTİRİM MODELİ KULLANILARAK DÖVİZ KURU TAHMİNİ Joural of Ecoomcs, Face ad Accoutg (JEFA), ISSN: 48-6697 Year: 4 Volume: Issue: 3 CURRENCY EXCHANGE RATE ESTIMATION USING THE GREY MARKOV PREDICTION MODEL Omer Oala¹ ¹Marmara Uversty. [email protected]

Detaylı