ROBUST TAHMİN EDİCİLERİ VE ÖZELLİKLERİ * Robust Estimators and Properties

Benzer belgeler
Regresyon ve Korelasyon Analizi. Regresyon Analizi

Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyon. Dr. Musa KILIÇ

Zaman Skalasında Box-Cox Regresyon Yöntemi

Sağlam Ridge Regresyon Analizi ve Bir Uygulama

BEKLENEN DEĞER VE VARYANS

ÖRNEKLEME YÖNTEMLERİ ve ÖRNEKLEM GENİŞLİĞİ

MERKEZİ EĞİLİM ÖLÇÜLERİ

ÖLÇÜM, ÖLÇÜM HATALARI ve ANLAMLI RAKAMLAR

İSTATİSTİK ANABİLİM DALI

Tanımlayıcı İstatistikler

Tahmin Edicilerin ve Test Đstatistiklerinin Simülasyon ile Karşılaştırılması

DOGRUSAL REGRESYONDA SAGLAM TAHMiN EDiciLER VE BiR UYGULAMA Meral Candan ÇETiN1, Aynur ORSOY1

REGRESYON ANALİZİNDE KULLANILAN EN KÜÇÜK KARELER VE EN KÜÇÜK MEDYAN KARELER YÖNTEMLERİNİN KARŞILAŞTIRILMASI

Doç. Dr. Mehmet AKSARAYLI

YER ÖLÇÜLERİ. Yer ölçüleri, verilerin merkezini veya yığılma noktasını belirleyen istatistiklerdir.

İki veri setinin yapısının karşılaştırılması

Quality Planning and Control

= k. Aritmetik Ortalama. Tanımlayıcı İstatistikler TANIMLAYICI İSTATİSTİKLER. Sınıflanmış Seriler İçin Aritmetik Ortalama

Olabilirlik Oranı Yöntemine Dayalı, Yapısal Homojen Olmayan Varyans Testlerinin Piyasa Modeli İçin Karşılaştırılması

denklemini sağlayan tüm x kompleks sayılarını bulunuz. denklemini x = 64 = 2 i şeklinde yazabiliriz. Bu son kompleks sayıları için x = 2iy

Tanımlayıcı İstatistikler (Descriptive Statistics) Dr. Musa KILIÇ

değerine bu matrisin bir girdisi(elemanı,bileşeni) denir. Bir sütundan (satırdan) oluşan bir matrise bir sütun (satır) matrisi denir.

TEZ ONAYI Nur ÇELİK tarafıda hazırlaa ANOVA Modellerde Çarpık Dağılımlar Kullaılarak Dayaıklı İstatstksel Souç Çıkarımı ve Uygulamaları adlı tez çalış

Polinom İnterpolasyonu

Eğitimle İlgili Sapan Değer İçeren Veri Kümelerinde En Küçük Kareler ve Robust M Tahmin Edicilerin Karşılaştırılması

Đst201 Đstatistik Teorisi I

Giriş. Değişkenlik Ölçüleri İSTATİSTİK I. Ders 5 Değişkenlik ve Asimetri Ölçüleri. Değişkenlik. X i ve Y i aşağıdaki gibi iki seri verilmiş olsun:

Orkun COŞKUNTUNCEL a Mersin Üniversitesi

Ridge Regresyonda M Tahmin Edicilerinin Kullanımı Üzerine Bir Uygulama 1

T.C. SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

BİR KARMAŞIK SİSTEMİN GÜVENİLİRLİK BLOK DİYAGRAMI İÇİN OLASILIK YOĞUNLUK FONKSİYONUNUN OLUŞTURULMASI VE İSTATİSTİKSEL GÜVENİLİRLİK HESAPLAMALARI*

Genelleştirilmiş Ortalama Fonksiyonu ve Bazı Önemli Eşitsizliklerin Öğretimi Üzerine

Önceki bölümde özetlenen Taylor metodlarında yerel kesme hata mertebesinin yüksek oluşu istenilen bir özelliktir. Diğer taraftan

Tahmin Edici Elde Etme Yöntemleri

6. Uygulama. dx < olduğunda ( )

TALEP TAHMİNLERİ. Y.Doç.Dr. Alpagut YAVUZ

HĐPERSTATĐK SĐSTEMLER

= İÇİNDEKİLER. E(X) = k Pascal (Negatif Binom) Dağılımı Hipergeometrik Dağılım N y=

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

Bir KANUN ve Bir TEOREM. Büyük Sayılar Kanunu

RANKI 2 OLAN SERBEST LIE CEBİRLERİNİN OTOMORFİZM GRUPLARININ SUNUMLARI 1 Reports Of Free Groups Otomorfizm Rank 2 Lie Algebras

İleri Teknoloji Bilimleri Dergisi Journal of Advanced Technology Sciences ISSN:

YÖNEYLEM ARAŞTIRMASI III. Dinamik Programlama. Örnek 3: Tıbbi Müdahale Ekiplerinin Ülkelere Dağıtımı

POISSON REGRESYON ANALİZİ

1. GAZLARIN DAVRANI I

Tanımlayıcı İstatistikler

SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

Gamma ve Weibull Dağılımları Arasında Kullback-Leibler Uzaklığına Dayalı Ayrım

ALTERNATİF SİSTEMLERİN KARŞILAŞTIRILMASI

ALTERNATİF SİSTEMLERİN KARŞILAŞTIRILMASI

Sayısal Türev Sayısal İntegrasyon İnterpolasyon Ekstrapolasyon. Bölüm Üç

KUKLA DEĞİŞKENLERİN T İSTATİSTİĞİ İLE AYKIRI GÖZLEMLER TESPİT EDİLEMEZ

Çok Aşamalı Sıralı Küme Örneklemesi Tasarımlarının Etkinlikleri Üzerine Bir Çalışma

DEÜ MÜHENDİSLİK FAKÜLTESİ FEN BİLİMLERİ DERGİSİ

FARKLI REGRESYON YÖNTEMLERİ İLE BETA KATSAYISI ANALİZİ

Operasyonel Risk İleri Ölçüm Modelleri

PORTFÖY OPTİMİZASYONUNDA ORTALAMA MUTLAK SAPMA MODELİ VE MARKOWITZ MODELİNİN KULLANIMI VE İMKB VERİLERİNE UYGULANMASI

(DERS NOTLARI) Hazırlayan: Prof.Dr. Orhan ÇAKIR. Ankara Üniversitesi, Fen Fakültesi, Fizik Bölümü

Parametrik Olmayan İstatistik Çözümlü Sorular - 2

α kararlı dağılım, VaR, Koşullu VaR,, Finansal α KARARLI DAĞILIMLARLA FİNANSAL RİSK

DEÜ MÜHENDİSLİK FAKÜLTESİ FEN ve MÜHENDİSLİK DERGİSİ Cilt: 9 Sayı: 1 s. 1-7 Ocak 2007 HİDROLİK PROBLEMLERİNİN ÇÖZÜMÜNDE TAŞIMA MATRİSİ YÖNTEMİ

GÜÇLÜ BETA HESAPLAMALARI. Güray Küçükkocaoğlu-Arzdar Kiracı

TAHMİNLEYİCİLERİN ÖZELLİKLERİ Sapmasızlık 3.2. Tutarlılık 3.3. Etkinlik minimum varyans 3.4. Aralık tahmini (güven aralığı)

BAZI YARIGRUP AİLELERİ ve YAPILARI İÇİN SONLULUK KOŞULLARI ve ETKİNLİK *

ARAŞTIRMA MAKALESİ / RESEARCH ARTICLE

BÖLÜM 4 KLASİK OPTİMİZASYON TEKNİKLERİ (KISITLI OPTİMİZASYON)

4/16/2013. Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

Tanımlayıcı İstatistikler

ÖZET Yüksek Lsas Tez NORMAL DAĞILIM VE NORMAL DAĞILIMLA İLGİLİ ÇIKARIMLAR Şeol ÇELİK Akara Üverstes Fe Blmler Esttüsü İstatstk Aablm Dalı Daışma : Doç

GENELLEŞTİRİLMİŞ BULANIK KÜMELER. Mehmet Şahin Gaziantep Üniversitesi, Matematik Bölümü, 27310, Gaziantep

Pareto I Daılımının lk Bozulma Sansürlü Örnekleme Planına Dayalı Parametrelerinin Tahmini ve Beklenen Test Süresi *

Yığın Hacminin Tahmini İçin Bulanık Doğrusal Regresyon Modelinde Ters Tahmin Metodu

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

LİNEER OLMAYAN DENKLEMLERİN SAYISAL ÇÖZÜM YÖNTEMLERİ-2

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

Regresyon Analizi Basit Do rusal Regresyon Analizi En Küçük Kareler Tekni i Varyans n(v 2 ) Tahmini Basit Do rusal Regresyonda Aral k Tahmini

BÖLÜM 3 YER ÖLÇÜLERİ. Doç.Dr. Suat ŞAHİNLER

TOPOLOJİK TEMEL KAVRAMLAR

9. Ders. Đstatistikte Monte Carlo Çalışmaları

İleri Diferansiyel Denklemler

TÜRKİYE ŞEKERPANCARI ÜRETİMİNDE FAKTÖR TALEP ANALİZİ ( ) (TRANSLOG MALİYET FONKSİYONU UYGULAMASI) Yaşar AKÇAY 1 Kemal ESENGÜN 2

MUTLAK SAPMALARIN ORTALAMASINI MİNUMUM YAPMA * (MİNMAD) REGRESYON ANALİZİ* Minimizing Mean Absolute Deviations (MINMAD) Regression Analysis*

Lojistik Regresyonda Meydana Gelen Aşırı Yayılımın İncelenmesi

SAÜ. Mühendislik Fakültesi Endüstri Mühendisliği Bölümü DİFERENSİYEL DENKLEMLER Dönemi Ders Notları. Prof. Dr.

ÇOKLU REGRESYON MODELİ, ANOVA TABLOSU, MATRİSLERLE REGRESYON ÇÖZÜMLEMESİ,REGRES-YON KATSAYILARININ YORUMU

Yrd. Doç. Dr. İhsa KARABULUT u daışmalığıda, Begül ARKANT tarafıda hazırlaa bu çalışma 3/07/008 tarhde aşağıdak jür tarafıda oy brlğ le Akara Üverstes

KUVVET SİSTEMLERİ KUVVET. Vektörel büyüklük. - Kuvvetin büyüklüğü - Kuvvetin doğrultusu - Kuvvetin uygulama noktası - Kuvvetin yönü. Serbest vektör.

ETKİN SINIR VE BETA KATSAYI KISITLI PORTFÖY SEÇİM MODELİ ÜZERİNE BİR UYGULAMA

Örnek A. Benzer tipteki 40 güç kaynağının dayanma süreleri aşağıdaki gibidir. Genişletilmiş frekans tablosu oluşturunuz;

GRİ MARKOV KESTİRİM MODELİ KULLANILARAK DÖVİZ KURU TAHMİNİ

TABAKALI ŞANS ÖRNEKLEME

Tanımlayıcı İstatistikler

18.06 Professor Strang FİNAL 16 Mayıs 2005

Tanımlayıcı İstatistikler

BÖLÜM 6 6. REGRESYON MODELİNİN TEMEL KONTROLÜ

Matematik olarak normal dağılım fonksiyonu. 1 exp X 2

Bir Alışveriş Merkezinde Hizmet Sektörü Đçin En Kısa Yol Problemi ile Bir Çözüm

DEĞİŞİM ÖLÇÜLERİ 4. TAŞINMAZ GELİŞTİRME TEZSİZ YÜKSEK LİSANS PROGRAMI. Ünite: 4 DEĞİŞİM ÖLÇÜLERİ. Doç. Dr. Yüksel TERZİ İÇİNDEKİLER İÇİNDEKİLER

QUANTILE REGRESYON * Quantile Regression

Transkript:

Ç.Ü Fe Blmler Esttüsü Yıl:2008 Clt:7-5 ROBUST TAHMİN EDİCİLERİ VE ÖZELLİKLERİ * Robust Estmators ad Propertes Yekta Stara KOÇ İstatstk Aablm Dalı Fkr AKDENİZ İstatstk Aablm Dalı ÖZET Robust tahm edcler, ver kümesde güvel gözlemler homoje dağılmaması durumuda güvel souçlar bulmak ve sapa değerler etks azaltmak amacıyla kullaılır. Bu çalışmada temel amaç; klask regresyo aalzde sapa gözlemler varlığı edeyle stadart varsayımları sağlamaması durumuda e küçük kareler yöteme alteratf olarak suula robust regresyo yötemler celemesdr. Bu çalışmada öce sapa değerler, kırılma oktası ve etk foksyou kavramları ele alıacak, sora robust bast regresyo ve çoklu regresyodak tahm edcler celeecektr. Öreklerle bu tahm edcler, e küçük kareler tahm edcsyle karşılaştırılacaktır. Aahtar kelmeler: E küçük kareler tahm edc, E küçük medya kareler tahm edc, Kırılma oktası, Robust tahm edc, Sapa değer. ABSTRACT Robust estmators are used for reducg the effects(weghts) of outlyg observatos the data set to get more relable ad stable estmators. The am of ths study s to propose robust regresso procedures as a alteratve method to Least Squares procedure whch s wdely used classcal regresso aalyss ad very sestve to outlyg observatos. I ths thess, frstly outler ad breakg pot cocepts wll be troduced, secodly a geeral overvew of estmators for robust smple ad multple regresso wll be gve ad fally these estmators wll be compared wth classcal Least Squares estmators ad examples wll be provded. Keywords: Breakg Pot,, Least meda squares estmator, Least squares estmator, Outler, Robust estmator, Grş Regresyo aalzde amaç; gözlee değerlere uya e y deklem oluşturmaktır. Brçok regresyo tekğ olmasıa karşı bularda e kullaışlı; olaı klasklğ ve hesaplama kolaylığıda dolayı e küçük kareler (EKK) tahm *Yüksek Lsas Tez-MSc. Thess 76

Ç.Ü Fe Blmler Esttüsü Yıl:2008 Clt:7-5 edcsdr. Fakat bu tahm edc sapa değerlere karşı çok hassastır. Bu probleme çözüm bulmak amacıyla sapalar değerlerde çok etklemeye ye statstksel tekkler gelştrld. Böylece robust (dayaıklı) tahm edcler ortaya çıktı. Bu yötem ver çoğuluğua uygu br model tasarlamaya çalışır. Ya, ver kümes küçük br bölümü sapa değerlerde oluşsa ble kala büyük bölüm güvelr souçlar verr. Bu çalışmada bast regresyo ve çoklu regresyo olmak üzere k aa başlık altıda robust tahm edcler ele alımış ve buları souçları örekler aracılığıyla klask EKK aalzyle karşılaştırılmıştır. Materyal ve Metot Materyal Regresyo aalzde amaç; gözlee değerlere e y uya deklemler oluşturmaktır. Klask leer model, +. y = x x e =,,, () p p dr. Burada öreklem geşlğ, x,, x p açıklayıcı değşkeler, y yaıt değşkedr. e hatalarıı se 0 ortalamalı ve blmeye varyaslı ormal dağılıma sahp olduğu varsayılır. Blmeye parametre vektörü ya.. p verde tahm edlr. Ver ç olaylar x. x. x değşkeler... x p... x p... x p y. y. y 77

Ç.Ü Fe Blmler Esttüsü Yıl:2008 Clt:7-5 matrs gösterm kullaılsı. Böyle br ver kümese regresyo tahm edcs uyguladığıda. p elde edlr. Burada j tahmler, regresyo katsayıları olarak adladırılır. Gerçek blmemese rağme j tahm edcler le açıklayıcı değşkeler j çarpılarak (2) y x... x p p (3) tahm edle değerler elde edlr. Bu durumda -c olayı r rezdüsü, y gözlemş değerler le ŷ tahm edle değer farkı olarak taımlaır. Ya, r =y - y (4) dır. E popüler regresyo tahm edc, m ˆ 2 r fadese karşılık gelr. Bu tahm edc amacı bu fadey mmum yaparak model e y duruma getrmektr. Bu yötem çok y ble e küçük kareler yötemdr (EKK). Bu yötem, statstğ öeml br köşe taşıdır. Popüler olmasıı ede se alaşılmasıı kolaylığıdır. 800 lü yıllarda buluduğuda blgsayarlar yoktu ve EKK tahm edcs verde belrl br matrs cebr le kolayca hesaplaablrd. Güümüzde ble brçok statstksel paket program hala geleeksellğ ve hesaplama hızıda dolayı ayı tekğ kullamaktadır Daha yakı zamalarda brçok araştırmacı, gerçek verler klask varsayımları tamame sağlamadığıı farketmeye başladı. EKK yötemde br ver kopyalaırke ya da taşıırke hatalı grldğde model tamame değşmektedr. Bu edele x ve y yöüdek regresyo sapaları stadart EKK aalzlerde cdd br rsk oluşturur. Bu problem çıkışı olarak robust regresyou ortaya çıktı. Bu yaklaşım sapalar tarafıda çok güçlü br bçmde etklemeye tahm edcler tasarlamaya çalışır. Bell belrsz robustlık fkre sahp brçok statstkç robustlığı amacıı bast br bçmde sapaları hmal etmek olduğua adı fakat bu doğru değldr. Akse (5) 78

Ç.Ü Fe Blmler Esttüsü Yıl:2008 Clt:7-5 robust aalz lk olarak ver çoğuluğuu br regresyoa uydurmak ster ve o zama robust çözümüde geş rezdülere sahp oktalar olarak sapaları keşfeder. Metot Daha robust br regresyo tahm edcse doğru lk adım Edgeworth de(987) geld. Bu tahm edc şu şeklde taımlaır: m ˆ r (6) Bu tekk geelde L regresyou olarak blr, EKK se L2 regresyou olarak blr. L regresyouu y-yöüdek sapmaya karşı robusttır fakat x-yöüdek sapaa karşı hassastır. Bu edele solu örekl kırılma oktası hala / dr. Bu yöde sorak adım Huber (973) bulduğu M tahm edcler kullaımıdır. Bu tahm edc m ˆ p( r ) (7) şekldedr. Burada p smetrk br foksyodur [p(-t)=p(t), t ç] ve 0 da tek mmuma sahptr. ˆ regresyo katsayılarıa göre bu fade farkı ( r ) x = 0 (8) eştlğ verr. Burada, p türev ve satır vektörüdür: x ( x,..., x p ) 0 = ( 0,,0 ) x -c durumdak açıklayıcı değşke Bu edele yukarıdak fade gerçekte p tae deklem br sstemdr. Çözümüü bulmak her zama çok kolay değldr. Pratk olarak Hollad ve Welsch (977) yede ağırlakladırılmış EKK yöteme dayaa fadeler tekrar kullaılır. 79

Ç.Ü Fe Blmler Esttüsü Yıl:2008 Clt:7-5 Bu deklem çözümü y ekse büyütülmese azara uygu br şekle döüştürülemez. Bu edele ı belrl br tahm le rezdüler stadartlaştırmak zorudayız. Ya ( r / ˆ) x = 0 (9) yazılmalıdır. Burada ˆ eş zamalı tahm edlmeldr. Mmax asmtotk varyas tartışmalarıa ede olduğu ç Huber (973) şu foksyou kullamayı ler sürdü: ( t) m( c,max( t, c)) (0) M-tahm edcler statstksel açıda L regresyouda daha etkldr. Ayı zamada uzaktak y lere göre hala daha robusttır. Fakat kırılma oktaları uzaktak x etks yüzüde hala / dr. Kaldıraç oktalarıı bu yaralaablrlğ yüzüde geelleştrlmş M- tahm edcler ler sürüldü..mallows (975) suduğu bu tahm edc belrl br ağırlık foksyou aracılığıyla uzaktak x sapalarıı etks sıırladırmak esas amacıdır. Mallows şu eştlğ kulladı: w( x ) ( r / ˆ) x 0 () Schwepp, Mallows u akse şuu kulladı: w( x ) ( r / w( x ) ˆ) x 0 (2) Bu tahm edcler br tek sapa gözlem etks sıırladırmak umuduyla yapıldı. Buları etks etk foksyou Hampel (974) dye adladırıla foksyolar aracılığıyla ölçüleblr. Bu edele karşılık gele GM (Geelleştrlmş M) tahm edcler geel olarak şu a sıırladırılmış etk tahm edcler olarak adladırılacaktır. Burada şu souç çıkar: Bütü GM tahm edcler kırılma oktası p br foksyou gb azala br değerde daha y olmayablr. Burada p 80

Ç.Ü Fe Blmler Esttüsü Yıl:2008 Clt:7-5 ye regresyo katsayılarıı sayısıdır. Bu çok yeterl değldr. Çükü bu arta boyutla brlkte kırılma oktasıı azalması alamıa gelr. Burada sapaları meydaa gelmes ç daha fazla fırsat vardır. Bu çalışma ayı kırılma oktasıa ulaşmış bütü GM tahm edcler göstermeyecektr. Fakat elbette k esas problem daha yüksek boyutlulardadır. Çeştl başka tahm edcler öerld. Maalesef bast regresyoda bu oktaları hçbr %30 luk kırılma oktasıa ulaşamadı. Üstelk oları çoğu p>2 ç ble taımlaamadı. Bütü bular yüksek kırılma oktalı robust regresyouu tamame mümkü olup olmadığı hakkıdak soruları arttırdı. Buu doğrulayıcı cevabı Segel(982) tarafıda verld. Segel %50 kırılma oktalı tekrarlı medya tahm edcs ler sürdüler. Gerçekte %50 bekleeblecek e y kırılma oktasıdır. Segel tahm edcs aşağıdak gb taımlaablr: Herhag p gözlem ç x, y,..., xp, yp olsu. Bu oktalara tam olarak uya parametre vektörü hesaplaır. Bu vektörü j-c koordatı, ˆ j med(...( med( med j(,..., p p p )))...) (3) m med r ˆ 2 (4) m ˆ ( r ) 2 : (5) eştlğyle verlr. Burada ( r 2 ) :... ( r 2 ) : (6) kares alıarak sıralamış rezdülerdr. (2.6) formülü EKK ya çok bezer. Tek farkı sapalarda uzakta kalması ç modele uymasıa z vermes suretyle e geş kares alımış rezdüler toplamda kullaılmamasıdır. LMS gb bu tahm edc de x leer döüşümler ç uygu döüşümlüdür ve zdüşüm takbe bağlıdır. E sağlam oralar h /2 olduğuda başarıldı. Bu ora da kırılma oktasıı %50 ye ulaşması durumudur. 8

Ç.Ü Fe Blmler Esttüsü Yıl:2008 Clt:7-5 LMS ve LTS her ks de rezdüler saçılımıı robust ölçümüü mmze ederek taımlaır. Buu geelleştrrsek Rousseeuw ve Yoha (984) S-tahm edcs dye adladırıla m S ( ) (7) ˆ le fade edle tahm edcy buldular. Burada S( ) fades, r ( ),..., r ( ) rezdüler ölçümüü robust M-tahm bell br çeşddr. Burada karışık sabtler uygu br seçmyle kırılma oktası %50 ye de ulaşablr. Buda başka S-tahm edcler aslıda M-tahm edcler gb ayı asmtotk performasa sahp olduğu ortaya çıkar. Araştırma Bulguları ve Tartışma Robust regresyou oldukça yüksek etkl ola oktaları etks azalta tahm edcler tasarlamaya çalışır. Br robust yötem ver çoğuluğuu br modele uydurmaya çalışır. İy oktalarla bçmlemş modelde uzakta yerleşe kötü oktalar souç olarak robust modelde geş rezdülere sahp olacaktır. Bu edele sapaları hassas olmayışıa ek olarak br robust regresyo tahm edcs bu oktaları bulumasıı kolay br ş olarak yapar. Elbette EKK dak rezdüler bu amaçla kullaılamazlar çükü sapalar çok küçük EKK rezdülere sahpke EKK model bu sapa oktaları çok fazla çekeblr. Ver Tablo de lstelee 4 ölçekl 2 gözlemde oluşur. Ver amoyağı trk aste oksdasyou ç br btkdek şlem taımlıyor. Yığı Kaybı (y), x ora şlem, x2 soğutulmuş suyu grş sıcaklığı ve x 3 ast kosatrasyou le açıkladı. Özetle lteratür atıf almış buluşları gösterdğ,3,4 ve 2. gözlemler sapa olduğu soucuu brçok saı çıkardığı söyleeblr. Bazılarıa göre 2. gözlem de br sapadır. EKK regresyou şu deklem verr: y ˆ 0,76x,295x2 0,52x3 39,9, EKK gösterge grafğ Şekl de gösterlyor. Rezdüler stadartlaştırılması rezdüler her br kısmıa modele uygu ölçek tahm le uygulaır. Yatay şert 2.5 le 2.5 arasıda stadartlaştırılmış rezdüler etrafıı çevryor. Böyle Şekl de olduğu gb sapa göze çarpmıyor. EKK gösterge grafğde stadartlaştırılmış EKK rezdüler şerd çe tamame düştüğü ç ver kümes sapa çermedğ soucua varılır. Fakat Şekl 2 ye bakarsak e küçük medya kareler ( LMS ) le lşkl ola gösterge grafğ y ˆ 0,74x 0,357x2 0,000x3 34,5, 82

Ç.Ü Fe Blmler Esttüsü Yıl:2008 Clt:7-5 Tablo Yığı Kaybı Vers (Stackloss Data) İdeks Ora Sıcaklık Ast Kosatrasyou Yığı Kaybı ( ) ( x ) ( x 2 ) ( x 3 ) ( y) 80 27 89 42 2 80 27 88 37 3 75 25 90 37 4 62 24 87 28 5 62 22 87 8 6 62 23 87 8 7 62 24 93 9 8 62 24 93 20 9 58 23 87 5 0 58 8 80 4 58 8 89 4 2 58 7 88 3 3 58 8 82 4 58 9 93 2 5 50 8 89 8 6 50 8 86 7 7 50 9 72 8 8 50 9 79 8 9 50 20 80 9 20 56 20 82 5 2 70 20 9 5 Kayak: Browlee (965) 83

Ç.Ü Fe Blmler Esttüsü Yıl:2008 Clt:7-5 Şekl. Yığı kaybı vers: EKK ye göre deks grafğ Şekl 2. Yığı kaybı vers: LMS e göre deks grafğ Bu grafk robust modele dayaır ve gerçekte zararlı oktaları varlığıı ortaya çıkarır. Bu gösterge grafğde, 3, 4 ve 2. gözlemler e uzakta olduğu 84

Ç.Ü Fe Blmler Esttüsü Yıl:2008 Clt:7-5 ve 2. gözlem sapaları olduğu bölge sıırıda olduğu ç arada olduğu heme açık br bçmde görülür. Bu durum robust regresyo tekğmz bu very tek br hamlede asıl aalz edebldğ gösteryor. Bular ayı ver kümes lk aalzlerde zahmetl ve uzu ola bazılarıyla kıyaslaır. Bu örek sadece EKK rezdülere bakılmasıdak tehlkey br kere daha gösteryor. Her regresyo aalzde EKK ve robust yötem her ks stadartlaştırılmış rezdüler kıyaslamaı gerekl olduğuu söyleyeblrz. Eğer k yötemde souçları heme heme ayı se o zama EKK güvelr olablr. Eğer farklı se robust yötem sapaları ortaya çıkarmak ç uygu br araç olarak kullaılablr. Burada o zama sapalar tamame araştırılablr ve belk düzeltleblr ya da sleblr. Souçlar LMS, LTS, L,S, M ve GM tahm edcler taımladı, EKK ve brbrleryle kıyasladı ve e y kırılma oktasıa S tahm edcs ulaştığı ortaya çıktı. LMS tahm edcs dğerlere kıyasla daha kolay hesaplaablmesde dolayı daha kullaışlı olduğu ortaya çıktı. Bu çalışmada hareketle buda sora verlerle br şleme başlamada öce sapa değerler bulmak amacıyla robust tahm edclerde herhag br kullaılması öerleblr. Kayaklar BROWNLEE, K.A., 965. Statstcal Theory ad Methodology Scece ad Egeerg, 2d ed., Joh Wley & Sos, New York. EDGEWORTH, F.Y.,887. O observatos relatg to several quattes, Hermathea, 6, 278-285. HAMPEL, F.R., 974. The fluece curve ad ts role robus estmato, J. Am. Stat. Assoc., 69, 383-393. HUBER, P.J., 973. Robust Regresso: Asymptotcs, Cojectures Ad Mote Carlo, A. Stat.,, 799-82. MALLOWS, C.L., 975. O Some Topcs Robustess, Upublshed Memoradum, Bell Telephoe Laboratores, Murray Hll, NJ. ROUSSEEUW, P.J., 983. Multvarate Estmato Wth Hgh Breakdow Pot, paper preseted at Fourth Paoa Symposum o Mathematcal Statstcs ad Probablty, Bad Tatzmadorf, Austra, September 4-9, 983. Abstract IMS Bull., 983, 2, p.234. Appeared (985), Mathematcal Statstcs ad Applcatos, Vol. B., edted by W. Grossma, G. Pflug, I. Veze, ve W. Wertz, Redel, Dordrecht, The etherlads, pp. 283-297. ROUSSEEUW, P.J., 984. Least Meda of Squares Regresso, J. Am. Stat. Assoc., 78, 87-880. ROUSSEEUW, P.J. ad LEROY, A.M., 987. Robust Regresso ad Outler Detecto, Joh Wley & Sos SIEGEL, A.F., 982. Robust regresso usg repeated medas, Bometrca, 69, 242-244. 85