REGRESYON ANALİZİ BÖLÜM 5-6

Benzer belgeler
ÇOKLU REGRESYON MODELİ, ANOVA TABLOSU, MATRİSLERLE REGRESYON ÇÖZÜMLEMESİ,REGRES-YON KATSAYILARININ YORUMU

Korelasyon ve Regresyon

Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ

Kİ-KARE TESTLERİ. şeklinde karesi alındığında, Z i. değerlerinin dağılımı ki-kare dağılımına dönüşür.

HAFTA 13. kadın profesörlerin ortalama maaşı E( Y D 1) erkek profesörlerin ortalama maaşı. Kestirim denklemi D : t :

Kİ KARE ANALİZİ. Doç. Dr. Mehmet AKSARAYLI Ki-Kare Analizleri

PARÇALI DOĞRUSAL REGRESYON

Merkezi Eğilim (Yer) Ölçüleri

X, R, p, np, c, u ve diğer kontrol diyagramları istatistiksel kalite kontrol diyagramlarının

BÖLÜM 1 1.GİRİŞ: İSTATİSTİKSEL DOĞRUSAL MODELLER

BÖLÜM 5 İKİ VEYA DAHA YÜKSEK BOYUTLU RASGELE DEĞİŞKENLER İki Boyutlu Rasgele Değişkenler

Doğrusal Korelasyon ve Regresyon

Asimetri ve Basıklık Ölçüleri Ortalamalara dayanan (Pearson) Kartillere dayanan (Bowley) Momentlere dayanan asimetri ve basıklık ölçüleri

Sıklık Tabloları ve Tek Değişkenli Grafikler

REGRESYON ANALİZİ BÖLÜM 1-2

Farklı Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = σ i2. Eşit Varyans. Hata. Zaman

UYUM ĐYĐLĐĞĐ TESTĐ. 2 -n olup. nin dağılımı χ dir ve sd = (k-1-p) dir. Burada k = sınıf sayısı, p = tahmin edilen parametre sayısıdır.

Sürekli Olasılık Dağılım (Birikimli- Kümülatif)Fonksiyonu. Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK

kadar ( i. kaynağın gölge fiyatı kadar) olmalıdır.

dir. Bir başka deyişle bir olayın olasılığı, uygun sonuçların sayısının örnek uzaydaki tüm sonuçların sayısına oranıdır.

REGRESYONDA ETKİLİ GÖZLEMLERİ BELİRLEME YÖNTEMLERİ VE KARŞILAŞTIRMALARI. Can DARICA YÜKSEK LİSANS TEZİ İSTATİSTİK

5.3. Tekne Yüzeylerinin Matematiksel Temsili

Sorunun varlığı durumunda hata terimi varyans-kovaryans matrisi Var, Cov(u) = E(uu') = σ 2 I n şeklinde yazılamıyor fakat

Bölüm 3. Tanımlayıcı İstatistikler

PARAMETRİK OLMAYAN HİPOTEZ TESTLERİ Kİ-KARE TESTLERİ

Tek Yönlü Varyans Analizi (ANOVA)

VEKTÖRLER VE VEKTÖREL IŞLEMLER

A İSTATİSTİK. 4. X kesikli rasgele (random) değişkenin moment çıkaran. C) 4 9 Buna göre, X in beklenen değeri kaçtır?

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

Sansürlenmiş ve Kesikli Regresyon Modelleri

YER ÖLÇÜLERİ. Yer ölçüleri, verilerin merkezini veya yığılma noktasını belirleyen istatistiklerdir.

Bölüm 3. Tanımlayıcı İstatistikler

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ

SEK Yönteminin Güvenilirliği Sayısal Bir Örnek. Ekonometri 1 Konu 11 Sürüm 2,0 (Ekim 2011)

DENEY 4: SERİ VE PARALEL DEVRELER,VOLTAJ VE AKIM BÖLÜCÜ KURALLARI, KIRCHOFF KANUNLARI

İki veri setinin yapısının karşılaştırılması

BÖLÜM EN KÜÇÜK KARELER REGRESYONUNDA KARŞILAŞILAN PROBLEMLER

SEK Tahmincilerinin Arzulanan Özellikleri. SEK Tahmincilerinin Arzulanan Özellikleri. Ekonometri 1 Konu 9 Sürüm 2,0 (Ekim 2011)

Sabit Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = s 2

bir yol oluşturmaktadır. Yine i 2 , de bir yol oluşturmaktadır. Şekil.DT.1. Temel terimlerin incelenmesi için örnek devre

ENDÜSTRİNİN DEĞİŞİK İŞ KOLLARINDA İHTİYAÇ DUYULAN ELEMANLARIN YÜKSEK TEKNİK EĞİTİM MEZUNLARINDAN SAĞLANMASINDAKİ BEKLENTİLERİN SINANMASI

Tek Yönlü Varyans Analizi

NİTEL TERCİH MODELLERİ

Rasgele Değişken Üretme Teknikleri

Bilgisayarla Görüye Giriş

Deney No: 2. Sıvı Seviye Kontrol Deneyi. SAKARYA ÜNİVERSİTESİ Dijital Kontrol Laboratuvar Deney Föyü Deneyin Amacı

MIT Açık Ders Malzemeleri Bu materyallerden alıntı yapmak veya Kullanım Koşulları hakkında bilgi almak için

YAŞAM ÇÖZÜMLEMESİNDE AYKIRI DEĞERLER OUTLIERS IN SURVIVAL ANALYSIS

Makine Öğrenmesi 10. hafta

Kİ-KARE VE KOLMOGOROV SMİRNOV UYGUNLUK TESTLERİNİN SİMULASYON İLE ELDE EDİLEN VERİLER ÜZERİNDE KARŞILAŞTIRILMASI

OLASILIĞA GİRİŞ. Biyoistatistik (Ders 7: Olasılık) OLASILIK, TIP ve GÜNLÜK YAŞAMDA KULLANIMI

Calculating the Index of Refraction of Air

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ÇOKLU İÇ İLİŞKİ VE EKOLOJİK REGRESYON İSTATİSTİK ANABİLİM DALI

Sistemde kullanılan baralar, klasik anlamda üç ana grupta toplanabilir :

Farklı Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = s 2 Eşit Varyans

ALGILANAN HİZMET KALİTESİ VE LOJİSTİK REGRESYON ANALİZİ İLE HİZMET TERCİHİNE ETKİSİNİN BELİRLENMESİ. Özet

Regresyon ve Korelasyon Analizi. Regresyon Analizi

2.7 Bezier eğrileri, B-spline eğrileri

T.C. SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

ELM201 ELEKTRONİK-I DERSİ LABORATUAR FÖYÜ

Deprem Tepkisinin Sayısal Metotlar ile Değerlendirilmesi (Newmark-Beta Metodu) Deprem Mühendisliğine Giriş Dersi Doç. Dr.

Tanımlayıcı İstatistikler

İKİ DEĞİŞKENLİ BASİT DOĞRUSAL REGRESYON MODELİ

( ) 3.1 Özet ve Motivasyon. v = G v v Operasyonel Amplifikatör (Op-Amp) Deneyin Amacı. deney 3

KENTSEL ALANDA ET TALEP ANALİZİ: BATI AKDENİZ BÖLGESİ ÖRNEĞİ. Dr. Ali Rıza AKTAŞ 1 Dr. Selim Adem HATIRLI 2

ALTERNATİF AKIM DEVRE YÖNTEM VE TEOREMLER İLE ÇÖZÜMÜ

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

Matris Cebiriyle Çoklu Regresyon Modeli

ÇOK DEĞİŞKENLİ OLASILIK DAĞILIMLARI

Bulanık Mantık ile Hesaplanan Geoid Yüksekliğine Nokta Yüksekliklerinin Etkisi

DOĞRUSAL HEDEF PROGRAMLAMA İLE BÜTÇELEME. Hazırlayan: Ozan Kocadağlı Danışman: Prof. Dr. Nalan Cinemre

YÖNETİM VE EKONOMİ Yıl:2006 Cilt:13 Sayı:1 Celal Bayar Üniversitesi İ.İ.B.F. MANİSA

TEMEL DEVRE KAVRAMLARI VE KANUNLARI

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

YAYILI YÜK İLE YÜKLENMİŞ YAPI KİRİŞLERİNDE GÖÇME YÜKÜ HESABI. Perihan (Karakulak) EFE

İÇME SUYU ŞEBEKELERİNİN GÜVENİLİRLİĞİ

İÇİNDEKİLER 1. GİRİŞ...

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

İSTATİSTİK DERS NOTLARI

K-Ortalamalar Yöntemi ile Yıllık Yağışların Sınıflandırılması ve Homojen Bölgelerin Belirlenmesi *

SAYISAL ANALİZ. Doç.Dr. Cüneyt BAYILMIŞ. Sayısal Analiz. Doç.Dr. Cüneyt BAYILMIŞ

YARIPARAMETRİK KISMİ DOĞRUSAL PANEL VERİ MODELLERİYLE ULUSLAR ARASI GÖÇ

1. KEYNESÇİ PARA TALEBİ TEORİSİ

uzayında vektörler olarak iç çarpımlarına eşittir. Bu iç çarpım simetrik ve hem w I T s formuna karşılık gelir. Buna p u v u v v v

3. Parçaları Arasında Aralık Bulunan Çok Parçalı Basınç Çubukları

FARKLI VERİ YAPILARINDA KULLANILABİLECEK REGRESYON YÖNTEMLERİ

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

Standart Model (SM) Lagrange Yoğunluğu. u, d, c, s, t, b. e,, Şimdilik nötrinoları kütlesiz Kabul edeceğiz. Kuark çiftlerini gösterelim.

4.5. SOĞUTMA KULELERİNİN BOYUTLANDIRILMASI İÇİN BİR ANALIZ

PARAMETRİK OLMAYAN HİPOTEZ TESTLERİ. χ 2 Kİ- KARE TESTLERİ. Doç.Dr. Ali Kemal ŞEHİRLİOĞLU Araş.Gör. Efe SARIBAY

EKONOMETRİYE GİRİŞ II ÖDEV 4 ÇÖZÜM

KIRMIZI, TAVUK VE BEYAZ ET TALEBİNİN TAM TALEP SİSTEMİ YAKLAŞIMIYLA ANALİZİ

HİSSE SENETLERİNİN BEKLENEN GETİRİ VE RİSKLERİNİN TAHMİNİNDE ALTERNATİF MODELLER

BAŞKENT ÜNİVERSİTESİ MAKİNE MÜHENDİSLİĞİ BÖLÜMÜ MAK MAKİNE MÜHENDİSLİĞİ LABORATUVARI DENEY - 8

Muhasebe ve Finansman Dergisi

Açık Poligon Dizisinde Koordinat Hesabı

ANOVA. CRD (Completely Randomized Design)

TEKNOLOJĐK ARAŞTIRMALAR

BÖLÜM II D. YENİ YIĞMA BİNALARIN TASARIM, DEĞERLENDİRME VE GÜÇLENDİRME ÖRNEKLERİ ÖRNEK 20 İKİ KATLI YIĞMA KONUT BİNASININ TASARIMI

Transkript:

REGRESYON ANALİZİ BÖLÜM 5-6 Yayın Tarh: 03-11-2007 Revzyon No:0 1 5. E.K.K. REGRESYONUNDA KARŞILAŞILAN PROBLEMLER VE BAZI KONU BAŞLIKLARI 2 1

EN KÜÇÜK KARELERDE KARŞILAŞILAN PROBLEMLER EKK da karşılaşılan problemler: o normallk, o sabt varyans o hataların bağımsızlığı o etkl gözlemler,sapan gözlemler, o modeln fonksyonel bçmnn zayıf belrlenmes, o bağımsız değşkenler arasındak çoklu doğrusal bağlantı o bağımsız değşkenlerdek hatalardır. 3 ROBUST REGRESYON Varsayımlar gerçekleşmedğnde en küçük kareler regresyonuna alternatf olarak robust regresyon yöntemler kullanılablr. Robust regresyon,parametrk modeln varsayımlarının gerçekleşmemes durumunda tahmnlern duyarlılığını azaltmak çn tasarlanmış statksel prosedürlern genel br sınıfıdır. Br robust regresyon prosedürü,büyük artıkların ağırlıklarının azaltılması le, bu tp hataların etksn azaltır. Bu artıkların etks, artık kareler toplam yerne mutlak artıkların toplamının mnmze edlmes le azaltılablr. Genel anlamda, sapan ve etkl gözlemlern tespt edlmes çn kullanılan prosedürler, robust regresyonun br parçası olarak ele alınablr. 4 2

NORMALLİK VARSAYIMI Hataların normal dağılış göstermes, regresyon parametrelernn tahmnlenmes ve toplam varyasyonun parçalanması çn gerekl değldr. Normallk varsayımı, yalnızca parametrelern güven aralıklarının kurulmasında ve anlamlılık testlernde gerekmektedr. 5 NORMALLİK VARSAYIMININ KONTROLÜ Normallk varsayımının kontrolünde, o artıkların plotları, o çarpıklık katsayısı ve o basıklık katsayısı, yardımcı olurlar. Örnek hacm yeternce büyük olduğunda, artıkların o frekans dağılışı, smetr ve basıklık çn karar vermede kullanılablr. Normallğn sağlanması durumunda br doğru veren, o br tam normal veya yarı normal plotun kullanımı se daha kolaydır. 6 3

TAM VE YARI NORMAL PLOT Bu plotlar, verlerden elde edlen, sıralanmış artıklar le standart normal dağılıştan elde edlen sıralanmış gözlemlern beklenen değerlern karşılaştırır. Tam-normal plot, artıkları olduğu gb, yarınormal plot se artıkların mutlak değerlern kullanır. 7 NORMALLİK VARSAYIMININ SAĞLANMASINDA KULLANILAN YÖNTEMLER Bağımlı değşkenn başka br forma transformasyonu, normallk varsayımının sağlanması çn sıkça uygulanan br yöntemdr. İstatstk teorsne göre, orjnal bağımlı değşkenn dağılışı blndğnde bu tp br transformasyon yapılablr. Örnek verler, normallğn sağlanması çn uygun olan transformasyonun bulunması le gerekl blgy sağlar. Artık plotları, uygun transformasyon le lgl fkr vereblr. Ayrıca brden çok sayıda transformasyon denerek normallk varsayımını en y sağlayan br tanes seçleblr. 8 4

VARYANS HETEROJENLİĞİ Sabt varyans varsayımı, bağımlı değşkendek her gözlemn, eşt mktarda blgy çerdğ anlamına gelmektedr. Dğer br fadeyle, sıradan en küçük karelerdek (SEKK) tüm gözlemler eşt ağırlıktadır. Dğer taraftan, varyans heterojenlğnn varlığı durumunda, bazı gözlemler dğerlernden daha fazla blgy çermektedr. SEKK tahmnleyclernn mnmum varyans özellğ bu varsayım le doğrudan bağımlıdır. 9 VARYANS HETEROJENLİĞİ Gözlemler SEKK le eşt ağırlıklandırıldığında, eğer varyanslar eşt değlse, parametre tahmnler mnmum varyans özellğn taşımazlar. SEKK de heterojen varyanslar, doğrudan tahmnlern hassasyet kaybına neden olmaktadır. Bu hassasyet kaybı ancak, heterojen varyanslar dkkate alınarak elde edlen tahmnlern hassasyetler le dkkate alınmadan elde edlen tahmnlern hassasyetler karşılaştırılarak görüleblr. Normal olmama durumunda olduğu gb, heterojen varyansın da verlerden kaynaklanması beklenr. 10 5

VARYANS HETEROJENLİĞİNİN BELİRLENMESİ Normal olmayan dağılışları veren durumlar, varyans heterojenlğne de neden olurlar. Bunun neden, normal olmayan dğer dağılışlarda varyansın, dağılış ortalaması le lşkl olmasıdır. Bununla beraber, verlern kend çndek gruplar ayrı ayrı normal dağılış gösterseler ble, bu dağılışların varyansları gruptan gruba değşklk göstereblr. Genel olarak, büyük varyanslar, büyük ortalamalara sahp gruplar le brlkte ortaya çıkmaktadır. Çeştl artık plotları, varyans heterojenlğn tespt etmek çn kullanılablr. 11 FARKLI VARYANSLILIĞIN ÖNLENMESİ Varyans heterojenlğnn önlenmes çn k ayrı yaklaşım vardır. o Bağımlı değşkenn transformasyonu ve o Ağırlıklı en küçük kareler yöntemlerdr. Bağımlı değşkenn transformasyonu yaklaşımı daha yaygındır. Buradak transformasyon, transforme edlmş ölçektek varyansı homojen yapacak şeklde seçlr. 12 6

FARKLI VARYANSLILIK VARSAYIMININ ÖNLENMESİ Bağımlı değşkenn olasılık dağılışı hakkındak br ön blg veya ortalama le varyans arasındak lşk hakkındak amprk blg, transformasyonunun şekl hakkında blg verr. Ağırlıklı en küçük kareler se, bağımlı değşkenn orjnal metrğn kullanır. Ancak, çerdğ blgnn mktarına göre her br gözlem ağırlıklandırır. 13 HATALAR ARASINDAKİ KORELASYON (OTOKORELASYON) Artıkların arasındak korelasyonun (otokorelasyon) brçok kaynağı olablr. Br zaman sersnde toplanan verlern korelasyonlu hatalara sahp olması sıkça rastlanan br durumdur. Br zaman noktasındak gözlem le ortaya çıkan hata, br öncek gözlem le ortaya çıkan hata le korelasyonlu olma eğlm göstereblr. Korelasyonlu hataların SEKK sonuçları üzerndek etks, varyans heterojenlğnn etks gb, tahmnlern hassasyetnde kayba neden olmasıdır. 14 7

OTOKORELASYONUN NEDENLERİ Verlern yapısı, bazen korelasyonlu hataların varlığının önereblr. o Zaman sırasında toplanmış herhang br ver set, korelasyonunun önemsz olduğu gösterlmedkçe zaman sers gb görülmeldr. o Br deneyn randomzasyonundak yeterszlkten veya randomzasyon planındak br hatadan kaynaklanan korelasyonlu hataların tespt edlmes se zordur. 15 OTOKORELASYONUN OLUŞTURDUĞU PROBLEMLER Eğer regresyon modelndek hatalar poztf otokorelasyona sahp se, o EKK parametre tahmnler sapmasızdır fakat mnmum varyans özellğn kaybetmştr. o MSE değer gerçek hata varyansını olduğundan küçük olarak tahmnlemektedr. o EKK le tahmnlenen s(b ) değerler gerçek değernden oldukça küçüktür. o Güven aralıkları ve t le F dağılımlarını kullanan testler artık kullanışlı değldr. 16 8

OTOKORELASYON: TANI VE ÖNLEM Deneysel çalışmalarda, aşırı derece küçük artık varyansları br fkr vereblr. Zaman sırası verlernde se, verlern toplandıkları sıraya bağlı olarak, artıkların plot edlmes otokorelasyonunun olup olmadığını belrlemek amacıyla kullanılablr. Genelleştrlmş en küçük kareler, korelasyonlu hatalara sahp verlern analz çn genel br yaklaşımdır. Bu yöntemde ağırlıklı en küçük karelerde (AEKK) olduğu gb artıkların başlangıç varyans-kovaryans matrs kullanmaktadır. Ancak artıklar arasındak kovaryanslar genellkle blnmemektedr ve verlerden tahmnlenmes gerekmektedr. Eğer korelasyon yapısı bast değlse tahmnlenmes zordur ve korelasyon matrsnn zayıf tahmnlenmes, hassasyet kaybına neden olur. 17 ETKİLİ VERİ NOKTALARI VE SAPANLAR SEKK yöntem, her br gözleme eşt ağırlık vermektedr. Fakat, her gözlem, çeştl en küçük kareler sonuçları üzernde eşt etkye sahp değldr. Örneğn, bast doğrusal regresyon problemnde eğm en çok, ortalamadan en uzakta bulunan bağımsız değşken değerlerne sahp gözlemlerden etklenmektedr. Dğer ver noktalarından uzak olan tek br nokta, regresyon sonuçları üzernde, hemen hemen tüm dğer noktaların toplamı kadar br etkye sahp olablr. 18 9

TANIMLAR Bu tp gözlemler etkl gözlemler olarak adlandırılır. Sapan term, ver setndek kalan gözlemlerle karşılaştırıldığında tutarsız olan gözlem çn kullanılır. Br gözlem, bağımlı değşken veya br ya da daha fazla sayıdak bağımsız değşkenn, beklenen lmtler dışında değerler alması nedenyle sapan gözlem olablr. Potansyel etkl gözlem term, br ya da daha fazla sayıdak bağımsız değşkendek sapan gözlem çn kullanılır. 19 SAPAN GÖZLEM Sapan term, bağımlı değşken değerler çersnde, dğer gözlemler le karşılaştırıldığında tutarsız olan gözlem çn kullanılır. Artıklardak sapan term se, gözlenen artığın, beklenen varyasyonundan daha büyük olduğu ver noktası çn kullanılır. Burada Sapan term bağımlı değşken veya artığın değerne karşılık gelecek şeklde kullanılmıştır. 20 10

SAPAN GÖZLEM Br ver noktası, çalışmanın yürütülmesndek hatalardan veya ver noktasının başka br populasyondan gelmesnden dolayı sapan ya da potansyel etkl nokta olablr. Kullanılan model sürec yeterl derecede temsl etmyorsa, aslında doğru olan br nokta, sapan artığa sahp br sapan olarak görüleblr. Dğer taraftan, gerçek br sapan, potansyel etkl nokta se sapan artığa sahp olmayablr. 21 ETKİLİ GÖZLEM Etkl ver noktaları regresyon doğrusunu zorlama eğlmndedrler ve bu yüzden küçük artılara sahptrler. Etkl noktaların ve sapanların tespt edlmes gerekmektedr. Yalnızca brkaç gözlemn etksnde olan regresyon sonuçları güvenlr olmazlar. Doğrulanması gereken lk şüphe, bu ver noktalarının doğru olup olmadığıdır. Açık br şeklde farkedleblen hatalar, eğer mümkünse düzeltlmeldr. Aks halde, ver setnden çıkarılmalıdır. 22 11

ETKİLİ GÖZLEM Açık br şeklde hata olarak tanımlanamayan veya üzernde çalışılan sstem hakkında çerdğ blg nedenyle, dkkatl br şeklde ncelenmes gereken doğru br nokta olablr. Bu noktalar üzernde çalışılan model veya tasarımdak yeterszlkler m yansıtmaktadır? Sapanlar ve etkl ver noktaları, rastgele çıkartılmamalıdır. Br sapan, çalışmadak en çok blg verc gözlem ble olablr. 23 POTANSİYEL ETKİLİ GÖZLEM: TEŞHİS YÖNTEMLERİ Potansyel olarak daha etkl olan noktalar, zdüşüm matrs H nn köşegen elemanlarının kontrol edlmesyle bulunablr. H matrsnn köşegen elemanları, örnek noktaları le X-uzayının merkez arasındak Ökld Uzaklığının ölçüsünü verr. Ancak br potansyel etkl noktanın, gerçekte etkl olup olmadığı, her br ver noktasının regresyon sonuçları üzerndek etks doğrudan ölçülerek bulunur. 24 12

SAPANLAR: TEŞHİS YÖNTEMLERİ Sapanlar, gözlenen artıkların analz le tespt edleblr. Genellkle artıkların genel br varyansa sahp olmaları çn önce standardze edlmeler tavsye edlr. Brkaç standart sapma büyüklüğünde olan br artık, dkkatlce gözden geçrlmes gereken br ver noktasına şaret etmektedr. Normallk ve varyans homojenlğ varsayımlarını sağlayıp sağlamadığını tespt etme amacı le kullanılan artıklarının plotları, sapanları tespt etmede de etkldrler. 25 MODEL YETERSİZLİKLERİ Eğer model doğru değlse se, SEEK tahmnleycler sapmalı olurlar. Öneml br bağımsız değşken modelde hmal edlmşse, artık kareler ortalaması, σ 2 nn (poztf) sapmalı br tahmn olur. Ayrıca, hmal edlen değşken, modeldek dğer değşkenlere ortogonal değlse regresyon katsayıları da sapmalı olur. Bağımsız değşkenlern yalnızca brnc kuvvetlern kullanan genel doğrusal model, Y nn her br bağımsız değşken le olan lşknn doğrusal olduğunu ve her br bağımsız değşkenn etksnn dğer değşkenlerden bağımsız olduğunu varsayar. 26 13

MODEL YETERSİZLİKLERİ Öneml olan daha yüksek-derecel polnomyal termlern (etkleşm termler de dahl olmak üzere) hmal edlmesnn etks, öneml br bağımsız değşkenn hmal edlmesnn etks le aynıdır. Gerçek lşknn doğrusal olmadığı durumlarda doğrusal br model kullanılmasındak temel düşünce, doğrusal olmayan fonksyona, stenlen br doğruluk derecesnde, uygun sayıda polnomal termler olan doğrusal br model le yaklaşılableceğdr. Böylece, doğrusal model, lglenlen sınırlı br bölgede tatmn edc br yaklaşım sağlar. Yaklaşımın yeterl olmaması durumunda, en küçük kareler sonuçları, öneml br değşkenn hmal edlmes durumunda olduğu gb sapmalı olacaktır. 27 MODEL YETERSİZLİKLERİ Süreç modellerne doğrusal modeller le yaklaşılması Cevap Yüzey Yöntem Blm le lgldr. Model yeterszlklernn tespt edlmes, o problemn yapısına ve o sstemden elde edleblen blgnn mktarına bağlıdır. Artık kareler ortalamasındak sapma ve dolayısıyla hmal edlen termn varlığı, σ 2 nn bağımsız br tahmn elde edleblyorsa tespt edleblr. Dkkate alınmayan yüksek-derecel polnomyal termler uygun artık plotları le kolayca görüleblr. Tümüyle hmal edlmş bağımsız değşkenlern tespt edlmes se daha zordur. 28 14

MODEL YETERSİZLİKLERİ Doğrusal yaklaşımlara alternatf olarak daha gerçekç olan doğrusal olmayan modeller formüle edleblr. Bazı doğrusal olmayan modeller, bağımlı değşkenn uygun br transformasyonu le doğrusallaştırılablr. Bu tp modeller aslında doğrusal modeller olarak adlandırılır. Transformasyondan sonra hatalar üzerndek varsayımlar sağlanıyorsa, doğrusallaştırılmış modele SEKK uygulanablr. 29 DOĞRUSAL BAĞLANTI PROBLEMİ X matrsnn tekllğ, X n bazı sütunlarının br doğrusal fonksyonunun kesn olarak sıfır vektörüne eşt olması durumunda çıkar. Tekllk EKK analznde (X T X) 1 var olmadığında bell olur. Daha probleml br durum se X matrs tekle yakın olduğunda, yan vektörlern doğrusal fonksyonu sıfıra yakın olduğunda ortaya çıkar. Değşken sayısının gereğnden fazla olması (aynı blgy değşk formlarda açıklamaktadır), X n tekle yakın olmasına neden olur. 30 15

YAKLAŞIK- TEKİLLİK DURUMU Yaklaşık-tekllk durumlarında normal eştlklern tek br çözümcü mevcuttur. Ancak bu çözüm oldukça kararsızdır. Böyle br durumda y veya X dek küçük değşkler (şansa bağlı gürültü), regresyon katsayılarının tahmnlernde büyük değşmelere neden olablr. Ayrıca regresyon katsayılarının varyansları oldukça büyük olurlar. X n yaklaşık-tekl olmasından kaynaklanan problemlere yaklaşık doğrusal bağlantı problem olarak adlandırılır. 31 ÇOKLU DOĞRUSAL BAĞLANTININ BELİRTİLERİ VE TESBİT EDİLMESİ Doğrusal bağlantının varlığını gösteren puçları: o regresyon katsayıları çn mantıksız değerler, o büyük standart hatalar, o model mantıklı br uyum sağladığı halde anlamsız olan kısm regresyon katsayıları ve o regresyon sonuçlarında önemsz görülen ancak öneml olduğu blnen değşkenler. Doğrusal bağlantının tespt edlmes doğrudan, o X n tekl değer ayrışımı veya o X T X n özdeğer-özvektör analz le sağlanablr. 32 16

ÇOKLU DOĞRUSAL BAĞLANTI PROBLEMİNİN ÇÖZÜMÜ Doğrusal bağlantı problemnn çözümü, modeln kurulmasındak amaca bağlıdır. Eğer amaç kestrm se, örnek X-uzayında doğrusal bağlantı cdd br problem yaratmaz. Eğer amaç regresyon katsayılarının tahmnlenmes se, parametrelernn tahmnler, parametre değernden büyük farklılıklar göstereblr; hatta yanlış şarete ble sahp olablr. 33 ÇOKLU DOĞRUSAL BAĞLANTI PROBLEMİNİN ÇÖZÜMÜ Sapmalı regresyon yöntemlernden brs kullanılablr. Daha y br çözüm se, eğer mümkünse, yen veya ek verlern elde edlmes ve böylece örnek X-uzayının yaklaşıktekllğ ortadan kaldırmak çn genşletlmesdr. Söz konusu amaç br sstemdek öneml değşkenler tanımak veya sstem modellemek se, kuvvetl doğrusal bağlantının olması durumunda regresyon sonuçları fazla yardımcı olmazlar ve yanıltıcı olablrler. o Burada, değşkenlern korelasyon yapısını anlamak ve bağımlı değşkenn bu yapıya nasıl uyumunun yapılacağını araştırmak daha verml olur. o Ana bleşenler analz ve ana bleşenler regresyonu bu yapıyı anlamada yardımcı olurlar. 34 17

BAĞIMSIZ DEĞİŞKENLERDEKİ ÖLÇÜM HATALARI Ölçüm hassasyetne bağlı olarak, ısı basınç, kşnn yaşı gb bağımsız değşkenler ölçülerken hata yapılablr. * (5.1) δ = X X Bast regresyon model çn, (5.2) Y = β + β X + ε 0 1 * Sadece X gözlendğ çn * (5.3) Y = β + β ( X ) δ + ε 0 1 * Y = + β + ε β δ (5.4) ( ) β X 0 1 1 35 BAĞIMSIZ DEĞİŞKENLERDEKİ ÖLÇÜM HATALARI * Bu model bağımsız değşken X ve hata term ε β δ olan br regresyon model 1 olarak görülse de değldr. Bağımsız değşken şans değşken olup hata term le lşkldr. X n rassal değşken olduğu modeller çn de rassal bağımsız değşken hata termnden bağımsız olmalıdır. 36 18

BAĞIMSIZ DEĞİŞKENLERDEKİ ÖLÇÜM HATALARI Model belrlemek çn aşağıdak varsayımlar yapılablr. (5.5a) E( δ ) = 0 (5.5b) E( ε ) = 0 (5.5c) E( δ ε ) = 0 Bunun sonucu olarak, * E ( X ) = E( X δ ) = X Kovaryans se, (5.6) σ ( X * ; 2 ) ( ) ε β1δ = β1σ δ İspat 40 Eğer X ve Y arasında br regresyon lşks varsa bu kovaryans sıfır olamaz. 37 ÖLÇÜM HATALARININ SONUÇLARI VE ÖNLEMLER Eğer model (5.4) e EKK uygulanırsa b parametre tahmnler sapmalı olacaktır ve kararlılık özellğn kaybedeceklerdr. Sapmasız tahmnleycler elde etmek çn yaklaşımlar: o δ nın dağılımı ve δ le ε arasındak kovaryans üzerne güçlü varsayımlar yapılır. o X n gerçek değer le lşks blnen fakat ölçüm hatasına sahp olmayan değşkenler ( alet nstrumental) kullanmak. Alet değşkenlern kullanılması regresyon parametrelernn tutarlı tahmnlernn elde edlmesne mkan sağlar. 38 19

X İN ÖLÇÜM HATASINA SAHİP OLDUĞU DURUM İLE X İN ŞANS DEĞİŞKENİ OLDUĞU DURUM ARASINDAKİ FARK: X şans değşken se analzcnn kontrolü dışındadır ve deneyden deneye şansa bağlı olarak değşr. Bu durumda X ölçüm hatasına sahp değlse kesn olarak (verlen br deneme çn) ölçümlenr. Bazı araştırmalarda se X belrl değerlerde sabtlenr. Örneğn ısı ve basınç gb. Fakat bu değşkenler stenen hassasyette sabtlemek mümkün olmadığından X ölçüm hatalı olarak adlandırılır. 39 PARAMETRELERİN ORTAK GÜVEN ARALIKLARI Parametre vektörünün dağılımının, T 1 2 b ~ N ( β, ( X X) σ ) varsayımı altında Tüm parametreler çn %100(1-α) güven sevyesnde br ortak güven aralığı, T T 2 (5.7)( β b) X X( β b) ps F( p, n p, 1 α ) Denklem p boyutlu uzayda elptk br eğrnn konturunu tanımlar. Bu yaklaşım sadece p değernn küçük (2,3,4) olduğu durumlar çn faydalıdır. 40 20

PARAMETRELERİN ORTAK GÜVEN ARALIKLARI Şekl 5.1 k parametrel mümkün br durum örneğdr. Parametreler β 1 ve β 2 çn %95 güven bölges nce uzun elps le gösterlmştr. Elps çndek (β 1, β 2 ) değerler parametrelern ortak olarak alablecekler değerlerdr. Bu yaklaşım b 1 ve b 2 tahmnler arasındak korelasyonu dkkate alır. 41 Şekl 4.1 42 21

PARAMETRELERİN ORTAK GÜVEN ARALIKLARI Parametreler β 1 ve β 2 çn breysel ayrı ayrı %95 güven aralıkları keskl kare le belrtlmş olup eş anlı yorumlanması yanlıştır. Örneğn E noktası (β 1, β 2 ) uygun değerlere sahptr. Bununla brlkte ortak güven bölges böyle br noktanın uygun olmadığını belrtmektedr. Parametre sayısı kden fazla olduğunda yorumlamak zordur. 43 PARAMETRELERİN ORTAK GÜVEN ARALIKLARI Böyle durumlarda elptk bölgenn ana eksenlernn uç noktalarının koordnatlarını bulmak br çözüm olablr. Başarmak çn güven konturu bulunmalı ve kanonk yapıya ndrgenmeldr. Bu amaçla kullanılablecek yöntemler; ana bleşenler regresyonu ve latent kök regresyonudur. Eğer model, E( Y Y ) = β ( X X ) ( ) 1 1 1 + L+ β k X k X k şeklnde yazılırsa β 0 parametresn çermeyen ortak güven bölges elde edlr. 44 22

ORTAK GÜVEN BÖLGELERİ İÇİN DİKKAT EDİLMESİ GEREKEN KONULAR Parametre tahmnlernn, o Varyansları V(b ) o Korelasyonları ρ j Cov( b, b ) j (5.8) ρ = j [ V ( b ) V ( b )] 1 2 j ncelenmeldr. Mümkün durumlara örnekler: o V(b ) > V(b j ) ve ρ j 0 Şekl 5.1 o V(b ) > V(b j ) ve ρ j =0 Şekl 5.2a o V(b ) = V(b j ) ve ρ j =0 Şekl 5.2b 45 Şekl 5.2 46 23

ORTAK GÜVEN BÖLGELERİ İÇİN DİKKAT EDİLMESİ GEREKEN KONULAR Parametreler β 0 ve β 1 çn breysel ayrı ayrı %95 güven aralıkları brlkte yorumlandığında eğer brbrnden bağımsız seler (0.95) 2 =0.9025 güven olasılığına sahptrler. Bununla brlkte aynı ver set kullanılarak tahmnlendğnden brbrnden bağımsız değldrler. Yorumların doğru olasılığını belrlemek amacıyla kullanılablecek br yöntem Bonferron ortak güven aralıkları yöntemdr. 47 BONFERRONİ ORTAK GÜVEN ARALIKLARI Verlern analz genellkle br dz tahmn ya da testn gerçekleştrlmesn gerektrr. Gerçekleştrlen test ya da tahmnlern bütün kümesne at doğrulukla lgl blgye gereksnm vardır. İlglenlen tahmnler (ya da testler) kümes, tahmnler (ya da test) ales olarak adlandırılır. 48 24

BONFERRONİ ORTAK GÜVEN ARALIKLARI Bonferron prosedüründe, ale güven katsayısını en az 1-α olacak şeklde düzenlemek amacıyla breysel güven katsayıları 1-α den büyük olacak şeklde düzeltlr. İk parametrel (k eşanlı güven aralığı) çn Bonferron eştszlğ: (5.9a) P ( A A ) 1 2α 1 2 k parametrel (k adet eşanlı güven aralığı) çn Bonferron eştszlğ: k (5.9b) P I A kα 1 = 1 İspat 39 49 YUVARLAMA HATALARI Br regresyon modelnde yalnızca br veya k bağımsız değşken olduğunda parametre tahmnlernn doğrudan hesaplanması genellkle hesaplamalarda fazla sorun çıkarmamaktadır. İkden fazla değşken ve fazla sayıda verlern bulunduğu problemlerde se elde edlen sonuçlar yuvarlama hataları nedenyle tamamen geçersz olablmektedr. 50 25

YUVARLAMA HATALARININ NEDENİ İk ana neden: o Regresyon hesaplamalarına dahl edlen sayılar brbrnden çok büyük farklılıklar göstereblr. Örneğn 52.793, -943 ve 6 sayılarının aynı hesaplamaya dahl edlmes gb o Ters alınacak matrs yaklaşık tekl matrs olablr. Matrsn determnantı, hesaplamalara dahl edlen dğer sayılarla kıyaslandığında oldukça küçük se yuvarlama problem büyük br olasılıkla ortaya çıkacaktır. X T X çok küçük br değer olduğunda X T X matrsne kötü şartlanmış (ll contoned) matrs denr. 51 YUVARLAMA HATALARININ ETKİSİNİ AZALTMAK İÇİN NE YAPILIR? Regresyon değşkenlernn standartlaştırılmasıyla regresyon problem korelasyonları çeren br forma dönüşür ve böylece hesaplamalara dahl edlen bütün sayılar -1 le 1 arasında değşr. Sayıların standart br forma dönüşmesyle yuvarlama hatalarının olumsuz etkler de en aza ndrlmş olur. 52 26

MERKEZLENMİŞ DEĞİŞKENLERE GÖRE MODEL Genel doğrusal model (5.10) Y = β + β X + β X + L+ β X + ε 0 1 1 2 2 k k Bu model bağımsız değşkenlern ortalamadan farklarına göre yazılarak merkezlenmş değşkenlere göre elde edlr. (5.11) Y = { β0 + β1x1+ L+ βkxk} + β1( X 1 X1) + L + βk ( Xk Xk) + ε Burada x j = X j X j merkezlenmş değşkendr ve β 0 = β0 + β1x1 + L + β k X k alınarak model, (5.12) Y β + β x + L + β x + ε = 0 1 1 k k 53 MERKEZLENMİŞ DEĞİŞKENLERE GÖRE MODEL Merkezlenmş değşkenlern ortalaması sıfırdır. 0 x j = 0 β parametresnn tahmnleycs dama bağımlı değşkenn artmetk ortalamasına eşttr. (I41.1) b 0 = Y İspat 41 Sonuç olarak (5.12) model (5.13) Y Y = β ( X X ) + L+ β ( X X ) + ε 1 1 1 k k k 54 27

MERKEZLENMİŞ MODEL İÇİN İÇ ÇARPIM MATRİSİ Bu modelde k=2 durumu çn çn X T X matrs, S S T 11 12 (5.14) X X = S = S S 21 22 Burada, n S = =1 X X X X (5.15) ( )( ) lj l l j j 55 STANDARTLAŞTIRILMIŞ DEĞİŞKENLERE GÖRE MODEL Merkezlenmş verler ölçeklenerek standartlaştırılmış değşkenler elde edlr. ( X X ) x j j j (5.16a) z = =, j = 1, K, k j 1 2 1 2 S S jj jj ( Y Y ) (5.16b) y = = 1, K, n 1 2 S Burada, n ( Y Y ) S = = 1 yy 2 yy Standartlaştırılmış değşkene göre model, 1 2 1 2 1 2 (5.17a) y S = β S z + L + β S z + ε yy 1 11 1 k kk k (5.17b) y α z + L+ α z + ε = 1 1 k k 56 28

STANDART MODEL İÇİN İÇ ÇARPIM MATRİSİ Standart modelde k=2 durumu çn çn X T X matrs, 1 r T 12 (5.18) X X = R = r 1 21 Burada, S12 (5.19a) r = 1 2 = r 12 21 ( S S ) 11 22 İspat 42 Bağımlı değşkenle bağımsız değşken arasındak korelasyon, S jy (5.19b) r = jy S S 1 Burada, ( ) 2 jj (5.20) ( n X X )( Y Y ) S = jy = 1 yy j j 57 STANDARTLAŞTIRILMIŞ DEĞİŞKENLERE GÖRE MODEL Burada yen modeln parametreler ve tahmnleycler, (5.21a) 1 β S j jj α = j 1 2 S yy (5.21b) 1 2 b S j jj a = j 1 2 S Orjnal parametre cnsnden, (5.22a) 1 2 α S j yy β = j 1 2 S jj (5.22b) 1 2 a S j yy b = j 1 2 S jj İspat 43 yy 2 58 29

6. ARTIKLARIN ANALİZİ VE REGRESYON TANILARI 59 REGRESYON TANILARI NEDİR? Regresyon tanıları, genel olarak regresyon analznde ortaya çıkan problemler belrlemek çn kullanılan teknkler fade eder. Problemlern neden, o Model ya da o Ver set kaynaklı olablr. 60 30

REGRESYON TANI YÖNTEMLERİ İncelenecek regresyon tanıları, o Grafksel yöntemler: varsayımlardak tutarsızlıkları, sapan gözlemler model yeterszlklern belrlemek çn. o Tanı statstkler: Sapan gözlemler Yüksek etk noktalarını Etkl gözlemler Çoklu doğrusal bağlantıyı belrlemek çn. 61 TEMEL KAVRAMLAR Sapan (outlers) gözlem, etkl (nfluental) gözlem ve yüksek etk (hgh-leverage) noktaları brbryle ç çe grmş ve çok yakın lşks olan üç kavramdır. 62 31

SAPAN GÖZLEM Sapan term, br ver setnde; dğer gözlemlern yanında bazı özellkler açısından tutarsız olan gözlem anlamına gelr. Tahmnlenen regresyon doğrusuna uyum göstermekte başarısız olan gözlemler sapan gözlem olarak değerlendrleblrler. Br gözlem, beklenen sınırların dışındak değerlere sahp bağımlı değşkenden ya da bağımsız değşken(ler)den dolayı sapan gözlem olablr. 63 SAPAN GÖZLEM Sapan term, ger kalan örnek verlernn yanında tutarsız olan bağımlı değşken değer çn kullanılmaktadır. Artıklardak sapan fades se gözlenen artıklar çnde beklenen kabul edleblr değşkenlkten daha büyük değere sahp ver noktaları çn kullanılır. Genelde sapan bağımlı değşkenn ya da artığın değer olarak kullanılmaktadır. 64 32

SAPAN GÖZLEM İÇİN TEŞHİS YÖNTEMLERİ Sapanlar, gözlenen artıkların analz le keşfedleblr. Tanı İstatstkler; sapan gözlem, ver setndek dğer gözlemlerle karşılaştırıldığında büyük değerde studendze artığa sahp gözlem olarak tanımlanablr. Grafksel Analz; Normal dağılım ve varyans heterojenlğ durumlarını keşfetmek çn plot edlen artıklar da sapanların tanımlanmasında etkl olurlar. 65 YÜKSEK ETKİ NOKTALARI Dğer ver noktalarından uzak olan br nokta, regresyon sonuçları üzernde hemen hemen dğer tüm noktalar kadar etkye sahp olablr. Bu tür gözlemlere yüksek etk (levarage) noktaları denr. EKK sonuçları üzernde br ver noktasının olası etks, dğer noktalara göre X- uzayındak, pozsyonu le hesaplanır. Genellkle br ver noktası, X-uzayındak ver noktalarının merkeznden uzaklaştıkça, regresyon sonuçlarını etkleme olasılığı da aynı oranda artar. 66 33

YÜKSEK ETKİ NOKTALARI VE TEŞHİSİ Br yüksek etk noktası, ver setndek dğer gözlemlerle karşılaştırıldığında büyük br h değerne sahp gözlem olarak tanımlanablr. Etk kavramı tamamen bağımsız değşkenler le lgl olup, bağımlı değşkenlerle br lgs yoktur. H matrsnn köşegen elemanları, örnek noktaları le örnek X-uzayının merkez arasındak ökld uzaklığının ölçüsüdür. 67 EKK nın GİZLİ VARSAYIMI Sıradan EKK yöntem hesaplamalarda her gözleme eşt ağırlık vermektedr. Bununla beraber, her gözlem çeştl EKK sonuçlarında eşt etkye sahp değldr. Örneğn, bast doğrusal regresyon modelndek eğm, bağımsız değşkenn ortalamadan en uzaktak değerlernden etklenr. NEDEN? 68 34

ETKİLİ GÖZLEMLER Etkl gözlemler, ver setndek dğer gözlemlerle karşılaştırıldığında, breysel olarak ya da brlkte uyumu yapılan regresyon denklemn aşırı ölçüde etkleyen gözlemlerdr. Bu tanım göreceldr, araştırmacı tanı statstklern kullanarak gözlemler etk derecelerne göre sıralayablr. 69 ETKİ TİPLERİ Br gözlem tüm regresyon sonuçları üzernde aynı etkye sahp olmayablr. Bu gözlem regresyon sonuçlarından hangsn (veya hanglern) etklemektedr? Br gözlem, o tahmnlenmş regresyon katsayıları b, o tahmnlenmş b varyansları, o ŷ kestrlmş değerler ve/veya o uyum ylğ statstkler üzernde etkl olablr. Analzn lk amacı hang tp etknn dkkate alınacağı sorusuna cevap aramaktır. 70 35

ÜÇ KAVRAM ARASINDAKİ İLİŞKİ o Sapan br gözlem, etkl gözlem olmayablr, o Etkl br gözlem, sapan gözlem olmayablr, o Büyük artık değerne sahp gözlemlern arzu edlmeyen br durum olması küçük br artığa karşılık gelen gözlemlern deal gözlem olduğu anlamına gelmemeldr. Neden1? o Sapan gözlemlerde olduğu gb yüksek etk noktaları da etkl gözlem olmayablr. o Buna karşın etkl gözlemlern de yüksek etk noktası olması gerekl değldr. o Bununla brlkte yüksek etk noktaları potansyel etkl gözlemler olarak değerlendrleblrler. 71 SAPANLARIN VE ETKİLİ NOKTALARIN KAYNAĞI Br çalışmada, o verler toplanırken yapılan hatalardan veya o ver noktalarının değşk anakütlelerden gelmesnden dolayı br ver noktası sapan ya da potansyel etkl nokta olablr. Modeln sürec yeternce açıklayamadığı durumlarda, doğru br nokta sapan gb görüneblr. Bu nokta çn sapan artığına (outler resdual) sahptr denr. 72 36

NE YAPILMALI? Açık br şeklde tanımlanablen hatalar mümkünse düzeltlmeldr. Mümkün değlse ver setnden çıkarılmalıdır. Hatalı oldukları açık olarak tanımlanamayan ya da doğru oldukları belrlenen ver noktalarının, dkkatl br şeklde ncelenmeler gerekldr. 73 NE YAPILMAMALI? Modeln ya da tasarımın yeterszlklern ortaya koyablrler. Sapan ve etkl gözlemlern fark gözetmekszn analzden atılması büyük br hata olacaktır. Bu özellğe sahp verler belk de araştırmada en fazla blg taşıyan gözlemlerdr. 74 37

NEDEN ARTIKLAR ANALİZ EDİLİR? Regresyon analznde problem, ε nun gözlemlenemedğ gb aynı zamanda tahmnlenememesnden kaynaklanmaktadır. Hatalar modeldek β vektörü blnmedğ çn gözlemlenemezler. Bununla brlkte e artığı, br anlamda şans hatası ε u ölçmektedr. 75 REGRESYON ANALİZİNDE HATALAR VE ARTIKLAR Hatalar; o Sıfır ortalamalı, o Sabt varyanslı, o Brbrnden bağımsız o Normal dağılış ε N(0;Iσ 2 ) gösterr. Artıklar; o Sıfır ortalamalı, o Farklı varyanslı, o Brbr le lşkl o Normal dağılış e N[0;(I-H)σ 2 ] gösterr. 76 38

ARTIK VE HATALAR ARASINDAKİ FARKLAR ε vektörünün elemanları brbrnden bağımsız ve aynı eşt varyansa sahp olsa ble, o H matrs köşegen matrs olmadıkça artıklar brbrnden bağımsız değldr, o H matrsnn köşegen elemanları brbrne eşt olmadıkça artıklar eşt varyanslı değldr. Not: H matrs ve elemanlarının özellkler çn Ref. Tanım 40 ve 41 Not: Artıklardak farklı varyanslılık, her br artığın standardze edlmes le düzeltleblr. 77 ARTIKLAR ARASINDAKİ KOVARYANSLAR Eştlkler, (I21.3) ve (I21.4) den, o V(ŷ )=σ 2 h ve o V(e )=σ 2 (1- h ) olarak elde edleblr. Not: Yorumlar çn Ref. Tanım 42 σ 2 sabt br tarafa bırakılırsa, h değer, V(ŷ ) ve V(e ) y hesaplamaktadır. 78 39

ARTIKLAR ARASINDAKİ KOVARYANSLAR Eştlk (I21.4) den e ve e j arasındak kovaryans, Cov (e, e j )= -σ 2 h j olup, e ve e j arasındak korelasyon katsayısı Cor(e,e j )=ρ j = olarak bulunablr. 1 h h j 1 h Eştlkten görüldüğü gb e ve e j arasındak korelasyon tamamen H nn elemanları tarafından hesaplanmaktadır. jj 79 HATA YERİNE ARTIĞIN KULLANILABİLMESİ İÇİN GEREKLİ KOŞULLAR Eştlk (3.13b) ε yerne e nn kullanılableceğ göstermektedr. Fakat bunun uygun br yaklaşım olablmes çn; o H matrsnn elemanları bazı özellklere sahp olmalıdır, o Uyumu yapılan model doğru olmalıdır. 80 40

NOTLAR Bu k durum gerçekte brbrnden bağımsız değldr. Modeln yanlış belrlenmesnn H matrs üzernde etk oluşturacağı unutulmamalıdır. 81 HATA YERİNE ARTIĞIN KULLANILABİLMESİ İÇİN GEREKLİ KOŞULLAR ε yerne e nn uygun br şeklde kullanılablmes çn; o X matrsnn sıralarının homojen olması, bu durumda H matrsnn köşegen elemanları yaklaşık olarak eşttr, ve o H matrsnn köşegen dışı elemanlarının yeternce küçük olması gerekldr. 82 41

AMAÇ NEDİR? Artıkların analznde amaç e değerlernn ncelenerek ε le lgl varsayımlarda ortaya çıkan eksklklern yorumlanmasıdır. Bazı problemlerde, modeln yanlış kurulması, ε değerler le e değerler arasında uygun br lşk kurulablmesn engeller. Bu gb durumlarda artıklarda gözlemlenen bazı belrtler, modeln uygun olmadığının ve/veya varsayımların gerçekleşmedğnn belrts olablr. 83 ARTIK ANALİZ TİPLERİ Artıklar üzerne yapılan nceleme k genel kısımda toplanablr; o Tek br sapan gözlemn test çn oluşturulan artık testler (statstkler), o Artıklar üzerne oluşturulan grafksel tanı yöntemler. Özellkle H matrsne olan bağımlılık neden le, tanı amacıyla kullanılacak artıkların dönüştürülmüş tplernn kullanılması terch edlmektedr. Artıkların dönüşümünde amaç, ölçek parametresnden bağımsız br dağılıma sahp artıkların elde edlmesdr. 84 42

ALTERNATİF YÖNTEM Alternatf olarak, artıklar seçlmş br kovaryans yapısına sahp olacak şeklde dönüştürüleblrler. Bu durumda n-p elemanlı ve elemanları lşksz olan br artık vektörünün elde edlmes le lglenlr. 85 DÖNÜŞTÜRÜLMÜŞ ARTIK İSTATİSTİKLERİ Sıradan artıklar, her br artığın varyansı hem σ hem de h değerlernn br fonksyonu olduğu çn ölçeğ bağımlı br dağılıma sahptrler. Bu değerlere bağımlı olmayan br artık tpnn regresyon tanısı olarak kullanılması daha faydalıdır. Bu amaçla e yerne: e f ( e, σ ) = (6.1) σ tanı statstğ kullanılablr. Tanım 37 86 43

DÖNÜŞTÜRÜLMÜŞ ARTIK İSTATİSTİKLERİ Burada σ, -nc artığın standart sapmasıdır. Dğer br deyşle σ 2 (e) matrsnn -nc köşegen elemanının kare köküdür. Eştlk (6.1) n dört özel durumu mevcuttur: o normalze artık, o standardze artık, o çsel studendze artık, Tanım 38 o dışsal studendze artık. Tanım 39 87 NORMALİZE ARTIK Eştlk (6.1) de σ yerne (e T e) 1/2 konularak, e a = =1,2,...,n (6.2a) e T e Elde edlecek olan a artık vektörü brm vektöre dönüşmektedr. max a statstğ maksmum normlanmış artık olarak adlandırılır. 88 44

STANDARDİZE ARTIK Eştlk (6.1) de σ yerne, T e e s = n p konularak, e b = (6.2b) s elde edlr. 89 İÇSEL STUDENDİZE ARTIK Eştlk (6.1) de σ yerne, σ = s 1 h (6.2c) olarak alınırsa, -nc çsel studendze artık, e r = (6.2d) s 1 h olarak tanımlanmıştır. Artık varyanslarının öneml ölçüde değşm gösterdğ durumlar çn, e /s yerne r statstğnn kullanılması önerlmştr. 90 45

DIŞSAL STUDENDİZE ARTIK Eştlk (6.1) de σ yerne, σ = s ( ) 1 h (6.2e) alınarak, T e y x β * ( ) r = = (6.2f) s 1 h s 1 h ( ) ( ) özdeşlğ le verlr. T Burada y x β ( ) uyumunda y değer kullanılmamıştır. * r statstğ jackknfe artık olarak adlandırılmıştır. 91 DIŞSAL STUDENDİZE ARTIK * r değerler brbrnden bağımsız değldr. Bu fadedek, T y ( )( I H ( )) y 2 ( s ) ( ) = (6.3) n p 1 -nc gözlem hmal edldğnde elde edlen artığın ortalama karesel hatasının tahmndr ve T 1 T H ( ) = X( )( X( ) X( )) X ( ) (6.4) matrs -nc gözlemn slndğ X () matrs çn zdüşüm matrsdr. 92 46

DÖRT İSTATİSTİK ARASINDAKİ İLİŞKİ Bu amaçla s ( ) fadesn s ye göre yazmak gerekldr: 2 2 2 n p r s = s ( ) (6.5) n p 1 Bu eştlk kullanılarak, b = a n p (6.6a) r = b 1 h = a n p 1 h (6.6b) r * a n p 1 = (6.6c) (1 h ) a 2. n p 1 * = r = 2 1 2 (6.6d) 2 n p r n p r r eştlkler elde edlr, r n p 1 93 DÖRT İSTATİSTİKTEN HANGİSİ KULLANILIR? Dört statstğn hepsnde de artıkların brbrnden bağımsız dağılış göstermedğ görülmektedr. Büyük örnek hacmler söz konusu olduğunda, pek çok problem çn bu olumsuz özellk hmal edleblr. Tanı amacı le ele alındıklarında normalze artıkların ve standardze artıklar e nn varyansını ortaya çıkarmazlar. Bu nedenle model yeterszlğnn ve sapan gözlemlern araştırılmasında terch edlen statstkler r ya da r * dır. 94 47

NİÇİN r YA DA r *? Ver setnde sapan gözlemn bulunmadığı durumlarda, s 2 2 ve s ( ) nn her ks de σ 2 nn sapmasız tahmnn sağlar. Buna karşın ver setnde br sapan gözlem bulunması durumunda, örneğn j-nc gözlem, 2 s ( j ) hala sapmasızdır ve r * j merkez olmayan br t-dağılımına sahptr. Kalan r * ve tüm r statstkler σ 2 nn sapmalı tahmnleycs olacaklardır. 95 NİÇİN r YA DA r *? Bu nedenle dışsal studendze artığın kullanılması ver setnde tek br sapan gözlemn bulunduğu durumlarda daha uygun sonuçlar verr. H matrsnn köşegen elemanlarının (dolayısı le e nn varyansının) değşken br yapıya sahp oldukları durumlarda r nn kullanılması tavsye edlr. 96 48

DIŞSAL STUDENDİZE ARTIĞIN AVANTAJLARI r *, (n-p-1) serbestlk derecel t-dağılımı gösterdğ çn artıkların aşırı değere sahp olup olmadıklarının değerlendrlmesnde uygun br krterdr, çünkü tabloları mevcuttur. Eştlk (6.6d) den görüldüğü gb r * statstğ r nn monotonk fakat doğrusal olmayan br transformasyonudur ve r 2 (n-p) ken r *2 olduğundan, r * büyük sapmaları r statstğne göre daha y yansıtmaktadır. s () tahmn, -nc gözlemdek toplam hata problemne karşı duyarsızdır. r * statstğ eşt varyansa sahptr. 97 TEK BİR SAPAN İÇİN TEST YÖNTEMLERİ Gözlenmş artıkların davranışlarının tam testler mevcut değldr. Yaklaşık olarak ya da görecel değerlendrmeler kullanılmak zorundadır. Standardze ya da studendze artıkların br sapan gözlemn kontrolü amacı le kullanılması br çoklu test prosedürüdür. Çünkü bu test prosedürü anlamlılık sevyelern bulmak çn brnc Bonferron eştszlğ üzerne oluşturulmaktadır. 98 49

TEK BİR SAPAN İÇİN TEST YÖNTEMLERİ Test edlecek artık, n örnek hacm çndek en büyük artık olablecektr ve α olasılığı çn uygun değerler belrlenmeldr. α olasılığına göre brnc dereceden Bonferron sınırı çn α=α*/n olmak üzere t-krtk değernn kullanılması önerlmektedr. Burada α* stenlen kapsamlı anlamlılık sevyesdr. Sapan gözlemlern belrlenmes çn Bonferron anlamlılık sevyeler artıklar arasındak korelasyonun aşırı derecede büyük olmadığı durumlar çn uygun br güvenceye sahptr. 99 TEST YÖNTEMLERİNİN GENEL YAPISI Konu le lgl brkaç prosedür mevcuttur. Bu prosedürler genellkle, ver setnde tek br sapan gözlem bulunduğu varsayımına dayanmaktadırlar. Bu prosedürlern genel yapısı, o T(x,, y ) statstkler çn, Pr{T(x,, y )>C α / en fazla br sapan mevcut} α şeklndek C α değernn bulunması, o Eğer T(x, y )> C α se -nc gözlemn sapan olarak belrlenmes, adımlarından oluşur. Br sapan gözlem çn aday durum blnmedğnde test genellkle maksmum r ya da r * değer üzerne oluşturulur. 100 50

TIETJEN, MOORE VE BECKMAN PROSEDÜRÜ Bast regresyon modeln ncelemşler, bu model çn, T(x, y )=R n = max r r max (6.7a) eştlğn önermşlerdr. Bast regresyon çn krtk değerler smulasyon le elde edlmştr. Büyük br R n değer ver setnde sapan br gözlemn varlığını belrtr. 101 TIETJEN, MOORE VE BECKMAN PROSEDÜRÜ R n statstğnn bleşenler, e /s(1-h ) 1/2, ncelendğnde paydanın da sıfır olableceğ durumlar olduğu görülmektedr. Nasıl 1? Dğer br deyşle paydanın sıfır olduğu durumlarda e dama sıfır değern almaktadır. Bu nedenle e =0 olduğunda R n =0 olarak tanımlanmıştır. 102 51

PRESCOTT (1975) PROSEDÜRÜ Genel doğrusal model çn; e R * = max n s statstğn önerlmştr. 2 Burada s, artıkların tahmnlenmş ortalama varyansıdır. Artıkların ortalama varyansı (n-p)σ 2 /n şeklndedr. 2 Bu durumda, s =(n-p)s 2 /n olduğu görüleblr. Sonuç olarak, * 1/2 Rn = n max a (6.7b) statstğ kullanılablr. İspat 36 103 PRESCOTT (1975) PROSEDÜRÜ a = max a çn 100(1-α) lık yüzde noktasının üst sınırı; U=[n(n-p)aF/(n(n-p-1+F))] 1/2 şeklnde tanımlamıştır. Not: Burada F, serbestlk dereces 1 ve (n-p-1) olan F dağılımı çn %(1-α) noktasındak değer tanımlamaktadır. Eştlk (6.7a) ve (6.7b) çn yaklaşık krtk değerler, ( n p) F (6.7c) n p 1+ F şeklndedr. Not: Krtk değerler, her br p değer, n örnek hacm ve α olasılık değerler çn Tablo 6.1 de verlmştr. 104 52

BONFERRONİ TESTİ Her br dışsal studentzed artık, (n-p-1) serbestlk derecel t-dağılışı gösterr. Bonferron krtk değer; t(1 α / 2 n; n p 1) olarak tanımlanmıştır. Ref. Örnek 6.2 105 GRAFİKSEL TANI YÖNTEMLERİ Artıkların oluşturdukları şekllern düzen, büyüklüklernden çok daha fazla blg taşır. Araştırma çn gerekl blgnn elde edleblmes çn genellkle brden fazla farklı plotun analznn gerekl olableceğ unutulmamalıdır. 106 53

ARTIK PLOTLARI TİPLERİ o Artıkların frekans dağılımı; hstogramlar, nokta grafkler vb. o Artıkların normal ya da yarı normal plotları. o Uyumu yapılmış değerlere karşı artık plotları. o Bağımsız değşkene karşı artık plotları. o Eklenmş değşken plotları. o Kısm regresyon etk plotları. o Kısm artık plotları. o Zamana karşı artık plotları. o Artıkların br geckmel plotu 107 ARTIKLARIN FREKANS DAĞILIMI Artıkların bast br frekans dağılımı, çarpıklık, brden fazla mod, basıklık vb. gb normallk varsayımını geçersz kılablecek durumların ortaya çıkarılmasında oldukça faydalıdır. Bununla brlkte normallk varsayımının kontrolü çn bu tp plotların kullanımında sonuçların güvenlr olablmes çn örnek hacmnn büyük olması gerekldr. Gözlem sayısının az olması durumunda nokta grafkler kullanılablr. Ref. Örnek 6.3 108 54

NORMAL PLOTLARI OLASILIK Uygun örnek hacm çn normal sıra (order) statstklerne karşı sıralanmış artıkların plotudur. Normal sıra statstkler, ortalaması sıfır varyansı br olan normal dağılımdan gelen dzne sokulmuş gözlemlern beklenen değerdr. Gözlenmş ve küçükten büyüğe düzenlenmş artıkların normal sıra statstklerne karşı plot edlmes normal plotları verr. Artıklar normal dağılımdan alınan br örneğ temsl edyorsa normal plotun beklenen sonucu, orjnden geçen ve eğm artıkların standart sapmasına bağlı olan düz br doğru şeklnde olmasıdır, (bkz. Şekl 6.1). 109 Artıklar Şekl 6.1 30 25 20 15 10 5-5 -10-15 -20-25 -30-3,0-1,8-0,6 0,6 1,8 Normal Sıra İstatstğ 110 55

NORMAL PLOTLARI OLASILIK Örnek sıra statstklernn örnekleme değşkenlğne bağlı olarak düz doğrudan rassal bazı sapmalar olablecektr. Br normal plotta beklenen düz doğrudan ayrılışlar normal dağılımdan faklılığı belrtr. Br çarpık dağılım, normal plotun br eğr şeklnde oluşmasına neden olur. Bu eğrnn yönü çarpıklığın yönüne bağlıdır. S-şeklndek br eğr, eğrnn yönüne bağlı kalın veya nce kuyruklu br dağılımı belrtr, (bkz. Şekl 6.2). 111 Artıklar Şekl 6.2 6,000 5,000 3,000 2,000 1,000 0-2,000-3,000-4,000-5,000-6,000-3 -2-1 0 1 2 3 Normal Sıra İstatstğ 112 56

NORMAL PLOTLARI OLASILIK Kalın kuyruklu dağılımlar, normal dağılıma göre daha fazla ekstrem gözlemlere sahptr. İnce kuyruklu dağılımlar se daha az ekstrem gözlem çerr. Bu arada dkkat edlmes gereken br konu da, modelde mevcut bazı kusurlarında normal dağılıştan farklılık etksne benzer durumlar gösterebleceğdr. Örneğn, farklı varyanslılık veya sapan artıklar nce kuyruklu br dağılım görüntüsü vereblr. Örneklemedek değşkenlk nedenyle, normal dağılımdan farklılık büyük olmadıkça, küçük örnekler çn normal olasılık plotları fazla blglendrc olmayablr. 113 UYUMU YAPILMIŞ DEĞERLERE KARŞI ARTIK PLOTLARI Artıkların uyumu yapılmış değerlere ya da X matrsnn elemanlarına karşı oluşturulan plotu, o r çn yaklaşık ortogonal, o e çn se tam ortogonaldr. varsayımlar doğru se r=0 doğrusunun çevresnde dağılan artıkların yaklaşık olarak r=±2 sınırlarının çnde olması beklenr, (Şekl 6.3). 114 57

Şekl 6.3 2 1 r 0 35 40 45 50 55 60-1 -2 115 FARKLI VARYANS DURUMU ŷ değerlerne göre gderek genşleyen br yapı göstermes farklı varyanslılığın belrtsdr, (Şekl 6.4). Bağımlı değşkenn varyansı ortalamasının br fonksyonu σ 2 =f(μ) se bu tp durumlarla karşılaşılması beklenr. Ayrıca hatalar ekleneblr değlse, örneğn çarpımsal se, Şekl 6.4 de gösterlen durumla karşılaşılablr. 116 58

Şekl 6.4 2 1 0 35 40 45 50 55 60-1 -2 117 ASİMETRİNİN BELİRTİLERİ Artıkların dağılımındak herhang br asmetr modelde ya da temel varsayımlarda br problem olduğunu belrtr. Örneğn, negatf artıkların değer olarak küçük fakat sayıca fazla, poztf artıkların değer olarak büyük fakat sayıca daha az olması, smetrk br dağılış göstermes gereken artıkların poztf yönde çarpık dağılım gösterdklernn göstergesdr. Çarpık dağılımın bu tp br plot le teşhs edlmes, artıkların normal plotu ya da hstogramına göre daha basttr. 118 59

MODEL YETERSİZLİĞİ-I ŷ nn bazı bölgelernde negatf dğer bölgelernde se poztf artıkların fazla olması o verlerdek sstematk br hatayı ya da o modelde öneml br değşkenn hmal edldğn ya da o mevcut değşkenlerden brsnn karesel formunun modele lave edlmes gerektğn belrtr, (Şekl 6.5). Artıkların büyük br çoğunluğunun çnde bulunduğu bandın dışında bulunan artık (veya artıklar) sapan gözlem olarak ntelendrlr. 119 Şekl 6.5 2 1 0-1 r 35 40 45 50 55 60-2 120 60

MODEL YETERSİZLİĞİ-II Artıklar yükselen veya aşağıya nen br düz bant şeklnde görüntü çzeblrler, (Şekl 6.6). Bu tp durumlarla genellkle sabt termn modelde bulunmaması (unutulması) halnde karşılaşılır. 121 Şekl 6.6 2 1 r 0-1 35 40 45 50 55 60 Y -2 122 61

BAĞIMSIZ DEĞİŞKENE KARŞI ARTIK PLOTU Çok değşkenl regresyonda, p-boyutlu br uzayı (bağımsız değşken uzayı) k boyutlu br plot le temsl etmek, yatay eksenn seçmnde problem oluşturmaktadır. İlk aşamada p-boyutlu uzaydak br vektör seçlr ve ver noktaları bu tek vektör üzerne zdüşümlenr. x 1 e karşı r nn plotunda, x 2 hmal edlerek x 1 n aynı değerler aynı abss değerne sahptr. Buna karşın r nn ŷ ye karşı oluşturulan plotunda aynı abss değer sadece aynı kestrm değerl durumlar çn geçerldr. 123 BAĞIMSIZ DEĞİŞKENE KARŞI ARTIK PLOTU Bağımsız değşkene karşı plotlar, sadece lgl bağımsız değşken açısından modelde br yeterszlk bulunup bulunmadığını ortaya koyablrler. x 1 çn oluşturulan br plot x 2 1 termnn lave edlmes gerektğn ya da V(ε )= x 1 σ 2 şeklnde br farklı varyanslılığı tanımlayablr. Bu plotlar x 1 ve x 2 arasındak etkleşm etklern belrleme yeteneğne sahp değldr. 124 62

BAĞIMSIZ DEĞİŞKENE KARŞI ARTIK PLOTU Artıkların br bağımsız değşkene karşı oluşturulan plotları, ŷ değerlerne karşı oluşturulan plotlara benzer şeklde yorumlanır. Sıfır çevresnde gderek büyüyen br dağılım farklı varyanslılığı belrtr. Bu tp plotların kullanılmasıyla bağımsız değşkenn yüksek dereceden polnomlarının modele dahl edlp edlmemes gerekllğ ortaya çıkacaktır. 125 BAĞIMSIZ DEĞİŞKENE KARŞI ARTIK PLOTU Bağımsız değşkenn yüksek derecel termnn modelde oluşturduğu olumsuzluğun, modeldek dğer bağımsız değşkenlern dağılımı ve etkler nedenyle anlaşılması güç olablecektr. Modelde brden fazla bağımsız değşenn bulunması durumunda kısm regresyon etk plotlarının kullanılması daha uygundur. Yüksek etk noktaları ve özellkle k veya daha fazla bağımsız değşkenn kombnasyonlarının oluşturduğu etkl gözlemlern tek değşkenl plotlarla belrlenmes oldukça güçtür. 126 63

ARTIKLARIN ZAMANA KARŞI PLOTLARI Zaman sırası dkkatle alınarak belrl peryotlarda alınan gözlemler genelde otokorelasyonlu artıklara sahp olablrler. Bu tür gözlemlern artıkları öncek artıkların polnomları olarak fade edleblr. Otokorelasyon, artıkların brbrn takp edecek şeklde sıfır etrafında sstematk yapı oluşturmasıdır. Otokorelasyonun belrlenmes çn en çok kullanılan yöntemlerden br şaret (run) testdr. 127 ARTIKLARIN ZAMANA KARŞI PLOTLARI İÇİN TESTLER Test brbrn takp eden poztf ve negatf artıklardak dzn sayısını dkkate almaktadır. Daha sonra bu dzn sayısı, artıkların brbrnden bağımsız olduğu sıfır hpotez altında ortaya çıkması beklenen dzn sayısı le karşılaştırılır. Ref. Örnek 6.4 Daha az dzn sayısı poztf otokorelasyondan ler geleblrken artıklardak çok sayıdak dzn sayısı negatf otokorelasyonun br gösterges olablr. 128 64

ARTIKLARIN ZAMANA KARŞI PLOTLARI İÇİN TESTLER Eğer n 1 ve n 2 gözlem sayıları 10 dan fazla se dzn dağılımı çn normal dağılışa yaklaşım kullanılablr. o Dağılım ortalaması, 2nn 1 2 μ = (6.8a) n + n 1 2 o varyansı, 2 σ = 2nn 1 2( 2nn 1 2 n1 n2) 2 ( n + n ) ( n + n 1) 1 2 1 2 (6.8b) o standart normal sapması, ( u μ + 12) z = (6.8c) σ Not: Eştlk (6.8c) dek (1/2) değer sürekllk çn düzeltme faktörü olarak kullanılmaktadır. 129 ARTIKLARIN BİR GECİKMELİ PLOTU Zaman sers verlerndek otokorelasyon, her br artığın kendnden br öncek artığa karşı plotu oluşturarak daha açık br şeklde ortaya çıkarılablr. Verlerdek br poztf otokorelasyon, Şekl 6.7 de olduğu gb poztf eğml br noktalar set oluşturur. 130 65

Şekl 6.7 + e 0 0 + e -1-131 ARTIKLARIN BİR GECİKMELİ PLOTU İÇİN TEST Artıklarda mevcut olan otokrelasyon Durbn- Watson test le de belrleneblr. Durbn-Watson test statstğ, d n ( e ) 2 2 e = 1 = n 2 e = 1 (6.9) Durbn-Watson test kullanılırken anlamlı br sonuç elde edlmes çn verlern zamana göre düzenlenmes (eğer zaman sers vers değlse) gerekldr. 132 66

YÜKSEK ETKİ NOKTALARI Sadece artıkların ncelenmes yüksek etk noktalarının belrlenmes çn yeterl olmayablr. Neden 2? Bu kısımda br noktanın etksnn ölçümü le lgl dört krter ncelenecektr. o İz düşüm matrsnn -nc köşegen elemanı. o Mahalanobs uzaklığı o Ağırlıklı karesel standardze uzaklık (WSSD). o Genşletlmş H xy matrsnn -nc elemanı. 133 YÜKSEK ETKİ NOKTALARI Ayrıca yüksek etk değerler le artıklar L-R plotu adı verlen br tek grafksel göstermde brlkte ele alınacaklardır. Bu plot yüksek etk noktaları le sapan gözlemlern ayrıştırılmasına olanak verr. 134 67

İZ DÜŞÜM MATRİSİNİN KÖŞEGEN ELEMANLARI İzdüşüm matrsnn elemanları eştlk (6.10a) köşegen elemanları eştlk (6.10b) le tanımlanmıştır. T T = x X X x (6.10a) ( ) 1 T ( ) 1 h T h j j = x X X x (6.10b) Bu değerler, artıkların büyüklüğü, aralarındak varyans, kovaryans yapıları ve uyumu yapılmış değerlern belrlenmesnde öneml rol oynarlar. * Bu nedenle hem r hem de h değerlernn brlkte ncelenmes önerlmektedr, o sapanların belrlenmes çn r *, o yüksek etk noktalarının belrlenmes çn h. 135 h İÇİN KRİTİK DEĞERLER-I Ortaya çıkan soru hang h değernn büyük olarak kabul edleceğdr. h çn genel kullanıma sahp üç krtk değer tanımlanmıştır. o Huber (1981), h >0.2 (6.11a) noktalarının yüksek etk noktası olarak sınıflanmasını önermştr. Not:Kestrlmş değerlern beş ya da daha az eşdeğer gözlem tarafından belrlendğ gözlemler çn özel br dkkatn gösterlmes zorunludur. 136 68

h İÇİN KRİTİK DEĞERLER-II o Hoagln ve Welsch (1978), 2 p h > (6.11b) n noktalarını yüksek etk noktaları olarak tanımlamıştır. 137 h İÇİN KRİTİK DEĞERLER-III o Model sabt br term çeryorsa ve X matrsnn sıraları brbrnden bağımsız olarak N p-1 (μ,σ) şeklnde dağılıyorsa, Chatterjee ve Had, (1988). n p h ( 1 n) F(p-1, n-p) p 1 1 h olup, nf ( p 1) + ( n p) h (6.11c) nf p 1 + n n p ( ) ( ) ( ) noktaları yüksek etk noktasıdır. Not:Burada F serbestlk dereceler (p-1, n- p) olan %100(1-α) lık F dağılımının tablo değerdr. Ref. Tanım 43 138 69

KRİTİK DEĞERLER İLE İLGİLİ YORUMLAR. X matrsnn sıraları normal dağılım gösterseler dah eştlk (6.11c) le tanımlanan krtk değer pek fazla kullanıma sahp değldr. Yukarıda h çn tanımlanan üç krter mekank olarak kullanılmamalıdır. H matrsnn tüm köşegen elemanlarının brbr le karşılaştırılması tavsye edlr. Böyle br karşılaştırmanın en y yolu h değerlernn ndeks plotu, ağaç yaprak ve/veya kutu plotları şeklndek grafksel göstermdr. Ref. Örnek 6.4 ve 6.5 139 MAHALANOBİS UZAKLIĞI Aşağıdak statstk M 2 =(o -ō)c -1 (o -ō) T (6.12a) -nc durumun karesel Mahalanobs uzaklığı olarak adlandırılır. Ref. Tanım 44 SAS ve SPSS gb paket programlar bu statstğ hesaplamaktadırlar. M 2 değerler belrl br anlamlılık sevyesnde p-2 serbestlk derecel χ 2 dağılımı tablo değerler le karşılaştırılablr. Karesel Mahalanobs uzaklığının, z düşüm matrsnn köşegen elemanları le lşks, M 2 =(n-1)[h -(1/n)] (6.12b) olarak tanımlanmıştır. 140 70

AĞIRLIKLI KARESEL STANDARDİZE UZAKLIK Danel ve Wood (1980) ağırlıklı karesel standardze uzaklığın, p 2 c j= 1 j WSSD =, = 1, K, n (6.13a) 2 sy kullanılmasını önermşlerdr. Ref. Tanım 45 Burada, n ( ) 2 2 y j 1 j y = sy = (6.13b) n 1 141 AĞIRLIKLI KARESEL STANDARDİZE UZAKLIK WSSD, j-nc değşken çn tahmnlenmş regresyon katsayısının büyüklüğünü, bu değşkenn görecel önemn belrten br ağırlık olarak kullanarak, j-nc değşkenn ortalamasından x j, x j değerlernn karesel uzaklığının toplamını veren br ölçümdür. Eğer -nc gözlem en az br değşkene göre extrem durumu tanımlıyorsa (k onun tahmnlenmş katsayısı büyüktür) WSSD değer büyük olacaktır. Ref. Örnek 6.5 ve 6.6 142 71

GENİŞLETİLMİŞ İZ DÜŞÜM MATRİSİNİN KÖŞEGEN ELEMANLARI Br tanı ölçümü olarak tek başına h değernn kullanılmasının dezavantajı y vektöründe çerlen blgy hmal etmesdr. Bu eksklğ gdermek amacıyla X matrs y vektörüyle genşletlsn Z=(X:y). Z matrs hem X hem de y dek blgy çerdğ çn ona at olan zdüşüm matrsnn H z köşegen elemanlarının h z kullanımı daha uygun olablr. 143 GENİŞLETİLMİŞ İZ DÜŞÜM MATRİSİNİN KÖŞEGEN ELEMANLARI Eştlk (I37.1) den, h z =z T (Z T Z) -1 z =h +(e 2 /e T e) (6.14) yazılablr. Ref. İspat 37 h ya da e 2 (ya da her ksnn) büyük olması durumunda h z büyük olacaktır. Fakat h z, X-uzayındak yüksek etk noktaları le Z-uzayındak sapan gözlemler brbrnden ayıramayacaktır. Ref. Örnek 6.5 ve 6.6 144 72

L-R PLOTU Yüksek etk noktaları le sapan gözlemler brbrnden ayıran etkn br plot, L-R plot olarak adlandırılır. Bu plot etkl değerler ve artıkları tek br plot olarak brleştrr. Bu yöntemde z düşüm matrsnn köşegen 2 elemanları karesel normalze artıklara a karşı plot edlr. L-R plot aşağıdak şartları sağlamak zorundadır: o 0 h 1 o 0 a 2 1 o h + a 2 1 Ref. Örnek 6.5 ve 6.6 145 YORUMLAR Buraya kadar yapılan açıklamalardan ve uygulamalardan görüldüğü gb ne sapan gözlemn ne de yüksek etk noktalarının etkl gözlem olmaları gerekl değldr. Etkl gözlemlern belrlenmes çn lave prosedürlere htyaç vardır. 146 73