YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Benzer belgeler
14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Ch. 4: Çok Değişkenli Regresyon Analizi: Çıkarsama

Çok Değişkenli Regresyon Analizi: Çıkarsama. OLS Tahmincilerinin Örnekleme Dağılımları (Sampling Distributions) Distributions)

OLS Yönteminin Asimptotik (Büyük Örneklem) Özellikleri SIRADAN EN KÜÇÜK KARELER (OLS) Asimptotik Özellikler: Tutarlılık. Asimptotik Özellikler

SIRADAN EN KÜÇÜK KARELER (OLS)

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Ch. 5: SEKK (OLS) nin Asimptotik Özellikleri

Ekonometri I VARSAYIMLARI

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Appendix C: İstatistiksel Çıkarsama

Ch. 12: Zaman Serisi Regresyonlarında Ardışık Bağıntı (Serial Correlation) ve Değişen Varyans

Matris Cebiriyle Çoklu Regresyon Modeli

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Appendix B: Olasılık ve Dağılım Teorisi

KONULAR. 14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

17 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

H 0 : θ = θ 0 Bu sıfır hipotezi şunu ifade eder: Anakütle parametresi θ belirli bir θ 0

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

Değişen Varyans (Heteroscedasticity) Sabit Varyans (Homoscedasticity) Varsayımı Altında Basit Regresyon Modeli

Örneklem Dağılımları & Hipotez Testleri Örneklem Dağılımı

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

İki Değişkenli Bağlanım Çıkarsama Sorunu

ARALIK TAHMİNİ (INTERVAL ESTIMATION):

4.2 Sayfa 159. Uygulama II Sayfa Sayfa 161

Ch. 3: Çok Değişkenli Regresyon Analizi: Tahmin

İçindekiler. Ön Söz... xiii

MODEL KURMA HATALARI ve VERİ SORUNLARI

A. Regresyon Katsayılarında Yapısal Kırılma Testleri

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

İstatistik ve Olasılık

Model Spesifikasyonu ve Veri Sorunları. MODEL KURMA HATALARI ve VERİ SORUNLARI

Çok Değişkenli Regresyon Analizi (Multiple Regression Analysis) Çoklu Regresyon Modeli Örnekler. Sınav başarı notu ve aile geliri

Ch. 1: Giriş, Temel Tanımlar ve Kavramlar

BASİT REGRESYON MODELİ

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

Bir Normal Dağılım Ortalaması İçin Testler

TOBB Ekonomi ve Teknoloji Üniversitesi İKT351 Ekonometri I, Dönem Sonu Sınavı

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

İstatistiksel Kavramların Gözden Geçirilmesi

TABLO I: Bağımlı değişken; Tüketim,- bağımsız değişkenler; gelir ve fiyat olmak üzere değişkenlere ait veriler verilmiştir.

GÜVEN ARALIKLARI ve İSTATİSTİKSEL ANLAMLILIK. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

ortalama ve ˆ ˆ, j 0,1,..., k

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

Kazanımlar. Z puanları yerine T istatistiğini ne. zaman kullanacağını bilmek. t istatistiği ile hipotez test etmek

İÇİNDEKİLER 1. GİRİŞ...

Basit Regresyon Modeli BASİT REGRESYON MODELİ. Basit Regresyon Modeli. Basit Regresyon Modeli: y = β 0 + β 1 x + u

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER 8

Zaman Serisi Verileriyle Regresyon Analizi

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

4. TAHMİN SONUÇLARININ DEĞERLENDİRİLMESİ Katsayıların Yorumu

İSTATİSTİK 2. Hipotez Testi 21/03/2012 AYŞE S. ÇAĞLI.

Normal Dağılımlılık. EKK tahmincilerinin ihtimal dağılımları u i nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.

OLASILIK ve İSTATİSTİK Hipotez Testleri

ANADOLU ÜNİVERSİTESİ. ENM317 Mühendislik İstatistiği İSTATİSTİKSEL TAHMİN Prof. Dr. Nihal ERGİNEL

İÇİNDEKİLER ÖN SÖZ...

LOJİSTİK REGRESYON ANALİZİ

Dependent Variable: Y Method: Least Squares Date: 03/23/11 Time: 16:51 Sample: Included observations: 20

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU

BİYOİSTATİSTİK PARAMETRİK TESTLER

Normal Dağılımlılık. EKK tahmincilerinin ihtimal dağılımları u i nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.

Hipotez. Hipotez Testleri. Y. Doç. Dr. İbrahim Turan Nisan 2011

Regresyon. Regresyon korelasyon ile yakından ilişkilidir

BÖLÜM 12 STUDENT T DAĞILIMI

Regresyon Analizi: Ek Konular KONULAR. Ölçü Birimlerinin Tahmin Sonuçlarına Etkisi. Veri ölçeğinin (data scaling) tahminlere etkisi

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Korelasyon ve Regresyon

Nokta ve Aralık Tahmini Merkezi Limit Teoremi Örneklem Dağılımı Hipotez Testlerine Giriş

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

27 Mart Ders Kitabı: Introductory Econometrics: A Modern Approach (4th ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

İSTATİSTİK II. Hipotez Testleri 1

K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır.

YARI LOGARİTMİK MODELLERDE KUKLA DECİşKENLERİN KA TSA YıLARıNIN YORUMU

Nitel Tepki Bağlanım Modelleri

İstatistik ve Olasılık

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications*

EME Sistem Simülasyonu. Girdi Analizi Prosedürü. Olasılık Çizgesi. Dağılıma Uyumun Kontrol Edilmesi. Dağılıma İyi Uyum Testleri Ders 10

ADMIT: Öğrencinin yüksek lisans programına kabul edilip edilmediğini göstermektedir. Eğer kabul edildi ise 1, edilmedi ise 0 değerini almaktadır.

Mühendislikte İstatistiksel Yöntemler

BİRDEN ÇOK BAĞIMLI DEĞİŞKENİ OLAN MODELLER

EME 3105 SİSTEM SİMÜLASYONU. Girdi Analizi Prosedürü. Dağılıma Uyum Testleri. Dağılıma Uyumun Kontrol Edilmesi. Girdi Analizi-II Ders 9

Regresyon Analizinde Nitel Bilgi. Nitel Değişkenler: Ders Planı. Nitel Bilgi

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

Parametrik Olmayan Testler. İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi

İstatistik ve Olasılık

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Transkript:

Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. ed., 2002, Thomson Learning. Ch. 4: Çok Değişkenli Regresyon Analizi: Çıkarsama Doç. Dr. Hüseyin Taştan 1 1 Yıldız Teknik Üniversitesi, İktisat Bölümü, Yıldız Kampüsü H Blok, Oda no. 124, Beşiktaş, İstanbul. Email: tastan@yildiz.edu.tr Ch. 4: Çoklu Regresyon Analizi: Çıkarsama Bu bölümde PRF nın parametreleri için hipotez testleri oluşturacağız. anakitle hata terimleri (u) normal dağılmıştır varsayımı (Varsayım MLR.6) altında SEKK (OLS) tahmin edicilerin dağılımlarını inceleyeceğiz. Önce tek tek parametreler hakkında hipotez testleri kuracağız (Section 4.2-4.3), sonra birden çok parametreyi içeren testler yapacağız (Section 4.4). Bir gurup bağımsız değişkenin tümünün birden model dışında bırakılıp bırakılmayacağına nasıl karar vereceğimizi göreceğiz. 2 SEKK (OLS) tahmin edicilerin örnekleme dağılımları (sampling distributions) SEKK (OLS) tahmin edicilerin beklenen değer ve varyanslarını bildiğimize göre bu tahmin edicilerin kesinlik derecelerini (precision) ele almamız yararlı olacaktır. Ancak, istatistiksel çıkarım (inference) yapabilmemiz için nin ilk iki momentinden (ortalama ve varyans) başka bunların tüm örnek dağılımlarını bilmemiz gerek. Gauss-Markov varsayımları altında dahi lerin dağılımları herhangi bir biçimi alabilir. 3 Econometrics 1

VARSAYIM MLR.6: Normallik Bu varsayıma göre hata terimi ortalaması 0 varyansı σ 2 olan bir normal dağılıma uyar. Varsayım MLR.6 daha önceki varsayımlardan çok daha kuvvetli bir varsayımdır. Bu varsayımın yapılması, MLR.3 (sıfır koşullu ortalama) ve MLR.6 (sabit varyans) varsayımlarının da yapıldığı anlamına gelir. 4 devam Gauss_Markov varsayımları (MLR.1-5) + Normallik varsayımı (MLR.6) = Klasik Doğrusal Model (CLM) Varsayımları CLM varsayımları altında SEKK (OLS) tahmin edicileri sadece doğrusal tahmin ediciler arasında değil, y i ler cinsinden doğrusal olsun ya da olmasın tüm tahmin ediciler arasında en küçük varyansa sahip sapmasız (unbiased) tahmin edicilerdir (bkz. Appendix E). CLM anakitle varsayımları özet bir biçimde şöyle gösterilebilir: 5 Tek açıklayıcı değişkenli modelde sabit varyanslı normal dağılım (Figure 4.1) 6 Econometrics 2

u ların dağılımını neden normal dağılım sayabiliriz? u lar y yi etkileyen (x ler dışında) pek çok faktörün toplam etkisini yansıtır. Bu nedenle, merkezi limit teoreminden (central limit theorem, CLT) (App.C) yararlanarak u ların Normal dağıldığını söyleyebiliriz. Ancak, bu varsayımın zayıf tarafları da çoktur. Örneğin, u yu oluşturan faktörlerin anakütle dağılımları çok farklı biçimlerde olabilir. CLT in bu durumlarda hala işlediğini varsayıyoruz. Bazı durumlarda değişkenlerin dönüştürmeleri (örneğin log) kullanılarak normal dağılıma yakın dağılımlar elde edilebilir. 7 devam CLT, u ları oluşturan gözlenemez faktörlerin toplam (additive) biçiminde yer aldıklarını varsayar. Oysa, bunun garantisi yoktur. Eğer, u, bu gözlenemez faktörlerin daha komplike (karmaşık) bir fonksiyonuysa, CLT bu konuda bize yardımcı olmaz. Uygulamada u ların N dağılıp dağılmadığı ampirik bir sorundur. Örneğin, ücretlerin; eğitim, tecrübe ve kıdem e koşullu dağılımının N olup olmadığı bir ampirik sorundur. Bunun böyle olması gerektiğini söyleyen bir teorem yoktur. Ücretlerin negatif değer almaması ve asgari ücret uygulaması, ücretler için N dağılım varsayımının fazla geçerli olmadığını telkin eder. 8 devam Log dönüştürme dağılımın normale yaklaşmasına oldukça yardımcı olur.örneğin, fiyat (price) değişkeninin dağılımı normalden çok uzak iken Log (price) N dağılıma yakın olmaktadır. MLR.6 varsayımının açıkça sağlanamadığı durumlar vardır. Örneğin, sadece birkaç değer alan y ler böyledir. ankete katılanların belli bir yılda, 2004 diyelim, hapse giriş sayıları değişkeni böyledir. Çoğu gözlem için 0, bazı gözlemler için 1,2,3 gibi değerler alacak. Ch.5 de göreceğimiz gibi, büyük örnek hacimlerine sahipken hata terimlerinin N dağılmaması ciddi sorun yaratmayacaktır. 9 Econometrics 3

OLS t.e. nin Örnekleme Dağılımları Normaldir THEOREM 4.1: MLR.1-MLR.6 varsayımları altında OLS tahmin edicilerinin, x lere koşullu olarak örnekleme dağılımları normaldir: Standardize edersek: Theorem 4.1 in ispatı zor değildir. CLM varsayımları sağlanıyorsa, normal dağılmış bir rassal değişkenin doğrusal kombinasyonları da normal dağılır. 10 devam SEK t.e. şöyle yazılabiliyordu: Burada, x j nin tüm diğer açıklayıcı değişkenler üzerine regresyonundan gelen i.nci kalıntı terimi ve SSR j bu regresyonunun kalıntı kareleri toplamıydı. w j ler x lere koşullu olarak sabit kabul edilebildiğinden (sadece x lerin fonksiyonu olduklarına dikkat edin) her bir SEK t.e. u ların doğrusal bir kombinasyonudur. 11 Bir populasyon parametresine ilişkin testler: t-testi Aşağıdaki PRF nun CLM varsayımlarını sağladığını varsayalım : Bilmediğimiz anakitle parametreleri hakkında hipotezleri oluşturabilmek için şu teoreme ihtiyacımız vardır : 12 Econometrics 4

devam Teorem 4.1 de SEK t.e.nin örnekleme dağılımlarının normal olduğunu ve böylelikle yazılabileceğini göstermiştik. Ancak bu ifadenin paydasında yer alan sd(betahatj) teriminde hata terimi u nun populasyondaki gerçek varyansının karekökü σ yer almaktaydı. Bunun yerine tahmin edicisini koyarsak Ortaya çıkan rassal değişken (n-k-1) s.d. İle t-dağılımına uyar 13 devam Teorem 4.2 betalara ilişkin hipotezleri test etmemize olanak tanır. Özellikle parametrenin gerçek değerinin sıfır olduğunu söyleyen null hipotezi ile ilgileneceğiz: Boş (null, sıfır) hipotez şunu söylüyor: x 1,x 2,,x j-1, x j+1, x k nın y üzerindeki etkileri dikkate alındığında,yani, x j dışındaki x ler kontrol edildiğinde, x j nin y nin beklenen değeri üzerindeki etkisi sıfırdır. Örneğin, regresyonunda hipotezi, eğitim ve kıdemin etkisi kontrol edildikten sonra exper in saat başına ücretler üzerinde 14 etkisi olmadığını söyler. t istatistiği (t değeri) (4.4) deki testi t değerini kullanarak yapacağız: Sıfıra karşı değil de herhangi bir başka değere karşı (beta*) test yapıyorsak, formül şöyle olur: t =(betahat beta*)/ se(betahat) se(betahat) >0 olduğu için t ile betahat in işareti aynıdır. se ile t değeri ters yönlü ilişkilidir.se ne kadar yüksekse t değeri mutlak olarak o denli küçük çıkar. Beta(hat) Ho hipotezi doğru olsun olmasın tam olarak sıfır çıkmaz. İstatistiksel olarak sıfır olup olmadığı ise se(betahat) ine bağlı. 15 Econometrics 5

devam Anlamlılık düzeyi (significance level) =1.ci tip hata = Doğru bir H 0 hipotezini (yanlışlıkla) reddetme olasılığı =α (4.4)ü reddetmek için bir karar kuralı belirleyebilmek için Ho doğru iken nin örnekleme dağılımını (sampling distribution) bilmemiz gerek. Teorem 4.2 den biliyoruz ki,bu dağılım ye eşittir. Test ettiğimiz bilinmeyen kitle parametresi beta dır, yoksa örnekten bulunan ve somut bir değer almış olan betahat değildir. 16 Tek yanlı alternatiflere karşı test H 0 ı reddetmek için bir karar kuralı geliştirebilmek için geçerli bir alternatif hipotez kurmamız gerek: H 1 : β j >0, H 1 : β j <0 veya H 1 : β j 0 Bunlardan hangisini alternatif hipotez olarak alacağımıza iktisat teorisi bilgimize başvurarak karar veririz. H 1 : β j >0 almışsak,boş hipotez şeklinde teşkil edilmiş demektir. Karar kuralı: Verilen α düzeyinde ise (c, kritik değer) H 0 ı reddederiz. 17 28 serbestlik derecesinde sağ kuyruk testi için %5 düzeyinde karar kuralı 18 Econometrics 6

19 Sol kuyruk testi için karar kuralı, s.d.=18 20 Örnek Example 4.2: Student Performance and School Size GRETL, meap93.gdt ABD nin Michigan eyaletindeki 408 liseye (high school) ilişkin 1993 yılı verileri Okul büyüklüğü öğrenci sayısı ile ölçülüyor (enroll). Totcomp: average annual teacher compensation, Staff: 1000 öğrenci başına öğretmen sayısı Math10: 10 üzerinden math testi sonuçları 21 Econometrics 7

Örnek 4.2 22 Regresyonun fonksiyonel biçimini değiştirelim:level-log model 23 devam 24 Econometrics 8

H 0 :β j =0 hipotezinin iki-taraflı karşı hipotezle testi Alternatif hipotez iki taraflı olduğunda yani için karar kuralı olur. Burada c, α düzeyinde test için t(n-k-1,α/2) kritik değeridir. Eğer parametrenin işaretinin ne olacağına dair teori yeterince bilgilendirici değilse bu şekilde iki taraflı alternatif hipotez kullanılabilir. Alternatif hipotez verilere bakılmadan (regresyon tahmin edilmeden önce) formüle edilmelidir. 25 İki taraflı karşı hipotez için %5 anlamlılık düzeyinde karar kuralı, s.d.(df)=25 26 Örnek 4.3: Determinants of College GPA, (GRETL, gpa1.gdt) 27 Econometrics 9

devam 28 β j nin sıfırdan farklı değerler için testi 29 Örnek 4.4: Campus Crime and Enrollment GRETL: campus.gdt 30 Econometrics 10

31 32 Örnek 4.5: Housing Prices and Air Pollution GRETL: hprice2.gdt 33 Econometrics 11

t-testi için p-değerinin hesaplanması Farklı anlamlılık düzeyleri (%1, %5, %10 gibi) farklı 1. tip hata payları-için test yapacağımıza, hesaplanan t değeri için H 0 ı reddedebileceğimiz en düşük anlamlılık düzeyi (α*) ni belirleyebiliriz. İşte bu en düşük α düzeyine p-değeri (p-value) denir. Standart regresyon paketlerinde otomatik olarak hesaplanan p-değerleri H 0 : β j =0 boş hipotezi için hesaplanmış p değerleridir. 34 35 Terminoloji H 0 boş hipotezini %α anlamlılık düzeyinde reddedemiyorsak, H 0 ı % α anlamlılık düzeyinde reddedemiyoruz (we fail to reject H 0 at the α % level). H 0,%α düzeyinde kabul edildi (H 0 is accepted at th α % level) demeyeceğiz. Beta katsayılarının istatistiksel olarak anlamlı olup olmadıkları (statistical significance) tamamen t değerlerine bağlıdır. Oysa ekonomik yönden anlamlı olup olmadıkları (economic significance), ciddi bir büyüklüğü temsil edip etmedikleri ise betahat lerin mutlak büyüklüklerine bağlıdır. 36 Econometrics 12

Büyük standart hatalar ve küçük t değerleri Örnek hacmi (n) arttıkça betaların varyansları ve dolayısıyla da standart hataları, se(betahat), düşer.yani, beta parametrelerini çok daha kesin bir şekilde (more precisely) tahmin edebiliriz. Bu nedenle, n büyükken küçük anlamlılık düzeyleri (%1 gibi) ile test yapmak daha uygundur. n küçükken α yı %10 a kadar düşürerek test yapabiliyoruz. Büyük standart hataların diğer bir nedeni bazı x ler arasındaki yüksek çoklu-bağıntıdır (high multicollinearity). Yüksek çoklu-bağıntı durumunda daha fazla gözlem toplamak dışında yapabileceğimiz çok fazla bir şey yoktur. 37 Ekonomik ve istatistiksel anlamlılığın yorumlanmasında bazı ilkeler: Öncelikle değişkenin istatistik bakımından anlamlı olup olmadığı kontrol edilmelidir. Eğer anlamlı ise (statistically significant) katsayı tahmininin büyüklüğünden hareketle ekonomik anlamlılık tartışılabilir. Bu tartışma özenle yapılmalıdır. Özellikle ölçü birimlerine, log dönüştürmesi olup olmadığına dikkat edilmelidir. Eğer bir değişken geleneksel düzeylerde (%1, %5, %10) anlamlı olmasa bile, y üzerindeki etkisinin büyüklüğüne bakılabilir. Bu etki büyükse p-değeri hesaplanıp yorumlanabilir. Küçük t-oranlarına sahip değişkenlerin yanlış işarete sahip olmalarına sık rastlanır. Böyle durumda değişkenin etkisi anlamsız olduğundan yorumlanmaz. Katsayı tahmini ekonomik ve istatistiksel açıdan anlamlı fakat yanlış işaretli bir değişkenin yorumlanması daha zordur. Bu durumda model spesifikasyonu ve veri problemi üzerinde 38 durulması gerekebilir. 4.3 Confidence Intervals (CI) (güven aralıkları) Klasik doğrusal model (CLM) varsayımları altında anakitle parametreleri (β lar) için güven aralıkları oluşturabiliriz. Bunlar, aralık şeklinde tahminlerdir (interval estimates). Regresyondan bulunan betahat ler ise nokta şeklindeki tahminlerdir (point estimates). 39 Econometrics 13

Aşağıdaki oranın Güven Aralıkları: devam (n-k-1) s.d. İle t-dağılımına uyduğunu biliyoruz. Bunu kullanarak katsayılar için güven aralıklarını kolaylıkla hesaplayabiliriz. %95 güven aralığı: Burada c, t(n-k-1) dağılımının 97.5nci yüzdelik değeridir. Alt ve üst güven sınırları sırasıyla 40 Güven aralığının yorumu İstatistik dersinde öğrendiğimiz güven aralığı yorumunu burda da yapacağız. Olanaklı tüm örneklemleri çeksek ve örneklem için regresyon tahmin edip, ilgili populasyon katsayısı için güven aralıkları oluştursak, bu güven aralıklarının %100(1-α) kadarı doğru parametre değerini içerecektir. Örneğin 100 güven aralığından 95 inin doğru parametreyi içerdiğini söyleriz. Burada α/2=0.025 olduğuna dikkat ediniz. Pratikte elimizde sadece bir güven aralığı vardır ve biz doğru değerin bu aralık içinde olup olmadığını bilmeyiz. 41 devam Güven aralıklarını hesaplayabilmek için üç büyüklüğe ihtiyaç vardır: katsayı tahmini, katsayı tahmininin standart hatası ve kritik değer. Bir çok ekonometri programı ilk iki büyüklüğü hesaplar. c yi bulmak için serbestlik derecesine (n-k-1) ve güven düzeyine (1-α) ihtiyaç duyulur. Örneğin sd=25 ve %95 güven düzeyi ile herhangi bir anakütle parametresi için güven aralığı olur. Serbestlik derecesi arttıkça (n>120) t dağılımı yerine standart normal dağılımın yüzdelik değerleri kullanılabilir. 42 Econometrics 14

devam Rule of Thumb: n-k-1>50 ise %95 güven aralığı kısa yoldan ˆ β j ± 2 se( ˆ β ) İle bulunabilir. Aşağıdaki hipotezi test etmek istediğimizi düşünelim. j H 0 ancak ve ancak %95 güven aralığı a j yi içermiyorsa %5 anlamlılık düzeyinde H 1 lehine reddedilebilir. 43 Örnek 4.8: Hedonic Price Model for Houses Bir malın fiyatının o malın karakteristikleriyle açıklanması hedonic fiyat modelinin oluşturur. Bir evin değerini belirleyen bir çok özelliği bulunur: büyüklüğü, oda sayısı, şehir merkezine, parklara ve okullara uzaklığı, vs. Bağımlı değişken: log(prices): ev fiyatlarının doğal logaritması Açıklayıcı değişkenler: sqrft (square footage) evin büyüklüğü, footkare cinsinden 1 square foot = 0.09290304 m2, yani 100m 2 yaklaşık 1076 ftsq. bdrms: evdeki oda sayısı bthrms: banyo sayısı 44 Örnek 4.8: Hedonic Price Model for Houses GRETL: hprice1.gdt 19 gözleme dayanılarak tahmin edilen regresyon şöyledir: Standart hatalar parantez içindedir. Katsayı tahminlerinin yorumlanması: Hem price hem de sqrft logaritmik olduğundan ilgili katsayı bize esnekliği verir: Oda ve banyo sayısı sabitken evin büyüklüğü %1 artarsa fiyatlar %0.634 artar. 45 Econometrics 15

Örnek 4.8: Hedonic Price Model for Houses GRETL: hprice1.gdt sd=n-k-1=19-3-1=15 olduğundan t 15 dağılımının 97.5nci percentile i c=2.131 olur. Buradan %95 güven aralığı yani, (0.242, 1.026) olur. Hipotezi sıfır bu aralıkta yer almadığından iki taraflı karşı hipotez lehine reddedilir. Bdrms değişkeninin katsayısı beklentilerimizin (?) aksine negatif çıkmıştır. Ancak unutulmaması gereken şey, bdrms katsayısını ceteris paribus yorumladığımızdır. Evin büyüklüğü ve banyo sayısı aynıyken oda sayısını arttırmak daha küçük odalar anlamına gelir ve bu genellikle tercih edilmez. 46 Örnek 4.8: Hedonic Price Model for Houses (-0.192, 0.060) olarak bulunmuştur. Bu güven aralığı sıfırı içerdiğinden bdrms değişkeninin ev fiyatları üzerindeki etkisinin istatistik bakımından anlamsız olduğunu söyleyebiliriz. Bthrms: katsayı tahmini 0.158 olarak bulunmuştu. Yorum: banyo sayısı bir arttığında ev fiyatları yaklaşık %100(0.158)=%15.8 artacağı tahmin edilmektedir. Bu değişken için %95 güven aralığı (CI) (-0.002, 0.318) olarak bulunmuştur. Teknik açıdan sıfırı içerdiğinden anlamsız olduğu söylenebilir. P-değerini hesaplayıp yorumlamak daha doğru olur. 47 Güven aralıkları ve varsayımlar Güven aralıkları ancak temelindeki CLM varsayımları sağlanıyorsa güvenle kullanılabilir, yoksa yanlış bilgi verir. Mevcut x lerle ilişkili önemli değişkenler dışta bırakılmışsa u lar x lerle ilişkili olacak, bu da betahat lerin sapmalı olmasına (omitted variable bias) yol açacaktır. Yine, eğer heteroscadasticity varsa, örneğin, yukarıdaki örnekte, Log(price) ın varyansının x lerden birisi ile birlikte değişmesi durumu, standart error lar, sd(betahat,j) in tahmin edicisi olarak geçersiz olacaklardır. u ların Normal dağıldığı varsayımı da gereklidir. Ancak,örnek büyükse bu genellikle sorun olmaz. 48 Econometrics 16

Parametrelerin tek bir doğrusal kombinasyonuna ilişkin hipotez testleri Bu bölümde birden çok betaya ilişkin testleri nasıl yapacağımızı göreceğiz. Üniversitede okunan bir yılla yüksek okulda okunan bir yılın ücrete katkısı (getirisi) aynı mıdır? jc: junior college (yüksek okul, mesleki okul) da okunan yıl sayısı ; univ: üniversitede okunan yıl sayısı Boş hipotez : H 0 : β 1 =β 2 (β 1 -β 2 =0) Alternatif hipotez : H 1 : β 1 <β 2 (β 1 -β 2 <0) 49 devam Test birden fazla betayı (iki beta) ilgilendirdiği için t istatistiği tek beta durumundakinden farklı hesaplanacaktır; 50 devam betahat lerin kovaryanslarını veren formül doğrusal cebir kullanılarak türetilecektir (bkz. Appendix E). Ancak, burada, regresyonu yeniden düzenleyerek yi direkt olarak bulabiliriz. Bunun için yeni bir parametre tanımlayalım: Test etmek istediğimiz hipotez şöyle olur: Modeli şu şekilde yazabiliriz: 51 Econometrics 17

(4.17) deki orijinal regresyonun tahmini 52 (4.25) deki yeniden düzenlenmiş modelin tahmini 53 Çoklu Doğrusal Kısıtların Testi: F-Test Regresyondaki t istatistikleri anakitleye ait beta parametrelerinin belli bir sabit e eşit olup olmadığını test etmemize yarar. Beta ların tek bir doğrusal kombinezonunun belli bir sabite eşit olup olmadığının testini ise, yukarıdaki örnekte gördüğümüz gibi, değişkenleri dönüştürerek modeli yeniden düzenlemek suretiyle yapıyorduk. Ancak, şu ana kadar hep tek bir kısıt (restriction) la ilgili test yapıyorduk. imdi çok sayıda kısıt varken nasıl test yapacağımızı görelim. 54 Econometrics 18

Dışlama Kısıtlarının Testi (Testing Exclusion Restrictions) Regresyonda yer alan bir değişkenler grubunun birlikte y üzerinde anlamlı bir etkisinin olup olmadığını test etmek istiyoruz. Örnek olarak şu modeli düşünelim: y β + β x + β x + β x + β x + x + u = 0 1 1 2 2 3 3 4 4 β5 5 Test etmek istediğimiz hipotez şudur: Sıfır hipotezi x 3, x 4 ve x 5 değişkenlerinin birlikte y üzerinde bir etkisinin olmadığını söylemektedir. Alternatif hipotez en az birinin sıfırdan farklı olduğunu söylemektedir. 55 Kısıtlanmış (restricted) ve kısıtlanmamış (unrestricted) modeller: H 0 altında (yani H 0 doğru kabul edildiğinde) elde edilen modele kısıtlanmış model denir. Örneğimizde H 0 daki kısıtları koyarsak aşağıdaki restricted modele ulaşırız. y β + β x + x + u = 0 1 1 β2 2 Kısıtlanmamış model ise orijinal modelimizdir: y β + β x + β x + β x + β x + x + u = 0 1 1 2 2 3 3 4 4 β5 5 56 F-testi: Kısıtlanmış ve kısıtlanmamış modellerin kalıntı kareleri toplamları (SSR) kullanılarak F istatistiği tanımlanır : Burada, SSR r : kısıntlanmış modelin KKTsi, SSR ur : kısıtlanmamış modelin KKTsi q= toplam kısıt sayısı: payın serbestlik derecesi=kısıtlanmamış modelin sd inden kısıtlanmış modelin sd çıkarılarak bulunabilir. H 0 ile konan kısıt sayısına eşit olmalıdır. Paydanın serbestlik derecesi kısıtlanmamış modelin serbestlik derecesine eşittir. 57 Econometrics 19

Dışlama kısıtı için F-testi genel gösterim 58 F-testi için karar kuralı H0 doğruyken yukarıda hesapladığımız F test istatistiği payın serbestlik derecesi q paydasının serbestlik derecesi (n-k-1) olan F dağılımına uyar: Karar kuralı Burada c ilgili anlamlılık düzeyinde F dağılımının kritik değeridir. 59 F(3,60) dağılımında %5 red bölgesi 60 Econometrics 20

F testi, aralarında yüksek çoklu-bağıntı bulunan x lerin tümünün birden model dışında tutulmasının testinde başarıyla uygulanabilir. Örneğin, firmaların başarı performanslarını ölçeceğiz ve kullanabileceğimiz performans ölçütleri genellikle birbirleriyle ilişkili olacaktır. Bu durumda tek tek t testleri yararlı olmayacaktır, zira, çoklu-bağıntı yüzünden se(betahat) lar hatalıdır. F testi uygulayarak, tüm performans ölçütlerinin birden (aynı anda) model dışına çıkarılmasının SSR yi ne ölçüde yükselttiğine bakabiliriz. 61 F ve t istatistiği arasındaki ilişki Tek bir bağımsız değişkene F testi uygulamak t testi ile aynı sonucu verir. q=1 iken t 2 = F olur. 62 F Testinin R 2 formu: F test istatistiğini SSR ler yerine kısıtlanmış ve kısıtlanmamış regresyonlardan elde edilen R2 ler cinsinden de yazabiliriz. Hatırlarsak, Olarak yazılabiliyordu. F rasyosunda yerine koyarsak Elde edilir. R 2 ur: kısıtlanmamış modelin R 2 si, R 2 r: kısıtlanmış modelin R 2 si. R 2 ur> R 2 r 63 Econometrics 21

Örnek 4.9: Parents Eduction in a Birth Weight Equation Değişken tanımları: Bağımlı değişken: bwght=birt weight, libre Açıklayıcı değişkenler: cigs: annenin hamilelik süresince günde içtiği ortalama sigara sayısı, parity: bebeğin doğum sırası, faminc: ailenin yıllık geliri, motheduc: annenin eğitim düzeyi (yıl), fatheduc: babanın eğitimi düzeyi (yıl) 64 Örnek 4.9: Parents Eduction in a Birth Weight Equation GRETL bwght.gdt dosyası bu verileri içermektedir. Bu veri setinde toplam 1388 gözlem vardır. Ancak anne ve babanın eğitim düzeylerine ilişkin kayıp gözlemler yüzünden regresyonda kullanılabilecek veri sayısı daha azdır. GRETL, SAMPLE, count missing values Kayıp gözlem sayısı 196 dır. Bu durumda n=1191 GRETL, SAMPLE, drop all obs with missing values 65 66 Econometrics 22

Örnek 4.9: devam u hipotezi test etmek istiyoruz: anne ve babanın eğitim düzeylerinin yeni doğan bebeklerin ağırlıkları üzerinde etkisi yoktur: H 0 : β 4 =0, β 5 =0 H 1 : en az biri sıfırdan farklı H 0 modele iki kısıt koymaktadır. Öyleyse q=2, payın serbestlik derecesi Paydanın serbestlik derecesi: n-k-1=1191-6=1185 Kısıtlanmamış ve kısıtlanmış model tahminleri şöyledir. 67 Örnek 4.9 Kısıtlanmamış model Model 1: OLS estimates using the 1191 observations 1-1191 Dependent variable: bwght VARIABLE COEFFICIENT STDERROR T STAT P-VALUE const 114.524 3.72845 30.716 <0.00001 *** cigs -0.595936 0.110348-5.401 <0.00001 *** parity 1.78760 0.659406 2.711 0.00681 *** faminc 0.0560414 0.0365616 1.533 0.12559 motheduc -0.370450 0.319855-1.158 0.24702 fatheduc 0.472394 0.282643 1.671 0.09492 * Mean of dependent variable = 119.53 Standard deviation of dep. var. = 20.1412 Sum of squared residuals = 464041= SSR ur Standard error of residuals = 19.7888 Unadjusted R-squared = 0.0387482= R 2 ur Adjusted R-squared = 0.0346923 F-statistic (5, 1185) = 9.5535 (p-value < 0.00001) 68 Örnek 4.9 Kısıtlanmış model Model 2: OLS estimates using the 1191 observations 1-1191 Dependent variable: bwght VARIABLE COEFFICIENT STDERROR T STAT P-VALUE const 115.470 1.65590 69.733 <0.00001 *** cigs -0.597852 0.108770-5.496 <0.00001 *** parity 1.83227 0.657540 2.787 0.00541 *** faminc 0.0670618 0.0323938 2.070 0.03865 ** Mean of dependent variable = 119.53 Standard deviation of dep. var. = 20.1412 Sum of squared residuals = 465167= SSR r Standard error of residuals = 19.7961 Unadjusted R-squared = 0.0364164= R 2 r Adjusted R-squared = 0.0339811 F-statistic (3, 1187) = 14.9533 (p-value < 0.00001) 69 Econometrics 23

F test istatistiği, SSR form: R 2 form: ( SSR SSR ) r ur / q F = = SSR ur /( n k 1) F = 2 2 ( Rur Rr )/ 2 ( 1 R )/( n k ur Örnek 4.9: devam (465167-464041)/2 464041/(11 91-5 -1) = 1.4377 q (0.0387482-0.0364164) /2 = = 1.4376 1) (1-0.0387482) /(1191-5 -1) Kritik değer: F(2, 1185) tablosundan %5 kritik değer c=3, %10 kritik değer 2.3 Karar: Bu anlamlılık düzeylerinde H 0 reddedilemez. Anne ve babanın eğitim düzeylerinin doğum ağırlıkları üzerinde etkisi yoktur. Başka bir deyişle bu iki değişken birlikte istatistik bakımından anlamsızdır. 70 71 72 Econometrics 24

73 Regresyonun bütününü anlamlılığına ilişkin F-testi Sıfır hipotezimiz şudur: regresyona eklenen açıklayıcı değişkenlerin y üzerinde birlikte etkisi yoktur: Alternatif hipotez betalardan en az birinin sıfırdan farklı olduğunu söylemektedir. Dışlama kısıtı için geliştirdiğimiz F testi regresyonun bütününün anlamlılığı için kullanılabilir. 74 Regresyonun bütününü anlamlılığına ilişkin F-testi H 0 kısıtı altında modeli yeniden yazarsak Bu kısıtlanmış modeldir. Sadece sabit terimin yer aldığına dikkat edin. F test istatistiği Olur. Buradaki R 2 kısıtlanmamış modelden elde edilen determinasyon katsayısıdır. Bütün ekonometri programları bu istatistiği otomatik olarak hesaplar. 75 Econometrics 25

Örnek 4.9 Bebeklerin doğum ağırlıkları örneğinde regresyonun bütün olarak anlamlı olup olmadığını test edelim. GRETL çıktısından (bkz. Model 1) bunun F-statistic (5, 1185) = 9.5535 (p-value < 0.00001) olduğunu görüyoruz. P-değeri oldukça küçük çıkmıştır. Yani H 0 ı reddedersek 1.tip hata olasılığımız çok küçük olacaktır. Öyleyse H 0 güçlü bir şekilde reddedilir. Regresyonun bütününün anlamsız olduğunu söyleyen sıfır hipotezine karşı kanıtlar güçlüdür. Regresyon bir bütün olarak anlamlıdır. 76 Genel Doğrusal Kısıtların Testi F testi, sadece dışlama (sıfıra eşitleme) kısıtları için değil daha genel kısıtların testi için de kullanılmaktadır. Örnek: ev fiyatlarını, ekspertiz değeri (assess), bahçe alanı (lotsize), evin alanı (sqrft) ve yatak odası sayısı (bdrms) değişkenleriyle açıklayalım. 77 Genel Doğrusal Kısıtların Testi (devam) Evin uzmanlarca saptanan ekspertiz değerinin rasyonel olup olmadığını test etmek istiyoruz. Eğer ekspertiz değeri rasyonel olarak belirlendiyse, bundaki %1 lik bir artışın ev fiyatlarında %1 lik bir artışı yol açması gerekir. Ayrıca, assess dışındaki değişkenlerin evin değerini açıklamada anlamsız olmaları gerekir. Yani sıfır hipotezimiz olur. 78 Econometrics 26

Genel Doğrusal Kısıtların Testi (devam) F testinin adımları aynıdır. Kısıtlanmamış ve kısıtlanmış modelleri ayrı ayrı tahmin edeceğiz. Kısıtlanmamış modeli şöyle yazalım. H 0 kısıtları altında kısıtlanmış modelimiz olur. Bu modeli aşağıdaki şekliyle tahmin edebiliriz: 79 Örnek: Gretl, hprice1.gdt Unrestricted model: SSR ur =1.822 Restricted Model: SSR r =1.880 80 F test istatistiği Örnek: Gretl, hprice1.gdt %5 düzeyinde F(4,83) kritik değeri, c=2.5 H 0 reddedilemez. Değerlemelerin rasyonel olduğunu söyleyen sıfır hipotezine karşı kanıt yoktur. 81 Econometrics 27

Regresyon sonuçlarının sunulması: Tahmin edilen beta katsayılarını, ilgili bağımsız değişkenin ve bağımlı değişkenin ölçü birimlerini ve regresyona giriş şekillerini dikkate alarak yorumlayınız. Katsayıların tek tek (t testi) ve tümü bir arada (F testi) istatistiksel olarak anlamlı olup olmadıklarını gösteriniz. Betahat lerin standart hatalarını (se) katsayıların altında veriniz. Bazen t değerleri de verilmektedir.ancak, t yerine se leri vermek daha doğrudur. Güven aralığı teşkil vs. için se lar gerekecektir. R 2 ve n mutlaka verilmeli. Bazen SSR ve regresyonun standart hatası (σ ) da verilmektedir. 82 Aynı veri kümesi ile birden çok regresyon tahmin ediyorsak sonuçlar bir tablo şeklinde verilebilir: 83 Econometrics 28