Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. ed., 2002, Thomson Learning. Ch. 5: SEKK (OLS) nin Asimptotik Özellikleri Doç. Dr. Hüseyin Taştan 1 1 Yıldız Teknik Üniversitesi, İktisat Bölümü, Yıldız Kampüsü H Blok, Oda no. 124, Beşiktaş, İstanbul. Email: tastan@yildiz.edu.tr Bölüm 5: SEKK (OLS) Asimptotik (büyük örneklem) özellikleri CH 3 ve 4 de SEKK (OLS) tahmin edicilerinin belirli sayıda gözlem içeren örneklem (finite sample), küçük örnek özelliklerini gördük. Bu özellikler herhangi bir örneklem büyüklüğü, n, için geçerliydi. Bunlar şu özelliklerdi : Sapmasızlık (MLR.1-MLR4 altında) BLUE özelliği (MLR.1-MLR5 altında) (Best=En Etkin) Varsayım MLR.6 nın işlevi : Hata terimi, u, normal dağılmıştır ve açıklayıcı değişkenlerden (x lerden) bağımsızdır. Bu varsayım, bize, OLS tahmin edicilerin x lere koşullu kesin örneklem dağılımlarını (exact sampling distribution conditional on the explanatory variables in the sample) türetebilmemize imkan verir. Teorem 4.1, OLS tahmin edicilerin, MLR.1- MLR.6 varsayımları altında normal örnekleme dağılımları na sahip olduklarını gösterdi. Bu, hesaplanan t ve F istatistiklerinin standart t ve F dağılımlarını izleyeceği anlamına gelir. Asimptotik (büyük örneklem) özellikleri OLS tahmin edicilerin sonlu (finite) ve küçük örneklem özelliklerinin yanında büyük örneklem özelliklerini de incelememiz gerekmektedir. Bu özellikler örneklem hacmi, n, sınırsız olarak artarken durumu altında incelenecektir. Tutarlılık (consistency): Bkz. EK C, sh.709 3 4 Sapmasızlık her zaman sağlanamaz. Bu durumda, çoğu kez, bir tahmin edici hiç olmazsa (en azından) tutarlılık koşulunu sağlamalıdır diye düşünürüz. 5 Her bir örnek hacmi n için, bir olasılık dağılımına sahiptir. Bu dağılım, hepsi n hacimli farklı yinelenen örneklerde nin alabileceği mümkün değerleri gösterir. Sapmasızlık özelliği gereği bu dağılımların ortalaması ye eşittir. Eğer tahmin edici tutarlı ise, n arttıkça bu dağılımlar β j etrafında daha dar olarak dağılır. n iken, nin dağılımı tek bir nokta üzerine,β j, düşer. Yani, ne kadar çok büyük örnek alabilirsek, bilinmeyen kitle parametresi β j yi o kadar az hata 6 ile tahmin edebiliriz. Wooldridge, Introductory Econometrics 1
Eğer n büyürken, kitle parametresi β j ye daha yakın bir noktaya gelmiyorsak o tahmin edici tutarsız (inconsistent) bir tahmin edicidir. Sapmasızlık (unbiasedness) için gereken varsayımlar tutarlılık için de yeterlidir : MLR.1- MLR.4 Aşağıdaki (5.3) nolu formül OLS tahmin edicisinin x lerle u lar arasında korelasyon olmaması koşulu sağlandığında tutarlı olduğunu gösterir : 7 8 Varsayım MLR.3 MLR.3 (zero conditional mean),mlr.3 nün otomatik olarak geçerli olmasını sağlar (implies), ancak, tersi doğru değildir. MLR.3 daha zayıf (yumuşak) bir koşuldur. Bu koşul OLS tahmin edicisinin tutarlı olmasını sağladığı halde sapmasız olmasını sağlayamıyor. Sapmasızlık için daha kuvvetli koşul olan MLR.3 gerekli. E(u x 1,,x k )=0 varsayımının ihlali sapma(bias) yol açar. Corr (u, x 1, x 2,,x k lardan birisi) 0 Asimptotik sapma : Asymptotic bias Asimptotik sapmanın işareti x 1 ile u arasındaki kovaryansın işaretine bağlıdır. Cov(x 1,u) nun tahmin edilmesi, u gözlemlenemez olduğundan, mümkün değildir. x 2 değişkeni dışlanırsa tutarsızlık yaratır. Aşağıdaki modeli düşünelim: İlk dört G-M varsayımları sağlanıyor olsun. Ayrıca hata terimi ν, x 1 ve x 2 ile ilişkisiz olsun. tutarsızlık (inconsistency) 9 10 Asimptotik sapma x 2 dışlanırsa hata terimi Sapmada (Bias) ise örneklem değerlerini kullanıyoruz. (x e koşullu Beklenti (E) alıyoruz). olur. Bu durumda olasılık limiti Tutarsızlıkta (Inconsistency) popülasyon varyans ve kovaryansını kullanıyoruz. 11 12 Wooldridge, Introductory Econometrics 2
Tahmin edici tutarsız ise örnek hacmini artırarak sorunu çözemeyiz. n arttıkça OLS tahmin edicisi ye yaklaşır. x lerden sadece birisinin (x 1 diyelim) u ile ilişkili olması genellikle (eğer x 1 diğer tüm x lerle ilişkili ise) tüm OLS tahmin edicilerinin tutarsız olmasına yol açar. x 1 ile ilişkisiz olan x ler varsa onların katsayıları tutarlıdır. Tutarsızlık: Örnek y: ev fiyatları x 1 : arıtma tesislerine uzaklık x 2 : evin kalitesi (büyüklük, oda sayısı, bulunduğu semtin çekiciliği vs gibi tüm faktörler) x 2 nin model dışında bırakıldığını düşünelim. β 1 >0, β 2 >0 Eğer ortalamada kaliteli evler çöp arıtma tesislerinin uzağındaysa bu iki değişken (pozitif) ilişkili olur: δ 1 >0 13 14 OLS tahmin edicilerinin tutarsızlığı Daha fazla gözlem toplamak tutarsızlığı ortadan kaldırmaz. Hatta problemi daha kötü hale getirir, çünkü OLS t.e. bu değere yaklaşır. Eğer herhangi bir x değişkeni u ile ilişkiliyse modelde yer alan tüm OLS t.e. Tutarsız olur. Eğer x 1 ve x 2 ilişkisiz ise, x 1 ile u arasındaki ilişki beta2şapkanın tutarlılığını etkilemez. 15 Asimptotik normallik MLR.6 u ların Normal dağıldığını ifade ediyordu. Bu, y nin x 1, x 2,., x k verilmişken normal dağıldığı anlamına gelir (y nin x lere koşullu dağılımı). OLS t.e. nin sapmasızlığı için normallik varsayımına gerek yoktu. Normallik varsayımı betaşapkaların örnekleme dağılımlarının elde edilmesi ve istatistiksel çıkarsama yapılabilmesi için gerekliydi. y lerin x lere koşullu dağılımı Normal değilse t ve F testleri yapamayacak mıyız? Büyük örnek hacimlerinde yapabiliriz (MLT). 16 Teorem 5.2: OLS nin Asimptotik Normalliği Gauss-Markov varsayımları MLR.1-MLR.5 altında Asimptotik varyans: x j nin tüm açıklayıcı değişkenler üzerine regresyonundan elde edilen kalıntılar Teorem 5.2 Teorem 5.2 çok yararlı bir teoremdir. Zira varsayım MLR.6 ya gerek duymuyor. Hata terimlerinin dağılımı ile ilgili getirdiği tek yeni kısıt u ların varyansının sonlu olması dır (σ 2 < ). Bunu zaten daima varsayıyoruz. Teorem 5.2, homoscedasticity ve zero conditional mean varsayımlarını yapmaktadır. n arttıkça t(n-k-1) test istatistiğinin dağılımı Normal dağılıma yaklaşacağı için şunu yazabiliriz: 17 18 Wooldridge, Introductory Econometrics 3
OLS t.e.nin standart hataları OLS t.e. nin varyansı SST j : x j nin ortalama çevresindeki değişkenliği (bütün kareler toplamı) R j2 : x j nin tüm x ler üzerine regresyonundan elde edilen belirlilik katsayısı Terimlerin n sonsuza giderken davranışları Asimptotik standart hata ve asimptotik t değerleri u lar N dağılmadığında (5.9) un kare kökünden bulunan standart hatalar büyük n ler için asimptotik standart hatalar adını alır. t istatistiklerine de asimptotik t değerleri deriz. Betaşapka ların standart hataları n nin kare kökünün tersi ile küçülür : Betaşapkaların varyansı 1/n oranında sıfıra yakınsar. 19 20 (5.10) nolu formülde n ile ilişkisi (c=5 için) se'deki n se % değişme 30 0.91 60 0.65-0.2929 120 0.46-0.2929 240 0.32-0.2929 480 0.23-0.2929 960 0.16-0.2929 1920 0.11-0.2929 se 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 0 500 1000 1500 2000 2500 Diğer bir büyük örneklem testi :Lagrange Multiplier (LM) test istatistiği Buna score testi de denir. Çoklu regresyonda bir grup betanın aynı anda sıfıra eşit olup olmadığını test edeceğiz : y = β o + β 1 x 1 + β 2 x 2 + β 3 x 3 + β 4 x 4 + u Son iki betanın aynı anda sıfır olup olmadığını test edelim: H o : β 3 = β 4 =0 H 1 : En azından birisi sıfırdan farklıdır. 21 22 LM test () H o daki betalara karşılık gelen x leri dışarıda bırakarak regresyonu (kısıtlı model) tahmin ediniz : y = β o* + β 1* x 1 + β 2* x 2 + u * Kısıtlı modelin artıklarını x lerin tümü üzerine regress ediniz (yardımcı regresyon-auxiliary regression): u*=α o + α 1 x 1 +α 2 x 2 + α 3 x 3 + α 4 x 4 + e Bu regresyonun R 2 si ile n in çarpımı test istatistiğini verir. LM=nR 2 istatistiği q (H o daki kısıt sayısı) serbestlik derecesine sahip bir ki-kare dağılımı izler. 23 24 Wooldridge, Introductory Econometrics 4
25 26 OLS nin asimptotik etkinliği Gauss-Markov varsayımları altında OLS tahmin edicilerin BLUE olduğunu biliyoruz. OLS,aynı zamanda, belli bir sınıf tahmin ediciler arasında asimtotik olarak etkin dir (asymptotically efficient). 27 Wooldridge, Introductory Econometrics 5