Çoklueşdoğrusallık Ekonometri 2 Konu 5 Sürüm 2,0 (Ekim 2011)
UADMK Açık Lisans Bilgisi İşbu belge, Creative Commons Attribution-Non-Commercial ShareAlike 3.0 Unported (CC BY-NC-SA 3.0) lisansı altında bir açık ders malzemesi olarak genel kullanıma sunulmuştur. Eserin ilk sahibinin belirtilmesi ve geçerli lisansın korunması koşulu ile özgürce kullanılabilir, çoğaltılabilir ve değiştirilebilir. Creative Commons örgütü ve CC-BY-NC-SA lisansı ile ilgili ayrıntılı bilgi http://creativecommons.org adresinde bulunmaktadır. Bu ekonometri ders notları setinin tamamına adresinden ulaşılabilir. A. Talha Yalta TOBB Ekonomi ve Teknoloji Üniversitesi Ekim 2011
Ders Planı 1
Klasik doğrusal bağlanım modelinin (KDBM) varsayımlarından biri, modele katılan değişkenler arasında çoklueşdoğrusallık (multicollinearity) olmadığı yönündedir. Gözlem sayısının açıklayıcı değişken sayısından çok olduğu ve açıklayıcıların yeterince değişkenlik gösterdiği varsayımları da çoklueşdoğrusallığın olmadığı varsayımının tamamlayıcılarıdır. Bu bölümde şu sorulara yanıt arayacağız: 1 Çoklueşdoğrusallığın niteliği nedir? 2 Çoklueşdoğrusallık gerçekten bir sorun mudur? 3 Uygulamada doğurduğu sonuçlar nelerdir? 4 Varlığı nasıl anlaşılabilir? 5 Düzeltmek için ne gibi önlemler alınabilir?
Eşdoğrusallık kavramını ilk kez 1934 yılında Ragnar Frisch öne sürmüştür. Önceleri bu terim bir bağlanım modelinin tüm ya da bazı açıklayıcı değişkenleri arasında kusursuz (perfect) ya da tam (exact) bir doğrusal ilişki olduğu anlamına geliyordu. Aşağıdaki örneği ele alalım: λ 1 X 1 + λ 2 X 2 + + λ k X k = 0 Yukarıdaki eşitlikte yer alan herhangi bir X, örnek olarak X 2, diğerlerinin doğrusal işlevi olarak gösterilebilir: X 2 = λ 1 λ 2 X 1 λ 3 λ 2 X 3 λ k λ 2 X k Diğer bir deyişle bu örnekteki herhangi bir X değişkenini diğerlerinin doğrusal bir bileşiminden türetmek olasıdır.
Bugün çoklueşdoğrusallık hem tam çoklueşdoğrusallığı hem de X değişkenlerinin genel olarak birbirleriyle ilişkili olduklarını gösteren daha geniş bir anlam içermektedir: λ 1 X 1 + λ 2 X 2 + + λ k X k + v i = 0 v i burada olasılıksal hata terimidir. Örnek olarak X 2 şu şekilde yazılabilir: X 2 = λ 1 λ 2 X 1 λ 3 λ 2 X 3 λ k λ 2 X k 1 λ 2 v i Buna göre X 2, diğer X değişkenlerinin kusursuz olmayan bir doğrusal bileşimidir.
Tanımladığımız şekliyle çoklueşdoğrusallık, yalnızca X ler arasındaki doğrusal ilişkileri anlatmaktadır. Örnek olarak aşağıdaki çokterimli (polynomial) bağlanım modelini ele alalım: Y i = β 0 + β 1 X i + β 2 Xi 2 + β 3 Xi 3 + u i Burada X i, X 2 i ve X 3 i ün işlevsel ilişki içinde olduğu açıktır. Ancak bu ilişki doğrusal olmadığı için çoklueşdoğrusallığın olmadığı varsayımını çiğnemez. Uygulamada ise X i, Xi 2, ve Xi 3 arasında hesaplanan ilinti katsayısı yüksek çıkacak ve bu da anakütle katsayılarının tahmin edilmesini güçleştirecektir.
Tam ve tamdan az eşdoğrusallık arasındaki farkı daha iyi görebilmek için, aşağıdaki varsayımsal verileri inceleyelim: X 1 X 2 X 2 10 50 52 15 75 75 18 90 97 24 120 129 30 150 152 Bu örnekte X 2 = 5X 1 olduğu için, X 1 ile X 2 arasında tam eşdoğrusallık bulunmaktadır. Diğer bir deyişle ilinti katsayısı r 12 = 1 dir. X2 değişkeni ise X 2 ye rastsal sayılar çizelgesinden alınan {2, 0, 7, 9, 2} sayılarının eklenmesiyle bulunmuştur. X 1 ile X2 arasında bir tam eşdoğrusallık olmamakla birlikte çok güçlü bir ilinti (r12 = 0,9959) bulunmaktadır.
Çoklueşdoğrusallığın Nedenleri Çoklueşdoğrusallık şu etmenlere bağlı olabilir: 1 Veri derleme yöntemi: Örnek olarak, bir X in anakütlede aldığı değerlerin sınırlı bir aralığından örneklem almak. 2 Anakütle kısıtlamaları: Örnek olarak, elektrik tüketiminin gelir ve konut büyüklüğüne göre bağlanımında görülen yüksek gelirli ailelerin büyük evlerde oturmaları durumu. 3 Model kurma hatası: Örnek olarak, bir X değişkeninin gözlenen aralığı darken bağlanım modeline X 2 gibi terimler eklemek. 4 Aşırı belirtimli model: Modelin gözlem sayısına göre çok fazla sayıda değişken içermesi.
Tam Eşdoğrusallık Tam çoklueşdoğrusallık durumunda bağlanım katsayıları belirsizdir. Ayrıca ˆβ katsayılarının ölçünlü hataları da sonsuz olur. Bunu görebilmek için üç değişkenli modeli sapmalar biçiminde yazalım: y i = ˆβ 2 x 2i + ˆβ 3 x 3i + u i Tahmin edilen β değiştirgeleri aşağıdaki gibidir: ˆβ 2 = ( y i x 2i )( x 2 3i ) ( y i x 3i )( x 2i x 3i ) ( x 2 2i )( x 2 3i ) ( x 2i x 3i ) 2 ˆβ 3 = ( y i x 3i )( x 2 2i ) ( y i x 2i )( x 2i x 3i ) ( x 2 2i )( x 2 3i ) ( x 2i x 3i ) 2 (... devam)
Tam Eşdoğrusallık Şimdi, X 3i = λx 2i diyelim ve λ 0 olsun. Bu durumda tahmin edilen değiştirgeler şuna indirgenir: ˆβ 2 = ˆβ 3 = ˆβ = ( y i x 2i )(λ 2 x 2 2i ) (λ y i x 2i )(λ x 2 2i ) ( x 2 2i )(λ2 x 2 2i ) λ2 ( x 2 2i )2 = 0 0 Yukarıdaki gösterimin belirsiz olmasının nedeni, X 2i ile X 3i nin tam eşdoğrusallıktan dolayı birbirlerinden ayrılamamasıdır. X 2i değişince X 3i de λ çarpanıyla değişir, sabit tutulamaz. Uygulamada bu durum yıkıcı olur çünkü bütün amaç zaten X 2i ve X 3i nin Y i üzerindeki kısmi etkilerini ayrıştırmaktır.
Tam Eşdoğrusallık Tam çoklueşdoğrusallığın yol açtığı belirsizlik sorununu görmek için X 3i = λx 2i özdeşliğini modele yerleştirelim: y i = ˆβ 2 x 2i + ˆβ 3 (λx 2i ) + u i = ( ˆβ 2 + λ ˆβ 3 )x 2i + u i = ˆαx 2i + u i Demek ki α değeri için tek bir tahmin yapılabilirken, β 2 ile β 3 için ayrı ayrı iki tahmin yapılamaz: ˆα = ( ˆβ 2 + λ ˆβ 3 ) ˆβ2 = ˆα λ ˆβ 3
Yüksek Eşdoğrusallık Tam çoklueşdoğrusallık uç bir durumdur. İktisadi verilerde genellikle tam doğrusal ilişkiye rastlanmaz. Yüksek çoklueşdoğrusallık durumu için şu ilişkiye bakalım: x 3i = λx 2i + v i Burada λ 0 dır. v i ise x 2i den bağımsız ( x 2i v i = 0) bir olasılıksal hata terimidir. Yukarıda gösterilen yüksek çoklueşdoğrusallık durumunda, β 2 ve β 3 katsayılarının tahmin edilmesi olanaklıdır: ˆβ 2 = ( y i x 2i )(λ 2 x 2 2i + v 2 i ) (λ y i x 2i + y i v i )(λ x 2 2i ) ( x 2 2i )(λ2 x 2 2i + v 2 i ) (λ x 2 2i )2 Yukarıdakine benzer bir gösterim β 3 için de çıkarılabilir. Demek ki yüksek çoklueşdoğrusallık durumunda tahmin yapılmasını engelleyen bir durum yoktur.
Önümüzdeki Dersin Konusu Önümüzdeki ders Çoklueşdoğrusallığın sonuçları