HAFTA 13 GÖLGE EĞİŞKENLERLE REGRESYON (UMMY VARIABLES) Gölge veya kukla (dummy) değşkenler denen ntel değşkenler, cnsyet, dn, ten reng gb hemen sayısallaştırılamayan ama açıklanan değşkenn davranışını etkleyeblen değşkenlern regresyon modelne alınması gölge değşkenl regresyon modeln oluşturur. Böyle değerlern alan değşkenlere gölge değşkenler denr. Gölge değşkenler regresyon modellernde tıpkı ncel değşkenler gb kullanılablr. Regresyon modelndek değşkenlern heps gölge ya da ntel se böyle modellere varyans analz modeller denr. 01 Örneğn; Y br profesörün yıllık maaşı 1, erkek profesör 0, bayan profesör Model: Y 0 1 Burada cnsyetn profesör maaşı değşmnde etks olup olmadığı araştırılacaktır. Kuşkusuz k, yaş, akademk derece, kıdem gb dğer değşkenler sabt tutulacaktır. Hata termlernn regresyon varsayımlarını sağladığı koşulu altında E( Y 0) kadın profesörlern ortalama maaşı 0 E( Y 1) erkek profesörlern ortalama maaşı 0 1 cnsyetn profesör maaşlarına etks olup olmadığı H0: 1 0 hpotez le test edlr. Örnek: Profesörlern şe başlama maaşlarına lşkn verler Y (bn dolar) Cnsyet (1=erkek, 0=kadın) 1 19 0 18 0 1.7 1 18.5 0 1 1 0.5 1 17 0 17.5 0 1. 1 Kestrm denklem Y S 18 3.8 : 0.3 0.44 t :54.74 7.439 R :0.8737 ˆ 0 1800 kadın profesörlern tahmn edlen ortalama maaşı ˆ ˆ 180 erkek profesörlern 0 1 tahmn edlen ortalama maaşı Sonuç olarak, kadın profesörlern ortalama maaşı erkek profesörlernknden düşüktür. Ncel ve ntel değşkenlern karışık olduğu regresyon modellerne ortak varyans çözümlemes modeller denr. 1
Br ncel, br k değerl ntel değşkenl regresyon: Model: Y 0 1 ; N 0, Br öncek örneğe dönersek, Y br profesörün yıllık maaşı yıl olarak eğtm deneym 1, erkek 0, kadın Br kadın profesörün ortalama maaşı: E Y, 0 0 Br erkek profesörün ortalama maaşı: E Y, 1 0 1 Böyle br regresyon modelnde dkkat edlmes gereken özellkler: 1. Kadın ve erkek gb k grubu belrlemek çn br gölge değşken yerne k gölge değşken tanımlanırsa model Y 0 11 3 ; N 0, 1, erkek 1, kadın 0, değl 0, değl tanımlanırsa, bu model çn tasarım matrs 1 br öncek örnekten Y ve 0 1 3 1 1 0 1 1 0 1 0 1 1 1 0 1 0 1 x x x x x 1 3 4 5 dr. Görüleceğ üzere. ve 3. sütunun toplamı 1. sütunu vermektedr. 1 ve arasında tam br ortak doğrusallık vardır ve EKK tahmn yapmak olanaksızdır. Böyle durumlarda k gölge değşken yerne br gölge değşken kullanmak ortak doğrusallık sorununu
m1 gölge değşken çözecektr. O halde br ntel değşkende m öbek varsa, yalnızca kullanmakla gölge değşken tuzağı olarak belrtlen ortak doğrusallık sorunundan kurtulmayı sağlar.. Gölge değşken kullanan regresyon modeller yorumlanırken verldğ önemldr. 01 değşkenlernn nasıl 3. 4. 0 değer verlen öbek, şık yada düzeye temel şık, ölçü şıkkı, kontrol şıkkı, karşılaştırma şıkkı, başvuru şıkkı yada atlanan şık gb adlar verlr. Bu şık öbürlernn karşılaştırılmaları çn br temeldr. Hang şıkkın temel şık olacağı önsel bazı düzencelern etkl olduğu br seçmden başka br şey değldr. gölge değşkenne verlen 1 katsayısı sabt term farkı olarak adlandırılır. 1. değern alan şıkkın sabt termnn temel şıkkın sabt term katsayısından ne kadar farklı olduğunu gösterr. Br ncel, br kden çok değer alan ntel değşkenl regresyon: Br kmsenn yıllık sağlık harcamalarının, o kmsenn gelrne ve eğtmne göre regresyon model bulunmak stenrse, değşkenler Y yıllık sağlık harcaması yıllık gelr orta ögretm, lse, ünverste dr. Gölge değşken sayısı, değşken düzey sayısından br eksk olmalı kuralı gereğnce,, gölge değşkenler yerne modele ve gölge değşkenler alınır. 1 3 1, lse mezunu 1, ünverste mezunu 0, değl 0, değl 1 gölge değşkenler alınarak, model Y 0 11 3 ; N 0, 1 olup, ortaöğretm düzey keyf olarak temel düzey alınır. Öyleyse 0 sabt term bu düzeyn sabtdr. 3
, 1 0, 0 0 3, 1, 0, 0, 1 E Y ortaöğretm E Y lse 1 0 1 3 E Y ünverste 1 0 3 Regresyon model bulunduktan sonra 1 le fark sabt termlernn tekl olarak, temel düzeyden, statstk bakımından anlamlı br fark gösterp göstermedğ H0 : 1 0 hpotezyle test edleblr. ANOVA ve ANCOVA le de test edleblr. Farklı br gölge değşken tanımlama yolu kullanıldığında regresyon modelnn yorumlanması da değşecektr. Br ncel, ks ntel değşkenl regresyon: Gölge değşken teknğ brden çok ntel değşken çn genşletleblr. Profesör maaşları örneğne dönecek olursak, Y br profesörün yıllık maaşı yıl olarak eğtm deneym 1, erkekse 1, beyazsa 0, değlse 0, değlse 1 Artık atlanan ya da temel şıkkı ten reng yan burada zenc kadın profesörse Model: Y 0 1 1 3 ; E 0 Zenc kadın profesörün ortalama maaşı: 0, 0, E Y 1 0 3 Zenc erkek profesörün ortalama maaşı: 1, 0, E Y 1 0 1 3 Beyaz kadın profesörün ortalama maaşı: 0, 1, E Y 1 0 3 Beyaz erkek profesörün ortalama maaşı: 1, 1, E Y 1 0 1 3 4
Yukarıdak modellerde sabt termler farklı almakla brlkte 3 eğm katsayıları aynıdır. Regresyon parametrelernn EKK tahmn edclernden statstksel anlamlı se ten reng, statstksel anlamlı se cnsyet br profesörün maaşını etklyor demektr. Eğer 1 ve nn her ks de statksel anlamlı se hem cnsyet hem de ten reng profesörlern maaşlarında öneml brer belrleycdr. Regresyon modellernn kararlılıklarının sınaması: Şmdye kadar alınan modellerde ntel değşkenlern çeştl alt regresyonlarında sabt term etkledğ ama eğm katsayıları aynı kaldığı varsayıldı. Ntel değşkenn her düzey çn farklı br regresyon doğrusu elde edlrken bu doğruların aynı eğml paralel olduğu ncelend. Eğer bu doğruların eğmler farklıysa, sabt termlernn sınanmasının uygulamada anlamı kalmaz. Bu regresyon doğrularının farklı eğml olup olmadığına çeştl testlerle bakılablr. Örnek: 1946 1963 yıllarında İngltere de tasarruflar ve gelr verler k dönemde ncelenecektr. I. dönem: Yenden yapılanma 1946 1954 arası (II. ünya savaşı sonrası) II. dönem: Yenden yapılanma sonrası 1955 1963 arası 1 I. dönem: Y 1 u1 ; 1,,, n1 II. dönem: Y 1 u; 1,,, n Y tasarruflar (mlyon $) 1 gelr (mlyon $) u, u k regresyon modelndek hata termler n ve n sırasıyla I. ve II. dönemdek gözlem sayıları 1 Her k dönem çn regresyon doğruları: ve se çakışan regresyonlar (aynı) 1. 1 1 ve se koşut regresyonlar (konumları bakımından farklı). 1 1 ve se uyumlu regresyonlar (aynı sabt terml fakat farklı eğml) 3. 1 1 ve se benzemez regresyonlar 4. 1 1 5
Her k dönem çn regresyonlar ayrı ayrı bulunablr, sonra yukarıdak durumların her br sınanablr. Chow sınaması: Verde yapısal br değşmn olup olmadığı Gregory Chow un önerdğ Chow sınaması le test edleblr. Chow sınamasının varsayımları: a) u 1 N 0, ve u N 0, u b) 1 aynı varyanslı ve u bağımsız rasgele değşkenler Chow sınamasının adımları: 1. n1 ve n gözlemler brleştrlerek tek br regresyon doğrusundan hata termler tahmn edlr (artıklar) ve bu artıklarda elde edlen SSE S1 bulunur. n n1 n toplam gözlem sayısı, p k1 modeldek parametre sayısı k açıklayıcı değşken sayısı n p n1 n p serbestlk dereces 6
. aha sonra n 1 gözlem ve tahmn edlr. Her br kestrm denklemnden I. dönem: sd1 n1 p II. dönem: sd n p Her k SSE 1 ve sd3 n1 n p dr. SSE 3. S5 S1 S4 bulunur ve serbestlk dereces se n gözlem çn ayrı ayrı regresyon doğrularından hata termler SSE S 1 ve SSE S 3 elde edlr. toplanır ve S S3 S4 bulunur. Burada serbestlk dereces sd4 n1 n p n1 n p p p p dr. 4. Chow sınaması varsayımları altında önerlen F test statstğ S1 S4 p F 1 S5 sd4 F S sd S S n n p 4 3 3 1 dr ve yokluk hpotez H 0 : hpotezn test eder. p; n n p Her k regresyon aynıdır. ve Örnek: Br öncek örnekten, n1 9, n 9, p 0 0 1 1 1. Tüm ver çn: Yˆ 1.081 0.1178 ˆ : 0.145 0.0088 S t : 7.4548 13.4316 r S1 SSE sd 0.9185 ve 0.57 16. I. dönem Yˆ 0.6 0.0470 S ˆ : 0.3054 0.066 t : 0.8719 1.7700 r S SSE1 sd1 0.3095 ve 0.1396 7 II. dönem Yˆ 1.750 0.1504 S : 0.3567 0.0175 t : 4.8948 8.5749 r S3 SSE sd 3. 4 3 3 0.9131 ve 0.1931 7 S S S 0.1396 0.1931 0.337, sd 14 S S S 0.57 0.337 0.395, sd 5 1 4 4 4. Test statstğ S5 sd4 0.395 F 5.04 S sd 0.337 14 4 3 0.05 çn F 3.74,14 (0.05) 7
5.04>3.74 olduğundan H0 : 1 1 ve hpotez red edlr. Yorum: Tasarruf fonksyonu her k dönem çn farklıdır. Acaba bu fark sabt termlerden m yoksa eğmlerden m olduğunu saptamak çn Chow sınaması uyarlanablr. Aynı zamanda gölge değşkenler yoluyla da bu araştırılablr. Gölge değşken yaklaşımı le k regresyon karşılaştırılması: Chow sınaması sürec gölge değşken teknğ le öneml ölçüde kısıtlanablr. Uygulamada Chow ve gölge değşken sınamalarından aynı sonuçlar elde edldyse, gölge değşkenlern bazı üstünlükler vardır. Tasarruf gelr örneğne dönersek; 1,. ver I. dönemde se 0,. ver II. dönemde se her k dönem brleştrlerek, regresyon model Y 0 1 3 I. dönem: E Y, 0 0 II. dönem: E Y, 1 Öncek tanımlamadan 0 1 3, ve, 1 0 1 0 1 3 dr. Burada 1 sabt term farkı ve 3 eğm farkı katsayılarını göstermektedr. Gölge değşken nn çarpım ( ) kalıbında modele eklenmes k dönem eğm katsayılarının farklı olup olmadığını ortaya çıkarır. Tasarruf gelr modelnn kestrm denklem: Yˆ 1.750 1.4839 0.1504 0.1034 Sˆ : 0.3319 0.4704 0.0163 0.033 t : -5.733 3.1545 9.38-3.1144 R 0.945 8
Görüleceğ üzere hem sabt term farkı hem de eğm farkı katsayısı statstk bakımından anlamlıdır. Bu da her k dönem çn öngörülen regresyon modellernn farklı olduğunun güçlü br göstergesdr. 1 se I. dönem: Yˆ ( 1.750 1.4839) (0.1504 0.1034) 0.663 0.0470 0 se II. dönem: Yˆ 1.750 0.1504 kestrm denklemler Chow sınaması le bulunan kestrm denklemler aynıdır. Gölge değşken teknğnn üstünlükler: 1. Yalnızca tek br regresyon model bulmak yeterldr. Tekl regresyonlar buradan türetleblr.. Tek regresyon modelndek regresyon parametrelernn testlernn yapılması le tekl regresyonların farklı olup olmadıkları bulunablr. 3. Chow sınaması tekl regresyonların sabt termler m yoksa eğmler açısından farklı olup olmadıklarının ayrımını yapamaz. Buna karşın gölge değşken teknğ Chow sınamasına karşın üstünlük sağlar. 4. Verlern br araya getrlmes serbestlk derecesn yükseltp tahmn edlen ana kütle katsayılarının görel hassaslığını artırır. İk gölge değşkenn etkleşm Y br profesörün yıllık maaşı yıllık gelr 1, kadınsa 1, ünverste mezunuysa 0, erkekse 0, değlse 1 Kadın ünverste mezunu, erkek ünverste mezununa göre gym çn daha fazla harcama yapılablr. Yan; k gölge değşken arasında etkleşm olablr. Bunu anlamak çn model; Y 0 1 1 3 1 4 1, 1, E Y 1 0 1 3 4 1 kadın olmanın fark etks ünverste mezunu olmanın fark etks 3 kadın ünverste mezunu olmanın fark etks Kadın ünverste mezunlarının ortalama gym harcamasının, kadınların ya da ünverste mezunlarının ortalama gym harcamasından 3 kadar farklı olduğunu gösterr. Eğer 1,, 3 ün heps artı şaretlyse, kadınların ortalama gym harcaması daha yüksektr, ama 9
bu kadınlar br de ünverste mezunuysa bu fark daha da büyüktür. Benzer br bçmde br ünverste mezununun ortalama gym harcaması, temel öbekten daha yüksektr, ama bu ünverste mezunu br de kadınsa bu fark daha da artar. Buda bze, etkleşm gölge değşkennn k farklı özellğnn tekl etklern nasıl değştrdğn gösterr. Etkleşm gölge değşken katsayısının statstk bakımından anlamlı olup olmadığı alışıldık sınamasıyla sınanablr. Eğer anlamlı çıkarsa k özellğn brlkte varlığı bu özellklern tek tek etklern azaltacak ya da artıracak demektr. Öneml br etkleşm termn göz ardı etmenn model kurma hatasına yol açacağını söylemeye ble gerek yoktur. t 10