KUKLA DEĞİŞKENLİ MODELLER



Benzer belgeler
Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

KUKLA DEĞİŞKENLİ MODELLER

Kukla Değişken Nedir?

KUKLA DEĞİŞKENLİ MODELLER

KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU

KUKLA DEĞİŞKENLİ MODELLER. Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller (Kovaryans Analizi Modeller)

TABLO I: Bağımlı değişken; Tüketim,- bağımsız değişkenler; gelir ve fiyat olmak üzere değişkenlere ait veriler verilmiştir.

1. YAPISAL KIRILMA TESTLERİ

T.C. TRAKYA ÜNİVERSİTESİ İKTİSADİ VE İDARİ BİLİMLER FAKÜLTESİ İKTİSAT BÖLÜMÜ GENEL EKONOMİK SORUNLAR TÜFE NİN İŞSİZLİK ÜZERİNE ETKİSİ HAZIRLAYANLAR:

ADMIT: Öğrencinin yüksek lisans programına kabul edilip edilmediğini göstermektedir. Eğer kabul edildi ise 1, edilmedi ise 0 değerini almaktadır.

A. Regresyon Katsayılarında Yapısal Kırılma Testleri

1. Basitlik 2. Belirlenmişlik Y t = b 1 (1-r)+b 2 X t -rb 2 X t-1 +ry t-1 +e t 3. R 2 ölçüsü 4. Teorik tutarlılık 5. Doğru Fonksiyonel Biçim

İyi Bir Modelin Özellikleri

Dependent Variable: Y Method: Least Squares Date: 03/23/11 Time: 16:51 Sample: Included observations: 20

Normal Dağılımlılık. EKK tahmincilerinin ihtimal dağılımları u i nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.

0, model 3 doğruysa a3. Variable Coefficient Std. Error t-statistic Prob.

Bağımlı Kukla Değişkenler

BİRDEN ÇOK BAĞIMLI DEĞİŞKENİ OLAN MODELLER

Normal Dağılımlılık. EKK tahmincilerinin ihtimal dağılımları u i nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.

Dependent Variable: Y Method: Least Squares Date: 03/23/11 Time: 16:51 Sample: Included observations: 20

İyi Bir Modelin Özellikleri

Regresyon Analizinde Nitel Bilgi. Nitel Değişkenler: Ders Planı. Nitel Bilgi

Yuvalanmamış F testi- Davidson- MacKinnon J sınaması

İÇİNDEKİLER 1. GİRİŞ...

Bağımlı Kukla Değişkenler

500 BÜYÜK SANAYİ KURULUŞUNDA ÜRETİM, KÂRLILIK VE İSTİHDAM İLİŞKİLERİ. YÜKSEK LİSANS TEZİ Müh. Özlem KÖSTEKLİ. Anabilim Dalı: İşletme Mühendisliği

EKONOMETRİDE BİLGİSAYAR UYGULAMLARI EVİEWS UYGULAMA SORULARI VE CEVAPLARI

ÖĞRENCİ SEÇME SINAVI NA HAZIRLANAN ÖĞRENCİLERİN BAŞARILARINI ETKİLEYEN FAKTÖRLERİN BELİRLENMESİ (OLTU ANADOLU LİSESİ ÖĞRENCİLERİ İÇİN BİR UYGULAMA)

UYGULAMA 2. Bağımlı Kukla Değişkenli Modeller

İstatistik ve Olasılık

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

Bağımlı Kukla Değişkenler

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

17 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

ANADOLU ÜNİVERSİTESİ REGRESYON KATSAYILARININ GÜVEN ARALIĞI = + REGRESYON KATSAYILARININ GÜVEN ARALIĞI

Y = 29,6324 X 2 = 29,0871 X 3 = 28,4473 y 2 = 2,04 x 2 2 = 0,94 x 2 3 = 2,29 yx 2 = 0,19 yx 3 = 1,60 x 2 x 3 = 1,06 e 2 = 0,2554 X + 28,47 X 3-0,53

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

OLS Klasik Varsayımlar. Çoklu Regresyon. Çoklu Regresyon Modellemesi. Çoklu Regresyon Modeli. Multiple Regression

EKONOMETRİ I E-VİEWS UYGULAMALI VE ÇÖZÜMLÜ SORULAR

ÇOKLU DOĞRUSAL BAĞLANTI

TEFE VE TÜFE ENDEKSLERİ İLE ALT KALEMLERİNDEKİ MEVSİMSEL HAREKETLERİN İNCELENMESİ* Soner Başkaya. Pelin Berkmen. Murat Özbilgin.

TEKNOLOJĐK ARAŞTIRMALAR

ÖNGÖRÜ TEKNĐKLERĐ ÖDEV 5 (KEY)

19. BÖLÜM BİRBİRİYLE İLİŞKİLİ OLAN İKİ DEĞİŞKENDEN BİRİSİNDEKİ DEĞİŞİME GÖRE DİĞERİNİN ALACAĞI DEĞERİ YORDAMA (KESTİRME) UYGULAMA-I

EVIEWS KULLANIMI (EVIEWS 8)

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

ÇOKLU REGRESYON MODELİ. Bir bağımlı değişkene etki eden çok sayıda bağımsız değişkeni analize dahil ederek çoklu regresyon modeli uygulanabilir.

3. BÖLÜM: EN KÜÇÜK KARELER

Korelasyon ve Regresyon

PARANIN TARİHÇESİ TÜRKİYE DE NAKİTSİZ EKONOMİ EKONOMİNİN FAYDALARI

Samuelson-Balassa Hipotezi Ve Reel Döviz Kuru: Türkiye, ABD, İngiltere, Fransa Ve Almanya İçin Sınanması

MAK 210 SAYISAL ANALİZ

PANEL VERİ MODELLERİNİN TAHMİNİNDE PARAMETRE HETEROJENLİĞİNİN ÖNEMİ: GELENEKSEL PHILLIPS EĞRİSİ ÜZERİNE BİR UYGULAMA

Korelasyon, Korelasyon Türleri ve Regresyon

White ın Heteroskedisite Tutarlı Kovaryans Matrisi Tahmini Yoluyla Heteroskedasite Altında Model Tahmini

ÜSTEL DÜZLEŞTİRME YÖNTEMİ

Matris Cebiriyle Çoklu Regresyon Modeli

Pazarlama Araştırması Grup Projeleri

OTOKORELASYON OTOKORELASYON

EVIEWS KULLANIMI (EVIEWS 7.1)

Türkiye nin Dış Turistik Tanıtımının Turizm Talebine Etkisi: Dönemi 1 Aytuğ ARSLAN 2

EKONOMETRİ. GRETL Uygulamaları. Prof. Dr. Bülent Miran

SAĞLIK HARCAMALARININ YILLARA GÖRE KARŞILAŞTIRILMASI ve SAĞLIK HARCAMALARINI ETKİLEYEN FAKTÖRLERİN İNCELENMESİ

TÜRKİYE DE PARA POLİTİKALARININ BANKALARIN KARLILIKLARI ÜZERİNE ETKİSİ

Appendix C: İstatistiksel Çıkarsama

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Öğr. Elemanı: Dr. Mustafa Cumhur AKBULUT

NİTEL TERCİH MODELLERİ

SANAYİ İŞÇİLERİNİN DİNİ YÖNELİMLERİ VE ÇALIŞMA TUTUMLARI ARASINDAKİ İLİŞKİ - ÇORUM ÖRNEĞİ

Statistical Package for the Social Sciences

4. TAHMİN SONUÇLARININ DEĞERLENDİRİLMESİ Katsayıların Yorumu


PROF. DR. ŞÜKRÜ KIZILOT

4.2 Sayfa 159. Uygulama II Sayfa Sayfa 161

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

Hipotezlerin test edilip onaylanması için çeşitli istatistiksel testler kullanılmaktadır. Fakat...

7.Ders Bazı Ekonometrik Modeller. Đktisat (ekonomi) biliminin bir kavramı: gayrisafi milli hasıla.

YILLARI ARASINDA GÜNEY CAROLINA DA OKUL İÇİ ŞİDDET İSTATİSKLERİ ANALİZİ (Bir Önceki Projeden Devam Edilecektir)

BASİT REGRESYON MODELİ

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

8. BÖLÜM: DEĞİŞEN VARYANS

LOJİSTİK REGRESYON ANALİZİ

Vadeli İşlem Sözleşmelerinde Vade Etkisi: Türkiye Örneği

Ekonometri I VARSAYIMLARI

ZAMAN SERİLERİ EKONOMETRİSİ I: DURAĞANLIK, BİRİM KÖKLER

Excel dosyasından verileri aktarmak için Proc/Import/Read Text-Lotus-Excel menüsüne tıklanır.

Appendix B: Olasılık ve Dağılım Teorisi

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

DOĞRUSAL ve DOĞRUSAL OLMAYAN SINIRLAMALAR DOĞRUSAL OLMAYAN SINIRLAMALARIN TESTİ

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Bağımsız Örneklemler İçin Tek Faktörlü ANOVA

KIRGIZİSTAN DA ENFLASYON DİNAMİKLERİ,

ALIŞTIRMA 2 GSYİH. Toplamsal Ayrıştırma Yöntemi

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

EŞANLI DENKLEM MODELLERİ

(AYIRIM) DENLİ. Emre KUZUGÜDENL. Doç.Dr.Serdar CARUS

TOBB Ekonomi ve Teknoloji Üniversitesi İKT351 Ekonometri I, Dönem Sonu Sınavı

The International New Issues In SOcial Sciences

Transkript:

KUKLA DEĞİŞKENLİ MODELLER Bir kukla değişkenli modeller (Varyans Analiz Modelleri) Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller (Kovaryans Analizi Modeller) Kukla değişkenlerin karşılıklı olarak birbirini etkilemeleri Mevsim dalgalanmalarının ölçülmesinde kukla değişkenler 1

Harcama Bir Kukla Değişkenli Modeller (Varyans Analiz Modelleri) Meslek Lisesi Devlet Lisesi N Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın. Birleştirilmiş Denklem Yıllık Okul Harcaması = b 1 + b 2 ML + u ML = 0 Devlet Lisesi Yıllık Okul Harcaması = b 1 ML= 1 Meslek Lisesi Yıllık Okul Harcaması = b 1 + b 2 2

120000.0 100000.0 b 1 +b 2 80000.0 60000.0 b 1 40000.0 20000.0 0.0 1 2 3 4 5 61 7 8 9 10 Devlet Lisesi Meslek Lisesi ML = 0 Devlet Lisesi ML= 1 Meslek Lisesi Yıllık Okul Harcaması = b 1 + b 2 ML + u 3

Harcama KUKLA DEĞİŞKENLERİN DİĞER KANTİTATİF DEĞİŞKENLERLE ALINDIĞI MODELLER (KOVARYANS ANALİZİ MODELLER) BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER Meslek Lisesi Devlet Lisesi Harcama:Okul harcaması N N:Öğrenci sayısı Bu kukla değişkenlerin açıklayıcı değişken olarak regresyon denkleminde nasıl yer aldıkları incelenecektir. 4

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın. Meslek lisesindeki öğrenciler belirli meslek dallarında yetenek sahibi olmaya çalışırken her meslek grubuna özgü gerekli olan araç ve gereçlerin temini için devlet lisesinde okuyan öğrencilere göre yıl içerisinde daha fazla harcama yapmaları gerekmektedir. Her iki lisede okuyan öğrencilerin harcamaları arasındaki farkı görmek için birinci yol iki grup içinde ayrı ayrı regresyon denklemi oluşturmaktır. Bununla birlikte iki ayrı regresyon denklemi kurmanın bazı sakıncaları olmaktadır. Bu sakıncalardan bir tanesi; büyük bir anakütle ile çalışmak yerine ayrı ayrı küçük örneklemler ile çalışmak katsayı tahminlerinin doğruluğu üzerinde ters etki olmasına neden olacaktır. 5

Harcama Meslek Lisesi b 1 ' Devlet Lisesi b 1 OCC = 0 Devlet Lisesi OCC = 1 Meslek Lisesi N Harcama = b 1 + b 2 N + u Harcama= b 1 ' + b 2 N + u İki lise harcamaları arasındaki fark için diğer bir yol ise ; meslek lisesi harcama denkleminin sabit terimi b 1 ' in devlet lisesinden daha büyük olduğunu varsayan bir hipotez kurmaktır. Aslında, bu varsayım ile her iki lise için yıllık marjinal maliyetlerin aynı fakat sabit maliyetlerin farklı olduğu varsayımı yapılmaktadır. Marjinal maliyet varsayımı görünüşte makul gözükmese de, bu varsayım anlatımı kolaylaştırmak için yapılmaktadır. 6

Harcama Meslek Lisesi b 1 ' d Devlet Lisesi b 1 N Devlet Lisesi Meslek Lisesi Harcama = b 1 + b 2 N + u Harcama = b 1 ' + b 2 N + u d İki sabit terim arasındaki fark olarak tanımlanabilir: d = b 1 ' - b 1. 7

d = b 1 ' - b 1 idi. b 1 ' = b 1 + d olacaktır ve meslek lisesine ait harcama fonksiyonu aşağıdaki gibi yazılabilir: OCC = 0 Devlet Lisesi OCC = 1 Meslek Lisesi Harcama = b 1 + b 2 N + u Harcama = b 1 + d + b 2 N + u Artık iki harcama fonksiyonunu birleştirip kukla değişken ML oluşturulabilir. ML öğrenci devlet lisesine gidiyor ise 0 değerini, meslek lisesine gidiyor ise 1 değerini almaktadır. Birleştirilmiş Denklem ML = 0 Devlet Lisesi ML= 1 Meslek Lisesi Harcama = b 1 + d ML + b 2 N + u Harcama = b 1 + b 2 N + u Harcama = b 1 + d + b 2 N + u 8

Harcama b 1 +d d Meslek Lisesi b 1 Devlet Lisesi N Her zaman kukla değişkenler sadece iki değer alırlar; 0 yada 1. Eğer ML 0 değerini alır ise harcama fonksiyonu devlet lisesine giden öğrencilerin harcama fonksiyonu olmakta, yada eğer ML 1 değerini alırsa harcama fonksiyonu meslek lisesine giden öğrencilerin harcama fonksiyonu olmaktadır. Birleştirilmiş Denklem ML = 0 Devlet Lisesi ML= 1 Meslek Lisesi Harcama = b 1 + d ML + b 2 N + u Harcama = b 1 + b 2 N + u Harcama = b 1 + d + b 2 N + u 9

Harcama 700000 600000 500000 400000 300000 200000 100000 0 Meslek Lisesi Devlet Lisesi 0 500 1000 1500 N Bu aşamada bir şehirdeki 74 lise için gerçek veri setini kullanarak regresyon denklemi oluşturulabilir. 10

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER Okul Okul Tipi Okul Harcaması N ML 1 Meslek 345,000 623 1 2 Meslek 537,000 653 1 3 Devlet 170,000 400 0 4 Meslek 526.000 663 1 5 Devlet 100,000 563 0 6 Devlet 28,000 236 0 7 Devlet 160,000 307 0 8 Meslek 45,000 173 1 9 Meslek 120,000 146 1 10 Meslek 61,000 99 1 Tablo ilk 10 okulun verilerini göstermektedir. Yıllık harcama yuan olarak ölçülmüştür. Bir yuan yaklaşık olarak 20 U.S centine eşittir. N okullardaki öğrenci sayısıdır. ML okul tipini gösteren kukla değişkendir. 11

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER. reg Harcama N ML Source SS df MS Number of obs = 74 ---------+------------------------------ F( 2, 71) = 56.86 Model 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total 1.4713e+12 73 2.0155e+10 Root MSE = 89248 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons -33612.55 23573.47-1.426 0.158-80616.71 13391.61 ------------------------------------------------------------------------------ Her ne kadar ML kukla değişken olsa da yeni bir açıklayıcı değişkenmiş gibi düşünülerek; Harcama değişkeni, N ve ML değişkenleri üzerine regresyona tabi tutulmaktadır. Katsayı yorumları: Regresyon sonuçları eşitlik şeklinde yeniden yazılabilir. ML değişkenine 0 ve 1 değerleri verilerek yeni eşitlikler türetilebilir. 12

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER ^ Harcama = -34,000 + 133,000ML + 331N Devlet Lisesi (ML = 0) ^ Harcama = -34,000 + 331N Eğer ML=0 olursa, devlet lisesine ait eşitlik elde edilir. Buradan yıllık marjinal harcamanın öğrenci başına 331 yuan olduğu ve sabit harcamanın da -34,000 Yuan olduğu ifade edilebilir. Kukla değişkenin katsayısı d ile tahminlenmektedir. Meslek lisesindeki öğrenciler için extra yıllık sabit harcamayı ifade etmektedir. 13

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER ^ Harcama = -34,000 + 133,000ML + 331N Devlet Lisesi (ML= 0) ^ Harcama = -34,000 + 331N Meslek Lisesi (ML = 1) ^ Harcama = -34,000 + 133,000 + 331N = 99,000 + 331N Eğer ML yerine 1 değeri konulursa, meslek lisesi öğrencileri için yıllık sabit harcamayı 99,000 yuan olarak hesaplayabiliriz. Meslek lisesindeki öğrencinin marjinal harcaması ise devlet okulundaki öğrenci ile aynıdır. 14

Harcama 700000 BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER 600000 500000 400000 300000 Meslek Lisesi Devlet Lisesi 200000 100000 0-100000 0 500 1000 1500 N Dağılma diyagramı regresyon sonuçlarından elde edilen iki harcama fonksiyonunu göstermektedir. 15

. reg Harcama N ML BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER Source SS df MS Number of obs = 74 ---------+------------------------------ F( 2, 71) = 56.86 Model 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total 1.4713e+12 73 2.0155e+10 Root MSE = 89248 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons -33612.55 23573.47-1.426 0.158-80616.71 13391.61 ------------------------------------------------------------------------------ Kukla değişkeninin katsayısını test etmek için; H 0 : d = 0 ve H 1 : d 0 hipotezleri t testi yardımı ile test edilebilir. Bir başka ifadeyle, H 0 hipotezi iki okul türü arasında sabit harcamalar bakımından fark olmadığını ifade etmektedir. ML nin katsayısının prob değeri 0.05 önem düzeyinden küçük olduğu için H 0 hipotezi reddedilebilmektedir. Yani iki okul türünün sabit harcamaları arasında fark vardır. 16

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER reg Harcama N ML Source SS df MS Number of obs = 74 ---------+------------------------------ F( 2, 71) = 56.86 Model 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total 1.4713e+12 73 2.0155e+10 Root MSE = 89248 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons -33612.55 23573.47-1.426 0.158-80616.71 13391.61 ------------------------------------------------------------------------------ Benzer şekilde diğer katsayılar içinde t-testi yapabiliriz. İlk olarak N ele alınırsa; N in katsayısının da istatistiksel olarak anlamlı olduğu söylenebilir. Bu da bize marjinal harcamaların istatistiksel olarak sıfırdan oldukça farklı olduğunu göstermektedir. 17

BİR KUKLA ve BİR KANTİTATİF DEĞİŞKENLİ MODELLER. reg Harcama N ML Source SS df MS Number of obs = 74 ---------+------------------------------ F( 2, 71) = 56.86 Model 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total 1.4713e+12 73 2.0155e+10 Root MSE = 89248 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons -33612.55 23573.47-1.426 0.158-80616.71 13391.61 ------------------------------------------------------------------------------ b 1 = 0 yani sabit terim için t istatistiğine baktığımızda bu katsayının anlamsız olduğu görülmektedir. 18

BİRDEN FAZLA KUKLA DEĞİŞKENLİ MODELLER Harcama = b 1 + d T TEK + d N NİT + d Tİ TİC + b 2 N + u Harcama:Okul harcaması Sadece bir D i kukla değişkenli modellerin yanında, D sayısı iki, üç, hatta yirmiye kadar olan modeller de söz konusu olmaktadır. Daha önce devlet lisesi ve meslek liseleri arasındaki harcama fonksiyonu arasındaki farkı belirtmek için kukla değişken kullanmıştık. Şangay da iki tip devlet okulu bulunmaktadır. Bunlardan bir tanesi olağan akademik eğitimin verildiği genel liseler, diğeri ise akademik eğitim ile birlikte ticaret eğitimi veren ticaret liseleridir. 19

Harcama = b 1 + d T TEK + d N NİT + d Tİ TİC + b 2 N + u Ticaret okullarının öğretim programı genel liselerden çok az bir farklılık göstermekte, sadece genel liselere göre birkaç ticaret eğitimleri bulunmaktadır. Aynı şekilde iki tip meslek lisesi bulunmaktadır. Teknik eğitim okulları(tek) ve Nitelikli (NİT) öğrenci yetiştiren liselerdir. Sonuçta kalitatif değişkenimiz dört gruba sahiptir. Uygulamada; bir kategori temel sınıf olarak seçilmektedir ve buna bağlı olarak diğer kukla değişkenler tanımlanmaktadır. Genellikle, kategoriler içerisinde en basit ve normal olan kategori temel sınıf olarak seçilmektedir. 20

Harcama = b 1 + d T TEK + d N NİT + d Tİ TİC + b 2 N + u Şangay örneğinde genel liseleri temel sınıf olarak seçmek en uygundur. Çünkü genel liseler sayıca çok olan liselerdir ve diğer liseler genel liselerin birer varyasyonlarıdır. Dolayısıyla okul tiplerine bağlı olarak üç tane kukla değişken tanımlayabiliriz. TEK : teknik eğitim okulları için kukla değişken; eğer öğrenci teknik okula gidiyorsa 1, diğer durumda 0 değerini alan kukla değişken. Benzer şekilde NİT ve TİC kukla değişkenleri sırasıyla nitelikli öğrenci yetiştiren ve ticaret eğitimi veren okullar için birer kukla değişkenlerdir. Her bir kukla değişkenin katsayı değeri bulunmaktadır ve bu katsayılar temel kategoriye göre her bir okul için ayrı ayrı ekstra harcama maliyetlerini ifade etmektedir. Dikkat edilirse temel kategori (referans kategori) modelde yer almamaktadır ve çıkarılmış kategori olarak ifade edilir. 21

Harcama = b 1 + d T TEK + d N NİT + d Tİ TİC + b 2 N + u Genel Lise Harcama = b 1 + b 2 N + u (TEK = NİT = TİC = 0) Eğer gözlem genel lise ile ilgili ise; diğer kukla değişkenler sıfır değerini almakta ve regresyon modeli en basit duruma indirgenmektedir. 22

Harcama = b 1 + d T TEK + d N NİT + d Tİ TİC + b 2 N + u Genel Lise Teknik Lise Harcama = b 1 + b 2 N + u (TEK = NİT = TİC = 0) Harcama = (b 1 + d T ) + b 2 N + u (TEK = 1; NİT= TİC = 0) Eğer gözlem teknik lise ile ilgili ise; TEK değişkeni 1 değerini, diğer kukla değişkenlerde 0 değerini almaktadır. Regresyon denklemi ise yukarıda gösterildiği gibi olmaktadır. 23

Harcama = b 1 + d T TEK + d N NİT + d Tİ TİC + b 2 N + u Genel Lise Teknik Lise Nitelikli Öğr. Yet. Lİsesi Ticaret Lisesi Harcama = b 1 + b 2 N + u (TEK = NİT = TİC = 0) Harcama = (b 1 + d T ) + b 2 N + u (TEK = 1; NİT = TİC = 0) Harcama = (b 1 + d N ) + b 2 N + u (NİT= 1; TEK = TİC = 0) Harcama = (b 1 + d Tİ ) + b 2 N + u (TİC = 1; TEK = NİT = 0) Benzer şekilde gözlem nitelikli öğrenci yetiştiren lisesi yada Ticaret lisesi ise, regresyon denklemleri yukarıda gösterildiği gibi oluşturulmaktadır. 24

Harcama Teknik b 1 +d T b 1 +d N Nitelikli d N d T Ticaret d Tİ b 1 +d Tİ b 1 Genel N Yukarıdaki diyagram modeli grafiksel olarak göstermektedir. d katsayısı; teknik, nitelikli ve ticaret lisesi için genel liseye göre ekstra gider harcamalarını ifade etmektedir. 25

Harcama Teknik b 1 +d T b 1 +d N Nitelikli d N d T Ticaret d Tİ b 1 +d Tİ b 1 Genel Dikkat edilecek olurda d katsayıların büyüklülüğü ve işaretleri için önceden bir varsayımda bulunulmamaktadır. Örnek verilerinden tahminlenecektir. N 26

Okul Tip Harcama N TEK NİT TİC 1 Teknik 345,000 623 1 0 0 2 Teknik 537,000 653 1 0 0 3 Genel 170,000 400 0 0 0 4 Nitelikli 526.000 663 0 1 0 5 Genel 100,000 563 0 0 0 6 Ticaret 28,000 236 0 0 1 7 Ticaret 160,000 307 0 0 1 8 Teknik 45,000 173 1 0 0 9 Teknik 120,000 146 1 0 0 10 Nitelikli 61,000 99 0 1 0 Yukarıdaki tabloda 74 liseden 10 tanesine ait veriler gösterilmektedir. Her bir kukla değişken TEK, NİT ve TİC kukla değişkenleri okul tiplerine göre oluşturulmuştur. 27

Harcama 700000 600000 500000 400000 300000 200000 100000 0 0 500 1000 1500 Teknik Lise Ticaret Lisesi Genel Lise Nitelikli Lisesi N Dağılma diyagramı yeni okulların verilerini göstermektedir. 28

. reg Harcama N TEK NİT TİC Source SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 ------------------------------------------------------------------------------ Verilere ait regresyon sonuçları tabloda gösterilmiştir. N in katsayısı her bir öğrenci için marjinal harcamayı ifade etmektedir ve yaklaşık 343 yuandır. 29

. reg Harcama N TEK NİT TİC Source SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 ------------------------------------------------------------------------------ TEK, NİT ve TİC değişkenlerinin katsayıları 154,000, 143,000, ve 53,000 sırasıyla genel liselere göre ilave yıllık sabit harcamaları ifade etmektedir. 30

. reg Harcama N TEK NİT TİC Source SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 ------------------------------------------------------------------------------ Sabit terim genel liselerde sabit harcamaların -55000 yuan olduğunu söylemektedir. 31

Harcama ^ = -55,000 + 154,000TEK + 143,000NİT+ 53,000TİC + 343N En üsteki regresyon sonuçlarını göstermektedir. Her bir okul için harcama fonksiyonları ayrı ayrı gösterilecektir. 32

Harcama= ^ -55,000 + 154,000TECH + 143,000NİT + 53,000TİC + 343N Genel Lise Harcama ^ = -55,000 + 343N (TEK= NİT = TİC = 0) Öğrenci başına yıllık marjinal harcama 343 yuandır. Öğrenci başına yıllık sabit harcamalar her bir okul için -55,000 yuan olarak tahmin 33 edilmiştir.

^ Harcama = -55,000 + 154,000TEK + 143,000NİT + 53,000TİC + 343N Genel Lise Harcama ^ = -55,000 + 343N (TEK= NİT = TİC = 0) Teknik Lise Harcama ^ = -55,000 + 154,000 + 343N (TEK = 1; NİT = TİC = 0) = 99,000 + 343N Genel liseye göre teknik lisenin ekstra yıllık sabit harcaması 154,000 yuan olarak tahminlenmiştir. 34

Harcama ^ = -55,000 + 154,000TEK + 143,000NİT + 53,000TİC + 343N Genel Lise Harcama ^ = -55,000 + 343N (TEK= NİT = TİC = 0) Teknik Lise Harcama ^ = -55,000 + 154,000 + 343N (TEK = 1; NİT = TİC = 0) = 99,000 + 343N Nitelikli Lisesi Harcama ^ = -55,000 + 143,000 + 343N (NİT = 1; TEK = TİC = 0) = 88,000 + 343N Ticaret Lisesi Harcama ^ = -55,000 + 53,000 + 343N (TİC = 1; TEK = NİT = 0) = -2,000 + 343N Benzer şekilde nitelikli öğrenci yetiştiren ve ticaret okulunun genel liseye göre yıllık ekstra harcaması 143,000 and 53,000 yuandır. 35

Harcama ^ = -55,000 + 154,000TECH + 143,000NİT + 53,000TİC + 343N Genel Lise Harcama ^ = -55,000 + 343N (TEK = NİT = TİC = 0) Teknik Lise Harcama ^ = -55,000 + 154,000 + 343N (TEK = 1; NİT = TİC = 0) = 99,000 + 343N Nitelikli Lisesi Harcama ^ = -55,000 + 143,000 + 343N (NİT = 1; TEK = TİC = 0) = 88,000 + 343N Ticaret Lisesi Harcama ^ = -55,000 + 53,000 + 343N (TİC = 1; TEK = NİT = 0) = -2,000 + 343N Dikkat edilirse öğrenci başına yıllık marjinal harcama 343 yuan olarak tahmin edilmiştir. 36

Harcama 700000 600000 500000 400000 300000 200000 100000 0-100000 0 200 400 600 800 1000 1200 1400 N Teknik Lise Ticaret Lisesi Genel Lise Nitelikli Dört harcama grafiği şekilde gösterilmiştir. 37

. reg Harcama N TEK NİT TİC Source SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 ------------------------------------------------------------------------------ Bütün katsayılar için t-testi yapabiliriz. N değişkenin katsayısı için t istatistiği 8.52 ve bu da bize beklenildiği gibi marjinal harcamaların istatistiksel olarak sıfırdan oldukça farklı olduğunu göstermektedir. 38

. reg Harcama N TEK NİT TİC Source SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 ------------------------------------------------------------------------------ Ayrıca teknik lise t-istatistiği katsayısı da istatistiksel olarak anlamlıdır. Bunun anlamı ise teknik lise yıllık sabit harcamalarının genel liselerin sabit harcamalarından oldukça büyük olduğunu göstermektedir. 39

. reg Harcama N TEK NİT TİC Source SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 ------------------------------------------------------------------------------ Benzer şekilde vasıflı NİT lerin t istatistiği 5.15 olarak bulunmuştur. 40

. reg Harcama N TEK NİT TİC Source SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 ------------------------------------------------------------------------------ Bununla birlikte Ticaret lisesinin t istatistiği sadece 1.71 dir ve bu da ticaret lisesi sabit harcamalarının genel lise sabit harcamalarında yeterince farklı olmadığını göstermektedir. Bu sonuç çok şaşırtıcı değil, çünkü ticaret lisesi genel liselerden çok farklı bir eğitime sahip değil. 41

. reg Harcama N TEK NİT TİC Source SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 ------------------------------------------------------------------------------ Son olarak kukla değişkenlerin ortak açıklayıcısı gücünü test etmek için F testi yapabiliriz. H 0 : d T = d N = d Tİ = 0 olarak tanımlanabilir. Alternatif hipotez ise en az bir d sıfırdan farklıdır şeklinde kurulmaktadır. 42

. reg Harcama N TEK NİT TİC Source SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 ------------------------------------------------------------------------------ Kukla değişkenli modelinde hata kareler toplamı 5.41 10 11. 43

. reg Harcama N Source SS df MS Number of obs = 74 ---------+------------------------------ F( 1, 72) = 46.82 Model 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05 ------------------------------------------------------------------------------ Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 339.0432 49.55144 6.842 0.000 240.2642 437.8222 _cons 23953.3 27167.96 0.882 0.381-30205.04 78111.65 ------------------------------------------------------------------------------ Kukla değişkensiz modelin hata kareler toplamı 8.92 10 11. 44

. reg Harcama N Source SS df MS Number of obs = 74 ---------+------------------------------ F( 1, 72) = 46.82 Model 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05. reg Harcama N TEK NİT TİC Source SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Değişkenlerin katsayılarına 0 sınırlaması konan genel F testi uygulanabilir. 45

. reg Harcama N Source SS df MS Number of obs = 74 ---------+------------------------------ F( 1, 72) = 46.82 Model 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05. reg Harcama N TEK NİT TİC Source SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 11 (8.92 10 5.41 10 F( 3,69) 11 5.41 10 / 69 11 ) / 3 14.92 f 1 = c =3 f 2 =n-k=74-5=69 F istatistiğinin payında hesaplanan RSS modeldeki kukla değişken sayısına bölünmektedir. Bir başka ifadeyle, modele eklenen yeni 46 değişken sayısına bölünmektedir.

. reg Harcama N Source SS df MS Number of obs = 74 ---------+------------------------------ F( 1, 72) = 46.82 Model 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05. reg Harcama N TEK NİT TİC Source SS df MS Number of obs = 74 ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 11 11 (8.92 10 5.41 10 ) / 3 F( 3,69) 14.92 F( 3,60) 11 crit, 0.1% 6. 17 5.41 10 / 69 H 0 hipotezi redddilebilir 47

KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU 1.HAL: Sabit Terimlerin Farklı Eğimlerin Eşit olması Yi b1 + b2di + b3xi + ui E(Y Di 0,X i) b1 + b3xi E(Y Di 1,X i) b1 + b2 + b3xi = 48

KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU 2.HAL: Sabit Terimlerin Eşit, Eğimlerin Farklı Olması Hali Yi b1 + b2dixi + b3xi + ui E(Y Di 0,X i) b1 + b3xi E(Y Di 1,X i) b 1 + (b2 + b 3)Xi = 49

Y i E(Y Di 1,X i) b 1 + (b2 + b 3)Xi ) b 2 + b 3 ) b 3 E(Y Di 0,X i) b1 + b3xi b 1 X i 50

KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU 3.HAL: Sabit Terim ve Eğimin İki Sınıf İçin Farklı Olması Yi b1 + b2di + b3dixi + b4xi + ui E(Y Di 0,X i) b1 + b4xi E(Y Di 1,X i) (b1 + b 2) + (b3 + b 4)Xi 51

Y i E(Y Di 1,X i) (b1 + b 2) + (b3 + b 4)Xi E(Y Di 0,X i) b1 + b4xi b 1 +b 2 ) b 4 ) b 3+b 4 b 1 X i 52

İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ Y i b1 + b2di + b3 DiXi + b4xi + ui Sabit terim farkı Eğim farkı 1. t testi ne bakılır. b 3 katsayısı anlamsız ve b 2 anlamlı ise 1.durum (sabit terim farklı eğimler aynı) -b 2 katsayısı anlamsız b 3 anlamlı ise 2. durum (sabit terim aynı eğimler farklı) her iki katsayı da anlamlı ise 3. durum (iki fonk. birbirinden farklıdır denir) 2. Chow Testi 53

Uygulama: İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ Yıllık Sigara Tüketimi Cinsiyet (D i ) (Erkek = 1, Kadın = 0) Yıllık Gelir (X i ) 25 1 400 20 0 260 19 0 270 24 1 360 20 0 240 22 1 310 21 1 280 18 0 200 19 0 260 22 1 320 Y b + b D + b D X + b X + u i 1 2 i 3 i i 4 i i 54

İKİ SINIF MODELLERİNİN FARKLILIĞININ KUKLA DEĞİŞKEN YÖNTEMİ İLE TESTİ Dependent Variable: Y Method: Least Squares Included observations: 10 Sabit Eğim Terim Farkı Farkı Variable Coefficient Std. Error t-statistic Prob. C 14.94231 2.598383 5.750619 0.0012 D i -3.786344 3.350850-1.129965 0.3016 X i 0.017308 0.010508 1.647020 0.1507 D i X 0.017555 0.012245 1.433624 0.2017 R-squared 0.955060 Mean dependent var 21.00000 Adjusted R-squared 0.932591 S.D. dependent var 2.260777 S.E. of regression 0.586972 Akaike info criterion 2.061496 Sum squared resid 2.067219 Schwarz criterion 2.182530 Log likelihood -6.307482 F-statistic 42.50422 Durbin-Watson stat 1.943502 Prob(F-statistic) 0.000195 55

Sonuç olarak İki sınıf tüketim fonksiyonlarının aynı olduğunu söyleyebiliriz. 56

BİR MODELDE KUKLA DEĞİŞKENLERİN KARŞILIKLI OLARAK BİRBİRİNİ ETKİLEMELERİ PROBLEMİ Yi b1 + b2d2 + b3d3 + b4xi + ui Y : Tüketim,X : Gelir i i D 2 1, Erkek D3 0, Kadın 1, Şehirde Oturanlar 0, Kırsal Kesimde Oturanlar Y b + b D + b D + b D D + b X + u i 1 2 2 3 3 4 2 3 5 i i E Y i D2 0,D3 0,Xi b1 + b5xi E Y D 1,D 1,X b + b + b + b + b X i 2 3 i 1 2 3 4 5 i Erkeğin Tüketim Farkı Şehirde Oturanların Tüketim Farkı Şehirde Oturan bir Erkeğin Tüketim 57 Farkı

b 4 katsayısının t istatistiğine bakılır. Şayet anlamlıysa iki kukla değişkenin modelde birlikte yer alması, bunların bireysel etkilerini azaltabilir veya arttırabilir. Bu durumda bu katsayının modelde yer almaması da spesifikasyon hatalarına yol açabilir. 58

MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA D 2 Üçer Aylar Karlar (Milyon Dolar) Şatışlar (Milyon Dolar) 1965-I 10503 114862 II 12092 123968 III 10834 121454 IV 12201 131917 1966-I 12245 129911 II 14001 140976 III 12213 137828 IV 12820 145465 1, İkinci Üç Aylık Dönem 1, Üçüncü Üç Aylık Dönem D3 0, Diğer Dönemler 0, Diğer Dönemler 1, Dördüncü Üç Aylık Dönem D4 0, Diğer Dönemler D 2 0 1 0 0 0 1 0 0 D 3 0 0 1 0 0 0 1 0 D 4 0 0 0 1 0 0 0 1 59

MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA Kar b + b D + b D + b D + b (Satış) + u 1 2 2 3 3 4 4 5 t t t Dependent Variable: Kar Variable Coefficient Std. Error t-statistic Prob. C 6688.363 1711.366 3.908201 0.0009 D 2 1322.892 638.4745 2.071957 0.0521 D 3-217.8054 632.2552-0.344490 0.7343 D 4 183.8564 654.2925 0.281000 0.7817 Satış 0.038246 0.011481 3.331281 0.0035 R 2 =0.525494 İstatistiki olarak anlamsız 60

MEVSİM DALGALANMALARININ ETKİSİNİN ARINDIRILMASINDA KUKLA DEĞİŞKENLERDEN FAYDALANMA Dependent Variable: Kar Sample: 1965:1 1970:4 VariableCoefficient Std. Error t-statistic Prob. C 6515.581 1623.083 4.014323 0.0006 D 2 1331.352 493.0214 2.700395 0.0134 Satış 0.039310 0.010575 3.717315 0.0013 R 2 = 0.515460 Mevsim dalgalanmalarının etkisinde 61

ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI UYGULAMA: 1935-1954 yıllarına arasında General Motor, Westinghouse ve General Electric firmalarna ait yatırım (Y), firmanın değeri (X 2 ) ve sermaye stoğu (X 3 ) verilerine ait tablo aşağıda verilmiştir. 62

ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI Firmaların yatırımları arasında fark olup olmadığını inceleyebilmek için de kukla değişkenlerden yararlanabiliriz. Firmaların ilk üç yıllarına ait veriler ile oluşturulan yeni tablo aşağıdaki gibidir. Yıllar Y X2 X3 D i Firma 1935 317.6 3078.5 2.8 1 GM 1936 391.8 4661.7 52.6 1 GM 1937 410.6 5387.1 156.9 1 GM 1935 12.93 191.5 1.8 0 WE 1936 25.90 516.0 0.8 0 WE 1937 35.05 729.0 7.4 0 WE 1935 33.1 1170.6 97.8 0 GE 1936 45.0 2015.8 104.4 0 GE 1937 77.2 2803.3 118.0 0 GE 63

ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI Yi b1 + b2x2 + b3x3 + b4di + ui GM yatırımlarının diğer firma yatırımlarından sabit terim kadar farklı olduğunu ifade etmektedir. D i 1, G.M gözlemleri için 0, Diğerleri için 64

ZAMAN SERİSİ VE ÇAPRAZ-KESİT VERİLERİNİN BİRARAYA GETİRİLMESİNDE KUKLA DEĞİŞKENLERİN KULLANIMI Dependent Variable: Y Method: Least Squares Included observations: 60 GM yatırımları, diğer firma yatırımlarından farklı ve fazladır. Variable Coefficient Std. Error t-statistic Prob. C -61.80754 23.79039-2.598004 0.0120 X2 0.038311 0.016752 2.286884 0.0260 X3 0.347303 0.032048 10.83683 0.0000 D i 278.5911 51.74338 5.384091 0.0000 R-squared 0.924866 Mean dependent var 251.067 Adjusted R-squared 0.920841 S.D. dependent var 311.6501 S.E. of regression 87.68352 Akaike info criterion 11.84969 Sum squared resid 430550.4 Schwarz criterion 11.9893 Log likelihood -351.4906 F-statistic 229.7778 Durbin-Watson stat 0.502776 Prob(F-statistic) 0.000000 İstatistiki olarak anlamlı 65

ÖRNEKLER 66

Örnek: Özel bir üniversitede öğretim üyelerinin yıllık maaşları ile cinsiyetleri arasında önce varyans daha sonra tecrübe değişkeni eklenerek kovaryans modeli oluşturulacaktır: Y i = a + b D i +u i Y i = Öğretim Üyelerinin Yıllık Maaşları D i = 1 Öğretim Üyesi Erkekse = 0 Diğer Durumlar (yani Kadın Öğretim Üyesi) Varyans Analiz Modelleri (ANOVA) Kadın Öğretim Üyelerinin Ortalama Maaşları: E( Y i D i = 0 ) = a Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Y i D i = 1) = a + b 67

25 24 23 22 21 20 3.280 19 18 21.280 17 16 18.00 15-0.5 0 0.5 1 1.5 2 Y i = 18 + 3.28 D i (0.32) (0.44) t (57.74)(7.44), R 2 =0.8737 68

Y i = a 1 + a 2 D i + b X i + u i Y i = Öğretim Üyelerinin Yıllık Maaşları X i = Öğretim Üyesinin Yıl olarak Tecrübesi D i = 1 Öğretim Üyesi Erkekse = 0 Diğer Durumlar (yani Kadın Öğretim Üyesi) Kadın Öğretim Üyelerinin Ortalama Maaşları : E( Y i X i,d i = 0 ) = a 1 +bx i Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Y i X i,d i = 1) = (a 1 + a 2 +bx i 69

Maaş Cinsiyet Tecrübe 22 1 16 19 0 12 18 0 12 21.7 1 15 18.5 0 10 21 1 11 20.5 1 13 17 0 8 17.5 0 9 21.2 1 14 70

Yıllık Maaş Y a 2 Erkek Kadın Y (a 1 + a 2 +bx i Y a 1 +bx i D i = 1 Öğretim Üyesi Erkekse = 0 Öğretim Üyesi Kadınsa a 1 Tecrübe (yıl olarak) X Y i = 15.051 + 2.239 D i + 0.289 X i s(b) (0.95) (0.44) (0.09) p (0.000) (0.002) (0.020), R 2 =0.949 71

DATA7-19 1960-1988 yılları arasında Türkiye deki Sigara Tüketimi Q Yetişkinlerin sigara tüketim miktarı(kg), Range 1.86-2.723. Y GNP(1968) TL, Range 2560-5723. P Türkiye deki sigara fiyatları Range 1.361-3.968. ED1 Kayıtlı ortaokul ve lise mezunu nüfus oranı(12-17 yaş) Range 0.112-0.451. ED2 Kayıtlı üniversite mezunu oranı (20-24) Range 0.026-0.095. D82 D86 = 1, 1982 ve sonrası = 1, 1986 ve sonrası 72

Dependent Variable: Q Sample: 1960 1988 Included observations: 29 Variable Coefficient Std. Error t-statistic Prob. P -0.097291 0.079389-1.225493 0.2340 ED2-5.547295 2.679248-2.07046 0.0509 ED1-2.994166 2.708828-1.105336 0.2815 D86-0.262700 0.090825-2.89238 0.0087 D82-0.288739 0.083649-3.451774 0.0024 Y 0.000762 0.000190 4.009205 0.0006 C 5.1139345 0.34132 0.101585 0.9200 Katsayılar istatistiki olarak anlamsız 73

Dependent Variable: Q Method: Least Squares Sample: 1960 1988 Included observations: 29 Variable Coefficient Std. Error t-statistic Prob. ED2-6.455259 2.724204-2.369595 0.0266 D86-0.351822 0.078985-4.454297 0.0002 D82-0.269429 0.084743-3.179385 0.0042 Y 0.000672 0.000170 3.945228 0.0006 C 58.18878 33.26618 1.749187 0.0936 74

DATA7-2 Belirli bir şirkette çalışan 49 kişinin istihdam durumu ve ücretleri WAGE = Aylık Ücret (Range 981-3833) EDUC = 8 yıllık eğitimden sonraki sahip olunan eğitim seviyesi(range 1-11) EXPER =Şirkette çalışma süresi(range 1-23) AGE = Yaş (25-64) GENDER = 1, Erkek ise; 0 kadın ise RACE = 1, beyaz ise; 0 diğerleri CLERICAL = 1 büro memuru ise, 0 diğerleri MAINT = 1 bakım işlerinde çalışıyor ise; 0 diğerleri CRAFTS =1,usta ise; 0 diğerleri Temel sınıf Profesyonel meslek grupları. 75

Dependent Variable: WAGE Method: Least Squares Included observations: 49 Variable Coefficient Std. Error t-statistic Prob. C 1637.202 263.6726 6.209224 0.0000 EDUC 49.33178 27.99678 1.762052 0.0855 EXPER 27.29509 9.488883 2.876533 0.0064 GENDER 473.6966 152.4818 3.106578 0.0034 RACE 207.0888 130.4491 1.587506 0.1201 CLERICAL-946.7380 174.6505-5.420758 0.0000 MAINT -1053.424 203.4297-5.178320 0.0000 CRAFTS -708.8822 176.0507-4.026580 0.0002 R-squared 0.737516 Mean dependent var 1820.204 Adjusted R-squared 0.692702 S.D. dependent var 648.2687 S.E. of regression 359.3643 Akaike info criterion 14.75483 Sum squared resid 5294850. Schwarz criterion 15.06370 Log likelihood -353.4934 F-statistic 16.45717 Durbin-Watson stat 2.107977 Prob(F-statistic) 0.000000 76

DATA 7-9 1985 yılında koleje giriş yapan öğrencilerin ilk yıl başarılarını göstermekte colgpa = 1986 sonbaharındaki ortalamaları (Range 0.85-3.97) hsgpa = Lise GPA (Range 2.29-4.5) vsat = Sözel derecesi (Range 200-700) msat = Sayısal derecesi (Range 330-770) dsci = 1 Bilim dalı için, 0 diğerleri dsoc = 1 Sosyal bilim dallı için, 0 diğerleri dhum = 1 Beşeri bilimdalı için 0 diğerleri darts = 1 Sanat dalı için, 0 diğerleri dcam = 1 Öğrenci kampüste yaşıyorsa, 0 diğerleri dpub = 1 Genel lise mezunu ise, 0 diğerleri 77

Dependent Variable: COLGPA Method: Least Squares Sample: 1 427 Included observations: 427 Variable Coefficient Std. Error t-statistic Prob. C 0.367296 0.224302 1.637506 0.1023 HSGPA 0.405914 0.063418 6.400630 0.0000 VSAT 0.000726 0.000290 2.503907 0.0127 MSAT 0.001086 0.000303 3.586609 0.0004 DSCI -0.027323 0.057319-0.476673 0.6338 DSOC 0.056148 0.072778 0.771494 0.4409 DHUM -0.004059 0.141771-0.028632 0.9772 DARTS 0.228650 0.188921 1.210294 0.2269 DCAM -0.040705 0.052162-0.780362 0.4356 DPUB 0.029403 0.063040 0.466416 0.6412 Katsayılar istatistiki olarak anlamsız 78

Dependent Variable: COLGPA Variable Coefficient Std. Error t-statistic Prob. C 0.423249 0.219749 1.926053 0.0548 HSGPA 0.398349 0.060586 6.574882 0.0000 VSAT 0.000737 0.000281 2.627361 0.0089 MSAT 0.001015 0.000294 3.457749 0.0006 79