KUKLA DEĞİŞKENLİ MODELLER Bir kukla değişkenli modeller (Varyans Analiz Modelleri) Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller (Kovaryans Analizi Modeller) Kukla değişkenlerin karşılıklı olarak birbirini etkilemeleri Mevsim dalgalanmalarının ölçülmesinde kukla değişkenler Parçalı Doğrusal ğ Regresyon Bir Kukla Değişkenli Modeller (Varyans Analiz Modelleri) Harcama Devlet Lisesi Mes lek 1 2 3 4 5 6 7 Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın. 1
Bir Kukla Değişkenli Modeller (Varyans Analiz Modelleri) Devlet Lisesi Mes lek 1 2 3 4 5 6 7 Birleştirilmiş Denklem Harcama = β 1 + β 2 ML + u ML = 0 Devlet Lisesi Harcama = β 1 ML= 1 Meslek Lisesi Harcama = β 1 + β 2 Bir Kukla Değişkenli Modeller (Varyans Analiz Modelleri) 120000,0 100000,0 β 1 +β 2 80000,0 60000,0 β 1 40000,0 20000,0 0,0 1 2 3 4 5 6 7 8 9 10 Devlet Lisesi 1 Meslek Lisesi 2
Bir Kukla Değişkenli Modeller (Varyans Analiz Modelleri) Y i = α + β D i +u i Y i = Öğretim Üyelerinin Yıllık Maaşları i D i = 1 Öğretim Üyesi Erkekse = 0 Diğer Durumlar (yani Kadın Öğretim Üyesi) Varyans Analiz Modelleri (ANOVA) Kadın Öğretim Üyelerinin Ortalama Maaşları: E( Y i D i = 0 ) = α Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Y i D i = 1) = α + β Örnek 25 24 23 22 21 20 3.280 19 18 21.280 17 16 18.00 15-0.5 0 0.5 1 1.5 2 Y i = 18 + 3.28 D i (0.32) (0.44) t (57.74)(7.44), R 2 =0.8737 3
KUKLA DEĞIŞKENLERIN DIĞER KANTITATIF DEĞIŞKENLERLE ALıNDıĞı MODELLER (KOVARYANS ANALIZI MODELLER) Harca ama Meslek Lisesi Devlet Lisesi N Harcama:Okul harcaması N:Öğrenci sayısı Bu kukla değişkenlerin açıklayıcı değişken olarak regresyon denkleminde nasıl yer aldıkları incelenecektir.. 1 Har rcama Meslek Lisesi Devlet Lisesi N Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın. 2 4
Har rcama Meslek Lisesi Devlet Lisesi N Meslek lisesindeki öğrenciler belirli meslek dallarında yetenek sahibi olmaya çalışırken her meslek grubuna özgü gerekli olan araç ve gereçlerin temini için devlet lisesinde okuyan öğrencilere göre yıl içerisinde daha fazla harcama yapmaları gerekmektedir. 3 Har rcama Meslek Lisesi Devlet Lisesi N Her iki lisede okuyan öğrencilerin harcamaları arasındaki farkı görmek için birinci yol iki grup içinde ayrı ayrı regresyon denklemi oluşturmaktır.. 4 5
Har rcama Meslek Lisesi Devlet Lisesi N Bununla birlikte iki ayrı regresyon denklemi kurmanın bazı sakıncaları olmaktadır. Bu sakıncalardan bir tanesi; büyük bir anakütle ile çalışmak yerine ayrı ayrı küçük örneklemler ile çalışmak katsayı tahminlerinin doğruluğu üzerinde ters etki olmasına neden olacaktır. 5 Harcama β 1 ' β 1 Meslek Lisesi Devlet Lisesi β 1 N OCC = 0 Devlet Lisesi OCC = 1 Meslek Lisesi Harcama = β 1 + β 2 N + u Harcama= β 1 ' + β 2 N + u İki lise harcamaları arasındaki fark için diğer bir yol ise ; meslek lisesi ücret denkleminin sabit terimi β 1 ' in devlet lisesinden daha büyük olduğunu varsayan bir hipotez kurmaktır. 6 6
Harcama β 1 ' Meslek Lisesi β 1 Devlet Lisesi N Devlet Lisesi Meslek Lisesi Harcama= β 1 + β 2 N + u Harcama= β 1 ' + β 2 N + u Aslında, bu varsayım ile her iki lise için yıllık marjinal maliyetlerin aynı fakat sabit maliyetlerin farklı olduğu varsayımı yapılmaktadır. Marjinal maliyet varsayımı görünüşte makul gözükmese de, bu varsayım anlatımı kolaylaştırmak için yapılmaktadır. 7 Ücret β 1 ' Meslek Lisesi β 1 δ Devlet Lisesi N Devlet Lisesi Harcama = β 1 ' + β 2 N + u Harcama = β 1 + β 2 N + u Meslek Lisesi δ İki sabit terim arasındaki fark olarak tanımlanabilir: δ = β 1 ' - β 1. 8 7
Harcama β 1 +δ δ Meslek Lisesi Devlet Lisesi β 1 N OCC = 0 Devlet Lisesi OCC = 1 Meslek Lisesi Harcama = β 1 + β 2 N + u Harcama = β 1 + δ + β 2 N + u β 1 ' = β 1 + δ olacaktır ve meslek lisesine ait harcama fonksiyonu yukarıdaki gibi yazılabilir. 9 Harcama β 1 +δ Meslek Lisesi δ Devlet Lisesi β 1 N Birleştirilmiş Denklem Harcama = β 1 + δ ML + β 2 N + u ML = 0 Devlet Lisesi Harcama = β 1 + β 2 N + u ML= 1 Meslek Lisesi Harcama = β 1 + δ + β 2 N + u Artık iki harcama fonksiyonunu birleştirip kukla değişken ML oluşturulabilir. ML kukla değişkeni öğrenci devlet lisesine gidiyor ise 0 değerini, meslek lisesine gidiyor ise 1 değerini almakatadır. 10 8
Harcama β 1 +δ δ Meslek Lisesi β 1 Devlet Lisesi N Birleştirilmiş Denklem Harcama = β 1 + δ ML + β 2 N + u ML = 0 Devlet Lisesi Harcama = β 1 + β 2 N + u ML= 1 Meslek Lisesi Harcama = β 1 + δ + β 2 N + u Her zaman kukla değişkenler sadece iki değer alırlar; 0 yada 1. Eğer ML 0 değerini alır ise harcama fonksiyonu devlet lisesine giden öğrencilerin harcama fonksiyonu olmakta, yada eğer ML 1 değerini alırsa harcama fonksiyonu Meslek lisesine giden öğrencilerin harcama fonksiyonu olmaktadır. 11 Harcama 700000 600000 500000 400000 300000 200000 100000 0 0 500 1000 1500 N Meslek Lisesii Devlet Lisesi Bu aşamada Şangay daki 74 lise için gerçek veri setini kullanarak regresyon denklemi oluşturulabilir. 12 9
Okul Tip Harcama N ML 1 Meslek 345,000 623 1 2 Meslek 537,000 653 1 3 Devlet 170,000000 400 0 4 Meslek 526.000 663 1 5 Devlet 100,000 563 0 6 Devlet 28,000 236 0 7 Devlet 160,000 307 0 8 Meslek 45,000 173 1 9 Meslek 120,000 146 1 10 Meslek 61,000 99 1 Tablo ilk 10 okulun verilerini göstermektedir. Yıllık harcama yuan olarak ölçülmüştür. Bir yuan yaklaşık olarak 20 U.S centine eşittir. N okullardaki öğrenci sayısıdır. 13 Okul Tip Harcama N ML 1 Meslek 345,000 623 1 2 Meslek 537,000 653 1 3 Devlet 170,000000 400 0 4 Meslek 526.000 663 1 5 Devlet 100,000 563 0 6 Devlet 28,000 236 0 7 Devlet 160,000 307 0 8 Meslek 45,000 173 1 9 Meslek 120,000 146 1 10 Meslek 61,000 99 1 ML okul tipini gösteren kukla değişkendir. 14 10
. reg Harcama N ML ---------+------------------------------ F( 2, 71) = 56.86 Model 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total 1.4713e+12 73 2.0155e+10 Root MSE = 89248 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons -33612.55 23573.47-1.426 0.158-80616.71 13391.61 Her ne kadar ML değişkeni kukla bir değişken olsa da yeni bir açıklayıcı değişkenmiş gibi düşünülerek; Harcama değişkeni, N ve ML değişkenleri üzerine regress edilebilmektedir. 15. reg Harcama N ML ---------+------------------------------ F( 2, 71) = 56.86 Model 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total 1.4713e+12 73 2.0155e+10 Root MSE = 89248 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons -33612.55 23573.47-1.426 0.158-80616.71 13391.61. Katsayı yorumları: 16 11
Harcama = -34,000 + 133,000ML + 331N Regresyon sonuçları eşitlik şeklinde yeniden yazılabilir. ML değişkenine 0 ve 1 değerleri verilerek yeni eşitlikler türetilebilir. 17 Harcama = -34,000 + 133,000ML + 331N Devlet Lisesi (ML = 0) Harcama = -34,000 + 331N Eğer ML=0 olursa, devlet lisesine ait eşitlik elde edilir. Buradan yıllık marjinal harcamanın öğrenci başına 331 yuan olduğu ve sabit harcamanın da -34,000 Yuan olduğu ifade edilebilir. 18 12
Harcama = -34,000 + 133,000ML + 331N Devlet Lisesi (ML = 0) Harcama = -34,000 + 331N Kukla değişkenin katsayısı δ ile tahminlenmektedir. Meslek lisesindeki öğrenciler için extra yıllık sabit harcamayı ifade etmektedir. 20 Harcama = -34,000 + 133,000ML + 331N Devlet Lisesi (ML= 0) Harcama = -34,000 + 331N Meslek Lisesi (ML = 1) Harcama = -34,000 + 133,000 + 331N = 99,000 + 331N Eğer ML yerine 1 değeri konulursa, meslek lisesi öğrencileri için yıllık sabit harcamayı 99,000 yuan olarak hesaplayabiliriz. Meslek lisesindeki öğrencinin marjinal harcaması ise devlet okulundaki öğrenci ile aynıdır. 21 13
Harcama 700000 600000 500000 400000 300000 200000 100000 Meslek Lisesi Devlet Lisesi 0-100000 0 500 1000 1500 N Dağılma diyagramı regresyon sonuçlarından elde edilen iki harcama fonksiyonunu göstermektedir. 22. reg Harcama N ML ---------+------------------------------ F( 2, 71) = 56.86 Model 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total 1.4713e+12 73 2.0155e+10 Root MSE = 89248 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons -33612.55 23573.47-1.426 0.158-80616.71 13391.61 Katsayıları hesaplamak için ayrıca regresyon sonuçlarında standart hata ve tanımlayıcı istatistikler verilebilir. 23 14
. reg Harcama N ML ---------+------------------------------ F( 2, 71) = 56.86 Model 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total 1.4713e+12 73 2.0155e+10 Root MSE = 89248 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons -33612.55 23573.47-1.426 0.158-80616.71 13391.61 Kukla değişkeninin katsayısını test etmek için; H 0 : δ = 0 ve H 1 : δ 0 hipotezleri t testi yardımı ile test edilebilir. 24.reg Harcama N ML ---------+------------------------------ F( 2, 71) = 56.86 Model 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total 1.4713e+12 73 2.0155e+10 Root MSE = 89248 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons -33612.55 23573.47-1.426 0.158-80616.71 13391.61 Bir başka ifadeyle, H 0 hipotezi iki okul türü arasında sabit harcamalar bakımından fark olmadığını ifade etmektedir. Kukla değişken katsayısının prob değeri 0.05 önem düzeyinden küçük olduğu için H 0 hipotezi reddedilebilmektedir. 25 15
reg Harcama N ML ---------+------------------------------ F( 2, 71) = 56.86 Model 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total 1.4713e+12 73 2.0155e+10 Root MSE = 89248 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons -33612.55 23573.47-1.426 0.158-80616.71 13391.61 Benzer şekilde diğer katsayılar içinde t-testi yapabiliriz. İlk olarak N değişkeni ele alınırsa; N değişkeni katsayısının da istatistiki olarak anlamlı olduğu söylenebilir. Bu da bize marjinal harcamaların istatistiki olarak sıfırdan oldukça farklı olduğunu göstermektedir. 26. reg Harcama N ML ---------+------------------------------ F( 2, 71) = 56.86 Model 9.0582e+11 2 4.5291e+11 Prob > F = 0.0000 Residual 5.6553e+11 71 7.9652e+09 R-squared = 0.6156 ---------+------------------------------ Adj R-squared = 0.6048 Total 1.4713e+12 73 2.0155e+10 Root MSE = 89248 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 331.4493 39.75844 8.337 0.000 252.1732 410.7254 ML 133259.1 20827.59 6.398 0.000 91730.06 174788.1 _cons -33612.55 23573.47-1.426 0.158-80616.71 13391.61 β 1 = 0 yani sabit terim için t istatistiğine baktığımızda bu katsayının anlamsız olduğu görülmektedir.. 27 16
COVA Model Y i = α 1 + α 2 D i + β X i + u i Y i = Öğretim Üyelerinin Yıllık Maaşları X i = Öğretim Üyesinin Yıl olarak Tecrübesi D i = 1 Öğretim Üyesi Erkekse = 0 Diğer Durumlar (yani Kadın Öğretim Üyesi) KadınÖğretim Üyelerinin Ortalama Maaşları : E( Y i X i,d i = 0 ) = α 1 +βx i Erkek Öğretim Üyelerinin Ortalama Maaşları : E ( Y i X i,d i = 1) = (α 1 + α 2 )+βx i Maaş Cinsiyet Tecrübe 22 1 16 19 0 12 18 0 12 21.7 1 15 18.5 0 10 21 1 11 20.5 1 13 17 0 8 17.5 0 9 21.2 1 14 17
Y lık Maaş Yıll α 2 Erkek Kadın Y= (α 1 + α 2 )+βx i Y=α 1 +βx i α 1 Tecrübe (yıl olarak) X Y i = 15.051 + 2.239 D i + 0.289 X i s(b) (0.95) (0.44) (0.09) p (0.000) (0.002) (0.020), R 2 =0.949 Harcama = β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Harcama:Okul harcaması Bir önceki modellerde olduğu gibi sadece bir D i kukla değişkenli modelleri yanında, D sayısı 1 18
Harcama= β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Bir önceki bölümlerde devlet lisesi ve meslek liseleri arasındaki harcama fonksiyonu arasındaki farkı belirtmek için kukla değişken kullanmıştık. 2 Harcama = β 1 + δ T TEK + δ W NİT+ δ V TİC + β 2 N + u Şangay da iki tip devlet okulu bulunmaktadır. Bunlardan bir tanesi olağan akademik eğitimin verildiği genel liseler, diğeri ise akademik eğitim ile birlikte iş eğitimi veren ticaret liseleridir. 3 19
Harcama = β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Ticaret okullarının öğretim programı genel liselerden çok az bir farklılık göstermekte, sadece genel liselere göre birkaç atölye eğitimleri bulunmaktadır. 5 Harcama = β 1 + δ T TEK + δ W NİT+ δ V TİC+ β 2 N + u Aynı şekilde iki tip meslek lisesi bulunmaktadır. Teknik eğitim okulları(tek) ve Nitelikli (NİT) öğrenci yetiştiren liselerdir. 6 20
Harcama = β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Sonuçta kalitatif değişkenimiz dört gruba sahiptir. Uygulamada; bir kategori temel sınıf olarak seçilmektedir ve buna bağlı olarak diğer kukla değişkenler tanımlanmaktadır 7 Harcama = β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Genellikle, kategoriler içerisinde en basit ve normal olan kategori temel sınıf olarak seçilmektedir. 8 21
HARCAMA = β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Şangay örneğinde genel liseleri temel sınıf olarak seçmek en uygundur. Çünkü genel liseler sayıca çok olan liselerdir ve diğer liseler genel liselerin birer varyasyonlarıdır. 9 Harcama = β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Dolayısıyla okul tiplerine bağlı olarak üç tane kukla değişken tanımlayabiliriz. TEK : teknik eğitim okulları için kukla değişken; eğer öğrenci teknik okula gidiyorsa 1, diğer durumda 0 değerini alan kukla değişken. 10 22
Harcama = β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Benzer şekilde NİT ve TİC kukla değişkenleri sırasıyla nitelikli öğrenci yetiştiren ve ticaret eğitimi veren okullar için birer kukla değişkenlerdir. 11 Harcama= β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Her bir kukla değişkenin katsayı değeri bulunmaktadır ve bu katsayılar temel kategoriye göre her bir okul için ayrı ayrı ekstra harcama maliyetlerini ifade etmektedir 12 23
Harcama = β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Dikkat edilirse temel kategori (referans kategori) modelde yer almamaktadır ve çıkarılmış kategori olarak tabir edilir. 13 Harcama = β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Genel Lise Harcama = β 1 + β 2 N + u (TEK = NİT = TİC =0) Eğer gözlem genel lise ile ilgili ise; diğer kukla değişkenler sıfır değerini almakta ve regresyon modeli en basit duruma indirgenmektedir 14 24
Harcama = β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Genel Lise Teknik Lise Harcama = β 1 + β 2 N + u (TEK = NİT = TİC =0) Harcama = (β 1 + δ T ) + β 2 N + u (TEK = 1; NİT= TİC = 0) Eğer gözlem teknik lise ile ilgili ise; Tek değişkeni 1 değerini, diğer kukla değişkenlerde 0 değerini almaktadır. Regresyon denklemi ise yukarıda gösterildiği gibi olmaktadır. 15 Harcama = β 1 + δ T TEK + δ W NİT + δ V TİC + β 2 N + u Genel Lise Teknik Lise Nitelikli Öğr. Yet. Lİsesi Ticaret Lisesi Harcama = β 1 + β 2 N + u (TEK = NİT = TİC =0) Harcama = (β 1 + δ T ) + β 2 N + u (TEK = 1; NİT = TİC = 0) Harcama = (β 1 + δ W ) + β 2 N + u (NİT= 1; TEK = TİC = 0) Harcama = (β 1 + δ V ) + β 2 N + u (TİC =1;TEK = NİT =0) Benzer şekilde gözlem vasıflı NİT lisesi yada TİC lisesi ise, regresyon denklemleri yukarıda gösterildiği gibi oluşturulmaktadır. 16 25
Harcama Teknik β 1 +δ T β 1 +δ W Nitelikli δ W δ T Ticaret δ V β 1 +δ V β 1 Genel N Yukarıdaki diyagram modeli grafiksel olarak göstermektedir. δ katsayısı; teknik, nitelikli ve ticaret lisesi için genel liseye göre ekstra gider harcamalarını ifade etmektedir. 17 Harcama Teknik β 1 +δ T β 1 +δ W Nitelikli Ticaret δ V δ W δ T β 1 +δ V β 1 Genel N Dikkat edilecek olurda δ katsayıların büyüklülüğü ve işaretleri için önceden bir varsayımda bulunulmamaktadır. Örnek verilerinden tahminlenecektir. 18 26
Okul Tip Harcama N TEK NİT TİC 1 Teknik 345,000 623 1 0 0 2 Teknik 537,000 653 1 0 0 3 Genel 170,000 400 0 0 0 4 Vasıflı 526.000 663 0 1 0 5 Genel 100,000 563 0 0 0 6 İş 28,000 236 0 0 1 7 İş 160,000 307 0 0 1 8 Teknik 45,000 173 1 0 0 9 Teknik 120,000000 146 1 0 0 10 Nitelikli 61,000 99 0 1 0 Yukarıdaki tabloda 74 liseden 10 tanesine ait veriler gösterilmektedir. Her bir kukla değişken TEK, NİT ve TİC kukla değişkenleri okul tiplerine göre oluşturulmuştur. 19 800000 600000 400000 200000 Ha arcama 0 0 500 1000 1500 N Teknik Lise İş Lisesi Dağılma diyagramı yeni okulların verilerini göstermektedir. 20 27
. reg Harcama N TEK NİT TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 Verilere ait regresyon sonuçları tabloda gösterilmiştir. N değişkeninin katsayısı her bir öğrenci için marjinal harcamayı ifade etmektedir ve 343 yuandır. 21. reg Harcama N TEK NİT TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 NİT 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 TEK, NİT ve TİC değişkenlerinin katsayıları 154,000, 143,000, ve 53,000 sırasıyla genel liselere göre ilave yıllık sabit harcamaları ifade etmektedir. 22 28
. reg Harcama N TEK Vasıflı TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 Vasıflı 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 Sabit terim genel liselerde sabit harcamaların -55000 yuan olduğunu söylemektedir. Katsayının negatif olması modelde olası tanımlama hataları olabileceğini göstermektedir. 23 Harcama = -55,000 + 154,000TEK + 143,000Vasıflı+ 53,000TİC + 343N En üsteki regresyon sonuçlarını göstermektedir. Her bir okul için harcama fonksiyonları ayrı ayrı gösterilecektir. 24 29
Harcama = -55,000 + 154,000TEK + 143,000WORKER + 53,000TİC + 343N Genel Lise Harcama= -55,000 + 343N (TEK= WORKER = TİC = 0) In the case of a general school, the dummy variables are all 0 and the equation reduces to the intercept and the term involving N. 25 Harcama= -55,000 + 154,000TECH + 143,000WORKER + 53,000TİC + 343N Genel Lise Harcama = -55,000 + 343N (TEK= WORKER = TİC = 0) Öğrenci başına yıllık marjinal masraf 343 yuandır. Öğrenci başına yıllık sabit harcamalar her bir okul için -55,000 yuan olarak tahmin edilmiştir. 26 30
Harcama = -55,000 + 154,000TEK + 143,000WORKER + 53,000TİC + 343N Genel Lise Harcama = -55,000 + 343N (TEK= WORKER = TİC = 0) Teknik Lise Harcama = -55,000 + 154,000 + 343N (TEK = 1; WORKER = TİC = 0) = 99,000 + 343N Genel liseye göre teknik lisenin ekstra yıllık sabit harcaması 154,000 yuan olarak tahminlenmiştir. 27 Harcama = -55,000 + 154,000TEK + 143,000WORKER + 53,000TİC + 343N Genel Lise Harcama = -55,000 + 343N (TEK= WORKER = TİC = 0) Teknik Lise Harcama = -55,000 + 154,000 + 343N (TEK = 1; WORKER = TİC = 0) = 99,000 + 343N Vasıflı İşçiler Lisesi Harcama = -55,000 + 143,000 + 343N (WORKER = 1; TEK = TİC = 0) = 88,000 + 343N İş Lisesi Harcama = -55,000 + 53,000 + 343N (TİC = 1; TEK = WORKER = 0) = -2,000 + 343N Benzer şekilde vasıflı NİT ve iş okulunun genel liseye göre yıllık ekstra harcaması 143,000 and 53,000 yuandır. 28 31
Harcama = -55,000 + 154,000TECH + 143,000WORKER + 53,000TİC + 343N Genel Lise Harcama = -55,000 + 343N (TEK = WORKER = TİC = 0) Teknik Lise Harcama = -55,000 + 154,000 + 343N (TEK = 1; WORKER = TİC = 0) = 99,000 + 343N Vasıflı İşçiler Lisesi Harcama = -55,000 + 143,000 + 343N (WORKER = 1; TEK = TİC = 0) = 88,000 + 343N İş Lisesi Harcama = -55,000 + 53,000 + 343N (TİC = 1; TEK = WORKER = 0) = -2,000 + 343N Dikkat edilirse öğrenci başına yıllık marjinal harcama 343 yuan olarak tahmin edilmiştir. 29 700000 600000 500000 400000 COST 300000 200000 100000 0 0 200 400 600 800 1000 1200 1400-100000 N Technical schools Vocational schools General schools Workers' schools The four cost functions are illustrated graphically. 30 32
. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 WORKER 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 Bütün katsayılar için t-testi yapabiliriz. N değişkeni için t istatistiği 8.52 ve bu da bize beklenildiği gibi marjinal harcamaların istatistiki olarak sıfırdan oldukça farklı olduğunu göstermektedir. 31. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 WORKER 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 Ayrıca teknik lise t-istatistiği katsayısı da istatistiki olarak anlamlıdır. Bunun anlamı ise teknik lise yıllık sabit harcamalarının genel liselerin sabit harcamalarından oldukça büyük olduğunu göstermektedir. 32 33
. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 WORKER 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 Benzer şekilde vasıflı NİTlerin t istatistiği 5.15 olarak bulunmuştur.. 33. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 WORKER 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 Bununla birlikte Ticaret lisesinin t istatistiği sadece 1.71 dir ve bu da ticaret lisesi sabit harcamalarının genel lise sabit harcamalarında yeterince farklı olmadığını göstermektedir. 34 34
. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 WORKER 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 Bu sonuç çok şaşırtıcı değil, çünkü iş lisesi genel liselerden çok farklı bir eğitime sahip değil.. 35. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 WORKER 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _ cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 Burada önemli olan sıfır hipotez; diğer liselerin sabit harcamalarının ayrı ayrı olarak genel lise sabit harcamalarından farklı olmadığını ifade etmesidir.. 36 35
. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 WORKER 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _ cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 Son olarak kukla değişkenlerin ortak açıklayıcısı gücünü test etmek için F testi yapabiliriz. H 0 : δ T = δ W = δ V = 0 olarak tanımlanabilir. Alternatif hipotez ise en az bir δ sıfırdan farklıdır şeklinde kurulmaktadır. 37. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 342.6335 40.2195 8.519 0.000 262.3978 422.8692 TEK 154110.9 26760.41 5.759 0.000 100725.3 207496.4 WORKER 143362.4 27852.8 5.147 0.000 87797.57 198927.2 TİC 53228.64 31061.65 1.714 0.091-8737.646 115194.9 _ cons -54893.09 26673.08-2.058 0.043-108104.4-1681.748 Kukla değişkenli modelinde hata kareler toplamı 5.41 10 11. 38 36
. reg Harcama N ---------+------------------------------ F( 1, 72) = 46.82 Model 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05 Harcama Coef. Std. Err. t P> t [95% Conf. Interval] ---------+-------------------------------------------------------------------- N 339.0432 49.55144 6.842 0.000 240.2642 437.8222 _cons 23953.3 27167.96 0.882 0.381-30205.04 78111.65 Kukla değişkensiz modelin hata kareler toplamı 8.92 10 11. 39. reg Harcama N ---------+------------------------------ F( 1, 72) = 46.82 Model 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 Değişkenlerin katsayılarına 0 sınırlaması konan genel F testi uygulanabilir.. 40 37
. reg Harcama N ---------+------------------------------ F( 1, 72) = 46.82 Model 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 11 (8.92 10 5.41 10 F( 3,69) = 11 5.41 10 / 69 11 ) / 3 = 14.92 F istatistiğinin payında hesaplanan RSS modeldeki kukla değişken sayısına bölünmektedir. Bir başka ifadeyle, modele eklenen yeni değişken sayısına bölünmektedir. 41. reg Harcama N ---------+------------------------------ F( 1, 72) = 46.82 Model 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 11 (8.92 10 5.41 10 F( 3,69) = 11 5.41 10 / 69 11 ) / 3 = 14.92 42 38
. reg Harcama N ---------+------------------------------ F( 1, 72) = 46.82 Model 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 11 (8.92 10 5.41 10 F( 3,69) = 11 5.41 10 / 69 11 ) / 3 = 14.92 F istatistiği değeri 14.92 oalrak hesaplanmaktadır.. 43. reg Harcama N ---------+------------------------------ F( 1, 72) = 46.82 Model 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 11 11 (8.92 10 5.41 10 ) / 3 F( 3,69) = = 14.92 F( 3,60) 11 crit, 0.1% = 6. 17 5.41 10 / 69 F tables do not give the critical value for 3 and 69 degrees of freedom, but it must be lower than the critical value with 3 and 60 degrees of freedom. This is 6.17, at the 0.1% significance level. 44 39
. reg Harcama N ---------+------------------------------ F( 1, 72) = 46.82 Model 5.7974e+11 1 5.7974e+11 Prob > F = 0.0000 Residual 8.9160e+11 72 1.2383e+10 R-squared = 0.3940 ---------+------------------------------ Adj R-squared = 0.3856 Total 1.4713e+12 73 2.0155e+10 Root MSE = 1.1e+05. reg Harcama N TEK WORKER TİC ---------+------------------------------ F( 4, 69) = 29.63 Model 9.2996e+11 4 2.3249e+11 Prob > F = 0.0000 Residual 5.4138e+11 69 7.8461e+09 R-squared = 0.6320 ---------+------------------------------ Adj R-squared = 0.6107 Total 1.4713e+12 73 2.0155e+10 Root MSE = 88578 11 (8.92 10 5.41 10 F( 3,69) = 11 5.41 10 / 69 11 ) / 3 = 14.92 F( 3,60) 0.1% crit, = 6.17 Thus we reject H 0 at a high significance level. This is not exactly surprising since t tests show that TECH and WORKER have highly significant coefficients. 45 40