Bağımlı Kukla Değişkenler

Benzer belgeler
Bağımlı Kukla Değişkenler

Bağımlı Kukla Değişkenler

Normal Dağılımlılık. EKK tahmincilerinin ihtimal dağılımları u i nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.

Dependent Variable: Y Method: Least Squares Date: 03/23/11 Time: 16:51 Sample: Included observations: 20

ADMIT: Öğrencinin yüksek lisans programına kabul edilip edilmediğini göstermektedir. Eğer kabul edildi ise 1, edilmedi ise 0 değerini almaktadır.

A. Regresyon Katsayılarında Yapısal Kırılma Testleri

TABLO I: Bağımlı değişken; Tüketim,- bağımsız değişkenler; gelir ve fiyat olmak üzere değişkenlere ait veriler verilmiştir.

Normal Dağılımlılık. EKK tahmincilerinin ihtimal dağılımları u i nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.

KUKLA DEĞİŞKENLİ MODELLERDE KANTİTATİF DEĞİŞKEN SAYISININ İKİ SINIF İÇİN FARKLI OLMASI DURUMU

KUKLA DEĞİŞKENLİ MODELLER

BİRDEN ÇOK BAĞIMLI DEĞİŞKENİ OLAN MODELLER

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

Kukla Değişken Nedir?

0, model 3 doğruysa a3. Variable Coefficient Std. Error t-statistic Prob.

EKONOMETRİYE GİRİŞ II ÖDEV 4 ÇÖZÜM

BAĞIMLI KUKLA DEĞİŞKENLİ MODELLER A- KADININ İŞGÜCÜNE KATILIM MODELİ NİN DOM İLE E-VIEWS DA ÇÖZÜMÜ

Ekonometri I VARSAYIMLARI

Yuvalanmamış F testi- Davidson- MacKinnon J sınaması

1. YAPISAL KIRILMA TESTLERİ

KUKLA DEĞİŞKENLİ MODELLER

ÇOKLU DOĞRUSAL BAĞLANTI

İÇİNDEKİLER 1. GİRİŞ...

Appendix C: İstatistiksel Çıkarsama

İyi Bir Modelin Özellikleri

İstatistik ve Olasılık

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

ÇOKLU REGRESYON MODELİ. Bir bağımlı değişkene etki eden çok sayıda bağımsız değişkeni analize dahil ederek çoklu regresyon modeli uygulanabilir.

1. Basitlik 2. Belirlenmişlik Y t = b 1 (1-r)+b 2 X t -rb 2 X t-1 +ry t-1 +e t 3. R 2 ölçüsü 4. Teorik tutarlılık 5. Doğru Fonksiyonel Biçim

Nitel Tepki Bağlanım Modelleri

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

T.C. TRAKYA ÜNİVERSİTESİ İKTİSADİ VE İDARİ BİLİMLER FAKÜLTESİ İKTİSAT BÖLÜMÜ GENEL EKONOMİK SORUNLAR TÜFE NİN İŞSİZLİK ÜZERİNE ETKİSİ HAZIRLAYANLAR:

İstatistik ve Olasılık

OTOKORELASYON OTOKORELASYON

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

KUKLA DEĞİŞKENLİ MODELLER

500 BÜYÜK SANAYİ KURULUŞUNDA ÜRETİM, KÂRLILIK VE İSTİHDAM İLİŞKİLERİ. YÜKSEK LİSANS TEZİ Müh. Özlem KÖSTEKLİ. Anabilim Dalı: İşletme Mühendisliği

4. TAHMİN SONUÇLARININ DEĞERLENDİRİLMESİ Katsayıların Yorumu

BASİT REGRESYON MODELİ

Farklı Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = σ i2. Eşit Varyans. Hata. Zaman

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

YARI LOGARİTMİK MODELLERDE KUKLA DECİşKENLERİN KA TSA YıLARıNIN YORUMU

altında ilerde ele alınacaktır.

Dependent Variable: Y Method: Least Squares Date: 03/23/11 Time: 16:51 Sample: Included observations: 20

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

İçindekiler. Ön Söz... xiii

Ch. 12: Zaman Serisi Regresyonlarında Ardışık Bağıntı (Serial Correlation) ve Değişen Varyans

İstatistik ve Olasılık

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

Y = 29,6324 X 2 = 29,0871 X 3 = 28,4473 y 2 = 2,04 x 2 2 = 0,94 x 2 3 = 2,29 yx 2 = 0,19 yx 3 = 1,60 x 2 x 3 = 1,06 e 2 = 0,2554 X + 28,47 X 3-0,53

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1

İÇİNDEKİLER ÖN SÖZ...

İstatistiksel Kavramların Gözden Geçirilmesi

EVIEWS KULLANIMI (EVIEWS 8)

BÖLÜM 1: YAşAM ÇÖzÜMLEMEsİNE GİRİş... 1

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

Regresyon. Regresyon korelasyon ile yakından ilişkilidir

Appendix B: Olasılık ve Dağılım Teorisi

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37


Normallik Varsayımı ve Ençok Olabilirlik Yöntemi

Mühendislikte İstatistiksel Yöntemler

Matris Cebiriyle Çoklu Regresyon Modeli

UYGULAMA 2. Bağımlı Kukla Değişkenli Modeller

2016 YILI AKTÜERLİK SINAVLARI: İSTATİSTİK OLASILIK

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Ch. 5: SEKK (OLS) nin Asimptotik Özellikleri

En Yüksek Olabilirlik Yöntemi. İstatistikte, tüm anakütleler kendilerine karşılık gelen bir olasılık dağılımı ile tanımlanırlar.

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

MAK 210 SAYISAL ANALİZ

SIRADAN EN KÜÇÜK KARELER (OLS)

17 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

Normallik Varsayımı ve Ençok Olabilirlik Yöntemi

DOĞRUSAL ve DOĞRUSAL OLMAYAN SINIRLAMALAR DOĞRUSAL OLMAYAN SINIRLAMALARIN TESTİ

ZAMAN SERİLERİNDE REGRESYON ANALİZİ

OLS Yönteminin Asimptotik (Büyük Örneklem) Özellikleri SIRADAN EN KÜÇÜK KARELER (OLS) Asimptotik Özellikler: Tutarlılık. Asimptotik Özellikler

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

ÇOKLU REGRESYON ANALİZİNDE VARSAYIMLARDAN SAPMALARIN İNCELENMESİ

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

PANEL VERİ MODELLERİNİN TAHMİNİNDE PARAMETRE HETEROJENLİĞİNİN ÖNEMİ: GELENEKSEL PHILLIPS EĞRİSİ ÜZERİNE BİR UYGULAMA

İstatistik ve Olasılık

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Basit Regresyon Modeli BASİT REGRESYON MODELİ. Basit Regresyon Modeli. Basit Regresyon Modeli: y = β 0 + β 1 x + u

2018 YILI BİRİNCİ SEVİYE AKTÜERLİK SINAVLARI İSTATİSTİK VE OLASILIK 29 NİSAN 2018

QUANTILE REGRESYON * Quantile Regression

Değişen Varyans (Heteroscedasticity) Sabit Varyans (Homoscedasticity) Varsayımı Altında Basit Regresyon Modeli

İstatistik ve Olasılık

İstatistik ve Olasılık


1: DENEYLERİN TASARIMI VE ANALİZİ...

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

EKONOMETRİDE BİLGİSAYAR UYGULAMLARI EVİEWS UYGULAMA SORULARI VE CEVAPLARI

Korelasyon, Korelasyon Türleri ve Regresyon

ortalama ve ˆ ˆ, j 0,1,..., k

BÖLÜM 10 ÖRNEKLEME YÖNTEMLERİ

Transkript:

Bağımlı Kukla Değişkenler Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla değişkenler söz konusudur. Bu durumdaki modelleri tahmin etmek için dört yaklaşım vardır: -Doğrusal Olasılık Modeli -Logit Modeli -Probit Modeli -Tobit Modeli 1

Doğrusal Olasılık Modeli Y i = b 1 + b 2 X i +u i Y i = 1 Eğer i. Birey istenen özelliğe sahipse 0 Diğer Durumlarda X i = Bağımsız değişken Bu modele olasılıklı model denmesinin nedeni, Y nin X için şartlı beklenen değerinin, Y nin X için şartlı olasılığına eşit olmasıdır. E(Y i X i )=Pr(Y i =1 X i ) 2

Doğrusal Olasılık Modeli E(u i ) = 0 E(Y i X i )= b 1 + b 2 X i Y i değişkeninin olasılık dağılımı: Y i Olasılık 0 1-P i 1 P i Toplam 1 E(Y i X i ) = SY i P i =0.(1-P i ) + 1.(P i ) = P i E(Y i X i )= b 1 + b 2 X i = P i 0 E(Y i X i ) 1 3

DOM Tahminindeki Sorunlar u i hata teriminin normal dağılmayışı: Normallik varsayımının sağlanmaması durumunda tahmin ediciler sapmasızlıklarını korurlar. Nokta tahminde normallik varsayımı gözardı edilir. Örnek hacmi sonsuza giderken EKK tahmincileri çoğunlukla normal dağılıma uyarlar DOM ile yapılan istatistiksel çıkarsamalar normallik varsayımı altındaki EKK sürecine uyarlar 4

u ların Binom Dağılımlı Olması EKKY varsayımlarından biri u değerlerinin dağılımının normal olmasıdır. Bu varsayım sayesinde katsayı tahminlerinin güven aralıkları hesaplanıp, test yapılabilmektedir. DOM de u lar normal dağılmaz, binom dağılımı gösterir: Y b b X u u Y b b X Y i i i 1 2 1 2 1 ve 0 değerini aldığında Y i =1 için i 1 2 i u 1 b b X u b b X Y i =0 için i 1 2 i i u lar normal değildir. İki değerli binom dağılımlıdır. Ancak büyük örneklerde DOM güven aralıkları ve hipotez testleri geçerlidir ve EKKY normal dağılım varsayımının sağlandığı 5 kabul edilmektedir.

u i hata teriminin değişen varyanslı olması: DOM de u lar eşit varyanslı değillerdir. Bunun için kesikli bir Y değişkeni varyansından hareketle Var ( Y) ( Y Y yerine u alınarak Var ( u) ( u Y ). P( 2 i Y i u) 2 ). P( u) ( u ). P( 2 i u i ) Y i u i İhtimal=P(u i ) 0 -b 1 -b 2 X (1-P i ) 1 1-b 1 -b 2 X P i Var(u ) ( b b X) (1 P ) (1 b b X) (P ) 2 2 i 1 2 i 1 2 i Var(u i) (b1 b2x)(1 b1 b2x) Var(u ) E(Y X )[1 E(Y X )] P (1 P ) i i i i i 6

u nun varyansı farklıdır. u nun varyansı Y nin X için şartlı beklenen değerine bağlıdır ve sonuçta u nun varyansı X in değerine bağlı olacak ve eşit olmayacaktır. u i hata teriminin değişen varyanslı olması: Var(u i ) = P i (1-P i ) DOM nin EKKY ile tahmininde ortaya çıkan farklı varyans problemine aşağıdaki dönüşümlü modeli tahmin ederek çözüm getirmek mümkündür: Y b1 b2xi ui v v v v i i i i vi E(Y X i)[1 E(Y X i)] P i(1 P i) 7

DOM de Farklı Varyansı Önleme E(Y X i) ler bilinmediğinden bunun yerine örnek tahmini ˆi değerleri hesaplanarak konur. v Y ˆ (1 Y ˆ ) i i i ifadesinde yerine 0 E(Y i X i ) 1 varsayımının yerine gelmeyişi DOM de Y nin şartlı olasılığını gösteren E(Y X) nın 0 ila 1 arasında bulunması şarttır. Y; 0 ve 1 değerini almaktadır.bu şart Y anakütle için geçerlidir. Anakütlenin tahmincisi olmayabilir. Tahmini şartlı olasılıklar 0 ile 1 olmayabilir: Yˆi için geçerli 8

0 E(Y i X i ) 1 0 ile 1 arasında mıdır? DOM, EKKY ile elde edildikten sonra: 1- Bunlardan bir kısmı 0 dan küçük, negatif değerli ise, bunlar için Yˆi 0 değerini alır. 1 den büyük değerli ise bunlar için nin 1 e eşit olduğu kabul edilir. 2- Bunlardan bir kısmı 0 dan küçük, negatif değerli ise, bunlar için Yˆi 0.001 değerini alır. 1 den büyük değerli ise bunlar için ne 0.999 değeri verilir. Yˆi Yˆi 9

3- Bunlardan bir kısmı 0 dan küçük, negatif değerli ve 1 den büyük değerli ise bu gözlemler atılır. Dönüştürmeden sonra EKKY tekrar uygulanır ve farklı varyansın kalktığı görülebilir. u v eşit varyanslıdır. Bu yöntem Tartılı En Küçük Kareler Yöntemi (TEKKY) olarak adlandırılır. 10

R 2 Değerinin Genellikle Küçük Çıkarak, İlişkinin Uyumunu Gösteren Bir Ölçü Olamaması Belli bir X e karşılık gelen Y, ya 0 ya da 1 dir. Öyleyse bütün Y değerleri, ya X ekseni ya da 1 in hizasındaki doğru üzerinde yer alır. Genellikle klasik En Küçük Kareler yöntemi ile hesaplanan R 2, böyle modellerde 1 den çok küçük çıkma eğilimindedir. Çoğu uygulamada R 2, 0.2 ile 0.6 arasında yer alır. Tahmin edilen Y i, ya 0 a ya da 1 e yakın çıkacaktır. Bu nedenle John Aldrich ile Forrest Nelson Nitel bağımlı değişkeni olan modellerde, belirlilik katsayısının bir özetleme istatistiği olarak kullanılmasından kaçınılması gerektiğini ileri sürmektedir (Gujarati, 1995:546). 11

Doğrusal Olasılık Modeli D i = b 1 + b 2 M i +b 3 S i +u i D i = 1 Eğer i. Kadının bir işi varsa ya da iş arıyorsa 0 Diğer Durumlarda M i = 1 Eğer i. Kadın evliyse ve diğer durumlarda 0 S i = i.kadının yıl olarak aldığı eğitim 12

D i M i S i D i M i S i 1 0 16 1 0 10 1 1 14 1 1 14 1 1 16 0 1 10 0 0 9 0 1 12 1 0 12 1 0 13 0 1 12 1 0 14 1 0 14 1 1 12 1 0 10 0 1 7 0 0 12 0 1 11 1 0 8 0 1 12 1 0 11 1 1 10 1 0 14 1 0 15 0 1 12 0 1 10 1 1 13 0 1 11 0 1 9 1 1 12 Kadının İşgücüne Katılımı Modeli: D i = 1 i.kadının bir işi varsa ya da iş arıyorsa 0 Diğer Durumlarda M i = 1 i. Kadın evliyse 0 diğer durumlarda S i = i.kadının yıl olarak aldığı eğitim 13

Kadının İşgücüne Katılımı Modeli D i = b 1 + b 2 M i +b 3 S i +u i Dependent Variable: D I Included observations: 30 M i = 1 Kadın evliyse ;0 diğer durumlarda ; S i = i.kadının yıl olarak aldığı eğitim Variable Coefficient Std. Error t-statistic Prob. C -0.284301 0.435743-0.652452 0.5196 M I -0.381780 0.153053-2.494430 0.0190 S I 0.093012 0.034598 2.688402 0.0121 R-squared 0.363455 Mean dependent var 0.600000 Adjusted R-squared 0.316304 S.D. dependent var 0.498273 S.E. of regression 0.412001 Akaike info criterion 1.159060 Sum squared resid 4.583121 Schwarz criterion 1.299179 Log likelihood -14.38590 F-statistic 7.708257 Durbin-Watson stat 2.550725 Prob(F-statistic) 0.002247 14

Daha sonra modelde değişen varyans olup olmadığı araştırılmak istenmiş ve White testi ile modelde değişen varyans problemi test edilmiştir. White Heteroskedasticity Test: F-statistic 1.759076 Probability 0.138742 Obs*R-squared 6.589061 Probability 0.143265 Prob değeri 0.143265>0.05 olduğu için H 0 hipotezi olan Değişen varyans yoktur, eşit varyans vardır hipotezi red edilemez. Test sonucu değişen varyans problemi ile karşılaşılmadığından herhangi bir işlem yapılmaz. Model olduğu gibi kabul edilir. 15

UYGULAMA:Akıllı telefonunun kullanılıp kullanılmamasını ifade eden bağımlı kukla değişken 50 kişiye yapılan anket sonuncunda yaş ve aylık ortalama gelir ile açıklanmıştır.(y=1, akıllı telefona sahip ise, Y=0 akıllı telefona sahip değilse) Kişi Y X(Gelir) Z(Yaş) Kişi Y X(Gelir) Z(Yaş) 1 1 250 23 26 0 185 21 2 1 350 21 27 1 250 21 3 0 150 23 28 1 500 21 4 1 600 22 29 1 790 23 5 1 200 22 30 1 500 22 6 0 150 20 31 1 675 22 7 1 390 27 32 1 490 22 8 0 200 18 33 1 500 21 9 0 900 25 34 1 760 21 10 0 150 18 35 1 550 26 11 0 255 18 36 1 400 24 12 0 300 20 37 1 200 21 13 1 640 25 38 0 220 21 14 1 500 27 39 1 175 23 15 1 300 22 40 1 840 21 16 0 550 19 41 1 150 23 17 1 800 18 42 1 200 23 18 1 875 21 43 1 200 23 19 0 600 17 44 1 485 23 20 0 500 20 45 1 250 21 21 0 500 19 46 1 300 20 22 1 500 21 47 1 470 19 23 1 550 22 48 1 800 23 24 1 750 21 49 0 250 21 25 1 225 23 50 0 130 23 16

Y=1, akıllı telefona sahip ise, Y=0 akıllı telefona sahip değilse; X(Gelir); Z(Yaş) Dependent Variable: Y Method: Least Squares Included observations: 50 Variable Coefficient Std. Error t-statistic Prob. C -1.373086 0.585035-2.347017 0.0232 X 0.000492 0.000259 1.900372 0.0635 Z 0.086130 0.026781 3.216041 0.0024 R-squared 0.2401 Mean dependent var 0.700 Adjusted R-squared 0.207770 S.D. dependent var 0.462910 S.E. of regression 0.412024 Akaike info criterion 1.122653 Sum squared resid 7.978889 Schwarz criterion 1.2373 Log likelihood -25.06633 F-statistic 7.425357 Durbin-Watson stat 1.552777 Prob(F-statistic) 0.001577 Önce Modelde değişen varyansın olup olmadığı White testi ile araştırılır. 17

White Heteroskedasticity Test: F-statistic 2.305076 Probability 0.010504 Obs*R-squared 10.37848 Probability 0.01195 1. Prob değeri 0.01195<0.05 olduğu için H 0 hipotezi olan Değişen varyans yoktur, eşit varyans vardır hipotezi red edilir. Değişen varyans problemi ile karşılaşıldığından önce Y hesaplanır. 2. Y nin 0 dan küçük değerleri ve 1 den büyük değerleri veri setinden çıkartılır.. v Y ˆ (1 Y ˆ ) 3. Ardından hesaplanır. i i i 4. Y= b 1 + b 2 X + b 3 Z modelinin her iki tarafı da değerine bölünür. 5. Model tahmin edilir. vi 18

Kişi Kişi Kişi Kişi 1 0.7308 16 0.5338 31 0.8536 46 0.4970 2 0.6077 17 0.5705 32 0.7627 47 0.4944 3 0.6817 18 0.8658 33 0.6815 48 1.0012 4 0.8167 19 0.3861 34 0.8093 49 0.5586 5 0.6201 20 0.5953 35 1.1367 50 0.6718 6 0.4233 21 0.5092 36 0.8907 7 1.1442 22 0.6815 37 0.5340 8 0.2756 23 0.7922 38 0.5438 9 1.2226 24 0.8044 39 0.6939 10 0.2510 25 0.7185 40 0.8486 11 0.3026 26 0.5266 41 0.6817 12 0.4970 27 0.5586 42 0.7062 13 1.0948 28 0.6815 43 0.7062 14 1.1982 29 0.9963 44 0.8463 15 0.6693 30 0.7676 45 0.5586 Y Y Y Y 19

Dependent Variable: Y / v Method: Least Squares Sample: 1 50 Included observations: 44 Excluded observations: 6 Variable Coefficient Std. Error t-statistic Prob. 1/ v -1.960127 0.591996-3.311048 0.0019 X / v 0.000468 0.000170 2.754280 0.0087 Z/ v 0.114551 0.028194 4.062939 0.0002 R-squared 0.899751 Mean dependent var 1.9024 Adjusted R-squared 0.894861 S.D. dependent var 2.504969 S.E. of regression 0.812241 Akaike info criterion2.487706 Sum squared resid 27.04915 Schwarz criterion 2.609356 Log likelihood -51.72954 F-statistic 183.9907 Durbin-Watson stat 1.728717 Prob(F-statistic) 0.000000 20

DOM e Alternatif Model Arama Örnek büyüklüğü arttıkça hata terimi normal dağılıma yaklaşsa ve değişen varyans durumunda, ağırlıklı en küçük kareler yöntemi kullanılsa, modelin her iki tarafı vi ye bölünüp model değişimi yapılsa bile normallik ve değişen varyans varsayımlarıyla ilgili sakıncaları giderebilmek için logit ve probit modeller geliştirilmiştir. Bu modeller, hem 0 E( Y i X i ) 1 şartını sağlayabilmekte ve hem de P i ile X i arasındaki ilişkiyi doğrusallıktan kurtarabilmektedirler. Yani, logit ve probit modelleri, farklı bağımsız X değişkeninin olasılığının 0 ile 1 arasında kalmasını sağladıkları gibi; ayrıca, değişik bağımsız değişkene ait belli bir artış karşısında, bu bağımsız değişkenin kullanılma olasılığının değişik miktarda artmasını sağlamaktadırlar. 21

DOM e Alternatif Model Arama Günümüzde nitel değişkenlerden oluşan kukla değişken verileri analiz etmek için çeşitli teknikler kullanılmaktadır. Bunlardan log-linear modeller iki veya daha fazla kukla değişkenin koşullu ilişkisini analiz etmek için geliştirilmiştir. Bununla birlikte, log-linear modeller sayesinde, değişkenlerin oluşturduğu bileşik dağılımı, iki veya daha fazla değişkenin birbirine bağımlı olup olmadığını ve iki veya daha fazla değişken arasındaki ilişkiyi neden-sonuç ilişkisine dayandırmaksızın test etmek mümkündür. 22

DOM e Alternatif Model Arama DOM ile ilgili sayılan sorunların hepsi bir şekilde aşılabilir Ancak, DOM, P i =E(Y=1 X) olasılığının X le doğrusal olarak arttığını varsayar. Yani X deki marjinal veya küçük bir artış hep sabittir. Gerçek hayatta ise bu beklenen bir durum değildir. DOM ile ilgili sorunlar şu iki özellik sayesinde aşılabilir: 1.X i arttıkça P i =E(Y=1 X) de artar ancak 0 ile 1 aralığının dışına çıkmaması gerekmektedir. 2.P i ile X i arasındaki ilişkinin doğrusal olmaması gerekmektedir. 23

DOM e Alternatif Model Arama Yukarıdaki iki özelliği taşıyan modelin şekli aşağıda verilmiştir: 1 P KDF - 0 + X Yukarıdaki eğri kümülatif dağılım fonksiyonuna benzemektedir. Bu fonksiyon kukla bağımlı değişkenli regresyon modellerinde kullanılabilir. 24

Logit Model Logit modeller, genelleştirilmiş doğrusal modelin belirli koşullar altında oluşturulmuş özel durumlarıdır. Bu durumda, eğer bağımsız değişkenlerin bazısı sürekli veya uygun (ilgili) sınıflar içine ayrıştırılamazsa, o zaman log-linear analiz yerine logistik regresyon kullanılmalıdır. Aynı zamanda eğer değişkenlerin bazısı bağımlı olarak ele alınırsa, o zaman logit model uygundur. Böyle bir durumda 0 la 1 arasında kalma koşulunu sağlayabilmek için logit modelin uygulanması önerilmektedir. Logit model, bağımlı değişkenin tahmini değerlerini olasılık olarak hesaplayarak olasılık kurallarına uygun sınıflama yapma imkanı veren, tablolaştırılmış ya da ham veri setlerini analiz eden bir istatistiksel yöntemdir. 25

Logit Model Logistik Dağılım Fonksiyonu 1 1 P i =E(Y=1 X) (b 1 b2x i ) 1 e e Z 1 i Z b b X 1 2 kümülatif lojistik dağılım fonksiyonudur. Zi Zi 1 1 e 1 e 1 P 1 1 Zi 1 Zi 1 Zi e e e z Pi 1 1 e. z e Bahis yada olabilirlik oranı z z 1-Pi 1 e e Bu orana lehine fark oranı denir. Lojistik modelin her iki tarafının doğal log. alındığında Pi z L ln( ) ln i i ee 1 Pi L i fark oranı logaritması olup hem X, hem parametrelere göre doğrusaldır.z değişkeni - dan + a değişirken, P 0 ile 1 arasında değişir. i i 26

Logit Model Logit modelde olasılık 1 1 P i =E(Y=1 X) (b 1 b2x i ) 1 e e Z 1 i iken. DOM de P =E(Y=1 X) b b X i 1 2 i şeklindedir. 27

Logit Modelin Özellikleri 1. P i, 0 dan 1 e kadar değer aldığında, Logitte - ile + arasında değer alır. 2. Logit, X e göre doğrusal iken olasılıklara göre değildir. 3. Logit modelin b 2 katsayısı şu şekilde yorumlanır: Bağımsız değişkendeki bir birimlik değişme karşısında logitteki değişmeyi gösterir. 4. Logit model tahmin edildikten sonra, X bağımsız değişkeninin belirli bir değeri için logitin gerçekleşme olasılığı hesaplanabilir. 28

Logit Model 1.00 F(Z) 0.75 p F( Z) 1 1 e Z 0.50 Z X 1 2 0.25 0.00-8 -6-4 -2 0 2 4 6 Z Bir olayın gerçekleşme olasılığının birden büyük olması durumundan kaçınmak için olasılığın Z nin S şeklinde bir fonksiyonu olduğunu varsaymaktır. Z açıklayıcı değişkenlerin fonksiyonu olarak ifade edilebilir. 29 2

Logit Model 1.00 F(Z) 0.75 p F( Z) 1 1 e Z 0.50 0.25 Z X 1 2 0.00 Z -8-6 -4-2 0 2 4 6 Birçok fonksiyon S şeklinde fonksiyon özelliklere sahiptir ve yukarıda gösterildiği gibi bunlardan biri de lojistik fonksiyondur. Z + sonsuza gideren, e -Z sıfıra gitmekte, ve p 1 e gitmektedir. (fakat 1 i geçmemektedir.). Z sonsuza giderken, e -Z de sonsuza gitmekte ve p de sıfıra gitmektedir (fakat sıfırın 30 altına inmemektedir.). 3

A- Frekanslı Serilerde Logit Modelin EKKY İle Tahmini 1.Adım: hesaplanır. 2.Adım: Pi ni Ni L ln(p 1 P ) i i i L ln[n (N n )] i i i i ihtimalleri (nispi frekanslar) fark oranı logaritmaları hesaplanır. 3.Adım: Li b1 b2xi ui orijinal lojistik modeli tahminlenir. Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir. v i Li b1 b2xi ui i i i i v N P (1 P ) 31

Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir. v i vi Li b1 vi b2 vixi viui L b v b X w Dönüşümlü veya Tartılı * * 1 i 2 i i v N P (1 P ) i i i i EKK Lojistik Modeli wi ui vi 32

Frekanslı Seri İçin Logit Model Uygulaması 300 aileden oluşan küçük bir kasabada ailelerin, yıllık gelirleri (X i ) ve ev sahibi olanların sayısı (n i ) aşağıdaki tabloda gösterilmiştir. X Milyon TL) Aile Sayısı= N i Ev Sahibi Olan Aile Sayısı=n i Nispi Frekanslar P i =n i /N i 12 20 5 0.25 16 25 6 0.24 20 35 10 0.28 26 45 15 0.33 30 50 25 0.50 40 34 18 0.53 50 30 20 0.66 60 26 16 0.61 70 20 15 0.75 80 15 10 0.67 SN i = 300 Sn i = 140 33

X i 1 N i 2 n i 3 P i 4=3/2 1-P i 5=1-4 P i /1- P i 6=4/5 L i 7=ln(6) 12 20 5 0.25 0.75 0.33-1.1086 16 25 6 0.24 0.76 0.31-1.1712 20 35 10 0.28 0.72 0.39-0.9416 26 45 15 0.33 0.67 0.49-0.7133 30 50 25 0.50 0.50 1.00 0.0000 40 34 18 0.53 0.47 1.13 0.1222 50 30 20 0.66 0.34 1.94 0.6626 60 26 16 0.61 0.39 1.56 0.4446 70 20 15 0.75 0.25 3.00 1.0986 80 15 10 0.67 0.33 2.03 0.7080 34

Dependent Variable: L Method: Least Squares Included observations: 10 Variable Coefficient Std. Error t-statistic Prob. C -1.409706 0.215776-6.533192 0.0002 X 0.032669 0.004667 7.000011 0.0001 R-squared 0.859649 Mean dependent var -0.089870 Adjusted R-squared 0.842106 S.D. dependent var 0.835010 S.E. of regression 0.331799 Akaike info criterion 0.808280 Sum squared resid 0.880723 Schwarz criterion 0.868797 Log likelihood -2.041402 F-statistic 49.00015 Durbin-Watson stat 1.582165 Prob(F-statistic) 0.000113 35

v=n.p.(1-p) 8=2.4.5 3.75 4.56 7.05 9.95 12.50 8.47 6.73 6.18 3.75 3.31 v i 9= 8 1.9365 2.1354 2.6552 3.1543 3.5355 2.9103 2.5942 2.4859 1.9365 1.8193 L* 10=7.9-2.1468-2.5009-2.5001-2.4999 0.0000 0.3556 1.7189 1.1052 2.1274 1.2880 X* 11=1.9 23.2379 34.1666 53.1036 82.0134 106.0660 116.4130 129.7112 149.1576 135.5544 145.5472 36

L i* = -1.38056 v i + 0.03363 X i*, s= 0.8421 s(b i ): (0.2315) (0.00556), R 2 = 0.80 t= (-5.9617) (6.0424), d= 1.649, F= 36.95 Gelir bir birim arttığında, ev sahibi olma lehine fark oranının logaritması 0.033 artmaktadır. Bu fark oranına göre belli bir gelir seviyesinde ev sahibi olma olasılığı hesaplanabilir: X=40 iken vi 2.9103 X 116.4130 değerleri yukarıdaki denklemde yerine konduğunda L * =-0.10288 bulunur. ˆ ˆ P Anti L Anti Anti 1 Pˆ Pˆ 0.9022 1 Pˆ olabilirlik oranı * log log log( 0.10288) 0.9022 ˆ 0.4743 P 37

40 birim gelirli bir ailenin ev sahibi olma olasılığı %47.43 dür. Lojistik modelden, belli bir gelir seviyesinde gelirdeki bir birimlik artışın ev sahibi olma olasılığını ne ölçüde arttıracağı tahmin edilebilir: bˆ 2 (1 Pˆ) Pˆ formülünden yararlanılır. X=40 iken gelir 1 birim arttığında ev sahibi olma olasılığı [0.03363(1-0.4743)0.4743]=0.00838(%0.8) 38

B- En Yüksek Olabilirlik Yöntemiyle Logit Modelin Elde Edilmesi Frekanslı olmayan serilerde logit modeli EKKY ile çözülemez. Pi z L ln( ) ln e i Z 1 P i e i i P i =1 ve P i =0 değerleri logit L i deki yerine koyulduğunda ln(1/0) ve ln(0/1) değerleri elde edilir ki bunlar anlamsızdır. En küçük kareler yöntemi ile L fonksiyonundaki parametrelerin tahmin değerleri bulunamaz, fakat bu parametreler maksimum olabilirlik modeli ile tahmin edilebilir. 39

Örneğin aşağıda frekanslı olmayan bir serinin en yüksek olabilirlik yöntemi ile logit model tahmini yer almaktadır: 40

Modeldeki katsayılar aşağıdaki gibidir; 41

Logit modelde katsayılar doğrudan, bağımsız değişkenlerdeki bir değişimin bağımlı değişkenin beklenen değeri üzerindeki etkisi olarak yorumlanamamaktadır. Katsayının işareti bağımsız değişken ile olayın gerçekleşme olasılığı arasındaki ilişkinin yönünü gösterir. Modeldeki bağımsız değişkenlerin tümü olayın gerçekleşme olasılığı ile ters yönlü bir ilişki içerisindedir. 42

43

1 P =E(Y=1 X) 1 e i (b b X ) 1 2 i 44

45

46

47

48

Probit Model Probit model, y bağımlı değişkenin normal dağıldığını varsayarken, Logit model bu değişkenin lojistik eğriye dayandığını varsaymaktadır. Bu iki modelden Logit modelin dağılımda lojistik birikimli dağılım fonksiyonunun kuyruk bölgeleri Probit modele göre daha geniştir. Nitel olarak ele alındığında bu iki model benzer sonuçlar vermesine rağmen iki modelin tahmin edilen anakütle katsayılarını doğrudan karşılaştırmak mümkün değildir. 49

İki değer alabilen nitel değişkenli nitel tercih modellerinden biri olan DOM ndeki en belirgin sorun, tahmin edilen olasılık değerlerinin 0-1 aralığının dışına çıkması sorunudur. Bu sorunun giderilmesi adına kullanılan Probit model, olasılıkların 0-1 arasında kalmasını sağlayan ve katsayılar itibariyle doğrusal olmayan bir modeldir. Probit model, genellikle gözlenemeyen bir fayda endeksi ile oluşturulduğundan, fayda endeksi hakkında bilgi verme yükümlülüğünü taşımaktadır. 50

Bağımlı kukla değişkenli modellerden kümülatif lojistik fonksiyonundan farklı olarak, normal kümülatif dağılım fonksiyonunu kullanan PROBİT(NORMAL) Model aşağıdaki gibi formüle edilir: F(z)= 0 Z 1 e 2 2 2 ( Z ) / 2 z P R O B İ T (NORMAL) MODEL Probit modeli şu şekilde tanımlayabiliriz: Herhangi bir i hanesinin ev sahibi olma veya olmama kararının gözlenemeyen bir fayda indeksi I i ye bağlı olduğunu varsayalım. 51

I i, bağımsız değişkenlere bağlıdır. Örneğin X i (gelir)değişkeni. I i = b 1 + b 2 X i Y=1 hane ev sahibi Y=0 hane ev sahibi değil. Her hane için I i nın belli bir değerinden itibaren ev sahibi olma durumu söz konusudur.i i değeri, I i* değerini aştığı zaman hane, ev sahibi olacak aksi durumda olmayacaktır. I i* I i ifadesi faydanın belli bir eşik değerinden sonra söz konusu olabileceğini gösterir. I i* başlangıç değeri de I i gibi gözlenemez. Ancak, aynı ortalama ve varyanslı normal dağıldığı varsayılarak I i değerleri yukarıdaki regresyon denkleminden tahmin edilir. Tahminciler bulunur. Normal dağılım varsayımıyla I i* ın I i den küçük veya eşit olma olasılığı aşağıdaki standartlaştırılmış normal KDF ile hesaplanabilir: (1) 52

Endeks değerinin kendisi gibi gözlenemeyen ve I i* ile ifade edilen eşik değerine sahip olduğu düşünüldüğünde, eğer I i değeri I * i değerini aşarsa olayın meydana gelmeyeceği söylenebilir. I * i değerinin I i değerinden küçük ya da I i ye eşit olması normallik varsayımı altında standartlaştırılmış birikimli dağılım fonksiyonlarından hareketle hesaplanmaktadır. Burada I i gerçekte ölçülmemiş bir endeks olup normal ve sürekli bir tesadüfi değişken olarak adlandırılabilir. I i ler için gözlemler mevcut değildir. Ancak bu endeksin küçük ve büyük değerlerinden bireysel gözlemlerin hangi kategoriye ait oldukları bilinmektedir. 53

P i =Pr(Y=1)=Pr(I i* I i )=F(I i ) 1 I i t 2 / 2 1 e dt 2 2 b 2 1 b2x i t / e 2 dt (2) =Standartlaştırılmış Normal KDF t N(0,1) =standartlaştırılmış normal değişken P i =Bir ev sahibi olma olasılığı. 54

Probit Model P i =F(I i ) 1 0 - + P i =F(I i ) P i 1 I i = b 1 + b 2 X i I i* <=I i verilmişken ev sahibi olma olasılığı P i ordinatta bulunur P i P i verilmişken, absiste I i bulunur. 0 - + I i =F -1 (P i ) 55

I i yı bulabilmek için 2 no lu ifadenin tersi alınmalıdır. I i = F -1 (I i )= F -1 (P i )=b 1 +b 2 X i =Probit model F -1 : normal kümülatif dağılım fonksiyonunun tersi. 56

57

A- Frekanslı Serilerde Probit Modelin Tahmin Aşamaları 1. P i = n i /N i hesaplanır. 2. I i = F -1 (P i )= normal eşdeğer sapma bulunur. 3. I i = b 1 + b 2 X i + u i EKK ile tahmin edilir. 4. İstenirse, I i yerine, (I i + 5)=probit değerleri alınarak, EKKY ile (13.19) tahmin edilir. 5. modelinin hata terimi u i farklı varyanslıdır. Bu sebepten dönüşümlü değerler alınarak TEKKY uygulanabilir: 58

2 u P i ( 1 Pi ) N f i i f i = F -1 (P i ) ifadesine eşit standart normal yoğunluk fonksiyonudur. 6. Büyük örnekler için b i 'lerin güven aralıkları ve hipotez testleri uygulanarak, anakütlede durumun geçerliliği araştırılabilir. 7. Belirlilik katsayısı R 2, modelin fonksiyonel biçiminin iyi seçilip seçilmediği konusunda bize fikir vermez. 59

Probit Model Uygulaması P i 0.25 I i =F -1 (P i ) -0.6745 Probitler=Z i =(I i +5) 4.3255 X i 12 0.24-0.7063 4.2937 16 0.28-0.5828 4.4172 20 0.33-0.4399 4.5601 26 0.50 0.0000 5.0000 30 0.53 0.0752 5.0752 40 0.66 0.4124 5.4124 50 0.61 0.2793 5.2793 60 0.75 0.6745 5.6745 70 0.67 0.4399 5.4399 80 60

Probit Model Uygulaması I i = -0.8587 + 0.0200 X i, r 2 = 0.8628 r= 0.9289 s(b i ) (0.0028) s= 0.2 d= 1.59 t= (7.094) Z i = 4.1324 + 0.0201 X i, r 2 = 0.8621 r= 0.9285 s(b i ) (0.0028) s= 0.2 d= 1.5637 t= (7.071) 61

B- En Yüksek Olabilirlik Yöntemiyle Probit Modelin Elde Edilmesi En Yüksek Olabilirlik Yöntemi nde anakütle ve bu anakütleden çekilen örnek arasındaki benzerlik ilişkisinden yararlanılarak bu örneğin elde edilme olasılığını maksimum yapan parametre değerleri tahmin edilmektedir. En Yüksek Olabilirlik Yöntemi, benzerlik fonksiyonunun maksimizasyonundan oluşmaktadır. Bu yöntemin uygulanabilmesi için hata terimlerinin dağılımının bilinmesi gereklidir. Logit modelin en yüksek olabilirlik yöntemiyle elde edilen örneğin probit model uygulaması şu şekilde gerçekleşmiştir: 62

63

64

65

66

67