HAFTA 4 PARÇALI DOĞRUSAL REGRESYO Gölge değşkenn br başka kullanımını açıklamak çn varsayımsal br şrketn satış temslclerne nasıl ödeme yaptığı ele alınsın. Satış prmleryle satış hacm Arasındak varsayımsal lşk Garant edlen en düşük prm Satış prm, eşk düzeyne kadar satışa bağlı olarak doğrusal artmakta, bu düzeyn üstünde yne satışa bağlı olarak doğrusal ama dk br eğmle artmaktadır. O halde satış prm le satış arasındak lşk le açıklanır. Y satış prm eşk düzeynden önce ve sonra olmak üzere k parçalı regresyon model satış temslcsnn yaptığı satış mktarı satışın eşk değer (köşe adı verlr) eşk değer verlmşken; D, se 0, se Model: Y 0 D ; 0, hedef düzeyne kadar olan ortalama satış prm: E Y D 0,, 0 hedef düzeynn üstündek ortalama satış prm: 0,, 0 0 E Y D D
I. parçadak regresyon doğrusunun eğm II. parçadak regresyon doğrusunun eğm eşk değernde regresyon doğrusunda br kırılma yoktur hpoteznn sınanması, tahmn edlen eğm farkı katsayısı ˆ nın statstk bakımından anlamlı olup olmadığına bakılır. Parçalı regresyon genellenrse, k. dereceden parçalı çok terml regresyon modelne br başka deyşle splne fonksyonları olarak blnen daha genel br fonksyon sınıfına uygulanablr. Örnek: Toplam malyet ve toplam üretm arasındak lşknn ncelenmes modelne bakılırsa, Y toplam malyet ($) toplam üretm (brm) 5500 brm eşk değer 5500 brmlk üretm düzeynde toplam malyetn değşebleceğ sezlmş olsun. Y 56 44 634 778 003 839 08 43 734 94 000 000 3000 4000 5000 6000 7000 8000 9000 0000 Kestrm denklem: Yˆ 45.7 0.79 0.0945 D t : - 0.845 6.0669.447 R 0.9737, 5500 D 0, 5500 5500 I. parça: üretmn marjnal malyet brm başına 8 cent II. parça: üretmn marjnal malyet brm başına 37 cent (8+9=37) olmakla brlkte ks arasındak fark, statstk bakımından anlamlı değldr. Yan, H0: 0 hpoteznn test statstğ.447 olup, %5 anlamlılık düzeynde anlamlı değldr. Gölge değşken kullanımında bazı teknk noktalar: Yarı-logartmalı fonksyonlarda gölge değşken lny D 0 katsayısı dek br brm değşmeye karşılık Y dek görel değşm olarak yorumlanır. Açıklayıcı değşkenn sürekl olması, gölge değşkendek gb k değer alan k uçlu değşken olmaması koşuluyla herhang br açıklayıcı değşkendek br değşmeye uygulanablr. Gölge değşken çnde Y dek ortalama görel değşm elde edleblr.
Gölge değşken tuzağını aşmak çn modelden sabt term atılır. Gölge değşkenler ve değşen varyans Dğer teknklerde olduğu gb değşen varyans sorunu çözülür. Gölge değşkenler ve ardışık bağımlılık Model: Y 0 D 3D u t t t t t t AB(): ut ut t; t 0, blndğ ya da tahmn edldğ varsayımıyla Yt Y açıklayıcı değşken olmak üzere aralarındak regresyon modelnde sorun yaratır. Bu sorun ortadan nasıl kaldırılır? t açıklanan değşken, t t D t gölge değşken varlığı 0, I. dönemde se t ) ) Dt, t II. dönemn lk gözlem se, II. dönemdek lk gözlemden sonra se t t değşken yerne t t değşken alınır. ) I. dönemdek gözlemler çn D alır. t t t D t t değer sıfır olacaktır. II. dönemdek lk gözlem çn değern ve dğer gözlemler çn D D Buradak sorun II. dönemn lk gözlem de olacaktır. değern t t t t t t GÖLGE AÇIKLAA DEĞİŞKELİ REGRESYO MODELİ Açıklanan değşkenn değerlernn k uçlu (bnary) olması durumunda regresyon modeln tahmn etmede kullanılan en yaygın modeller. Doğrusal olasılık model (DOM). Logt model 3. Probt model 4. Tobt model. Doğrusal olasılık model (DOM): Model: Y 0 Örneğn; ale gelr Y,. ale ev sahb se 0,. ale ev sahb değlse k uçlu (bnary) Y açıklanan değşken, açıklayıcı değşken veya değşkenlern doğrusal br fonksyonu olarak gösteren modellere doğrusal olasılık modeller denr. Çünkü E Y P Y 3
dr. Sapmasız (yansız) tahmn edcler elde edeblmek çn 0;,,, altında E Y 0 elde edlr. E Y P Y p alınırsa; 0 ve E Y E Y p p p 0 p olacaktır. Doğrusal olasılık modelnde parametre tahmnndek sorunlar: 4 E n varsayımı. Hata termlernn normal dağılıma sahp olmaması: Açıklanan değşken k uçlu değerler aldığında hata termlernn normal dağıldığı varsayımı yerne getrmes olanaksızdır. Bunu göreblmek çn Y 0 Y se 0 Y 0 se 0 lern normal dağıldığı varsayılamayacağı, aslında Bnom dağılımına uyacağı görülmektedr. Ancak büyük örneklemlerde doğrusal olasılık model le yapılan statstk çıkarımlar normallk varsayımı altında EKK yöntemne uyar.. Hata termlernde değşen varyans: Her j çn E E j olduğu söylenemez. Y 0 0 0 0 ve 0 olsa ble hata termlernn sabt varyanslı Olasılık p p Toplam Var E E E E 0 O halde E p p 0 0 0 E Y p olduğundan, Var E 0 0 0 0 lern varyansı 0 0 0 0 0 0 0 0 p p 0 0 p p p lere yan lere bağlıdır, dolayısıyla varyans sabt değldr.
Var E p p w olarak tanımlanırsa, Y 0 w w w w model w le ağırlıklandırıldığında ve ; olarak tanımlandığında; w w Y 0 orjnden geçen doğrusal model elde edlr. w le ağırlıklandırılarak dönüşüm yapılmış bu modeln hata termler artık sabt varyanslıdır. Bu sorun çözüldüğüne göre artık EKK tahmn edcler bulunablr. E Y p blnmedğnden ağırlıkları tahmn edlerek EKK tahmn edcler bulunablr. w lern tahmn edlmes: w lerde blnmemektedr. O halde w. adım: Y 0 modelnden wˆ Yˆ Yˆ lar bulunur. Yˆ lar bulunur. Sonra w nn tahmn olarak. adım: Tahmn edlen wˆ lar kullanılarak Y Y ; ve ler bulunur. w w w Y 0 modelnden EKK tahmn edcler elde edlr. Bunun sonucunda doğrusal olasılık model elde edlmş olur. 0 E Y p varsayımının yerne gelmeyş: Doğrusal olasılık modellernde olarak doğru olmakla brlkte E Y E Y zorunlu olarak 0 le arasında olmalıdır. Bu önsel nn tahmn edcler olan Y ˆ ların bu sınırlamayı sağlayacağının br güvences yoktur. Buda doğrusal olasılık modellernn EKK tahmn edclerndek sorun olarak ortaya çıkmaktadır. Bu durum söz konusu olduğunda Yˆ ların 0 le arasında olup olmadığına bakılır. Eğer bazıları 0 dan küçük se bunlara sıfır değer, den büyükse bunlara da değer verlr. Dğer br yol se sağlayan br tahmn teknğ gelştrmektr. Yˆ ların 0 le arasında olmalarını. Logt Model : (Lojstk model) 0 E Y P Y p Doğrusal olasılık model 5
e E Y PY p e e 0 0 0 Lojstk fonksyonu le tanımladığımızda modele lojstk regresyon adı verlr. Lojstk fonksyonla tanımladığımız E Y, 0 le arasından değer almaktadır. p değer yalnız le değl parametreler le olan lşks de doğrusal değldr. Bu da EKK metodu le parametreler tahmn edlemeyecek demektr. Ama bu sorun gerçek olmaktan çok görüntüseldr, çünkü özünde doğrusaldır. e E Y PY p e e 0 p Odds rato: 0 p e 0 0 0 e p 0 0 e e e 0 p log odds rato: ln 0 L p Daha önce verlen örneğe dönecek olursak, ale gelr Y,. ale ev sahb se 0,. ale ev sahb değlse p ev sahb olma olasılığı p p ev sahb olmanın odds oranı (br alenn ev sahb olma olasılığının olmama olasılığına oranıdır) Eğer p 0.8 se alenn ev sahb olma odds oranı 4 e dr. Odds oranının logartması, ve parametrelerne göre doğrusaldır. ye logt denr ve bu modellere de logt modeller denr. L Logt model özellkler:. p, 0 dan e gderken logt L de le a arasında değşr.. L, e göre doğrusal olmakla brlkte olasılıklar le brlkte doğrusal artar. (Doğrusal olasılık model le zıttır.) 3. Logt modelnn yorumu: eğm, dek br brm değşmeye karşılık değşmey ölçer. (örneğn, gelrdek br brm artış dyelm 000 $ değştğnde ev sahb olmanın log-odds oranının nasıl değştğn bldrr.) L L dek 6
4. Bell br gelr düzey, dyelm veryken ev sahb olmanın odds oranını değl de, ev sahb olmanın kend olasılığı tahmn edlmek stenrse le edldkten sonra E Y 5. Doğrusal olasılık model, p nn model log-odds oranının doğrudan bulunablr. Logt modelnn tahmn edlmes: p L ln 0 p Bu model tahmn edeblmek çn 0 tahmnler br kez elde le doğrusal lşk çnde olduğu varsayılırsa, logt le doğrusal lşkde olduğunu varsayar. den başka logt L değerlern de blmek gerekr. bulunmasında bazı sorunlarla karşılaşılır. Tekl verlern varlığında ev sahb ale örneğnde olduğu gb, eğer br ale ev sahb se, değlse olacaktır. Ama bu değerler p p 0 doğrudan L de yerne koyarsak, L ln eğer br ale ev sahb se 0 0 L ln eğer br ale ev sahb değlse olarak bulunur. Bu fadelern anlamsız olduğu açıktır. Bu durumda EKK regresyon parametreler tahmn edlemeyeceğnden en çok olablrlk (MLE) yöntemne başvurulur. MLE yöntemnn bu model çn bulunması matematksel olarak karmaşık olduğundan bu derste şlenmeyecektr. Dyelm k verlermz sıklık tablosu olarak verlmşse buradan p ˆ lar elde edleblr. Örneğn, gelr düzey (gelr grubu) n Bu durumda görel sıklığıdır.. gruptak ale sayısı n. gruptak ev sahb olan ale sayısı. gelr düzeyne sahp br alenn ev sahb olma oranı ˆ nn yerne tahmn p ˆ lar bulunup, Lˆ nın L nn n p olacaktır. Yan değer yeternce büyükse pˆ p ye yakınsayacaktır. Bu tp verlerde ˆ pˆ L ˆ ˆ ln 0 pˆ üzerne kestrm denklem elde edlr. derece y br tahmn olacaktır ve verlen her değşken olarak bağımsız dağılıyor se, logt L nn tahmnler bulunur. değer yeternce büyükse, Lˆ p değer de o gelr düzeyndek her gözlem de br Bnom 0, p p 7
dağılımına sahptr. Buradan da görüleceğ üzere doğrusal olasılık modelnde olduğu gb hata termler değşen varyanslıdır. Bu sorunun çözümü çn ağırlıklandırılmış EKK yöntem kullanılacaktır. Ancak görgül amaçlarla, blnmeyen le değştrerek nn br tahmn edcs ˆ ˆ ˆ p p kullanılacaktır. Logt regresyonunu tahmn etmenn adımları: p y pˆ. Her gelr düzey çn ev sahb olmanın tahmn edlen olasılığı pˆ pˆ. Her çn logt L ln ler bulunur. pˆ 3. Değşen varyans sorununu çözmek çn w pˆ pˆ ağırlıkları bulunarak; n lar bulunur. w L w w w modelnden 0 L L w 0 sabt varyanslı model elde edlr. 4. L ın w ve L ˆ w ˆ 0 değerler üzerne kestrm denklem ˆ olarak elde edlr. Dkkat edleceğ üzere bu modelde sabt term (ntercept) yoktur. Yan orjnden geçen regresyon model bulunmuştur. 5. Son olarak model çn statksel sonuç çıkarımı yapılır. Yen regresyon katsayıları çn aralık tahmnler bulunur ve hpotez testler yapılıp, sonuçlar yorumlanır. Örnek: gelr düzey (gelr grubu) n. gelr düzeyndek ale sayısı n. gelr düzeyndek ev sahb olan ale sayısı n pˆ n Lˆ w L ˆ 8
6 8 0 3 5 0 5 30 35 40 40 50 60 80 00 70 65 50 40 5 8 8 8 45 36 39 33 30 0 0.0 0.4 0.30 0.35 0.45 0.5 0.60 0.66 0.75 0.80 -.3863 -.56-0.847-0.690-0.007 0.0400 0.4054 0.6633.0986.3863.598 3.099 3.5496 4.66 4.9749 4.85 3.9497 3.3496.7386.0000-3.507-3.4807-3.007 -.6407-0.9985 0.673.60.8 3.0086.776 Ağırlıklandırılmış en küçük kareler kestrm denklem Lˆ.593 w 0.078 ˆ : S 0.5 0.0054 t : -4.90 4.4456 R 0.9637 ˆ 0.9 MSE ot: Uygulamada p ˆ nın 0 ya da değern almasını önlemek çn Lˆ değerler ˆ p ˆ n L ln ln n pˆ den bulunur. Gevşek br kural olarak her düzey çn değernn en az 5 olması terch edlr. Yukarıdak örneğmze dönecek olursak, tahmn edlen eğm katsayısı ağırlıklandırılmış gelrde br brm (000$) artışta ev sahb olma tahmn oranının ağırlıklandırılmış logartmasının 0.08 kadar artacağını gösterr. 0.0787 nn ters logartması alınırsa yaklaşık.088 olur k buda dak br brm artışa karşılık ev sahb olmanın ağırlıklı oranı.088 ya da %8.8 kadar artacak demektr. Genel olarak, j. eğm katsayısının ters logartması alınıp, bundan br çıkarılınca elde edlen sonuç 00 le çarpılarak açıklayıcı değşkendek br brm artışa karşılık odds oranındak yüzde değşm bulunmuş olacaktır. j. 9