SAÜ Fen Edebyat Dergs (009-II) M.EBEGİL RIDGE TAHMİNİNE DAYALI YANLI TAHMİN EDİCİ ÖZET İÇİN BİR TEST İSTATİSTİĞİ Meral EBEGİL Gaz Ünverstes, Fen Edebyat Fakültes, İstatstk Bölüü, 06500, ANKARA derel@gaz.edu.tr Bu çalışada, Rdge tahn edcsne dayalı yanlı tahn edc le en küçük kareler tahn edcs arasında br seç yapak çn ortalaa hata krterne bağlı br test statstğ önerlştr. Anahtar Keleler: Ortalaa Hata Kare, Rdge Regresyon, Lu-Tp Tahn Edc, Doğrusal Kabul Edleblr Tahn Edcler, Shrnkage Tahn Edcler A TEST STATISTIC FOR BIASED ESTIMATOR BASED ON RIDGE ESTIMATOR ABSTRACT In ths study, a test statstc of the ean square error crteron has been proposed to choose between a based estator based on Rdge estator and the least squares estator. Key Words: Mean Square Error, Rdge Regresson, Lu-Type Estator, Lnear Adssble Estators, Shrnkage Estators. 1. GİRİŞ Regresyon katsayılarını tahn etek çn yaygın olarak kullanılan yönte en küçük kareler (EKK) yöntedr. Ancak, EKK yöntenn doğru sonuçlar veres çn çeştl varsayıların sağlanası gerekektedr. Bunlardan br bağısız değşkenler arasında lşk olaasıdır. Aa gerçekte bu duru her zaan sağlanayablr. Böyle durularda, EKK tahn yöntenn kullanılası yanlış odel bulgularına ve kullanıına neden olur. Bu tür brbryle bağılılık gösteren bağısız değşkenlerle analz yapak çn çeştl yönteler gelştrlştr. Bu yöntelerden br yanlı tahn yöntelerdr. Yanlı 1
M.EBEGİL SAÜ Fen Edebyat Dergs (009-II) yöntelere lşkn tahn edcler, EKK tahn edclerne göre yanlı, ancak çok daha küçük varyanslı tahnler verrler. Yanlı tahn yöntelernde genel aaç, EKK tahn yöntende büyük olan varyans alanını küçük br yan karşılığında daraltaktır. Böylece EKK yöntene göre daha doğru sonuçlar elde edlr. Yanlı tahn edcler sınıfının çnde yer alan bazı tahn edcler, Shrnkage tahn edcler olarak adlandırılır. Teel Bleşenler regresyonu, Rdge regresyonu ve bunların türevler bu sınıfın brer üyesdrler. Farebrother (1978) yaptığı çalışasında, Shrnkage tahn edcler çn genel br yapı oluşturuştur. Rdge, Teel Bleşenler ve Koşullu-nu hata kare ortalaalı yanlı tahn edclernn brer Shrnkage tahn edcs olduklarını gösterştr *1+. Lsk (198) çalışasında, EKK tahn edcs le Shrnkage tahn edcs arasında seç yapak çn güçlü Ortalaa Hata Kare (OHK) ölçütünü verştr *+. Yne Lsk (1983) çalışasında EKK tahn edcs le Shrnkage tahn edcs arasında seç yapak çn daha zayıf OHK test şlen kullanıştır *3+. Kejan (1993) çalışasında rdge tahn edcsne alternatf olarak Lu-Kejan tahn edcsn önerştr *4+. Daha sonra bu tahn edc Akdenz ve Kaçıranlar (1995) tarafından Lu tahn edcs olarak adlandırılıştır *5+. Sakallıoğlu, Kaçıranlar ve Akdenz (1997) tarafından Lu tahn edcsnn terasyon tahn edcler le karşılaştırılası ncelenştr *6+. Derel (1999) çalışasında, Shrnkage tahn edclernn genel yapısını verştr *7+. Ebegl, Gökpınar ve Ekn (005) çalışalarında, yanlı tahn edcler sınıfı çnde yer alan Shrnkage tahn edclernden, Rdge ve Lu tahn edcler çn br test statstğ verş, ayrıca bu tahn edcler bağısız değşkenler arasındak farklı korelasyon yapılarına göre sülasyon yoluyla karşılaştırılıştır *8+. Sakallıoğlu ve Kaçıranlar (003) tarafından Rdge tahn edcsne dayalı yanlı br tahn edc önerlştr [9]. Ebegl (006) çalışasında Lu-Tp ve Rdge tahn edcsne dayalı yanlı tahn edcler de Shrnkage tahn edcler yapısı çnde fade ederek bu tahn edclern brer Shrnkage tahn edcs olduğunu gösterştr [10]. Ebegl (007) tarafından, Rdge tahn edcsne dayalı
SAÜ Fen Edebyat Dergs (009-II) M.EBEGİL yanlı tahn edcnn en az, EKK tahn edcs kadar etkn olables çn gerekllk ve yeterllk koşullarını elde etştr [11]. Bu çalışanın knc bölüünde Shrnkage tahn edclernn teel yapısı kısaca verldkten sonra, Rdge tahn edcsne dayalı yanlı tahn edcnn en az, EKK tahn edcs kadar etkn olables çn gerekllk ve yeterllk koşulları üzernde duruluştur. Üçüncü bölüde, öncelkle br Shrnkage tahn edcs le EKK tahn edcsnden brn seçek çn br test statstğ tanıtılıştır. Daha sonra bu test statstğ ve Ebegl (007) de oluşturulan gerekllk ve yeterllk koşuluna bağlı olarak Rdge tahn edcsne dayalı yanlı tahn edcs le EKK tahn edcsnden brn seçek çn br test statstğ önerlştr.. SHRINKAGE TAHMİN EDİCİLER SINIFININ GENEL YAPISI Bu bölüde doğrusal regresyon odelnden yola çıkarak Shrnkage tahn edclernn genel yapısı verlştr. n gözlel, k bağısız değşkenl br çoklu doğrusal regresyon odel,, ~ 0, In n q Y X (1) rank X q n bçnde tanılanır *1+. Y, ( n 1) boyutlu bağılı değşken vektörü; qk 1 olak üzere, X, ( n q) boyutlu stokastk olayan grd atrs;, ( q 1) boyutlu blneyen katsayılar vektörü;, E( ) 0 ve E koşullarını sağlayan hata vektörüdür. ( ) In ( XX ) atrs; q q boyutlu, poztf tanılı, setrk br atrs olduğundan dolayı öyle br ortonoral P atrs vardır k P X XP bçnde köşegenleştrr., eleanları 3 ( XX ) atrsn ( XX ) atrsnn poztf öz değerler 1 > >...> q olan q q boyutlu köşegen br atrstr [,3].
M.EBEGİL SAÜ Fen Edebyat Dergs (009-II) Z XP ve P olak üzere, (1) eştlğndek odeln kanonk foru, Y XPP Z () şeklndedr. Br regresyon paraetresnn doğrusal kabul edleblr tahn edcler sınıfı kapsaı çndek b tahn edc, q R olak üzere kabul edleblr doğrusal br A( ˆ b) b (3) bçndedr [1]. Burada ˆ ; nın EKK tahn edcs, A ; ( q q) boyutlu br atrs ve b ; ( q 1) boyutlu sabt br vektördür. Bu şeklde gösterlen tahn edcler, doğrusal kabul edleblr tahn edcler (lnear adssble estators) sınıfındandır. Br tahn edcnn kabul edleblr (adssble) br tahn edc olası çn dğer koşullar aşağıdak gb sıralanablr. ( X X ) A veya 1 A( X X) (4) setrk ve A atrsnn öz değerler *0,1+ aralığında olalıdır. (3) ve (4) eştlklerndek koşullara ek olarak, kabul edleblrlk çn A atrsnn setrk olduğu varsayılır. A ve XX atrsler aynı ortonoral P atrs tarafından köşegenleştrleblr. PAP, eleanları A atrsnn *0,1+ aralığına düşen öz değerler,,..., olan 1 q ( q q) boyutlu köşegen br atrstr [,3]. () eştlğndek odel altında (3) eştlğ, PA( ˆ b) Pb 4
SAÜ Fen Edebyat Dergs (009-II) M.EBEGİL ˆ P AP( a) a ( ˆ a) a (5) olur. Burada ˆ P ˆ, a P b dır. Bu tür doğrusal kabul edleblr tahn edcler, Shrnkage tahn edcler olarak slendrlr [,3]..1. Shrnkage ve En Küçük Kareler Tahn Edclernn Ortalaa Hata Kare Matrsler EKK tahn edcler atrsler sırasıyla, ˆ ve Shrnkage tahn edcler nın OHK OHK ( ˆ ) ( X X) 1 ve 1 OHK ( ) A( X X) A ( I A)( b)( b) ( I A) (6) dır [,3]. (6) eştlğ le verlen bu atrslern eşdeğer kanonk forları, OHK( ˆ ) 1 ve 1 OHK ( ) ( I )( a)( a) ( I ) (7) bçnde gösterlr. Bu k atrs arasındak farkın, yan OHK ( ˆ ) OHK ( ) nın negatf olayan tanılı br atrs olası, OHK ( ˆ ) OHK ( ) 0 le ükündür. Buradan hareketle OHK ( ˆ ) OHK ( ) farkının negatf olayan tanılı olasının gerek ve yeter koşulu 1 ( b) ( I A) X X( I A)( b)/ 1 (8) 5
M.EBEGİL SAÜ Fen Edebyat Dergs (009-II) eştlğnn sağlanasıdır. Aynı şeklde, OHK ( ˆ ) OHK ( ) farkının negatf olayan tanılı br atrs olası se ancak ve ancak 1 ( a) ( I ) ( I )( a)/ 1 (9) le ükündür *+. Eş (8) dek koşul altında br Shrnkage tahn edcs olan nın, en az ˆ EKK tahn edcs kadar etkn olduğu söyleneblr []... Shrnkage Tahn Edcler Yardııyla Ortalaa Hata Karelern Azaltılası Lsk (198), çalışasında genel yapısını verdğ Shrnkage tahn edclernn OHK atrsler le, blnen EKK tahn edclernn OHK atrslern karşılaştırarak br gerekllk ve yeterllk koşulu elde etştr. Daha sonra bu gerekllk ve yeterllk koşulunu kullanarak Rdge ve ˆ d ˆ, 0d 1, tahn edclernn her br çn gerekllk ve d yeterllk koşullarını oluşturuştur []. Bu koşullar sağlandığında Shrnkage tahn edcler en az, EKK tahn edcler kadar etkndr. Ekn (1999) çalışasında Lu tahn edcs çn gerekllk ve yeterllk koşulunu elde etştr [13]. Sakallıoğlu ve Kaçıranlar (003), Rdge tahnne dayalı br tahn edcy, k>0 ve <d< olak üzere, 1 k, d X X X Y dk (10) şeklnde tanılaışlardır. Burada 1 k X X k XY, Rdge regresyon tahn edcsdr [9]. Ebegl (007) çalışasında, Eş (10) da verlen tahn edc çn gerekllk ve yeterllk koşullarını, k d 1 k d ( a) ( a)/ 1 (11) 6
SAÜ Fen Edebyat Dergs (009-II) M.EBEGİL veya X X k dx X 1 k X X X X d ( b) ( b) / 1 (1) bçnde elde etştr [11]. (11) ve (1) eştlklerndek gerekllk ve yeterllk koşulunun sağlanası duruunda Rdge tahnne dayalı yanlı tahn edc, en az EKK tahn edcs kadar etkndr sonucu çıkarılablr. 3. SHRINKAGE TAHMİN EDİCİSİNİN SEÇİMİ İÇİN BİR TEST Lsk (198) çalışasında, OHK atrslerne dayalı olarak, br Shrnkage tahn edcs le EKK tahn edcsnden brn seçek çn br test statstğ oluşturuştur []. Bu çalışada, bu test statstğ ve Ebegl (007) tarafından oluşturulan gerekllk ve yeterllk koşullarına bağlı olarak Rdge tahnne dayalı yanlı tahn edc le EKK tahn edcsnden brn seçek çn br test statstğ önerlştr. (8) ve (9) eştlklernde verlen gerekllk ve yeterllk koşulları altında k tahn edc arasından seç yapılası ükündür. Bu duruda Shrnkage tahn edcs le EKK tahn edcs ˆ arasında br seç yapılası çn kullanılacak test statstğnn yapısı, bu eştszlğe dayandırılır. Lsk (198) Toro-Vzcarrondo ve Wallace nn test statstğn kullanarak aşağıdak test statstğ üzernde çalışıştır *+: ˆ ˆ F H ˆ, (13) burada H I A X X I A 1 ( ) ( ), ˆ ˆ ( Y X ) ( Y X ˆ ) ( n q), rank( H) ve b 0 7
M.EBEGİL SAÜ Fen Edebyat Dergs (009-II) olarak alınıştır. Bu statstğn kanonk foru, F ˆ ( I ) ( I ) ˆ / ˆ 1 1 q 1 ( ˆ / ˆ ) (14) 1 şeklnde yazılablr. Burada rank( I ) ( I ) dır., sıfırdan farklı lern sayısı olak üzere, 1 F ˆ ˆ (15) 1 ( / ) şeklnde de fade edleblr. nn1 q olduğu görülektedr. F ˆ / ˆ olarak fade edldğnde, 1 F 1 F (16) olur. Bu duruda F test statstğ F statstklernn karışıından oluşur. Dğer br fadeyle, (15) eştlğ, (16) eştlğ gb de yazılablr. Burada ˆ ˆ, serbestlk dereces 1 ve erkez olaa paraetres w / olan br k-kare dağılıına uyar. ( n q) ˆ / dereces ( n q) olan k-kare dağılıına sahptr. bağısızdır. Bu duruda, F erkez olaa paraetres uyaktadır. se serbestlk ˆ ve ˆ ˆ, serbestlk dereces 1 ve ( n q), ˆ w / olan F dağılıına 8
SAÜ Fen Edebyat Dergs (009-II) M.EBEGİL (16) eştlğ, lern bütün ağırlıkları 1 ler veya sıfırlar oladıkça, erkez olayan F nn dağılı fonksyonun kapalı forunun fade edles oldukça zordur. Bununla brlkte yaklaşık çözülere ulaşılablr [,3,14]. Shrnkage tahn edcler çn gerekllk ve yeterllk koşulu, 1 1 d. Bundan dolayı hpotez testler, Ho: 1 1 karşıt hpotez H1: 1 1 (17) şeklnde yazılablr. Önerlen test şlende karar kuralı, F F (, n q,1) se Ho kabul, ve FF (, n q,1) se Ho red şeklndedr. F (, n q,1), serbestlk dereces ve (n-q), erkez olayan paraetres w 1 1 γ olan F nın dağılıından elde ω edlr. F çn erkez-f yaklaşıı kullanarak F (, n q,1) krtk noktaların değer belrleneblr. Bunun çn oentler yaklaşıı le statstklernn oentler kullanılarak F test statstğnn başlangıç oentler elde edlr. Bunu çn Theobald (1974) e bakılablr *15]. F 3.1. F İstatstğ İçn Merkez-F Yaklaşıı Patnak (1949), erkez olayan F dağılıı çn erkez-f yaklaşıı üzernde çalışıştır *16+. Bu yaklaşıda erkez-f dağılıı 9
M.EBEGİL SAÜ Fen Edebyat Dergs (009-II) F(, n q) nın ve erkez olayan F(, n q, ) dağılıının lk k oentler kullanılarak F(, n q, ) r F(, n q) yazılablr. r ve paraetreler F dağılılarının lk k oentler le bulunur. Dğer br fadeyle, erkez-f n k oent yaklaşıı, erkez- F ve F/ r nn lk k oentler çn fadelern eştlenesyle, 1 r (1 ) ve 1 1 1 (1 ) (1 ) (18) bçnde elde edlr. Burada q ve 1 verlşken 1 1 r, şeklnde de fade edleblr ve 1 ler *0,1+ aralığında olak üzere düzeltlş serbestlk dereces, ( 1) /( ) 1 1 bçnde yazılablr []. Buradan kolaylıkla n 1 ax (19) olduğu görülür *17+. Bu eştszlk yardııyla düzeltlş serbestlk dereces çn alt ve üst sınırları, ( 1) /( ) ( 1) /( ) (0) 1 ax 1 n şeklnde belrlenr []. Üst sınır ax ve alt sınır n olarak fade edleblr. Bu halde bütün 0 1 çn 10
SAÜ Fen Edebyat Dergs (009-II) M.EBEGİL F ( ax, n q) F ( n, n q) ken F ( ax, n q) ve F ( n, n q) krtk noktaları elde edlr. F/ r statstğ, bu krtk değerlerle karşılaştırılablr. Buradan hareketle, test statstğ çn bu krtk noktalardan, F/ r> F ( n, n q) se Ho hpotez red, F/ r< F ( ax, n q) se Ho hpotez kabul ve F ( ax, n q) F/ r F ( n, n q) kararsızlık (belrszlk) duruu şeklnde bölgeler oluşturulablr. 3.. Rdge Tahnne Dayalı Yanlı Tahn Edcnn Seç İçn Br Test Bu bölüde, daha öncek bölülerde açıklanan test statstğnn Rdge tahnne dayalı yanlı tahn edcye nasıl uygulanacağı açıklanıştır. (13) eştlğnde verlen test statstğnde gerekl fadeler yerne konularak, Rdge tahnne dayalı yanlı tahn edc çn test statstğn oluşturak ükün olacaktır. Bunun çn, (10) eştlğnde verlen Rdge tahnne dayalı br tahn edcsnde, Rdge regresyon tahn edcs 1 k X X k XY yerne yazılır ve gerekl düzenleeler yapılırsa, 1 1 kd, XX d XX k XX ˆ Aˆ (1) şeklnde fade edleblr. Buradan test statstğnde yer alan, H ( I A) 1 X X ( I A) fadesndek A atrs yerne yazılarak, Rdge tahnne dayalı yanlı tahn edc çn test statstğ, ˆ ˆ F H ˆ 11
M.EBEGİL SAÜ Fen Edebyat Dergs (009-II) ˆ X X k dx X ˆ 1 k X X X X d () ˆ şeklnde oluşturulur. Burada ve ˆ daha öncek bölülerde tanılandığı gb hesaplanır. Bu test statstğnn kanonk foru, k d 1 k ˆ ˆ d F (3) ˆ bçnde belrlenr. Dğer krtk noktalar, karar kuralları ve tanılaalar öncek bölülerde açıklandığı gb, buradak fadelere bağlı kalınarak hesap edlr. 4. SONUÇ Model kurak aacıyla, regresyon katsayılarını tahn etek çn yaygın olarak kullanılan yönte En Küçük Kareler (EKK) yöntedr. EKK tahn yöntende aaç hatayı en küçükleektr. Ancak bağısız değşkenler arasında şddetl br lşk bulunuyorsa, bu tür verler hatada, dolayısıyla varyansta yanıltıcı br büyüeye sebep olur. Bu büyüe paraetre tahnlerne ve kestr sonuçlarına olusuz şeklde yansır. Dğer br deyşle, bağısız değşkenler arasında şddetl br lşk bulunduğu durularda, varyanstak yanıltıcı büyüeden dolayı, EKK tahn yöntenn kullanılası yanlış odel bulgularına ve kullanıına neden olur. Bu olusuz etky yok etek çn yanlı tahn yöntelerne başvurulur. Bu yönteler küçük br yan karşılığı varyans alanını dolayısıyla hatayı küçültür. Yanlı yöntelere lşkn bu tahn edcler, EKK tahn edclerne göre yanlı, ancak çok daha küçük varyanslı tahnler verrler. Dğer br fadeyle, yanlı tahn yöntelernn kullanılasındak genel aaç, EKK tahn yöntende büyük olan varyans alanını küçük br yan karşılığında daraltaktır. Böylece EKK yöntene göre daha doğru sonuçlar elde edlr. 1
SAÜ Fen Edebyat Dergs (009-II) M.EBEGİL Bu aaçla, Lsk (198) çalışasında, OHK atrslerne dayalı olarak, br Shrnkage tahn edcs le EKK tahn edcsnden brn seçek çn br test statstğ oluşturuştur. Bu çalışada, bu test statstğ ve Ebegl (007) tarafından, Rdge tahnne dayalı yanlı tahn edcnn en az EKK tahn edcs kadar etkn olası çn oluşturulan gerekllk ve yeterllk koşulları kullanılarak, Rdge tahnne dayalı yanlı tahn edc le EKK tahn edcsnden brn seçek çn br test statstğ oluşturuluştur. Bu test statstğ kullanılarak, Rdge tahnne dayalı yanlı tahn edcnn, EKK tahn edcsne terch edleceğ durular belrleneblecektr. KAYNAKLAR [1]. Farebrother, R. W., (1978), A Class of Shrnkage Estators., Journal of the Royal Statstcal Socety B, 40, 47-49. []. Lsk, E. P., (198), A Test of the Mean Square Error Crteron for Shrnkage Estators. Councatons n Statstcs 11(5), 543-56. [3]. Lsk, E. P., (1983), Choosng a Shrnkage Estator-a test of the Mean Square Error Crteron. Proc. Frst Tapere Se. Lnear Models, 45-6. [4]. Kejan, L., (1993). A New Class of Based Estate n Lnear Regresson., Councatons. n Statstcs: Theory and Methods.,(), 393-40. [5]. Akdenz, F. and Kaçıranlar, S. (1995). On the Alost Unbased Generalzed Lu Estator and Unbsed Estaton of the Bas and MSE. Coun. Statst-Theory and Meth., 4(7), 1789-1797. [6]. Sakallıoğlu, S., Kaçıranlar, S. ve Akdenz, F. (1997). Bazı Yanlı Regresyon Tahn Edclernn Karşılaştırılası., Araştıra Sepozyuu 97 Bldrler, DİE., Ankara. [7]. Derel, M., (1999), Bazı Shrnkage Tahn Edcler le En Küçük Kareler Tahn Edcsnn Br Test İstatstğ le Karşılaştırılası, Yüksek Lsans Tez, Ankara, 11-18. [8]. Ebegl, M.,Gökpınar, F. and Ekn, M. (006), A Sulaton Study on Soe Shrnkage Estators, Hacettepe Journal of Matheatcs and Statstcs, 35():13-6. 13
M.EBEGİL SAÜ Fen Edebyat Dergs (009-II) [9]. Sakallıoğlu, S., Kaçıranlar, S., (005), Yen Br Yanlı Tahn Edc ve Lu-Tp Tahn Edc le Karşılaştıralar. 4. İstatstk Kongres, 08-1 Mayıs 005, Bldr ve Poster Özetler Ktabı. Antalya. 50-51. [10]. Ebegl, M. (006). Shrnkage Tahn Edcler Sınıfı Üzerne Br Çalışa, Sakarya Ünverstes, Fen Edebyat Fakültes, Fen Edebyat Dergs 8(), 53-58. [11]. Ebegl, M. (007). En Küçük Kareler Tahn Edcs İle Br Shrınkage Tahn Edcsnn Etknlk Karşılaştırası, Anadolu Ünverstes Bl ve Teknoloj Dergs 8(1), 79-83. [1]. Rao, C. R., (1976). Estaton of Paraeters n a Lnear Models., The Annals of Statstcs, 4, 103-1037. [13]. Ekn, M., (1999). EKK Tahn Edcs le Br Shrnkage Tahn Edcsnn etknlk karşılaştırası, Journal of the Insttute of Scence and Technology,Gaz Unverstes, 1(3), 509-514. [14]. Noran, L. J. and Sauel, K.(1970), Dstrbutons n Statstcs, Chapter 6. [15]. Theobald, C. M. (1974). Generalzatons of Mean Square Error Appled to Rdge Regresson, Journal of the Royal Statstcal Socety B,36, 103-106. [16]. Patnak, P. B. (1949), The Noncentral K-Kare and F Dstrbutons and ther Applcatons, Boetrka 36, 0-3. [17]. Toutenburg, H. (198), Pror Inforaton n Lnear Models. John Wley and Sons. New York. 14