ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ Semh CAN BAZI ÇOK DEĞİŞKENLİ İSTATİSTİKSEL TEKNİKLER ARASINDAKİ İLİŞKİNİN İNCELENMESİ VE UYGULAMALARI İSTATİSTİK ANABİLİM DALI ADANA, 0
ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ BAZI ÇOK DEĞİŞKENLİ İSTATİSTİKSEL TEKNİKLER ARASINDAKİ İLİŞKİNİN İNCELENMESİ VE UYGULAMALARI Semh CAN YÜKSEK LİSANS TEZİ İSTATİSTİK ANABİLİM DALI Bu Tez 4/0/0 Tarhnde Aşağıdak Jür Üyeler Tarafından Oybrlğ/Oyçokluğu le Kabul Edlmştr. İmza... Doç. Dr. Mahmude Revan ÖZKALE DANIŞMAN İmza... Prof. Dr. Hamza EROL ÜYE İmza... Yrd. Doç. Dr. Gülsen KIRAL ÜYE Bu Tez Ensttümüz İstatstk Anablm Dalında hazırlanmıştır. Kod No: Prof. Dr. İlham YEĞİNGİL Ensttü Müdürü Not: Bu tezde kullanılan özgün ve başka kaynaktan yaılan bldrşlern, çzelge ve fotoğrafların kaynak gösterlmeden kullanımı, 5846 sayılı Fkr ve Sanat Eserler Kanunundak hükümlere tabdr.
ÖZ YÜKSEK LİSANS TEZİ BAZI ÇOK DEĞİŞKENLİ İSTATİSTİKSEL TEKNİKLER ARASINDAKİ İLİŞKİNİN İNCELENMESİ VE UYGULAMALARI Semh CAN ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ İSTATİSTİK ANABİLİM DALI Danışman :Doç. Dr. Mahmude Revan ÖZKALE Yıl: 0, Sayfa: 9 Jür :Doç. Dr. Mahmude Revan ÖZKALE :Prof. Dr. Hamza EROL :Yrd. Doç. Dr. Gülsen KIRAL Çok değşkenl statstksel yöntemler ver kümelernn analznde sıklıkla kullanılmaktadır. Bu metotlardan regresyon analznn br değşken kümesnn dğer değşken kümes le bağımlılığını araştırması, temel bleşenler analznn br ver kümesndek değşkenler arasındak lşky ncelemes, kanonk korelasyon analznn se k veya daha fazla değşken kümes arasındak lşky ncelemes nedenyle bu çalışmada, bu yöntemler ve aralarındak lşkler ncelenmştr. Çoklu ç lşk olması durumunda çok değşkenl çoklu regresyonda rdge ve temel bleşenler regresyon tahmn edcler ele alınmıştır. Bu teork çalışmalar Büyük Şehr Beledyes gelr ve gderler arasındak lşk le örneklendrlmştr. Anahtar Kelmeler: Çok Değşkenl Çoklu Regresyon Analz, Kanonk Korelasyon Analz, Rdge Tahmn Edc, Temel Bleşenler Tahmn Edc I
ABSTRACT MSc THESIS ANALYZING THE RELATIONSHIP BETWEEN SOME OF THE MULTIVARIATE STATISTICAL TECHNIQUES AND APPLICATIONS Semh CAN ÇUKUROVA UNIVERSITY INSTITUTE OF NATURAL AND APPLIED SCIENCES DEPARTMENT OF STATISTICS Suervsor :Assoc. Prof. Dr. Mahmude Revan ÖZKALE Year: 0, Pages: 9 Jury :Assoc. Prof. Dr. Mahmude Revan ÖZKALE :Assoc. Prof. Dr. Hamza EROL :Asst. Prof. Dr. Gülsen KIRAL Multvarate statstcal methods are wdely used n the analyss of data set. Snce regresson analyss examnes the deendency of one varable set on the other varable set, rncal comonents analyss consders the nternal connecton of varables wthn a data set, canoncal corelaton analyss consders relatonshs between two or more data sets, these methods and the relatonshs between these methods are examned n ths study. Rdge and rncal comonents regresson estmators are consdered n the multvarate multle regresson n the resence of multcollnearty. These theorc studes are llustrated by the relatonsh between the ncome and exense of metrooltan muncalty. Keywords: Multvarate Multle Regresson Analyss, Canoncal Correlaton Analyss, Rdge Estmator, Prncal Comonents Regresson Estmator II
TEŞEKKÜR Bu tezn hazırlanmasında bana destek olan ve hçbr zaman yardımlarını, desteğn esrgemeyen danışmanım sayın Doç.Dr. M. Revan ÖZKALE ye, İstatstk bölümü öğretm elemanlarına teşekkürlerm sunarım. Ayrıca, madd ve manev desteklern hçbr zaman esrgemeyen anneme ve babama teşekkürü br borç blrm. III
İÇİNDEKİLER SAYFA ÖZ... I ABSTRACT... II TEŞEKKÜR... III İÇİNDEKİLER.....IV TABLOLAR DİZİNİ... VI ŞEKİLLER DİZİNİ... VII SİMGELER VE KISALTMALAR... X. GİRİŞ.... ÇOK DEĞİŞKENLİ ÇOKLU REGRESYON ANALİZİ... 3.. Çok Değşkenl Çoklu Regresyon Modeln Matematksel Gösterm... 3.. Çok Değşkenl Çoklu Regresyon Modeln Varsayımları... 6.3. Çok Değşkenl Regresyon Modelde En Küçük Kareler Tahmn... 6.4. Σ İçn Tahmn Edc... 8.5. Lkelhood Tahmn Edc... 8.5.. Wshart Dağılımı... 0.6. Çok Değşkenl Regresyon Parametrelernn Önem Test....6.. Wlk s Lambda Test İstatstğ....6..Hotellng T - Lawley İz İstatstğ... 3.6.3.Roy En Büyük Kök İstatstğ... 4.6.4.Plla Test İstatstğ... 4.6.5. X Değşkenlernn Alt Kümes Üzernde Önem Test... 5.7. X ve Y Arasındak Uyumun Ölçüsü... 7.7.. RV Katsayısı... 8.8. En İy Modeln Seçm... 0.8.. Forward (İler Doğru) Seçm Sürec... 0.8.. Backward (Gerye Doğru) Eleme Sürec... 3.8.3. Stewse Sürec... 4.9. Y Değşkenlernn Br Alt Kümesnn Seçm... 4.0. Tüm Olası Alt Kümeler... 5 IV
.0.. Çoklu Belrleyclk Katsayısı... 6.0. Hata Kareler Ortalaması... 7.0.3. C Krter... 7 3. KANONİK KORELASYON ANALİZİ... 3 3.. Kanonk Korelasyon Analzne Grş... 3 3.. Kanonk Korelasyon Analznn Amacı... 3 3.3. Kanonk Değşkenler ve Kanonk Korelasyonlar... 33 3.4. Kanonk Korelasyon Katsayılarının Önem Test... 38 4. TEMEL BİLEŞEN ANALİZİ... 4 5. ÇOK DEĞİŞKENLİ TEKNİKLER ARASINDAKİ İLİŞKİ... 44 5.. EKK le Kanonk Korelasyon Analz Arasındak İlşk... 44 5.. EKK le Temel Bleşenler Analz Arasındak İlşk... 47 6. ÇOKLU İÇ İLİŞKİ... 50 6.. Çoklu İç İlşknn Belrlenmes... 50 6... Korelasyon Matrsnn İncelenmes... 50 6... Varyans Şşrme Faktörü... 50 6..3. XX Matrsnn Özdeğerlernn Analz... 5 6.. Rdge Regresyon... 5 6... K Değernn Bulunması... 54 6.3. Temel Bleşenler Regresyon... 56 7. UYGULAMA... 58 8. SONUÇLAR... 98 KAYNAKLAR... 99 ÖZGEÇMİŞ... 03 EKLER... 04 V
TABLOLAR DİZİNİ SAYFA Tablo.. Wlk s Lambda Değerlernn F İstatstğ Değerlerne Dönüştürme Tablo 7.. Gder Bütçes 60 Tablo 7.. Gelr Bütçes 6 Tablo 7.3.006 009 Aylık TÜFE Değerler 6 VI
VII
ŞEKİLLER DİZİNİ SAYFA Şekl 7.. Y Değerlernn Saçılım Grafğ 78 Şekl 7.. X Değerlernn Saçılım Grafğ...79 Şekl 7.3. X ve Y Değerlernn Saçılım Grafğ..80 Şekl.7.4. Brnc Model çn k Grafğ.. 9 Şekl.7.5. İknc Model çn k Grafğ... 93 Şekl.7.6. Üçüncü Model çn k Grafğ.. 94 VIII
IX
SİMGELER VE KISALTMALAR HKT YKT HKO EKK TBR Hata Kareler Tolamı Yanlılık Kareler Tolamı Hata Kareler Ortalaması En Küçük Kareler Temel Bleşen Regresyon X
. GİRİŞ Semh CAN.GİRİŞ Bu tez de yer alan konular olan çok değşkenl çoklu regresyon, kanonk korelasyon analz, temel bleşenler analz, çoklu çlşk ve rdge regresyon çn önceden yaılan çalışmalar aşağıda belrtlmştr. Baloğlu (996), gelr ve hane halkı kş sayısıyla et ve sebze tüketm arasındak lşky çok değşkenl regresyon analz le açıklamıştır. Çalışmasında 994 yılının tek br ayına at verler kullanmış Wlk s Lamda statstğnden yararlanarak bağımsızlık testne de yer verlmştr. Analz sonucunda et sebze tüketmnn ekonom le lgl olduğu sonucuna varmakla beraber enflasyonunda tüketm ve gelr etkleyeceğn ve enflasyonunda dkkate alınması gerektğn vurgulamıştır. Al-Subah (00), 5 tane tütün yarağının temel bleşenler yan tütünün temel çerkler üzerne çok değşkenl çoklu regresyon analz uygulamış olu, 3 tane yanıt değşken ve 6 tane açıklayıcı değşken kullanmıştır. Forward, Backward ve Stewse seçm yöntemleryle değşkenler seçlmştr. Bunun yanı sıra en y küme seçmnde dğer krterler olan çoklu belrleyclk katsayısı S ve son olarak Mallow s C seçm krterlern kullanmıştır. Burdck (98), Wlk s Lambda statstğ ve R, hata kare ortalaması R çoklu belrleyclk katsayısını kullanarak br şrketn lastk kemerden sonra çelk kemer le lgl tcar reklamın katılımcılar tarafından zlenme versn ncelemştr. Bu amaç çn katılımcıların yaşları, eğtm düzeyler, ale kş sayısı ve yıllık gelrler açıklayıcı değşkenler, reklamın nandırıcılığı ve kemer terch yanıt değşkenler olarak alınmıştır. Çankaya (005), tolam 86 baş Alman Alacası Kıl melez keçlerne at özellkler ncelemştr. Bu çalışmada temel kanonk korelasyon özellkler uygulanmıştır. Verlerden k tane değşken kümes oluşturularak bunların arasındak kanonk korelasyon değşkenler, aralarındak kanonk korelasyon ve önem test ncelenmştr.
.GİRİŞ Semh CAN Khur (986), 935 954 yılları arasında General Electrc, IBM ve Westnghouse şrketlernn brüt yatırımlarını çeren ver grubu ncelenmştr. Alınan ver grubunda çoklu ç lşknn varlığı XX matrsnn özdeğerler ve koşul sayısı metodu yardımıyla satlanmıştır. Yne bu çalışmada lgl çok değşkenl çoklu regresyon çn testler ve çoklu ç lşknn etks ncelemştr. Lovetsky, Tshler ve Conkln (00), X ve Y değşlerne at lneer kombnasyonları ve kovaryans matrs yardımıyla EKK ler ve temel bleşen analz arasındak lşky ncelemştr. Kanonk korelasyon mantığından faydalanarak temel bleşen analznde elde edlen özvektörlere göre değşkenlern önem sırası belrlenmştr. Breman ve Fredman (997), Hoerl ve Kennard (970) tarafından önerlen yöntem le çoklu ç lşknn varlığında rdge regresyon kullanarak çoklu ç lşknn regresyon katsayıları üzerndek etksn azaltmıştır. Çoklu ç lşkl verlern standartlaştırılmasıyla elde edlen yanıt değşkenlern korelasyon matrs yardımıyla yüksek lşkl değşkenler belrlenmş, rdge regresyonu uygulayarak ekk tahmnler ve rdge regresyon tahmnler karşılaştırılmıştır. Cannon (009), çok değşkenl çoklu regresyon modelnde varyansın (aşırı büyük) şşmes durumunu ncelemş ve Brown ve Zdek (980) tarafından önerlen çok değşkenl çoklu regresyon çn rdge regresyonu kullanarak olumsuz etklern ndrgemştr. XX matrsnn Büyükşehr beledyes vers gelr ve gder arasındak lşky analz etmek çn çok değşkenl çoklu regresyonda katsayılar önem test uygulanı alt küme seçm krterler le en y model belrlenmştr. Kanonk korelasyon ve temel bleşenler analz le EKK arasındak lşk ncelenmş olu açıklayıcı ve yanıt değşkenlern öneml olanları belrlenmştr. Endüstrnn aynı ş kolunda bulunan 3 şrketn yasa verlernn çoklu çlşk durumundayken, rdge regresyon ve temel bleşenler regresyon yardımıyla çoklu çlşknn katsayılar üzerndek olumsuz etks azaltılmıştır.
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN. ÇOK DEĞİŞKENLİ ÇOKLU REGRESYON ANALİZİ Regresyon analz, aralarında sebe-sonuç lşks bulunan k veya daha fazla değşken arasındak lşky, o konu le lgl tahmnler yada kestrmler yaablmek amacıyla regresyon model olarak adlandırılan matematksel br model le karakterze eden br statstksel analz teknğdr (Şahnler, 000). Regresyon analznde yanıt değşkenler ve açıklayıcı değşkenlern sayısına göre model adlandırablrz. Tek br yanıt değşken ve tek br açıklayıcı değşken durumunda oluşturulacak regresyon modelne bast doğrusal regresyon adı verlr ve Y = β 0 + βx + ε, =,, K, n şeklnde yazılablr. Çoklu regresyon model se br yanıt değşken ve brden fazla açıklayıcı değşken durumundak regresyon modelne denr ve Y = β0 + βx+ βx + K + β X + ε, =,,..., n şeklnde yazılablr. Brden fazla yanıt değşken olması durumunda se regresyon analzler çok değşkenl çoklu regresyon analz le yaılır. Çok değşkenl statstksel analz, tek değşkenl statstksel analz yöntemlernn yeterl sonuç vermedğ durumlarda kullanılan yöntemlern genel adıdır (Küçükönder, Efe ve Akyol, 004). Çok değşkenl çoklu regresyon analz se açıklayıcı ve yanıt değşkenlernn analzn çok değşkenl yaklaşımla çözümlemeye yönelk olarak gelştrlmş br analz yöntemdr (Keskn, Boysan ve Göktaş, 007)... Çok Değşkenl Çoklu Regresyon Modelnn Matematksel Gösterm Çok değşkenl çoklu lneer regresyon model 3
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN Y n = n X. Β + Ξ (.) ( q+ ) ( q+ ) n olarak yazılablr. Burada Y yanıt değşkenlern, X açıklayıcı değşkenlern, Β regresyon katsayıların ve Ξ hataların matrs olarak yazılablr. Model açık bçmde Y Y M Y = β = β = β 0 0 0 + β + β + β X X X + K + β + K+ β q X q + K + β q q X X q + ε q + ε () + ε () ( ) (.) olarak fade edleblr. (.) eştlğnde verlen modeldek Y, X, Β ve Ξ matrsler açık bçmde yazılacak olursa; X ver matrs: x x L x q X x x K x X M M M O M M x n xn x K nq X n q X ( X X K Xq) ( q ) n + = = = olarak fade edleblr. Bu göstermde, n boyutlu brlerden oluşan vektör, X, K, lar se n boyutlu açıklayıcı değşkenler vektörüdür. X K X lar X q ( + q) boyutlu gözlemlern vektörlerdr. Y yanıt değşkenlernn matrs gösterm:,, n y y y K y y y y y Y K = = = Y Y Y n M M O M M y n yn y K n y n ( K ) 4
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN şeklnde olu bu göstermde Y ( =, K, ) n boyutlu vektörler Y matrsnn sütunlarını ve y ( j =, K, n ) boyutlu vektörler Y matrsnn satırlarını j göstermektedr. Β katsayılar matrs se ( q + ) boyutlu olu β L β 0 0 β Β = = = () () ( ) ( β β β ) ( q+ ) M O M K βq β M L q β q + β şeklndedr. Ξ, n boyutlu hata matrs se ε ε K ε ε ε ε ε ε Ξ= = = M M O M M εn εn ε n ε K n n K () () ( ) ( ε ε K ε ) olarak fade edleblr. Bu göstermlerle brlkte (.) le verlen denklem sstem =, K, olarak veya matrs gösterm le Y ( ) ( ) = Xβ + ε, y y K y x x L x q β0 β0 K β0 ε ε K ε y y K y x x K x q β β K β ε ε K ε = + M M O M M M M O M M M O M M M O M y y K y x x K x β β K β ε ε K ε n n n n n nq q q q n n n şeklnde yazılablr. 5
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN 6.. Çok Değşkenl Çoklu Regresyon Modeln Varsayımları Çok değşkenl çoklu regresyon analznde aşağıdak varsayımlar geçerldr:. Ξ hata matrsnn beklenen değer 0 yan ( ) 0 = Ξ Ε dır. Denk olarak XB Y E = ) ( olarak da yazılablr. Bu varsayım lneer modeln doğru olduğunu belrtr.. Ξ matrsnn satırlarının lşksz olduğu varsayılır. Yan, j E j =, 0 ) ( ε ε n j,,, K = dr. ε nn kovaryans matrs Σ le gösterlr ve blnmedğ varsayılır. ε lern ortalamaları sıfır olduğundan ) ( ) ( ) ( ) ( j E Cov y Cov σ ε ε ε = = Σ = = dır. Ayrıca 0 ) ( ) ( = E ε olduğundan ( ) ), ( 0 0 0 0 0 0 0 ) ( ), ( ) ( ) ( ) ( ) ( j j j j j nj n j n j n nj j j nj j j nj j n j j Y Y Cov I E E E Cov = = = = = = σ σ σ σ ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε ε K M M K K K M dır (Srvastava, 979). Aynı gözlem vektöründek -nc ve j -nc bleşenler lşkl ken farklı gözlem vektörlerndek bleşenler lşkszdr. 3. Ξ hataları çok değşkenl normal dağılıma sahtr (Srvastava, 979)..3. Çok Değşkenl Regresyon Modelde En Küçük Kareler Tahmn ( )( ) ( ) S Y X Y X Β =ΞΞ= Β Β eştlğnn Β ye göre türev alını sıfıra eştlenmes le Β nn en küçük kareler tahmn edcs bulunur:
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN Β= ˆ ( ) S Β = Β + Β= XXΒ= XY ( XX) XY XX 0 XY n ˆ ˆ Β Β = ˆj ve = j= ˆΒ en küçük kareler (EKK) tahmn edcs ( )( ) ( Y X ˆ) ( Y X ˆ) tr Y X Y X ε Β Β ncelklern de mnmum yaar (Rencher, 00). (.) model çn Y matrsnn her br kolonuna Β nn br kolonu karşılık gelr. Bu nedenle Brown ve Zdek (980) ve Scolve (970), =,, K, çn Y nn her br X,, X, K X q le ayrı ayrı tahmn edlebleceğn belrtmştr. Y nn kolonları Y,, Y, K Y le gösterldğnden ( ) ( XX XY XX) X ( Y Y Y) ( ), ( ),..., ( ) Β= ˆ =,,..., = XX XY XX XY XX XY ( ˆ() ˆ() ˆ( ) β β β ) = K yazılablr. EKK nın özellkler;. ˆΒ, Β nın yansız tahmn edcsdr.. ˆΒ dak β jk ların EKK tahmn edcler tüm lneer yansız tahmn edcler arasında mnmum varyansa sahtr. Bu sonuç se Gauss Markov teorem olarak blnr. 3. ˆΒ dak tüm βˆ jk lar brbrleryle lşkldr. Bunun neden X değşkenler arasındak ve Y değşkenler arasındak lşkdr. X,, X, K X q brbr le lşkl olduğundan ˆΒ nın verlen br kolonundak βˆ lar lşkldr. X,, X, K X q ortagonal se ˆΒ nın her br kolonundak βˆ lar lşkszdr. Dolayısıyla X ler arasındak lşk 7
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN her kolondak βˆ ların brbr le lşksn etkler. Ayrıca Y,, Y, K Y ler lşkl olduğundan her kolondak βˆ lar dğer kolondak βˆ lar le lşkldr. 4. ˆΒ çok değşkenl normal dağılıma sahtr..4. İçn Tahmn Edc ( ) = Cov nn yansız tahmn edcs; y S e ( Y XΒˆ) ( Y XΒˆ) E = = n q n q ˆ YY ΒXY = n q le verlr: E( S e ) =..5. Lkelhood Tahmn Edc Çok değşkenl çoklu regresyon modelnde hatalar normal dağılıma sah ken arametrelern tahmnler genellkle lkelhood tahmn metoduyla bulunur. boyutlu çok değşkenl normal dağılım, tek değşkenl normal dağılımın genelleştrlmşdr (Johnson ve Wchern, 00). Y ( =,, K ) () Xβ ortalamaya sah, I sah rasgele örneklem se Y nn olasılık yoğunluk fonksyonu σ varyanslı normal dağılıma ( ) f Y πσ e ( Y µ ) σ =, < Y < ve lkelhood fonksyonu; 8
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN () ( Y ) Xβ n n = LB (, σ ; Y ) = ex πσ σ LB σ Y ( Y XB)( Y XB) = (.3) (, ; ) ex n n σ ( ) σ π şeklndedr. (.3) eştlğ Σ çok değşkenl çoklu regresyon analznde yazılacak olursa L( ΒΣ, ) =. ex n ( Y XB) Σ ( Y XB) Σ ( π) buradan da; InL( ΒΣ, ) = nln( π) In( Σ) tr ( Y XB) Σ ( Y XB) (.4) olarak yazılablr. (.4) eştlğnn B ve Σ na göre türevlern alı sıfıra eştlersek; InL(.) = XY XY + XXB = 0 B = XXB XY XXB = Β= ˆ XY ( XX) XY ve Σ ya göre türev alını sıfıra eştlendğnde Σ= ˆ ( Y XB ˆ )( Y XBˆ) n 9
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN elde edlr. Burada nσ Wshart dağılımına sahtr (Johnson ve Wchern, 00).5.. Wshart Dağılımı Wshart (98) tarafından ortaya konulmuş br dağılım olu genellkle K Kare dağılımının uzantısı olarak çok değşkenl durumda yer alır (Kollo ve Von Rosen, 005). Wshart dağılımı kovaryans matrs tahmnnn analznde öneml rol oynar (Hardle ve Smar, 003). ( ) X ~ N µ, Σ olu Σ 0 ve µ = 0 olmak üzere q q tnde br A matrs bazı X matrsler çn q A = XX olarak yazılablyorsa Wshart dağılımına sahtr. q =, µ = 0 ve Σ= I se Wshart matrs n serbestlk derecel K Kare dağılımının genelleştrlmş haldr (Kollo ve Von Rosen, 005 ( ) X ~ N 0, Σ ve X, A rasgele değşken n = çarımları olarak yazılablr. fonksyonu, X j den bağımsız olmak üzere X ( X,, Xq ) = K olsun. A= XX tolamına dönüştürülür yan rassal vektörlernn Burada X vektörü Wshart dağılımına sah se dağılımın yoğunluk W n ( A; ) Σ = ( n q ) tr A Σ A e, A> 0 q nq qq ( ) 4 n π Σ Γ ( n+ ) = 0, dy.. n serbestlk derecel olarak yazılablr. 0
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN.6. Çok Değşkenl Regresyon Parametrelernn Önem Test Β arametre matrs aşağıdak şeklde arçalanablr: β0 K β0 β 0 Β= =β K β Β M O M βq β K q X değşkenlernn hç brnn Y değşkenlernn herhang brn tahmn etmedğ (redct) hotez Η Β 0 hotezne karşı Η Β 0 le verlr. Genel 0 : = : kareler tolamı Y Y, YY = ( YY Β ˆ XY ) +Β ˆ XY olarak yazılablr (Rencher, 00). Eştlğn her k tarafından nyy çıkartılırsa: ( ˆ ) ( ˆ ) YY nyy = YY Β XY + Β XY nyy =Ε+Η bulunur. ˆ Ε= YY Β XY hata kareler tolam matrs ve ˆ Η=ΒXY nyy çaraz üretm matrsdr (Tmm, 00). Bu matrsler, Η 0 hotezn test çn kullanılır. Η 0 hoteznn test edlmes çn kullanılan test statstkler (Tmm, 00) se Wlk s Lamda Λ = Hotellng Lawley Plla İz s = + λ = Ε Ε + Η s (s) U = λ = tr[ Ε Η] = λ [ ] s (s) V = = tr Η( Η + Ε) = + λ
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN şeklndedr. Roy en büyük kök test θ = λ + λ.6.. Wlk s Lambda Test İstatstğ λ değerler Ε Η matrsnn özdeğerler ve s = mn(, q) olmak üzere, Wlk s Lambda test statstğ; ˆ s Ε YY ΒXY Λ= = = (.5) Ε+Η + YY nyy = λ yazılablr. (.5) le verlen test statstğ lkelhood oran yaklaşımı le de test edleblr. Λ, 0 arasında değerler alır (Pham-Ga, 008). H 0 : B = 0 hotez altında Λ, Λ, q, n q dağılımına sahtr. v Ε = n q ve v Η = q olmak üzere Λ Λα,, vη, v se α önem düzeynde Η Ε 0 red edlr. Λ değer sıfıra yakınsadıkça hotez red edlrken e yakınlaştıkça kabul edlr (Bçkc, 007). Λα değerler Tablo Ek de verlmştr.,, vη, vε Wlk s Lambda test statstğ genellkle çok değşkenl analzde çeştl statstksel testler çn kullanılır ve tek değşkenl analzde F dağılımı le aynı rolü oynar (Pham-Ga, 008). S yy S yx S matrs S = olarak arçalanmak üzere Wlk s Lambda test S xy S xx statstğ kovaryans matrs yardımlıyla S S yy S yxs xx S xy Λ = = (.6) S S S xx yy yy
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN olarak da fade edeblr. Wlk s Lamda statstğ χ statstğne de dönüştüreblr. Bu dönüşüm; χ = vε Η ( v + ) ln Λ şeklnde yazılablr..6.. Hotellng T - Lawley İz İstatstğ Hotellng T test çok değşkenl normal dağılım varsayımına göre kurulan çok değşkenl hotezlern test edlmesn amaçlayan br yöntemdr. Hotellng (93), Student t nn çok değşkenl genellemes olan T statstğnn önemllğn değerlendrmek çn br dağılım ortaya koymuştur ve bu dağılım çok değşkenl hotezlern test edlmesnde kullanılmaktadır. T test statstğ tek değşkenl hotezlern test edlmesnde yararlanılan t testnn çok değşkenl hotezler çn genelleşmş bçmdr(özdamar, 999). statstğ λ değerler Ε Η matrsnn özdeğerler olmak üzere Hotellng T - Lawley U ( s) = s = λ = tr [ Ε Η] olarak tanımlanır. v v E (s) U H test statstğnn üst yüzdelk noktaları Tablo Ek de verlmştr. ve U v H ( s) > U se hotez red edlr. α 3
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN.6.3. Roy En Büyük Kök İstatstğ Η 0 hotezn test çn Brleşm - Kesşm test Roy un en büyük kök test statstğn kullanır. λ, Ε Η matrsnn en büyük özdeğer olmak üzere Roy en büyük kök test statstğ, θ λ = + λ olarak tanımlanır. s mn(, q) =, = ( q ) N olu m ve = ( n q ) olmak üzere θ > se hotez red edlr. θ çn krtk değerler Tablo Ek 3 de verlmştr. θ α, s, m, N Η 0 hoteznn alternatf olan Η hotez brleşm test olarak tanımlandığından dolayı Brleşm Kesşm testnde hotezn test edlmes çn red bölgelernn brleşm alınır (Levne ve Ohman, 997). Red bölgelernn brleşmnn alınmasından dolayı Ε Η matrsnn en büyük özdeğer alınmalıdır..6.4. Plla Test İstatstğ Plla test statstğn; V ( s) s λ = = tr + λ = [ Η( Η + Ε) ] olarak fade edleblr. Roy en büyük kök statstğ yöntem le s, m ve N arametreler benzerlk gösterr. değerler Tablo Ek 4 te verlmştr. V > Vα se hotez red edlr. Test çn krtk 4
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN H 0 doğru ken tanımlanan dört test statstğnn tamamı aynı I. T hatayı verr. H 0 yanlış se testlern güç sıralaması özdeğerlernn konumuna (bçmne) bağlıdır. Özdeğerler eşt veya yaklaşık eşt se testlern gücünün sıralaması ( ) ( s) V s Λ U θ şeklndedr. Sadece br tek özdeğer sıfırdan farklı se ( s) ( s) θ U Λ V dr (Kladooulos ve Ramsey, 005)..6.5. X Değşkenlernn Alt Kümes Üzernde Önem Test Regresyon katsayıları çn yaılan önem test le katsayıların öneml olanları seçleblr. Başka br değşle modeldek q tane X açıklayıcı değşkenlernn model çn öneml olanları seçleblr. Y lern ( Y, K,Y ), X n son h değşkenne, Xq h+, Xq h+, K, Xq bağlı olmadığı hotez nceleneblr. Β matrs Β d, h satır çermek üzere yazılablr. Β Β= Β r d olarak arçalanablr. Hotez Η : 0 0 Β d = olarak X r, X n Β r ye karşılık gelen kolonları se ndrgenmş model, Y = X r Β r +Ξ şeklnde fade edleblr (Rencher, 00). Tam model le ndrgenmş model karşılaştırmak çn ˆ XY Β tam model ve ˆ r Β XY ndrgenmş model çn regresyon kareler tolamı ve çaraz üretm matrsler r arasındak fark kullanılır: ˆ ˆ r r Η=ΒXY Β XY. Bu durumda : 0 0 d Η Β = hotezn test, tam ve ndrgenmş modeln Xq h+, Xq h+, K, Xq ve X, X, K, Xq değşkenlernn önemllğn testtr. Yaılan test çn tam modeldek hata kareler tolam matrs kullanılır. Bu durumda ˆ Ε= YY Β XY ( YY ˆ XY ) ( ˆ XY ˆ rxy r ) Ε+Η= Β + Β Β = YY Βˆ XY r r olacaktır. Buradan Wlk s Lambda statstğ 5
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN Λ ( Xq h+, Xq h+, K, Xq / X, X, K, Xq h) Ε = Ε+Η ˆ YY ΒXY = YY Βˆ XY r r (.7) le verlr. ( Xq h+, Xq h+,, Xq / X, X,, Xq h) Λ K K göstermnde, Wlk s lamda tam ve ndrgenmş model testn sağlar. (.7) fades tam ve ndrgenmş model çn Λ nın termler cnsnden fade edleblr. ˆ Β r r YY XY, ndrgenmş model Y = X r Β r +Ξ çn hata matrsdr. Bu hata matrs, ndrgenmş model çn regresyonun önemllğn test kullanılablr. (.5) dekne denk olarak yazılacak olursa Λ r değer Λ = r ˆ Β r r YY YY XY nyy şeklnde gösterlr. yazılablr: (.7) fades tam ve ndrgenmş modeller çn Wlk s Λ ların oranı olarak YY Βˆ XY Λ ( Xq h+, Xq h+, K, Xq / X, X, K, Xq h) = ˆ XY YY Βr r YY Βˆ XY YY nyy = YY Βˆ XY Λ = Λ r r YY nyy f r 6
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN Tam model ve ndrgenmş model çn Λ değerler bulunarak oranlanır. Bu şeklde hesalanan test statstğ düzeynde Η 0 red edlr. Λα,, v, v tablo değernden küçük veya eşt se se α önem Η Ε.7. X ve Y Arasındak Uyumun Ölçüsü İk değşken kümes arasındak uyum ölçüsü kanonk korelasyonlar kullanılarak belrleneblr (Bölüm 3.3). Burada belrleyclk katsayı oranı ncelenecektr. Regresyon model tarafından açıklanablen değşmn tolam değşm çndek ayı olan belrleyclk katsayısı, yanıt değşkendek değşmn yüzde kaçının açıklayıcı değşken tarafından açıklanabldğn belrtr (Alar, 003). Y nn tek değşkenl olduğu durumda belrleyclk katsayısı; R = s yx S s xx yy s yx olarak fade edleblr. lşk varken R, 0 ve arasında değşr. İk değşken arasında doğrusal br R değernn e yakınsaması yanıt değşkendek değşmn büyük br bölümünün açıklayıcı değşkenler tarafından açıklandığını ve varsayımlar sağlandığında modeln uygun olduğunu gösterr (Alar, 003). uyumun Çok değşkenl durumda Y, Y,..., Y ve X, X,..., X q arasındak R benzer ölçüsü R M S yx S S xx yy S yx = (.8) 7
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN olarak tanımlanablr. Burada elde edlr. S yx, S xy, S xx ve S yy, S yy S yx S = matrsnden S xy S xx.7.. RV Katsayısı (.8) eştlğnn harcnde Robert ve Escoufer (976) tarafından önerlen dğer br yöntem, RV = ( xy yx ) ( xx) tr( Syy ) tr S S tr S dr. RV katsayısı değşkenlern k kümes arasındak lşkyle lglenr (Josse, Pages ve Husson, 008). Aynı durum Hotellng (936) tarafından öne sürülen kanonk korelasyon analznde de değşkenlern k kümes arasındak lneer bağımlılığın tanımlanmasıyla lgl referanstır. Brnc grubun değşkenlernn lneer kombnasyonlarıyla knc grubun değşkenlernn lneer korelasyonu araştırılır. Kanonk korelasyon analzyle kanonk korelasyon katsayıları elde edlr. RV katsayısı k değşken kümes arasındak lşkyle korelasyon katsayısı değerlern belrlemede önemldr (Josse, Pages ve Husson, 008). RV katsayısı, maksmum kanonk korelasyon analzndek kanonk korelasyon katsayısıyla lglendğ şeklde lglenr. Yan, RV katsayısının maksmum değeryle lglenlr. Robert ve Escoufer (976) tarafından önerldğ şeklde; X ve Y değşkenler arasındak uzaklık kullanılarak RV katsayısı tanımı yaılablr. Tüm değşkenlern sıfır ortalamaya sah merkezleştrlmş olduğu varsayılmak üzere X ve Y değşkenlernn sırasıyla korelasyon matrsler S( X) = XX ve S( Y) = olarak tanımlansın. Br A karesel matrsnn normunun ( ) YY A = tr AA le verlen 8
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN { } tanımdan hareketle ( ) ( ) S X trs X = olarak yazılablr. X ve Y değşkenler çn br gösterm olarak C( X ) ve C( Y ) arasındak uzaklık ölçümü; = { } ( ) { ( ) } { } ( ){ ( ) } { trs( X) } { trs( Y) } S( X) { trs( Y) } + SY ( ) { trs( X) } S( X) SY ( ){ trs( X) trs( Y) } { ( ), ( )} ( ) ( ) dst C X CY S X trs X SY trs Y ( ) ( ) S X trs Y SY trs X A= AA= A = traa = ( ) trs( Y) trs X ( ) ( ) + ( ) ( ) ( ) ( ) { ( ) ( )} ( ) trs( Y) { ( ), ( )} = ( ) ( ) ( ) trs( Y) { } ( ) ( ) ( ) { } { } ( ) ( ) trs X trs Y trs Y trs X tr S X SY trs X trs Y = trs X tr S X SY trs X dst C X CY tr S X SY trs X trs Y = RV XY, { } ( ) ( ) { tr( XYYX )} tr( XX ) tr( YY) (, ) = (. ) { } { } RV XY tr XXYY tr XX tr YY = olarak da yazılablr. RV katsayısı [ 0, ] kaalı aralığında değerler alır ve bu değer e yaklaştıkça modeln daha y sonuçlar vereceğn gösterr (Robert ve Escoufer, 976). RV katsayısının özellkler;. = q = se RV = r (bast korelasyon katsayısının kares) 9
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN. = ve q > se bazı koşullar altında belrleme katsayısı RV nn özel durumudur. Yan 3. 0 RV RV = R olacaktır. 4. RV = 0 se burada k değşken kümes lşkszdr (Josse, Pages ve Husson, 008)..8. En İy Modeln Seçm Çok değşkenl regresyon çözümlemesnde, model oluşturan açıklayıcı değşkenlerden veya yanıt değşkenlerden bazılarının modele katkısı önemsz olablr. Bu nedenle, yanıt değşken en uygun şeklde açıklayacak açıklayıcı değşkenlern belrlenmes ve önemsz değşkenlern modelden çıkartılması gerekr. Bu sürece, değşken seçm denr (Alar, 003). Modeldek değşkenler seçmek çn forward seçm sürec, backward eleme sürec ve stewse sürec kullanılır. Çok değşkenl çoklu regresyon analznde açıklayıcı değşkenler X ler çn yaılan seçm yöntemler yanıt değşkenler Y ler çnde aynı şeklde geçerldr. Forward, Backward ve Stewse seçm süreçlernn yanı sıra belrleyclk katsayısı, kullanılarak model seçm yaılablmektedr. R çoklu S hata kare ortalaması ve Mallow s C krter de.8.. Forward (İler Doğru) Seçm Sürec Forward seçm sürec, Wlk s Λ temelnde ele alınır. İlk adımda her X j üzernde tüm tane Y yanıt değşkenn regresyonu test edlr. satırlıdır: X j ye ve sabt terme karşılık gelen satırı çerecek şeklde ˆΒ matrs k βˆ βˆ L βˆ Β ˆ j = βˆ βˆ βˆ L 0 0 0 j j j. 0
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN Değşken seçm sürecnde kullanılacak olan test statstğ; ( X j) Λ = ^ β j j YY YY XY nyy olarak yazılablr. Burada ( X j ) X j nn ( X j ) Λ değer Λ,, n dağılımına sahtr. Her j çn Λ değer hesalandıktan sonra mnmum ( X j ) Λ değern veren X j değşken seçlr. İlk olarak, dğer değşkenlern varlığı durumunda her değşken test edlmez; tane Y değşkenn tek başına en y tahmn eden araştırılır. X j değşken Brnc adımda modele dahl edlen değşken ( X değşken olsun) çn düzeltlen her X çn ( X j / X) ( X, X j) Λ Λ = (.9) Λ ( X ) olarak verlen kısm Λ hesalanır. Her X j X Λ ( X j, X) n mnmum değer seçlr. çn ( X j, X) Λ hesalanır ve İknc adımda Xdeğşken modele dahl edlsn. Üçüncü adımda ( X j / X, X) ( X, X, X j) Λ Λ = (.0) Λ ( X, X ) fadesn mnmum yaan X j araştırılır. (.0) eştlğn mnmum yaan değer araştırılır. Dğer değşkenler çn tek tek rosedür tekrarlanır. m tane değşken modele alındıktan sonra kısm Λ br sonrak adım çn
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN ( X j / X, X, K, Xm) ( X, X,, Xm, X j) Λ K Λ = Λ ( X, X, K, X ) m (.) olur. Burada X, X, K, Xm modele alınan lk m değşken ve X j modele alınablecek kalan q m değşken çersnden aday değşkendr. (.) mnmum yaan X modele alınır. (.) le verlen kısm Wlk s lamda Λ,,, n m j Λ dağılımına sahtr (Rencher, 00). Forward seçm teknğne model en y açıklayan değşken le başlanır. En küçük kısm Λ değer önceden belrlenmş eşk değer geçene kadar rosedüre devam edlr. Aks takdrde, forward yöntem modele değşken eklemeye devam eder (Al-Subah, 00). Her adımda modele gren değşken kısm F le sınanablr. Tablo. dek eştlklern yardımıyla ve v Η değerlerne göre ve her X j çn hesalanan Wlk s Lambda değerleryle F statstğ hesalanablr (Rencher, 00). Eğer FHesa > F se X j Tablo değşken modele dahl edlr. Tablo. Wlk s Lambda Değerlernn F İstatstğ Değerlerne Dönüştürme v, Η F İstatstğ Değer Serbestlk Dereceler Parametreler ( ) Herhang değer, v Η = Herhang değer, v Η = Herhang v Η değer, = Herhang v Η değer, = Λ v Ε + Λ Λ v Ε + Λ ΛvΗ Λ v Ε Λ vε Λ v Η v, Ε + ( ), v Ε + v, v Η Ε ( v ) v, Η Ε Bu dönüşüm serbestlk derecelernn genel şeklne göre aşağıdak gb dönüştürüleblr.
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN df = vη, df = wt vη ( ) v 4 w= vε + vη ( + vη + ), t = + 5 Η vη Λ F = Λ t t df df.8.. Backward (Gerye Doğru) Eleme Sürec Gerye doğru eleme şlem, lerye doğru seçm şlemnn tersne, tüm değşkenlern modelde bulunduğu regresyon denklemnden değşkenlern tek tek çıkartıldığı seçm yöntemdr. Bu yöntemde, değşkenlern modele grmesne lşkn seçm krterler yerne, değşkenlern modelden çıkartılmasına yönelk seçm krterler uygulanır. Backward eleme sürec, modeldek tüm X ler le başlar ve kısm Λ kullanılarak her sefernde br slnr. İlk adımda, her X j çn kısm Λ ( X j / X, X, K, X j, X j+, K, Xq) Λ( X,, Xq) ( X, X, K, X j, X j+, K, Xq) Λ = Λ K Λ,, n q dağılımına sahtr (Rencher, 00). En büyük kısm Λ ya sah değşken modelden atılır. İknc adımda, kısm Wlk s Λ gerye kalan her q değşken çn hesalanır. Dğerlernn var olduğu durumda en az öneme sah değşken elenr. Bu süreç öneml olan en büyük kısm Λ ya varıncaya kadar devam eder. Br başka deyşle önceden belrlenmş eşk değerden büyük olmadığında süreç sonlandırılır (Al-Subah, 00). Tablo. dek eştlklern yardımıyla ve v Η değerlerne göre ve her çn hesalanan Wlk s lamda değerleryle F statstğ hesalanablr. Denklemdek X j 3
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN tüm değşkenler çn kısm F değerler bulunur. F değerlernden en küçük değere sah olan değşken önemsz se modelden çıkartılır (Koçak, 006)..8.3. Stewse Sürec (Adımsal Süreç) Stewse regresyon, sayıda belrleyc değşken çnden yanıt değşken açıklama ntelğne sah uygun belrleyc değşkenlern alt kümesn seçmey sağlayan br yöntemdr. Stewse regresyon le k değşken kümesnden ( k ) < değşkenden oluşan br model oluşturulur. Stewse regresyon da değşkenlern, yanıt değşken açıklamaktak güçlerne göre modele alınması söz konusudur (Özdamar, 999)..9. Y Değşkenlernn Br Alt Kümesnn Seçm X değşkenler çn Bölüm.8..8.3 dek seçm sürec le yaılan yöntemler Y değşkenlernn seçm çnde aynı şeklde yaılır. Kullanılan blgsayar rogramında X değşkenler yanıt ve Y değşkenler açıklayıcı değşkenler gb lstelenr (Rencher, 00). X değşkenlernn alt kümesnn bulunmasından sonra bazı Y değşkenler herhang X değşkenne bağlı değlse modelden slneblr. Alt kümeler çn Wlk s lamda tam ve ndrgenmş modelde Y değşkenler çn hesalanır. Kısm Wlk s lamda değerlerne göre Y değşkenlern ekley sleblrz. Forward seçm sürecnde Y değşkennn modele eklenmesnde (.9), (.0) ve (.) eştlklernde verlen kısm Λ statstkler tanımlanır. Örneğn, lk k değşken Y ve Y modelde ken hesalanan Wlk s lamda statstğ, ( Yj / Y, Y) Λ Λ = Λ ( Yj, Y, Y) ( Y, Y ) 4
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN şeklndedr. Her Yj Y, Y çn mnmum ( Yj / Y, Y) ve Y 3 modelde ken kısm Wlk s Λ statstğ Λ seçlr. Benzer şeklde Y, Y ( Yj / Y, Y, Y3) Λ Λ = Λ ( Yj, Y, Y, Y3) ( Y, Y, Y ) 3 şeklnde olu Λ, qn, q 4 dağılımlıdır. q modeldek X değşkenlernn sayısı ve 4 modeldek Y değşkenlernn sayısını gösterr. = ken Λ, qn, q 4 dağılımı Fqn, q 4 dağılımına dönüştürüleblr. Bakcward eleme sürecnde, lk adımda Λ, q, n q dağılımına sah ( Yj / Y, Y, K, Yj, Yj+, K, Y) Λ( Y,, Y ) ( Y, K, Yj, Yj+, K, Y) Λ = Λ K değern maksmum yaan Y j değşken modelden atılır. Stewse sürec Forward sürecnn değştrlmş br hal olarak tasarlanablr. Tüm süreç X değşkenlernn seçm süreçlerne benzer br şeklde yaılablmektedr..0. Tüm Olası Alt Kümeler Tüm olası regresyon yöntem otansyel tahmn edclern ktlesnn tüm olası alt kümelernn belrlenmes olarak adlandırılır. Alt küme seçmnde sıkça kullanılan yöntemlerden brsde mümkün olan tüm altküme denklemlern ncelemektr. Regresyon model karşılaştırmak çn çeştl krterler le tüm olası regresyon seçm sürec kullanılablr (Al-Subah, 00), (Koçak, 006). R, S ve C krterler, çoklu regresyondak tek değşkenl Y değşkenn tahmn çn X n olası alt kümlern karşılaştırmak çn kullanılır, burada, k tane mevcut bağımsız değşkenlerden seçlen alt kümelerdek X lern sayısını 5
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN göstermektedr. Bu üç krter R, S ve C benzer şeklde matrs göstermne genşletleblr. Bunlar determnant ya da z kullanılarak skaler forma ndrgeneblr (Rencher, 00). Değşken sayısı az olduğunda en y alt kümey bulmak çn değşkenlern tüm olası alt kümeler ncelenr. k sayıda değşken olduğunda bu değşkenlern tüm k kombnasyonlarına karşılık gelen tane olası alt küme vardır (Koçak, 006)..0.. Çoklu Belrleyclk Katsayısı R fades Y nn tek değşkenl durumunda ve ( ) sah model çn çoklu belrleyclk katsayısı olarak tanımlansın: tane X değşkenne R β = X y ny ˆ yy ny. R nn çok değşkenl matrs gösterm ( ) ( ˆ ) R = YY nyy Β XY nyy olarak da fade edleblr. m, y lern sayısı ve, k tane mevcut açıklayıcı değşkenden seçlenlern sayısı olmak üzere tr ( R ) m olduğu gb kullanılır (Rencher, 00). Böylece tr ( R ) m y maksmum yaan R y skaler forma dönüştürmek çn ( R ) tr 0 m,3, K, k olur. Tek değşkenlde = belrlenr. Formülde tr ( ) R yerne R de kullanılablmektedr (Tmm, 00). 6
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN.0.. Hata Kareler Ortalaması Tek değşkenl durumda S HKT = HKO = n olarak tanımlanan hata kareler ortalaması çok değşkenl durum çn S Ε = (.) n olarak fade edleblr. Burada ˆ E = YY BXYdr. Skaler br değere dönüştürmek çn tr ( S ) ya da S kullanılablr ve tek değşkenldek S le aynı amaçlı kullanılır. tr ( S ) nn mnmum değerne sah alt model yada ( S ) tr( S k ) tr < olacak şekldek en küçük değerne sah alt model seçlr. Benzer br uygulama S çn de yaılablr (Rencher, 00)..0.3. C Krter Model seçm çn Mallow s krter çoklu regresyon model çn ( ) ( ) Γ = σ Ε Yˆ Xβ Ε Yˆ Xβ + olarak önerlr (Mallows, 973). X, tane değşkenn seçlmş olduğu matrs, Y = X βˆ ve β ˆP fades ˆ P β nn en küçük kareler tahmn edcs olsun. 7
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN ( ˆ ) ( ˆ β β) YKT =Ε Y X Ε Y X tanımlanırsa Γ = σ YKT yazılablr. + Γ, () model dereces ve YKT modeln yanlılığı arasındak lşknn ölçüsüdür. Genellkle, küçük se YKT büyüktür. Bundan dolayı en y model çn tek br mnmum Γ seçlr (Baek ve ark., 005). Γ blnmyorken Mallow s (973) aşağıdak tahmn önerr, ( ) σˆ C = HKT n (.3) ( βˆ ) ( βˆ ) HKT = Y X Y X, σ ˆ = HKT n k ( βˆ) ( βˆ) HKT = Y X Y X ve ˆβ, β nın en küçük kareler tahmn edcsdr. tane değşkenn bulunduğu regresyon model very yeternce açıklıyorsa, yanlılık önemsz olur, yan 0 HKT YKT dır. Bu durumda ( n ) ve σ ˆ tahmn brbrne yakın değerler aldığında (Baek ve ark., 005). Bundan dolayı; σ tahmn çn her k fade de aynı değere sah olur ( ) σˆ C = HKT n olur. Burada, Α = X ( X X ) X, Ε( HKT ) = n + β X Xβ Ε( Y AY ) Ε ( Y AY ) = β X ΑXβ + tr[ ΑΕ( εε )] = β X ΑXβ + σ σ ve dr. Dolayısıyla, Ε( HKT ) = ( n ) + β X ( I A) Xβ = ( n ) σ YKT σ ve n + C ( HKT ) ( n ) = σ YKT + = Γ σ Ε olur. Bu durumda, değşkenlern en y kümesnn seçm kümeler çerr ve (.) eştlğ ışığında, C nn en küçük değerlernn ortaya çıktığı test edlen bu C değerler seçm ye yakındır. Dğer taraftan, = k se HKT = ( n k) σˆ ve C = k dır (Baek ve ark., 005). 8
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN Yukarıdak belrtlen tanımlamaların ışığında C krternn çok değşkenl çoklu regresyon analzndek değer C = E E eştlğnden bulanablr. k Açıklayıcı değşkenlerden tanes alt modelde olmak üzere alt model Y X B + Ε olarak fade edleblr. Bu model yardımıyla yanıt değşkenler = Y ˆ = X B ˆ olarak tahmn edlr. Gözlem vektörlernn tahmn edlmş değerler le lglenldğnden Yˆ nın satırları olarak verlen yˆ, yˆ,, yˆ K n le lglenlr: yˆ x yˆ x = M M yˆ n x n B ˆ x Bˆ x Bˆ = M x nb ˆ. Genel olarak doğru modelde tahmn edclerdr. Bu durumda ŷ tahmn edlmş vektörler E y ) nn yanlı ( ( ˆ ( ))( ˆ ( )) ( ˆ ˆ ˆ ( ))( ˆ ˆ ˆ = ( ) + ( ) ( ) + ( ) ( ) ) E y E y y E y E y Ey Ey E y y Ey Ey E y ( ˆ ˆ )( ˆ ˆ ) ( ˆ ( ))( ˆ ( ) ( ) ( ) ( ) ( ) ) = E y Ey y Ey + Ey E y Ey E y = Cov y + Bas( y) Bas( y) ( ˆ ) [ ˆ ][ ˆ ] (.4) şeklndedr. Bu formüldek Cov y ˆ, Bˆ = ( βˆ βˆ K βˆ ) olmak üzere ( ) () () ( m) ( ˆ ) ( ) ( () ( ) ( )) = ˆ ˆ, ˆ,, ˆ β = β β K βm Cov y Cov x Cov x x x olarak yazılır. Burada m, yanıt değşkenlern sayısıdır. ( ) = Σ Cov olduğundan y 9
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN ( ˆ) Cov y ( ) L σ ( ) σx X X x mx X X x = M O M m x X X x mmx X X x σ ( ) L σ ( ) ( x( X X ) x ) = Σ dr. n gözlemn üzernden tolam alındığında n n ( ˆ ) ( ) Cov y = x X X x Σ = = n = ( ) P =Σ x X X x = Σ olur. Yanlılığın tolamı se S (.) de tanımlanmak üzere n [ Bas( yˆ ][ ˆ ) Bas( y) ] = ( n ) E( S Σ) = olarak yazılablr. (.4) eştlğ alınırsa Σ le çarılı tüm gözlemler üzernden tolamı ( ) n E ( yˆ ( )) ˆ E y y E( y) tr n E S = ( ) ( ) ( ) Σ =Σ Σ+ Σ ( ) ( ) = I + n Σ E S Σ elde edlr. E = YY Β ˆ XY olmak üzere tüm k değşkene dayalı örneklem k k k kovaryans matrs ( ) E n k S k = k olu k S, Σ nın br tahmn 30
. ÇOK DEĞİŞKENLİ LİNEER REGRESYON Semh CAN k ( ) ( ) C = I + n S S S k k ( ) = S E + n I olarak elde edlr. Bu se Rencher n (00) belrttğ gb Mallows un (973) önerdğ formdadır. Br skaler değere dönüştürmek çn tr C ) veya C kullanılır. Fakat n negatf se C de negatf olablr ve Sarks, Coutsourdes ve Troske ( (983) C nn br uyarlaması olarak E = YY Β ˆ XY olmak üzere her zaman oztf olan C = E E y önermşlerdr. k k Tüm olası alt kümeler çn C değerler hesalanır. En küçük C değern veren alt modeller en y alt model olarak alınır (Koçak, 006). 3
3. KANONİK KORELASYON ANALİZİ Semh CAN 3. KANONİK KORELASYON ANALİZİ 3.. Kanonk Korelasyon Analzne Grş Kanonk korelasyon analz, her brnde k yada daha fazla değşken bulunan, k değşken kümes arasındak lşk yaısının rdelenmesnde kullanılan çok değşkenl analz teknğdr. Bu analz dğer br çok çok değşkenl statstksel analz teknklernn özellklern taşır ve genellkle çok değşkenl regresyon analznn tamamlayıcısıdır. İşlem aşamalarının uzun oluşu, gerekl hesalamalardak ve elde edlen sonuçların yorumlanmasındak güçlüklerden dolayı, araştırıcılar kanonk korelasyon analzn kullanmayı ek fazla terch etmey, bunun yerne daha bast yöntemler kullanmaktadır. Ancak, k değşken kümes arasındak lşk yaısını bozmadan ortaya koyablme ve bast yöntemlere göre daha fazla blg edneblme bakımından bu analz teknğnn önem göz ardı edlemez. Analzde, her k değşken kümes çnde kümelerde yer alan değşkenlern kombnasyonlarından yen değşkenler elde edlr ve bu yen değşkenler arasındak korelasyonun maksmum olması amaçlanmaktadır (Keskn ve ark., 005). Kanonk korelasyon analz, br kümedek değşkenlern lneer kombnasyonları ve dğer kümedek değşkenlern lneer kombnasyonları arasındak korelasyon üzernde odaklanır. İlk olarak; en büyük korelasyona sah lneer kombnasyon çft belrlenr. Sonra başlangıçta seçlen çft le tüm korelasyonsuz çftler arasında en büyük korelasyona sah lneer kombnasyon çft belrlenr ve buna benzer şeklde devam eder. Lneer kombnasyon çftler kanonk değşken olarak ve kanonk değşkenlern korelasyonları kanonk korelasyon olarak adlandırılır (Johnson ve Wchern, 00). 3.. Kanonk Korelasyon Analnn Amacı Kanonk korelasyon analznn amaçları aşağıdak gb sıralanablr:. Aynı breyden elde edlen k değşkenler kümesnn brbrnden bağımsız olu olmadığının test edlmes 3
3. KANONİK KORELASYON ANALİZİ Semh CAN. Kümeler arası korelasyona en fazla katkıda bulunan her k kümedek değşkenlern satanması 3. Yanıt değşken ve açıklayıcı değşkenlere at kümeler arasındak korelasyonu maksmum yaan lneer kombnasyonların belrlenmes 3.3. Kanonk Değşkenler Ve Kanonk Korelasyonlar Aynı örnekleme brm üzernde ölçülmüş =,, K, q ve X X X X Y = Y, Y,, Y K ( q ) değşken kümelernn olduğu varsayılsın. Bu k değşken kümesnn doğrusal kombnasyonları arasındak korelasyon hesalanır. Bu şeklde hesalanan korelasyonlara kanonk korelasyon, değşkenlern doğrusal kombnasyonlarından oluşan yen değşkenlere de kanonk değşkenler adı verlr (Keskn ve ark., 005). Bu hesalanan kanonk korelasyonların çersnde en büyük korelasyona lk kanonk korelasyon adı verlr. Maksmum korelasyonun hesalandığı değşken kümesnn doğrusal kombnasyonuna se lk kanonk değşken adı verlr (Çankaya, 005). Y değşken kümes ( ) boyutlu µ Y ortalama vektörüne, X değşken kümes ( q ) boyutlu µ X ortalama vektörüne sah olsun. Bu değşken kümelerne at ortalama ve kovaryans matrsler µ µ Y = µ X Σ Σ YY YX Σ= Σ XY ΣXX şeklnde gösterleblr. Y; X, X, K, Xq arasındak örneklem kovaryansları ve korelasyonları sy s yx r yx S = R syx s = xx ryx R xx 33
3. KANONİK KORELASYON ANALİZİ Semh CAN matrsler le özetleneblr. S veya R arçalanmış matrsler yardımıyla X ve Y arasındak karesel çoklu korelasyon R s S s = = ryx Rxx ryx yx xx xy sy şeklnde hesalanablr. Çoklu korelasyon R, X lern br lneer kombnasyonu ve y arasındak maksmum korelasyon olarak da yan R= r olarak da max a yax, tanımlanablr. Brden fazla Y ve brden fazla X olması durumu ele alınırsa, Bölüm.7 de S verlen S = S yy xy S S yx xx arçalanışı nceleneblr. X ve Y arasındak lşk çok değşkenl çoklu regresyon analznde değer R S S S = değer le ölçülmüştü. yx xx xy M S yy R M s M = yy yx xx xy = = R S S S S r olarak yazılablr. Burada s mn ( q, ) = ve r, r, K, r s değerler S S S S yy yx xx xy matrsnn özdeğerlerdr. r değerler 0 arasında değerler aldığından aradak lşky değerlendrmek çn y br ölçü olmayacaktır. Fakat bu özdeğerler tek başlarına aradak lşknn y br ölçüsü olacaktır. r, r, K, r s lern kare köklerne kanonk korelasyon denr (Rencher, 00). X değşkenlernn lneer kombnasyonu U = ax ve Y değşkenlernn lneer kombnasyonu V = by arasındak korelasyon r max r ab, axby, = olmak üzere r en büyük korelasyonun karesdr. En büyük korelasyonu veren katsayı vektörler a ve b olarak gösterlsn. Bu durumda r, U = ax ve V = by arasındak korelasyon olu, a ve b katsayı vektörler özvektörler olarak bulunur. U ve V lneer 34
3. KANONİK KORELASYON ANALİZİ Semh CAN fonksyonlarına brnc kanonk değşkenler denr (Rencher, 00). Dğer r, r 3, K, r s özdeğerlerne karşılık gelen kanonk değşkenler U = ax ve V = by şeklndedr. S S S S yy yx xx xy matrs Α= S S ve yy yx Β= S S olmak üzere ΑΒ olarak xx xy yazılablr. ΑΒ ve ΒΑ matrsler kare matrsler oldukları sürece ΑΒ ve ΒΑ nın sıfırdan farklı özdeğerler aynıdır fakat özvektörler aynı değldr. Bu durumda r, r, K, r s özdeğerler AB = S yy S yxs xx S xy ve BA = S xx S xys yy S yx den bulunablr. Yan özdeğerler S S S S yy yx xx xy S S S S xx xy yy yx ri= 0 ri= 0 karakterstk denklemlernden elde edleblr. U = ax ve V = by kanonk değşkenlerndek a ve b katsayı vektörler aynı k matrsn özvektörlerdr: ( Syy SyxSxx Sxy r I) a = 0 ( S S S S r I) b = 0 xx xy yy yx. (3.) S S S S yy yx xx xy ve S S S S xx xy yy yx matrsler aynı sıfır olmayan öz değerlere fakat farklı özvektörlere sahtrler. S S S S yy yx xx xy matrs ve S S S S xx xy yy yx matrs q q boyutludur. Dolayısıyla a, ve b, q boyutludur. < q ken S S S S xx xy yy yx nn rankı dur. Bu durumda tane özdeğer sıfırdan farklıdır. Genelde U ( q) = ax ve s = mn, tane V = by kanonk değşken çftlerne karşılık gelen r karesel kanonk korelasyon değerler vardır. s tane kanonk korelasyon çftne karşılık gelen kanonk korelasyonlar 35
3. KANONİK KORELASYON ANALİZİ Semh CAN r U = ax V = by r U = ax V = by M ru = ax V = by s s s s s şeklnde gösterleblr. Burada r (,,, s) = K U ve V arasındak örneklem korelasyonu r = ru, V dr. X ve Y matrsndek verler standartlaştırıldıktan sonra; U ve V kanonk değşken çftler arasındak kanonk korelasyonlar brbrnden bağımsız olacak şeklde hesalanır. Kanonk korelasyon analznn yaılablmes çn ver kümesnde bazı varsayımların sağlanması gerekmektedr. Bu varsayımlar; değşkenler çok değşkenl normal dağılıma sah olmalıdır (Keskn ve ark., 005). U ve V kanonk değşkenlernn varyans ve kovaryansları aşağıdak gb olu brm varyansa sahtrler (Tmm, 00): ( ) ( ) (, ) Var U as xxa = = Var V bs yyb = = Cov U V = as xyb U ve V kanonk değşkenler arasındak korelasyon (, ) ruv (, ) ( ) ( ) Cov UV = = Var U Var V asxyb asxxabsyyb şeklnde hesalanır. U ve V kanonk değşkenler arasındak korelasyonu en büyük yamak çn a ve b katsayılarının en büyük olduğu korelasyon katsayısını bulmak gerekr. U ve V vektörlernde yer alan ve brm varyansa sah olan kanonk değşken çft ( ) V (Saraçlı, 006): U, ( =,,..., k ) korelasyonu en büyük yaan değerlerdr 36
3. KANONİK KORELASYON ANALİZİ Semh CAN ( U, V ) = ρ maxcorr. (3.) a, b Burada (3.) fadesn en büyük yamak gerekr. Bundan dolayı katsayıların maksmzasyon roblemn çözmek çn λ ve λ, Lagrange çaranları olmak üzere Lagrange fonksyonu L= asxyb λ asxxa bsyyb ( ) λ ( ) şeklnde yazılablr (Anderson, 958). Lagrange fonksyonunun λ, λ, a ve b ye göre kısm türev alınır ve sıfıra eştlenrse, L = S b S a xy λ = a xx 0 L = Syxa λ = b Syyb 0 L = asxxa = 0 λ (3.3) (3.4) asxxa = L λ = bs b = 0 yy bsyyb= eştlkler elde edlr. (3.3) eştlğ soldan k eştlk aşağıdak gb olur: a ve (3.4) eştlğ soldan b le çarılırsa asxyb bsyxa ( asxxa) λ = (3.5) 0 ( bsyyb) λ = (3.6) 0 37
3. KANONİK KORELASYON ANALİZİ Semh CAN (3.5) ve (3.6) eştlğnden faydalanılarak λ = as b xy λ = bs a yx eştlkler elde edleblr. Buradan da asxyb λ λ ρ = = = eştlğ bulunablr. (3.3) ve (3.4) eştlkler yardımıyla S b xy λsxxa = 0 yx λsyyb= 0 S a ρsxx Sxy a = 0 Syx ρs yy b yazılablr (Anderson, 958). Buradan ρ S S S S = 0 xx yy xy yx ρ Sxx SxySyySyx = 0 S S S ρ S = 0 xy yy yx xx S S S S ρ = 0 xx xy yy yx elde edlr ve denklemn çözülmes le ρ = λ, ρ = λ öz değerler bulunur. 3.4. Kanonk Korelasyon Katsayılarının Önem Test Kanonk korelasyon analz, boyut ndrgeme çn de kullanılableceğnden; orjnal değşken kümeler arasındak korelasyonun, elde edlen yen değşken çftlernden kaç tanes le büyük ölçüde açıklanableceğnn, dğer br fade le adet kanonk korelasyondan kaç tanesnn statstksel olarak öneml olduğunun belrlenmes gerekr. Bunun çn brkaç test yöntem gelştrlmştr. En yaygın olarak kullanılan Wlk s lamda yada Barlett test statstğdr (Keskn ve ark., 005). Hotez; 38
3. KANONİK KORELASYON ANALİZİ Semh CAN Η : ρ = ρ =... = ρ = 0 0 Η : ρ 0, çn olarak yazılablr. H 0 hotez altında tüm X ler ve tüm Y ler lşkszdr. H 0 hotez tüm kanonk korelasyonlar r,, r, K rs nn önemsz olduğu durumuna denktr. Ayrıca Η 0 hotez Bölüm.6 dak genel regresyon hotezne eşdeğerdr. Genel regresyonda Η0 : Β = 0 hotez tüm X ler ve tüm Y ler lşklendrr (eştlk.6 Wlk s lamda). Tüm kanonk korelasyonların ( r, r, K, r s ) önemllğ S R Λ = = S S R R xx yy yy xx le teste edlr. Λ Λα,, q, n q se Η 0 red edlr. s Λ, Λ = ( r ) olarak da = yazılablr. Bu eştlk gösteryor k br veya daha fazla r çok büyük ken Λ küçülecektr. Sonrak şlemlerde Λ çn r, Λ 3 çn r 3 devam edlrse, önem test çn kullanılacaktır. Alternatf olarak χ yaklaşımı da kullanılır ve r çn Λ çn r χ = n q ( + + 3) ln Λ olarak verlr ve q serbestlk derecel χ dağılımına sah olu, χ χ α se Η 0 hotez red edlr. Η 0 hoteznn red edlmes durumunda en büyük olan kanonk korelasyon katsayısı hotezden çıkarılarak şlemler Η 0 hotez red edlmeynceye kadar tekrarlanır. İşlem sırasında çıkarılan her kanonk korelasyon çn değşken sayıları eksltlerek serbestlk dereces hesalanır (Çankaya, 005). Brnc kanonk 39
3. KANONİK KORELASYON ANALİZİ Semh CAN korelasyon çıkarıldıktan sonra hesalanan test statstğ ( )( q ) dereceldr (Cooley ve Lohnes, 97). serbestlk χ test statstğne alternatf olarak F yaklaşım da kullanılmaktadır. s = mn(, q), df = q, = wt q + q 4 t = olmak üzere + q 5 w, df, = n ( + q + 3) F Λ = Λ df t t df yaklaşımı kullanılablr. F > Fα se Η 0 red edlr. Tüm s kanonk korelasyon üzerndek Λ le verlen test red edlrse brnc kanonk korelasyon dışındaklern önemllğnden emn olunmaz. Λ den r atılarak r,, K rs nn önem test çn Λ = s ( r ) = hesalanır. Λ Λα se Η 0 hotez red edlr. En azından r sıfırdan öneml derecede farklı olacaktır. Bu şeklde devam edlerek her r test edlr. k ıncı adımda test statstğ Λ = k s ( r ) = k olarak yazılır. Burada Λ k, k+, q k+, n k q Λ dağılımına sahtr ve r k, rk, K +, r çn s önem test yaılır. Hotez red edlmeyene kadar devam edlr. 40
3. KANONİK KORELASYON ANALİZİ Semh CAN Genel χ ve F yaklaşımları Λ k çn de uygulayablr. χ yaklaşımı χ = + + 3 ln Λ n ( q ) k olarak yazılır ve χ, ( k )( q k ) + + serbestlk derecesne sahtr. F yaklaşımı se = ( k + )( q k ) df, = wt [( k + )( q k + ) ] + df +, w = n ( q + 3) ve ( k + ) ( q k + ) 4 t = olmak üzere ( k + ) + ( q k + ) 5 F Λ = Λ t k t k df df le verlr. 4
4. TEMEL BİLEŞEN ANALİZİ Semh CAN 4. TEMEL BİLEŞEN ANALİZİ Temel bleşenler analznn teknğ lk defa Karl Pearson (90) tarafından tanımlanmıştır. Temel bleşen analznde, değşkenlern lneer kombnasyonlarının maksmum varyansı aranır. Regresyonda, yanıt değşken(ler) en y açıklayan açıklayıcı değşkenlern lneer kombnasyonu le lglenlr. Kanonk korelasyonda, değşkenlern herhang br alt kümesnn lneer kombnasyonu le maksmum lşkl, değşkenlern br alt kümesnn lneer kombnasyonları araştırılır (Rencher, 00). Temel bleşenler analz se regresyon ve kanonk korelasyon analzlernde olduğu gb değşkenler k gruba ayırmaz, br ver grubuna uygulanan yöntemdr. Temel bleşenler analz değşkenlern lneer kombnasyonları yardımıyla değşken kümesnn varyans kovaryans yaısını açıklamakla lglenr. X, X, K, Xq gb q tane açıklayıcı değşkenlern lneer kombnasyonlarıyla lglenlsn. Varyanskovaryans matrs Σ ve λ λ K λ q 0 bu matrsnn özdeğerler se lneer kombnasyonlar Y = ax = a X + a X + Ka X q Y = ax = a X + a X + Ka X q M M M Y = ax = a X + a X + Ka X q q q q qq q q q (4.) olarak yazılır. a, =, K, q ler özdeğerlere karşılık gelen özvektörlerdr. a j j =, K, q elemanlarına sah a, =, K, q özvektörler a a a + K + a (4.) = q = kısıtlarına yan 4
4. TEMEL BİLEŞEN ANALİZİ Semh CAN a + a + K+ a = q a + a + K+ a = q M a + a + K+ a = q q qq kısıtlarına sahtrler. (4.) de verlen Y brnc temel bleşen olu maksmum varyansa sah lneer kombnasyondur. ( ) Var Y = aσ a maksmum olu, aa = kısıtı altında ( ) Var Y = aσ a = λ olarak bulunur. Y knc temel bleşen olu knc büyük Var Y = a Σ a olu varyansa sah lneer kombnasyondur. ( ) ( ) aa = kısıtı altında Var Y = a Σ a = λ olacaktır ve bu durum dğer değşkenler çn varyansların büyüklüğüne göre yazılablr. Genel olarak düşünüldüğünde; Σ varyans-kovaryans matrs ( λ, a),( λ, a),,( λq, aq) bleşenler genel olarak K özdeğer özvektör çftlerne sah ve temel Y = ax = a X + a X + K + a X q q şeklnde olu, Var( Y ) = aσ a = λ, ( ) σ, Cov Y, Y = aσ a = 0 olarak tanımlanablr. k k X nn varyansı ve λ, Y nn varyansı olmak üzere temel bleşenlern varyansının tolamı orjnal değşkenlern varyansının tolamına eşttr. Yan, X j j =, K, q lern varyanslarının tolamı özdeğerlern tolamına eşttr: σ + σ + K+ σ = λ + λ + K + λ qq q 43
5. ÇOK DEĞİŞKENLİ TEKNİKLER ARASINDAKİ İLİŞKİ Semh CAN 5. ÇOK DEĞİŞKENLİ TEKNİKLER ARASINDAKİ İLİŞKİLER Lovetsky, Tshler ve Conkln (00), k ver kümes arasındak bağlantının tahmn çn çok değşkenl EKK yöntemn ncelenmş ve büyük ver kümeslern analz etmek çn kullanılan dğer çok değşkenl teknklerle lşksnn nasıl olduğunu göstermştr. Bu bölümde EKK metodunun kanonk korelasyon ve temel bleşenler analzlerne eşt veya benzer olduğu gösterlecektr. 5.. Ekk İle Kanonk Korelasyon Analz Arasındak İlşk İk ver kümes olarak X : ( n q) ve Y :( n ) ele alınsın. Sırasıyla q ve, X ve Y kümelerndek değşken sayısı ve n gözlem sayısıdır. Tüm değşkenler merkezleştrlsn ve standart samaları le normalleştrlsn, a: ( q ) ve b: ( ) blnmeyen arametrelern vektörler olmak üzere U = Xa, V = Yb (5.) skorları tanımlansın. Bu durumda U :( n ) ve :( ) V n tnde vektörler olu karşılık gelen değşkenlern ağırlıklı ortalamaları olarak yorumlanablr. (5.) yardımıyla X ve Y arasındak lşk belrlenmek stensn yan (5.) dek skorlar benzer se X ve Y yakından lşkl olacaktır. Bu benzerlk skorlar arasındak fark ε = U V (5.) le tanımlanır. İk küme arasındak uzaklığın ölçümü (5.) dek vektörün normunun kares olarak tanımlanablr. Bu se ekk amacına benzeyecektr. XX = S, YY = S, XY = S, YX = S varyans-kovaryans matrsler olmak xx yy xy yx üzere 44
5. ÇOK DEĞİŞKENLİ TEKNİKLER ARASINDAKİ İLİŞKİ Semh CAN ( )( ) ( ax by )( Xa Yb) EKK = ε = U V U V = = as a as b+ bs b xx xy yy (5.3) tanımlansın. (5.3) ü mnmum yaan a ve b vektörler araştırılır. Ancak (5.3) a ve b nn homojen fonksyonu olduğundan dolayı, blnmeyen arametrelern belrleneblmes çn bazı normallk koşullarına htyaç duyulur. (5.3) un uygun analz çn UU =, VV = (5.4a) normallk koşulları yada dğer br göstermle as a =, bs b= (5.4b)! xx yy koşulları tanımlansın. (5.3) ve (5.4) kullanılarak Lagrange fonksyonu, ( xx ) ϕ( xx ) L= EKK γ as a bs b (5.5) şeklnde gösterlr. Burada γ ve ϕ Lagrange çaranlarıdır. Daha sonra (5.5) eştlğnn a ve b ye göre türevler alını denklem sıfıra eştlenrse, denklem sstem S b= λs a, S a= ηs b (5.6) xy xx yx yy olur. Burada λ = γ ve η = ϕ şeklndedr. (5.6) eştlğnde brnc denklem a ve knc denklem b le çararak ve (5.4) denklem kullanımıyla λ = η = elde edlr. (5.6) eştlğnn brnc asxyb denklem a çn çözülür ve knc denklemde yazılırsa ve benzer şeklde (5.6) eştlğnn knc denklem b çn çözülür ve brnc denklemde yazılırsa 45
5. ÇOK DEĞİŞKENLİ TEKNİKLER ARASINDAKİ İLİŞKİ Semh CAN S b= λs a S a = ηs b xy xx yx yy S S b= λa S S a = ηb xx xy yy yx S S ηb= ηλa S S λa = ληb xx xy yy yx ( xx xy yy yx) λ ( yy yx xx xy ) S S S S a a S S S S b b = = η (5.7) elde edlr. (5.7) le verlen eştlkler kanonk korelasyon analznn (3.) eştlkler le benzerdr (Lovetsky, Tshler ve Conkln, 00). Kanonk korelasyon analz k ver kümes arasındak lşknn ölçümü olarak kullanılmakta olu kanonk korelasyon ( ) Cov UV ρ = = = Var( U) Var( V) ( UU)( VV) ( asxxa)( bsyyb), UV asxxb (5.8) olarak tanımlandığı (3.) de belrtlmşt. Kanonk korelasyon analz (5.8) le verlen korelasyonu maksmum yaan a ve b vektörlernn tahmn le lglenr (eştlk 3. de belrtldğ gb). (5.8) maksmum yaan a ve b arametreler çn λ η λ η = ( ) ( ) = xy ( xy ) ( yy ) (5.9) L UV UU VV as b as a bs b Lagrange fonksyonu tanımlansın, burada λ ve η Lagrange çaranlarıdır. (5.9) maksmum yaan a ve b çözümler (5.7) dek çözümü verr. (5.3) le verlen fonksyonun mnmum değer EKK = γ dr. (5.8) dek kanonk korelasyonun maksmum değer ρmax = λmax dır. γ = λ eştlğnden dolayı γ mn gelr. Böylece, (5.3) ün çözümü mn mn, λ max a karşılık λ max maksmum özdeğere ve (5.7) le verlen a ve b temel özvektörlere karşılık gelr. Bu çözüm se (5.8) le verlen kanonk korelasyonu maksmum yaar (Lovetsky, Tshler ve Conkln, 00). Yan EKK y mnmum yaan çözüm kanonk korelasyonu maksmum yaar. 46
5. ÇOK DEĞİŞKENLİ TEKNİKLER ARASINDAKİ İLİŞKİ Semh CAN Çok değşkenl çoklu regresyon ve kanonk korelasyon arasında şu gb farklılıklar vardır. Çok değşkenl çoklu regresyon yanıt değşken ve açıklayıcı değşkenler arasındak lşky model kurarak araştırırken, kanonk korelasyon analz k kümenn nasıl lşklendğn nceler. Kanonk korelasyon analznde k ver kümesnn rolü değşeblr yan smetrktr. Br başka deyşle, ver kümesnn her ks de eşanlı olarak yanıt ve açıklayıcı değşkenler olarak davranablr. Fakat çok değşkenl çoklu regresyon asmetrktr. Yan yanıt ve açıklayıcı değşkenlern roller değştğnde elde edlen model arametreler farklı olacaktır. 5.. Ekk İle Temel Bleşenler Analz Arasındak İlşk (5.3) le verlen fonksyon aa =, bb= (5.0) kısıtlamaları altında ele alınsın ((5.0) le verlen kısıtlamalar (4.) le verlen kısıtlamalara denktr). Bu kısıtlamalar altında Langrange fonksyonu, ( ) η( ) L= LS λ aa bb (5.) şeklnde fade edleblr. (5.) fadesn mnmum yaan eştlkler S a S b= λa xx yy xy S b S a = ηb yx (5.) olarak yazılablr. (5.) dek lk eştlk a, knc eştlk se b le çarılırsa, λ = asxxa η = bsyyb asxyb bsyxa 47
5. ÇOK DEĞİŞKENLİ TEKNİKLER ARASINDAKİ İLİŞKİ Semh CAN elde edlr. Burada λ ve η Lagranj çaranlarıdır. λ ve η termlernn γ = λ+ η lneer kombnasyonları yazılırsa bu fade (5.3) le verlen fonksyona denk olur. g λ η asxxa bsyyb = = se k karesel formun farklarına eşttr. Bu durumda γ + g γ g λ = ve η = olur böylece (5.), genelleştrlmş lneer olmayan S g I q S xy a γ a = g S S + I b b xy yy xx (5.4) özdeğer roblemn gösterr (Lovetsky, Tshler ve Conkln, 00). (5.4) eştlğ teratf yöntemle çözülür. Her terasyonda γ mnmum özdeğerne karşılık gelen özvektör kullanılır. Lovetsky, Tshler ve Conkln (00) lk brkaç teryonda yakınsamanın olduğunu belrtmşlerdr. g = 0 ken (5.4) le verlen lneer olmayan roblem bast özdeğer bulma roblemne dönüşür. γ λ = alınarak (5.4) roblem Sxx Sxy a a = λ Syx S yy b b (5.5) özdeğer roblemne dönüşür. (5.3) fonksyonunun mnmum değer (5.5) n mnmum özdeğerne karşılık gelr. (5.0) le verlen koşullar yerne aa + bb= (5.6) koşulu kullanılarak (5.5) roblem çn ( ab, ) vektör çft bulunablr. Bu durumda (5.) eştlğ yerne 48
5. ÇOK DEĞİŞKENLİ TEKNİKLER ARASINDAKİ İLİŞKİ Semh CAN ( ) L= LS λ aa+ bb (5.7) Lagrange fonksyonu yazılablr. (5.7) eştlğn mnmum yaan a ve b (5.) le verlen çözümde η = λ alınmasına denktr. Böylece (5.0) ve (5.6) kısıtlamaları altında (5.3) fonksyonu aynı sonucu verr (Lovetsky, Tshler ve Conkln, 00). (5.6) kısıtlaması altında (5.3) fonksyonu blok matrs formunda temel bleşenler analzne ndrgeneblr. (5.5) eştlğ S S xx yx S S xy yy a a = λ (5.8) b b olarak da yazılablr. (5.8) se temel bleşenler analz, Sc = λc olarak yazılablr. S, X ve Y ver kümelerndek q + değşken çn a korelasyonların matrs ve c, vektörüdür. (5.8) dek b dek V y ters şaretl almaya denktr. Böylece (5.) dek ε vektörü b y kullanmak (5.) ε = U + V olur. Bu ε nun varyansını maksmum yamak (5.3) dek karesel formun değern maksmum yamaya denktr. Böylece, (5.7) y mnmum yamak temel bleşenler analzndek varyansı maksmum yamak aynı (5.8) roblemne karşılık gelr (Lovetsky, Tshler ve Conkln, 00). 49
6. ÇOKLU İÇ İLİŞKİ Semh CAN 6. ÇOKLU İÇ İLİŞKİ Çoklu lneer regresyon modellernn EKK le yorumlanması açıklayıcı değşkenlern brbryle lşksz olduğu varsayımına dayanır. Açıklayıcı değşkenler arasında lneer bağımlılık olablr. Bu durumda çoklu ç lşk roblem ortaya çıkar. Çoklu ç lşk regresyonda arametrelern EKK tahmnlernde roblemler yaratmaktadır. 6.. Çoklu İç İlşknn Belrlenmes Çoklu lneer regresyon analznde çoklu ç lşknn belrlenmes çn yöntemler şu şeklde sıralanablr (Montomery, Peck ve Vnng, 00). 6... Korelasyon Matrsnn İncelenmes Çoklu ç lşknn br ölçümü, standartlaşmış durumda çalışırken matrsndek köşegen dışı r j elemanlarının ncelenmes le mümkündür. X ve XX lneer bağımlılığa yakın ken r j yakındır. Ancak kden fazla açıklayıcı değşken arasındak lneer bağımlılık varsa r j ler uygun ölçü olmayablr. X j 6... Varyans Şşrme Faktörü ( XX) C = matrsnn köşegen elemanları çoklu ç lşky belrlemede kullanılan dğer br yöntemdr. C, C nn j nc köşegen elemanı = ( ) jj C R jj j olarak yazılablr. Varyans şşrme faktörü, ( ) VIF = C = R olarak yazılablr. j jj j Uygulamada herhang br VIF değer 0 u aşarsa, çoklu ç lşk roblem vardır. 50
6. ÇOKLU İÇ İLİŞKİ Semh CAN 6..3. XXMatrsnn Özdeğerlernn Analz XX matrsnn özdeğerler λ λ,, K, λq verdek çoklu ç lşky belrlemede kullanılmaktadır. Br ya da daha fazla özdeğerler küçük se X n kolonları arasında bağımlılık vardır. XX matrsnn en büyük gösterlmek üzere koşul sayısı, λ mak ve en küçük λmn özdeğerler olarak λ k = λ mak mn şeklnde tanımlanablr. k < 00 se çoklu ç lşk yoktur, 00< k < 000 se çoklu ç lşk orta şddetldr, 000 < k se çoklu ç lşk şddetldr şeklnde yorumlanır. Çoklu lneer regresyonda çoklu ç lşk roblem çözümü çn Hoerl ve Kennard (970) rdge regresyonu ve Hotellng (933) temel bleşenler regresyonu önemştr. Çok değşkenl çoklu regresyon analznde de XX matrsnn bazı özdeğerler sıfıra yakın olması durumunda kolonlar arasında lneer bağımlılık olduğu sonucuna varılır. Koşul sayısının bulunması se Khur (986) tarafından ( ) K X λ max = λmn şeklnde önermştr. K( X ) n büyük değere sah olması X n kolonlarında güçlü çoklu ç lşknn olduğunu gösterr. Khur (986), çoklu lneer regresyon da koşul sayısının yorumuna benzer olarak Belsley, Kuh ve Welch (980) un önersne aralel olarak ( ) 0 K X < se zayıf çoklu ç lşk, K ( X ) > 30 veya00 se güçlü br çoklu ç lşknn mevcut olduğunu belrtmştr. 5
6. ÇOKLU İÇ İLİŞKİ Semh CAN 6.. Rdge Regresyon ( ˆ ( ) ˆ ( ) β K β ) Bˆ = gösterm dkkate alınırsa çoklu ç lşk mevcut ken XX matrsnn özdeğerlernn bazılarında çok küçük kararsızlık yaratır; ( ˆ() ˆ() ) ( ˆ() ˆ() () () () () ) ( ˆ ˆ ) ( ˆ ˆ β β = β β = β β = β β ) () () () ( ˆ ) ˆ ˆ = tr Cov β + β β E E tr E tr tre ( ) ( ) ( ) = tr XX XCov y X XX + βˆ () () ( ) ( ) = tr σ XX XX XX βˆ βˆ + = σ + βˆ βˆ () () j ( ) () () jtr XX ˆ( ) ˆ() j β = = σ α + β βˆ burada α ler ( ) XX matrsnn özdeğerler olu α α K αq dr. () β nın rdge tahmn ( ) ( ˆ () ) ( ˆ ) ( ) () ˆ () ˆ () β, = β β + β β ˆ() ˆ() ˆ() () () ( ˆ ˆ = YY β XY + β XXβ + k β β m) S k Y X Y X k m (6.) fonksyonunun mnmum yaılması le S ( β, k) β = + + = Xy XXβ kβ 0 Xy+ XXβ + kβ = 0 Xy+ XX + ki β = 0 ( q+ ) ( q+ ) βˆ = + XX ki Xy 5
6. ÇOKLU İÇ İLİŞKİ Semh CAN olarak elde edlr (Srvastava, 979). (.) le verlen çok değşkenl çoklu regresyon model çn Β regresyon ˆ XX XY katsayılarının EKK tahmn ( ) değşkenler yüksek korelasyonlu ken Β= olarak bulunmuştu. X, X, K Xq XX tekllğe yakın olur ve ˆΒ regresyon katsayılarının en küçük kareler tahmnler yanıltıcı (stkrarsız) ve kötü tahmn edlr (Srvastava ve Kubokawa, 005). Haste ve ark. (00) rdge tahmn edcy g ( B) = Y XB + k B fonksyonunu mnmum yaan çözüm olarak önermşlerdr (Kers ve Smlde, 007): ˆ B ( k) = ( X X + ki ) X Y. (6.) Brown ve Zdek (980) se değşken arasındak lşky dkkate alarak EKK tahmn çn verlen ˆ ( ˆ ) () ˆ ( B β,, β ) değşkenl rdge regresyon tahmn edcy = K fadesne benzer düşünce le çok Bˆ * ( K) = ( I q+ X X + K I ) ( I q X ) Y * veya denk olarak Bˆ ( K) = ( X X I + I K) ( X X I ) Β ˆ * q+ q+ şeklnde önermştr. Burada kronecker matrs çarımıdır. K Ι matrs (( q ) ( q ) ) + + tnde K k ( q+ ) Ι = M O M k Ι Ι L L k k ( q+ ) ( q+ )( q+ ) Ι Ι blok matrsdr. 53
6. ÇOKLU İÇ İLİŞKİ Semh CAN ( q ) ( q ) Y + + tndek K matrs rdge arametrelern matrsdr. ( Y K ) * = olmak üzere Y = vec( Y ), n tnde yanıt değşkenlern Y ˆ * vektörü ve B ( K), ( q + ) tnde regresyon katsayıları çn tahmn edcler vektörüdür. K = 0 ken çok değşkenl rdge tahmn edc EKK tahmn edcye ndrgenr. Özel olarak K köşegen K dag k, K, k ) formunda ken çoklu her = ( q+ br Y, K,Y yanıt değşkenl lneer regresyonda rdge tahmn edc elde edlr. Bu durum Breman ve Fredman (997) tarafından önerlen yönteme de denktr. Breman ve Fredman (997) yanıt değşken çn ˆ ( ) β arametrelern Hoerl ve Kennard ın (970) önerdğ k > 0 olmak üzere βˆ = ( X X + ki ) XY, =, K, şeklndek rdge regresyon le tahmn etmey () q+ önermştr yan her tane yanıt değşken çn uygulamada ayrı ayrı rdge regresyon tahmn yaılır. K köşegen elemanları k lerden oluşan köşegen matrs olmak üzere ( ) q+ Β= ˆ + Ι XX K XY şeklnde de uygulanablr. 6... k Değernn Bulunması Çoklu lneer regresyonda rdge arametreler oztf olmasına rağmen Hua ve Gunst (983) çok değşkenl çoklu lneer regresyonda negatf rdge arametrelernn kullanılableceğn de belrtmştr. Cannon (009) se smülasyon çalışması yaarak negatf rdge arametrelernn etklern ncelemştr. Yatığı smülasyon çalışmasında oztf rdge arametreler varyansı düşürürken, negatf rdge arametrelernn varyansı şşrdğn görmüştür. Cannon (009), K matrsnn seçmn 54
6. ÇOKLU İÇ İLİŞKİ Semh CAN = j= ( ( ) ( ˆ ˆ )) cov, j cov, j COV = Y Y Y Y le verlen fonksyonu mnmum yaarak bulmayı önermştr. K nın elemanları oztf veya negatf değerler alablmektedr. k nın (eştlk (6.)) değernn elde edlmes çn br dğer yöntem çaraz geçerllk yöntemdr. Bu metot da Y () nn tahmn değer modelde -nc gözlem ˆ olmaksızın, ( k) Β rdge regresyon tahmn kullanılarak her gözlem çn Y ˆ () tahmn değer le Y gözlem değer arasındak farkın karesnden elde edlr (Srvastava, 979). k nın seçlen değerler çn ( ˆ () ()) ˆ Y Y = Y Xβ ( k) = = ( ) kareler tolamı hesalanır, mnmum değer veren k seçlr. a önceden seçlen çok küçük oztf br sayı olmak üzere (6.3) yardımıyla bulunan ˆk çn Srvastava (979) kˆ, kˆ 0 ˆ k = k ˆ, a kˆ< 0 a, kˆ < a şeklnde seçmey önermştr. Dğer br yöntem Kubokowa ve Srvastava (00) tarafından Kˆ n q 3 Βˆ XXΒˆ q n q S = (6.3) tr XX ( ) 55
6. ÇOKLU İÇ İLİŞKİ Semh CAN ( ) ( )( ) S n q Y X Y X = Β Β olarak önerlmştr. ˆK oztf yada negatf değer alablr. 6.3. Temel Bleşenler Regresyon Temel bleşenler analznde, değşkenlern lneer kombnasyonlarının maksmum varyansı aranır. Tüm lneer kombnasyonlar öncelkle ver yaısı ya da dğer değşkenlerle lşky belrlemektedr. Regresyon analznde temel bleşenler analznn kullanılmasının k durumda avantajlıdır: (Rencher, 00):. Açıklayıcı değşkenlern sayısı gözlemlern sayısından büyük ken test yamak mkansızlaştığında. Açıklayıcı değşkenler yüksek lşkl se, regresyon katsayılarının tahmn hatalı olduğunda Bu gb durumda, temel bleşenler yöntem açıklayıcı değşkenlern sayısını daha küçüğe ndrgeyeblr ve regresyon katsayıları tahmnn daha doğru tahmnler halne getrleblr (Rencher, 00). XX matrsnn özdeğerler 0 λ λ K λ q olmak üzere ve açıklayıcı değşkenler lşkl se, özdeğerlern bazıları çok küçük ve sıfıra yakın olacaktır. D 0 T X olarak yazılsın. Bu göstermde XX matrs ( ) ( r) ( r) X = T ( r) T( s) 0 D( s) T( s) ( T r T ) T = özdeğerlere karşılık gelen özvektörlern matrs, D ( ) ( s) D( r ) 0 = = dag( λ, K, λ ) 0 D ( q = r + s) özdeğerlern matrsdr. Burada ( s) ( q) q D ( r) görecel olarak büyük özdeğerlere sah ve ( s) D se küçük özdeğerlere sah Βˆ ( r) olsun. Β ˆ ( q) = Βˆ ( s ) olmak üzere, D ( s) nn köşegen elemanları çok büyük 56
6. ÇOKLU İÇ İLİŞKİ Semh CAN 57 olduğundan ( ) ˆ s B nn tahmnlernde büyük kararsızlık oluşturacaktır (Srvastava, 979). Bu yüzden EKK ler tahmn edcde ( ) r D kullanımı terch edlr. Ekk tahmn edc, Y X T TD Y X T XT X T T B q ) ( ˆ ) ( = = olarak yazılablr ve ( ) q D matrsnn ndrgenmesyle EKK ler tahmn edc Y X T D T Y X T XT X T T B r r r r r r r r ) ( ˆ ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( = = olarak gösterlr.
7. UYGULAMA Semh CAN 7. UYGULAMA: BÜYÜKŞEHİR BELEDİYE BÜTÇESİ Beledyeler, belde saknlernn yerel ntelktek htyaçlarını karşılamak üzere kurulan ve karar organı seçmenler tarafından seçlerek oluşturulan, dar ve mal özerklğe sah kamu tüzel kşsdr (5393 sayılı Beledye Kanunu). Büyükşehr beledyeler Türk beledyeclğne 984 yılında grmş olan üst kademe beledyelerdr. Bu beledyeler 98 anayasasının 7. maddesndek "büyük yerleşm yerlernde özel yönetm bçmler oluşturulablr " hükmüne dayanılarak 984 yılında kurulmağa başlanmıştır. Büyükşehr beledyeclğnde se, büyükşehr hzmet alanı çnde brden çok lçe veya brnc kademe beledyes vardır. Dolayısıyla, beledye hzmet aynı zamanda hem büyükşehr, hem de lçe beledyes elyle yürütülür. Büyükşehr beledyesnn yaacağı hzmetler çn belrl br bütçe olması gerekmektedr. Bu bütçede gelrler ve gderler var olacaktır. Bu gelr ve gderler aşağıdak gb sıralayablrz. Beledye bütçes 508 sayılı Kamu Mal Yönetm ve Kontrol Kanununun 3 üncü maddesnde; belrl br dönemdek gelr ve gder tahmnler le bunların uygulamasına lşkn hususları gösteren ve usulüne uygun olarak yürürlüğe konulan belge olarak tarf edlmştr. Beledye gderler sıralanacak olduğunda: Personel Gderler: Bordroya dayalı olarak kamu ersonelne yaılan ödemeler olarak tanımlanır. Personel gderler se memurlar, temel maaşlar, zamlar ve tazmnatlar, sosyal haklar, ek çalışma karşılıkları, sözleşmel ersonel, şçlern ücretler, şçlern sosyal hakları ve geçc ersonel olarak alt başlıklarda tolanır. Sosyal Güvenlk Kurumlarına Devler Prm Gderler: devletn şveren sıfatıyla ödedğ sosyal güvenlk katkı aylarıdır. Memurlar, şçler ve sözleşmel ersonel olarak üç alt başlıkta tolanır. Mal ve Hzmet Alımları: faturalı olarak alınan mal ve hzmet bedellerdr. Bu ödenen bedeller, üretme yönelk mal ve malzeme alımı (hammadde alımı), tüketme yönelk mal ve malzeme alımı (kırtasye, büro malzemes ve benzer), 58
7. UYGULAMA Semh CAN yolluklar (yurtç geçc görev yollukları), görev gderler, hzmet alımları, yol bakım ve onarım gderler ve tedav ve cenaze gderler alt başlıklarında tolanılablr. Faz Gderler: Kurumun borçlarına lşkn faz ödemelerdr. Dğer ç borç faz gderlerdr. Sermaye Gderler: Kurumun mal varlığını artıran ödemelerdr. Sermaye gderler, gayrmenkul alımları ve kamulaştırma, gayrmenkul sermaye üretm gderler, malzeme gder, taşıma gder, ş maknes kralama ve menkul malların büyük onarım gderler olarak alt başlıklarda tolanır. Borç Verme: Br mal varlık karşılığında yaılan ödemelerdr. Beledye gelrler se; Verg Gelrler: Genel bütçe verg gelrlernden ay verlr. Tolanan vergler ller bankası aracılığıyla beledyelere dağıtılır. Beledye sınırları çersnde, mülkyet üzernden alınan vergler, dahlde alınan mal ve hzmet vergler ve harçlar alınır. Bu vergler bna vergs, arsa vergs, araz vergs, eğlence vergs, yangın sgortası, lan ve reklam vergs, bna nşaat harcı, şgal harcı, şyer açma zn harcı, totancı hal resm harcı ve ölçü ve tartı aletler muayene harcı olarak alt başlıklarda tolanır. Teşebbüs ve Mülkyet Gelrler: Bu gelr mal ve hzmet satış gelrler, çevre krllğn önleme gelr, ulaştırma hzmetler, kurumlar hasılatı, mahall dareler kurumlar hasılatı, kra gelrler ve dğer teşebbüs ve mülkyet gelrler olarak alt başlıklarda tolanır. Dğer Gelrler: Faz gelrler, kş ve kurumlardan alınan aylar, verg ve harç gelrlernden alınan aylar, merkez dare verg gelrlernden alınan aylar, çevre ve temzlk vergs, ara cezaları, dar ara cezaları ve dğer çeştl gelrler olarak alt başlıklarda tolanır. Sermaye Gelrler: Taşınmaz satış gelrler ve arsa satışı olarak belrlenr. Alınan Bağış ve Yardımlar: Kş ve kurumlardan alınan bağış veya yardımlardır. 59
7. UYGULAMA Semh CAN Tablo 7. Gder Bütçes Tablo 7. de Y, ersonel gderler; Y, sosyal güvenlk kurumlarına devlet rmler gderler; Y 3, mal ve hzmet alım gderler; Y 4, faz gderler; Y 5, car transferler; Y 6, sermaye gderler; Y 7, borç verme olarak tanımlanır. Tablo 7. de verler ham ver olarak görülmektedr. 60
7. UYGULAMA Semh CAN Tablo 7. Gelr Bütçes 6
7. UYGULAMA Semh CAN Tablo 7. de X, verg gelrler; X, teşebbüs ve mülkyet gelrler; X 3, dğer gelrler; X 4, sermaye gelrler; X 5, alınan bağış ve yardımlar le özel gelrler olarak gösterlmektedr. Tablo 7. de verler ham ver olarak görülmektedr. Bu verler daha sonra reelleştrme yaılarak, yan enflasyonun TL üzerndek değern belrlemek ve yaılacak analzde olumsuz etkler azaltmak amacıyla reelleştrme yaılmıştır. Reelleştrme Tablo 7.3 de verlen 006 009 yılları arasındak TÜFE değerler kullanılarak yaılmıştır (TÜFE değerler TÜİK den elde edlmştr). Ham verler aylık ver olduğundan her yılın lgl ayına at TÜFE değerler kullanılarak reelleştrme yaılacaktır. Yan; 006 Ocak ayındak TL nn değernn 008 yılındak değer hesalanırken, 008 yılındak Ocak ayının TÜFE oranı dkkate alınacaktır. Bu durumu aşağıdak formül le hesalanablr. SonYılınTÜFESİ İlkYılınTÜFESİ Yüzdelk Değşm = 00 İlkYılınTÜFESİ Bulunan yüzdelk değşm değern her yılın lgl ayı çn tek tek hesalayarak o yılk değer le çarıldığında 009 yılındak lgl ay çn değer bulunablr. Örneğn; 006 Mart ayındak 00 TL nn değer 008 Mart ayında Yüzdelk Değşm 50.7 4.8 = 00=.0098 4.8 olarak hesalanmıştır. 006 Mart ayındak 00 TL nn 008 Mart ayındak değer 00 YüzdelDeğşm = 00.0098= 00.98 TL olarak bulunur. 6
7. UYGULAMA Semh CAN Tablo 7.3 006 009 Aylık TÜFE değerler YIL 006 007 008 009 OCAK 3,57 35,84 46,94 60,90 ŞUBAT 3,84 36,4 48,84 60,35 MART 4,8 37,67 50,7 6, NİSAN 5,84 39,33 5,79 6,5 MAYIS 8,0 40,03 55,07 63,9 HAZİRAN 8,63 39,69 54,5 63,37 TEMMUZ 9,7 38,67 55,40 63,78 AĞUSTOS 9,5 38,70 55,0 63,9 EYLÜL 30,8 40,3 55,7 63,93 EKİM 3,47 4,67 59,77 67,88 KASIM 34,8 45,45 6,0 70,0 ARALIK 34,49 45,77 60,44 70,9 Uygulama kısmında SPSS 5 ve MATLAB 7 rogramları kullanılmıştır. Her k uygulama da verler standartlaştırılmıştır. Çok değşkenl regresyon modelnde katsayılar matrs aşağıdak gb.530 7. 0 4.5 0 3. 0 5. 0 8.3 0 5.99 0 0.958 0.980 0.898 0.668 0.556 0.36 0.60 ˆ 0.005 0.0 0.06 0.00 0.74 0.67 0.060 Β= 0.577 0.590 0.550 0.60 0.373 0.76 0.9 0.077 0.065 0.063 0.8 0.76 0.099 0.060 0.00 0.075 0.03 0.064 0.09 0.035 0.078 7 8 8 7 7 7 8 bulunmuştur. Yanıt değşkenler çn eştlkler se 63
7. UYGULAMA Semh CAN Yˆ =.53 0 + 0.958X + 0.005X + 0.577X + 0.077X + 0.00X 7 3 4 5 Yˆ = 7. 0 + 0.980X + 0.0X + 0.590X + 0.065X + 0.075X 8 3 4 5 Yˆ = 4.5 0 + 0.898X + 0.06X + 0.550X + 0.063X 0.03X 8 3 3 4 5 ˆ 7 Y4 = 3. 0 + 0.668X+ 0.00X + 0.60X3 0.8X4 0.064X5 ˆ 7 Y = 5. 0 + 0.556X + 0.74X + 0.373X + 0.76X 0.09X 5 3 4 5 Yˆ = 8.3 0 + 0.36X + 0.67X + 0.76X 0.099X 0.035X 7 6 3 4 5 Yˆ = 5.99 0 + 0.60X 0.060X + 0.9X 0.060X 0.078X 8 7 3 4 5 şeklndedr. Yanıt değşkenler çn elde edlen eştlklerde; dğer değşkenler sabt ken X (Verg Gelrler) 7.000.000.000 TL değştğnde; Y (Personel Gderler) 6.706.000.000TL, Y (Sosyal Güvenlk Kurumlarına Devlet Prmler) 6.860.000.000TL, Y 3 (Mal ve Hzmet Alım Gderler) 6.86.000.000TL, Y 4 (Faz Gderler) 676.000.000.TL, Y 5 (Car Transferler) 3.89.000.000TL, Y 6 (Sermaye Gderler).8.000.000TL ve Y 7 (Borç Verme).80.000.000TL attırdığı görülür. Aynı şeklde; dğer değşkenler sabt ken X (Teşebbüs ve Mülkyet Gelrler) 7.000.000.000TL değştğnde; Y (Personel Gderler) 35.000.000TL, Y (Sosyal Güvenlk Kurumlarına Devlet Prmler) 54.000.000TL, Y 3 (Mal ve Hzmet Alım Gderler) 74.000.000TL, Y 4 (Faz Gderler) 7.000.000.TL, Y 5 (Car Transferler).98.000.000TL, Y 6 (Sermaye Gderler).69.000.000TL artacak, ancak Y 7 (Borç Verme) 40.000.000TL azalacaktır. X 3 (Dğer Gelrler) 7.000.000.000 TL değştğnde ve dğer değşkenler sabt tutulduğunda; Y (Personel Gderler) 4.039.000.000TL, Y (Sosyal Güvenlk Kurumlarına Devlet Prmler) 4.30.000.000TL, Y 3 (Mal ve Hzmet Alım Gderler) 3.850.000.000TL, Y 4 (Faz Gderler) 4.07.000.000.TL, Y 5 (Car Transferler).6.000.000TL, Y 6 (Sermaye Gderler) 5.08.000.000TL ve Y 7 (Borç Verme).533.000.000TL attırdığı görülür. 64
7. UYGULAMA Semh CAN X 4 (Sermaye Gelrler) 7.000.000.000TL değştğnde ve dğer değşkenler sabt tutulduğunda; Y (Personel Gderler) 539.000.000TL, Y (Sosyal Güvenlk Kurumlarına Devlet Prmler) 455.000.000TL, Y 3 (Mal ve Hzmet Alım Gderler) 44.000.000TL, Y 5 (Car Transferler).3.000.000TL arttığı, Y 4 (Faz Gderler).56.000.000.TL, Y 6 (Sermaye Gderler) 693.000.000TL ve y 7 (Borç Verme) 40.000.000TL azalttığı görülür. X 5 (Alınan Bağış ve Yardım Gelrler) 7.000.000.000 TL değştğnde ve dğer değşkenler sabt tutulduğunda; Y (Personel Gderler) 7.000.000TL, Y (Sosyal Güvenlk Kurumlarına Devlet Prmler) 55.000.000TL artacak, ancak Y 3 (Mal ve Hzmet Alım Gderler) 9.000.000TL, Y 4 (Faz Gderler) 448.000.000.TL, Y 5 (Car Transferler).463.000.000TL, Y 6 (Sermaye Gderler) 45.000.000TL ve Y 7 (Borç Verme) 546.000.000TL azaldığı görülür. SYY SYX S = formundak Varyans-Kovaryans matrs çn; S XY S XX.0000 0.9738 0.8353 0.5 0.5394 0.5586 0.043 0.9738.0000 0.8659 0.437 0.5539 0.490 0.050 0.8353 0.8659.0000 0.4 0.6377 0.479 0.046 S yy = 0.5 0.437 0.4.0000 0.4587 0.4994-0.0365 0.5394 0.5539 0.6377 0.4587.0000 0. 0.450 0.5586 0.490 0.479 0.4994 0..0000-0.035 0.043 0.050 0.046-0.0365 0.450-0.035.0000.0000 0.4565-0.4886 0.838 0.03 0.4565.0000-0.0838 0.5865 0.4906 S xx = -0.4886-0.0838.0000 0.070 0.0598 0.838 0.5865 0.070.0000 0.680 0.03 0.4906 0.0598 0.680.0000 65
7. UYGULAMA Semh CAN 0.694 0.79 0.6867 0.30 0.4884 0.0 0.0983 0.4395 0.495 0.5006 0.0967 0.4967 0.795-0.0338 S xy = 0.49 0.70 0.44 0.56 0.0 0.599 0.0797 0.3760 0.47 0.3960-0.003 0.3843 0.869-0.057 0.809 0.3609 0.943-0.086 0.70 0.094-0.0797 0.694 0.4395 0.49 0.3760 0.809 0.79 0.495 0.70 0.47 0.3609 0.6867 0.5006 0.44 0.3960 0.943 S yx = 0.30 0.0967 0.56-0.003-0.086 0.4884 0.4967 0.0 0.3843 0.70 0.0 0.795 0.599 0.869 0.094 0.0983-0.0338 0.0797-0.057-0.0797 matrsler yardımıyla tam model çn çoklu belrleyclk katsayısı aşağıdak gb hesalanablr. RV değer RV ( xy yx ) ( xx) tr( Syy ) = tr S S = 0.35 tr S olarak hesalanmıştır. Hesalanan RV değer açıklayıcı değşkenler yanıt değşkenlern %35 açıklama oranına sahtr. Parametrelern önemllğ çn α = 0.05 önem düzeynde Η0 : Β = 0 hotez test Η : Β 0 edleblr. Test çn hesalanması gereken Wlk s Lambda değer çn Ε, Η, ve Ε Η matrsler sırasıyla 66
7. UYGULAMA Semh CAN 0.33 0.66 0.078 0.078-0.096 0.60-0.099 0.66 0.447 0.0665-0.043-0.0338 0.38-0.083 0.078 0.0665 0.46-0.00 0.0683 0.30-0.06 Ε= 0.078-0.043-0.00 0.6450 0.65 0.6-0.664-0.096-0.0338 0.0683 0.65 0.58-0.0500 0.064 0.60 0.38 0.30 0.6-0.0500 0.600-0.957-0.099-0.083-0.06-0.664 0.064-0.957 0.9457 0.7668 0.8075 0.757 0.4384 0.5590 0.346 0.360 0.8075 0.8553 0.7994 0.4480 0.5877 0.3574 0.333 0.757 0.7994 0.7539 0.43 0.5694 0.3408 0.6 Η= 0.4384 0.4480 0.43 0.3550 0.936 0.868 0.99 0.5590 0.5877 0.5694 0.936 0.477 0.7 0.086 0.346 0.3574 0.3408 0.868 0.7 0.3999 0.09 0.360 0.333 0.6 0.99 0.086 0.09 0.0543 Ε Η= -9.6460-0.867-9.5530-5.887-6.8445-5.5753 -.7097 7.9 9.050 7.7 0.50.743 9.099 3.0984.7678.8590.7479 0.953.733 0.506 0.967.9038 3.053.834.8645.9478.3864 0.6060 0.5003 0.5347 0.546 0.866 0.5553 0.3433 0.039-0.9493-0.998-0.978-0.343-0.5874 0.3044-0.43.0584.056.03 0.786 0.738 0.6 0.440 olarak hesalanmıştır. Ε Η matrsnn özdeğerler 835 λ =., λ = 0. 7794, λ = 0. 350, 3 λ = 0.396, λ = 0. 059, 000007 4 5 λ 0. 6 =, λ 7 = 0. 000 olmak üzere Wlk s Lambda test statstğ 3 Λ= = +Ε Η = + λ = = 0.059 +.835 + 0.7794 + 0.350 + 0.396 + 0.059 0.000007 0.00 67
7. UYGULAMA Semh CAN olarak hesalanır. Wlk s Lambda tablo değer Λ =Λ =Λ = olarak bulunmuş olu; genel regresyon v,, v qn,, q 7,5,4 0,73 Η Ε testnde Λ= 0.59<Λ 3,,8 = 0.73 olduğundan Η 0 hotez red edlr. Açıklayıcı değşkenlerden en az br model çn anlamlıdır. Oluşturulan çok değşkenl çoklu regresyon model çn en y model seçmn nceleyelm. İlk olarak forward seçm sürecn ele alalım. Açıklayıcı değşkenler çn hesalanan Wlk s Lambda değerler, ( X) ( X4) ( X) ( X5) ( X ) 0.586 Λ = 0.69 Λ = 0.678 Λ = 0.6 Λ = 0.754 Λ = 3 olarak hesalanmıştır. Bu değerlerden mnmum Wlk s lamdaya sah olan değşken le Forward sürecne başlanır. Tüm Y yanıt değşkenler modelde ken en küçük Wlk s değer X açıklayıcı değşkenne attr. Wlk s tablo değer se; Λ =Λ = dur. Hesalanan Wlk s le tablo değer karşılaştırıldığında; v,, 7,,46 0.679 H ve ( X ) Λ = 0.69<Λ tablo = 0.679 olduğundan dolayı Η 0 red edlr ve X açıklayıcı değşken modelde yer almalıdır. İknc adımda tüm Y yanıt değşkenleryle X, X, X 3, X 4, X 5 açıklayıcı değşkenler modelde ken hesalanan Wlk s Lambda statstğ değerler ( X X) ( X4 X) ( X X ) ( X X ) Λ / = 0.744 Λ / = 0.663 Λ / = 0.79 Λ / = 0.775 3 5 68
7. UYGULAMA Semh CAN olarak hesalanır. Mnmum Wlk s değer X 3 değşkenne at olan ( X X ) Λ / = 0.79 değerdr. Wlk s tablo değer se Λ,, =Λ 7,,45 = 0.56 3 olarak bulunur. vh ve Λ = 0.79<Λ = 0.56 hesa tablo olduğundan dolayı X 3 değşken modelde olmalıdır. X ve X 3 açıklayıcı değşkenler modelde ken hesalanan dğer değşkenlere at Wlk s değerler; ( X X X ) ( X X X ) ( X X X ) Λ /, = 0.755 Λ /, = 0.753 Λ /, = 0.778 3 4 3 5 3 olarak hesalanmıştır. Burada hesalanan değerler arasındak mnmum Wlk s değerne sah olan değşken X 4 değşken olu; Wlk s tablo değer olan Λ =Λ = le karşılaştırıldığına; v,, 7,3,44 0.47 H ve Λ = 0.753>Λ = 0.47 hesa tablo olduğundan dolayı X 4 değşken modelde olmamalıdır. Aynı sürec X değşken çn uygulandığında; ( X X X ) Λ /, =Λ = 0.755>Λ = 0.47 3 hesa tablo olduğundan dolayı X değşken modelde olmamalıdır. Sürece X 5 le devam edldğnde se hesalanan Wlk s değer ( X X X ) Wlk s tablo değer le karşılaştırıldığında, Λ /, = 0.778 olarak bulunur. 5 3 69
7. UYGULAMA Semh CAN Λ = 0.778>Λ = 0.47 hesa tablo olduğundan dolayı X 5 modelde yer almamalıdır. Aynı süreç bu kez Y değşkenler yanıt değşken olarak değlde açıklayıcı değşken gb uygulanarak devam edlr. Y açıklayıcı değşkenler çn tek tek Wlk s değerler hesalanır. ( Y) ( Y5) ( Y) ( Y6) ( Y3) ( Y7) ( Y ) 0.645 Λ = 0.33 Λ = 0.53 Λ = 0.45 Λ = 0.600 Λ = 0.46 Λ = 0.946 Λ = 4 Bu değerlerden mnmum Wlk s değerne sah olan değşken Y değşkennn Wlk s değer olu Λ ( Y ) = 0.45 olarak bulunur. Bulunan bu değer Wlk s tablo değeryle Λ,, =Λ 5,,46 = 0.744 karşılaştırılırsa; vh ve Λ = 0.45<Λ = 0.744 hesa tablo olduğundan dolayı Y değşken modelde olmalıdır. Y değşken modelde ken hesalanan Wlk s değerler; ( Y Y) ( Y5 Y) ( Y3 Y) ( Y6 Y) ( Y Y ) ( Y Y ) Λ / = 0.84 Λ / = 0.743 Λ / = 0.86 Λ / = 0.630 Λ / = 0.78 Λ / = 0.90 4 7 buradak değerler çersnde mnmum değere sah olan değşken Y 6 değşkennn sah olduğu Wlk s değerdr. Bu değer tablo değer Λ,, =Λ 5,,45 =Λ = 0.67 le karşılaştırıldığında; vh ve tablo 70
7. UYGULAMA Semh CAN Λ = 0.630>Λ = 0.67 hesa tablo olduğundan dolayı Y 6 değşken modelde yer almamalıdır. Bu sürece devam edldğnde dğer değşkenlern Y, Y3, Y4, Y5, Y 7 değşkenlernn modelde olmayacağı görülmektedr. Forward seçm sürecne göre; X ve X 3 açıklayıcı değşkenler le Y yanıt değşken modelde yer almalıdır. Ancak X, X4, X 5 ve Y, Y3, Y4, Y5, Y 6 değşkenler modelde yer almamalıdır. İknc olarak Backward eleme sürecn ele alalım. Backward eleme sürec; tüm X açıklayıcı değşkenler ve tüm Y yanıt değşkenler modelde ken Wlk s Lambda ( X XXX 3 4X5) ( X3 XX X4X5) ( X XXX 3 4X5) ( X4 XX XX 3 5) ( X XX XX) Λ / = 0.0 Λ / = 0.89 Λ / = 0.865 Λ / = 0.866 Λ / = 0.88 5 3 4 Bu değerlerden en büyük Wlk s Lambda değerne sah değşken le sürece başlanır. X 4 değşken en büyük Wlk s değerne sah olu; Λ 7,5,4 = 0.73 Wlk s tablo değer le karşılaştırıldığında; Λ = 0.866>Λ = 0.73 hesa tablo olduğundan dolayı X 4 değşken modelden atılır. Sürece devam edldğnde hesalanan Wlk s değerler ( X XXX 3 5) ( X3 XX X5) ( X XXX ) ( X XX X ) Λ / = 0.0 Λ / = 0.8 Λ / = 0.80 Λ / = 0.87 3 5 5 3 7
7. UYGULAMA Semh CAN olarak bulunur. En büyük Wlk s değer se X 5 değşkenne at olan ( X XX X ) Λ / = 0.87 dr. Bu değer tablo değer Λ 7,4,43 = 0.335 le 5 3 karşılaştırıldığında; Λ = 0.87>Λ = 0.335 hesa tablo olduğundan dolayı X 5 modelden atılır. Gerye kalan değşkenlerle elde edlen Wlk s değerler aşağıda verlmştr. ( X XX3) ( X3 XX ) ( X / XX) 0.755 Λ / = 0.06 Λ / = 0.8 Λ = 3 Bu değerlerden en büyük Wlk s değerne sah olan değşken X değşkendr. Bu değer Wlk s tablo değer Λ 7,3,44 = 0.47 le karşılaştırıldığında Λ = 0.755>Λ = 0.47 hesa tablo olduğundan dolayı X değşken modelden atılmalıdır. X ve X 3 le sürece devam edlrse; ( X X ) ( X X ) Λ / = 0.79 Λ / = 0.08 3 3 olarak hesalanmıştır. Burada büyük Wlk s değer X 3 değşkennn sah olduğu Wlk s değer olu, tablo değer Λ 7,,4 = 0.56 le karşılaştırıldığında Λ = 0.79<Λ = 0.56 hesa tablo 7
7. UYGULAMA Semh CAN olduğundan dolayı X 3 değşken modelde yer almalıdır. X değşken çn Wlk s değer se ( X X ) Λ / = 0.08 olarak hesalanmış olu, Wlk s tablo değer 3 Λ 7,,4 = 0.56 le karşılaştırılırsa; Λ = 0.08<Λ = 0.56 hesa tablo olduğundan dolayı X değşken modelde yer almalıdır. X ve X 3 değşkenlern her ks de Backward eleme sürec sonunda model çn önem arz ettkler ve model açıklamada katkı sağlayacakları görülmüştür. Backward eleme sürecnde X açıklayıcı değşkenler çn yaılan test Bölüm.9 da gösterldğ gb Y yanıt değşkenler, açıklayıcı değşkenler olarak kabul ed analz ederek Backward eleme sürecn uygulayacağız. değerler, Tüm Y yanıt değşkenler modelde ken hesalanan Wlk s Lambda ( Y YYYYYY 3 4 5 6 7) ( Y5 YYYYYY 3 4 6 7) ( Y YYYYYY 3 4 5 6 7) ( Y6 YYYYYY 3 4 5 7) ( Y3 YYYYYY 4 5 6 7) ( Y7 YYYYYY 3 4 5 6) ( Y4 / YYYYYY 3 5 6 7) 0.6 ( Y / YYYYYY ) 0.807 Λ / = 0.655 Λ / = 0.807 Λ / = 0.456 Λ / = 0.57 Λ / = 0906 Λ / = 0.83 Λ = Λ = 5 3 4 6 7 Burada en büyük Wlk s değerne sah olan değşken le sürece başlanır. Y 3 değşkennn sah olduğu Wlk s değer tablo değer Λ 5,7,40 = 0.9 le karşılaştırıldığında; Λ = 0.906>Λ = 0.9 hesa tablo olduğundan dolayı Y 3 değşken modelden atılır. Sürece devam edldğnde elde edlen Wlk s değerler 73
7. UYGULAMA Semh CAN ( Y YYYYY 4 5 6 7) ( Y5 YYYYY 4 6 7) ( Y YYYYY 4 5 6 7) ( Y6 YYYYY 4 5 7) ( Y YYYYY ) ( Y YYYYY ) Λ / = 0.645 Λ / = 0.774 Λ / = 0.388 Λ / = 0.60 Λ / = 0.68 Λ / = 0.85 4 5 6 7 7 4 5 6 olarak bulunmuştur. En büyük Wlk s değer Y 7 değşkenne at olan ( Y YYYYY ) Λ / = 0.85 dr. Bu değer tablo değer Λ 6,5,4 = 0.333 le 7 4 5 6 karşılaştırıldığında; Λ = 0.85>Λ = 0.333 hesa tablo olduğundan dolayı Y 7 değşken modelden atılır. Sürece devam edldğnde Wlk s değerler; ( Y YYYY 4 5 6) ( Y5 YYYY 4 6) ( Y YYYY 4 5 6) ( Y6 YYYY 4 5) ( Y / YYYY ) 0.67 Λ / = 0.678 Λ / = 0.769 Λ / = 0.48 Λ / = 0.604 Λ = 4 5 6 olarak bulunur. En büyük Wlk s değer Y 5 değşkenne at olan ( Y YYYY ) Λ / = 0.769 dur. Bulunan bu değer tablo değer Λ 5,5,4 = 0.384 le 5 4 6 karşılaştırıldığında; Λ = 0.769>Λ = 0.384 hesa tablo olduğundan dolayı Y 5 değşken modelden atılır. Dğer değşkenlern hesalanan Wlk s değerler 74
7. UYGULAMA Semh CAN ( Y YYY 4 6) ( Y4 YYY 6) ( Y YYY ) ( Y YYY ) Λ / = 0.669 Λ / = 0.634 Λ / = 0.393 Λ / = 0.606 4 6 6 4 olarak hesalanmıştır. En büyük Wlk s değerne sah değşken se Y değşken olu; bu değer tablo değer Λ 5,4,43 = 0.446 le karşılaştırılırsa; Λ = 0.669>Λ = 0.446 hesa tablo olduğundan dolayı Y değşken modelden atılmalıdır. Gerye kalan değşkenlern Wlk s değerler; ( Y YY 4 6) ( Y4 YY 6) ( Y YY ) Λ / = 0.48 Λ / = 0.74 Λ / = 0.598 6 4 olarak bulunur. Bu değerlern en büyüğü Y 4 değşkenne at olan Wlk s değer, tablo değer Λ 5,3,44 = 0.5 le karşılaştırıldığında Λ = 0.74>Λ = 0.5 hesa tablo olduğundan dolayı Y 4 değşken modelden atılır. Gerye kalan değşkenlern hesalanan Wlk s değerler aşağıdak gbdr. ( Y Y ) ( Y Y ) Λ / = 0.5 Λ / = 0.630 6 6 Büyük Wlk s değerne sah olan Y 6 değşkenn, tablo değer Λ 5,,45 = 0.67 le karşılaştırıldığında, 75
7. UYGULAMA Semh CAN Λ = 0.630>Λ = 0.67 hesa tablo olduğundan Y 6 değşken modelden atılır. Gerye kalan Y değşkenne at olan Wlk s değer Λ ( Y ) = 0.45 olarak bulunur. Bu değer tablo değer Λ 5,,46 = 0.744 le karşılaştırıldığında, Λ = 0.45<Λ = 0.744 hesa tablo olduğundan dolayı Y değşken modelde yer almalıdır. Backward sürecne göre; X ve X 3 açıklayıcı değşkenler le Y yanıt değşken modelde yer almalıdır. Ancak X, X4, X 5 açıklayıcı değşkenler ve Y, Y3, Y4, Y5, Y6, Y 7 değşkenlernn modele katkı sağlamadıkları belrlenmştr. Forward ve Backward süreçlernn sonunda, X ve X 3 açıklayıcı değşkenler le Y yanıt değşken modelde yer almalı, ancak X, X4, X 5 açıklayıcı değşkenler ve Y, Y3, Y4, Y5, Y6, Y 7 değşkenlernn modele her k süreç sonunda da katkı sağlamadıkları belrlenmştr. Forward ve Backward süreçlernn ışığında Stewse sürec le de benzer sonuçların bulunduğu görülmüştür. En y model seçmne göre yanıt değşken Y ve açıklayıcı değşkenler X ve X 3 olarak alınır. Bu en y modeln analznde sonuç olarak; çoklu belrleyclk katsayısı R = 0.96 olarak bulunmuştur. Bu durumda açıklayıcı değşkenler yanıt değşkenler % 9 oranında açıkladığı belrlenr. En y modeln modelden daha y br sonuç vermştr. R değer tam Seçm süreçlernden elde edlen değşkenlerle oluşturulan modeln hata kareler ortalaması HKO = 0.004 76
7. UYGULAMA Semh CAN olarak hesalanmıştır. Bu değern küçük olması terch edlmektedr. gbdr: Başka br model seçm krter olan C değer çn hesalama şekl aşağıdak HKT C = n+ HKO Buradak eştlkten elde edlen C değer; 0.6 C = 48 + = 5.75 0.004 olarak hesalanmıştır. C değer, çoklu belrleyclk katsayısı, hata kareler ortalaması ve değşken seçm süreçler ışığında en y modeln değşkenlernn, yan model açıklamakta ve modele maksmum katkı sağlayan değşkenler X, X 3 açıklayıcı değşkenler ve Y yanıt değşkennn oluşturduğu model en y model olarak kabul edlr. Aynı ver kümesne kanonk korelasyon uygulayarak Büyükşehr Beledyes gelr ve gder arasındak lşky nceleyelm: Hesalamalardan önce tüm verler standartlaştırılmıştır..0000 0.4565-0.4886 0.838 0.03 0.4565.0000-0.0838 0.5865 0.4906 S xx = -0.4886-0.0838.0000 0.070 0.0598 0.838 0.5865 0.070.0000 0.680 0.03 0. 4906 0.0598 0.680.0000 77
7. UYGULAMA Semh CAN Şekl 7..X Değerlernn Saçılım Grafğ X değşkenlernn korelasyon matrsne göre; X (Teşebbüs ve Mülkyet Gelr) ve X 4 (Sermaye Gelrler), X (Teşebbüs ve Mülkyet Gelr)ve X 5 (Alınan Bağış ve Yardımlar) değşkenler arasında orta güçte br lşk vardır..0000 0.9738 0.8353 0.5 0.5394 0.5586 0.043 0.9738.0000 0.8659 0.437 0.5539 0.490 0.050 0.8353 0.8659.0000 0.4 0.6377 0.479 0.046 S yy = 0.5 0.437 0.4.0000 0.4587 0.4994-0.0365 0.5394 0.5539 0.6377 0.4587.0000 0. 0.450 0.5586 0.490 0.479 0.4994 0..0000-0.035 0.043 0.050 0.046-0.0365 0.450-0.035.0000 78
7. UYGULAMA Semh CAN Şekl 7..Y Değerlernn Saçılım Grafğ Y değşkenlernn korelasyon matrsne göre; Y (Personel Gderler) ve Y (Sosyal Güvenlk Kurumlarına Devlet Prm Gderler), Y (Personel Gderler) ve Y 3 (Mal ve Hzmet Alım Gderler), Y (Sosyal Güvenlk Kurumlarına Devlet Prm Gderler) ve Y 3 (Mal ve Hzmet Alım Gderler) değşkenler arasında çok güçlü br lşk vardır. 0.694 0.79 0.6867 0.30 0.4884 0.0 0.0983 0.4395 0.495 0.5006 0.0967 0.4967 0.795-0.0338 S xy = 0.49 0.70 0.44 0.56 0.0 0.599 0. 0797 0.3760 0.47 0.3960-0.003 0.3843 0.869-0.057 0.809 0.3609 0.943-0.086 0.70 0.094-0.0797 79
7. UYGULAMA Semh CAN Şekl 7.3.X ve Y Değerlernn Saçılım Grafğ X ve Y değşkenlernn korelasyon matrsne göre; X (Verg Gelrler) ve Y (Personel Gderler), X (Verg Gelrler) ve Y (Sosyal Güvenlk Kurumlarına Devlet Prm Gderler), X (Verg Gelrler) ve Y 3 (Mal ve Hzmet Alım Gderler) değşkenler arasında güçlü br lşk vardır. se X ve Y değşkenlerne at kanonk değşkenler yan lneer kombnasyonlar 80
7. UYGULAMA Semh CAN V V V3 V4 V5 Y 0.4683-0.704-0.8308-0.6459 0.45 Y 0.8654 0.56 0.45 0.759-0.369 Y3-0.0844-0.499 0.583-0.083-0.0490 Y4-0.399 0.0480 0.06-0.009-0.636 Y5-0.033 0.0566 0.0686-0.093 0.6073 Y6 0.0450 0.397-0.0776 0.05 0.055 Y7-0.0507 0.0773-0.078-0.049-0.55 X X X3 X4 X5 U U U3 U4 U5 0.8488-0.09-0.309 0.664-0.4790 0.03 0.33 0.6869 0.85 0.59 0.53 0.8698-0.0374 0.0994-0.996 0.0008-0.384-0.7040 0.457 0.5877 0.0687 0.0378 0.84-0.933-0.568 V= 0.4683Y 0.8654 Y - 0.0844 Y - 0.399 Y - 0.033Y + 0.0450 Y - 0.0507Y 3 4 5 6 7 V= - 0.704 Y+0.56 Y - 0.499 Y + 0.0480 Y + 0.0566 Y + 0.397 Y + 0.0773Y 3 4 5 6 7 = + + 3+ 4 5-0.0776 Y6-0.078Y7 V3-0.8308Y 0.45Y 0.583Y 0.06 Y + 0.0686Y V4= - 0.6459Y + 0.759 Y - 0.083 Y - 0.009 Y - 0.093Y + 0.05 Y - 0.049Y 3 4 5 6 7 V5= 0.45Y 0.369Y 0.0490Y 0.636 Y + 0.6073Y + 0.055 Y - 0.55Y 3 4 5 6 7 U 0.8488 X + 0.03 X + 0.53 X = 3 + 0.0008 X4 + 0.0687X5 U= - 0.09 X + 0.33 X + 0.8698 X - 0.384 X +0.0378X 3 4 5 U3= - 0.309X + 0.6869 X - 0.0374 X - 0.7040X + 0.84X 3 4 5 U4= 0.664 X + 0.85 X + 0.0994 X + 0.457 X - 0.933X 3 4 5 = X.59 X - 0.996X3 + 0.5877 X4-0.568X5 U5-0.4790 + 0 şeklndedr. S kovaryans matrs Syy, Sxx, Syx, S xy olarak arçalanablr. Bu arçalanmış matrsten U ve V kanonk değşkenler arasındak korelasyon ve kanonk korelasyonlar bulunablr. 8
7. UYGULAMA Semh CAN S S S S yy yx xx xy S S S S xx xy yy yx ri= 0 ri= 0 Bu denklemlerden elde edlen özdeğerler r = 0.977, r = 0.4380, r 3 = 0.598, r 4 = 0.6 ve r 5 = 0.057 olarak bulunur. Bu özdeğerler U ve V kanonk değşkenler arasındak korelasyonlardır. Bu özdeğerlern kökler se r = 0.963, r = 0.668, r 3 = 0.5, r 4 = 0.350 ve r 5 = 0.5097 olarak bulunur ve bu değerler kanonk korelasyonlar olarak adlandırılır. r = 0.977 en büyük korelasyon çn U ve V kanonk değşkenler arasındak kanonk korelasyon se (, ) ( ) ( ) Cov U V as xyb ru (, V) = = = 0.963 Var U Var V as abs b xx yy olarak hesalanmıştır. korelasyon se r = 0.4380 çn U ve V kanonk değşkenler arasındak kanonk (, ) ( ) ( ) Cov U V as xyb ru (, V) = = = 0.668 Var U Var V as abs b xx yy olarak bulunmuştur. korelasyon se r 3 = 0.598 çn U 3 ve V 3 kanonk değşkenler arasındak kanonk ( 3, 3) ( ) ( ) Cov U V as 3 xyb3 ru ( 3, V3) = = = 0.5097 Var U Var V as abs b 3 3 3 xx 3 3 yy 3 8
7. UYGULAMA Semh CAN olarak hesalanmıştır. korelasyon se r 4 = 0.6 çn U 4 ve V 4 kanonk değşkenler arasındak kanonk ( 4, 4) ( ) ( ) Cov U V as 4 xyb4 ru ( 4, V4) = = = 0.350 Var U Var V as abs b olarak hesalanır. korelasyon se 4 4 4 xx 4 4 yy 4 r 5 = 0.057 çn U 5 ve V 5 kanonk değşkenler arasındak kanonk ( 5, 5) ( ) ( ) Cov U V as 5 xyb5 ru ( 5, V5) = = = 0.5 Var U Var V as abs b 5 5 5 xx 5 5 yy 5 olarak bulunmuştur. Kanonk korelasyonun katsayılarının önem test yaılmak stenrse Η 0 hotez aşağıdak gbdr: Η : ρ = ρ = ρ = ρ = ρ = 0 0 3 4 5 Η : ρ 0, çn Η 0 hoteznn test edlmes çn Wlk s lamda test statstğ hesalanablr. Ayrıca her br kanonk korelasyonkatsayısının önemllğ çn gerekl Wlk s Lambda test statstkler aşağıdak gb hesalanmıştır. Wlks Ch-SQ DF Sg 0.06 47.86 35 0 0.359 4.459 4 0.05 3 0.639 8.9 5 0.56 4 0.864 5.934 8 0.655 5 0.984 0.639 3 0.888 83
7. UYGULAMA Semh CAN Η : ρ = 0, Η : ρ 0 hoteznn test edlmes çn Wlk s Lambda test 0 statstğ aşağıdak gb hesalanablr. 5 ( r ) ( 0.977)( 0.4380)( 0.598)( 0.6)( 0.057) Λ= = = Λ= 0.06 olarak hesalanmıştır. Λ = 0.06<Λ tablo = 0.73 olduğundan dolayı Η 0 hotez red edlr. Bu durumda; ρ sıfırdan farklıdır. Η : ρ = 0, Η : ρ 0 hoteznn test edlmes çn Wlk s Lambda test 0 statstğ aşağıdak gb hesalanablr. 5 ( r ) ( 0.4380)( 0.598)( 0.6)( 0.057) Λ = = = Λ = 0.359 olarak bulunur. Λ = 0.359<Λ tablo = 0.467 olduğundan dolayı Η 0 hotez red edlr. Bu durumda ρ sıfırdan farklıdır. Η : ρ = 0, Η : ρ 0 hoteznn test edlmes çn Wlk s Lambda test 0 3 3 statstğ aşağıdak gb hesalanablr. 3 5 ( r ) ( )( )( ) Λ = = 0.598 0.6 0.057 = 0.639 = 3 olarak bulunur. Λ 3 = 0.639>Λ tablo = 0.5 olduğundan dolayı Η 0 hotez kabul edlr. Bu durumda, sürece devam edlemez. Sonuç olarak; ρ ve ρ sıfırdan farklı ancak ρ3, ρ 4 ve ρ 5 sıfıra eşttr. Bu sonuçlar ışığında lk k kanonk korelasyon sıfırdan farklı ve öneml olduğu sonucuna varılır. U ve V lneer kombnasyonları arasındak lşk çn U V 84
7. UYGULAMA Semh CAN ve U V arasındak lşk öneml ancak U3 V3, U4 V4 ve U5 V5 lneer kombnasyonları arasında öneml olmayan lşk vardır. U V ve U V her k küme çersnde değşkenler en çok açıklayan kanonk değşkenlerdr. Yan U kanonk değşkenn ( X ) verg gelrler %84 ve ( ) X teşebbüs mülkyet gelr %3, U kanonk değşkenn se sırasıyla( X ) verg gelrler negatf yönde %0 ve ( X ) teşebbüs mülkyet gelr %3; V kanonk değşkenn ( ) Y ersonel gderler %47 ve ( Y ) sosyal güvenlk kurumlarına devlet rmler gderler negatf yönde %86, V kanonk değşkenn se ( Y ) ersonel gderler negatf yönde %70 ve ( Y ) sosyal güvenlk kurumlarına devlet rmler gderler %56 etklemektedrler. Kanonk korelasyon analz ve temel bleşenler analznn çok değşkenl çoklu regresyon le lşksn nceleyelm: Kanonk korelasyon analzne göre; Sxx, Sxy, Syy, S yx matrsler kullanılarak; S S S S xx xy yy yx veya S S S S yy yx xx xy matrslernden aynı özdeğerler elde edlr. Bulunan özdeğerlerden maksmum olanına at olan özvektör le hang değşkenlern önem arz ettğ bulunablr. Sonra maksmum özdeğere at kanonk korelasyon değer λ = 0.963 olarak bulunur. Bu özdeğer yardımıyla mnmum γ mn = λ = 0.963= 0.0368 max değer bulunablr. Bu değer yardımıyla, LS mn mn ( ) = γ = 0.0368 = 0.0736 değer elde edlr. 85
7. UYGULAMA Semh CAN özvektör S S S S xx xy yy yx çn λ max = 0.977 maksmum özdeğerne karşılık gelen 0.8488 0.03 a = 0.53 0.0008 0.0687 olarak bulunur ve S S S S yy yx xx xy çn λ max = 0.977 maksmum özdeğerne karşılık gelen özvektör 0.4683 0.8654 0.0844 b = 0.399 0.033 0.0450 0.0507 olarak elde edlr. a ve b özvektörlerne göre; a özvektörü çn X (Verg Gelrler) ve X 3 (Dğer Gelrler) X değşkenlern açıklamakta öneml br yere sah olu, gelr bütçesnde en fazla getrs olan gelrler olarak değerlendrleblr. b çn se ve Y (Sosyal Güvenlk Kurumlarına Devlet Prmler Gderler) Y değşkenlern açıklamakta öneml br yere sah olu, gder bütçesnde öneml gderler olarak göze çarmaktadır. En fazla harcamanın yaıldığı değşkenler olarak değerlendrleblr. Bu durumda, beledye sınırları çersnde alınan vergler ve genel bütçeden alınan aylar buna ek olarak dğer gelrler, kurumda çalışan ersoneln sosyal güvenlk kurumuna yaılan ödemelere harcanmakta olduğu yorumu yaılablr. 86
7. UYGULAMA Semh CAN Genel bütçe kasamında X, X 3 ve Y değşkenler genel bütçenn açıklanmasında yada değerlendrlmesnde göze çaran değşkenlerdr. Lovetsky, Tshler ve Conkln (00) makalesndek sonuçları uygulama üzernde görmek amacıyla (5.5) eştlğndek S korelasyon matrs aşağıdak şeklde elde edlmştr..0000 0.4565-0.4886 0.838 0.03-0.694-0.79-0.6867-0.30-0.4884-0.0-0.0983 0.4565.0000-0.0838 0.5865 0.4906-0.4395-0.495-0.5006-0. 0967-0.4967-0.795 0.0338-0.4886-0.0838.0000 0.070 0.0598-0.49-0.70-0.44-0.56-0.0-0.599-0.0797 0.838 0.5865 0.070.0000 0.680-0.3760-0.47-0.3960 0.003-0.3843-0.869 0.057 0.03 0.4906 0.0598 0.680.0000-0.809-0.3609-0.943 0.086-0.70-0.094 0.0797-0.694-0.4395-0.49-0.3760-0.809.0000 0.9738 0.8353 0.5 0.5394 0.5586 0.043 S = -0.79-0.495-0.70-0.47-0.3609 0.9738.0000 0.8659 0.437 0.5539 0.490 0.050-0.6867-0.5006-0.44-0.3960-0.943 0.8353 0.8659.0000 0.4 0.6377 0.479 0.046-0.30-0.0967-0.56 0.003 0.086 0.5 0.437 0.4.0000 0.4587 0.4994-0.0365-0.4884-0.4967-0.0-0.3843-0.70 0.5394 0.5539 0.6377 0.4587.0000 0. 0.450-0.0-0.795-0.599-0.869-0.094 0.5586 0.490 0.479 0.4994 0..0000-0.035-0.0983 0.0338-0.0797 0.057 0.0797 0.043 0.050 0.046-0.0365 0.450-0.035.0000 Temel bleşenler analzne göre; S matrsnn sah olduğu özdeğerlerden maksmum olanı terch edlr. Bu maksmum özdeğern sah olduğu özvektöre göre X ve Y değşkenlernn öneml olanları belrleneblr. Bu özdeğere karşılık gelen özvektör, λ max = 5.0883 olarak bulunur. 87
7. UYGULAMA Semh CAN 0.350 0.9 a = 0.060 0.49 0.999 0.4074 V = 0.448 0.403 b = 0.36 0.385 0.35 0.04 olarak elde edlr. Buna göre, X değşkenler çersnde X (Verg Gelrler), X (Teşebbüs ve Mülkyet Gelrler) ve öneml olan açıklayıcı değşkenler ve Y yanıt değşkenler çersnde öneml olan değşkenler Y (Personel Gderler), Y (Sosyal Güvenlk Kurumlarına Devlet Prmler Gderler) ve Y 3 (Mal ve Hzmet Alım Gderler) tür. Beledyenn toladığı gelrler çersnde beledye sınırları çersnde alınan vergler, beledyenn kend bünyesnde kurulan şrketlerden gelen sermaye gelrler, ersoneln maaşlarına, tazmnatlarına, sosyal güvenlk kurumu çn ödenen rmlere ve beledyenn yatırım yada dğer hzmet durumları çn yatığı mal ve hzmet çn yaılan gderlere harcandığı söyleneblr. Yan genel bütçenn açıklanmasında ve bütçey oluşturan değşkenler olarak X, X, Y, Y ve Y 3 temel olarak alınablr. Fakat Y, Y ve Y 3 karşılaştırıldığında Y ve Y 3 ün etklernn brbrne yakın ancak Y nn braz daha etkn olduğu görülmüştür. Çok değşkenl çoklu regresyon, kanonk korelasyon ve temel bleşenler analzlernn ekk le lşks ncelendğnde bu üç yöntem sonucunda varılan sonuç; açıklayıcı değşkenler kümesnde öneml olan değşkenler ( X ) verg gelrler ve ( X 3 ) dğer gelrler, yanıt değşkenler kümesnde öneml olan değşken se ( Y ) sosyal güvenlk kurumlarına devlet rmler gderler olarak belrlenr. 88
7. UYGULAMA Semh CAN UYGULAMA İknc uygulamada kullanılacak olan ver Khur den (986) alınmıştır. Khur (986) makalesnde; çoklu ç lşknn etksyle lgl çok değşkenl testler ve Σ varyans kovaryans matrsnn yaısına çoklu ç lşknn etksn ncelemştr. Verler 935 954 yılları arasında 0 Amerkan şrketnn brüt yatırımlarını çeren ver gurubundan seçlmştr. Bu şrketler endüstrnn aynı ş kolunda faalyet göstermektedr. Bu şrketlern yanıt modellernn lşkl olduğunu düşünmenn mantıklı olduğunu Boot ve De Wt (960) tarafından önerlmştr. Bu şrketler se General Electrc, IBM ve Westnghouse şrketlerdr. Değşkenler se X X = -nc Şrketn her yıl çn hsse sened değer = -nc Şrketnaynı zamandak sermaye stok değer Y = Br yıl çndek -nc şrketn mevcut brüt yatırım değer şeklnde tanımlanablr.,( =,,3) X = 0 3 General Electrc IBM Westnghouse X X X 3 X 4 X 5 X 6 0.000.706 0.0978 0.970 0.0065 0.95 0.008 0.000.058 0.044 0.03 0.058 0.560 0.0008 0.000.8033 0.80 0.3 0.077 0.790 0.0074 0.000.0397 0.56 0.67 0.039 0.5604 0.08 0.000.56 0.76 0.864 0.0486 0.599 0.035 0.000.3 0.866 0.980 0.055 0.685 0.065 0.000.834 0.09 0.769 0.065 0.537 0.036 0.000.5880 0.878 0.76 0.0805 0.56 0.0608 0.000.7494 0.399 0.874 0.0944 0.67 0.0844 0.000.687 0.33 0.3303 0.096 0.667 0.09 0.000.0077 0.396 0.344 0.093 0.737 0.094 0.000.083 0.3460 0.409 0.094 0.7605 0.0860 0.000.6567 0.4564 0.4074 0.4 0.584 0. 0.000.6044 0.5434 0.409 0.74 0.663 0.306 0.000.438 0.683 0.48 0.493 0.5838 0.48 0.000.605 0.6474 0.6738 0.644 0.635 0.367 0.000.894 0.673 0.6769 0.77 0.738 0.97 0.000.0797 0.76 0.700 0.000 0.864 0.455 0.000.376 0.8003 0.7935 0.5.935 0.748 0.000.7599 0.8889 0.973 0.387.889 0.35 89
7. UYGULAMA Semh CAN General Electrc IBM Westnghouse Y Y Y3 33.000 0.3600.9300 45.0000 5.9800 5.9000 77.000 5.9400 35.0500 44.6000 7.5300.8900 48.000 4.6000 8.8400 74.4000 8.5400 8.5700 3.0000 43.400 48.500 9.9000 4.800 43.3400 6.3000 7.8400 37.000 Y = 56.8000 3.6000 37.800 93.6000 39.0300 39.700 59.9000 50.700 53.4600 47.000 5.8500 55.5600 46.3000 64.0300 49.5600 98.3000 68.600 3.0400 93.5000 77.3400 3.400 35.000 95.3000 54.3800 57.3000 99.4900 7.7800 79.5000 7.500 90.0800 89.6000 35.700 68.6000 Khur nn (986) çalışmasında analzler ham ver üzernde yaılmıştır ve koşul sayısı 454 olarak bulunmuştur. Standartlaştırmanın çoklu ç lşknn etksn azaltacağı düşünces le bu çalışmada verler önce standartlaştırılmış, daha sonra analzler yaılmıştır. KoşulSayısı ( ) λ λ max = K X = = mn 8.3444 olarak belrlenmştr. Bulunan bu değer 30 a yakın olduğundan çoklu ç lşknn olduğu kabul edleblr. ˆΒ ekk tahmnler matrs se, 90
7. UYGULAMA Semh CAN 0.053 0.89 0.54.507.337 0.7403 ˆ 0.3607 0.483 0.5085 Β EKK = 0.7835 0.667 0.53 0.467 0.4984.3694 0.0759 0.593 0.9700 olarak bulunur. Tahmnlerdek negatf değerler çok lşknn varlığını göstermektedr. Çoklu ç lşknn varlığı durumunda rdge regresyon tahmn edc yöntem kullanılablr. Rdge regresyon yöntemn Bredman ve Fredman ın (997) önerdğ gb her y yanıt değşken çn ayrı ayrı uygulanacaktır. Brnc model olarak Y alınsın. Bu model çn elde edlen ekk tahmnler aşağıdak gbdr. () () = Xβ + ε ˆ () β EKK 0.053.507-0.3607 = -0.7835 0.467 0.0759 Şekl 7.4 de verlen rdge z yardımıyla uygun k değer 0.8 0.9 arasındak değerler olarak belrleneblr. k = 0.88 değer çn elde edlen rdge regresyon tahmn edc se ˆ () ( ) β R k 0.063 0.47 0.9 = 0.39 0.60 0.54 9
7. UYGULAMA Semh CAN şeklndedr. 0.7 0.6 0.5 0.4 ß ß ß3 ß4 ß5 ß6 0.3 β 0. 0. 0-0. -0. 0 0. 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 k Şekl 7.4. Brnc model çn k grafğ () () İknc model olarak Y = Xβ + alınsın. Bu model çn elde edlen EKK tahmnler aşağıdak gbdr. ε ˆ () β EKK -0.89.337 0.483 = -0.667 0.4984-0.593 9
7. UYGULAMA Semh CAN Şekl 7.5 dek rdge z yardımıyla uygun k değer ( 80 00) arasındak değerler olarak belrleneblr. k = 88.9 değer çn elde edlen rdge regresyon tahmn edc se; ˆ () ( ) β R k 8.8978 0 0.0003 0.0004 = 0.000 0.0008 5.385 0 şeklndedr..5 x 0-3 0.5 0 β -0.5 - -.5 ß ß ß3 ß4 ß5 ß6 - -.5 0 0 0 30 40 50 60 70 80 90 00 k Şekl 7.5. İknc model çn k grafğ 93
7. UYGULAMA Semh CAN (3) (3) Üçüncü model olarak Y = Xβ + alınsın. Bu model çn elde edlen EKK tahmnler aşağıdak gbdr. 3 ε ˆ (3) β EKK -0.54 0.7403-0.5085 = 0.53.3694-0.9700 Uygun k değer ( 0.9 ) arasındak değerler olarak belrleneblr. k = 0.95 değer çn elde edlen rdge regresyon tahmn edc se; ˆ (3) ( ) β R k 0.0693 0.5 0.0 = 0.40 0.8 0.4 şeklndedr. 94
7. UYGULAMA Semh CAN. 0.8 0.6 ß ß ß3 ß4 ß5 ß6 0.4 β 0. 0-0. -0.4-0.6 0 0. 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 k Şekl 7.6.Üçüncü model çn k grafğ Her üç modeln EKK tahmn matrsler ve rdge regresyon tahmn matrsler brleştrlr se; ˆ β EKK 0.053 0.89 0.54.507.337 0.7403 0.3607 0.483 0.5085 = 0.7835 0.667 0.53 0.467 0.4984.3694 0.0759 0.593 0.9700 95
7. UYGULAMA Semh CAN ( ) β ˆ k R 8 0.063.8978 0 0.0693 0.47 0.0003 0.5 0.9 0.0004 0.0 = 0.39 0.000 0.40 0.60 0.0008 0.8 5 0.54.385 0 0.4 şeklnde olur. Bu k matrs karşılaştırılacak olursa; rdge regresyon tahmnlernn brbrlerne yakın değerlerde olduğu ve negatf değerlern olmadığı görüleblr. Böylece, rdge regresyon tahmn edcnn çoklu ç lşknn şddetn azalttığı söyleneblr. Aynı ver çn temel bleşenler regresyonu kullanarak arametreler tahmn edelm. Temel bleşen regresyonda ( XX ) matrsnn özdeğerler dkkate alınarak, en büyük özdeğerlere göre tahmnler yaılır. ( XX ) matrsnn özdeğerler: D q r s ( ) = ( 4.6369,.8,0.09,0.0309,0.07,0.0058 q ) ( = + ) olarak bulunur. Burada den büyük olan lk k λ = 4.6369 ve λ =.8 özdeğerler dkkate alınacaktır. Bu özdeğerlere karşılık gelen özvektörler -0.59 0.848-0.4499-0.4-0.4508-0.0594 T = -0.4554-0.60-0.4078 0.3938-0.44-0.59 açıklayıcı değşkenler yardımıyla temel bleşen regresyonda tahmnler bulmada yardımcı olacaktır. En küçük kareler tahmnler; 96
7. UYGULAMA Semh CAN ˆ β EKK 0.053 0.89 0.54.507.337 0.7403 0.3607 0.483 0.5085 = 0.7835 0.667 0.53 0.467 0.4984.3694 0.0759 0.593 0.9700 ken temel bleşen regresyon tahmnler 0.0096-0.006 0.0058 0.0545 0.049 0.000 ˆ 0.0530 0.0453 0.098 Β TBR = 0.0546 0.0484 0.00 0.0433 0.097 0.073 0.0538 0.0487 0.097 olarak bulunur. EKK tahmnler le temel bleşen regresyon tahmnler karşılaştırıldığında; EKK tahmnlernde negatf değerlern sayılarının temel bleşen regresyon da azaldığını ve tahmnlern brbrlerne yakınlaştığı görüleblr. Böylece, çoklu ç lşknn tahmnler üzerndek olumsuz etksnn azaldığı belrlenmştr. 97
8. SONUÇLAR Semh CAN 8. SONUÇLAR İlk uygulama kısmında değşken seçm sürec ve alt küme seçm krterlerne göre en y model oluşturulduğunda Büyükşehr Beledyes sınırları çersnde aldığı ( X ) verg gelrler ve ( X 3) dğer gelrlern her k gelrn öneml olduğu görülür. Büyükşehr Beledyes kaynaklarının kullanıldığı gderler se ( Y ) sosyal güvenlk kurumlarına devlet rmler gderler olarak belrlenr. Beledyenn gelrlern bünyesnde çalışan ersoneln maaşlarına, sosyal güvenlk rmlerne harcadığı söyleneblr. Kanonk korelasyon ve temel bleşenler analzlernn çok değşkenl le lşks ncelendğnde ( X ) verg gelrler ve ( X 3) dğer gelrlern öneml gelr kaynağı olduğunu ve ( Y ) sosyal güvenlk kurumlarına devlet rmler gderler öneml gder olduğu söyleneblr. Sonuç olarak, Büyükşehr Beledyes sınırları çersnde aldığı vergler ve devlet genel bütçesnden aldığı verg gelrlern, beledye çalışanlarının sosyal güvelk rmlerne harcadığı belrlenmştr. İknc uygulamada, çoklu ç lşk varlığında ekk yöntemnn hatalar verdğn ve güvenlr olmayan br yöntem olduğu görülmektedr. Bu olumsuz durumu düzeltmek çn önerlen k yöntem rdge regresyon ve temel bleşenler kullanılarak elde edlen tahmn değerlernn EKK tahmnlernden daha kararlı oldukları test edlmştr. Rdge regresyon yöntemnde çok değşkenl regresyon çn Bredman ve Fredman nın (997) önerdğ şeklde ayrı ayrı model oluşturularak çoklu ç lşknn olumsuz etkler azaltılmıştır. 98
KAYNAKLAR ALPAR, R., 003, Uygulamalı Çok değşkenl İstatstksel Yöntemlere Grş, Nobel Yayıncılık, Ankara. AL-SUBAIHI, A. A., 00, Varable Selecton n Multvarate Regresson Usng SAS / IML, Amercan Statstcal Assocaton, 7,. ANDERSON, T. W., 958, An Introducton To Multvarate Analyss, New York: Wley, New York. BAEK, S., KARAMAN, F., AHN, H., 005, Varable Selecton for Heteroscedastc Data Through Varance Estmaton, Communcatons n Statstcs, 34, 567-583. BALOĞLU, B., 996, Gelr Ve Hanehalkı Kş Sayısıyla Et Ve Sebze Tüketm Arasındak İlşknn Çok değşkenl Regresyon Analzyle Belrlenmes Yüksek Lsans Tez, Anadolu Ünverstes Fen Blmler Ensttüsü, Eskşehr. BİÇKİCİ, B., 007, Çok Değşkenl Varyans Analz ve Çoklu Doğrusal Regresyon Analznn Uygulamalı Olarak Karşılaştırılması Yüksek Lsans Tez, Atatürk Ünverstes Fen Blmler Ensttüsü, Erzurum BOOT, J., C., DE WIT, G., M., 960, Investment Demand: An Emrcal Contrbuton To The Aggregaton Problem, Internatonal Economc,, 3 30. BREIMAN, L., FRIEDMAN, J.,H., 997, Predctng Multvarate Resonses İn Multle Lnear Regresson, Journal Of The Royal Statstcal Socety, B59,, 3-54 BROWN, P. J., ZIDEK, J. V., 980, Adatve Multvarate Rdge Regresson, Ann. Statst., 8, 64-74. BURDICK, R. K., A Note On The Multvarate General Lnear Test, The Amercan Statstcan, 36,, 3-3. CANNON, A. J., 009, Negatve Rdge Regresson Parameters For İmrovng The Covarance Structure Of Multvarate Lnear Downscalng Models, Internatonal Journal Of Clmatology, 9, 76 769. COOLEY, W. W., LOHNES, P. R., 97, Multvarate Data Analyss, John Wley & Sons, New York. 99
ÇANKAYA, S., 005, Kanonk Korelasyon Analz ve Hayvancılıkta Kullanımı, Çukurova Ünverstes Fen Blmler Ensttüsü Doktora Tez, Adana. HARDLE, W., SIMAR, L., 003, Aled Multvarate Statstcal Analyss, Srnger Verlag. HASTIE, T., TIBSHIRANI, R., FRIEDMAN, J., 00, The Elements of Statstcal Learnng, Srnger, New York HOERL, A. E., and KENNARD, R. W., 970. Rdge Regresson: Based Estmaton for Nonorthogonal Problems. Technometrcs,,, 55-67. HOTELLING, H., 933. Analyss of a Comlex of Statstcal Varables nto Prncal Comonents. Journal of Educatonal Pschology, 4, 47-44 and 489-50. JOHNSON, R. A., WICHERN, D.W., 00, Aled Multvarate Statstcal Analyss, Pearson Educaton, New Jersey. JOSSE, J., PAGES, J., HUSSON, F., 008, Testng The Sgnfcance of The RV Coeffcent, Comutatonal Statstcs and Data Analyss, 53, 8 9. KESKİN, S., BOYSAN, M., GÖKTAŞ, İ., 007, Mükemmelyetçlk ve Obsesf Komülsf Semtomlar Arası İlşk İçn Çok Değşkenl Analz Yaklaşımı, 0. Ulusal Byostatstk Kongres. KESKİN, S., KOR, A., BAŞPINAR, E., 005, Akkeç Oğlaklarında Kesm Önces ve Kesm Sonrası Ölçülen Bazı Özellkler Arasındak İlşk Yaısının Kanonk Korelasyon Analz le İrdelenmes. Ankara Ünverstes Zraat Fakültes Tarım Blmler Dergs, (), 54-59, Ankara. KHURI, A.I., 986, Exact Tests For The Comarson Of Correlated Resonse Models Wth an Unknown Dserson Matrx, Technometrcs, 8, 4. KIERS, H. A. L., SMILDE, A. K., 007, A Comarson of Varous Methods for Multvarate Regresson wth Hghly Collnear Varables, Stat. Meth. And Al., 6, 93-8. KLADOPOULOS, C. N., RAMSEY, P. H., 005, A More Roboust Procedure for Testng The Null Hyothess n MANOVA, Qeens College Of Cty Unversty Of New York. 00
KOÇAK, İ., 006, Çok Değşkenl Ayarlama Problemnde Değşken Seçm Doktora Tez, Hacettee Ünverstes Fen Blmler Ensttüsü, Ankara. KOLLO, T., VON ROSEN, D., 005, Advanced Multvarate Statstcs wth Matrces, Srnger. KÜÇÜKÖNDER, H., EFE, E., AKYOL, E., ŞAHİN, M., ÜÇKARDEŞ, F., 004, Çok Değşkenl İstatstksel Analzlern Hayvancılıkta Kullanımı, 4. Ulusal Zootekn Blm Kongres. LEVINE, R. A., OHMAN, P. A., 997, Reeated Challenge Studes: A Comarson Of Unon-Intersecton Testng Wth Lnear Modelng, Psychometrka, 6, 3, 435-455. LIPOVETSKY, S., TISHLER, A., CONKLIN, W. M., 00, Multvarate Least Squares And Its Relaton To Other Multvarate Technques, Aled Stochastc Models In Busness And Industry, 8, 347 356. MALLOWS, C., L., 973, Some Comments on CP, Technometrcs, 5 (4), 66 675. MONTGOMERY, D. C., PECK, E. A., VINING, G. G., 00, Introducton To Lnear Regresson Analyss, Thrd Edton, John Wley & Sons, New York. ÖZDAMAR, K., 999, Paket Programlar İle İstatstksel Ver Analz, Kaan Ktaev, Eskşehr. ÖZDAMAR, K., 999, Paket Programlar İle İstatstksel Ver Analz, Kaan Ktaev, Eskşehr. PHAM-GIA, T., 008, Exact Dstrbuton of The Generalzed Wlk s Statstc and Alcatons, Journal of Multvarate Analyss, 99, 698 76. RENCHER, A.C., 00, Methods Of Multvarate Analyss, Wley, New York. ROBERT, P., ESCOUFIER, Y., 976, A Unfyng Tool For Lnear Multvarate Statstcal Methods: The RV Coeffcent, Journal Of The Royal Statstcal Socety. Seres C (Aled Statstcs), 5, 3, 57-65. SARAÇLI, Z., SARAÇLI, S., 006, Eskşehr Osmangaz Ünverstes İİBF. Öğrenclernn Demografk Özellkler le Ünverste Sorunları Arasındak İlşknn Doğrusal Olmayan Kanonk Korelasyon Analz le İncelenmes, Eskşehr Osmangaz Ünverstes İİBF Dergs, (), 7-38, Eskşehr. 0
SCLOVE, S. L., 97, Imroved Estmaton of Parameters n Multvarate Regresson. Sankhya, Ser. A, 33, 6-66. SRIVASTAVA, M. S., 979, An Introducton To Multvarate Statstcs, New York:North Holland, New York. SRIVASTAVA, M. S., KUBOKAWA, T., 005, Mnmax Multvarate Emrcal Bayes Estmators Under Multcollnearty, Journal of Multvarate Analyss, 93, 394 46. ŞAHİNLER, S., 000, En Kareler Yöntem le Doğrusal Regresyon Model Oluşturmanın Temel Prensler, Mustafa Kemal Ünverstes Zraat Fakültes Dergs -5, 57-73. TEKİN, M., 993, Kanonk Korelasyon Analz ve Br Uygulama, İstanbul Ünverstes Sosyal Blmler Ensttüsü Doktora Tez, İstanbul. TIMM, N.H., 00, Aled Multvarate Analyss, Srnger, New York. 0
ÖZGEÇMİŞ 984 yılında Adana da doğdum. 996 yılında Tatbkat İlkokulunu (şu ank sm Manas İlköğretm Okulu), 999 yılında Özel Ortadoğu Kolejn, 00 yılında Yüreğr İncrlk Lsesn btrdm. 003 yılında Çukurova Ünverstes Fen Edebyat Fakültes Matematk Bölümünde lsans öğrenmme başladım. 007 yılında bu bölümden mezun olduktan sonra aynı yıl Çukurova Ünverstes İstatstk Bölümünde yüksek lsans öğrenmme başladım. Halen bu bölümde yüksek lsana öğrenmme devam etmekteym. 03
EKLER EK λ ler Ε Η ın özdeğerler olmak üzere Wlk s lamda s Ε Λ= = çn Ε+Η + λ = krtk değerler. ( a = 0 3 ü göstermektedr.) 04
05
06
07
08
09
0
EK Lawley Hotellng test statstğ v v E (s) U H çn üst yüzdelk noktalar
3
4
EK 3 λ, Ε Η matrsnn en büyük özdeğer olmak üzere θ λ = le verlen Roy un test + λ v v = = = H dr. H E statstğ. Parametreler m, N, s mn ( v, ) 5
6
7
EK 4: λ ler Ε Η ın özdeğerler olmak üzere Plla s statstğ V değerler ( s) = λ s = + λ çn krtk 8
9