KATEGORĠK VERĠLER ĠÇĠN LOGARĠTMĠK DOĞRUSAL MODELLER VE GÖÇ ĠSTATĠSTĠKLERĠ ÜERĠNE BĠR UGULAMA* ÖET Snan METE ** Aydın ÜNSAL *** İ yönlü olumsallı tablolarında statst çıarsamalar çn Pearson un -are statstğ yeterl olmata anca daha büyü boyutlu olumsallı tablolarında bu statst ullanılamamatadır. Üç veya daha ço boyutlu olumsallı tablolarında lş yapılarının belrlenmes çn değşenler arasında bağımlı bağımsız ayrımı yapmayan Logartm Doğrusal Modeller ullanılablr. Logartm Doğrusal Modeller yardımıyla daha ço değşen arasında etleşmler sorgulanablmetedr. Bu çalışmada Logartm Doğrusal Modeller ncelenmş ve göç statstler üzerne br uygulama yapılmıştır. Anahtar Kelmeler: Kategor Ver, Olumsallı Tabloları, Logartm Doğrusal Modeller ABSTRACT In two-ways contngency tables, Pearson s ch-square statstcs s enough for statstcal nferences but can t used n bgger contngency tables. For determnng assocaton structures n three-ways or bgger contngency tables, Log-Lnear Models can be used, whch doesn t dscrmnate varables as dependent or ndependent. Interactons between many varables can be nterrogated wth log-lnear models. In ths study, Log-Lnear Models are nvestgated and an applcaton on mgraton statstcs had done. Keywords: Categorcal Data, Contngency Tables, Log-Lnear Models 1. GĠRĠġ Sosyal blmlerde yapılan çalıģmalarda değģenlern ntelğ, statst çıarsamaları ve analzler çoğu zaman sınırlandırmatadır. Ntel değģenlern ullanılmasının zorunlu olduğu bu dallarda verler, parametr ten varsayımlarını çoğunlula sağlamadığı çn parametr testlerle analz edlemez. * Bu çalıģmada, 009 yılında Gaz Ünverstes SBE Eonometr ABD. da Prof. Dr. Aydın ÜNSAL danıģmanlığında hazırlanan ve abul edlen Kategor Ver Analz öntemler ve Uygulamalar baģlılı dotora tezmn lgl bölümünden yararlanılmıģtır. ** ArĢ.Gör.Dr., Asaray Ünverstes. Ġ.Ġ.B.F. ĠĢletme Bölümü, Sayısal öntemler ABD, snanmete@hotmal.com *** Prof. Dr., Gaz Ünverstes Ġ.Ġ.B.F. Eonometr Bölümü, aunsal@gaz.edu.tr
10 Snan Mete, Aydın Ünsal DeğĢenlern ölçümler III. (eģt aralılı) ve IV. (oranlı) ölçüm düzeylernde yapıldığında analzlerde parametr tenler ullanılıren, düģü ölçüm düzeyler olara tanımlanan sınıflama (nomnal) ve sıralama (ordnal) ölçüm düzeyler söz onusu olduğunda parametr olmayan tenlern ullanılması zorunlu olmatadır. Sınıflama veya sıralama ölçüm düzeyleryle ölçüleblen verler Kategor Ver olara adlandırılmatadır, anca üçü doğal sayı değerler alan eģt aralılı ölçme düzeynde ölçülmüģ verler çn de bazı durumlarda Kategor Ver tanımı yapılıp, parametr olmayan tenler ullanılır. ġel 1: Kategor Ver Tanımı Kayna: Powers ve e, 000;7. Kategor verlern analznde l aģama, verler en yaygın fade bçm olan çapraz-sınıflandırılmıģ (ontenans) tablo üzernde toplanmalıdır. Kategor değģen sayısının olduğu durumda, değģenlerden br satırda, dğer se sütunda olma üzere -yönlü çapraz sınıflandırma tablosu oluģturulur. Ġ değģenden oluģan yönlü çapraz sınıflandırma tablosundan hareetle, değģen arasında lģy test etme çn, Pearson un statstğ veya l defa Wls tarafından hesaplanan G olablrl oran statstğ ullanılır. alnızca değģen arasında lģ olup olmadığını araģtıran Pearson n f test statstğnde göze freansları le tahmn edlen belenen freansları arasında far date alınır ve belenen değerler hesaplanıren değģenlern brbrnden bağımsız olduğu varsayılır. n f f
Asaray Ünverstes İİBF Dergs, Oca 010, Clt:, Sayı: 1 11 Asmptot olara dağılımı gösteren ve tam bölüneblme özellğne sahp olduğu çn de Pearson test statstğne arģı üstünlü sağlayan olablrl oran statstğ de G n olara fade edleblr. n ln f Sadece ategor değģenn bulunduğu -yönlü tabloların analz Pearson veya G olablrl oran statstğ ullanılara yapılıren, veya den fazla değģenden oluģan ço-yönlü tabloların analz çn logartm doğrusal modeller ullanılır.. LOGARĠTMĠK DOĞRUSAL MODELLER Ġ ategor değģenden oluģan yönlü çapraz sınıflandırılmıģ tablolarda değģenler arası lģ Pearson veya G olablrl oran statstler yardımıyla test edlmete en, üç veya daha fazla değģenden oluģan ço-boyutlu tabloların analz çn genellle standart yol zlenmģtr (Brcan ve ıldız, 1993; 4); 1. ol: Ço boyutlu tablodan, mümün olan -boyutlu marnal toplamları elde edere ayrı ayrı analz etme. Bu metod, değşenler arasında lş haında belrl br doğruluta blg sağlamala brlte, aşağıda mahsurları da taşımatadır: o Dğer değģenler date alındığında, lģl ategor değģen çftler arasında marnal lģy tam ayıramaz. o DeğĢenler arasında üç fatör ve daha yüse derecel o G nterasyonların varlığını hmal eder. Tüm l lģlern aynı zamanda denenmelerne müsaade etmez.. ol: Varyans analz gb, blnen bazı parametr metodları uygulama. Bu yolun rahatlıla uygulanablmes varyans analz varsayımlarından; x gözlemlernn varyansları homoen, gözlemlern normal dağılıģa uygun ve aynı zamanda toplanablrl varsayımlarının geçerl olması geremetedr. Çapraz sınıflandırılmıģ tablolarda değģenlere at verler, multnomal, bnom veya posson gb dağılımlara uygun olduğu çn, varsayımların çoğunu yerne getremezler. Bu varsayımları sağlayaca bazı transformasyonlar ala
1 Snan Mete, Aydın Ünsal gelmele brlte, yapılan bu transformasyonlar Ģartların tümünü sağlamayı baģaramamatadır. K-Kare tenğ sadece yönlü çapraz tablolarda ullanılmatadır. K- Kare tenğnn üç veya daha ço yönlü tablolarda etsz almasından dolayı ço yönlü tabloların analznde logartm doğrusal modeller ullanılmatadır. Ntel değģenlerden oluģan çapraz tabloların çözümlenmesnde logartm doğrusal modellern ullanımı üç amaca hzmet eder (Uygun, 1990;90); DeğĢenlern oluģturduğu bleģ dağılımı test etme; DeğĢenlern brbrlerne bağımlı olup olmadığını test etme, DeğĢenler arasında lģy sebep-sonuç lģsne dayandırmasızın test etme. DeğĢenler arasında lģ sebep-sonuç lģsne dayandırılara test edlme stenrse logartm doğrusal modellern daha spesf br görünümü olan logt model ortaya çımatadır (Acar, 000; 784). K-Kare tenğ le değģenler arasında lģ test edlren parametre tahmn yapılmaz, logartm doğrusal modellerde se br model oluģturulur ve modelde parametrelern tahmn yapılır. Gözlemlerle lgl uramsal çerçevey tanımlayan model den elde edlen parametreler, değģenlern bleģmn ya da etleģmn tanımlamatadır (Mete, 009; 3). Log-lneer modeller ategor değģenlern analznde sılıla ullanılan br yöntemdr. Daha ço veya daha fazla ategorl den fazla değģenn (ço yönlü ontenans tablolarının) analznde ullanıldığından Ço-önlü Freans Analz olara da adlandırılmatadır. Log-Lneer Modeller, ontenans tablolarının hücrelernde yer alan freansların, değģenlern ategorlerne ne adar bağlı olduğunu ortaya çıaran, ategor değģenler arasında lģler ve etleģmler nceleyen modellerdr (Çlan, 009;153). Log-lneer modellerde parametrelern tahmn edclern bulablme çn odds oranlarından yararlanılır. Odds, herhang br değģenn br seçeneğnde bulunan freansın aynı değģenn dğer seçeneğnde freansına oranı Ģelnde tanımlandığında, btģ satırlardan (satır ve satır +1) ve btģ sütunlardan (sütun ve +1) düzenlenen ve belenen freansları esas alan alt tablolar çn uygun odds oranı ( 1,,..., I 1 ve 1,,..., J 1) le gösterldğnde F F F, 1 1, 1 F 1,
Asaray Ünverstes İİBF Dergs, Oca 010, Clt:, Sayı: 1 13 olara hesaplanır. Denlemde tanımlanan ( I 1) ( J 1) oddsoranları le, I J tablosundan düzenlenen herhang dğer alt tablolara at olan odds-oranları belrleneblr (Bayram, 000; 63). Logartm doğrusal model bağımlı ve bağımsız değģen ayrımı yapmaz. Ġncelenece rter belenen hücre freanslarıdır (Green vd., 1977; 54). Logartm doğrusal modellerde parametre sayısı, değģen sayısı (d) ye d bağlı olara den hesaplanır. Ġ boyutlu modeller çn ( ) dört adet 3 parametre bulunuren, üç boyutlu modelde parametre sayısı ( ) sez adet olur..1. Ġ Boyutlu Tabloların Analz Her br düzeye sahp ategor değģen değerlernn br satırda, dğer sütunda olma üzere boyutlu br çapraz sınıflandırılmıģ tabloda gösterldğn düģünelm. Bu tablo çn logartm doğrusal model Ln( F ) A B AB bçmndedr. DoymuĢ model olara adlandırılan (1) numaralı model hem tel hem de l etleģmler çermetedr; Ln( F ) : Tabloda gözes çn belenen freansların doğal logartması, : Belenen freansların doğal logartma değerlernn ortalaması, A : A değģennn ana ets, B : B değģennn ana ets, AB AB : A ve B değģenlernn etleģm ets. parametresnn 0 değern alması, A değģen le B değģennn bağımsız olmasını fade eder ve (1) numaralı model, Ln( F ) bçmnde, doymamıģ br modele dönüģür. A B Logartm doğrusal modellerde yüse derecel br termn modelde bulunduğu zaman, daha düģü derecel tüm termlern de modelde yer aldığı türde lģler hyerarş olara ntelendrlr. HyerarĢ br logartm doğrusal modelde, br parametres sıfıra eģt se, daha yüse derecel tüm (1) ()
14 Snan Mete, Aydın Ünsal parametreler de sıfıra eģt olur. Eğer, parametres sıfırdan farlı se, daha düģü derecel tüm parametreler de sıfırdan farlıdır. Örneğn; Ln( ) (3) F A AB model hyerarģ olmayan br modeldr, çünü parametres modelde B bulunmasına rağmen ana etleģm term modelde yer almamatadır... Üç Boyutlu Tabloların Analz Üç değģenn yer aldığı br çapraz sınıflandırma tablosu çn doymuģ logartm doğrusal model; dr. LnF AB (4),, gb üç değģen çeren çapraz sınıflandırma tablosundan hyerarģ olara elde edleblece logartm doğrusal modeller aģağıda gb sıralanablr; Tam bağımsızlı model; LnF (5) ısm bağımsızlı çeren modeller; LnF LnF LnF oģullu bağımsızlı çeren modeller; LnF LnF LnF tüm l etleģmler çeren model se; dr. LnF
Asaray Ünverstes İİBF Dergs, Oca 010, Clt:, Sayı: 1 15, Bu hyerarģ modellerde, genel ortalamayı,, l etleģmler ve,, de üçlü etleģm gösterr. ana etler, Ġstatstsel paet programları hyerarģ olmayan modeller test edememetedr. Çünü hyerarģ olmayan modeller arasından seçm çn br statstsel süreç sağlanamamatadır. Bunun sebeb se br etleģm termnn anlamlı olmadığı durumlarda, daha yüse derecel etleģmlern anlamlı olup olmadığının yorumunun anlam taģımamasındandır. (Oğuzlar, 004;37) Üç yönlü hyerarģ br logartm doğrusal model çn test edlmes gereen baģlıca hpotezler Ģunlardır; H : 0 (6) H : 0 = 0 (7) H : 0, H : 0, H : 0, H : 0, H : 0, = 0 (8) = 0 (9) = = = = = 0, = = 0, = = 0, =0 (10) =0 (11) =0 (1) H 0 : 0, = = = 0, = = = 0 (13) Logartm Doğrusal modellerde test edlen değģen ve oluģturulan hpotez sayısı ço fazladır. Bu nedenle örnelem hacmnn üçü seçlmes sonuç elde etmey güçleģtreceğnden büyü hacml örnelemlerle çalıģılması geremetedr. Bu doğrultuda örnelem hacmnn tabloda hücre sayısının en az 5 atı olması önerlmetedr (Agül, 1997; 408)..3. En Ġy Modeln Seçm EtleĢmlern test edlmesnde farlı yalaģım söz onusudur. Örneğn üç değģen çeren üç yönlü çapraz sınıflandırılmıģ tablolar çn (4) numaralı doymuģ modelden baģlayara, abul edleblr düzeye gelnceye adar yüse dereceden etleģm termlernn modelden atılması le en uygun modele ulaģılablr. Dğer yalaģımda se, baģlangıç model (5) numaralı tam bağımsızlı modeldr. Bu modele abul edleblr düzeye ulaģılana adar etleģm termler elenere en uygun model elde edleblr. Brden fazla modeln anlamlı çıması durumunda, hang logartm doğrusal modeln seçlen değģenler arasında lģy doğru fade ettğn belrlemede uyum ylğ testler ullanılır. ve G olablrl oran test
16 Snan Mete, Aydın Ünsal statstler en ço ullanılan uyum ylğ testlerdr. statstğ, G I J K f ln f / Fˆ 1 1 1 gb hesaplanablr. G olablrl oran test M 1 ve M model olsun. M 1, M ye göre daha bast br model olma Ģartıyla modelden hangsnn uygun log-lneer model olduğuna olablrl oran test statstler arasında far alınara arar verlr. KoĢullu olablrl oran test statstğ adı verlen bu test statstğ, G M / M G M G M 1 1 düzenlenen sıfır hpotez altında v1 v serbestl dereces le asmptot olara dağılır. Üç yönlü tablolar çn yorumlanan logartm doğrusal modeller daha fazla değģen çeren tablolar çn de genģletleblr. Anca değģen sayısının artması, lģ ve etleģm termlernn yorumlanmasını, test edlmes gereen hpotezlern oluģturulmasını ve en y model seçm sürecn daha armaģı ve zor yorumlanablr br hale somatadır. 3. UGULAMA ÇalıĢmada, Em 000 tarhnde Türye de yapılan ondördüncü genel nüfus sayımının göç le lgl blgler ullanılmıģtır. Türye Ġstatst Kurumu nun (TÜĠK) yaptığı nüfus sayımının göç le lgl detayları 005 yılında, Genel Nüfus Sayımı 000 Göç Ġstatstler adlı br aynata toplanara basılmıģtır. Sayım gününde dam ametgah yer le sayımdan beģ yıl önce dam ametgah yer farlı olan Ģler, göç eden nüfus olara tanımlanmıģtır. Bu tanım gereğ, göç eden nüfus, 6 ve daha yuarı yaģta nüfusu apsamatadır. (TÜĠK, 005;7) ÇalıĢmada verler, 1985-000 yılları arasında göç statstlernden alınmıģtır. Uygulamada değģenler (göç türü, cnsyet, ouma yazma) ve bu değģenlern ategorler aģağıda gbdr. Göç Türü Cnsyet Ouma azma ġehrden ġehre Ere Ouma azma Blen Köyden ġehre Bayan Ouma azma Blmeyen ġehrden Köye Köyden Köye G
Asaray Ünverstes İİBF Dergs, Oca 010, Clt:, Sayı: 1 17 1985-000 yıllarında toplam 6.579.460 Ģ (6 yaģ ve yuarısı) göç etmģtr. Göç edenlern; Göç Türü, Cnsyet ve Ouma azma değģenlerne göre yerleģtrldğ üç-yönlü çapraz tablo 0.05 yanılma düzeynde, SPSS for Wndows 15.0 paet programı yardımıyla Logartm Doğrusal modellerle analz edlmģtr. Öncelle üç yönlü tabloda ana et, nc dereceden etleģm ve üçüncü dereceden etleģm termlernn anlamlılığı ncelenmģtr. Tablo 1: Göç Türü, Cnsyet ve Ouma azma DeğĢenler Ġçn K önlü EtleĢm Özet Tablosu Tablo 1 de l ısmın brnc satırı, bütün brnc ve daha üst derecel etlern 0 a eģt olduğu, yan ana etler ve daha büyü etlern (l ve üçlü), sıfır olduğu hpotezn, H : 0, 0 = = = 0, = = = 0 test eder. Gere olablrl oran, gerese Pearson K-Kare test statstlernn yüse, ve p değernn 0.000 olması sonucunda ( p = 0.000 < 0.05), sıfır hpotez reddedlr. Ġnc satırda se, bütün nc dereceden ve üçüncü dereceden etlern sıfıra eģt olduğu hpotez, H : 0, = = = 0 yüse olablrl oran ve Pearson K-Kare test statstler ve 0.000 olan p değer ( p = 0.000 < 0.05) le reddedlr. Tablo 1. n l ısmının son satırında se, H : 0
18 Snan Mete, Aydın Ünsal hpotez, yan üçlü etleģmn sıfıra eģt olduğu hpotez, 0.000 olan p değer (p = 0.000 < 0.05) le reddedlr. Tablo 1 n nc ısmı se, sırasıyla; brnc, nc ve üçüncü dereceden etlern sıfıra eģt olduğu hpotezlern test eder. Bu hpotezler, test statst sonuçlarının yüse olması ve 0.000 olan p değer (p = 0.000 < 0.05) le reddedlr. Modelde yer alaca nc dereceden etleģm parametrelern tespt etme çn aģağıda Tablo den ısm lģ testler nceleneblr. Tablo de nc dereceden etleģm parametreler ncelendğnde, cnsyet-eğtm, cnsyet-göç türü ve eğtm-göç türü değģenler çn ısm lģ parametreler statstsel olara anlamlı bulunmuģtur. Tablo : Göç Türü, Cnsyet ve Ouma azma DeğĢenlernn EtleĢm Düzeylerne At K-Kare ve Olasılı Değerler Tablo de ana etler gösteren cnsyet, eğtm ve göç türü değģenlerne at parametre tahmnler 0.05 yanılma düzeynde statstsel olara anlamlı bulunmuģtur. Tablo 1 ve Tablo den elde edlen sonuçlar, aģağıda model parametre tahmnlernn yer aldığı Tablo 3 ten de görüleblr.
Asaray Ünverstes İİBF Dergs, Oca 010, Clt:, Sayı: 1 19 Tablo 3: Göç Türü, Cnsyet ve Ouma azma DeğĢenlernn Parametre Tahmnler Tablo 3 te p değerlernn tamamına yaını sıfır çımıģ ve hemen hemen değģenlern her düzeynde etleģmlern sıfırdan farlı olduğu hpotez reddedlmģtr. 4. SONUÇ Kategor verlerle çalıģılan alanlarda, verler parametr test varsayımlarını geçemedğ çn parametr analzler yapılamamatadır. Kategor değģen arasında lģ olup olmadığı -are analz le test edleblren, den fazla değģen barındıran ço-yönlü tabloların analznde -are analz ullanılamamatadır. Kategor verlerden oluģan ço-yönlü tabloların analz çn logartm doğrusal modeller, bağımlı-bağımsız ayrımı yapmasızın, değģenler arasında lģ olup olmadığını test edeblmetedr. Logartm doğrusal modellern spesf br türü olan Logt modeller değģenler arasında bağımlı-bağımsız ayrımı yapara, lģler test etmetedr. ÇalıĢmada, -yönlü ve üç-yönlü çapraz tabloların logartm doğrusal modellerle analz edlmes teor olara açılanmıģ ve 1985-000 yılları arasında göç statstlernden derlenmģ br üç-yönlü tabloya uygulanmıģtır. Uygulamada ele aldığımız üç-yönlü tablonun, logartm doğrusal modelle analz edlmes sonucunda gere üçüncü dereceden etleģm ve gerese nc dereceden etleģmlern sıfırdan farlı olduğu hpotezler reddedlmģ ve doymuģ br model elde edlmģtr.
0 Snan Mete, Aydın Ünsal 5. KANAKLAR ACAR, Fatma. (1999). Çapraz Tabloların Çözümlenmesnde Logartm Doğrusal Modellern Kullanımı, IV. Ulusal Eonometr ve Ġstatst Sempozyumu Bldrler, 14-16 Mayıs, Antalya, (s:783-799). AKGÜL, Azz. (1997). Tıbb Araştırmalarda İstatstsel Analz Tenler - SPSS Uygulamaları. üseöğretm Kurulu Matbaası, Anara. BARAM, Nuran. (000). Kategor Verlern Log-Lnear Modellerle Analz. Uludağ Ünverstes İ.İ.B.F. Dergs, 19, 1-, (s:61-67). BĠRCAN, Hüdaverd ve ILDI, Necat. (1993). Üç-Boyutlu Çapraz- SınıflandırılmıĢ Kategor Verlere Log-Lneer Modellern Uydurulması, Atatür Ü. raat Faültes Dergs 4 (), (s:1-35). ÇĠLAN, Çğdem Arıcıgl. (009). Sosyal Blmlerde Kategor Verlerle İlş Analz-Kontenans Tabloları Analz, Pegem Aadem, Anara. GREEN, P.E. vd. (1977). On the Analyss of Qualtatve Data n Maretng Research, Journal of Maretng Research, Vol: IV, (s: 5-59). METE, Snan. (009). Kategor Ver Analz öntemler ve Uygulamalar, Gaz Ünverstes Sosyal Blmler Ensttüsü, ayınlanmamıģ Dotora Tez, Anara. OĞULAR, AyĢe. (004). HyerarĢ Logartm Doğrusal Modeller Arasından En Uygun Modeln Seçm, Öner, C:6, S:1, (s:35-45). POWERS, Danel A. ve IE, u. (000). Statstcal Methods For Categorcal Data Analyss, Academc Press. U.S.A. TÜĠK. (005). ayın No:976, Genel Nüfus Sayımı 000 Göç İstatstler, TÜĠK Matbaası, Aralı. UGUN, Hamza. (1990). Çapraz Tabloların Çözümlenmes ve Log-Lnear Modeller, Hacettepe Ünverstes İtsad İdar Blmler Faültes Dergs, Clt:8, Sayı:1, (s:99-308).