Ç.Ü.Z.F. Dergisi, 2015, 30 (1) : 1 8 J.Agric. Fac. Ç.Ü., 2015, 30 (1) : 1-8 Çoklu Doğrusal Regresyon inde Değişken Seçiminin Zooekniye Uygulanışı G. Tamer KAYAALP (1) Melis ÇELİK GÜNEY (1) Zeynel CEBECİ (1) Öze Çoklu doğrusal regresyon analizinde, en uygun modeli belirlemek için klasik yönemler ve adımsal yönemler kullanılabilmekedir. Adımsal yönemler; ileriye doğru seçim yönemi, geriye doğru seçim yönemi ve adımsal seçim yönemidir. Klasik yönemlerde ise değişken seçimi için gelişirilmiş ölçülerden bazıları; belirme kasayısı (R 2 ), düzelilmiş belirme kasayısı, haa kareler oralaması ve Cook isaisiğidir. Bu çalışmanın amacı, yumura kabuk ağırlığı, yumura ak indeksi ve yumura sarı indeksi verileri ele alını, çoklu regresyonda adımsal yönemlerden en uygun modeli oraya koyarak yumura ağırlığı ahmini yamakır. Çalışmanın sonucunda üç adımsal yönemde de aynı modele ulaşılmışır. Kullanılan bağımsız değişkenlerin yumura ağırlığı ahmininde açıklayıcı olmadığı sonucuna varılmışır. Anahar kelimeler: Çoklu regresyon analizi, değişken seçimi, ileriye doğru seçim, geriye doğru seçim, adımsal seçim Variable Selecion in Mulile Regression Alicaion of Animal Science Absrac Generally wo grous of mehods are used for variable selecion in order o deermine he bes fi model in mulile linear regression analysis. Alernaively he sewise such as backward, forward and sewise mehods can be alied as new/efficien algorihms. While he well known crieria such as R 2, adjused R 2, MSE and Cook saisics are used for variable selecion. The urose of his sudy, egg shell weigh, aken u egg whies and yolk index, index daa, sewise mulile regression model is he mos suiable mehod of making egg weigh esimae uing ou. Three sewise mehod has also been achieved as a resul of he work of he same model. Egg weigh was concluded ha he argumens used o illusrae he esimaion. Key Words: Mulile regression analysis, variable selecion, forward, backward, sewise. Giriş Çoklu doğrusal regresyon modelinde amaç, bağımsız değişkenler (açıklayıcı değişkenler) ile bağımlı değişkendeki (ceva değişkeni) olam değişimi açıklamakır. Çoklu doğrusal regresyon analizinde, model oluşuran bağımsız değişkenlerden bazılarının modele kakısı önemsiz olabilir. Bu nedenle, bağımlı değişkeni "en uygun" şekilde açıklayacak bağımsız değişkenlerin belirlenmesi ve önemsiz değişkenlerin modelden çıkarılması gerekir. Bu sürece "değişken seçimi" denir (Alar, 2003). Regresyonda değişken seçimi ya da en iyi modelin oluşurulmasıyla ilgili çalışmalar Cox ve Snell (1974), Hocking (1972), Myers (1990) ve Thomson (1978a, 1978b) arafından yaılmışır. Değişken seçimi amacıyla değişik yönemler gelişirilmişir. Bu yönemler hesalama ekniklerine göre klasik yönemler ve adımsal yönemler olmak üzere iki grua incelenir. Adımsal yönemler ise; 1) İleriye doğru seçim yönemi 2) Geriye doğru seçim yönemi Yayın Kuruluna Geliş Tarihi: 04.12.2015 (1) Çukurova Üniversiesi Ziraa Fakülesi Zooekni Bölümü ADANA
Çoklu Doğrusal Regresyon inde Değişken Seçiminin Zooekniye Uygulanışı 3) Adımsal seçim yönemi olarak bilinir (Alar,2003). Bu çalışmada adımsal yönemler karşılaşırmalı olarak incelenmekedir. İleriye doğru seçim yöneminde, her defasında bir bağımsız değişken ilave edilerek en uygun regresyon modelinin bulunmasını arzu emekedir. Geriye doğru seçim yöneminde, ileriye doğru seçim yöneminden am ersi durum söz konusudur. üm bağımsız değişkenler ile başlamakadır. Adımsal seçim yöneminde ise hem ileriye doğru seçim yönemi hem de geriye doğru seçim yönemi aynı anda kullanılmakadır (Çakır Zeyinoğlu, 2007). Zooeknide bağımlı değişken olarak ele alınan bir faköre birçok unsur eki emekedir. Ancak bir çok araşırmacı ele alınan bir faköre eki eden unsurlardan kaç anesinin veya hangisinin regresyon modeline giri girmeyeceği konusunda ereddü emekedir. Bu nedenle regresyon analizinde ele alınan modelde, modele hangi bağımsız değişkenlerin gireceği konusu zooeknide büyük önem arz emekedir (Berberoğlu, 2002). Bu çalışmada yumura ağırlığını en iyi ahmin eden regresyon modelini bulmak için çoklu doğrusal regresyon modelinde değişken seçimi yönemleri karşılaşırmalı olarak incelenecekir. Maeryal ve Yönem Maeryal Bu çalışmada, Çukurova Üniversiesi, Ziraa Fakülesi, Zooekni Bölümü, Tavukçuluk İşlemesinden alınan yumuralar maeryal olarak kullanılmışır. 80 gün boyunca rasgele olanan yumuraların, iç kalie özelliklerinden ak indeksi ve sarı indeksi, dış kalie özelliklerinden ise kabuk ağırlığı değişkenleri incelenmişir. Tüm analizlerde SPSS 17.0 V. ake rogramı kullanılmışır. Çalışmada kullanılan veri seinde yumuranın aşağıdaki özellikleri bağımlı ve bağımsız değişken olarak kullanılmışır. Y: Yumura ağırlığı X 1: Kabuk ağırlığı X 2: Yumura ak indeksi (%) X 3: Yumura sarı indeksi (%) Yönem Poulasyon için çoklu doğrusal regresyon modeli, Y i=β 0+β 1 X i1 +β 2 X i2 +...+β k X ik +ε ij ; i=1,2,...n j=1,2,...k (1) şeklinde anımlanır. Eşilike; Y i:bağımlı değişkeninin gözlenen i.inci değerini X ij: j.inci bağımsız değişkenin i.inci düzeyindeki değerini β j: j.inci regresyon kasayısını ε ij : Haa erimini k: Bağımsız değişken sayısını gösermekedir (Guns ve Mason, 1980). En küçük kareler yönemi kullanılarak çoklu doğrusal regresyon modelindeki regresyon kasayısının ahminleri elde edilir ve Ŷ i =β 0 + β 1X i1+β 2X i2+...+β kx ik ; i=1,2,...n (2) şeklinde model oluşurulur (Mongomery ve ark., 2001; İyi ve Erol, 2008). İleriye Doğru Seçim Yönemi İleriye doğru seçim yöneminde değişken seçme işlemine modelde sadece sabi erimin bulunduğu denklemle başlanır ve değişkenler modele eker eker eklenir. e alınması düşünülen ilk bağımsız değişken, bağımlı değişken ile en yüksek korelasyona sahi değişkendir. Aynı zamanda bu değişken Y bağımlı değişkeni ile en yüksek F isaisiğine sahi değişkendir. Hesala bulunan F isaisiği α önem düzeyinde anlamlı ise, bu değişken modele alınır ve ileriye doğru seçim yönemi 2
Ç.Ü.Z.F. Dergisi, 2015, 30 (1) : 1 8 J.Agric. Fac. Ç.Ü., 2015, 30 (1) : 1-8 devam eder. Yaılan es sonucunda, bu değişken modele alınmazsa seçim süreci sona erer (Alar,2003). Geriye Doğru Seçim Yönemi İlk aşamada model içine üm değişkenler dahil edilir. Daha sonraki kademelerde her defasında bir ane olmak üzere en düşük kısmi F değerine sahi olan bağımsız değişken aılmak surei ile işleme devam edilir. Aılan değişkenin kakısı her seferinde es edilir. Aılan değişkenin kakısı isaisiki olarak önemli ise ama işlemi gerçekleşirilmez ve işlem orada durdurulur (Efe ve ark.,2000). Adımsal Seçim Yönemi Adımsal seçim yönemi, ileriye doğru seçim yöneminin düzenlenmesinden oluşur. e daha önce eklenen bağımsız değişken kısmi F isaisikleriyle yeniden değerlendirilir. e daha önceden eklenen bir bağımsız değişken daha sonraki adımlarda modelden çıkarılabilir (Mongomery ve ark., 2001). Bu yönemde amaç, Y bağımlı değişkenini ekileyebilecek bağımsız değişkenlerin neler olduğu eorik olarak belirlendiken sonra, bunlar arasından birbiriyle ilişkileri olmayan ve bağımlı değişkeni en çok ekileyen değişkenleri seçmekir. Adımsal seçim yöneminin en önemli yararı, çoklu doğrusal bağlanı sorununa çözüm geirmesidir (Işık, 2006). Adımsal seçim yönemine ilişkin sisemaik yaklaşım aşağıdaki şekilde özelenebilir. Bağımsız değişkenlerin ek ek bağımlı değişkenle aralarındaki basi doğrusal korelasyon kasayılarıyla, bağımsız değişkenler arasındaki basi doğrusal korelasyon kasayıları hesalanarak korelasyon marisi oluşurulur. Bu korelasyon marisi incelenerek korelasyon kasayısı en yüksek olan bağımsız değişken seçilir. Birinci adımda, bağımlı değişkeni en fazla ekilediği düşünülen bağımsız değişken modele dahil edilir. Bu bağımsız değişkenle bağımlı değişken arasındaki ilişkinin korelasyon kasayısının veya F esi seçilen anlamlılık düzeyi için uygulanır. İlişkinin anlamlı olduğu kabul edilirse, yani H 0: β 1 =0 şeklinde kurulan hioez reddedilirse o bağımsız değişken modelde kalır. İkinci adımda, kalan (k-1) ade bağımsız değişken içinden birinin bağımlı değişken Y 'yi önemli ölçüde ekileyen ikinci bağımsız değişken olarak seçilir. e giren değişken dışındaki üm bağımsız değişkenlerin kısmi korelasyonları hesalanır ve es edilir. Bu kısmi korelasyon kasayılarının incelenmesinin nedeni modelde mulaka kalması gereken en güçlü değişken sabi uulduğunda Y'yi en fazla ekileyen değişkeni bulmakır. Böylece ilk modele eklenen bağımsız değişken ile çoklu doğrusal bağlanısı olmayan ve aynı zamanda Y bağımlı değişkenini en fazla ekileyen bir değişken seçilmiş olacakır. Yaılan es sonucunda ilk modele giren bağımsız değişken ile yeni modele giren bağımsız değişken arasında olası düşük ilişki nedeniyle es isaisiği değişecekir. Bu değişim konrol edili, değişkenin modelde kalı kalmayacağına bakılmalıdır. Üçüncü adımda, ikinci adımda yaılan işlemlere benzer işlemler yaılır. e giren değişkenler dışındaki değişkenlere ai kısmi korelasyon kasayıları hesalanır ve es edilir. Bu süreç, seçilen anlamlılık düzeyinde ilişkiler anlamlı olduğu sürece üm değişkenler için ekrarlanarak modele giri girmeyeceğine karar verilir. İlişkiler anlamsız çıkığında model anlamlı ilişkiye sahi olan bağımsız değişkenler kadar değişkenle kalır (Keller ve ark., 1990; Orhunbilge, 1996; Mendenhall ve Sincich, 1996; Işık, 2006). Bağımsız değişkenlerin sürekli modele giri sonra ekrar çıkışını engellemek için önem seviyesi farklı alınmakadır. Bu çalışmada bağımsız değişkeni modele eklemede α =0.05, 3
Çoklu Doğrusal Regresyon inde Değişken Seçiminin Zooekniye Uygulanışı bağımsız değişkeni modelden çıkarmada ise α=0.10 alınmışır. Böyle yaılmasının ana nedeni modeli daha esnek uu haa ayını genişleerek modelde daha fazla değişken kalmasını sağlamakır. Araşırma Bulguları İleriye Doğru Seçim Yönemi İlk olarak Y bağımlı değişkeni ile X bağımsız değişkenler arasındaki basi doğrusal korelasyon marisine göre korelasyon kasayısı en yüksek bağımsız değişkenin bulunması gerekir. Çizelge 1' de görüldüğü gibi yüksek korelasyon kasayısı r yx1=0.658'dir. Ardından modelde X 1 değişkeni bulunuyorken regresyon analizi yaılır. Çizelge 1. Yumura verilerine ai korelasyon marisi Y X 1 X 2 X 3 Y 1.000 X 1 0.658 1.000 X 2 0.279 0.140 1.000 X 3 0.359 0.302 0.687 1.000 Çizelge 2. X 1 değişkeni modelde iken regresyon sonuçları Sandarlaşırılmamış B Sandar Haa Bea 1 Sabi 29.522 4.686 6.300.000 X 1 5.070.658.658 7.710.000 X 1 değişkenin anlamlılık düzeyi <0.05 olduğundan X 1 değişkeni modele alınır. Daha sonra X 1 değişkeni sabiken Y ile en yüksek kısmi korelasyona sahi bağımsız değişken X 2'dir. r y2.1= r y2 r 21 r y1 = 0.279 0.140 0.658 (1 r 2 21 ) (1 r 2 y1 ) (1 0.140 2 ) (1 0.658 2 ) =0.251 r y3.1= r y3 r 31 r y1 = 0.359 0.302 0.685 (1 r 2 31 ) (1 r 2 y1 ) (1 0.302 2 ) (1 0.658 2 ) =0.224 (3) Bu nedenle X 2 değişkeni modele alınacakır. Şimdi modelde X 1 ve X 2 değişkeni bulunuyorken regresyon analizi yaılır. Çizelge 3'e bulunan X 2'nin anlamlılık düzeyi <0.05 olduğu için X 2 değişkeni modele eklenecekir. Geriye sadece bağımsız değişken olarak X 3 kalmışır. Bu nedenle üm bağımsız değişkenler modelde iken regresyon analizi yaılır. Çizelge 4'e bakılarak X 3 bağımsız değişkeninin anlamlılık düzeyi > 0.05 olduğu için X 3 değişkenin modele giremeyeceği anlaşılır. Sonuç olarak bulunan model X 1 ve X 2 değişkenlerinden oluşan modeldir. R 2 =0.468 bulunmuşur. = 27.356+4.864 X 1 + 0.587 X 2'dir. Y i 4
Ç.Ü.Z.F. Dergisi, 2015, 30 (1) : 1 8 J.Agric. Fac. Ç.Ü., 2015, 30 (1) : 1-8 Çizelge 3. X 1 ve X 2 değişkeni modelde iken regresyon sonuçları Sandarlaşırılmamış B Sandar Haa Bea 1 Sabi 27.356 4.664 5.865.000 X 1 4.864.647.631 7.517.000 X 2.587.258.191 2.274.026 Çizelge 4. X 1, X 2 ve X 3 değişkeni modelde iken regresyon sonuçları Sandarlaşırılmamış B Sandar haa Bea 1 Sabi 25.710 5.323 4.830.000 X 1 4.738.678.615 6.992.000 X 2.429.355.140 1.211.230 X 3.086.132.078.650.518 Geriye Doğru Seçim Yönemi İlk olarak modele kakısı en az olan değişkeni bulmak gerekir. Çizelge 4'e büün bağımsız değişkenler modelde iken X 3 bağımsız değişkeninin önem seviyesi P>0.10 olması modele kakısını anlamsız kılar. Ancak Çizelge 4'e anlamlılık düzeyi 0.10' dan büyük X 2 değişkeni de yer almakadır. Bu nedenle X 3 değişkeni modelden aılmışken regresyon analizi uygulanır ve Çizelge 3'e görülen sonuçlar elde edilir. Hem X 1 hem de X 2 değişkeninin anlamlılık düzeyi 0.10'dan küçük olduğu için işlem sonlandırılır. SPSS ake rogramında geriye doğru seçim yönemi uygulanırsa Çizelge 5'deki sonuçlar elde edilir. Geriye doğru seçim yönemiyle R 2 =0.468 bulunmuşur. Sonuç olarak bulunan model X 1 ve X 2 değişkenlerinden oluşan modeldir. = 27.356+4.864 X 1 + 0.587 X 2'dir. Y i Çizelge 5. SPSS'de Geriye doğru seçim yönemi sonuçları R R 2 Düzelilmiş R 2 Sandar Haanın Tahmini 1.686.471.450 1.75921 2.684.468.454 1.75260 5
Çoklu Doğrusal Regresyon inde Değişken Seçiminin Zooekniye Uygulanışı Çizelge 5. SPSS'de Geriye doğru seçim yönemi sonuçları (devam) Sandarlaşırılmamış B Sandar Haa Bea 1 Sabi 25.710 5.323 4.830.000 X 1 4.738.678.615 6.992.000 X 2.429.355.140 1.211.230 X 3.086.132.078.650.518 2 Sabi 27.356 4.664 5.865.000 X 1 4.864.647.631 7.517.000 X 2.587.258.191 2.274.026 Adımsal Seçim Yönemi e alınacak değişken, bağımlı değişkenle en yüksek korelasyon kasayısına sahi olan değişkendir. Çizelge 1' de görüldüğü gibi yüksek korelasyon kasayısı r yx1=0.658'dir. Burada X 1 bağımsız değişken modele girmeye adaydır. de Y ve X 1 değişkeni bulunuyorken regresyon analizi yaılır. Çizelge 2'ye bakıldığında X 1 değişkenin anlamlılık düzeyi <0.05 olduğundan X 1 modele eklenecekir. Daha sonra X 1 değişkeni sabiken Y ile en yüksek kısmi korelasyona sahi bağımsız değişkeni bulmak gerekir. (3) numaralı eşiliğe bakılırsa; r y2.1=0.251'dir. Bu nedenle X 2 değişkeni modele girmeye adaydır. X 1 ve X 2 değişkeni modelde iken regresyon analizi yaılır. Çizelge 3'e göre X 2'nin anlamlılık düzeyi <0.05 olduğu için X 2 değişkeni modele eklenecekir. Ancak X 1'in anlamlılık düzeyi değişiği için modelden çıkarma durumu olu olmadığı için konrol edilmesi gerekmekedir. <0.10 olduğu için X 1 değişkeni modelde kalmaya devam edecekir. Geriye sadece bağımsız değişken olarak X 3 kalmışır. Çizelge 4'e bakılarak X 3 bağımsız değişkeninin anlamlılık düzeyi > 0.05 olduğu için X 3 değişkeni modele giremeyeceği anlaşılır. Sonuç model; X 1 ve X 2 değişkenlerinden oluşan modeldir. SPSS ake rogramında adımsal seçim yönemi uygulanırsa Çizelge 6'daki sonuçlar elde edilir. Adımsal seçim yönemiyle R 2 =0.468 bulunmuşur. Sonuç olarak bulunan model X 1 ve X 2 değişkenlerinden oluşan modeldir. Y i = 27.356+4.864 X 1 + 0.587 X 2'dir. Çizelge 6. SPSS'de Adımsal seçim yönemi sonuçları R R 2 Düzelilmiş R 2 Sandar Tahmini 1.658.432.425 1.79886 2.684.468.454 1.75260 Haanın 6
Ç.Ü.Z.F. Dergisi, 2015, 30 (1) : 1 8 J.Agric. Fac. Ç.Ü., 2015, 30 (1) : 1-8 Çizelge 6. SPSS'de Adımsal seçim yönemi sonuçları (devam) Sandarlaşırılmamış B Sandar Haa Bea 1 Sabi 29.522 4.686 6.300.000 X 1 5.070.658.658 7.710.000 2 Sabi 27.356 4.664 5.865.000 X 1 4.864.647.631 7.517.000 X 2.587.258.191 2.274.026 Tarışma ve Sonuç Bu çalışmada incelenen veri seinde, ileriye doğru seçim yönemi, geriye doğru seçim yönemi ve adımsal seçim yönemi incelenmişir. Üç yönemle de aynı modele ulaşılmışır. Tahmin modeli Y i = 27.356+ 4.864 X 1 + 0.587 X 2 olarak bulunmuşur. Kabuk ağırlığı ve yumura ak indeksi sıfır iken ahmini yumura ağırlığı 27.356 gr olması beklenmekedir. Ancak gerçeke böyle bir durum olmayacağından 27.356 değeri, biyolojik olarak anlamlı bir değer değildir. Tahmin için gerekli bir kesme nokası arameresi olarak değerlendirilir. lerde R 2 =0.468 ora düzeyde bir açıklama değeridir. Bu da yumura ağırlığını belirlemede başka değişkenlerin olacağını işare emekedir. Kaynaklar Alar, R. (2003) Uygulamalı Çok Değişkenli İsaisiksel Yönemlere Giriş 1. 2. Baskı, Nobel Basımevi, Ankara. Berberoğlu, E. (2002) Değişken Seçimi Yöneminin Kullanımı İle Belirlenmesinin Zooekniye Uygulanışı. Yüksek Lisans Tezi, Gaziosmanaşa Üniversiesi. Cox, D. R., Snell, E. J. (1974) The Choice of Variables in Observaional Sudies, Al. Sais., 23, 51-59. Çakır Zeyinoğlu, F. (2007) İşlemelerin Dönen Varlıklarının Saışlar Üzerindeki Ekileri: En İyi Regresyon Denkleminin Seçimi ve Sekörel Karşılaşırma. Marmara Üniversiesi İ.İ.B.F. Dergisi, 23 (2) : 331-349. Efe, E., Bek, Y., Şahin, M. (2000) SPSS'de Çözümleri ile İsaisik Yönemler II, Kahramanmaraş Süçüimam Üniversiesi Rekörlüğü Yayın No:10, Kahramanmaraş. Guns, R.F., Mason, R.L. (1980) Regression Analysis and Is Alicaions, Marcel Dekker, New York. Hocking, G. (1972) Crieria for Selecion of a Subse Regression: Which one should be used. Technomerics, 14, 967-970. Işık, A.(2006) Uygulamalı İsaisik-II. Bea Basım, İsanbul. İyi, P., Erol, H. (2008) Çoklu Lineer Regresyonda En İyi Seçimi. Ç.Ü. Fen Bilimleri Ensiüsü, 17 (5) :48-56. Keller, G., Warrack, B., Barel, H. (1990) Saisics for Managemen and Economics. A Sysem Aroach. 2 nd 7
Çoklu Doğrusal Regresyon inde Değişken Seçiminin Zooekniye Uygulanışı Ed. Wadsworh Publishing Comany. Belmon, California. Mendenhall, W., Sincich, T. (1996) A Second Course in Saisics: Regression Analysis. 5h Ediion. Simon and Schuser / A Viacom Comany. USA. Myers, R. H. (1990) Classical and Modern Regression wih Alicaions, 2nd ed., PWS-Ken Publishers, Boson. Mongomery, D.C., Peck, E.A., Vining, G.G. (2001) Inroducion o Linear Regression Analysis, 3rd Ediion, John Wiley & Sons, New York. Orhunbilge, N. (1996) Uygulamalı Regresyon ve Korelasyon Analizi. İ.Ü.İşleme Fakülesi, Yayın No: 267, İsanbul. Thomson, M. L. (1978a) Selecion of variables in mulile regression: Par I. A review and evaluaion,in. Sais. Rev., 46: 1-19. Thomson, M. L. (1978b) Selecion of variables in mulile regression: Par II. Chosen rocedures, comuaions and examles, In. Sais. Rev., 46: 129-146. 8