T.C. MARMARA ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ EKONOMETRİ ANABİLİM DALI İSTATİSTİK BİLİM DALI

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "T.C. MARMARA ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ EKONOMETRİ ANABİLİM DALI İSTATİSTİK BİLİM DALI"

Transkript

1 T.C. MARMARA ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ EKONOMETRİ ANABİLİM DALI İSTATİSTİK BİLİM DALI REGRESYON ANALİZİNDE ROC EĞRİSİ KESTİRİMİ İLE MODEL SEÇİMİ Yüksek Lisans Tezi BURCU KÖKSAL İstanbul, 2011

2 T.C. MARMARA ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ EKONOMETRİ ANABİLİM DALI İSTATİSTİK BİLİM DALI REGRESYON ANALİZİNDE ROC EĞRİSİ KESTİRİMİ İLE MODEL SEÇİMİ Yüksek Lisans Tezi BURCU KÖKSAL Danışman: DOÇ. DR. AHMET METE ÇİLİNGİRTÜRK İstanbul, 2011

3

4 ÖZET Regresyon analizi ile elde edilen doğrusal ve doğrusal olmayan model kestirimleri için model etkinliklerinin değerlendirilmesinde yararlanılan çeşitli model seçme ölçütleri mevcuttur. Bu çalışmada, temelde doğrusal olmayan ancak bazı dönüşümlerle doğrusallaştırılabilen lojistik regresyon modelleri için sıklıkla kullanılan model seçme ölçütlerine seçenek olarak ROC eğrisi kestiriminin kullanılabilirliği incelenmiştir. Uygulama çalışmasında yeni araştırmalar aracılığıyla sürekli gelişim gösteren ve güncelliğini koruyan, tüm dünyada olduğu gibi Türkiye de de önemi son yıllarda giderek artan bir konu olan mutluluk kavramı ele alınmıştır. Türkiye de mutluluk algısını etkileyen sosyo-demografik unsurlar öznel ve nesnel gösterge ayrımında değerlendirilmiştir. Bu amaçla nesnel ve öznel göstergeler kullanılarak nesnel, öznel ve karma model kestirimleri elde edilmiştir. Farklı model seçme ölçütlerine göre yapılan değerlendirmede ROC eğrisi kestirimi, kestirilen modeller arasından en iyi ayırım gücüne sahip olan modelin belirlenmesinde en uygun seçim ölçütü olarak saptanmıştır. Mutlulukla ilgili mevcut çalışmalarda çoğunlukla nesnel göstergelerden yararlanıldığı görülmüştür. Mevcut çalışma sonuçları ile uygulama sonuçları birlikte ele alınırsa, kişisel algıya göre farklılık gösteren mutluluk kavramı değerlendirilirken algıya dayalı olan öznel göstergelerin de dikkate alınmasının yararlı olacağı söylenebilir. Anahtar Kelimeler: Lojistik Regresyon Analizi, Model Seçimi, ROC Eğrisi, Mutluluk.

5 ABSTRACT There are several model selection criteria which are used in evaluating the efficiency of linear and nonlinear models that are obtained by regression analysis. In this study, the availability of the ROC curve estimation was examined as an alternative option to commonly used model selection criteria for the logistic regression models, which are essentially nonlinear but can be linearized with some transformations. The notion of the happiness, which is a continuously improving and keeping up-to-date subject whereby the new researches and has an increasing importance in all over the world as well as in Turkey, was discussed in the application study. The sociodemographic factors affecting the perception of happiness in Turkey were evaluated at the separation of the subjective and objective indicators. For this purpose, objective, subjective and mixed model estimations were derived from the objective and subjective indicators. Based on the evaluation which was made according to the different model selection criteria, the ROC curve estimation was determined as the most appropriate model selection criterion which specifies the model that has the best discrimination power among the other estimated models. Mostly objective indicators were employed in the existing studies that are related to the happiness. If the results of the application and existing studies taken together, it can be said that it is useful to consider the subjective indicators, which are based on the individual perception, in evaluating the notion of happiness which varies according to the perception. Keywords: Logistic Regression Analysis, Model Selection, ROC Curve, Happiness.

6 TEŞEKKÜR Tez çalışmam süresince yorum ve yönlendirmeleri ile her zaman destek olarak motivasyonumu yüksek tutmamı sağlayan değerli danışmanım Doç. Dr. Ahmet Mete Çilingirtürk e; tez konumu belirlememde yol gösteren Doç. Dr. Nural Bekiroğlu na; ayrıntılı açıklamaları ile konuya ilişkin kuramsal eksikliklerimi gidermeme yardımcı olan Dr. Mithat Gönen e ve Doç. Dr. Mevlüt Türe ye; ilk uygulama tasarımda kısıtlı zamanını ayırıp teknik bilgilendirmede bulunan ve veri sağlama konusunda destek olan Opr. Dr. Kürşat Çağın a ve Benan Temizsoy a; ikinci uygulama çalışmama ilişkin çeşitli bilgilendirme ve yönlendirmelerde bulunan Ord. Prof. Dr. Ruut Veenhoven a; desteği ile sürekli varlığını hissettiren değerli dostum Elif Şentürk e ve son olarak her koşulda yanımda olan, maddi-manevi destek vererek her konuda anlayış gösteren aileme içtenlikle teşekkür ederim. İstanbul, 2011 Burcu Köksal

7 İÇİNDEKİLER Sayfa No. TABLO LİSTESİ... vi ŞEKİL LİSTESİ... ix KISALTMALAR... x SİMGELER... xii GİRİŞ REGRESYON ANALİZİ Regresyon Modelleri Kestirim Yöntemleri En Küçük Kareler (EKK) Yöntemi En Çok Olabilirlik (EÇO) Yöntemi Hata Terimini Ortaya Çıkaran Nedenler ve Varsayımlar Hata Terimini Ortaya Çıkaran Nedenler Hata Terimine İlişkin Varsayımlar Model Seçimi Değişken Seçme Teknikleri Model Seçme Ölçütleri ROC EĞRİSİ ANALİZİ ROC Eğrisi Analizinde Kullanılan Temel Kavramlar ROC Eğrisinin Özellikleri ROC Eğrisinin Değerlendirilmesinde Yararlanılan Göstergeler AUC Parametrik Yaklaşıma Göre AUC Kestirimi Parametrik Olmayan Yaklaşıma Göre AUC Kestirimi Yarı Parametrik Yaklaşıma Göre AUC Kestirimi Tekil Noktalar ve Parçalı Alanlar Youden Indeksi En Yüksek Dikey Uzaklık ROC Eğrisi Analizinin Kullanım Alanları En İyi Ayırım Etkinliğini Veren Eşik Değerin Belirlenmesi Farklı Analiz Tekniklerinin ve Model Etkinliklerinin Değerlendirilmesi TÜRKİYE DE MUTLULUK ALGISINI ETKİLEYEN SOSYODEMOGRAFİK UNSURLARA İLİŞKİN BİR UYGULAMA Mutluluk Araştırmaları Uygulamanın Amacı Uygulamanın Kapsamı iv

8 3.3.1 Yığın ve Örneklem Sosyo-demografik Özellikler Ölçek ve Kodlama Analiz ve Bulgular Nesnel Göstergelere İlişkin Betimleyici İstatistikler Öznel Göstergelere İlişkin Betimleyici İstatistikler Mutluluk Algısının Nesnel Göstergelere Göre Değişimi Mutluluk Algısının Öznel Göstergelere Göre Değişimi İkili Lojistik Regresyon Analizi ile Model Kestirimleri Nesnel Modelin Kestirimi Öznel Modelin Kestirimi Karma Modelin Kestirimi Kestirilen Modellerin Değerlendirilmesi Kestirilen Modellere Göre ROC Eğrilerinin Kestirimi Nesnel Modele Göre ROC Eğrisi Kestirimi Öznel Modele Göre ROC Eğrisi Kestirimi Karma Modele Göre ROC Eğrisi Kestirimi ROC Eğrisi Kestirimlerine Göre Model Seçimi SONUÇ EKLER EK1. 0,9 AUC için Uygulama Örneği EK2. Dünya Değerler Araştırması Anket Soru Formu EK3. Dünya Değerler Araştırması Anket Sonuçlarına İlişkin Veri Görseli EK4. Nesnel Nitelikli Göstergeler Seti EK5. Öznel Nitelikli Göstergeler Seti EK6. Temsili Eşik Değerlere Göre Modeller için ROC Eğrisinin Elle Çizimi EK7. MedCalc te Açılan Boş Veri Sayfasının Görseli EK8. MedCalc te Oluşturulan Veri Sayfasının Görseli EK9. MedCalc te Tekil ROC Eğrisinin Kestirim Yolu Görseli EK10. MedCalc te Tekil ROC Eğrisi Kestirimi için Değişken Seçimi Görseli EK11. MedCalc te Tekil ROC Eğrisi Kestirim Sonucu Görseli EK12. MedCalc te ROC Eğrilerinin Karşılaştırılma Yolu Görseli EK13. MedCalc te Karşılaştırmalı ROC Eğrisi Kestirimi için Değişken Seçimi Görseli EK14. MedCalc te Karşılaştırmalı ROC Eğrisi Kestirim Sonucu Görseli KAYNAKÇA v

9 TABLO LİSTESİ Sayfa No. Tablo 1 : ROC Eğrisi Analizi için Genel Yazın Özeti Tablo 2 : ROC Eğrisi Bileşenleri İçin Genel Bir Adlandırma Tablo 3 : ROC Eğrisi Kestirimcileri için Doğru Atama Tablosu Tablo 4 : Birinci ve İkinci Tip Hatalar Tablo 5 : Modelin Ayırım Gücünün AUC Değerlerine Göre Değerlendirilmesi Tablo 6 : Örneğe İlişkin Doğru Atama Tabloları Tablo 7 : Örneğe İlişkin DPO ve YPO Kestirimleri Tablo 8 : Anket Soru Formundaki Mutluluk Algısı ve Yaşam Memnuniyeti Soruları Tablo 9 : İsimsel Ölçekli Nesnel Göstergelerin Dağılımı Tablo 10 : Sıralı Ölçekli Nesnel Göstergelerin Dağılımı Tablo 11 : İsimsel Ölçekli Öznel Göstergelerin Dağılımı Tablo 12.1 : Sıralı Ölçekli Öznel Göstergelerin Dağılımı Tablo 12.2 : Sıralı Ölçekli Öznel Göstergelerin Dağılımı Tablo 13 : Mutluluk Algısının Nesnel Göstergelere Göre Değişimi Tablo 14 : Mutluluk Algısının Öznel Göstergelere Göre Değişimi Tablo 15 : Nesnel Model için Yineleme Geçmişi Tablo 16 : Nesnel Model için Omnibus Testi Model Katsayıları vi

10 Tablo 17 : Nesnel Model Özeti ile Hosmer-Lemeshow Uyum İyiliği Testi. 95 Tablo 18 : Nesnel Model için Doğru Atama Tablosu Tablo 19 : Nesnel Modele İlişkin Kestirim Sonuçları Tablo 20 : Öznel Model için Yineleme Geçmişi Tablo 21 : Öznel Model için Omnibus Testi Model Katsayıları Tablo 22 : Öznel Model Özeti ile Hosmer-Lemeshow Uyum İyiliği Testi.. 99 Tablo 23 : Öznel Model için Doğru Atama Tablosu Tablo 24 : Öznel Modele İlişkin Kestirim Sonuçları Tablo 25 : Karma Model için Yineleme Geçmişi Tablo 26 : Karma Model için Omnibus Testi Model Katsayıları Tablo 27 : Karma Model Özeti ile Hosmer-Lemeshow Uyum İyiliği Testi Tablo 28 : Karma Model için Doğru Atama Tablosu Tablo 29 : Karma Modele İlişkin Kestirim Sonuçları Tablo 30 : Öznel, Nesnel ve Karma Modelin Özet Göstergeleri Tablo 31 : Nesnel Model için Kritik Değere Göre Belirlenen Koşullu Olasılık Kestirimleri Tablo 32 : Nesnel Modele İlişkin Kestirilen AUC Değeri Tablo 33 : SPSS ile Elde Edilen Nesnel Modele İlişkin AUC Kestirimi Tablo 34 : Öznel Model için Kritik Değere Göre Belirlenen Koşullu Olasılık Kestirimleri Tablo 35 : Öznel Modele İlişkin Kestirilen AUC Değeri vii

11 Tablo 36 : SPSS ile Elde Edilen Öznel Modele İlişkin AUC Kestirimi Tablo 37 : Karma Model için Kritik Değere Göre Belirlenen Koşullu Olasılık Kestirimleri Tablo 38 : Karma Modele İlişkin Kestirilen AUC Değeri Tablo 39 : SPSS ile Elde Edilen Karma Modele İlişkin AUC Kestirimi Tablo 40 : Modellere İlişkin Karşılaştırmalı AUC Kestirimleri Tablo 41 : Öznel ve Nesnel Modele İlişkin Kestirilen AUC Değerlerinin Karşılaştırılması Tablo 42 : Öznel ve Karma Modele İlişkin Kestirilen AUC Değerlerinin Karşılaştırılması Tablo 43 : Nesnel ve Karma Modele İlişkin Kestirilen AUC Değerlerinin Karşılaştırılması viii

12 ŞEKİL LİSTESİ Sayfa No. Şekil 1 : Parametrik Yaklaşıma Göre Kestirilen ROC Eğrileri Şekil 2 : Parametrik Olmayan Yaklaşıma Göre Kestirilen ROC Eğrisi Şekil 3 : Kestirim Değerlerinin ROC Alanında Gösterimi Şekil 4 : Farklı Eşik Değerlere Göre Koşullu Olasılıkların Belirlenmesi.. 66 Şekil 5 : Örnek için ROC Eğrisi Kestirimi Şekil 6 : Test Etkinliğinin Değerlendirilmesinde ROC Eğrilerinin Kullanım Yolunun Gösterimi Şekil 7 : Nesnel Modele İlişkin Kestirilen ROC Eğrisi Şekil 8 : Öznel Modele İlişkin Kestirilen ROC Eğrisi Şekil 9 : Karma Modele İlişkin Kestirilen ROC Eğrisi Şekil 10 : Öznel, Nesnel ve Karma Modellere Ait ROC Eğrilerinin Karşılaştırılması ix

13 KISALTMALAR AIC Akaike Bilgi Ölçütü (Akaike Information Criterion, AIC) AKT Açıklanan Kareler Toplamı (Explained Sum of Squares, ESS) Asimp. Asimptotik (Asymptotic) AUC ROC Eğrisi Altında Kalan Alan (Area Under the ROC Curve) BO Birikimli Oran DESTE Doğrusal En İyi Sapmasız Kestirimci (Best Linear Unbiased Estimator, BLUE) DOM Doğrusal Olasılık Modeli (Linear Probability Model) DNO Doğru Negatif Oranı (True Negative Rate, TNR) DPO Doğru Pozitif Oranı(True Positive Rate, TPR) EÇO En Çok Olabilirlik (Maximum Likelihood, ML) EFİS Rev.1.1 Avrupa Topluluğu nda Ekonomik Birimlerin İstatistiki Sınıflaması EKK En Küçük Kareler (Least Squares, LS) GA Güven Aralığı (Confidence Interval, CI) İİBS-1 İstatistiki Bölge Birimleri Sınıflandırması (Nomenclature of Territorial Units for Statistics-1, NUTS-1) KKT Kalıntı Kareler Toplamı (Residual Sum of Squares, RSS) Kov. Kovaryans (Covariance, Cov.) MVD En Yüksek Dikey Uzaklık (Maximum Vertical Distance) NÖD Negatif Öngörü Değeri (Negative Predictive Value, NPV) OF Olabilirlik Fonksiyonu (Likelihood Function, LF) OHK Ortalama Hata Kare (Mean Square Error, MSE) Ort. Ortalama (Mean) P Anlamlılık (Significance, Sig.) PC Öngörü Ölçütü (Prediction Criteria, PC) PÖD Pozitif Öngörü Değeri (Positive Predictive Value, PPV) R N ROC SBC Negatif Sınıfın Sıra Toplamı Alıcı İşletim Karakteristiği (Receiver Operating Characteristic) Schwarz Bayesyen Ölçütü (Schwarz Bayesian Criterion) x

14 sd. SH SS T TDK TKT TÜİK U UAVT UİDS, 93 W YI YNO YPO YSO Serbestlik Derecesi (Degrees of Freedom, df) Standart Hata (Standard Error, SE) Standart Sapma (Standard Deviation, SD) Sınıflandırma Eşik Değeri Türk Dil Kurumu Toplam Kareler Toplamı (Total Sum of Squares, TSS) Türkiye İstatistik Kurumu Mann-Whitney U Test İstatistiği Ulusal Adres Veri Tabanı Uluslararası İşteki Durum Sınıflaması Wald Test İstatistiği Youden Indeksi (YI) Yanlış Negatif Oranı (False Negative Rate, FNR) Yanlış Pozitif Oranı (False Positive Rate, FPR) Yanlış Sınıflandırma Oranı (Misclassification Rate, MR) xi

15 SİMGELER Birim zamanda olayların yinelenme oranı Başlangıç risk fonksiyonu Lojit fonksiyon Bir olayın gerçekleşme olasılığı Bir olayın gerçekleşmeme olasılığı xii

16 GĠRĠġ Regresyon analizinde kestirilen farklı modellerin etkinliklerinin değerlendirilmesi ve en yüksek kestirim gücüne sahip modelin belirlenmesi amacıyla geliştirilmiş olan çeşitli model seçme ölçütleri bulunmaktadır. Araştırmanın niteliğine ve araştırmacının tercihine göre kullanımı farklılık gösteren bu ölçütlere ek olarak, ROC Eğrisi Analizine göre de model seçimi yapılabileceği önermesi bu tez çalışmasının odak noktasını oluşturmuştur. Dolayısı ile tezin amacı ROC eğrilerinin oluşturulması ve kullanılması üzerine bilgi vermek; lojistik modellerin karşılaştırılmasında yöntemin seçim ölçütü olarak tercih edilme nedenlerini göstermektir. İkincil amaç ise güncel bir konu olan mutluluk algısı çalışmalarının değerlendirilmesiyle mutlu olan ve olmayan bireylerin ayrımı için en uygun modelin kestirilmesidir. Birinci bölümde, Regresyon Analizi genel konu başlığı altında Regresyon Modelleri, Kestirim Yöntemleri, Hata Terimini Ortaya Çıkaran Nedenler ve Varsayımlar ile Model Seçimi alt başlıkları sunulmuştur. Üçüncü bölümde yer verilen uygulama çalışmasında, model seçimi aşamasına kadar izlenilen yollar ve dikkat edilmesi gereken unsurlar konusunda bu açıklamalar baz alınmıştır. İkinci bölümde, birinci bölümün sonunda kısaca değinilen ROC Eğrisi Analizine geniş bir yer ayrılmıştır. Başlangıçta konuya ilişkin yapılan yazın taramasının ardından sırasıyla ROC Eğrisi Analizinde Kullanılan Temel Kavramlar, ROC Eğrisinin Özellikleri, ROC Eğrisinin Değerlendirilmesinde Yararlanılan Göstergeler ve ROC Eğrisi Analizinin Kullanım Alanları alt başlıkları ile genel bir çerçeve oluşturulmaya çalışılmıştır. Üçüncü bölüm, birinci ve ikinci bölümlerin somut bir örnek üzerinde gösterimi niteliğinde olan Türkiye de Mutluluk Algısını Etkileyen Sosyo-demografik Unsurlara İlişkin bir Uygulama çalışmasını içermektedir. Türkiye de mutluluk algısı ile ilgili bir uygulama yapma fikrinin çıkış noktası, uygulama sonuçlarının yaşam memnuniyeti, yaşam kalitesi gibi bağıntılı kavramlara dönük olarak yapılan farklı araştırma sonuçları ile karşılaştırması ve ne derece tutarlılık gösterdiğinin belirlenmesidir. Bağımlı değişken olarak alınan mutluluk algısı ile öznel ve nesnel nitelikli sosyo-demografik unsurlar için 1

17 kestirilen farklı lojistik regresyon modelleri içinden en yüksek kestirim gücüne sahip modelin seçilmesinde ROC eğrisi kestirimlerinden yararlanılmıştır. Lojistik regresyon analizi için SPSS 15.0, farklı eşik değerler için ROC Eğrisine ilişkin koşullu olasılıkların hesaplanması ve bu olasılıklara göre ROC Eğrilerinin çizilmesinde Excel, lojistik regresyon analizi ile kestirilen olasılık değerlerinden ROC eğrilerinin elde edilmesi ve karşılaştırılması içinse MedCalc programlarından yararlanılmıştır. 2

18 1. REGRESYON ANALĠZĠ Regresyon terimi ilk kez tanınmış bir İngiliz meteorolog ve insan bilimci olan Francis Galton ( ) tarafından 19. yüzyılda ortaya atılmıştır. Galton, İnsanların Kalıtımında Tipik Kurallar adıyla 9 Şubat 1877 tarihinde Kraliyet Kurumuna sunduğu çalışmasında geri dönüş (reversion) deyişini; 1885 te Antropoloji Enstitüsü dergisinin 15. sayısında yayınladığı Kalıtsal Olarak Boylarda Ortalamaya Doğru Regresyon (Regression Towards Mediocrity in Hereditary Stature) isimli çalışmasında ise regresyon (regression) ifadesini kullanmıştır. 1 Galton bu son çalışmasında anne ve babanın boyu ile çocukların boyu arasındaki bağıntının incelenmesini amaçlamıştır. Uzun boylu anne-babaların uzun, kısa boylu anne-babaların kısa boylu çocukları olur eğiliminin geçerliliğine karşın, belli bir boydaki anne babaların çocuklarının ortalama boyunun genel nüfustaki ortalama boya doğru yaklaşma (regress) eğiliminde olduğunu bulmuştur. 2 Regresyon analizinin tanımına geçmeden önce analizde kullanılan değişkenlere ilişkin bir ön bilgi vermek yerinde olacaktır. Değişkenler nedensel ilişki yönünden bağımlı (açıklanan) ve bağımsız (açıklayıcı) değişken olmak üzere ikiye ayrılmaktadır. Bağımsız değişken, değeri rassal olarak belirlenen ve bağımsız olarak değişim gösteren, diğer değişkenlerin değişimi üzerinde etkisi olan değişken olup X ile ifade edilir. Bağımlı değişken ise, değeri bağımsız değişkenin etkisiyle değişen değişkendir ve genellikle Y ile gösterilir. Bağımlı ve bağımsız değişkenler arasında birlikte bir değişim olup olmadığını matematiksel olarak ortaya çıkaran tekniğe regresyon; bağımsız değişkenin belirli bir birim değişmesi durumunda bağımlı değişkenin ortalama olarak nasıl bir değişim gösterdiğini yani, nedensellik bağıntılarını inceleyen çözümlemeye ise regresyon analizi adı verilir. 1 Norman R. Draper ve Harry Smith, Applied Regression Analysis, Wiley Series in Probability & Statistics, 1998, US, s Francis Galton ve JD Hamilton Dickson, Family Likeness in Stature. Proceedings of the Royal Society of London, Vol. 40, (1886), s. 42 ve 72 Aktaran: Damador N Gujarati, Temel Ekonometri, Ümit Şenesen ve Gülay Günlük Şenesen (çev.), İstanbul: Literatür Yay, 1999, s

19 Bu bölümde regresyon analizinde kullanılan modeller, temel varsayım, kısıt ve kestirim yöntemleri anlatılarak model seçim ölçütleri üzerinde durulacaktır. 1.1 Regresyon Modelleri Regresyon analizi ile değişkenler arasında nedensellik ilişkisinin bulunup bulunmadığı değil, bağımlı ve bağımsız değişkenler arasında birlikte bir değişimin olup olmadığı belirlenir. 3 Analizin diğer bir amacı, bağımsız değişken(ler)in verilen her farklı değeri için bağımlı değişkenin alacağı ortalama değeri kestirmek ve gerçek parametre değerlerine ilişkin çıkarsamalar yapmaktır. Regresyon analizinde bağımsız değişkenlerin sabit, bağımlı değişkenin ise rassal olduğu varsayımı altında, bağımsız değişken değerlerine bağlı olarak farklı değerler alan bağımlı değişken için bir değişim (varyans) söz konusudur. 4 Yapılan çözümleme aracılığı ile bu değişimin nedeni ve bağımsız değişkenlerin bu değişimi ne oranda açıkladığı saptanır. Bağımlı ve bağımsız değişkenler arasındaki etkileşime göre regresyon analizinde kullanılan modeller doğrusal ve doğrusal olmayan regresyon modelleri olmak üzere ikiye ayrılmaktadır. Doğrusal olmayan regresyon modelleri de kendi içinde dönüşüm ile doğrusallaştırılabilen ve doğrusallaştırılamayan modeller olmak üzere iki grupta incelenmektedir. Modellerin anlatımına geçmeden önce doğrusallık terimine değinmek yararlı olacaktır. Regresyon analizinde, değişkenlerde ve katsayılarda (parametrelerde) doğrusallık olmak üzere iki tür doğrusallık söz konusudur. Değişkenlerde doğrusallık durumu, modeldeki her değişkenin üssünün bir olması anlamına gelir; bağımlı ve bağımsız değişkenler arasında doğrusal bir fonksiyonel ilişkinin olduğunu belirtir. Benzer olarak katsayılarda doğrusallık, modelde yer alan tüm katsayı değerlerinin üslerinin bir olduğunu ve bağımlı değişken ile katsayı değerleri arasında doğrusal bir fonksiyonel ilişkinin varlığını ifade eder. 3 Mahir Nakip, Pazarlama AraĢtırmaları Teknikler Ve (SPSS Destekli) Uygulamalar, Ankara: Seçkin Yayıncılık: 2003, s Özkan Ünver ve Hamza Gamgam, Uygulamalı Ġstatistik Yöntemler, 3. Baskı, Ankara: Siyasal Kitabevi, 1999, s

20 (1.1) (1.1) ifadesindeki model, hem katsayılarda hem de değişkenlerde doğrusal olan bir model örneğidir. (1.2) (1.2), katsayılarda doğrusal olan ancak değişkenlerde doğrusal olmayan modele örnek olarak verilebilir. (1.3) (1.3) ifadesi ise değişkenlerde doğrusal iken katsayılarda doğrusal olmayan modele örnektir. Doğrusal regresyon analizinde doğrusallık, modelin katsayıları ile ilgili bir kavramdır ve fonksiyon tipini belirtmektedir. Dolayısıyla esas olan katsayılarda doğrusallıktır ve değişkenlerde doğrusallık bir ön koşul değildir. 5 Yukarıda verilen model örneklerinde hem (1.1) hem de (1.2) de gösterilen modeller doğrusal regresyon modeli olarak kabul edilir. Ancak (1.3) deki model katsayılarda doğrusal değildir, bu sebeple doğrusal olmayan regresyon modeli olarak ifade edilir. Doğrusal regresyon modelleri, denklemlerin çözümündeki ve parametre kestirimlerinin elde edilmesindeki kolaylık sebebiyle doğrusal olmayan modellere tercih edilmektedir. Ancak, uygulamalarda değişkenler arasındaki bağıntılar her zaman doğrusal olarak ifade edilemediğinden bu durumda doğrusal olmayan modellere başvurulmaktadır. Bağımlı değişken, tek bağımsız değişkenden etkilenmekte ise basit, birden fazla bağımsız değişkenden etkilenmekte ise çoklu doğrusal regresyon modeli söz konusu olur. Basit Doğrusal Regresyon Modeli Tek bağımsız değişken ile bağımlı değişken arasındaki nedensellik ilişkisinin 5 Damador N. Gujarati, Temel Ekonometri, Ümit Şenesen ve Gülay Günlük Şenesen (çev.), İstanbul: Literatür Yay, 1999, s

21 şeklindeki doğrusal bir fonksiyonel yapı üzerinden incelendiği regresyon modelidir. Bu fonksiyonel yapının genel gösterimi i. gözlem için (1.4) ile ifade edilir: (1.4) Bu denklemde, parametresi sabit terim olarak adlandırılmakta olup, bağımsız değişken değeri sıfır olduğunda bağımlı değişkenin alacağı başlangıç değerini belirtir. parametresi ise regresyon (eğim) katsayısı olarak ifade edilir ve bağımsız değişkendeki değişimin bağımlı değişkende oluşturduğu değişikliğin ortalama bir değerini verir. Hata terimi adı verilen, ölçme hatalarını ya da dikkate alınmayan değişkenlerin etkisini temsil eden rassal bir değişkendir. Çoklu Doğrusal Regresyon Modeli Araştırmalarda, çalışılan konunun niteliği ve dayandığı kuramlar dikkate alındığında çoğu kez bağımlı değişkeni etkileyen birden fazla etken bulunmakta bundan dolayı da basit doğrusal regresyon modeli uygulamalarda yetersiz kalmaktadır. Bu durumda, basit doğrusal regresyon modelinin ikiden çok değişken içerecek şekilde genişletmesi ile elde edilen çoklu doğrusal regresyon modeli kullanılır. i:1,2,,n ve j:1,,k olmak üzere çoklu doğrusal regresyon modelinin genel matematiksel gösterimi (1.5) teki gibidir: (1.5) Karşılaşılabilecek en yalın çoklu doğrusal regresyon modeli ise (1.6) da ifade edilen, iki bağımsız ve bir bağımlı olmak üzere üç değişkenden oluşan modeldir. (1.6), bağımsız değişken değerleri sıfır iken bağımlı değişkenin alacağı ortalama değeri belirten sabit terimdir. ve ise kısmi regresyon katsayıları olarak adlandırılırlar., X 2i sabit iken X 1i de, ise X 1i sabitken X 2i de meydana gelen bir birimlik değişmeye karşılık bağımlı değişken değerinde meydana gelecek ortalama değişimi gösterir. 6

22 Çoklu doğrusal regresyon modelinde, basit doğrusal regresyon modelinin varsayımlarından farklı olarak bağımsız değişkenler arasında çoklu doğrusallık (bağlantı) yoktur şeklinde bir varsayım söz konusudur: 6 Değişkenler arasındaki ilişki doğrusal olarak ifade edilemediğinde başvurulan doğrusal olmayan regresyon modellerinin genel fonksiyonel yapısı, biçimindedir. Doğrusal regresyon modeline benzer olarak bağımlı ve bağımsız değişkenler ile doğrusal olmayan parametre değerlerinden oluşmaktadır. 7 Doğrusal regresyon modelinden farklı olarak ifadesi katsayılarda doğrusal olmayan bir fonksiyonu belirtir. ve (1.3) ifadesinde gösterilen modeller doğrusal olmayan modellere örnek olarak verilebilir. Yaygın olarak kullanılan doğrusal olmayan regresyon modellerinin değişken yapılarına ve kullanıldığı durumlara aşağıda sırasıyla değinilecektir: Poisson regresyon biçiminde sayılabilir kesikli rassal nitelikte olan bir bağımlı değişken ile bir ya da daha çok bağımsız değişken arasındaki ilişki varlığı incelendiğinde kullanılabilecek bir tekniktir. Bağımlı değişken, ender görülen olayların belli bir zaman diliminde gerçekleşme sıklığını ya da oran/hızı temsil edebilir. Öğrencilerin okula gitmedikleri gün sayısı, bir hastanede yapılan tıbbi ya da cerrahi hatalı işlem sayısı gibi çeşitli örneklerin modellenmesinde Poisson regresyon tekniğinden yararlanılabilir. 8 Poisson un kesikli rassal değişken değerleri her zaman pozitif olduğundan Poisson ortalaması da sıfırdan büyüktür. Poisson regresyon, bağımlı değişkenin kesikli olması durumunda normallik varsayımı sağlanamayacağı için doğrusal regresyon * Çoklu doğrusallık, bir regresyon modelinin tüm ya da bazı bağımsız değişkenleri arasındaki doğrusal birleşimi ifade etmektedir. 6 Gujarati, s. 192 ve J.Fox, Nonlinear Regression and Nonlinear Least Squares, Appendix to An R and SPLUS Companion to Applied Regression, 2002, s.1. Y rassal değişkeninin olası değerleri sonlu ya da sayılabilir sonsuz sayıda ise Y değişkenine kesikli rassal değişken denir. 8 Kadir Sümbüloğlu ve Beyza Akdağ, Regresyon Yöntemleri ve Korelasyon Analizi, Ankara: Hatiboğlu Yayınevi, 2007, s

23 analizine seçenek olarak kullanılan bir yöntemdir. 9 Poisson regresyon modelinin genel matematiksel biçimi (1.7) ifadesinde belirtilmiştir: (1.7) eşitlik elde edilir: (1.7) ifadesinin doğal logaritmasının alınmasıyla (1.8) ifadesinde gösterilen (1.8) Poisson regresyon modelinin uyum iyiliğinin sınanmasında sıklıkla kullanılan testlerin, Pearson Ki-kare ve Sapma (G 2 ) testi olduğu söylenebilir. 10 (1.9) da belirtilen, gözlenen (G) ve beklenen (B) sıklık değerlerine dayalı olarak çözümlenen Pearson Ki-Kare test istatistiği (n-k) serbestlik derecesi ile ki-kare dağılımına uyar. (1.9) (1.10) da belirtilen G-kare test istatistiğinin 0 a yaklaşması model uyumunun arttığının, uzaklaşması ise model uyumunun azaldığının göstergesidir. (1.10) Cox regresyon Yaşam süresi verilerini çözümlemek için geliştirilen bir modelleme tekniğidir. Cox oransal hazard (risk) regresyon modeli olarak da adlandırılan bu teknik, farklı değişkenlerin yaşam süresi üzerindeki etkilerini aynı anda ortaya çıkarmayı amaçlamaktadır. Yaşam süresi verileri normal dağılıma uygunluk göstermediği, 9 Edward L. Frome, MH Kutner ve JJ Beauchamp. Regression Analysis of Poisson-Distributed Data, Journal of The American Statistical Association, Vol.68, No.344, 1973, s Özlem Deniz, Poisson Regresyon Analizi, İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, Vol.4, No.7, 2005, s.67. 8

24 genellikle üstel ya da weibull dağılım(ın)a uyduğu için doğrusal regresyon analizine seçenek olarak kullanılan bir yöntemdir. 11 Risk oranının bağımsız değişkenlerin bir fonksiyonu olduğunu varsayan Cox regresyon modeli, başlangıç risk ve üstel kısım olmak üzere iki bölümden oluşur. Başlangıç bölümü risk zaman süresi, üstel kısım ise değişkenler ve regresyon katsayılarından oluşur. Cox regresyon modelinde bağımsız değişkenlerin bağımlı değişkene etkileri çarpımsaldır. Cox regresyon modelinin genel matematiksel biçimi (1.11) ifadesinde belirtilmiştir: (1.11) Zamanın bir fonksiyonu olan başlangıç risk fonksiyonu ile zamandan bağımsız olan toplam bağımsız değişken setinin logaritmik değerinin çarpımı [ ] risk modelinin değerini verir. 12 Cox regresyon modelinin parametre kestirimlerinde En Çok Olabilirlik (EÇO) yönteminden yararlanılır. Elde edilen parametre kestirimlerinin anlamlılık sınaması ise Wald Testi, Olabilirlik Oran (Likelihood Ratio, LR) Testi ve Skor Testi olmak üzere üç yöntemden yararlanılarak yapılabilir. Üstel regresyon Bağımsız değişkenin zaman olduğu, genellikle büyüme ile ilgili yapılan modellemelerde kullanılmaktadır. Üstel regresyon modelinin genel fonksiyonel formu (1.12) ifadesindeki gibidir: (1.12) Üstel dağılım, λ olarak ifade edilen tek bir oran parametresine sahip ve [0,+ ) tanım aralığında değer alan sürekli bir dağılımdır. Weibull dağılım, ölçek(λ) ve şekil(γ) olmak üzere iki parametreye sahip olan ve [0,+ ) tanım aralığında değer alan sürekli bir dağılımdır. γ =1 iken wiebull dağılımı üstel dağılıma dönüşür. 11 Sümbüloğlu ve Akdağ, s Sümbüloğlu ve Akdağ,, s

25 Tek bağımsız değişken için oluşturulan üstel regresyon modeli parametreleri kullanılarak (1.13) ifadesindeki gibi gösterilebilir: ve (1.13) Üstel modelin parametre kestirimleri için Newton Raphson Yöntemi kullanılmakta olup, modelin uyum iyiliği ile elde edilen ki-kare test istatistiğine göre değerlendirilmektedir. 13 Lojistik regresyon Üçüncü bölümde yer alan uygulamanın çözümlenmesinde lojistik regresyon analizi kullanıldığından bu teknik daha kapsamlı sunulacaktır. Değişkenlere, ölçüm biçimi bakımından kategorik (isimsel, sıralı) ya da metrik (aralıklı, oransal) yapıda olmalarına göre farklı istatistiksel teknikler uygulanır. Doğrusal regresyon analizi, metrik yapıdaki bağımlı ve bağımsız değişkenler için uygulanırken, bağımlı değişkenin kategorik yapıda olması durumunda hata teriminin normal dağılıma uygunluk ve sabit varyanslılık varsayımları sağlanamadığından doğrusal regresyon analizi kullanılamaz. Doğrusal Olasılık Modelleri (DOM), bağımlı değişkenin 0 ve 1 olmak üzere iki değer aldığı bağımsız değişkenlerin ise metrik yapıda olduğu durumda, bağımsız değişkenlerdeki değişimin bağımlı değişken üzerindeki etki düzeyini ölçmek için doğrusal regresyon analizine seçenek olarak kullanılan tekniklerden biridir. DOM, bağımsız değişken(ler) veri iken bağımlı değişkenin koşullu beklenen değeri ya da olayın gerçekleşmesinin koşullu olasılığı olarak yorumlanabilir. 14 Doğrusal regresyondan farklı olarak, bağımsız değişkendeki bir birimlik değişimin bağımlı değişken üzerinde yarattığı doğrudan etkiyi değil; bağımlı değişkenin koşullu olasılığı üzerindeki etkisini ölçer. DOM, varsayımı altında (1.14) teki gibi ifade edilebilir: 13 Mete Sırvancı ve Grace Yang, Estimation of the Weibull Parameters Under Type I Censoring, Technical Report No:321, 1984, s Gujarati, s

26 (1.14) Kestirim yöntemleri başlığı altında anlatılan ve doğrusal regresyon modellerinde parametre kestirimleri için kullanılan En Küçük Kareler (EKK) yöntemi, DOM parametreleri için kullanılamamaktadır. Çünkü EKK nın gerektirdiği bazı varsayımlar DOM için sağlanamamaktadır. Bu varsayımlar ile DOM un diğer olumsuz özelliklerini şu şekilde sıralamak mümkündür: 15 DOM da bağımlı değişken gibi hata terimi de 0 ve 1 olmak üzere iki değere sahip olduğundan, hata terimleri normal dağılıma değil binom dağılımına uyar. Dolayısı ile hata terimleri normal dağılıma uyar varsayımı sağlanamaz. DOM da hem bağımlı değişkenin koşullu beklenen değeri hem de hata teriminin varyansı bağımsız değişkenin aldığı değere bağlı olarak değişkendir. koşullu olasılık değeri için, ifadesi geçerlidir. Kestirilen koşullu olasılık değerinin bu aralığın dışına çıkması durumunda DOM kullanılamaz. Model seçme ölçütleri başlığı altında değinilen R 2 değeri, DOM için genellikle düşük çıktığından uyum iyiliğinin bir ölçüsü olarak değerlendirilemez. Bağımsız değişken değerleri sonsuza doğru artınca veya azalınca olasılıkların düşmesi beklendiğinden, DOM için bağımsız değişkenin değişen değerlerine göre koşullu olasılıkların doğrusal olarak artış gösterdiğinin varsayılması mantıksal olarak tutarlı değildir. Bağımsız değişken değeri arttıkça X e bağlı olarak doğrusal şekilde artan bağımlı değişkenin koşullu beklenen değeri, tanım aralığının dışına çıkabilmektedir. Olasılık değeri tanım aralığının dışına çıktığında ise bağımsız değişkenler ile bağımlı değişkenin koşullu beklenen değeri arasında doğrusal olmayan ilişki söz konusu olmakta ve DOM varsayımı sağlanamamaktadır. Bu durumda ikili bağımlı değişkenin değişimini değerlendirmek için uygun bir birikimli dağılım fonksiyonu kullanılmalıdır. 15 Recep Tarı, Ekonometri, 3. Baskı, Kocaeli Üniv. Yay. No:172, 2005, s

27 Lojit ve probit modeller, DOM un bu eksikliğini gidermeye yönelik geliştirilen; sırasıyla lojistik ve normal birikimli dağılım fonksiyonlarından türetilen modeller olup, sahip oldukları fonksiyonlar açısından Lojistik Regresyon Model çeşitleri olarak adlandırılırlar. Doğrusal olmayan regresyon tekniklerinden biri olan lojistik regresyon analizi, kategorik yapıdaki bağımlı değişken ile kategorik, metrik ya da karma (kategorik ve metrik) yapıda bulunan bağımsız değişken(ler) arasındaki ilişkinin incelenmesinde kullanılır. 16 Lojistik regresyon modelleri, temelde doğrusal olmayıp, lojit ya da probit dönüşümler aracılığı ile doğrusallaştırılabilen modellerdir. Lojit model ile probit modelin farkı, lojit modelin standardize edilmiş lojistik olasılık dağılımına, probit modelin ise normal olasılık dağılımına göre türetilmesidir. Lojistik regresyon ile doğrusal regresyon analizi arasındaki farklılıklar ise şu şekilde sıralanabilir: Doğrusal regresyon analizinde kestirilen bağımlı değişken sürekli, lojistik regresyonda ise kesikli nitelikte olmalıdır. İkili lojistik regresyon modelinde bağımlı değişkenin Binom dağılımına uyduğu varsayılır. 17 Doğrusal regresyonda bağımlı değişkenin değeri, lojistik regresyonda ise bağımlı değişkenin alabileceği değerlerden birinin gerçekleşme olasılığı kestirilir. Doğrusal regresyon analizinde bağımsız değişkenlerin çoklu normal dağılım göstermesi şartı aranırken, lojistik regresyon uygulanması için bağımsız değişkenlerin dağılımına dair bir koşul aranmamaktadır. 18 Lojistik regresyon analizinde varyans-kovaryans matrislerinin eşitliği aranmaz. Lojistik regresyonda bağımsız değişkenler arasında çoklu bağlantı sorunu olmadığı varsayılır. 16 Aziz Akgül ve Osman Çevik, Ġstatistiksel Analiz Teknikleri: SPSS te ĠĢletme Yönetimi Uygulamaları, 2. Baskı, Ankara: Mustafa Kitabevi, 2005, s Eric Vittinghoff, Stephen S. Shiboski, David V. Glidden ve Charles M. McCulloch, Regression Methods in Biostatistics Linear, Logistic, Survival, and Repeated Measures Models, New York: Springer, 2005, s.162 ve Sibel Coşkun ve Diğerleri, Lojistik Regresyon Analizinin İncelenmesi ve Diş Hekimliğinde Bir Uygulaması, Cumhuriyet Üniversitesi DiĢ Hekimliği Fakültesi Dergisi, Vol.7, No.1, 2004, s

28 Lojistik regresyon analizi, ayırıcı analiz tekniği olma özelliği de taşımaktadır. Normallik ve varyans-kovaryans matrislerinin eşitlik varsayımının sağlanamaması; tüm bağımsız değişkenlerin iki sonuçlu ya da sürekli ve kesikli değişken karışımından oluşması durumunda doğrusal ayırma analizi en iyi sonucu veremeyeceğinden ayırma analizine seçenek olarak lojistik regresyon analizi kullanılmaktadır. Bağımlı değişkenin kategori sayısına göre üç temel lojistik regresyon yöntemi söz konusudur. Bir ya da daha fazla bağımsız değişken ile isimsel ve iki kategorili tek bağımlı değişken arasındaki bağıntının incelenmesinde ikili (binary) lojistik regresyon; isimsel ve ikiden çok kategorili bağımlı değişken ile olan bağıntının incelenmesinde ise çoklu (multinomial) lojistik regresyon analizi uygulanır. Sıralı ölçekli ve ikiden çok kategorili tek bağımlı değişken ile olan bağıntının incelenmesinde de sıralı(ordinal) lojistik regresyon tekniğinden yararlanılır. Bağımsız değişken sayısına göre lojistik regresyon modellerini iki ve çok değişkenli modeller olmak üzere ikiye ayırmak da mümkündür. Bağımlı değişkenin alabileceği değerlerin 0-1 arasında olmasını sağlamak için bağımsız değişken ile bağımlı değişken arasında doğrusal olmayan ilişki veren bir model kullanılır. (1.14) ifadesinde verilen DOM modelinden hareketle oluşturulan; parametre kestiriminin işaretine göre bağımlı değişken ile bağımsız değişkenler arasında S veya ters S şeklinde doğrusal olmayan bir ilişki kurulmasını sağlayan fonksiyona lojistik fonksiyon denilir, (1.15) ifadesindeki gibi gösterilir. (1.15) Bu tür fonksiyonlar 0 ve 1 asimptotlarına sahip olduklarından bağımlı değişkenin kestirim değeri olan de 0 ve 1 sınırları arasında kalmaktadır. 19 (1.15) ifadesi hem değişkenlerde hem de katsayılarda doğrusal değildir. Ayrıca, aldığı değerler de sınırlı olduğundan uygulamada zorluk yaratabileceği için lojistik fonksiyonun bir dönüşüm ile doğrusallaştırılması gerekmektedir. Doğrusal dönüşümde yararlanılan odds oranı, bağlantı fonksiyonu gibi kavramlar şu şekilde açıklanabilir: 19 Cengiz Aktaş, Orkun Erkuş, Lojistik Regresyon Analizi ile Eskişehir in Sis Kestiriminin İncelenmesi, Ġstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, Vol.8, No.16, 2009, s

29 Bir durumun gerçekleşme olasılığının gerçekleşmeme olasılığına oranı odds oranı olarak ifade edilir ve biçiminde gösterilir. (1.15) te ifade edilen lojistik fonksiyon, (1.16) da belirtilen ve odds oranının doğal logaritması alınarak oluşturulan bağlantı fonksiyonu kullanılarak doğrusallaştırılabilmektedir. (1.16) lojit olarak adlandırılmakta olup, hem değişkenlere hem de katsayılara göre doğrusaldır ve (-, + ) aralığında değişen değerler alır. yükseldikçe değeri de artar. Eğer ise negatif, ise pozitif değerler alır. 20 Odds oranı, nin üst olasılık değerini 1 den + a; bağlantı fonksiyonu ise nin alt olasılık değerini 0 dan - a genişletir. Dolayısı ile., (-, + ) aralığında değer alır. 21 Lojit modele göre kurulan bağlantı fonksiyonu aracılığıyla yapılan doğrusallaştırmanın ardından (1.15) ifadesi (1.17) de belirtilen ve lojistik regresyon modeli olarak adlandırılan eşitliğe dönüşür. (1.17) Lojistik regresyon modeli ile elde edilen parametre kestirimlerinin yorumlanması doğrusal regresyon modelinden farklıdır. için katsayı yorumu yapılırken X deki bir birimlik artış için odds oranı ile çarpılarak elde edilen değerden yararlanılır. Bu durum her katsayı için aynı şekildedir. Lojistik regresyon modelindeki bir parametreye ilişkin değerinin ilgili olduğu bağımsız değişken, bağımlı değişkenin yüzde kaç oranında fazla gözlenme olasılığına sahip olduğunu belirtir, diğer bir deyişle X=1 durumunun X=0 durumuna oranlanması ile bağımlı değişkenin kaç kat daha fazla 1 olarak görüldüğü sonucuna ulaşılır David W Hosmer ve Stanley Lemeshow, Applied Logistic Regression, New York: John Wiley and Sons, 2000, s Alan Agresti, Analysis Of Ordinal Categorical Data, New York :John Wiley and Sons, 1990, s H.Bircan, Lojistik Regresyon Analizi: Tıp Verileri Üzerine Bir Uygulama, Kocaeli Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, Vol.2, No.8, 2004, s

30 Lojistik regresyon analizinde parametre kestirimleri analitik olarak elde edilemediğinden genellikle iteratif (yinelemeli) bir yöntem olan EÇO tekniğinden yararlanılmaktadır. Yeniden Ağırlıklandırılmış Yinelemeli EKK Yöntemi ve Minimum Lojit Ki-Kare Yöntemi de uygulamada kullanılan diğer kestirim tekniklerindendir. Lojistik regresyon analizi ile kestirilen parametrelerin anlamlı olup olmadığının ve ulaşılan modelin uygunluğunun sınanmasında kullanılan başlıca testlerin Wald Testi, Olabilirlik Oran Testi ve Hosmer-Lemeshow Uyum İyiliği Testi olduğu söylenebilir. Kestirilen modelde her bir bağımsız değişkene ilişkin parametrelerin anlamlılığı, ve olmak üzere 1 serbestlik derecesi ile ki-kare dağılımına uyan ve (1.19) ifadesinde verilen Wald testi ile sınanır. (1.18) Değerlendirmeye göre katsayı istatistiksel olarak anlamsız çıkarsa o bağımsız değişken modelden çıkarılır. 23 Parametrelerin anlamlılığı test edildikten sonra modelin genel olarak anlamlı olup olmadığı sınanır. Olabilirlik Oran Testi, sabit terim dışındaki tüm parametre kestirimlerinin yani modelin genel olarak anlamlı olup olmadığının sınanmasında kullanılan ve log-olabilirlik fonksiyonuna dayanan bir testtir. 24 Olabilirlik oran testinin, Sapma (Deviance) Ki-Kare ve kullanımı daha yaygın olan Model-Ki Kare olmak üzere iki seçeneği bulunmaktadır. 25 ve şeklindeki yokluk ve alternatif hipotezlerinin sınanmasında olabilirlik oran test istatistiğinin dönüştürülmüş biçimi olan ve (n-k) serbestlik derecesi ile ki-kare dağılımına uyan -2ln-olabilirlik (- 2lnL) istatistiği kullanılır. -2lnL istatistiği ile modele eklenen bağımsız değişkenlerin modele olan katkısı araştırılır. -2lnL 1 ve -2lnL 2 şeklinde, yalnız sabit terimden oluşan model ile hem sabit 23 Sümbüloğlu ve Akdağ, s Şeref Kalaycı, SPSS Uygulamalaı Çok DeğiĢkenli Ġstatistik Teknikleri, 2. Baskı, Ankara: Asil Yayın Dağıtım, 2006, s Sümbüloğlu ve Akdağ, s

31 terimi hem de bağımsız değişken(ler)i kapsayan modele ilişkin iki ayrı -2lnL istatistiği hesaplanır. 26 İki istatistik arasındaki fark (1.19) ifadesi ile bulunarak, elde edilen sonuca göre modelin verileri iyi temsil edip etmediğine karar verilir. (1.19) Modelin uyum iyiliğinin değerlendirilmesinde yararlanılan Hosmer-Lemeshow Uyum İyiliği Testi ise temelde bir ki-kare testidir. Lojistik regresyon analizi ile elde edilen bağımlı değişkene ilişkin olasılık kestirimleri g sınıfa (genellikle 10) ayrılarak en düşük değerden en yüksek değere doğru sıralanır. Her hücre için beklenen sıklıklar hesaplanarak gözlenen sıklıklar ile karşılaştırılır. 27 = Model verileri itibariyle uygundur. = Model verileri itibariyle uygun değildir. Yokluk ve alternatif hipotezlerin sınanmasında (1.20) de gösterilen test istatistiğinden yararlanılır. 28 (g-2) serbestlik derecesi ile ki-kare dağılımına uyan Hosmer-Lemeshow test istatistiği (1.20) deki gibi hesaplanır. (1.20) o i, i. sınıftaki olay sonuçlarının toplam sıklığını, N i i. sınıftaki birimlerin toplam sıklığını, ise i. sınıf için bir olayın sonucuna ilişkin ortalama kestirim olasılığını göstermektedir. Lojistik regresyon modelinin etkinliğinin bir ölçüsü olarak ROC Eğrisi Analizi sonucu elde edilen Eğri Altında Kalan Alan (AUC) kestirim değerini de kullanmak mümkündür. Pek çok bilgisayar programının çıktısında ayırım gücünün değerlendirilmesinde Pseudo R 2 değerleri esas alınmaktaysa da, bu değerler modelin açıklama gücünü olduğundan daha zayıf gösterebilmektedir. Bu nedenle AUC gibi iyi ayırım gücüne sahip diğer göstergelerin de değerlendirilmesi önerilmektedir Ali Sait Albayrak, Uygulamalı Çok DeğiĢkenli Ġstatistik Teknikleri, Ankara: Asil Yayın Dağıtım, 2006, s Sümbüloğlu ve Akdağ, s Ronald N. Forthofer, Eun Sul Lee ve Mike Hernandez, Biostatistics: A Guide to Design, Analysis and Discovery, 2nd Ed., United States of America:Elsevier Academic Press, 2007, s Forthofer, Lee ve Hernandez, s.401 ve

32 1.2 Kestirim Yöntemleri Regresyon analizinde eldeki veri setine en iyi uyumu gösteren regresyon modelinden elde edilen kestirimlerin parametrenin gerçek değerine yakın olması ve bu değerlerin parametre çevresinde dar bir alanda değişim göstermesi beklenir. 30 Parametre gerçek değerine yakınlığın ölçülmesinde, kestirim değerlerine ait ortalama ve varyansın yanı sıra, örnekleme hatası, sistematik hata, ortalama hata karesi gibi unsurlar da dikkate alınmaktadır. Katsayıları ya da değişkenleri bakımından doğrusal olmayan kimi modeller logaritmik dönüşüm gibi çeşitli dönüşümler ile doğrusal hale getirilebilmektedirler. Doğrusal olan ve dönüşüm ile doğrusallaştırılan modellerin parametre kestirimlerinde EKK Yöntemi, EÇO Yöntemi gibi kestirim teknikleri kullanılmaktadır. Doğrusallaştırılamayan modellerin parametre kestirimleri ise Doğrusal Olmayan EKK ve EÇO yöntemleri ile hesaplanabilmektedir. 31 Doğrusal olmayan modellerin parametre kestirimleri yinelemeler (iterasyon) ile elde edilebilmekte, doğrusal modellerin parametre kestirimleri ise doğrudan hesaplanabilmektedir. Doğrusal modellerin en iyi parametre kestirimlerinde aranılan özellikler ve kullanılacak kestirim yönteminin saptanması için yararlanılan ölçütler küçük ve büyük örneklemlerde farklılık gösterdiğinden ayrı başlıklar altında ele alınacaktır. Küçük örneklem özellikleri: 1. Sapmasızlık: Elde edilen kestirimin beklenen değeri, E( ), ile parametrenin gerçek değeri arasındaki farka sapma denir ve ifade edilir. olarak Kestirimin beklenen değeri ile parametrenin gerçek değerinin eşit olması durumunda değeri sıfır olur ve kestirimin sapmasız olduğu söylenir. Sapmasızlık 30 Tarı, s Albayrak, s

33 durumunda, kestirim değeri ortalama olarak parametrenin gerçek değerini verir ve örnek sayısı arttıkça iki değer birbirine yaklaşır. Ancak sapmasızlık özelliği, yalnızca ortalamaya dayandığından tek başına değerlendirilmesi pek bir anlam ifade etmemektedir. 2. En küçük varyans: Başka kestirim teknikleri ile bulunan sapmalı ya da sapmasız kestirimcilere göre en küçük varsayansa sahip olan kestirimcinin en iyi kestirimci olduğu söylenebilir. parametresine ait ve gibi sapmasız iki farklı kestirim değeri olduğu varsayılırsa, durumunda kestirimi kestirimine tercih edilir. Sapmasızlıkta olduğu gibi, en küçük varyans özelliği de değerlendirmede tek başına yeterli değildir. En küçük varyanslı olduğu halde sapmalı olan bir kestirimci, parametrenin gerçek değerinden farklı bir değer çevresinde değişim gösterir ki bu tercih edilir bir durum değildir. 3. Etkinlik: Hem sapmasız olan hem de diğer sapmasız kestirimcilerle karşılaştırıldığında en küçük varyansa sahip olan kestirimcinin etkin bir kestirimci olduğu söylenebilir. ve gibi iki sapmasız kestirim değeri için matematiksel gösterim şeklindedir. Bu iki kestirimden, etkin olanı olup, genel bir ifade ile tüm sapmasız kestirimler içinde en küçük varyansa sahip olandır. 4. Doğrusallık: Örnek verilerinin doğrusal bileşimi ile elde edilen kestirimin doğrusal olduğu kabul edilir. Doğrusal, sapmasız ve diğer parametre kestirimcileri ile karşılaştırıldığında en küçük varyansa sahip olan kestirimci DESTE (BLUE: Best Linear Unbiased Estimators) olarak adlandırılır. 5. En küçük ortalama hata kareleri (OHK): En küçük varyans ve sapmasızlık özelliklerinin eşanlı sağlanamadığı durumda kullanılan bir seçim ölçütüdür. OHK, parametre kestiriminin gerçek parametre değeri ile olan farklarının karelerinin beklenen değeri olarak ifade edilebilir ve biçiminde gösterilir. Sapmalı ve küçük varyanslı olan kestirimciler ile sapmasız ancak büyük varyanslı kestirimcilerin seçiminde OHK değerleri dikkate alınır ve en küçük OHK değerine sahip olan kestirimci tercih edilir. 18

34 6. Yeterlilik: Kestirilecek parametre hakkında en fazla bilgiyi veren kestirimcinin yeterlilik şartını sağladığı söylenebilir. Büyük örneklem özellikleri: Aranılan istatistiksel özelliklerin küçük örneklemlerde sağlanamaması durumunda, örnek çapı olan n sonsuza doğru arttıkça bu özelliklerle sağlanmaya başlanacağından büyük örneklem tercih edilir. Kestirimcilerin büyük örneklerde taşıdığı özellikler asimptotik (kavuşmaz) özellikler olarak adlandırılır ve şu şekilde sıralanabilir: Asimptotik Sapmasızlık: şartı geçerli ise yani örneklem büyüklüğü sonsuza doğru büyürken kestirimin ortalama değeri parametrenin gerçek değerine yaklaşmaktaysa kestirimi için, parametresinin asimptotik sapmasız bir kestirimcisi olduğu söylenebilir. Asimptotik sapmanın sayısal değeri matematiksel olarak, şeklinde ifade edilebilir. Küçük örneklemlerde sapmasız olan bir kestirimcinin büyük örneklemlerde de asimptotik sapmasız olduğu şeklinde bir genelleme yapılabilir ancak asimptotik sapmasız olan kestirimcinin küçük örneklemlerde de sapmasız olduğu söylenemez. 2. Asimptotik Tutarlılık: Kestirim değeri, asimptotik sapmasız ve aynı zamanda örneklem büyüklüğü arttıkça gerçek parametre değerine,, yaklaşmakta ise nın tutarlı bir kestirimci olduğu söylenebilir. Matematiksel olarak, ve şeklinde ifade edilir. 3. Asimptotik Etkinlik: En küçük asimptotik varyansa sahip olan kestirimcinin, asimptotik etkin bir kestirimci olduğu söylenebilir. 4. Asimptotik Normallik: Örneklem büyüklüğü arttıkça kestiriminin örneklem dağılımı normal dağılıma yaklaşırsa, bu kestirimcinin örneklem dağılımının asimptotik normal dağılıma uyduğu söylenebilir. Tüm bu özelliklerin önem derecesi, araştırmacının amacına ve seçimine bağlı olarak faklılık gösterdiğinden öncelik sıralaması söz konusu değildir. 32 Gujarati, s

35 1.2.1 En Küçük Kareler (EKK) Yöntemi Parametre kestirim yöntemlerinden biri olan en küçük kareler yöntemi, dayandığı varsayımlar ve içerdiği özellikler nedeniyle gerek basit gerekse çoklu regresyonda en çok kullanılan tekniklerden biridir. Yığından seçilen rassal örneklerden oluşan örneklemden elde edilen parametre kestirim değerleri ile gözlenen değerler arasındaki farkın, yani kalıntı kareler toplamının enküçüklenmesine dayanır. Yığına ait bir genel doğrusal regresyon modelinde β parametrelerinin EKK kestirimcileri sırasıyla ve (j=1,2,,k) olarak ifade edilirse, bu kestirimciler aracılığı ile elde edilecek genel doğrusal regresyon denklemi şöyle olacaktır: (1.21), Y i nin kestirilen değeridir. bileşeni ise stokastik nitelikte olup, bağımlı değişkenin kestirilen ve gözlenen değerleri arasındaki farka karşılık gelir ve kalıntı adını alır. Denklem cinsinden şu şekilde yeniden yazılabilir: (1.22) Kestirim değerleri gözlenen değerlere ne kadar yakın olursa kurulan model o denli doğru ve güvenilir olur. Değerlerin yakın çıkması kalıntılar toplamının yani değerinin enküçüklenmesi ile mümkündür. Ancak, gözlenen değerlerle çizilen gerçek regresyon doğrusu ve kestirilen değerlerle çizilen kestirim regresyon doğrusu arasındaki sapmaların kimisi pozitif kimisi negatif işaretli olduğundan birbirini götürür ve kalıntı toplamı sıfır olur. Fakat, yalnızca cebirsel toplam sıfıra eşit çıkacağından varolan sapmalar kaybolmaz. Cebirsel toplamı sıfır olan bir değeri enküçükleyebilmek ise, sapmaların karelerini alarak bu kareler toplamını enküçüğe indirgemekle mümkün olur. 33 Stokastik kelimesi hedefin göbeği anlamına gelen Yunanca stokhos sözcüğünden türetilmiştir. Atılan okun hedefi vurup vurmaması rassal bir süreci kapsar. Dolayısı ile stokastik sözcüğü gözlemler ya da çeşitli olgular için farklılık gösterme durumunu ifade eder ve deterministik ifadesi ile karşıt anlam taşıdığı söylenebilir. 33 A. Koutsoyiannis, Ekonometri Kuramı: Ekonometri Yöntemlerinin Tanıtımına GiriĢ, Ümit Şenesen ve Gülay Günlük Şenesen (çev.), Ankara: Verso Yay., 1989, s

36 EKK yöntemi ile olanaklı en küçük kalıntı kareler toplamını,, veren en iyi parametre kestirimleri belirlenir ve elde edilen bu kestirim değerleri aracılığı ile kurulan regresyon modelinin en uygun model olduğu kabul edilir. (1.24) teki ifade, (1.23) te verilen nin ve her bir e göre kısmi türevleri alınarak sıfıra eşitlenmesi ile elde edilen kalıntı kareler toplamını enküçükleyecek parametre kestirim değerlerini göstermektedir. (1.23) (1.24).. Gerekli yalınlaştırmalardan sonra şu eşitlikler elde edilir: (1.25). Elde edilen bu denklemler normal denklemler olarak adlandırılır ve normal denklemlerin çözülmesiyle ve kestirim değerlerine ulaşılır. Normal denklemler setinin matris ile gösterimi (1.26) ifadesindeki gibidir: (1.26) (Y: Bağımlı değişken vektörü, X: Bağımsız değişken matrisi, vektörü, u: Hata vektörü) : Parametre 21

37 parametrelerinin kestirim değerlerini ifade eden kestirim matrisi şu şekilde hesaplanır: (1.27) Bağımlı değişkene ait kestirim değerleri de kestirim değerlerinden hareketle (1.27) ifadesindeki gibi elde edilir: (1.28) EKK yöntemi ile elde edilen kestirim değerlerinin doğruluk derecesi ya da güvenirliği her bir kestirimcinin standart hatası ile ölçülür. 34, (1.29) (1.30) (1.31) (1.32) : Hata terimine ait sabit varyans dışında formülasyonlarda yer alan tüm büyüklükler eldeki veriden hesaplanmaktadır. nin kestirimcisi olan ve hata terimine ait sabit varyansın pozitif kareköküne karşılık gelen kestirimcinin standart hatası şu şekilde elde edilir: 35 (1.33) (1.34) 34 Gujarati, s: 70 ve 71. ifadesi, formülasyonların aslında ortalamadan sapma şeklinde kullanılmıştır. 35 Gordon Hilton, Intermediate Politometrics, New York : Columbia University Press, 1976, s

38 Kestirimin standart hatası, gözlenen bağımlı değişken değerlerinin kestirilen regresyon doğrusuna göre olan standart sapmalarını belirtir, bu sebeple uyum iyiliğinin bir ölçüsü olarak kullanılabilir En Çok Olabilirlik (EÇO) Yöntemi EKK yönteminin yanı sıra kullanılan diğer bir parametre kestirim tekniği olan en çok olabilirlik yöntemi, eldeki veriyi doğru olarak değerlendirebilmek için istatistiksel bir çerçeve sunar. EÇO yönteminin özellikleri ve dayandığı varsayımlar büyük örnekleme dönük olduğundan, büyük örneklem kestirim tekniği olarak da nitelendirilebilir. 36 EÇO yönteminde, yığından rassal olarak seçilen örnekler aracılığı ile yığın parametrelerinin birbirinden farklı tüm olası kestirim değerleri saptanarak, bu değerler arasından gözlemlenen değerleri belirleme olasılığını enyüksekleyen kestirimlerin seçilmesi hedeflenir. 37 Lojistik regresyon analizinde ise EÇO yöntemi ile log-olabilirlik değerinin enyükseklenmesi hedeflenir. 38 gibi basit bir doğrusal regresyon modelinde Y i nin ortalama ve σ 2 varyans ile normal dağılıma uyduğu,, varsayılırsa Y i nin ortak olasılık yoğunluk fonksiyonunun genel ifadesi şu şekilde gösterilebilir: β β σ ; i=1,2,,n (1.35) Varsayım gereği, Y i değerlerinin birbirinden bağımsız olduğu göz önüne alınırsa, ortak olasılık yoğunluk fonksiyonunun n tane tekil yoğunluk fonksiyonunun çarpımından oluştuğu söylenebilir ve açık olarak şu şekilde (1.36) daki gibi belirtilir: β β σ β β σ β β σ (1.36) 36 Scott R. Eliason, Maximum Likelihood Estimation: Logic and Practice, Sage University Paper series on Quantitative Applications in the Social Sciences,1993;07-096, Newbury Park, CA: Sage, s LR Klein, A Text Book of Econometrics, Evanston, III., Row, Peterson&Co., 1953, s Sümbüloğlu ve Akdağ, s

39 Normal dağıldığı varsayılan, bağımsız ve rassal olan herhangi bir Y i değişkeni için tekil olasılık fonksiyonu normal dağılım olasılık fonksiyonuna eşit olur: (1.37) Her bir Y i değişkeni için (1.37) fonksiyonu (1.36) da yerine konulursa şu ortak olasılık yoğunluk fonksiyonu elde edilir: β β σ σ σ (1.38) Üstel terimlerin çarpımı kuralı biçimde de gösterilebilir: uygulanarak ortak olasılık şu β β σ (1.39) verilmişken β 1, β 2, σ 2 parametre değerleri bilinmiyorsa (1.39) fonksiyonuna olabilirlik fonksiyonu (OF) denir. OF(β 1, β 2, σ 2 ) ile gösterilir ve matematiksel ifadesi (1.40) daki gibidir. β β σ (1.40) En yüksek OF değerinin bulunması ile gözlenen değerleri belirleme olasılığını enyüksekleyen kestirim değerlerinin seçilmesi mümkündür. En yüksek OF değeri, (1.40) fonksiyonunda β β σ parametrelerine göre alınan kısmi türevlerin sıfıra eşitlenmesiyle elde edilir. Kısmi türev işleminin kolaylaştırılması için olabilirlik fonksiyonunun her iki tarafının doğal logaritması alınır. Logaritmik fonksiyon, monoton bir fonksiyon olduğundan hem OF hem de en yüksek düzeye aynı noktada varacaktır. 39 (1.41) 39 Gujarati, s

40 Elde edilen (1.41) fonksiyonunun β β σ parametrelerine göre kısmı türevleri alınırsa şu eşitlikler elde edilir: (1.42) (1.43) (1.44) EÇO kestirimcileri olarak gösterilir; (1.42), (1.43) ve (1.44) denklemlerinde yerine yazılır ve bu denklemler sıfıra eşitlenirse şu ifadelere ulaşılır: (1.45) (1.46) (1.47) Yalınlaştırmalardan sonra (1.45) ve (1.46) ifadelerinden şu denklemlere ulaşılır: (1.48) (1.49) Elde edilen son eşitlikler EKK yöntemi ile bulunan normal denklemlerin aynısıdır. Dolayısıyla, hem EKK hem de EÇO yöntemi için β parametre kestirimleri eşit bulunur. Elde edilen kestirimler (1.47) eşitliğinde yerine yazılırsa, (1.50) ifadesindeki kestirimine ulaşılır. (1.50) σ 2 nin EKK kestirimcisinin serbestlik derecesini dikkate aldığı dolayısıyla sapmasız olduğu söylenebilir. Oysa EÇO kestirimcisi serbestlik derecesini dikkate almamaktadır. Bu sebeple EÇO yöntemi ile elde edilen kestiriminin sapmalı olduğu sonucuna ulaşılır. 25

41 Sapmanın büyüklüğü, (1.50) eşitliğinin her iki tarafının beklenen değeri alınarak şu şekilde hesaplanabilir: 40 (1.51) (1.33) ifadesi, kalıntı kareler toplamının beklenen değeri cinsinden yazılırsa (1.52) ifadesine ulaşılır. (1.52) (1.52), (1.51) ifadesinde yerine yazıldığında (1.53) eşitliği elde edilir. (1.53) Bulunan bu değer, kestiriminin gerçek σ 2 değerini küçük örneklemlerde olduğundan düşük değerli kestirdiğini gösterir. Örneklem büyüklüğü arttıkça sapma unsuru olan ikinci terim sıfıra yaklaşır. Bu durumda kestiriminin sapma değeri azalacağından n için lim olacağı, dolayısıyla EÇO kestirimcisinin asimptotik sapmasız özellik gösterdiği söylenebilir. Lojistik regresyon modeli için EÇO yöntemi ile parametre kestirimi yapabilmek, öncelikle EÇO fonksiyonunun oluşturulması ile mümkündür. Bu fonksiyon ile gözlenen değerlerin olasılıkları parametrelerin bir fonksiyonu olarak açıklanır ve fonksiyonu enyüksekleyen EÇO kestirimlerinin seçilmesine dikkat edilir. Dolayısıyla elde edilen kestirimlerle gerçek parametre değerlerinin birbirine yakınsaması hedeflenir. Lojistik modelde parametre kestirimi için kullanılabilecek koşullu ve koşulsuz olmak üzere iki EÇO yöntemi bulunmaktadır. Parametre sayısı gözlem sayısından büyük ise koşullu, küçük ise koşulsuz yöntemden yararlanılmaktadır. 41 Uygulamada parametre sayısı gözlem sayısından genellikle küçük olduğu için koşulsuz EÇO yöntemi kullanılır. Aşağıda anlatılan lojistik regresyon parametre kestiriminde de koşulsuz EÇO yöntemi kullanılmaktadır. 40 Gujarati, s DG Kleinbaum ve M. Klein, Logistic Regression: A Self-Learning Text (Statistics for Biology and Health), Third Edition, USA: Springer Sciences Business Media, 2010, s.107 ve

42 Bağımlı değişkenin 0 ve 1 olmak üzere iki değerden oluşması durumunda (1.15) te verilen lojistik fonksiyondaki ifadesi, bağımsız değişkenin belirli bir değeri için bağımlı değişkenin 1 e eşit olma koşullu olasılığını ; ifadesi ise bağımlı değişkenin 0 a eşit olma koşullu olasılığını verir. Buradan hareketle, ise olabilirlik fonksiyonuna katkı kadar, ise ) kadar olmaktadır. Bağımlı ve bağımsız değişkenlerin EÇO fonksiyonuna katkısı, n sayıda gözlem için iki sonuçlu Binom dağılımına 42 uyan ve (1.54) ifadesinde verilen olasılık fonksiyonu ile belirlenir. (1.54) Birbirinden bağımsız olduğu varsayılan n sayıda gözlem için olabilirlik fonksiyonu, (1.55) şeklinde verilen çarpımsal ifade ile gösterilir. Elde edilen olabilirlik fonksiyonunun doğal logaritması alınarak (1.56) daki log-olabilirlik fonksiyonuna ulaşılır: (1.56) (1.56) ifadesinin parametrelere göre türevleri alınıp elde edilen eşitliklerin sıfıra eşitlenmesi ile EÇO kestirimleri elde edilir. 43 Eşitlikler doğrusal olmayan yapıda olduğundan en iyi sonuca yinelemeli çözümler ile ulaşılmaktadır. Yinelemeli çözümlemede önce parametrelere belli bir başlangıç değeri verilerek ilk kestirimler elde edilir. Her yinelemede yapılan çıkarma ve artırımların ardından log-olabilirlik fonksiyonunun türevi alınır. Yinelemelerde kestirimler arası farkın azalması ve log olabilirlik düzeyinin değişmemesi en iyi kestirim sonucuna ulaşıldığının göstergesidir Selahattin Güriş ve Şahamet Bülbül, Olasılık, İstanbul: Marmara Üniversitesi Nihad Sayar Eğitim Vakfı Yayınları, 1995, s Hosmer ve Lemeshow, s Hüseyin Tatlıdil, Çok DeğiĢkenli Ġstatistiksel Analiz, Ankara: Hacettepe Üniversitesi Fen Fakültesi İstatistik Bölümü Yayınları, 1992, s

43 1.3 Hata Terimini Ortaya Çıkaran Nedenler ve Varsayımlar Ölçme hataları, tanımlama hataları ya da matematiksel kalıbın yanlış seçilmesi nedeniyle kestirim değerleri ile gerçek parametre değerleri arasında sapma olabilmektedir. Bu hata unsurlarının tümü hata terimi adı verilen, genellikle ε veya u ile ifade edilen tek bir terimde toplanarak modele eklenmektedir Hata Terimini Ortaya Çıkaran Nedenler Hata terimini ortaya çıkaran nedenleri 3 maddede sıralamak mümkündür: 1. Veri toplama aşamasında ortaya çıkan ve verinin sağlandığı kaynaktan ileri gelen ölçme hataları. 2. İlgisiz değişkenin modele alınması ya da önemli değişkenin dikkate alınmaması olmak üzere iki şekilde ortaya çıkan, değişkenlerin yanlış seçilmesine dayanan tanımlama hataları Önemli değişkenin modele alınmaması: Bağımlı değişkeni açıklamada önemli etkiye sahip değişken(ler) modele alınmadığından parametreler sapmalı olur. Yani kestirilen değerler bağımsız değişkenin bağımlı değişken üzerindeki etkisini gösteren gerçek parametre değerlerinden farklı olur. Bu durumda hata terimi ve parametrelere ait varyansların kestirilen değerleri de sapmalı olacağından, parametrelere ilişkin hesaplanan güven aralıkları ve hipotez testleri de hatalı sonuç verir. Sapmanın ortadan kalkması için model dışı bırakılan değişkenle modeldeki değişkenlerin ilişkisiz olması, kovaryanslarının sıfır olması gerekir İlgisiz değişkenin modele alınması: Parametre kestirimleri sapmasız olur ancak, ilgisiz değişken içeren modelin parametre varyansı gerçek modelin parametre varyansından büyük olacağından parametrelerin istenilen yapısal özelliklerinden olan etkinlik özelliği sağlanamaz. Bu durumda modelin parametre kestirimleri güvenilir olmaz. Bağımsız değişkenin gerçekten gerekli olup olmadığı konusunda kararsız kalınırsa, söz konusu değişken ile ilgili veri sağlanması ve örnek büyüklüğünün 28

44 yeterli olması şartı ile değişkenin modele alınması tercih edilir Hata terimini ortaya çıkaran diğer bir neden, araştırmacıdan kaynaklanan bir hata olan matematiksel kalıbın yanlış seçilmesi, yani bağımlı ve bağımsız değişkenler arasındaki bağıntının hatalı fonksiyon biçimi ile belirtilmesidir. Değişkenlere ait verilerin değerleri serpilme diyagramında çizilerek en uygun matematiksel yapı belirlenebilir Hata Terimine ĠliĢkin Varsayımlar Doğrusal regresyon için geçerli olan aşağıdaki varsayımlar, hata terimi normal dağılıma uymayan doğrusal olmayan yapılarda aranmaz. a. değerleri veri iken hata teriminin ortalaması sıfırdır. (1.57) b. değerleri veri iken hata teriminin varyansı tüm gözlemler için aynıdır yani, sabit varyans söz konusudur. (1.58) c. gibi iki değer söz konusu iken hata terimleri arasında otokorelasyon edilir. yoktur. Matematiksel olarak (1.59) daki gibi ifade (1.59) d. ile birbirinden bağımsız yani ilişkisiz olduğundan kovaryans da sıfırdır ve (1.60) daki gibi ifade edilir: (1.60) gösteriminden hareketle hata terimlerinin sıfır ortalama ve sabit varyans ile normal dağılıma uyduğu varsayımı altında doğrusal regresyon için hem EKK hem de EÇO yöntemi ile elde edilen β parametrelerine ilişkin kestirim değerleri aynıdır. Hata terimine ait varyansın kestirim değerleri ise iki yönteme göre farklılık gösterir. 45 Tarı, s.339. Ardışık bağımsızlık olarak da ifade edilen otokorelasyon, birbirini izleyen hata terimleri arasında ilişki olması durumunu belirtmektedir. 29

45 EKK yönteminde serbestlik derecesi dikkate alındığından büyük örneklemlerde iki kestirimci birbirine yaklaşır. 1.4 Model Seçimi Model seçimi, uygulamalı bir araştırmada araştırmanın en önemli aşamalarından birisi olup; değişkenler, matematiksel fonksiyonlar ve kabul edilen varsayımlar açısından bir bütün olarak en uygun modelin saptanması anlamına gelir. Model seçiminde bağımsız değişkenlerin seçilmesi ve değişkenler arasındaki bağıntının fonksiyonel yapısının belirlenmesi şeklinde iki unsur söz konusudur. Kestirilen modelin araştırılan konuya ilişkin uygun model olup olmadığı, en uygun modelin taşıması gereken genel özellikler dikkate alınarak belirlenebilir: 46 a. Basitlik: Kurulacak model, olabildiğince az değişken içeren ve araştırılan konuyu en iyi temsil eden model olmalıdır. b. Belirlenmişlik: Kestirilen her parametre için tek bir mümkün değer olmalıdır. c. Doğru fonksiyonel biçim: Belirleme katsayısı, standart hata gibi değerler ile fonksiyonel biçimin doğruluğu incelenebilir. d. Kuramsal tutarlılık: Elde edilen parametre kestirimlerinin işaret ve büyüklük bakımından kuram ile uyuşması gerekmektedir. e. Kestirim gücü: Gerek gözlem dönemi içinde gerekse dışında başarılı öngörü sonuçları veren modelin iyi bir model olduğu söylenebilir. Modelin doğru kurulabilmesi için modelde yer alacak değişkenlerin doğru belirlenmesi önemlidir. Model kurulumuna değişkenler doğru şekilde saptandıktan sonra geçileceğinden önce değişken seçimine ilişkin tekniklere değinilecektir DeğiĢken Seçme Teknikleri Tanımlama hataları parametre kestirimlerini güvensiz kıldığından modele alınacak bağımsız değişkenlerin doğru şekilde seçilebilmesi önemlidir. 46 Tarı, s

46 Değişken seçiminde sıklıkla yararlanılan üç teknik mevcuttur: Geriye Doğru Eleme: Başlangıçta tüm değişkenleri içeren bir model geliştirilir. Doğrusal regresyon analizinde, kestirilen her parametre için t ve F testleri yapılarak istatistiksel olarak anlamsız bulunan parametrenin ait olduğu değişken modelden çıkarılır. Lojistik regresyon analizi uygulandığında ise parametrelerin anlamlı olup olmadığı Wald testi ile belirlenir ve anlamsız bulunan parametreye ilişkin değişken modelden çıkarılır. Analizde kullanılan eleme unsuruna göre geride kalan değişkenler için de benzer çözümleme yapılarak aynı testler tekrar uygulanır. Modelin açıklama gücü arttığı ya da değişmediği sürece yapılan elemenin uygun olduğu kabul edilerek işleme devam edilir ve sonunda en uygun model belirlenir. 2. İleriye Doğru Seçim: Tüm bağımsız değişkenler arasında bağımlı değişken ile en yüksek korelasyona sahip olan değişken seçilerek regresyon analizi bu değişkenler üzerinden uygulanır. Elde edilen parametre kestiriminin istatistiksel olarak anlamlı olup olmadığı uygulanan regresyon analizi türüne göre t, F ya da Wald testi aracılığıyla belirlenir. Parametre kestirimi anlamsız bulunursa ilgili değişken modelden çıkarılır ve kalan bağımsız değişkenler arasında bağımlı değişken ile en yüksek kısmi korelasyona sahip olan değişken modele alınır. Analiz tekrar uygulanır ve elde edilen sonuçlara göre parametre anlamlılıkları sınanarak en uygun model elde edilinceye kadar aynı işlemler yinelenir. 3. Adım Adım Regresyon: İlk olarak, bağımlı değişken ile en yüksek korelasyona sahip değişken modele alınarak işleme başlanır. Kalan değişkenler ile bağımlı değişken arasında kısmi korelasyon hesaplanarak en yüksek kısmi korelasyon değerine sahip değişken denkleme alınır. Her aşamada denkleme giren son değişkenin istatistiksel bakımdan anlamlı olup olmadığı ve son seçilen değişken modelde iken önceden alınan değişkenlerin modelde kalmasına gerek olup olmadığı test edilir. Yani, modele alınan bir değişken ilerleyen adımlarda model dışı bırakılabilir. Sonuç olarak denklemde yer alması gereken değişkenler ve katsayılar belirlenerek işlem tamamlanır. 47 Sümbüloğlu ve Akdağ, s

47 1.4.2 Model Seçme Ölçütleri Sapmalı ve etkin olmayan kestirimciler yaratan tanımlama hataları, matematiksel kalıbın yanlış seçilmesi ya da yapılan ölçme hataları modeli olumsuz etkileyen en önemli unsurlardandır. Bu nedenle model kurma aşamasında bu hatalar dikkate alınarak hatasız ya da düzeltilebilir hataya sahip olan model seçilmelidir. Modelin yeterliliğine karar vermede göz önüne alınan unsurlar, modelin doğrusal olup olmamasına göre farklılık gösterebilmektedir. Doğrusal model söz konusu olduğunda parametrede aranılan yapısal özelliklere uyan, yani doğrusal, sapmasız kestirimciler arasında en küçük varyanslı kestirimlere sahip, DESTE, model tercih edilmelidir. Hata grafiklerine bakılarak da belirlenen fonksiyonel yapıya en uygun olan modelin seçilmesi mümkündür. Doğrusal bir regresyon modelinin yeterliliği konusunda karar verebilmek için uyum iyiliğinin ölçüsü olarak en yaygın kullanılan ve modellerin karşılaştırılmasında yararlanılan ölçü, belirlilik katsayısıdır. Seçim ölçütlerinden biri olan belirlilik katsayısının sahip olduğu kimi zayıflıklardan dolayı seçenek olarak türetilen bazı ölçütler de geliştirilmiştir. Model seçiminde yararlanılan başlıca ölçütler kısaca şu şekilde ifade edilebilir: Belirlilik Katsayısı Parametre kestirim değerlerinin gerçek değerlerlere ne kadar iyi uyduğunun, yani gözlenen ve kestirilen değerlerin ne denli tutarlı olduğunun belirlenmesi gerekir. Bağımlı değişkendeki değişimin bağımsız değişkenlerdeki değişim ile açıklanma oranını belirten belirlilik katsayısı doğrusal model seçiminde en sık başvurulan ölçütlerden biridir. Bu oran ne denli yüksekse gözlenen ve kestirilen değerlerin o kadar uyumlu olduğu, başka bir deyişle en yüksek değerine sahip modelin tercih edileceği söylenebilir. değeri, tanım aralığında değer alan bir büyüklük olup; alt değer olan sıfır bağımlı değişkendeki değişimlerin bağımsız değişkenler tarafından açıklanamadığını, üst değer olan bir ise %100 açıklandığını ifade eder. 32

48 Toplam değişim, varyansın parçalanma özelliği sayesinde açıklanan ve açıklanamayan değişim olmak üzere iki bölüme ayrılabilir. Böylelikle toplam değişimin matematiksel ifadesi (1.61) deki gibi gösterilir. 48 (1.61) (1.62) (1.62) ifadesinin yalınlaştırılması ile eşitliği elde edilir. Buradan hareketle belirlilik katsayısı (1.63) ifadesindeki gibi bulunur: (1.63) Regresyon analizi sonucunda elde edilen kestirim değerleri gözlenen değerlere ne kadar yakınsarsa sapmalar o denli az, KKT değeri o kadar küçük; KKT değeri düşük olunca da uyum iyiliğinin bir göstergesi olan değeri yüksek olacaktır. Matematiksel gösterimden hareketle, bağımsız değişken sayısı arttıkça azalma eğilimine girer ve artar. Böylece en yüksek R 2 değerin ulaşılabilir. Fakat bu durum kestirilen hata varyansının da büyümesine sebep olacağından, R 2 model seçimi için her zaman iyi bir ölçüt olmamaktadır. Bağımsız değişken sayısı farklı ancak bağımlı değişkeni aynı olan iki regresyon modeli arasında değerine göre seçim yapılırken bu unsurun göz önüne alınması gerekir. Düzeltilmiş Bağımsız değişkenlerin katkısı ile değeri artan R 2 nin bu zayıflığını önlemek için, serbestlik derecesine göre düzeltilen ve düzeltilmiş R 2 ( ) olarak adlandırılan yeni bir R 2 büyüklüğü geliştirilmiştir. Bu ölçütün kullanılmasındaki ana amaç, bağımsız değişkenlerin eklenmesi ile ortaya çıkan R 2 değerindeki artışın önlenmesidir Serdar Kılıçkaplan, Ġstatistiksel Analiz-ΙΙ BasılmamıĢ Ders Notları. Ankara: Gazi Üniversitesi, Gujarati, s

49 , normal R 2 değerinden ya daha küçük ya da bu değere eşit olur. Düzeltilmiş R 2 değeri en büyük olan modeli seçmek ile en küçük varyanslı (σ 2 ) modeli seçmenin birbirine eş olduğu söylenebilir. Değişkenlere ilişkin birimlerin aynı olması şartı ile farklı sayıda bağımsız değişkene sahip modeller arasında kullanılarak karşılaştırma yapılması da mümkündür. 50 (1.64) olacağından k>1 için ise olur; durumunda ise negatif değer alabilir. Amemiya Öngörü Ölçütü Verilerle en iyi uyumu sağlayan modeli seçmek ve en iyi öngörüyü yapabilmek uyum iyiliği ölçüsü belirlemenin temel hedefidir. Amemiya tarafından, öngörü başarısını doğrudan yansıtacak bir uygunluk ölçüsü olarak öngörü hata kareleri ortalaması ölçütü ya da kısaca öngörü ölçütü (Prediction Criterion, PC) denilen ve yalnız örnek bilgisini gerektiren bir ölçüt ortaya atılmıştır. 51 Tüm modellerin doğru olduğu varsayımı altında her bir modelden elde edilen öngörünün hata karesi ortalaması, n: örnek sayısını, k: değişken sayısını belirtmek üzere (1.65) ifadesinden hesaplanarak bulunur ve sonuçların değerlendirilmesiyle doğru modele ulaşılır. 52 (1.65) Optimal Önem Düzeyi Ortak bağımsız değişkenlere sahip modellerin bulunduğu durumda, bir modelin seçimi diğer modelin parametreleri için kurulan hipotezin kabul ya da ret kararına bağlıdır. Hipotezin kabul veya reddi, bir anlamda seçilen önem düzeyine dayalı 50 Reha Alpar, Çok DeğiĢkenli Ġstatistiksel Yöntemlere GiriĢ, 2. Baskı, Ankara: Nobel Yayınevi, 2003, s Tarı, s (21 Eylül 2011). 34

50 olduğundan, F testinin kritik değerini doğru belirlemek önemlidir. 53 F testinin optimal kritik değeri (1.66) daki gibi bulunmaktadır. 54 (1.66) Hipotez testine dönük teknikler dışında bilgi teorisine dayalı olarak geliştirilen model seçme ölçütleri de mevcuttur. 55 Akaike Bilgi Ölçütü (Akaike Information Criterion, AIC), Schwarz Bayesyen Ölçütü (Schwarz Bayesian Criterion, SBC) ve Mallow un Cp Ölçütü ne aşağıda sırasıyla değinilmektedir. AIC ve SBC AIC ve SBC, doğrusal regresyon modellerinde sıklıkla kullanılan model seçim ölçütlerdendir. Tanımlanan modellerden her biri için AIC ve SBC değeri hesaplanarak en küçük AIC ya da SBC değerine sahip olan model tercih edilir. AIC ve SBC değerleri (1.67) de belirtilen formüller ile elde edilir: 56 (1.67) AIC aşağı, SBC ise yukarı doğru sapmalıdır. Yani AIC azalma, SBC ise artma eğilimindedir. Mallow un C p Ölçütü Bağımlı değişken, sabit terim ve k tane bağımsız değişkenden oluşan bir model için, (p k) olmak üzere p tane bağımsız değişken seçilir ve kalıntı kareler toplamı hesaplanırsa C p ölçütü şu şekilde elde edilir: 57,58 (1.68) p<k durumunda modeller karşılaştırılırken en küçük C p değerine sahip olan model tercih edilir. 53 Tarı, s Takeshi Amemiya, Selection of Regressors, International Economic Review, Vol.21, No.2, 1980, s Meltem Ş. Ucal, Ekonometrik Model Seçim Kriterleri Üzerine Kısa Bir İnceleme, Cumhuriyet Üniversitesi Ġktisadi ve Ġdari Bilimler Dergisi, Vol. 7, No.2, 2006, s Funda Yurdakul, Uygulamalı Ekonometri-ΙΙ BasılmamıĢ Ders Notları, Ankara: Gazi Üniversitesi, CL Mallows, Some Comments on CP, Technometrics, Vol.15, No.4, 1973, s

51 Farklı modellere ilişkin R 2 değerlerinin karşılaştırılabilmesi için modellerin fonksiyonel yapısının ve kestirimcilerinin aynı olması gerekmektedir. (1.63) ve (1.64) ifadelerinde belirtilen belirlilik katsayıları, doğrusal regresyon analizi uygulanarak kestirilen modelin uyum iyiliğini ölçmede kullanılmaktadır. Farklı model yapıları için geliştirilen çeşitli R 2 hesaplamaları da mevcuttur. Pseudo R 2 Aldrich ve Nelson tarafından, 1984 yılında yazılmış olan Linear Probability, Logit and Probit Models isimli çalışmada Bağımlı değişkeni kategorik yapıda olan modellerde belirlilik katsayısının bir özetleme istatistiği olarak kullanılmasından kaçınılması gerektiği ileri sürülmektedir. 59 Bağımlı değişken kategorik yapıda iken seçenek olarak kullanılan lojistik regresyon analizinde, bağımlı değişkenin varyansı bu değişkenin olasılık dağılımına bağlı olarak değişmektedir. Dolayısıyla doğrusal regresyon analizinin kestirim değerleri ile hesaplanan belirlilik katsayısı, lojistik regresyon için hesaplanamamaktadır. Lojistik regresyon modelinin uyum iyiliğinin ölçülmesi için, olabilirlik oranına göre hesaplanan ve bağımsız değişkendeki bir birimlik değişmenin bağımlı değişkenin koşullu olasılığında yarattığı değişim düzeyini saptamada kullanılan Cox & Snell R 2, Nagelkerke R 2 gibi Pseudo R 2 adı verilen yapay katsayılar geliştirilmiştir. 60 Bu katsayılara ilişkin formülasyonlar sırasıyla (1.69) ve (1.70) ifadelerinde verildiği gibidir. Pseudo R 2 Cox & Snell R 2 : Formül (1.69) Nagelkerke R 2 : (1.70) :Yalnız sabit terim içeren modelin olabilirlik değeri : Bağımsız değişkenleri içeren modelin olabilirlik değeri Pseudo: Belirli bir özelliği taşıyan ancak o özelliği özünde içermeyen, ona sahip olmayan bir tür yapay biçimi anlatan ön ek. 59 John Aldrich ve Forrest Nelson, Linear Probability, Logit and Probit Models, Beverly Hills, Calif:Sage Publications, 1984, s Roberta C. Nacif, Online Customer Loyalty: Forecasting the Repatronage Behavior of Online Retail Customers, Gabler Edition Wissenschaft : Kundenmanagement & Electronic Commerce. Wiesbaden, 2003, s.233 ve

52 Nagelkerke R 2, alabileceği en yüksek değer genelde 1 den küçük olan Cox & Snell R 2 nin bu zayıflığını ortadan kaldırmak üzere geliştirilmiştir. 61 Her iki Pseudo R 2 de, EKK kestirimleriyle elde edilen R 2 gibi 0-1 aralığında değer alır. Bulunan değer 1 e yakın ise bağımlı ve bağımsız değişkenler arasındaki ilişkinin güçlü, 0 a yakın ise zayıf olduğu söylenebilir. Yukarıda anlatılan hipotez testine dönük teknikler ile bilgi teorisine dayalı olarak geliştirilen model seçme ölçütleri dışında, kestirilen model etkinliklerinin değerlendirilmesinde kullanılabilecek diğer bir istatistiksel kestirim tekniğinin ROC Eğrisi Analizi olduğu söylenilebilir. ROC Eğrisi Analizi: ROC eğrisi analizi, herhangi bir konuda yapılan araştırmada belirli bir veri seti üzerinden uygulanan farklı analiz tekniklerinin değerlendirilmesinde, fonksiyonel olarak aynı yapıda olan model etkinliklerinin karşılaştırılarak en iyi modelin saptanmasında kullanılan bir analizdir. Test edilen değişkenin kestirilen değerlerinden hareketle belirlenen Duyarlılık ve (1-Özgüllük) oranlarına dayanır. ROC eğrisi, Y ekseninde Duyarlılık X ekseninde ise (1-Özgüllük) oranlarının yer aldığı koordinat düzleminde, belirlenen farklı eşik değerler için kestirilecek Duyarlılık ve (1-Özgüllük) çiftlerinin çakışım noktalarının birleştirilmesiyle oluşturulur. Kestirilen ROC eğrisine ilişkin değerlendirmeler, eğri aracılığıyla hesaplanan AUC, Youden Indeksi (YI) gibi göstergeler üzerinden yapılır. İkinci bölümde ROC Eğrisi Analizi ayrıntılı bir şekilde anlatılacaktır. 61 Albayrak, s

53 2. ROC EĞRĠSĠ ANALĠZĠ İstatistiksel karar kuramı ile sinyal algılama kuramının temel ilkelerine dayalı olarak türetilen bir yöntem olan ROC eğrisi analizi, İkinci Dünya Savaşı sürecinde radar sinyallerinin doğru olarak belirlenebilmesi, yani isabetli ve hatalı sinyallerin ayırt edilebilmesi amacıyla geliştirilmiştir. 62,63 ROC teriminin Türkçe açılımındaki alıcı kelimesi ile radar detektörüne, karakteristik kelimesi ile de sınıflandırıcının belirli bir potansiyel aralıktaki işlemsel özelliklerine atıfta bulunulmaktadır. 64,65 ROC eğrisi analizi ile ilgi yapılan yazın taramasında, yöntemin çeşitli bilim dallarında yaygın olarak kullanıldığı görülmüştür. Aşağıda verilecek olan yazın özetinde, yöntem ile ilgili mevcut olan çalışmalar içinde farklı yaklaşımların geliştirildiği en çok başvurulan kaynaklar sıralanmaktadır ların ortalarında ROC eğrisi analizinin deneysel psikoloji ve psikofizik çalışmalarında kullanımı yaygınlaşmıştır. Dorfman ve Alf, 1968 yılında yayınlanmış olan Maximum Likelihood Estimation of Parameters of Signal Detection Theory A Direct Solution isimli çalışmalarında ROC eğrisi verilerinden hareketle normal dağılım varsayımları kullanılarak sinyal algılama kuramının parametre kestirimlerinin EÇO yöntemi ile elde edebileceğini öne sürmüşlerdir. 66 Lusted, 1971 yılında yayınlanan Signal Detectability and Medical Decision Making isimli çalışmasında radyolojide kullanılan çeşitli tekniklerin etkinliklerinin ve tanı tutarlılıklarının değerlendirilmesi ile tıbbi karar verme sürecinde ROC eğrilerinin kullanılabileceği fikrini ortaya atmıştır. 67 ROC eğrisi analizi, tanı testlerinin etkinliğinin 62 DM Green ve JA Swets. Signal Detection Theory and Psychophysics, Reprint Edition, Los Altos, CA:Peninsula Publishing, 1988, s James P. Egan, Signal Detection Theory and ROC Analysis, Academic Press, New York, 1975, s CE Metz, ROC Analysis in Medical Imaging: A Tutorial Review of the Literature ; Radiological Physics and Technology, Vol.1, No.1, 2008, s Wojtek J. Krzanowski ve David J. Hand, ROC Curve for Continuous Data, Chapman and Hall/CRC, 2009, s DD Dorfman ve Edward Jr. Alf, Maximum Likelihood Estimation of Parameters of Signal Detection Theory A Direct Solution, Psychometrika, Vol.33, No.1, 1968, s.117, (27 Temmuz 2009). 66 LB Lusted, Signal Detectability and Medical Decision Making, Science, Vol.171, No.3977, 1971, s.1217, ( ). 67 CE. Metz, ROC Methodology in Radiology Imaging, Invest Radiol, Vol.21, No.9, 1986, s.720, ( ). 38

54 değerlendirilmesinde ve yeni radyolojik tekniklerin incelenmesinde günümüzde de yaygın olarak kullanılmaktadır. 68,69 Hanley ve McNeil tarafından 1982 yılında hazırlanan The Meaning and Use of the Area Under a Receiver Operating Characteristic(ROC) Curve isimli çalışmada tanı doğruluğunun bir göstergesi olarak AUC değerinden yararlanılabileceği ortaya konulmuştur yılında yayınlanan A Method of Comparing the Areas under Receiver Operating Characteristic (ROC) Curves Derived from the Same Cases adlı bir diğer çalışmada ise aynı örneklem için farklı gözlemciler tarafından uygulanan tanı testi etkinlikleri kestirilen AUC değerlerinin karşılaştırılmasıyla değerlendirilirken, alanlar arası korelasyonun da dikkate alınması gerektiği öne sürülmüştür. 71 Tosteson ve Begg tarafından 1988 yılında hazırlanmış olan A General Regression Methodology for ROC Curve Estimation isimli çalışmada, kategorik sıralı yapıdaki veri için ROC eğrisi kestiriminde genelleştirilmiş sıralı regresyon yönteminden yararlanılabileceği belirtilmektedir. Bu yaklaşım ile farklı birimler tarafından elde edilen tanı testi sonuçlarının ROC eğrisi üzerindeki etkisinin saptanabildiği; bunun da ROC eğrisinin test etkinliklerini değerlendirme yeteneğini önemli derecede artırdığı öne sürülmektedir. 72 Raubertas, Rodewald, Humiston ve Szilagyi tarafından 1994 yılında hazırlanan ROC Curves for Classification Trees adlı çalışmada, tıbbi karar verme sürecinde kullanılan karar ağacı yönteminde maliyet, etkililik, yararlılık gibi unsurlara göre türetilen karar ağaçlarından en uygun olanının belirlenmesinde ROC eğrilerinden yararlanılabileceği ortaya konulmuştur MH Zweig ve G. Campbell, Receiver Operating Characteristic (ROC) Plots: A Fundamental Evaluation Tool in Clinical Medicine, Clinical Chemistry, Vol. 39, No.4, 1993, s JA Hanley ve BJ McNeil, The Meaning and Use of the Area Under a Receiver Operating Characteristic (ROC) Curve, Radiology, Vol.143, No.1, 1982, s JA Hanley ve BJ McNeil, A Method of Comparing the Areas Under Receiver Operating Characteristic (ROC) Curves Derived from the Same Cases, Radiology, Vol.148, No.3, 1983, s RF Raubertas, RE Rodewald, SG Humiston ve PG Szilagyi. ROC Curves for Classification Trees, Medical Decision Making, Vol.14, No.2, 1994, s AN Tosteson ve CB Begg, A General Regression Methodology for ROC Curve Estimation, Medical Decision Making, Vol.8, No.3, 1988, s.204, (27 Ekim 2009). 73 M. Coffin ve S. Sukhatme, Receiver Operating Characteristic Studies and Measurement Errors, Biometrics, Vol. 53, No.3, 1997, s.823, (04 Temmuz 2011). 39

55 Coffin ve Sukhatme, 1997 yılında yayınlanmış olan Receiver Operating Characteristic Studies and Measurement Errors isimli çalışmada ölçme hatası yapılması durumunda ROC eğrisi kestiriminin de sapmalı bulunacağını öne sürerek sapma düzeyini kestirmeye ve sapma düzeltici kestirimcilerle sapmayı en aza indirmeye dönük bir yaklaşım geliştirmişlerdir. 74 Obuchowski ve McClish tarafından 1997 yılında yazılan Sample Size Determination for Diagnostic Accuracy Studies Involving Binormal ROC Curve Parameters adlı çalışmada, iki değişkenli normal dağılıma uyan ROC eğrisinin parametre kestirimi için örnek hacminin belirlenmesi ile ilgili bir yaklaşım öne sürülmüştür. 75 Hajian-Tilaki ve Hanley tarafından 2002 yılında hazırlanan Comparison of Three Methods for Estimating the Standard Error of the Area Under the Curve in ROC Analysis of Quantitative Data isimli çalışmada, ROC eğrisinin değerlendirilmesinde en sık yararlanılan gösterge olan AUC değerinin standart hatasının kestiriminde üç yöntemin geçerliliği metrik veri için karşılaştırılmıştır. 76 Nakas ve Yiannoutsos tarafından 2004 yılında yazılan Ordered Multiple-Class ROC Analysis with Continuous Measurements adlı çalışmada, üç ve üçten fazla sınıf mevcutken ROC eğrisinin üç boyutlu olarak elde edilebileceği ve ROC yüzeyinin hacmi hesaplanarak değerlendirmelerin bu değere göre yapılabileceği ortaya konulmuştur. 77 ROC eğrisi analizi ile ilgili mevcut olan başlıca çalışmaların kronolojik sıra ile gösterimi Tablo 1 de verilmiştir: 74 NA Obuchowski. ve DK McClish, Sample Size Determination for Diagnostic Accuracy Studies Involving Binormal ROC Curve Parameters, Statistics in Medicine, Vol.16, No.13, 1997 s. 1529, (04 Temmuz 2011). 75 CT Nakas ve CT.Yiannoutsos, Ordered Multiple-Class ROC Analysis with Continuous Measurements, Statistics in Medicine, Vol.23, No.22, 2004, s KO Hajian-Tilaki ve JA Hanley, Comparison of Three Methods for Estimating the Standard Error of the Area Under the Curve in ROC Analysis of Quantitative Data, Academic Radiology, Vol.9, No.11, 2002, s.1278, (27 Ekim 2009). 40

56 Tablo 1. ROC Eğrisi Analizi için Genel Yazın Özeti Yazar Yıl ÇalıĢma DM Green ve JA Swets 1966 Signal Detection Theory and Psychophysics DD Dorfman ve Edward Jr.Alf 1968 Maximum Likelihood Estimation of Parameters of Signal Detection Theory LB Lusted 1971 Signal Detectability and Medical Decision Making JP Egan 1975 Signal Detection Theory and ROC Analysis D. Bamber 1975 The Area Above the Ordinal Dominance Graph and the Area Below the Receiver Operating Characteristic Graph CE Metz 1978 Basic Principles of ROC Analysis JA Hanley ve BJ McNeil 1982 JA Swets ve RM Pickett 1982 JA Hanley ve BJ McNeil 1983 The Meaning and Use of the Area Under a Receiver Operating Characteristic(ROC) Curve Evaluation of Diagnostic Systems: Methods from Signal Detection Theory A Method of Comparing the Areas under Receiver Operating Characteristic (ROC) Curves Derived from the Same Cases CE Metz 1986 ROC Methodology in Radiology Imaging AN Tosteson ve CB Begg 1988 ER DeLong, DM DeLong ve DL Clarke-Pearson RF Raubertas, RE Rodewald, SG Humiston ve PG Szilagyi 1988 F. Hsieh ve BW Turnbull 1996 M. Coffin ve S. Sukhatme, 1997 NA Obuchowski. ve DK McClish G. Li, RC. Tiwari ve MT Wells A General Regression Methodology for ROC Curve Estimation Comparing the Areas Under Two or More Corelated Receiver Operating Characteristic Curves: A Nonparametric Approach 1994 ROC Curves for Classification Trees KH Zou ve WJ Hall 2000 Nonparametric and Semiparametric Estimation of the Receiver Operating Characteristic Curve Receiver Operating Characteristic Studies and Measurement Errors Sample Size Determination for Diagnostic Accuracy Studies Involving Binormal ROC Curve Parameters Semiparametric Inference for a Quantile Comparison Function with Applications to Receiver Operating Characteristic Curves Two Transformation Models for Estimating an ROC Curve Derived from Continuous Data D. Faraggi ve B. Reiser 2002 Estimation of the Area under The ROC Curve KO Hajian-Tilaki ve JA Hanley J. Qin ve B. Zhang, 2003 Comparison of Three Methods for Estimating the Standard Error of the Area Under the Curve in ROC Analysis of Quantitative Data Using Logistic Regression Procedures for Estimating Receiver Operating Characterictic Curves 41

57 Z. Zhang 2004 T. Fawcett 2004 CT Nakas ve CT Yiannoutsos 2004 M. Gönen 2007 CE Metz 2008 Least Squares Analysis of the Receiver Operating Characteristic Curve ROC Graphs: Notes and Practical Considerations for Researchers Ordered Multiple-Class ROC Analysis with Continuous Measurements Analyzing Receiver Operating Characteristic Curves Using SAS ROC Analysis in Medical Imaging: A Tutorial Review of the Literature WJ. Krzanowski ve DJ. Hand 2009 ROC Curves for Continuous Data Kaynak: Yazar tarafından derlenmiş ve oluşturulmuştur. Karar destek sistemleri arasındaki ayırım etkilerinin değerlendirilmesinde, farklı sınıflandırma tekniklerinin ve model doğruluklarının karşılaştırılmasında kullanılan ROC eğrisi analizinden, veri madenciliği alanında da sıklıkla yararlanılmaktadır. 78,79 Gündelik yaşamda istatistiksel kestirimlere pek çok alanda başvurulmaktadır. Ulaşım, tarım gibi birçok yaşamsal faaliyet üzerinde etkili olan hava durumu kestirimlerinin doğruluk oranına ilişkin hata payını bilmek önemlidir. Kredi başvurusu yapan kişi için kredi verme kararında ve uygulanacak faiz oranın belirlemesinde borç ödeme olasılığının doğru olarak kestirilmesi istatistiksel kestirimciler kullanılarak mümkün olabilmektedir. İstatistiksel kestirimlerden sıklıkla yararlanılan diğer bir alan tıbbi karar verme sürecidir. Belirli şikâyetlerle hastalık belirtisi gösteren kişiler için konulan tıbbi tanı daha sonraki değerlendirmeler ve tedaviler üzerinde etkili olacağından, tanının doğruluk düzeyinin saptanması önemlidir. Tanı koymada maliyete ve hastanın taşıdığı riske göre değişen, genellikle birden fazla test kullanılır ve elde edilen sonuçların etkinliğinin karşılaştırılmasıyla tanıya ilişkin değerlendirmeler yapılır. Örneklerde de belirtildiği gibi gelecek planları tüm sektörlerde, istatistiksel analizlerle 78 L. Kallin Westin, Receiver Operating Characteristic Curve Analysis Evaluating Discriminance Effects Among Decision Support Systems, Sweden: Umeå Universitet - Department of Computing Science, 2001, s.5. www8.cs.umu.se/research/reports/2001/018/part1.pdf 79 P.Flach, H. Blockeel, C. Ferri, J. Andez-Orallo, ve J. Struyf, Decision Support for Data Mining: An Introduction to ROC Analysis and Its Applications, Data Mining and Decision Support: Integration and Collaboration, Vol. 745, 2003, s (04 Temmuz 2011). 42

58 elde edilen kestirimlere göre şekillenmekte ve kestirimlerin doğruluk düzeyini bilmek atılacak her adımda yol gösterici olmaktadır. 80 Araştırmanın niteliğine göre ROC eğrisi için kestirimlerin adlandırılmasında farklı kullanımlar mevcuttur. Tablo 2 de kullanım alanına bağlı olarak farklı nitelendirmelere sahip değişkenlerden yaygın olarak kullanılanları gösterilmiştir: Tablo 2. ROC Eğrisi Bileşenleri İçin Genel Bir Adlandırma Bağımsız değiģken Bağımlı değiģken Bağımlı değiģkenin kestirim/öngörü değerleri Kestirimci Belirtici Skor/puan Öngörü Sonuç Durum Altın standardı Gösterge Gözlem - Kontrol Hasta - Sağlıklı Pozitif Negatif Var - Yok İsabetli - İsabetsiz Kaynak: Mithat Gönen, Analyzing Receiver Operating Characteristic Curves Using SAS, Cary, NC: SAS Press, 2007, s ROC Eğrisi Analizinde Kullanılan Temel Kavramlar ROC eğrisi duyarlılık, x ise (1-özgüllük) oranına karşılık gelir. biçiminde bir matematiksel fonksiyon ile ifade edilirse y bir fonksiyon olup koordinat eksenin birinci bölgesinde yer alır. fonksiyonu monoton artan Duyarlılık ve (1-özgüllük) oranlarına ilişkin kestirim değerleri birer koşullu olasılık olup, sınıflandırma eşiği t nin değişen değerlerine göre belirlenir. Her bir farklı t değeri için elde edilen duyarlılık ve (1-özgüllük) çiftlerinin çakışım noktalarının koordinat ekseni üzerinde birleştirilmesiyle ROC eğrisi oluşturulur. 81 Y gibi bir değişkene sahip olunduğu, bu değişkenin pozitif ve negatif olarak adlandırılan iki olguyu kapsadığı varsayılsın. m<n, ve olmak üzere Y değişkeninin birim değerleri biçiminde gösterilebilir. 80 Mithat Gönen, Analyzing Receiver Operating Characteristic Curves Using SAS, Cary, NC: SAS Press,2007, s.1 ve 2.. Belirli bir tanım aralığında yer alıp bu aralığın tamamında artış gösteren fonksiyona monoton artan fonksiyon denir. 81 Krzanowski ve Hand, s

59 Test sonucu Belirli bir sınıflandırma kuralına göre yapılacak rassal ayırımın ardından Y değişkeni, eşitliğini sağlayan m adet pozitif ve eşitliğini gerçekleyen (n-m) adet negatif olguyu temsil eden iki sınıfa ayrılır. Sınıfların ayırımı büyük ya da küçük değerler dikkate alınmaksızın rassal olarak yapıldığından P sınıfında bulunan birimlerin N sınıfında da bulunması mümkündür. Tablo 3 te indis notasyonları ile gösterilen gözlem sayıları için ve eşitlikleri geçerlidir. Tablo 3. ROC Eğrisi Kestirimcileri için Doğru Atama(Kontenjans) Tablosu Gerçek durum i j Pozitif Negatif Toplam Pozitif Negatif Toplam Kaynak: Mithat Gönen, Analyzing Receiver Operating Characteristic Curves Using SAS, Cary, NC: SAS Press, 2007, s.6 ile Tom Fawcett, An Introduction to ROC Analysis, Pattern Recognition Letters, 2006, Vol.27, No. 8, s.862 kaynaklarından derlenerek yazar tarafından oluşturulmuştur. Tablo 3 teki değerler için şu eşitlikler söz konusudur: 82 (2.1) (2.2) Test edilecek değişkenin sürekli olması durumunda belirli bir eşik değer kullanılarak değişken iki sonuçlu hale getirilir. Buna göre t gibi bir eşik değer için değişkenin t ye eşit ya da t den düşük değerleri negatif (N), t den yüksek olan değerleri ise pozitif (P) olarak sınıflandırılır Krzanowski ve Hand, s Krzanowski ve Hand, s.7. 44

60 Yapılan sınıflandırmanın doğruluk düzeyinin değerlendirilmesinde, koşullu olasılıklar aracılığı ile kurulan ve Tablo 3 te gösterilmiş olan doğru atama tablolarından yararlanılır. Doğru atama tabloları, gerçek ve kestirilen sınıf değerlerine dayalı olarak P ve N sınıflarındaki her bir birim değerinin eşik değer ile karşılaştırılmasıyla elde edilir. Eşik değer, alt sınırı P ve N sınıflarındaki birimlerin en küçük değeri, üst sınırı ise P ve N sınıflarındaki birimlerin en büyük değeri olan ve bu aralıkta farklı değerler alabilen bir değişkendir. 84 P ve N sınıflarının Y değişken değerlerinden oluşturulduğu göz önüne alındığında T olarak ifade edilen eşik değer değişkeninin birim değerleri Y değişkeninin kestirilen değerlerine dayalı olarak şu biçiminde gösterilebilir: Y değişkeninin birim değerleri iken Y değişkeninin kestirilen değerleri olmak şartı ile olarak ifade edilir. Her bir farklı kestirim değeri için olmak üzere, ) biçiminde k adet eşik değeri mevcuttur. Sınıflara ve eşik değere ilişkin olarak yapılan açıklamalar ile Tablo 3 teki değerlerden hareketle, ve olmak üzere belirli bir sınıfa ait kestirilen koşullu olasılıklar şu şekilde ifade edilebilir: Duyarlılık (Doğru Pozitif Oranı, DPO)= Gerçekte pozitif olan tüm olgular içinden, uygulanan test sonucunda pozitif bulunan olguların oranını verir. (2.3) Özgüllük (Doğru Negatif Oranı, DNO)= Gerçekte negatif olan tüm olgular içinden, test sonucunda negatif bulunanların oranını gösterir. (2.4) 84 Mevlüt Türe, (mevlut.ture@adu.edu.tr), ROC Eğrisinde Eşik Değer Kavramı, Burcu Köksal a kişisel e-posta, [brckoksal@gmail.com] (29 Aralık 2010). 45

61 (1-Özgüllük; Yanlış Pozitif Oranı, YPO)= oranını belirtir. Gerçekte negatif olan tüm olgular içinden, test sonucunda pozitif bulunanların (2.5) YNO (Yanlış Negatif Oranı)= (2.2) ifadesinden hareketle elde edilen ve DPO oranını tamamlayıcı nitelikte olan diğer bir koşullu olasılık yanlış negatif oranıdır. Gerçekte pozitif olan tüm olgular içinden, test sonucunda negatif bulunanların oranını gösterir. (2.6) DPO, gerçekte P sınıfına ait olan birimin, birim değeri t değerinin üstünde olduğundan, doğru olarak P sınıfına atanması durumunda ortaya çıkacak doğru sınıflandırmayı gösterir. DNO, gerçekte N sınıfına ait olan birimin, birim değeri t eşik değerine eşit ya da ondan küçük olduğundan, doğru olarak N sınıfına atanması durumunda ortaya çıkacak doğru sınıflandırmayı belirtir. YPO, gerçekte N sınıfına ait olan birimin, birim değeri t değerinin üstünde olduğundan, hatalı olarak P sınıfına atanması durumunda ortaya çıkacak yanlış sınıflandırmayı belirtir. YNO ise, gerçekte P sınıfına ait olan birimin, birim değeri t eşik değerine eşit ya da ondan küçük olduğundan, hatalı olarak N sınıfına atanması durumunda ortaya çıkacak yanlış sınıflandırmayı belirtir. 85 Sınıflandırmaya ilişkin yapılan kestirimler için aşağıdaki olasılık değerlerinin de tanımlanması mümkündür: 86 Pozitif Öngörü Değeri (PÖD) Gerçekte P sınıfına ait olan tüm birimler arasından sınıflandırma kuralına göre P sınıfına atanan belirli birimleri gösterir. (2.7) 85 Krzanowski ve Hand,s.8 ve Gönen, s.8. 46

62 Negatif Öngörü Değeri (NÖD) ) Gerçekte N sınıfına ait olan tüm birimler arasından sınıflandırma kuralına göre N sınıfına atanan belirli birimleri gösterir. (2.8) Doğruluk (Doğru Sınıflandırma Oranı, DSO) Doğru sınıflandırma oranı olarak da adlandırılabilecek olan bu oran gerçekte pozitif ve negatif olan tüm olgular içinden, uygulanan test sonucuna göre pozitif ve negatif olarak kestirilenlerin oranını gösterir. (2.9) Yanlış Sınıflandırma Oranı (YSO) t eşik değerinden daha büyük birim değerine sahip olmasına karşın hatalı olarak N sınıfına atanan veya t eşik değerine eşit ya da ondan daha küçük birim değerine sahip olmasına karşın hatalı olarak P sınıfına atanan birimlere ilişkin toplam olasılığı belirtir. (2.10) ROC eğrisi kestiriminde yararlanılan DPO, YPO, DNO ve YNO koşullu olasılıklarının elde ediliş mantığının hipotez testindeki hata tipleri ile ilişkilendirilebilir olduğu söylenebilir. Kavramsal karşılaştırma yapmadan önce hata tiplerine ilişkin bir ön bilgi verilmesi yerinde olur. Tablo 4. Birinci ve İkinci Tip Hatalar Gerçek durum Test Sonucu (Karar) H 0 Doğru H 0 Yanlış H 0 Kabul Doğru karar (1-α) ΙΙ. tip hata(β) H 0 Red Ι. tip hata(α) Doğru karar(1-β) Kaynak: Mustafa Aytaç, Matematiksel Ġstatistik, 3. Baskı, Ezgi Kitabevi, Bursa, 2004, s

63 Ι. tip hata (α): Testin anlamlılık düzeyi olarak da bilinir ve gerçekte doğru olan yokluk hipotezini reddetme olasılığını verir. ΙΙ. tip hata (β): Gerçekte yanlış olan yokluk hipotezinin reddedilememe olasılığıdır. 1-α: Testin güvenirlik düzeyi olup, gerçekte doğru olan yokluk hipotezinin reddedilememe olasılığına karşılık gelir. 1-β: Testin gücünü belirtir ve gerçekte yanlış olan yokluk hipotezini reddetme olasılığını verir. Tablo 3 ve Tablo 4 ten hareketle, DPO ve YPO oranları ile birinci ve ikinci hata tipleri arasında şöyle bir bağıntı kurulabilir: (2.11) (2.12) Bu durumda, elde ediliş bakımından DPO oranının testin güvenirlik düzeyi ile, YPO oranının ise İkinci Tip Hata ( ) ile özdeş olduğu söylenebilir. 2.2 ROC Eğrisinin Özellikleri Değişen sınıflandırma eşik değerlerine ( ) göre hesaplanan DPO ve YPO koşullu olasılıklarının koordinat ekseni üzerinde sırasıyla X ve Y eksenlerinde yer aldığı ve ROC eğrisinin bu çakışım noktalarının birleştirilmesiyle elde edildiği bilgisinden hareketle eşik değerler ile kestirilen olasılık değerleri arasında şu şekilde bir ilişki kurulması mümkündür. 87 (2.13) (2.14) 87 Krzanowski ve Hand, s

64 olmak üzere, t değiştikçe ve nin birlikte artıp azaldığı; fonksiyonunun da tanım aralığında konumlanan monoton artan bir fonksiyon olduğu söylenebilir. Değişken sürekli yapıda ise, kestirilen ROC eğrisinin eğimi, türev hesabı ile şu biçimde belirlenir: (2.15) Buradan hareketle, elde edilir. (2.16) (2.15) ve (2.16) ifadeleri kullanılarak şu son eşitliğe ulaşılır: (2.17) 2.3 ROC Eğrisinin Değerlendirilmesinde Yararlanılan Göstergeler Kestirilen koşullu olasılık çiftlerinin birleştirilmesiyle elde edilen ROC eğrisinin etkinliğinin değerlendirilmesinde sıklıkla kullanılan göstergeler AUC ile Tekil Noktalar ve Parçalı Alanlar olup; Youden Indeksi (YI) ve En Yüksek Dikey Uzaklık (Maximum Vertical Distance, MVD) da seçenek olarak geliştirilen diğer iki göstergedir AUC AUC, P ve N sınıflarının ayırım etkinliği ile kestirilen ROC eğrisinin performansının değerlendirilmesinde ve model doğruluklarının karşılaştırılmasında 88 Krzanowski ve Hand, s

65 yaygın olarak kullanılan bir göstergedir. AUC un tanım aralığı olup, 0,5 ve 1 sırasıyla alt ve üst sınırları oluşturmaktadır. AUC değerinin alt sınıra eşit bulunması rassal ayrımı ifade eden köşegen çizgisinin altındaki alanı belirtir. AUC değerinin üst sınıra eşit bulunması ise tam ayırımı ifade etmektedir. Modelin ayırım gücü, Tablo 5 te verilen AUC a ilişkin değer aralıkları dikkate alınarak değerlendirilmektedir. Tablo 5. Modelin Ayırım Gücünün AUC Değerlerine Göre Değerlendirilmesi AUC =0,5 Model ayırım gücüne sahip değildir 0,5 <AUC < 0,7 Model zayıf ayırım gücüne sahiptir 0,7 AUC < 0,8 Model kabul edilebilir bir ayırım gücüne sahiptir 0,8 AUC < 0,9 Model mükemmel bir ayırım gücüne sahiptir 0,9 AUC Model üstün bir ayırım gücüne sahiptir Kaynak:, N Ronald Forthofer, Eun Sul Lee ve Mike Hernandez. Biostatistics: A Guide to Design, Analysis and Discovery. 2nd Ed., United States of America: Elsevier Academic Press, 2007, s ,9 AUC durumu N nitelikli birimlerin neredeyse tümünün N sınıfına, P nitelikli birimlerin de yaklaşık olarak hepsinin P sınıfına atandığını, yani model ile tam bir sınıf ayrımı yapıldığını belirtir. Uygulamada ender rastlanılan bir durum olup modelle ilgili bir sorunun göstergesi olabilir. 89,90 Ek.1 de mevcuttur. Bu durumun uygulamalı örneği AUC değerinin kestiriminde ve değerlendirilmesinde, değişkenlerin ölçüm yapısına ve dağılım biçimine bağlı olarak farklılık gösteren çeşitli yaklaşımlardan yararlanılmaktadır. Değişkenlerin ölçüm yapısı dikkate alınmadan yapılan AUC kestiriminde elde edilen sonuçlar yanıltıcı olabilmektedir. Bu nedenle farklı veri yapıları için farklı araştırmacılar tarafından geliştirilen parametrik, yarı parametrik ve parametrik olmayan yaklaşımlar mevcut olup, bu yaklaşımlara göre elde edilen kestirimlerin etkinlik düzeyleri arasında da farklılıklar olduğu öne sürülmektedir. Esas olarak normal 89 Hosmer ve Lemeshow, s Merle Grobbel, Implementing Climate Change Measures in the EU: Key Success Factors, Wiesbaden : VS Verlag fur Sozialwissenschafte, 2009, s

66 dağılımlı veriler için AUC kestiriminde parametrik yaklaşımlar benimsenirken, normal dağılım göstermeyen veri yapıları için parametrik olmayan yaklaşımlar söz konusudur. AUC değerinin, Gini katsayısı ve Lorenz eğrisi ile olan ilişkiye bağlı olarak hesaplanabildiği bir yöntem de geliştirilmiştir. Parametrik, yarı parametrik ve parametrik olmayan yaklaşımlar ile AUC kestiriminden önce Gini katsayısına dayalı olan bu yönteme değinilecektir. Y ekseninde milli gelirin, X ekseninde ise nüfusun birikimli yüzdelerinin yer aldığı koordinat düzleminde çakışan yüzde çiftlerinin birleştirilmesiyle oluşturulan Lorenz eğrisi, gelir dağılımını açıklamaya dönük grafiksel bir gösterimdir. Eğrinin, düzlemde yer alan köşegen çizgisi ile çakışması durumunda gelir dağılımında tam eşitlik söz konusu olur. Eğrinin köşegen çizgisinin altında konumlanması, gelir dağılımında bozulma olduğunun göstergesidir. Gini katsayısı, gelir dağılımındaki eşitsizliği ölçmek üzere Lorenz eğrisine bağlı olarak hesaplanan bir katsayı olup AUC ile bu anlamda benzerlik gösterir. Lorenz eğrisi ve köşegen çizgisi arasında kalan alanın, köşegenin altında kalan toplam alana oranlanması ile elde edilir. [0,1] tanım aralığında değer alan Gini katsayısının 0 a yakın olması adil bir gelir dağılımını, 1 e yakın olması ise gelir dağılımında eşitsizliği belirtir. ROC eğrisinin de DPO ve YPO oranları arasındaki eşitsizliği yani ayırım etkinliğini verdiği dikkate alındığında ROC ve Lorenz eğrilerinin özdeş olduğu söylenebilir. Hem Lorenz eğrisi hem de ROC eğrisi için köşegen çizgisinin altındaki alan 0,5 olup, Gini katsayısı ile AUC arasında şöyle bir ilişki kurulması mümkündür. 91 (2.18) 91 Krzanowski ve Hand, s

67 Parametrik YaklaĢıma Göre AUC Kestirimi AUC kestiriminde ve ROC eğrisinin oluşturulmasında yararlanılan koşullu olasılıkların parametrik varsayımlar dikkate alınarak elde edildiği söylenebilir. Parametrik yaklaşıma göre sürekli yapıdaki değişkenler için koşullu olasılık kestirimlerinin iki değişkenli normal (binormal veya bivariate normal) dağılıma uyduğu, dolayısıyla da oluşturulacak ROC eğrisinin sürekli bir eğri olacağı varsayılır. Normal dağılım varsayımlarına dayanılarak AUC kestirimi yapılabileceği fikri ilk olarak Green ve Swets tarafından 1966 da ortaya atılmıştır. 92 Dorfman ve Alf, iki değişkenli normal dağılım gösteren ROC eğrisinin parametre kestirimlerini EÇO Yöntemi ile elde eden RSCORE adlı bir yazılım geliştirmişlerdir. 93 Algoritmaları Charles E. Metz, Benjamin A.Herman, Jong-Her Shen, Helen B. Kronman ve Pu-Lan Wang tarafından tasarlanan, Jong-Her Shen, Helen B. Kronman, ve Pu-Lan Wang ın katkılarıyla Benjamin A. Herman tarafından yazılan; ayrıca ROCFIT, INDROC, LABROC, CORROC ve CLABROC gibi programların güncelleştirilmiş bir sürümü olan ROCKIT; sürekli dağılan veya sıralı kategorik yapıda olan test değişkeni için iki değişkenli normal dağılıma uyan ROC eğrisi kestirimi ile test doğruluğunun bir ölçüsü olarak tanımlanan AUC kestirimi için geliştirilen diğer bir yazılımdır. 94, Pozitif ve negatif olarak adlandırılan iki olguyu kapsayan ve sürekli yapıda olan Y değişkeninin sırasıyla m ve (n-m) adet olguyu temsil eden P ve N sınıfları için birim değerlerinin ortalama ve varyans ile standart normal dağılıma uyduğu varsayılır. 95 Değişen t eşik değerleri için türetilen ve X ekseninde yer alan YPO ile Y ekseninde bulunan DPO koşullu olasılık kestirimlerinin genel fonksiyonel yapıları şu biçimdedir: 92 Green ve Swets, s.58 ve Dorfman ve Alf, s CE Metz, ROCKIT 0.9 B - IBM compatable ROCKIT User s Guide, Chicago: The University of Chicago, Department of Radiology, 1998, s.10. CE Metz ve HB Kronman. Computer Programs: ROCKIT, ROCFIT, LABROC, CORROC, CLABROC, INDROC. Available from CE Metz, Department of Radiology, University of Chicago, Chicago, IL. 95 Krzanowski ve Hand, s

68 (2.19) Normal dağılımın simetrik yapıda olduğu göz önüne alınırsa eşitlik şu şekilde de gösterilebilir: (2.20) (2.21) Benzer şekilde normal dağılımın simetrik yapıda olduğu düşünülürse (2.21) eşitliği şöyle de yazılabilir: (2.22) dağılıma ilişkin Eğer birikimli standart normal dağılım fonksiyonu( ), standart normal gibi bir değer ile elde ediliyorsa şu eşitlik geçerli olur: (2.23) ulaşılır: (2.23) ifadesinde elde edilen t eşitliği (2.22) de yerine yazılırsa şu eşitliğe (2.24) edilir: (2.24) ifadesinin düzenlenmesi ile ROC eğrisinin fonksiyonel gösterimi elde (2.25) ise (2.25) deki olduğu varsayılır. ifadeleri sırasıyla kesişim ve eğim katsayıları olup, ve (2.26) Normal dağılım olasılık yoğunluk fonksiyonu: Birikimli standart normal dağılım fonksiyonu: 53

69 aracılığı ile şu şekilde elde edilir: 96 parametrelerinin varyans ve kovaryansları, kestirimcileri (2.27) (2.28) (2.29) Şekil 1 de iki değişkenli normal dağılım modellerinden türetilmiş olan üç ROC eğrisi örneği bulunmaktadır. ġekil 1. Parametrik Yaklaşıma Göre Kestirilen ROC Eğrileri Kaynak: Wojtek J. Krzanowski ve David J. Hand. ROC Curves for Continuous Data. Chapman and Hall/CRC, s.33 ROC eğrisinin sol üst köşeye en yakın olması açısından ayırım etkinliği en iyi olanın en üstteki eğri olduğu söylenebilir. 96 Ferhan Elmalı, Altın Standartlı ve Altın Standartsız Durumlarda Parametrik, Yarı Parametrik ve Parametrik Olmayan ROC Eğrisi Yöntemlerinin KarĢılaĢtırılması, Yayınlanmamış Doktora Tezi, Eskişehir Osmangazi Üniversitesi, Sağlık Bilimleri Enstitüsü Biyoistatistik Anabilim Dalı, 2009, s.9. 54

70 AUC kestiriminin genel biçimsel gösterimi (2.30) daki gibidir: 97 (2.30) iken ve iken olduğu göz önüne alınır ve buna göre (2.30) ifadesinde değişken değişimi yapılırsa şu ifadeye ulaşılır: (2.31) (2.31) deki integral içi ifadelerin (2.15) ve (2.17) de verilen karşılıkları yerlerine yazılırsa yeni gösterim şöyle olur: (2.32) (2.32) ifadesinde işaretsel düzeltmeler yapılırsa şu eşitliğe ulaşılır: (2.33) (2.26) da verilmiş olan kesişim ve eğim parametreleri ile (2.33) ifadesi dikkate alınarak AUC kestiriminde (2.34) ifadesinden yararlanılır: (2.34) (2.34) deki eşitliğin açık ifadesi şu şekildedir: (2.35) Kestirilen AUC değerinin varyansı ise kestirilen parametre varyansları aracılığı ile (2.36) ifadesinde belirtildiği gibi elde edilir: 98 (2.36) 97 Krzanowski ve Hand, s.26. Standart normal bir değişken. 98 Elmalı, s

71 (2.36) eşitliğinde yer alan f 1 ve f 2 ifadeleri ise şu şekilde hesaplanır: (2.37) (2.38) AUC un [0,5-1,0] tanım aralığında değer aldığı ve ancak 0,5 ten büyük değerler için anlamlı olabileceği düşünülürse, AUC için yokluk hipotezi ile alternatif hipotezin ve şeklinde tek taraflı olarak kurulması uygun olur. (2.39) (2.39) da verilen test istatistiğinden elde edilecek sonuca göre AUC değerinin istatistiksel olarak anlamlı olup olmadığına karar verilir Parametrik Olmayan YaklaĢıma Göre AUC Kestirimi Normal dağılım göstermeyen veriler için ROC eğrisi kestiriminin parametrik yaklaşıma göre yapılması hatalı sonuçların ortaya çıkmasına neden olmaktadır. Bu tür veriler için yapılacak ROC eğrisi kestiriminde herhangi bir dağılım varsayımı içermeyen parametrik olmayan yaklaşımlar geliştirilmiştir. 99 Ancak bu yaklaşımlar ile elde edilen ROC eğrisi düz bir eğri olmamakta bu da AUC yorumunda bilgi kaybına neden olabilmektedir. Qin ve Lejla Hotilovac tarafından, 2008 yılında yazılan Comparison of Nonparametric Confidence Intervals for the Area Under the ROC Curve of a Continuous-Scale Diagnostic Test isimli çalışmada, parametrik yaklaşımla elde edilen AUC kestirimlerinde P ve N sınıflarına ait dağılım yapıları için oluşturulan aralığın kısıtlı olduğu belirtilmektedir. Parametrik yaklaşım ile elde edilen AUC kestirimleri için diğer bir olumsuz özellik, elde edilen kestirim sonuçlarının model varsayımlarına karşı duyarlı olmasıdır Jiezhun Gu, Subhashis Ghosal ve Anindya Roy. Non-parametric Estimation of ROC Curve, Institute of Statistics Mimeo Series North Carolina state University, No. 2592, 2006, s Gengsheng Qin ve Lejla Hotilovac, Comparison of Non-parametric Confidence Intervals for the Area Under the ROC Curve of a Continuous-Scale Diagnostic Test, Stat Methods Med Res, Vol.17, No.2, 2008, s

72 DPO AUC kestirimi için kullanılan parametrik olmayan yaklaşımlardan biri trapez kuralıdır. Bu kurala göre, DPO ile YPO çiftlerinin çakışım noktalarının birleştirilmesi ile elde edilen ROC eğrisini oluşturan geometrik şekillerin alanlarının toplanmasıyla AUC değerine ulaşılır. 1 0,8 0,6 0,4 0,2 A 1 A 2 A 3 A 4 A ,2 0,4 0,6 0,8 1 YPO ġekil 2 Parametrik Olmayan Yaklaşıma Göre Kestirilen ROC Eğrisi Kaynak: Yazar tarafından oluşturulmuştur. Rassal olarak belirlenen koşullu olasılıklarla oluşturulan Şekil 2 deki ROC eğrisine ilişkin AUC değeri, trapez kuralına göre geometrik alanların toplanması ile şeklinde elde edilir. Bamber tarafından, 1975 yılında hazırlanan The Area Above the Ordinal Dominance Graph and the Area Below the Receiver Operating Characteristic Graph adlı çalışmada, iki sınıfa ilişkin birim dağılımının karşılaştırılmasında kullanılan Mann Whitney U test istatistiğinin trapez kuralı ile bulunan AUC değeri ile eşdeğer olduğu öne sürülmektedir. 101 AUC ve Wilcoxon-alan kestirimi olarak da ifade edilebilen Mann Whitney U istatistiği arasındaki ilişki, m ve (n-m) sırasıyla P ve N sınıflarının birim sayısı; U: 101 D. Bamber, The Area Above the Ordinal Dominance Graph and the Area Below the Receiver Operating Characteristic Graph. Journal of Math. Psychology, Vol.12, No.4, 1975, s (04 Temmuz 2010). 57

73 Mann-Whitney U test istatistiği, R N : Negatif sınıfın sıra toplamı olmak üzere (2.40) daki gibi gösterilebilir: 102,103 (2.40) Kestirilen AUC değerine ilişkin varyans ise (2.41) daki ifade ile hesaplanır: 104 (2.41) (2.42) Q 1 : Rassal olarak seçilen ve pozitif olduğu bilinen iki olgunun, negatif olduğu bilinen bir olgudan daha yüksek değer alma olasılığı. Q 2 : Rassal olarak seçilen ve negatif olduğu bilinen iki olgunun, pozitif olduğu bilinen bir olgudan daha yüksek değer alma olasılığı. SPSS programında da AUC değerinin kestiriminde parametrik olmayan yaklaşım esas alındığından, ROC eğrisi analizi ile bulunan AUC değeri ile Mann- Whitney-U test istatistiği aracılığı ile kestirilen AUC değeri aynı olmaktadır. Swets ve Pickett tarafından, 1982 yılında hazırlanan Evaluation of Diagnostic Systems: Methods from Signal Detection Theory isimli çalışmada da, iki sınıfa ilişkin birim dağılımı benzerliğinin bir ölçüsü olan Mann Whitney U test istatistiğinin, AUC değerinin parametrik olmayan sapmasız bir kestirimcisi olduğu belirtilmektedir. Ancak, trapez kuralına göre AUC değeri sapmalı olarak kestirildiğinden Mann Whitney U test istatistiğine ve trapez kuralına göre kestirilen AUC değerlerinin aynı olamayacağı öne sürülmektedir. 105 Trapez kuralına göre elde edilen kestirimler sapmalı olduğundan, bilgisayar programlarından ulaşılan sonuçların daha tercih edilir olduğu söylenebilir. 102 Faraggi, s ve M. Greiner ve Diğerleri, Principles and Practical Application of the Receiver-Operating Characteristic Analysis for Diagnostic Tests, Preventive Veterinary Medicine, Vol.45, No.1, 2000, s Hanley ve. McNeil, The Meaning and Use of the Area under a Receiver Operating Characteristic(ROC) Curve, s.32 ve JA Swets ve RM Pickett, Evaluation of Diagnostic Systems: Methods from Signal Detection Theory. Academic Press,New York,

74 ER DeLong, DM DeLong ve DL Clarke-Pearson, 1988 yılında yayınlanan Comparing,Areas Under Two or More Corelated Receiver Operating Characteristic Curves: A Nonparametric Approach adlı çalışmalarında, iki ve daha fazla ilişkili AUC değerinin karşılaştırılması için genelleştirilmiş U istatistiğine dayanan parametrik olmayan bir yaklaşım sunmuşlardır. 106 Qin ve Zhou, 2006 yılında yayınlanan Empirical Likelihood Inference for the Area Under the ROC Curve isimli çalışmalarında kapsamlı benzetimler ile çeşitli yöntemler kullanılarak elde edilen kestirimlerin doğruluk ve etkinliklerini karşılaştırmışlardır Yarı Parametrik YaklaĢıma Göre AUC Kestirimi ROC eğrisi kestiriminde kullanılan parametrik ve parametrik olmayan yaklaşımların içerdiği dezavantajlara alternatif olarak geliştirilen yarı parametrik yaklaşımlar mevcuttur. Yarı parametrik yaklaşıma göre yapılan kestirim, parametrik ve parametrik olmayan yaklaşımlarla elde edilen kestirimlere göre daha güçlüdür. Dolayısıyla yarı parametrik yaklaşım ile kestirilen ROC eğrisi, parametrik olmayan yaklaşıma göre kestirilen ROC eğrisinden daha düzgündür. ROC eğrisi kestirimi için farklı araştırmacılar tarafından geliştirilen çeşitli yarı parametrik yaklaşımlar mevcuttur. En kolay ve en eski yaklaşımlardan biri, Green ve Swets tarafından geliştirilen, 1966 yılında yayınlanan Signal Detection Theory and Psychophysics adlı çalışmada yer verilen, belirli monoton artış dönüşümlerin ardından test değişkeninin iki değişkenli normal dağılacağını varsayan iki değişkenli normal model yaklaşımıdır. 108 Hsieh ve Turnbull tarafından 1996 yılında yayınlanan Nonparametric and Semiparametric Estimation of the Receiver Operating Characteristic Curve isimli 106 ER DeLong, DM DeLong ve DL Clarke-Pearson, Comparing,Areas Under Two or More Corelated Receiver Operating Characteristic Curves: A Nonparametric Approach,Biometrics, Vol. 44, No. 3, 1988, s G. Qin ve X.H. Zhou, Empirical Likelihood Inference for the Area Under the ROC Curve, Biometrics, Vol.62, No.2, 2006, s Green ve Swets, s

75 çalışmada, hem yarı parametrik hem de parametrik olmayan yaklaşıma göre ROC eğrisi kestirimi mevcuttur. 109 Li, Tiwari ve Wells tarafından 1999 yılında hazırlanan Semiparametric Inference for a Quantile Comparison Function with Applications to Receiver Operating Characteristic Curves adlı diğer bir çalışmada, ROC eğrisi kestiriminde pozitif ve negatif olgu sınıflarına ait test sonuçları parametrik ve parametrik olmayan yaklaşıma göre ayrı ayrı modellenmiştir. Elde edilen sonuçlara göre yarı parametrik bir yaklaşım geliştirilmeye çalışılmıştır. 110 Pepe, 2000 yılında yayınlanan An Interpretation for the ROC Curve and Inference Using GLM Procedures adlı çalışmasında ROC eğrisini yarı parametrik olarak modelleyerek ROC eğrisine ilişkin parametreleri kestirmek için, ROC eğrisi üzerindeki her noktayı ikili rassal bir değişkenin koşullu olasılığı olarak değerlendirerek genelleştirilmiş doğrusal modellerden yararlanmıştır. 111 Zou ve Hall, 2000 yılında yayınlanan Two Transformation Models for Estimating an ROC Curve Derived from Continuous Data adlı çalışmalarında. sıralı ölçekli verilerde P ve N sınıfları için AUC kestirimini yarı parametrik yöntem ile elde etmeye çalışmışlardır. 112 Qin ve Zhang tarafından 2003 yılında hazırlanmış olan Using Logistic Regression Procedures for Estimating Receiver Operating Characterictic Curves isimli çalışmada, parametrik ve parametrik olmayan yaklaşımlara göre yapılan ROC eğrisi kestirimine seçenek olarak, lojistik regresyon modeli yardımı ile daha güvenilir kestirimler sunan yarı parametrik yaklaşım ile kestirimi önermişlerdir Fushing Hsieh ve Bruce W. Turnbull, Nonparametric and Semiparametric Estimation of the Receiver Operating Characteristic Curve, The Annals of Statistics, Vol.24, No.1, 1996, s G. Li, RC. Tiwari, ve MT: Wells, Semiparametric Inference for a Quantile Comparison Function with Applications to Receiver Operating Characteristic Curves. Biometrika, Vol.86, No.3, 1999, s Margaret Sullivan Pepe, An Interpretation for the ROC Curve and Inference Using GLM Procedures, Biometrics, Vol. 56, No.2, 2000, s KH Zou ve WJ Hall, Two Transformation Models for Estimating An ROC Curve Derived from Continuous Data, Journal of Applied Statistics, Vol.27, No.5, 2000, s Jing Qin ve Biao Zhang, Using Logistic Regression Procedures for Estimating Receiver Operating Characterictic Curves, Biometrika, Vol.90, No.3, 2003, s

76 Z. Zhang, 2004 yılında tamamlamış olduğu, Semiparametric Least Squares Analysis of the Receiver Operating Characteristic Curve adlı çalışmasında ROC eğrisi kestirimi için EKK yöntemine dayalı bir yarı parametrik yöntem geliştirmiştir. 114 Green ve Swets tarafından geliştirilen iki değişkenli normal model yaklaşımında, modeldeki sabit terim ve eğim katsayısı kestirimleri için de farklı yöntemler bulunmaktadır. Benzer olarak, parametre kestirimleri için bi gamma, bi beta modelleri gibi farklı öneriler de getirilmiştir. 115 Y bağımlı değişkeninin pozitif (P=1) ve negatif (N=0) olarak adlandırılan iki olguyu kapsadığı varsayılsın. (1.13) te verilen lojistik fonksiyondaki ifadesinin bağımsız değişkenin belirli bir değeri için bağımlı değişkenin 1 e eşit olma koşullu olasılığını verdiği, ifadesinin ise bağımlı değişkenin 0 a eşit olma koşullu olasılığını gösterdiği ilgili başlıkta belirtilmişti. Bağımlı değişkenin 1 e eşit olma koşullu olasılığını sağlayan ve (1.13) te biçiminde gösterilen lojistik fonksiyon, şeklindeki bağlantı fonksiyonu aracılığı ile doğrusallaştırıldığında (1.15) te olarak belirtilen lojistik regresyon modeli elde edilmişti. Ulaşılan lojistik regresyon modelinde, kestirilen parametre değerleri kullanılarak bağımlı değişkenin kestirilen olasılıkları belirlenebilmektedir. ROC eğrisi kestiriminde ise bağımlı değişkenin gerçek değerleri ile kestirilen olasılık değerlerinden yararlanılmaktadır. Burada belirtilmesi gereken önemli bir nokta, ROC eğrisinin monoton dönüşümler altında değişmez olduğudur. Yani, aynı bağımlı değişken için X yerine f(x) kullanıldığında, f monoton ise, aynı ROC eğrisi elde edilir Z. Zhang, Semiparametric.Least Squares Analysis of the Receiver Operating Characteristic Curve, Unpublished Doctoral Dissertation, University of Washington, Gu, Ghosal ve Roy, s Mithat Gönen (gonenm@mskcc.org), ROC Eğrisi Kestirimi, Burcu Köksal a kişisel e-posta. [brckoksal@gmail.com] (30 Nisan 2010). 61

77 ROC eğrisi kestiriminde lojistik regresyon modeline dayalı yaklaşımın normal dağılıma dayalı yaklaşımdan daha sağlam ve kesin; parametrik olmayan yaklaşıma göre ise daha etkin sonuç vereceği öngörülmektedir Tekil Noktalar ve Parçalı Alanlar Değişkenlerin sürekli olması durumunda ilgilenilen belirli bir YPO (x 1 ) değeri varsa, ROC eğrisinde bu YPO oranına karşılık gelen DPO değeri y(x 1 ) noktası olur. YPO için tek bir değerden büyük ancak (0,1) gibi tam bir aralıktan da küçük olan (a,b) gibi belirli bir aralığa odaklanıldığında, bu aralığa karşılık gelen ROC eğrisi altındaki kısmi alan şu şekilde hesaplanır: 118 (2.43) Youden Indeksi (YI) AUC ve PAUC, kestirilen ROC eğrisinin değerlendirilmesinde en yaygın kullanılan iki özet göstergedir. Sürekli yapıdaki değişkenler için geliştirilen diğer göstergelerden biri olan YI, DPO ve YPO arasındaki en büyük farka karşılık gelir: (2.44) (2.2) ifadesinde belirtilmiş olan eşitliği dikkate alınarak (2.44) ifadesinde gerekli düzenleme yapılırsa eşitlik şu biçimde de ifade elde edilebilir: (2.45) DPO ve YPO arasındaki farkın en büyük olduğu yani YI değerinin hesaplandığı duruma ilişkin eşik değeri genellikle en iyi ayırım etkinliğini veren değerdir En Yüksek Dikey Uzaklık (Maximum Vertical Distance, MVD) ROC eğrisi ile köşegen çizgisi arasındaki uzaklığa karşılık gelen ve tanım aralığı [0,1] olan MVD, ROC eğrisinin değerlendirilmesinde yararlanılan diğer bir 117 Qin ve Zhang, s Krzanowski ve Hand, s

78 göstergedir. P ve N sınıflarındaki birimlerin koşullu olasılık dağılımları arasındaki en yüksek mutlak uzaklık olarak ifade edilebilir ve şu eşitlik ile gösterilir: (2.46) Belirli bir eşik değer için elde edilen DPO ve YPO aracılığı ile de hesaplanabilen MVD şöyle ifade edilebilir: (2.47) DPO ve YPO arasındaki farkın en yüksek mutlak değeri için hesaplanan MVD, YI değerine eşit olmaktadır. 2.4 ROC Eğrisi Analizinin Kullanım Alanları İkinci bölüm başında verilmiş olan yazın özetinden hareketle ROC eğrilerinin başlıca kullanım alanının karar verme sürecinde en iyi ayırım etkinliğini veren eşik değerinin belirlenmesi ile farklı analiz tekniklerinin ve modellerin etkinliklerinin değerlendirilmesi olduğu söylenebilir En Ġyi Ayırım Etkinliğini Veren EĢik Değerin Belirlenmesi Tüm olası eşik değerler için, tanı testinin gerçek özelliklerini ortaya koyarak tanı testlerinin doğruluğunun değerlendirilmesinde kullanılan ROC Eğrisi Analizi, tıbbi karar verme sürecinde en çok başvurulan yöntemlerden biridir. Tanı testinde en uygun DPO ve DNO oranlarını veren en iyi eşik değerin saptanmasında ROC eğrisinden yararlanılır. 119 Araştırmanın odak noktasına göre negatif olguların doğru belirlenmesi amaçlanıyorsa NÖD, pozitif olguların doğrulanması hedefleniyorsa PÖD önem kazanır. PÖD veya NÖD değerlerinin artırılması sırasıyla YNO ve YPO oranının azaltılması ile mümkün olur. Güvenilir bir tanıya ulaşabilmek için amaca göre pozitif ve negatif 119 Kazım Özdamar, Tıp, Biyoloji, Eczacılık ve DiĢ Hekimliği Öğrencileri için SPSS ile Biyoistatistik, Güncelleştirilmiş 4. Baskı, Eskişehir: Kaan Kitabevi, 2001, s

79 olguları ayıran en doğru koşullu olasılıkları verecek uygun bir eşik değerin belirlenmesi gerekir. Ayırım etkinlikleri değerlendirilmek üzere YPO ve DPO oranlarına ilişkin dört temsili kestirim sonucu (A,B,C ve D noktaları) bulunduğu varsayılsın. ġekil 3 Kestirim Değerlerinin ROC Alanında Gösterimi Kaynak: ve Tom Fawcett, ROC Graphs: Notes and Practical Considerations for Researchers, HP Labs.Tech. Report, Vol.31, No. HPL ,2004, s.4 kaynaklarından derlenerek oluşturulmuştur. Şekil 3 te belirtilmiş olan ROC alanı üzerinde gösterilen kestirim sonuçları şöyle yorumlanabilir: 120 A: DPO ve YPO oranlarının her ikisinin de %100 olduğu durumdur ve (0;1) koordinatına karşılık gelmektedir. Bu noktanın y ekseninin en ucunda yer aldığı düşünülürse, noktanın izdüşümü köşegen çizgisini tam dik keser. Kestirimin doğruluk oranı %100 dür. A, B, C, D noktaları ile ifade edilen kestirimler için A noktasına yakın bulunan kestirimin daha tercih edilir olduğu söylenebilir. B: DPO oranı yaklaşık 0,65, YPO ise 0,75 tir ( ). 64

80 C: DPO oranı yaklaşık 0,80, YPO ise 0,20 olan C noktası köşegen çizgisinin tam üzerinde yer almakta olup, kestirimin doğruluk oranının %50 olduğu söylenebilir. D: Köşegen çizgisinin altında yer alan bu kestirim, kötü bir ayırım etkinliğinin göstergesidir. D noktasının köşegen çizgisine göre tersi alındığında D* noktası elde edilir ki bu nokta için DPO yaklaşık 0,95, YPO ise 0,40 tır. D* kestiriminin, DPO ve YPO oranları sırasıyla 0,65 ve 0,75 olan B kestirimine göre daha tercih edilir bir kestirim sonucu olduğu söylenebilir. ise yani sınıflara ilişkin olasılık yoğunluk fonksiyonlarının aynı olması durumunda t değişirken DPO her zaman YPO değerine eşit olacak ve ROC eğrisi (0,0) ve (1,1) noktaları arasında yer alan köşegen çizgisi (45 derece doğrusu) ile çakışacaktır. Bu durumda, köşegen çizgisi üzerinde yer alan her nokta, %50 doğruluk oranı ile rassal kestirimi belirteceğinden yapılan sınıflandırma da rassal özellik taşır. Genel olarak köşegen çizgisinin üstündeki noktaların iyi, altındaki noktaların ise kötü ayırım sonuçlarını gösterdiği ifade edilmektedir. birbirinden tamamen farklı ise DPO=1 ve YPO=0 için her birimin mükemmel sınıflandırılmasını sağlayan en az bir t mevcuttur. Eşik değerinden büyük tüm birim değerleri için elde edilen koşullu olasılıklarda tüm küçük t değerlerinde YPO, 0 dan 1 e doğru değişirken DPO=1 olur. Benzer şekilde tüm büyük t değerlerinde DPO, 1 den 0 a doğru değişirken YPO=0 olur. ROC eğrisi grafiğin üst sınırları boyunca yani, [(0,0);(0,1)] ile [(0,1);(1,1)] aralığında düz bir çizgi olarak konumlanır. Sürekli yapıdaki değişkenler için oluşturulan ROC eğrisi sürekli, kesikli yapıdaki değişkenler için oluşturulan ROC eğrisi ise kesikli olur ve grafiğin genel olarak üst üçgeninde yer alırlar. Eğrinin, sol üst köşeye yakın olması ayırım gücünün yüksek olduğunun göstergesidir. Eğrinin grafiğin alt üçgeninde konumlanması, birim değerlerinin hatalı sınıflandırıldığını belirtir. Bu durumda, birim değerleri tekrar gözden Rassal kestirime örnek olarak atılan madeni para ya da doğacak bebeğin cinsiyeti verilebilir. 65

81 geçirilerek birimler doğru şekilde P veya N sınıfına atanmalıdır. Eğriyi oluşturan bazı noktalar alt üçgende yer alırsa, yalnız bu noktalara karşılık gelen t değerleri için düzeltme yapılması daha doğru olmaktadır. ne kadar farklı olursa aralarındaki örtüşme de o kadar az olur ve yanlış sınıflandırma yapma olasılığı azalır. Benzer olmaları durumda ise aralarındaki örtüşme çok olur ve yanlış sınıflandırma yapma olasılığı artar. Eşik değerler Negatif (DNO) Pozitif (DPO) YNO YPO ġekil.4 Farklı Eşik Değerlere Göre Koşullu Olasılıkların Belirlenmesi Kaynak: Yazar tarafından oluşturulmuştur. Şekil 4 te yer alan iki varsayımsal dağılımda P ve N sınıflarına ait olan birim değerlerinin ortalaması sırasıyla 0.9 ve 0.3 ise t=0.6 için DPO ve DNO değerlerinin eşit olduğu; t<0.6 için DNO değerinin azalmasıyla DPO değerinin arttığı, t>0.6 içinse DPO değerinin azalmasıyla DNO değerinin arttığı söylenebilir. Koşullu olasılıkların kestiriminde yararlanılan doğru atama tablolarının türetimini küçük bir veri seti üzerinden somut olarak görmek mümkündür. Üstte birim değerleri verilen ve örnek hacmi 20 birim olan veri setinin rassal olarak P ve N olmak üzere iki sınıfa ayrıldığı ve her sınıfta 10 birim bulunduğu varsayılsın. 66

82 Kestirim Kestirim Kestirim Kestirim Kestirim Kestirim Kestirim Kestirim Kestirim Kestirim Kestirim P: N: için [(1.4);(0.3)] aralığında değişen eşik değerler aracılığı ile oluşturulan doğru atama tabloları Tablo 6 da verilmiştir. t 1.4 için Tablo 6. Örneğe İlişkin Doğru Atama Tabloları Gerçek P N Toplam P t=1.2 için Gerçek P N Toplam P N Toplam Gerçek t=1.0 için P N Toplam P N Toplam Gerçek t=0.9 için P N Toplam P N Toplam t=0.8 için Gerçek P N Toplam P N Toplam t=0.7 için Gerçek P N Toplam P N Toplam Gerçek t=0.6 için P N Toplam P N Toplam Gerçek t=0.5 için P N Toplam P N Toplam Gerçek t=0.4 için P N Toplam P N Toplam t 0.3 için Gerçek P N Toplam P N Toplam Gerçek t=0.3 için P N Toplam P N Toplam N Toplam Kaynak: Yazar tarafından oluşturulmuştur. 67

83 DPO (Duyarlılık) koşulunu sağlayan her birim değeri için gerçekte P sınıfında bulunan birimler ile N sınıfında bulunan birimlerin tümü N sınıfına atanmış olduğundan ) olur. içinse, gerçekte P sınıfında bulunan 1.4 değerli birim P sınıfına, gerçekte N sınıfında bulunan 10 birimin tümü de yine N sınıfına atandığından koşullu olasılıklar ) şeklinde olur. Her eşik değeri için oranlar buna benzer şekilde hesaplanır. Doğru atama tabloları aracılığıyla bulunan koşullu olasılık kestirimleri Tablo 7 de, bu değerler ile çizilen ROC eğrisi de Şekil 5 te görülmektedir. Tablo 7. DPO ve YPO Kestirimleri 1,4 1,2 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 <0,3 0,0 0,0 0,0 0,0 0,1 0,2 0,4 0,5 0,8 0,9 1,0 0,0 0,1 0,2 0,3 0,6 0,7 0,7 0,9 1,0 1,0 1,0 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 YPO (1-Özgüllük) ġekil 5, Örnek için ROC Eğrisi Kestirimi Kaynak: Wojtek J. Krzanowski ve David J. Hand, ROC Curves for Continuous Data, CRC Press/Taylor & Francis Group, Boca Raton, London, New York, 2009, s.43 ve 44 DPO ve YPO farkının en yüksek olduğu YI değeri 0,5 ile t=0,8 ve t=0,7 için sağlanmaktadır. Dolayısıyla en iyi ayrım bu iki eşik değerden biri ile elde edilebilir. Farklı eşik değerlere göre oluşturulan doğru atama tablolarından hareketle koşullu olasılık hesabı ile ROC eğrisi çiziminin 3. Bölümde yer alan uygulama çalışması üzerinde öznel, nesnel ve karma modellere göre gösterimi Ek.6 da mevcuttur. 68

84 2.4.2 Farklı Analiz Teknikleri ile Model Etkinliklerinin Değerlendirilmesi Belirli bir konu üzerinde uygulanan farklı analiz teknikleri ile elde edilen sonuçlardan en iyi olanının belirlenmesinde, türetilen modellerin etkinliklerinin değerlendirilmesinde ROC eğrilerinden yararlanıldığı söylenebilir. Kurt ve Türe, 2005 yılında yayınlanan Tıp Öğrencilerinde Alkol Kullanımını Etkileyen Faktörlerin Belirlenmesinde Yapay Sinir Ağları ile Lojistik Regresyon Analizinin Karşılaştırılması isimli çalışmalarında alkol kullanımını etkileyen faktörleri Lojistik Regresyon ve Yapay Sinir Ağları Analizi ile incelemişlerdir. Lojistik regresyon ve yapay sinir ağları yöntemlerine göre elde edilen modellerin alkol kullanan ve kullanmayan öğrencileri ayırmadaki etkinlikleri ROC Eğrisi Analizi ile karşılaştırılmıştır. 121 Türe, Kurt, Yavuz ve Kürüm, 2005 yılında yayınlanan Hipertansiyonun Tahmini için Çoklu Tahmin Modellerinin Karşılaştırılması (Sinir Ağları, Lojistik Regresyon ve Esnek Ayırma Analizleri) adlı çalışmalarında hipertansiyonun kestirilmesinde kullandıkları Lojistik Regresyon, Esnek Ayırma Analizi ve Sinir Ağları yöntemlerinden elde edilen modellerin performanslarının karşılaştırılmasında ROC Eğrisi Analizinden yararlanmışlardır. 122 Kestirilen AUC değerlerinin çiftler halinde karşılaştırılması ile farklı analiz sonuçları ya da mevcut modeller arasında istatistiksel olarak anlamlı bir fark olup olmadığı test edilerek en iyi analiz sonucunun ya da modelin saptanması mümkün olur. Şekil 6 da ROC eğrileri ile test etkinliklerinin değerlendirilmesine ilişkin oluşturulan bir diyagram görülmektedir. 121 İmran Kurt ve Mevlüt Türe, Tıp Öğrencilerinde Alkol Kullanımını Etkileyen Faktörlerin Belirlenmesinde Yapay Sinir Ağları ile Lojistik Regresyon Analizinin Karşılaştırılması, Trakya Üniv. Tıp Fakültesi Dergisi, Vol.22, No.3, 2005, s Mevlüt Türe, İmran Kurt, Ebru Yavuz ve Turhan Kürüm, Hipertansiyonun Tahmini için Çoklu Tahmin Modellerinin Karşılaştırılması (Sinir Ağları, Lojistik Regresyon ve Esnek Ayırma Analizleri), Anadolu Kardiyoloji Dergisi, No.5, 2005, s

85 Testin doğruluğunun görsel değerlendirmesi Testler arasında görsel karşılaştırma Testin doğruluğunun sayısal değerlendirmesi: AUC ROC Analizi ROC eğrileri: Tüm DPO/ YPO çiftleri Benzerlik oranı Testler arasında sayısal karşılaştırma Beklenen maliyetin minimize edilmesi, ayırma analizi gibi çeşitli yollarla karar eşiğinin seçimi Lojistik regresyon analizi Seçilen duyarlılık veya özgüllüklerin kullanımı Çizimlerin altındaki alanların kullanımı Etkinlik Kestirim değeri ġekil 6 Test Etkinliğinin Değerlendirilmesinde ROC Eğrilerinin Kullanım Yolunun Gösterimi Kaynak: MH Zweig ve G. Campbell, Receiver Operating Characteristic (ROC) Plots: A Fundamental Evaluation Tool in Clinical Medicine, Clinical Chemistry, Vol.39, No.4, 1993: s.562. ROC Eğrilerinin AUC Değerlerinin Karşılaştırılması Aynı veri seti kullanılarak türetilen iki ROC eğrisi olması durumunda, ve olarak ifade edilen iki kestirim alanı elde edilir. Alanlar arasında istatistiksel olarak anlamlı bir fark olup olmadığı ise şu şekilde test edilir: Eşlenik örneklemden elde edilen iki AUC kestirimi arasında anlamlı bir fark olup olmadığının sınanmasında z test istatistiğinden yararlanılır. (2.48) Eşlenik örneklem durumundan dolayı alanların ilişkili olması olası olduğundan, alanlar arası farkın standart hatasının (2.49) eşitliği ile hesaplanması uygun olmaz. (2.49) 70

86 yararlanılır. Bu durumda alanlar arası ilişkinin dikkate alındığı (2.50) ifadesinden (2.50) r: İki alan arasında tanımlanan korelasyon katsayısı. AUC 1 ve SH 1 sırasıyla, birinci modelleme ile kestirilen ROC eğrisine ilişkin AUC değeri ile bu değere ilişkin standart hatayı; AUC 2 ve SH 2 ise ikinci modelleme ile kestirilen ROC eğrisine ilişkin AUC değeri ile bu değere ilişkin standart hatayı ifade eder. AUC 1 ve AUC 2 değerleri arasındaki korelasyon katsayısı şu biçimde hesaplanır: (2.51) Korelasyon katsayısının hesabında, sonuca ilişkin ölçme düzeyinin metrik ya da sıralı kategorik olmasına göre Pearson çarpım moment, Sperman sıra ya da Kendall tau korelasyon katsayılarından biri kullanılabilir. 123 (2.48) ifadesinde hesaplanan z değeri, normal dağılım tablosunda ilgili değer ile karşılaştırılır. z değerleri belli kesim değerlerinin üstünde ise bu, gerçek AUC değerlerinin farklı olduğuna ilişkin bir kanıt sayılır. z nin paydası çok büyük ise z değeri çok küçük olur, bu durumda alanlar arası farkın belirlenme şansı azalır. Paket programlar aracılığı ile yapılan karşılaştırmada ise hesaplanan z test istatistiğine ilişkin P (Sig.) değerinin belirlenen anlam düzeyinden küçük olması durumunda alanlar arasındaki farkın istatistiksel olarak anlamlı olduğu ve hipotezinin kabul edileceği; büyük olması durumunda ise alanlar arasında istatistiksel olarak fark olmadığı ve hipotezinin reddedilemeyeceği söylenebilir. 123 JA Hanley ve BJ McNeil, A Method of Comparing the Areas under Receiver Operating Characteristic (ROC) Curves Derived from the Same Cases, Radiology, s

87 3. TÜRKĠYE DE MUTLULUK ALGISINI ETKĠLEYEN SOSYO-DEMOGRAFĠK UNSURLARA ĠLĠġKĠN BĠR UYGULAMA Tezin bu bölümünde araştırma amacına uygun olarak önce mutluluk kavramı ve önemi açıklanacak, sırasıyla Mutluluk Araştırmaları, Uygulamanın Amacı ve Kapsamı ile Yığın ve Örneklem, Sosyo-demografik Özellikler, Ölçek ve Kodlama alt başlıkları altında yapılacak açıklamaların ardından uygulamaya ilişkin elde edilen sonuçlar Analiz ve Bulgular bölümünde değerlendirilecektir. 3.1 Mutluluk AraĢtırmaları Mutluluk, geçmişten günümüze süregelen süreçte anlamı ve kapsamı sürekli sorgulanan bir kavramdır. Farklı bilim dallarından pek çok araştırmacı ve düşünürün mutluluk algısı üzerine yaptığı araştırma ve yorumlara dayanarak mutluluk kavramının, kişinin hoşlanma veya hissettiği tatmin düzeyi olarak ya da toplam yaşam kalitesini ne düzeyde iyi gördüğü ile ilgili bir duygu ya da his olarak nitelendirilebilir. TDK nın Güncel Türkçe Sözlüğü nde Tüm özlem ve isteklere eksiksiz ve sürekli olarak ulaşılmaktan duyulan kıvanç durumu 124 olarak tanımlanmaktadır. Felsefe Terimleri Sözlüğü nde mutluluk kavramı için verilen tanımlamalardan bazıları, Genellikle insanların kendilerine en yüksek erek olarak koydukları değer. Bilinci dolduran tam bir doygunluk durumu. İstek ve eğilimlerin tam bir uyumu ve doygunluğu şeklindedir. 125 Yapılan araştırmaların çoğunda mutluluk algısı ile yaşam memnuniyeti ve öznel olarak iyi olma durumu kavramlarının birlikte ya da birbiri yerine kullanıldığı görülmüştür. 126 Mutluluk kavramı için, kişisel algı ve beklentilere göre farklılık gösteren çeşitli tanımlamalar da mevcuttur. Mutluluk algısının kişisel algıya yani bakış açısına göre değişim gösterdiği düşünülürse, kişilerin içinde bulundukları duruma göre mutluluğa (8 Eylül 2011) (8 Eylül 2011). 126 Carol Graham, Can Happiness Research Contribute to Development Economics, Massachusetts Avenue Development Seminar, (10 Şubat 2004), s.5. 72

88 farklı anlamlar yükledikleri söylenebilir. Ailesinin parkta oynamasına izin vermesi bir çocuk için mutluluk unsuru olabilirken, hasta olan bir kişi için mutluluk sağlığına kavuşmak demektir. Hükümlü olan diğer bir kişi içinse mutluluğun tekrar özgür olmak olarak nitelendirilebileceği söylenebilir. Mutluluk algısı üzerine yaptığı çalışmalar ile bilinen Ruut Veenhoven, mutluluğu yaşamaktan alınan haz biçiminde tanımlamaktadır. Veenhoven, 1991 yılında yayınlanan Is Happiness Relative adlı çalışmasında mutluluk düzeyinin varsıl ve yoksul ülkeler için göreli olarak gösterdiği değişimi karşılaştırmış, mutluluk düzeyinin durağan yaşam koşullarından bağımsız olması gibi kimi saptamalarda bulunmuştur. 127 Frey ve Stutzer tarafından 2000 yılında hazırlanan Maximizing Happiness adlı çalışmada, mutluluk üzerinde etkisi olan unsurlar 11 Avrupa ülkesine ilişkin makro ve mikro veriler kullanılarak ekonometrik modelleme ile saptanmıştır. Çalışma sonucuna göre mutluluğu etkileyen en önemli makro göstergeler işsizlik oranı ve enflasyon; mikro göstergeler ise işsizlik, gelir, eğitim ve medeni durum olarak belirlenmiştir. 128 Veenhoven, 2001 yılında yayınlanan Quality of Life and Happiness:Not Quite the Same adlı çalışmasında yaşam kalitesinin yaşanılan çevrenin kalitesi, performans kalitesi, öznel yaşam memnuniyeti düzeyi olmak üzere üç unsurdan oluştuğunu belirtmiştir. 129 Frey ve Stutzer tarafından, 2002 yılında hazırlanan What Can Economists Learn From Happiness Research? adlı diğer bir çalışmada mutluluk ve iktisat arasındaki ilişki araştırılmıştır. Araştırma sonucuna göre gelir ve mutluluk arasında pozitif yönlü bir ilişki olduğu; enflasyon oranındaki sürekli artış satın alma gücünü ve gelecek beklentilerini olumsuz etkilediğinden mutlulukla arasında negatif yönlü bir ilişki olduğu söylenebilir. İşsizliğin, öznel iyi olma durumunu hem bireysel hem de toplumsal 127 Ruut Veenhoven, Is Happiness Relative?, Social Indicators Research, Vol.24, No.1, 1991, s Bruno S. Frey ve Alois Stutzer, Maximizing Happiness, German Economic Review, Vol.1, No.2, 2000, s Ruut Veenhoven, Quality of Life and Happiness:Not Quite the Same, published in İtalian in: G. DeGirolamo et al (ads), Salute a qualita dell vida, Centro Scientifico Editore, Torino, Italia, 2001, s.67 www2.eur.nl/fsw/research/veenhoven/pub2000s/2001e- (21 Eylül 2011). 73

89 anlamda ciddi şekilde azalttığı, dolayısı ile mutluluk ve işsizlik arasındaki ilişkinin de negatif yönlü olduğu söylenebilir. 130 Veenhoven, 2004 yılında Positive Psychology in Practice adıyla yayınlanan çalışmanın Happiness as a Public Policy Aim: The Greatest Happiness Principle bölümünde, mutluluk kavramının kamu politikası olarak hem toplum hem de bireyler açısından bir hedef ölçütü olabileceğini belirtmiştir. Ayrıca, gerek makro gerekse mikro düzeyde anketler aracılığı ile yapılacak doğrudan sorgulamalarla yaşam memnuniyetinin ölçülebileceğine, farklı kişiler ya da uluslar için karşılaştırmalar yapılabileceğine değinmektedir yılında yayınlanan Is Life Getting Better?: How Long and Happily Do People Live in Modenr Society? isimli diğer bir çalışmada yaşam kalitesinin tarım toplumundan sanayi toplumuna geçişin ardından pozitif yönde bir değişim gösterdiği belirtilmektedir. 132 Mutluluk, güncelliğini sürekli koruyan, gerek dünyada gerekse Türkiye özelinde hakkında yeni çalışmalar türetilen bir kavramdır. Günümüzde iktisat, sosyoloji, psikoloji gibi sosyal bilimler ile tıp alanında da yoğun olarak ele alınan bir konu olduğu söylenebilir. Mutluluk kavramının bir süreci kapsadığı düşünülürse, araştırmalarda mutluluk algısını veya yaşam memnuniyetini ölçmeye dönük olarak sorulan Genel mutluluk durumunuzu nasıl nitelendirirsiniz? ya da Genel olarak bugünlerde hayatınızdan ne derece memnunsunuz? sorularının yanıtının, sosyo-demografik, psikolojik, ekonomik açıdan pek çok unsuru kapsadığından sürecin bütünü ile ilgili genel kanıyı yansıttığı söylenebilir. 133 Özellikle felsefe ve edebiyat alanlarının eski bir konusu olan yaşam memnuniyeti ya da mutluluk kavramına ilişkin uygulama çalışmalarına, ölçme ve 130 Bruno S. Frey ve Alois Stutzer, What Can Economists Learn From Happiness Research?, Forthcoming in Journal of Economic Literature, 2002, s.38 ve Ruut Veenhoven, Happiness as a Public Policy Aim: The Greatest Happiness Principle, PA Linley ve Stephen Joseph (Ed.), Positive Psychology in Practice içinde ( ), Hoboken,NJ: John Wiley & Sons, 2004, s.658 ve Ruut Veenhoven, Is Life Getting Better?: How Long and Happily Do People Live in Modenr Society?, European Psychologist, Vol.10, No.4, 2005, s Graham, s.6. 74

90 tanımlama sorunlarından dolayı 1940 lı yıllarda başlanabilmiştir. 134 Bu konudaki en kapsamlı teorik bilgi ve uygulama örneklerinin Dünya Mutluluk Veri Bankası nda (World Database of Happiness) toplandığı söylenebilir. Çoğunluğu birinci dünya ülkeleri olmak üzere ikinci ve üçüncü dünya ülkelerini de kapsayan bu çalışma, Rotterdam Erasmus Üniversitesi tarafından yürütülen bir araştırma projesidir. Güncel bilimsel araştırmalarla, farklı ülkelerdeki insanların mutluluk dereceleri, mutlu ve mutsuz insanların ne gibi karakteristik özelliklere sahip olduklarıyla ilgili makro düzeyde bilgiler sunmaktadır yılından beri yayınlanan Mutluluk Araştırmaları Dergisi (Journal of the Happiness) de konuya artan ilginin diğer bir göstergesidir. 136 Avrupa Birliği ne üye ülkeler ile üyelik için başvuran ülkelerin yaşam kalitesine ilişkin unsurların değerlendirilmesine dönük olarak Avrupa Yaşama ve Çalışma Koşullarını İyileştirme Vakfı (Eurofound) tarafından periyodik olarak uygulanan Avrupa Yaşam Kalitesi Anketi (European Quality of Life Survey, EQLS) adında bir çalışma da mevcuttur. İlki 2003 ikincisi 2007 yılında gerçekleştirilmiş olan bu çalışmada, istihdam, ekonomik kaynaklar, çevresel ortam, aile ve hane yapısı, topluma katılım, sağlık, eğitim gibi unsurların yaşam kalitesi üzerindeki etkileri araştırılmıştır. 137 Türkiye özelinde gerçekleştirilen mutluluk algısı ya da yaşam memnuniyeti araştırmalarının genellikle belirli sosyo-demografik özelliklere sahip bireyler üzerinden uygulandığı saptanmıştır. Ayrıntılı değerlendirmelerin yapıldığı kapsamlı çalışma sayısı ise oldukça sınırlıdır. TÜİK tarafından 2003 yılından beri her yıl düzenli olarak tekrarlanan Yaşam Memnuniyeti Araştırması, TÜİK in toplumsal içerikli ve aynı zamanda öznel öğeler içeren ilk araştırması olma özelliği taşımaktadır. Bu araştırmada Türkiye deki bireylerin öznel mutluluk algılaması, sağlık, sosyal güvenlik, örgün eğitim, çalışma hayatı, gelir, 134 TÜİK,Yaşam Memnuniyeti Araştırması, 2010, ( ). 135 Ruut Veenhoven, World Database of Happiness, 2007, (14 Nisan 2011) (21 Eylül 2011). 137 Avrupa Yaşama ve Çalışma Koşullarını İyileştirme Vakfı, Birinci Avrupa Yaşam Kalitesi Anketi: Türkiye de Yaşam Kalitesi Özeti, 2007, (25 Eylül 2011), s.1. 75

91 kişisel güvenlik ve adalet hizmetleri ile kişisel gelişim gibi temel yaşam alanlarındaki memnuniyetleri ölçülmektedir. Avrupa Topluluğunda Ekonomik Birimlerin İstatistiksel Sınıflandırmasına karşılık gelen EFİS Rev.1.1 ve Uluslararası İşteki Duruma karşılık gelen UİDS, 93 sınıflama sistemlerinin kullanıldığı yaşam memnuniyeti araştırmasında, kent-kır ayrımı esas alınmakta; araştırmanın örneklemi ise UAVT çerçevesinde iki aşamalı tabakalı küme örneklemesi yöntemine göre belirlenmektedir. 138 Türkiye için mutluluk algısı ile ilgili yapılan en kapsamlı çalışmalardan birinin Üçdoğruk, Bozkuş ve Çevik tarafından 2006 yılında hazırlanmış olan Bireysel Refah ve Mutluluk Düzeyine Etki Eden Faktörlerin Sıralı Lojit ile Modellenmesi: Türkiye Örneği isimli çalışma olduğu söylenebilir. Bu çalışmada, TÜİK tarafından gerçekleştirilen 2004 yılına ait Hanehalkı Yaşam Memnuniyeti Araştırması nın anket verileri kullanılarak bireysel refah ve mutluluğu etkileyen faktörler sıralı logit/probit model yaklaşımı ile belirlenmeye çalışılmış, sonuçlar iktisadi ve istatistiksel açıdan yorumlanmıştır. 139 Babadağ, Uyanık ve Yılmaz tarafından 2009 yılında hazırlanan ve Yaşam Memnuniyeti Anketi nin Veri Madenciliği Süreci ile İncelenmesi adını taşıyan çalışmanın ise bu konuda yayınlanan diğer bir kapsamlı çalışma olduğu söylenebilir. TÜİK tarafından gerçekleştirilen dönemine ilişkin Hanehalkı Yaşam Memnuniyeti anket verilerinin kullanıldığı bu çalışmada, belirlenen sosyo-demografik özellikler ile mutluluk algısı arasındaki ilişkinin süreçsel değerlendirmesi yapılmıştır. 140 Yazın taraması dikkate alındığında, mutluluk algısına ilişkin gerek mikro gerekse makro düzeyde pek çok araştırmanın olduğu görülmüştür. Araştırma sonuçlarından edinilen genel izlenim, mutluluk algısının yaş, medeni durum, eğitim durumu ve sosyal ilişkiler ile pozitif; işsizlik durumu ile negatif ilişkili olduğu şeklindedir (21 Eylül 2011). 139 Sezer Bozkuş, Emrah İsmail Çevik ve Şenay Üçdoğruk, Subjektif Refah ve Mutluluk Düzeyine Etki Eden Faktörlerin Sıralı Lojit ile Modellenmesi: Türkiye Örneği, 15. Ġstatistik AraĢtırma Sempozyumu Bildiriler Kitabı, 2006, s Kadir Korhan Babadağ, Deniz Uyanık ve Sebiha Yılmaz, Yaşam Memnuniyeti Anketi nin Veri Madenciliği Süreci ile İncelenmesi, (21 Eylül 2011), s Selay Giray, Doğrusal Olmayan Kanonik Korelasyon Analizi ve YaĢam Memnuniyeti Üzerine Bir Uygulama,Yayınlanmamış Doktora Tezi, Marmara Üniversitesi Sosyal Bilimler Enstitüsü, Ekonometri Anabilim Dalı, İstatistik Bilim Dalı, 2011, s

92 3.2 Uygulamanın Amacı Türkiye de mutluluk algısı ile ilgili bir uygulama yapma fikrinin çıkış noktası, hem öznel hem de nesnel nitelikli göstergelerden oluşan sosyo-demografik unsurların mutluluk algısı üzerindeki etki düzeylerinin belirlenmesi; elde edilen kestirim sonuçlarının, mutluluk algısıyla ilgili mevcut olan farklı araştırma sonuçları ile ne derece tutarlılık gösterdiğinin saptanmasıdır. Çalışmanın amacının, bağımlı değişken olarak alınan mutluluk algısı ile öznel ve nesnel nitelikli sosyo-demografik göstergeler için kestirilen farklı lojistik regresyon modelleri içinden en yüksek kestirim gücüne sahip modelin belirlenmesinde, mevcut seçim ölçütlerine seçenek olarak ROC eğrisi kestiriminden de yararlanılabileceğinin gösterilmesidir Uygulamanın Kapsamı Uygulamada kullanılan veriler, 1981 yılından bu yana yürütülen ve her beş yılda bir yinelenen Dünya Değerler Araştırması nın (World Values Survey, WVS ) döneminde gerçekleştirilen anket sonuçlarından derlenmiştir. 142,143 Dünya Değerler Araştırması, dünya çapında 87 ülkede gerçekleştirilen en büyük sosyal bilim araştırması niteliği taşımaktadır. Türkiye de daha önce , ve dönemlerinde üç kez tekrarlanmıştır dönemi için yürütülmekte olan çalışma henüz sonuçlanmadığından, uygulamada mevcut olan döneminin verileri baz alınmıştır. Uygulamada ikincil veri kullanılmış olmasının hem olumlu hem de olumsuz yanları bulunmaktadır. Araştırmada kullanılan yöntemler ile ülkelerin seçimi, örneklemin oluşturulması, araştırmacıların eğitimi ve çalışmaların temel stratejisinin belirlenmesi gibi konularda, alanında uzmanlaşmış saygın akademisyenlerden oluşan Dünya Değerler Araştırmaları Birliği Yönetim Kurulu nun söz sahibi olması; Türkiye için gerçekleştirilen anketlerin örnekleminin TÜİK tarafından belirlenmesi ve örnek (14 Nisan 2011) (14 Nisan 2011). 77

93 hacminin büyük olması bu araştırmanın başlıca avantajlarındandır. Temel amacı tüm dünyada siyasal, sosyal ve kültürel değişimi izlemek olan bu araştırmanın önemi çalışma grubunca yayımlanan eserlerde, bilimsel makale ve kitaplarda yer alan referanslarda açıkça vurgulanmaktadır 144. Araştırmanın olumsuz yanı ise mutluluk algısını ölçmede kullanılan ölçeğin yazında kabul görmüş bir ölçek olmamasıdır. Tablo 8 de, araştırma kapsamında mutluluk ve yaşam memnuniyeti ile ilgili mevcut olan iki soru yer almaktadır. Tablo 8 Anket Soru Formundaki Mutluluk Algısı ve Yaşam Memnuniyeti Soruları S2. Bugünlerde genel olarak mutlu olup olmadığınızı söyler misiniz? Mesela şu okuyacağım şıklardan hangisi, bugünlerdeki genel mutluluk durumunuzu en iyi tarif ediyor? Çok mutluyum Biraz mutluyum Pek mutlu değilim ya da Hiç mutlu değilim. S.20. Genel olarak bugünlerde hayatınızdan ne kadar memnunsunuz? Son derece memnun ve tatmin olmuş hissediyorsanız 10, Hiç memnun değilseniz 1 olmak üzere 1 ve 10 aralığında bir puanlama yapınız. 1 Çok mutluyum 2. Biraz mutluyum 3. Pek mutlu değilim 4. Hiç mutlu değilim 1. Hiç memnun değilim Son derece memnunum ROC eğrisi analizi ikili değer alan ya da iki değerli hale dönüştürülebilen değişkenler için uygulanabildiğinden uygulamada ikili lojistik regresyon analizi kullanılmıştır. Dolayısıyla da analizlerde bağımlı değişken olarak Tablo 8 de verilen yaşam memnuniyeti sorusu yerine, standart bir ölçeği olmadığından iki değerli hale dönüştürülmesi tercih edilen genel mutluluk düzeyi sorusu kullanılmıştır. Uygulama kapsamına ilişkin olarak Yığın ve Örneklem, Sosyo-demografik Özellikler ile Ölçek ve Kodlama alt başlıklarında veri yapısı ile ilgili öne çıkan özellikler irdelenmektedir Yığın ve Örneklem Türkiye ayağı, döneminde Boğaziçi Üniversitesi nden Prof. Dr. Yılmaz Esmer öncülüğünde bir grup akademisyen tarafından yürütülmüş olan Dünya s yılında Michael Fordyce tarafından geliştirilen ve 1996 da Sezai Kalafat tarafından Türkçe ye uyarlanan Mutluluk Ölçeği örnek olarak verilebilir. 78

94 Değerler Araştırması nın yığınını, seçmen yaşına gelmiş yani 18 ve üzeri yaştaki bireyler oluşturmaktadır. Bu kapsamda toplamda 87 ülkeden yaklaşık kişi ile yüz yüze görüşülmüştür. Türkiye deki saha çalışması Ocak-Mart 2007 döneminde gerçekleştirilen araştırmanın örneklemi TÜİK tarafından 3 aşamalı tabakalı küme örneklemesine göre belirlenmiştir. Birinci aşamada ortalama 150 haneden oluşan kümeler seçilmiş, ikinci aşamada örneğe seçilen kümelerden sistematik olarak örnek adresleri belirlenmiştir. Üçüncü aşamada ise anketin uygulanacağı bireyler haneden rassal olarak seçilmiştir. Kümelerin seçimi Türkiye İBBS-1 kapsamında yer alan 12 bölgeye göre yapılmıştır. Başlangıçta, 18 ve üstü yaştaki bireyler için hedeflenen örnek hacmi 1815 iken anket uygulanabilen birey sayısı 1346 dır. Değerlendirmesi yapılacak olan mutluluk algısı sorusu için eksik bir yanıt olduğu belirlendiğinden analizler 1345 kişinin anket verisi üzerinden uygulanmıştır Sosyo-demografik Özellikler Powdthave tarafından 2007 yılında hazırlanan Economics of Happiness: A Review of Literature and Applcations isimli çalışmada, mutluluk algısının hem öznel hem de nesnel nitelikli göstergeleri kapsayan farklı boyutlarının bulunduğu, dolayısı ile hem öznel hem de nesnel göstergelere dayandırılarak ölçülmesi gerektiği belirtilmiştir. 145 Sosyo-demografik özelliklerin taşıdıkları nesnel ve öznel nitelikler için farklı değerlendirmeler söz konusu olabilmektedir. Nesnel kavramı, kişisel yorum içermeyen kanıtlanabilir nitelikteki durumu ya da yargıyı belirtir. Öznel kavramı ise kişisel algılamaya göre farklılık gösteren dolayısı ile üzerine yüklenen anlamın kişilere göre değişebildiği durumu veya yargıyı ifade eder. Araştırmanın soru formu, sosyal, kültürel, çevresel, siyasal nitelikli pek çok ana soru ile alt soru gruplarından oluşmaktadır. Ancak, uygulamada mutluluk algısı üzerinde 145 Nattavudh Powdthave, Economics of Happiness: A Review of Literature and Applcations, Forthcoming in Chulalongkorn Journal of Economic, 2007, ss.17 ve 18. Nesne ile ilgili olan, nesnede oluşan, bireyin kişisel görüşünden bağımsız olan, objektif. Özneye ilişkin olan, öznede oluşan, nesnelerin gerçeğine değil, bireyin düşünce ve duygularına dayanan, subjektif 79

95 en çok etkisi olabileceği düşünülen nesnel ve öznel nitelikli sosyo-demografik göstergeler belirlenerek analizler yalnız bu göstergeler üzerinden uygulanmıştır. Analizlerde kullanılan değişkenleri kapsayan anket soru formu ile anket sonuçlarının görseli sırasıyla Ek.2 ve Ek.3 te mevcuttur. Nesnel nitelikli sosyo-demografik göstergelerin seçiminde, yazın taramasında sıklıkla karşılaşılan Cinsiyet, Yaş, Medeni durum, Eğitim durumu, Çalışma durumu, Çalışılan sektör, Gelir düzeyi, Yaşanılan bölge değişkenleri dikkate alınmıştır. Uygulanan analizlerde ise, mevcut çalışmalarda yararlanılan nesnel göstergelerin yanı sıra Sahip olunan çocuk sayısı, Aile ile birlikte yaşama durumu ve Dine bağlılık olmak üzere mutluluk üzerinde etkisi olabileceği düşünülen üç ek nesnel gösterge kullanılmıştır. Mutluluk algısı üzerindeki etki düzeyleri incelenen ve kişisel algıya göre farklılık gösteren öznel nitelikli göstergeler ise Ailenizin, Dost ve arkadaşlarınızın, Kendiniz için ayırdığınız boş zamanın, Siyasetin, İş ve çalışmanın, Dinin yaşamınızdaki önemi; Genel sağlık durumunuz, Hanedeki maddi durumunuzun tatmin düzeyi, Siyasete olan ilgi düzeyiniz, Demokrasinin önemi olarak belirlenmiştir. Kategorileri ile birlikte verilen nesnel göstergeler seti Ek.4 te, öznel göstergeler seti ise Ek.5 te mevcuttur. Siyasetin yaşamınızdaki önemi ve Siyasete olan ilgi düzeyi değişkenleri aynı ifadeyi belirtmekte olup; ikinci ifadenin kontrol sorusu olarak sorulduğu düşünülmektedir. Mutluluk algısının ayırımında etkisinin olup olmadığını saptamak üzere her iki gösterge de analizlerde kullanılmıştır Ölçek ve Kodlama Anket soru formundaki soruların geneline bakıldığında isimsel, sıralı, aralıklı ve oransal ölçekli olmak üzere tüm ölçek düzeylerinden çeşitli soruların mevcut olduğu görülmektedir. Uygulamada kullanılan öznel göstergelerin ölçekleri isimsel ve sıralı yapıdadır. Nesnel göstergelerin ölçek düzeyi de ağırlıklı olarak isimsel ve sıralı yapıda olmakla birlikte gelir düzeyi değişkeninin sıralı kategorik yapıda verildiği görülmektedir. Yaş değişkeni hem metrik hem kategorik yapıda mevcuttur. Başlangıçta iki yapı da analizde kullanılmış, ancak her ikisinin de kestirilen modele dahil edilmediği 80

96 görüldüğünden Ek.4 teki nesnel göstergeler setinde yalnız 3 kategoriden oluşan sıralı kategorik yapıdaki yaş değişkenine yer verilmiştir. Uygulamada kullanılan mutluluk değişkeni gerçekte 4 kategoriden oluşmakta olup, SPSS te Transform/Recode Into Different Variable yolu izlenerek Pek mutlu değilim ve Hiç mutlu değilim kategorileri 0:Mutsuz; Çok mutluyum ve Biraz mutluyum kategorileri ise 1:Mutlu olarak kodlanarak Mutluluk Algısı şeklinde kaydedilmiştir. Analizlerde bağımlı değişken olarak bu yeni değişken kullanılmıştır. Uluslararası bir araştırma olduğu için, mevcut veride Yaşanılan bölge değişkeni ülke bazında verilen 6 haneli kodlara göre kategorize edilmiştir; Dine bağlılık değişkeni ise mevcut tüm dinleri kapsamaktadır. Veri karmaşasından kurtulmak adına, bu iki değişkene ilişkin kategoriler Ek.2 deki anket soru formunda verildiği şekilde yani yalnız Türkiye yi kapsayacak biçimde Transform/Recode Into Different Variable yolu izlenerek yeniden kodlanmıştır. 3.4 Analiz ve Bulgular Uygulamada, nesnel ve öznel nitelikli göstergelerden yararlanılarak yalnız nesnel, yalnız öznel ve hem nesnel hem öznel göstergeler için lojistik regresyon analizi uygulanarak üç farklı model elde edilmiştir. Yalnız nesnel göstergelerle kurulan model için nesnel model, yalnız öznel göstergelerle kurulan model için öznel model, hem nesnel hem öznel göstergeler ile kurulan model içinse karma model ifadeleri kullanılmıştır. Analize ilişkin kestirim sonuçlarına geçilmeden önce, nesnel ve öznel göstergeler yönünden veriden elde edilen betimsel istatistikler öznel ve nesnel gösterge ayırımında değerlendirilmiştir Nesnel Göstergelere ĠliĢkin Betimleyici Ġstatistikler Mutluluk algısı üzerindeki etki düzeyleri incelenen nesnel göstergelerin değerlendirmesi isimsel ya da sıralı ölçekli olmalarına göre farklılık göstermektedir. Bu nedenle isimsel ve sıralı yapıdaki nesnel göstergelerin sıklık ve oran dağılımının ayrı yorumlanması tercih edilmiştir. 81

97 İlk olarak, isimsel ölçekli nesnel göstergelerin sıklık ve oran dağılımı Tablo.9 da görülmektedir. Tablo 9 İsimsel Ölçekli Nesnel Göstergelerin Dağılımı DeğiĢken Kategori Sıklık Oran Cinsiyet 1:Erkek ,3 2:Kadın ,7 1: Evli ,2 2: Evli gibi birlikte yaşıyorlar 1 0,1 Medeni Durum 3: Boşanmış 20 1,5 4: Evli fakat eşinden ayrı yaşıyor 3 0,2 5: Dul 33 2,5 6: Bekâr ,5 1: Tam zamanlı ,9 2: Yarı zamanlı 37 2,8 3: Kendi işimin sahibiyim ,5 Çalışma Durumu 4: Emekli 127 9,4 5: Ev hanımı ,3 6: Öğrenci 119 8,8 7: İş arıyorum 82 6,1 8: Diğer 30 2,2 1: İstanbul ,3 2: Batı Marmara 49 3,6 3: Ege ,8 4: Doğu Marmara : Batı Anadolu 126 9,4 Yaşanılan Bölge 6: Akdeniz ,1 7: İç Anadolu 84 6,2 8: Batı Karadeniz 86 6,4 9: Doğu Karadeniz 50 3,7 10: Kuzeydoğu Anadolu 51 3,8 11: Ortadoğu Anadolu 73 5,4 12: Güneydoğu Anadolu ,2 1: Hayır ,9 Ailenizin yanında mı yaşıyorsunuz? 2: Evet ,1 1:Devlet/kamu kurumları/yerel yönetimleri ,4 Çalışılan Sektör 2: Özel sektör ,4 3: Vakıf, dernek veya sivil toplum kuruluşları 9 1,2 Dine bağlılık 1: Müslüman ,9 5: Diğer 1 0,1 Anketin uygulandığı 1345 kişiden 676 sı erkek, 669 u kadındır. Yani ankete yanıt veren erkeklerin oranı %50,3, kadınların oranı ise %49,7 dir. Yanıt veren kişilerden evli olanların oranı %66,2 iken bekar olanların oranı %29,5 tir. Kalan %4,3 lük dilimde ise sırasıyla dul, boşanmış, evli olup eşinden ayrı yaşayanlar ve evli gibi birlikte yaşayanlar yer almaktadır. Geçerli oran değerleridir. 82

98 Ev hanımları %34,3, tam zamanlı çalışanlar %22,9, kendi işinin sahibi olanlar ise %13,5 ile ankete en fazla katılım gösteren kesimlerdir. Ankete yanıt veren 749 kişiden özel sektörde çalışan kişilerin katılım oranı %80,4 iken, kamu sektöründe çalışanların oranı %18,4 dir. Vakıf niteliği taşıyan yerlerde çalışanların sayısı ise 9 olup katılım oranı %1,2 dir. Ankete en çok katılımın olduğu üç bölge sırasıyla %19,3 ile İstanbul, %12,1 ile Akdeniz ve %11,8 ile Ege bölgesidir kişinin %31,1 i ailesinin yanında yaşadığını, %68,9 u ise ailesi ile birlikte yaşamadığını belirtmiştir. Dinsel kimliğini belirten 1331 katılımcının; %99,9 u Müslüman %0.1 i ise Diğer yanıtını vermiştir. İkinci olarak, sıralı ölçekli nesnel göstergelerin sıklık ve oran dağılımı Tablo.10 da görülmektedir. Tablo 10 Sıralı Ölçekli Nesnel Göstergelerin Dağılımı DeğiĢken Kategori Sıklık Oran BO 1: ,3 40,3 Yaş 2: ,9 82,2 3: 50 ve üstü , : Çocuk sahibi değil ,2 36,2 1: Bir çocuk ,4 49,6 2: İki çocuk ,9 69,4 3: Üç çocuk ,1 83,5 Sahip olunan çocuk sayısı 4: Dört çocuk 83 6,2 89,7 5: Beş çocuk 49 3,6 93,3 6: Altı çocuk 31 2,3 95,6 7: Yedi çocuk 18 1,3 96,9 8: Sekiz ve üstü çocuk 41 3, : Hiç okula gitmedim : İlkokuldan ayrıldım 51 3,8 11,8 3: İlkokul mezunuyum ,6 46,4 4: Ortaokuldan ayrıldım 35 2,6 49 5: Ortaokul mezunuyum 97 7,2 56,2 Eğitim Düzeyi 6: Liseden ayrıldım 45 3,3 59,6 7: Lise mezunuyum ,6 8: Üniversiteden ayrıldım ,6 9: Üniversite mezunuyum ,9 91,5 10: Şu anda lise öğrencisiyim 19 1,4 92,9 11: Şu anda üniversite öğrencisiyim 92 6,8 99,8 12: Lisansüstü 3 0,2 100 Birikimli oran değerleridir. 83

99 Gelir Durumu 1: 0-500TL ,3 23,3 2: TL ,9 49,1 3: TL ,8 63 4: TL ,6 77,5 5: TL 47 3,5 81 6: TL 99 7,4 88,4 7: TL 20 1,5 89,9 8: TL 80 5,9 95,8 9: TL ,8 10: 3001 TL ve üstü 29 2,2 100 Ankete katılan kişilerin %41,9 unun yaş aralığında oldukları görülmektedir yaş aralığında olan kişiler %40,3; 50 ve üstü yaşta olan kişiler ise %17,8 lik bir katılım payına sahiptirler. Dolayısı ile yaş aralığı ve altı olan kişilerin katılımcıların %82,2 sini oluşturdukları söylenebilir. Ankete katılan 1344 kişiden %36,2 sinin çocuk sahibi olmadığı görülmektedir. %19,9 ile ikinci en yüksek katılım iki çocuk sahibi olanlardan, üçüncü en yüksek katılım da %14,1 ile üç çocuk sahibi olanlardan gelmiştir. Dört ve daha az çocuğa sahip olanlar, katılımcıların %89,7 sini oluşturmaktadır katılımcının %34,6 sına karşılık gelen 465 kişi ilkokul mezunu iken, 269 lise mezununun katılım payı %20 dir. Üçüncü en yüksek katılım ise 147 kişi ile üniversite mezunlarına aittir ve katılım payı %10,9 dur. Hiç okula gitmediğini belirten 108 kişinin oranı %8 iken, lisansüstü eğitim alan 3 kişi %0,2 ile en düşük katılım oranına sahiptir. Diğer yönden, birikimli oranlara bakıldığında katılımcıların %56,2 sinin en fazla ortaokul mezunu olduğu görülmektedir. Ayrıca eğitim durumu için mod değeri 3 olup, yorumla tutarlı şekilde en çok yanıt verilen kategori grubunun ilkokul mezunu olduğu söylenebilir. Gelir durumu için mod değeri 2 bulunmuştur. Bununla bağlantılı olarak ankete en yüksek katılımın %25,9 ile aylık TL kazanç ile en düşük ikinci gelir grubuna sahip kişilerden geldiği söylenebilir. En yüksek ikinci katılımcı grubu %21,3 oranla aylık TL kazanca sahip ve dar gelirli olarak nitelendirilebilecek kişileri kapsamaktadır. %14,6 pay ile aylık TL kazanca sahip olanlar üçüncü en yüksek katılım oranına sahiptirler. Aylık TL ve daha az kazanca sahip olanlar 84

100 katılımcıların % 73 ünü oluşturmakta olup; en yüksek gelir grubu olan 3001TL ve üstü aylık kazanca sahip 29 kişinin ankete katılım oranı %2,2 dir Öznel Göstergelere ĠliĢkin Betimleyici Ġstatistikler Uygulamada kullanılan tek isimsel ölçekli öznel gösterge bağımlı değişken olarak belirlenen mutluluk algısıdır. Mutluluk algısına ilişkin sıklık ve oran dağılımı Tablo.11 de görülmektedir. Tablo 11 İsimsel Ölçekli Öznel Göstergelerin Dağılımı DeğiĢken Kategori Sıklık Oran 0:Mutsuz ,2 Mutluluk Algısı 1:Mutlu ,8 Ankete katılan 1345 kişiden 191 i %14,2 oranla kendisini mutsuz olarak,, 1154 kişi ise %85,8 oranla kendisini mutlu olarak nitelendirmiştir. Uygulamada kullanılan öznel göstergeler dört ana soru ile altı alt gruplu sorudan oluşmaktadır. Alt gruplu sorular için sıklık ve oran tablosu, kategori tekrarı yapmamak için kategoriler sütunda olacak şekilde tasarlanmıştır. Dolayısı ile dört ana soru ile altı alt gruplu soru için iki farklı sıklık ve oran tablosu hazırlanmıştır. İlk olarak, sıralı ölçekli dört ana soru için oluşturulan sıklık ve oran dağılımı Tablo.12.1 de görülmektedir. Tablo 12.1 Sıralı Ölçekli Öznel Göstergelerin Dağılımı-1 DeğiĢken Kategori Sıklık Oran BO 1: Çok iyi ,9 16,9 2: İyi ,8 Genel sağlık durumunuz 3: Orta ,7 91,5 4: Kötü 103 7,7 99,2 5: Çok kötü 11 0, : Hiç tatminkar değil 57 4,3 4, ,5 7, , ,6 19,6 Hanedeki maddi durumun tatmin düzeyi ,6 36, ,4 56, , ,1 90, ,4 96,6 10. Son derece tatminkar 46 3,

101 Siyasete olan ilgi düzeyiniz Demokrasinin önemi 1: Çok yakından ilgiliyim 116 8,6 8,6 2: Biraz ilgiliyim ,5 39,1 3: Pek ilgi duymam ,9 67 4: Hiç ilgi duymam : Hiç önemi yok 6 0,5 0, ,7 1, ,1 1, ,2 1, ,4 2, ,3 6, ,1 11, ,2 24, ,4 43,8 10: Vazgeçilemez önemde ,2 100 Ankete katılan 1340 kişiden %51 i genel sağlık durumunu iyi olarak nitelendirirken, katılımcıların %23,7 si orta, %16,9 u ise çok iyi yanıtını vermişlerdir. Sağlık durumunu kötü bulanların payı %7,7 iken çok kötü bulanların oranı %0,8 dir kişi içinden hanedeki maddi tatmin düzeyine 6 ve 7 puan verenlerin oranı %20,4 tür. Katılımcıların %16,6 sı 5 puan, %13,1 i ise 8 puan vermiştir. %4,3 lük kesim maddi tatmin düzeyine 1 puan, %3,4 lük kesim ise 10 puan vermiştir. Hanedeki maddi tatmin düzeyi için mod 7 olarak bulunmuştur kişiden siyasete hiç ilgi duymadığını ifade edenler %33, biraz ilgi duyduğunu belirtenler ise %30,5 oranındadır. Ankete katılan 1317 kişiden 740 ı %56,2 katılım oranı ile demokrasinin vazgeçilmez önemde olduğunu belirtmişlerdir. Demokrasinin hiç önemi olmadığını söyleyen 6 kişi katılımcıların %0,5 ine karşılık gelmektedir. Katılımcılardan demokrasinin önemine 9 ve daha az puan verenlerin oranı %43,8 dir. İkinci olarak, sıralı ölçekli dört ana soru için oluşturulan sıklık ve oran dağılımı Tablo12.2 de görülmektedir. 86

102 Tablo 12.2 Sıralı Ölçekli Öznel Göstergelerin Dağılımı-2 Kategori DeğiĢken Gösterge 1:Çok önemli 2:Oldukça önemli 3:Çok önemli değil 4:Hiç önemli değil S Ailenin yaşamınızdaki O 97,8 2 0,1 0,1 önemi BO 97,8 99,9 99,9 100 Dost ve arkadaşlarınızın yaşamınızdaki önemi Kendiniz için ayırdığınız boş zamanın yaşamınızdaki önemi Siyasetin yaşamınızdaki önemi İş ve çalışmanın yaşamınızdaki önemi Dinin yaşamınızdaki önemi S O 61,5 35,6 2 0,8 BO 61,5 97,2 99,2 100 S O 47,3 40,2 10,3 2,2 BO 47,3 87,5 97,8 100 S O 13,2 24,6 30,4 31,7 BO 13,2 37,8 68,3 100 S O 56,7 29,4 9,1 4,8 BO 56,7 86,1 95,2 100 S O 75 16,5 5,8 2,8 BO 75 91,4 97, kişinin %97,8 i ailesinin yaşamında çok önemli yeri olduğunu belirtirken, 1 kişi ailesinin yaşamında hiç önemi olmadığını ifade etmiştir. Dost ve arkadaşlarının yaşamındaki yerini çok önemli olarak nitelendirenlerin oranı %61,5 iken, iyi olarak nitelendirenlerin oranı %35,6 dır kişiden %47,3 ü kendisi için ayırdığı boş zamanın yaşamında çok önemli yeri olduğunu belirtirken, %40,2 lik kesim oldukça önemli olduğunu ifade etmiştir kişiden %31,7 si siyasetin yaşamında hiç önemi olmadığını, %30,4 çok önemi olmadığını belirtmiştir. Siyaseti önemseyenlerin oranı ise %13,2 dir. Sonuçların, kontrol sorusu niteliğinde ana sorularda yer alan siyasete olan ilgi düzeyi sorusuna verilen yanıtlarla tutarlı olduğu görülmektedir kişiden %56,7 si iş ve çalışmanın yaşamında çok önemli yeri olduğunu, %4,8 i ise hiç önemi olmadığını ifade etmiştir. Son olarak, 1343 kişinin %75 i dinin yaşamında çok önemli yeri olduğunu, %2,8 i ise hiç önemi olmadığını belirtmiştir Mutluluk Algısının Nesnel Göstergelere Göre DeğiĢimi Ek.4 te verilen nesnel göstergelere göre mutluluk algısının değişimi Tablo 13 te görülmektedir. S: Sıklık, O: Oran, BO: Birikimli oran anlamındadır. 87

103 Cinsiyet Yaş Medeni Durum Eğitim Düzeyi Çalışma Durumu Çalışılan Sektör Gelir Durumu Ailenizin yanında mı yaşıyorsunuz? Dine bağlılık Tablo 13. Mutluluk Algısının Nesnel Göstergelere Göre Değişimi Mutluluk Algısı(%) Mutsuz Mutlu 0: Erkek 50,8 50,2 1: Kadın 49,2 49,8 1: ,9 39,9 2: ,2 42,7 3: 50 ve üstü 19,9 17,4 1: Evli 58,1 67,6 2: Evli gibi birlikte yaşıyorlar 0,0 0,1 3: Boşanmış 3,1 1,2 4: Evli fakat eşinden ayrı yaşıyor 0,5 0,2 5: Dul 2,6 2,4 6: Bekâr 35,6 28,5 1: Hiç okula gitmedim 9,4 7,8 2: İlkokuldan ayrıldım 5,2 3,6 3: İlkokul mezunuyum 30,4 35,3 4: Ortaokuldan ayrıldım 3,7 2,4 5: Ortaokul mezunuyum 5,2 7,5 6: Liseden ayrıldım 5,2 3,0 7: Lise mezunuyum 22,5 19,6 8: Üniversiteden ayrıldım 0,0 1,2 9: Üniversite mezunuyum 7,9 11,4 10: Şu anda lise öğrencisiyim 0,5 1,6 11: Şu anda üniversite öğrencisiyim 9,9 6,3 12: Lisansüstü 0,0 0,3 1: Tam zamanlı 14,1 24,4 2: Yarı zamanlı 2,1 2,9 3: Kendi işimin sahibiyim 15,2 13,2 4: Emekli 9,9 9,4 5: Ev hanımı 29,3 35,1 6: Öğrenci 11,5 8,4 7: İş arıyorum 12,0 5,1 8: Diğer 5,8 1,6 1: Devlet/kamu kurumları/yerel yönetimleri 14,4 19,1 2: Özel sektör 84,7 79,6 3: Vakıf, dernek veya sivil toplum kuruluşları 0,9 1,3 1: 0-500TL 23,0 21,0 2: TL 28,8 25,4 3: TL 14,1 13,8 4: TL 12,0 15,0 5: TL 2,1 3,7 6: TL 6,8 7,5 7: TL 3,7 1,1 8: TL 4,7 6,2 9: TL 1,6 2,1 10: 3001 TL ve üstü 2,6 2,1 1: Hayır 60,5 70,3 2: Evet 39,5 29,7 1: Müslüman 100,0 99,9 5: Diğer 0,0 0,1 88

104 Yaşanılan Bölge Sahip olunan çocuk sayısı 1: İstanbul 22,0 18,8 2: Batı Marmara 0,5 4,2 3: Ege 4,7 13,0 4: Doğu Marmara 5,2 8,5 5: Batı Anadolu 8,4 9,5 6: Akdeniz 17,8 11,2 7: İç Anadolu 4,2 6,6 8: Batı Karadeniz 6,8 6,3 9: Doğu Karadeniz 3,1 3,8 10: Kuzeydoğu Anadolu 2,6 4,0 11: Ortadoğu Anadolu 6,3 5,3 12: Güneydoğu Anadolu 18,3 8,8 0: Çocuk sahibi değil 42,4 35,1 1: Bir çocuk 9,9 14,0 2: İki çocuk 15,7 20,6 3: Üç çocuk 11,5 14,5 4: Dört çocuk 6,8 6,1 5: Beş çocuk 4,2 3,6 6: Altı çocuk 1,0 2,5 7: Yedi çocuk 2,1 1,2 8: Sekiz ve üstü çocuk 6,3 2,5 Cinsiyete göre yapılan mutluluk algısı değerlendirmesinde, kendisini mutlu olarak nitelendiren erkeklerin oranının %50,2 iken kadınların oranının %49,8 olduğu söylenebilir. Kendini en mutlu gören yaş grubunun %42,7 ile aralığı olduğu, % 39,9 ile yaş aralığındaki kişilerin ikinci sırada, %17,4 oranı ile de 50 ve üstü kişilerin üçüncü sırada geldiği söylenebilir. Kendini en mutsuz gören yaş grubunun ise %42,9 ile aralığı olduğu, % 37,2 ile yaş aralığındaki kişilerin ikinci sırada, %19,9 oranı ile de 50 ve üstü kişilerin üçüncü sırada geldiği söylenebilir. Evlilerin kendisini mutsuz olarak niteleyenler içindeki oranı %67,6, kendisini mutlu olarak niteleyenler içindeki oranı ise %58,1 dir. Benzer yorum bekarlar için kendisini mutsuz olarak niteleyenler içindeki oranı %35, kendisini mutlu olarak niteleyenler içindeki oranı ise %28,5 tir şeklindedir. Diğer kategoriler için de yorumlar benzer şekilde yapılabilir. Ankete en yüksek katılım gösteren ilkokul mezunlarının kendisini mutsuz olarak niteleyenler içindeki oranı %35, kendisini mutlu olarak niteleyenler içindeki oranı ise %30,4 tür. Benzer şekilde lise mezunlarının kendisini mutsuz olarak niteleyenler içindeki oranı %22,5, kendisini mutlu olarak niteleyenler içindeki oranı ise %19,6 dır. 89

105 Öncelikle en yüksek oranlara sahip kategoriler dikkate alınmış olup diğer kategoriler için de yorumlar benzer şekilde yapılabilir. Ev hanımlarının kendisini mutsuz olarak niteleyenler içindeki oranı %29,3, kendisini mutlu olarak niteleyenler içindeki oranı ise %35,1 dir. Kendi işinde çalışanların %15,2 sinin kendisini mutsuz, %13,2 sinin ise mutlu olarak gördüğü söylenebilir. Tam zamanlı çalışanların kendisini mutsuz olarak niteleyenler içindeki oranı %14,1, kendisini mutlu olarak niteleyenler içindeki oranı ise %24,4 dür. Özel sektör çalışanlarının kendisini mutsuz olarak niteleyenler içindeki oranı %84,7, kendisini mutlu olarak niteleyenler içindeki oranı ise %79,6 dır. Kamu sektörü çalışanlarının kendisini mutsuz olarak niteleyenler içindeki oranı %14,4, kendisini mutlu olarak niteleyenler içindeki oranı ise, %19,1 dir. Aylık kazancı TL aralığında olanların kendisini mutsuz olarak niteleyenler içindeki oranı %28,8, kendisini mutlu olarak niteleyenler içindeki oranı ise %25,4 tür. Aylık kazancı 0-500TL aralığında olanların kendisini mutsuz olarak niteleyenler içindeki oranı %23, kendisini mutlu olarak niteleyenler içindeki oranı ise %21 dir. Ailesinden ayrı yaşayanların kendisini mutsuz olarak niteleyenler içindeki oranı %60,5, kendisini mutlu olarak niteleyenler içindeki oranı ise %70,3 tür.. Ailesi ile birlikte yaşayanların kendisini mutsuz olarak niteleyenler içindeki oranı %39,5, kendisini mutlu olarak niteleyenler içindeki oranı ise %29,7 dir. Dine bağlılık sorusuna 1331 kişi yanıt vermiş, 1330 kişi Müslüman olduğunu belirtirken 1 kişi Diğer olarak atanan farklı bir seçenek söylemiştir. Belirli bir dine bağlı olup dinsel kimliğini Müslüman olarak belirtenlerin, kendisini mutsuz olarak niteleyenler içindeki oranı %100, kendisini mutlu olarak niteleyenler içindeki oranı ise %99 dur. Oranların Müslüman seçeneği için bu kadar yüksek çıkması katılımcı sayısından ileri gelmektedir. Bölge olarak İstanbul da yaşayanların kendisini mutsuz olarak niteleyenler içindeki oranı %22, kendisini mutlu olarak niteleyenler içindeki oranı ise %18,8 dir. 90

106 Güneydoğu Anadolu bölgesinde yaşayanların %18,3 ünün kendisini mutsuz, %8,8 inin ise mutlu olarak gördüğü söylenebilir. Akdeniz bölgesinde yaşayanların kendisini mutsuz olarak niteleyenler içindeki oranı %17,8, kendisini mutlu olarak niteleyenler içindeki oranı ise %11,2 dir. Çocuk sahibi olmayanların kendisini mutsuz olarak niteleyenler içindeki oranı %42,4 iken, kendisini mutlu olarak niteleyenler içindeki oranı %35,1 dir. İki çocuk sahibi olanların kendisini mutsuz olarak niteleyenler içindeki oranı %15,7, kendisini mutlu olarak niteleyenler içindeki oranı ise %20,6 dır Mutluluk Algısının Öznel Göstergelere Göre DeğiĢimi Ek.5 te verilen öznel göstergelere göre mutluluk algısının değişimi Tablo 14 te görülmektedir. Tablo 14. Mutluluk Algısının Öznel Göstergelere Göre Değişimi Ailenin yaşamınızdaki önemi Dost ve arkadaşlarınızın yaşamınızdaki önemi Kendiniz için ayırdığınız boş zamanın yaşamınızdaki önemi Siyasetin yaşamınızdaki önemi İş ve çalışmanın yaşamınızdaki önemi Dinin yaşamınızdaki önemi Genel sağlık durumunuz Mutluluk Algısı Mutsuz Mutlu 1:Çok önemli 97,9 97,8 2:Oldukça önemli 1,6 2,1 3:Çok önemli değil 0,0 0,1 4:Hiç önemli değil 0,5 0,0 1:Çok önemli 66,0 60,8 2:Oldukça önemli 28,8 36,8 3:Çok önemli değil 3,1 1,8 4:Hiç önemli değil 2,1 0,6 1:Çok önemli 47,1 47,3 2:Oldukça önemli 34,0 41,2 3:Çok önemli değil 13,1 9,9 4:Hiç önemli değil 5,8 1,6 1:Çok önemli 16,9 12,6 2:Oldukça önemli 24,9 24,6 3:Çok önemli değil 25,9 31,2 4:Hiç önemli değil 32,3 31,6 1:Çok önemli 57,7 56,5 2:Oldukça önemli 28,0 29,7 3:Çok önemli değil 10,1 8,9 4:Hiç önemli değil 4,2 4,9 1:Çok önemli 80,5 74,1 2:Oldukça önemli 13,7 16,9 3:Çok önemli değil 3,7 6,2 4:Hiç önemli değil 2,1 2,9 1: Çok iyi 6,3 18,6 2: İyi 31,9 54,1 3: Orta 38,2 21,2 4: Kötü 19,9 5,7 5: Çok kötü 3,7 0,3 91

107 Siyasete olan ilgi düzeyiniz Hanedeki maddi durumun tatmin düzeyi Demokrasinin önemi 1: Çok yakından ilgiliyim 12,1 8,1 2: Biraz ilgiliyim 29,5 30,6 3: Pek ilgi duymam 27,4 28,0 4: Hiç ilgi duymam 31,1 33,3 1: Hiç tatminkar değil 11,0 3,1 2 8,9 2,6 3 12,0 4,1 4 8,9 6,2 5 16,2 16,7 6 15,7 21,1 7 10,5 22,1 8 11,5 13,4 9 1,6 7,2 10. Son derece tatminkar 3,7 3,4 1: Hiç önemi yok 0,5 0,4 2 1,1 0,6 3 0,5 0,0 4 0,0 0,3 5 1,6 1,3 6 1,1 3,6 7 4,3 5,2 8 9,0 13,9 9 23,4 18,8 10: Vazgeçilmez önemde 58,5 55,8 Ailesinin yaşamında çok önemli yeri olduğunu belirten kişilerin, kendisini mutsuz olarak niteleyenler içindeki oranı %97,9 iken, kendisini mutlu olarak niteleyenler içindeki oranı %97,8 dir. Dost ve arkadaşlarının yaşamındaki yerini çok önemli olarak nitelendiren kişilerin, kendisini mutsuz olarak niteleyenler içindeki oranı %66 iken, kendisini mutlu olarak niteleyenler içindeki oranı %60,8 dir. Oldukça önemli yanıtı veren kişilerin, kendisini mutsuz olarak niteleyenler içindeki oranı %28,8 iken, kendisini mutlu olarak niteleyenler içindeki oranı %36,8 dir. Kendisi için ayırdığı boş zamanın yaşamında çok önemli yeri olduğunu belirten kişilerin, kendisini mutsuz olarak niteleyenler içindeki oranı %47,1 iken, kendisini mutlu olarak niteleyenler içindeki oranı %47,3 tür. Oldukça önemli yanıtı veren kişilerin, kendisini mutsuz olarak niteleyenler içindeki oranı %34 iken, kendisini mutlu olarak niteleyenler içindeki oranı %41,2 dir. Siyasetin yaşamında hiç önemi olmadığını belirten kişilerin, kendisini mutsuz olarak niteleyenler içindeki oranı %32,3 iken, kendisini mutlu olarak niteleyenler içindeki oranı %31,6 dır. Çok önemli değil yanıtı verenlerin kendisini mutsuz olarak 92

108 niteleyenler içindeki oranı %25,9 iken, kendisini mutlu olarak niteleyenler içindeki oranı %31,6 dır. İş ve çalışmanın yaşamında çok önemli yeri olduğunu belirten kişilerin, kendisini mutsuz olarak niteleyenler içindeki oranı %57,7 iken, kendisini mutlu olarak niteleyenler içindeki oranı %56,5 tir. Oldukça önemli yanıtı verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı %28 iken, kendisini mutlu olarak niteleyenler içindeki oranı %29,7 dir. Çok önemli yanıtı verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı da %10,1 iken, kendisini mutlu olarak niteleyenler içindeki oranı %8,9 dur. Dinin yaşamında çok önemli yeri olduğunu belirten kişilerin, kendisini mutsuz olarak niteleyenler içindeki oranı %80,5 iken, kendisini mutlu olarak niteleyenler içindeki oranı %74,1 dir. Oldukça önemli yanıtı verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı %13,7 iken, kendisini mutlu olarak niteleyenler içindeki oranı %16,9 dur. Genel sağlık durumunu iyi olarak belirten kişilerin, kendisini mutsuz olarak niteleyenler içindeki oranı %31,9 iken, kendisini mutlu olarak niteleyenler içindeki oranı %54,1 dir. Orta yanıtı verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı %38,2 iken, kendisini mutlu olarak niteleyenler içindeki oranı %21,2 dir. Kötü yanıtı verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı %19,9 iken, kendisini mutlu olarak niteleyenler içindeki oranı %5,7 dir. Çok iyi yanıtı verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı %6,3 iken, kendisini mutlu olarak niteleyenler içindeki oranı %18,6 dır. Son olarak çok kötü yanıtı verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı %3,7 iken, kendisini mutlu olarak niteleyenler içindeki oranı %0,3 tür. Siyasete olan ilgi düzeyine hiç ilgi duymam yanıtı veren kişilerin, kendisini mutsuz olarak niteleyenler içindeki oranı %31,1 iken, kendisini mutlu olarak niteleyenler içindeki oranı %33,4 tür. Biraz ilgiliyim yanıtı verenlerin ise kendisini mutsuz olarak niteleyenler içindeki oranı %29,5 iken, kendisini mutlu olarak niteleyenler içindeki oranı %30,6 dır. 93

109 Hanedeki maddi tatmin düzeyine 7 puan verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı %10,5 iken, kendisini mutlu olarak niteleyenler içindeki oranı %22,1 dir. 5 puan verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı %16,2 iken, kendisini mutlu olarak niteleyenler içindeki oranı %16,7 dir. 6 puan verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı %15,7 iken, kendisini mutlu olarak niteleyenler içindeki oranı %21,1 dir.1 puan verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı %11 iken, kendisini mutlu olarak niteleyenler içindeki oranı %3,1 dir. 10 puan verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı %3,7 iken, kendisini mutlu olarak niteleyenler içindeki oranı %3,4 dir. Demokrasinin vazgeçilmez önemde olduğunu belirten kişilerin, kendisini mutsuz olarak niteleyenler içindeki oranı %58,5 iken, kendisini mutlu olarak niteleyenler içindeki oranı %55,8 dir. 9 puan verenlerin kendisini mutsuz olarak niteleyenler içindeki oranı %23,4 iken, kendisini mutlu olarak niteleyenler içindeki oranı %18,8 dir. Demokrasinin hiç önemi olmadığını söyleyen 6 kişinin kendisini mutsuz olarak niteleyenler içindeki oranı %0,5 iken, kendisini mutlu olarak niteleyenler içindeki oranı %0,4 tür Ġkili Lojistik Regresyon Analizi ile Model Kestirimleri SPSS 15.0 paket programı kullanılarak yalnız nesnel, yalnız öznel ve hem nesnel hem öznel değişkenler üzerinden uygulanan analizde değişken seçimi için ileriye doğru aşamalı değişken seçme tekniğinden (Forward Wald) yararlanılmıştır. Yazındaki yaygın kullanım göz önüne alınarak analizlerde anlamlılık düzeyi, α=0.05 ve sınıflara yapılacak atama için sınıflandırma eşik değeri t=0.5 olarak belirlenmiştir Nesnel Modelin Kestirimi Kestirilen ilk model, Ek.4 te verilen nesnel nitelikli göstergeler üzerinden kurulan nesnel modeldir. Nesnel göstergelerin mutluluk algısı üzerindeki etki düzeylerini saptamak üzere kurulan modele ilişkin sonuçlar aşağıdaki gibidir: 94

110 Tablo 15. Nesnel Model için Yineleme Geçmişi Yineleme -2 Log olabilirlik Sabit terimin katsayısı (β 0 ) 1 630,383 1,398 Adım ,315 1, ,214 1, ,214 1,731 İlk aşamada modele sabit terimin eklendiği ve bu aşamanın dördüncü yinelemesinde -2logL istatistiği 0,001 değerinin altında bir azalış gösterdiğinden yinelemelere son verildiği; dördüncü yineleme sonunda sabit terimin katsayısının 1,731 ve -2LogL istatistiğinin de 619,214 olarak elde edildiği söylenebilir. Tablo 16 Nesnel Model için Omnibus Testi Model Katsayıları Ki-kare sd P Adım 24, ,010 Blok 49, ,000 Model 49, ,000 Tablo 17 Nesnel Model Özeti ile Hosmer ve Lemeshow Uyum İyiliği Testi -2 Log olabilirlik Cox & Snell R 2 Nagelkerke R 2 sd P 569,386 0,066 0,115 3, ,862 Yalnız sabiti içeren modelin -2logL olabilirlik değeri 619,214; sabit ve bağımsız değişkenleri içeren modelin -2logL olabilirlik değeri ise569,386 dır. Model Ki- Kare değeri olan 49,828 bu iki -2LogL olabilirlik değeri arasındaki farktır. Modelin istatistiksel anlamlılığının sınanmasında kullanılan olabilirlik oran testine ilişkin yokluk ve alternatif hipotez(i) şu şekilde kurulur: (Model genel olarak anlamlı değildir) (Model genel olarak anlamlıdır) Olabilirlik oran testine ilişkin test istatistiği için P=0,000<α=0,05 geçerli olduğundan yokluk hipotezi reddedilir. Yani kestirilen nesnel modelin genel olarak anlamlı olduğu söylenebilir. 95

111 Modelin Cox ve Snell R 2 ve Nagelkerke R 2 değerleri sırasıyla 0,066 ve 0,115 olarak bulunmuştur. Cox ve Snell R 2 değerine göre bağımsız değişkenlerdeki bir birimlik değişme kişilerin mutlu olarak nitelendirilmesi yönünde %6,7 seviyesinde, Nagelkerke R 2 değerine göre ise bağımsız değişkenlerdeki bir birimlik değişme kişilerin mutlu olarak nitelendirilmesi yönünde %11,5 oranında bir değişim yaratmaktadır. Modelin verilerle olan uyum iyiliğinin testinde yararlanılan Hosmer- Lemeshow test istatistiğine ilişkin değerlendirmede yararlanılan hipotezler ise şu şekildedir: H 0 : Modelde uyum eksikliği yoktur. H 1 : Modelde uyum eksikliği vardır. uyumlu olduğunu ifade eden test istatistiği için P=0,862>α=0,05 geçerli olduğundan modelin verilerle kümesine iyi uyum sağladığı %95 güvenle söylenebilir. hipotezi reddedilemez. Kestirilen nesnel modelin veri Nesnel model için uygulanan analiz sonucunda oluşturulan doğru atama tablosu Tablo18 de görülmektedir. Tablo 18. Nesnel Model için Doğru Atama Tablosu Kestirim değerleri Gözlenen değerler Mutluluk Algısı (Sıklık) Doğruluk Yüzdesi Mutsuz Mutlu Mutsuz Mutluluk Algısı Başlangıç Mutlu Toplam (%) 85,0 Mutsuz ,8 Mutluluk Algısı Analiz sonucu Mutlu ,4 Toplam (%) 84,7 Başlangıçta doğruluk yüzdesi %85 iken analiz sonucunda bu oranın %0,3 düşüşle %84,7 ye gerilediği görülmektedir. Analizin uygulandığı 731 kişiden 617 kişinin doğru olarak mutlu, 2 kişinin ise yine doğru olarak mutsuz şeklinde nitelendirildiği söylenebilir. Yanlış sınıflandırma oranı ise % 15,3 tür. 19 da verilmiştir: Nesnel model için elde edilen EÇO katsayı kestirimlerine ilişkin sonuçlar Tablo 96

112 Tablo 19. Nesnel Modele İlişkin Kestirim Sonuçları DeğiĢken SH W sd P GA %95 Alt sınır Üst sınır ÇalıĢma Durumu 19, ,006 Çalış. Dur. (Tam zamanlı) 2,346 0,657 12, ,000 10,440 2, ,8645 Çalış. Dur. (Yarı zamanlı) 1,749 0,832 4, ,035 5,747 1, ,3307 Çalış. Dur. (Kendi işi) 1,445 0,655 4, ,027 4,241 1, ,3051 Çalış. Dur. (Emekli) 1,746 0,677 6, ,010 5,734 1, ,6221 Çalış. Dur. (Ev hanımı) 1,385 0,736 3, ,060 3,993 0, ,9032 Çalış. Dur. (Öğrenci) 1,672 0,908 3, ,065 5,324 0, ,5288 Çalış. Dur. (İş arıyor) 1,335 0,688 3, ,052 3,802 0, ,6539 Bölge 22, ,023 Bölge (İstanbul) 0,462 0,376 1, ,219 1,587 0,7601 3,3140 Bölge (Batı Marmara) 2,148 1,073 4, ,045 8,570 1, ,2011 Bölge (Ege) 1,645 0,486 11, ,001 5,180 2, ,4156 Bölge (Doğu Marmara) 1,369 0,566 5, ,016 3,931 1, ,9282 Bölge (Batı Anadolu) 0,916 0,516 3, ,076 2,499 0,9089 6,8687 Bölge (Akdeniz) 0,354 0,399 0, ,375 1,425 0,6514 3,1173 Bölge (İç Anadolu) 1,039 0,533 3, ,051 2,828 0,9948 8,0373 Bölge (Batı Karadeniz) 0,557 0,487 1, ,253 1,745 0,6722 4,5291 Bölge (Doğu Karadeniz) 0,937 0,628 2, ,135 2,553 0,7462 8,7336 Bölge (Kuzeydoğu Anadolu) 1,595 0,814 3, ,050 4,929 0, ,3129 Bölge (Ortadoğu Anadolu) 1,477 0,684 4, ,031 4,379 1, ,7372 Sabit -0,805 0,656 1, ,219 0,447 Tablo 19 daki sonuçlara göre nesnel modele göre mutluluk algısını etkileyen değişkenlerin çalışma durumu ile yaşanılan bölge olduğu ve belirli kategorileri bakımından %5 anlamlılık düzeyi için istatistiksel olarak anlamlı çıktıkları görülmektedir. Parametre yorumları yalnız anlamlı çıkan değişken kategorileri için yapılacaktır. Çalışma Durumu: Tam zamanlı çalışan kişiler için parametre kestirim değeri 2,346 olup, bu değişken kategorisindeki artış kişilerin mutlu olarak nitelendirilmesi yönündeki fark oranının logaritmasını 2,346 birim artırmaktadır. Benzer şekilde yarı zamanlı çalışan kişi kategorisindeki artış 1,749, kendi işinde çalışan kişi kategorisindeki artış 1,445 ve emekli kişi kategorisindeki artış da kişilerin mutlu olarak nitelendirilmesi yönündeki fark oranının logaritmasını 1,746 birim artırmaktadır. 97

113 Çalışma durumu için referans kategori Diğer olarak atanmıştır. Buradan hareketle tam zamanlı çalışan kişilerin mutlu olarak nitelendirilme olasılığı çalışma durumuna diğer yanıtı veren kişilere göre yaklaşık 12,7 kat daha fazladır. Benzer şekilde çalışma durumuna Diğer cevabı veren kişilere göre yarı zamanlı çalışan kişilerin 4,4 kat, kendi işinde çalışan kişilerin 4,9 kat, emekli yanıtı veren kişilerin ise yaklaşık 6,7 kat daha mutlu olarak nitelendirilebileceği söylenebilir. Yaşanılan Bölge: Batı Marmara bölgesinde yaşayan kişiler için parametre kestirim değeri 2,148 olup, bu değişken kategorisindeki artış kişilerin mutlu olarak nitelendirilmesi yönündeki fark oranının logaritmasını 2,148 birim artırmaktadır. Benzer şekilde Ege bölgesinde yaşayan kişi kategorisindeki artış 1,645, Doğu Marmara bölgesinde yaşayan kişi kategorisindeki artış 1,369 ve Ortadoğu Anadolu bölgesinde yaşayan kişi kategorisindeki artış da kişilerin mutlu olarak nitelendirilmesi yönündeki fark oranının logaritmasını 1,447 birim artırmaktadır. Yaşanılan bölge için referans kategori Güneydoğu Anadolu bölgesi olarak atanmıştır. Batı Marmara bölgesinde yaşayan kişilerin mutlu olarak nitelendirilme olasılığı Güneydoğu Anadolu bölgesinde yaşayan kişilere göre 4 kat daha fazladır. Benzer şekilde Güneydoğu Anadolu bölgesinde yaşayan kişilere göre Ege bölgesinde yaşayan kişilerin yaklaşık 11,5 kat, Doğu Marmara bölgesinde yaşayan kişilerin yaklaşık 5,8 kat, Ortadoğu Anadolu bölgesinde yaşayan kişilerin ise yaklaşık 4,7 kat daha mutlu olarak nitelendirilebileceği söylenebilir Öznel Modelin Kestirimi Kestirilen ikinci model, Ek.5 te verilen öznel nitelikli göstergeler üzerinden kurulan öznel modeldir. Öznel göstergelerin mutluluk algısı üzerindeki etki düzeylerini saptamak üzere kurulan modele ilişkin sonuçlar aşağıdaki gibidir: 98

114 Tablo 20. Öznel Model için Yineleme Geçmişi Yineleme -2 Log olabilirlik Sabit terimin katsayısı (β 0 ) ,086 1,432 Adım ,179 1, ,918 1, ,918 1,799 İlk aşamada modele sabit terimin eklendiği ve bu aşamanın dördüncü yinelemesinde -2logL istatistiği 0,001 değerinin altında bir azalış gösterdiğinden yinelemelere son verildiği; dördüncü yineleme sonunda sabit terimin katsayısının 1,799 ve -2LogL istatistiğinin de 1058,918 olarak elde edildiği söylenebilir. Tablo 21. Öznel Model için Omnibus Testi Model Katsayıları Ki-kare sd P Adım 17, ,040 Blok 164, ,000 Model 164, ,000 Tablo 22. Öznel Model Özeti ile Hosmer ve Lemeshow Uyum İyiliği Testi -2 Log olabilirlik Cox & Snell R 2 Nagelkerke R 2 sd P 894,025 0,119 0,214 5, ,701 Yalnız sabiti içeren modelin -2logL olabilirlik değeri 1058,918; sabit ve bağımsız değişkenleri içeren modelin -2logL olabilirlik değeri ise 894,025 tir. Model Ki- Kare değeri olan 164,893 bu iki -2LogL olabilirlik değeri arasındaki farktır. Modelin istatistiksel anlamlılığının sınanmasında kullanılan olabilirlik oran testine ilişkin yokluk ve alternatif hipotez(i) şu şekilde kurulur: (Model genel olarak anlamlı değildir) (Model genel olarak anlamlıdır) Olabilirlik orana testine ilişkin test istatistiği için P=0,000<α=0,05 geçerli olduğundan yokluk hipotezi reddedilir. Yani kestirilen öznel modelin genel olarak anlamlı olduğu söylenebilir. Modelin Cox ve Snell R 2 ve Nagelkerke R 2 değerleri sırasıyla 0,119 ve 0,214 olarak bulunmuştur. Cox ve Snell R 2 değerine göre bağımsız değişkenlerdeki bir 99

115 birimlik değişme kişilerin mutlu olarak nitelendirilme yönünde %11,9 düzeyinde, Nagelkerke R 2 değerine göre ise bağımsız değişkenlerdeki bir birimlik değişme kişilerin mutlu olarak nitelendirilme yönünde %21,4 oranında bir değişim yaratmaktadır. Modelin verilerle olan uyum iyiliğinin testinde yararlanılan Hosmer Lemeshow test istatistiğine ilişkin değerlendirmede yararlanılan hipotezler ise şu şekildedir: H 0 : Modelde uyum eksikliği yoktur. H 1 : Modelde uyum eksikliği vardır. uyumlu olduğunu ifade eden test istatistiği için P=0,701>α=0,05 geçerli olduğundan modelin verilerle kümesine iyi uyum sağladığı %95 güvenle söylenebilir. hipotezi reddedilemez. Kestirilen öznel modelin veri Öznel model için sınıflandırma eşik değeri, t=0.5 için uygulanan analiz sonucunda oluşturulan doğru atama tablosu Tablo 23 te görülmektedir. Tablo 23. Öznel Model için Doğru Atama Tablosu Kestirim değerleri Gözlenen değerler Mutluluk Algısı (Sıklık) Doğruluk Yüzdesi Mutsuz Mutlu Mutsuz Mutluluk Algısı Başlangıç Mutlu Toplam (%) 85,8 Mutsuz ,9 Mutluluk Algısı Analiz sonucu Mutlu ,3 Toplam (%) 85,9 Başlangıçta doğruluk yüzdesi %85,8 iken analiz sonucunda bu oranın % 0,1 lik artışla %85,9 a yükseldiği görülmektedir. Analizin uygulandığı 1296 kişiden 1093 ünün doğru olarak mutlu, 20 sinin ise yine doğru olarak mutsuz şeklinde nitelendirildiği söylenebilir. Yanlış sınıflandırma oranı ise % 14,1 tür. 24 te verilmiştir: Öznel model için elde edilen EÇO katsayı kestirimlerine ilişkin sonuçlar Tablo 100

116 Tablo 24. Öznel Göstergelere Göre Kestirim Sonuçları DeğiĢken SH W sd P GA % 95 Alt sınır Üst sınır Sağlık Durumu 72, ,000 Sağ. Dur.(Çok iyi) 4,037 0,825 23, ,000 56,681 11, ,4578 Sağ. Dur. (İyi) 3,388 0,773 19, ,000 29,604 6, ,6960 Sağ. Dur. (Orta) 2,357 0,776 9, ,002 10,560 2, ,3082 Sağ. Dur. (Kötü) 1,860 0,797 5, ,020 6,425 1, ,6163 Maddi Tatmin 39, ,000 Mad. Tat.(Hiç tatminkar değil) -0,792 0,523 2, ,130 0,453 0,1624 1,2632 Mad. Tat.(2) -0,756 0,548 1, ,168 0,470 0,1603 1,3749 Mad. Tat.(3) -0,676 0,513 1, ,188 0,508 0,1859 1,3906 Mad. Tat.(4) -0,160 0,522 0, ,759 0,852 0,3061 2,3706 Mad. Tat.(5) 0,028 0,474 0, ,953 1,028 0,4062 2,6033 Mad. Tat.(6) 0,345 0,470 0, ,463 1,411 0,5618 3,5456 Mad. Tat.(7) 0,861 0,493 3, ,081 2,365 0,8999 6,2176 Mad. Tat.(8) 0,142 0,495 0, ,775 1,152 0,4370 3,0379 Mad. Tat.(9) 1,704 0,750 5, ,023 5,494 1, ,8866 Demokrasinin Önemi 8, ,513 Demok. Ön.(Hiç önemi yok) 0,537 1,188 0, ,651 1,711 0, ,5632 Demok. Ön. (2) -0,612 0,858 0, ,475 0,542 0,1009 2,9113 Demok. Ön. (3) -24, ,970 0, ,000 0, Demok. Ön. (4) 19, ,723 0, , , Demok. Ön. (5) -0,141 0,682 0, ,836 0,869 0,2284 3,3038 Demok. Ön. (6) 1,423 0,790 3, ,072 4,149 0, ,5232 Demok. Ön. (7) 0,170 0,417 0, ,684 1,185 0,5234 2,6843 Demok. Ön. (8) 0,411 0,303 1, ,175 1,508 0,8324 2,7312 Demok. Ön. (9) -0,247 0,218 1, ,256 0,781 0,5092 1,1970 Sabit -1,297 0,878 2, ,140 0,273 Tablo 24 teki sonuçlara göre öznel modelde mutluluk algısını etkileyen değişkenlerin sağlık durumu, maddi tatmin düzeyi ve demokrasiye verilen önem olduğu belirlenmiştir. Sağlık durumunun tüm kategorilerinin, maddi tatmin düzeyinin ise tek bir kategorisinin %5 anlamlılık düzeyinde istatistiksel olarak anlamlı çıktığı; demokrasiye verilen önemin ise hiçbir kategorisinin istatistiksel olarak anlamlı çıkmadığı görülmüştür. Parametre yorumları yalnız anlamlı çıkan değişken kategorileri için yapılacaktır. 101

117 Sağlık Durumu: Sağlık durumuna çok iyi yanıtı veren kişiler için parametre kestirim değeri 4,037 olup, bu değişken kategorisindeki artış kişilerin mutlu olarak nitelendirilmesi yönündeki fark oranının logaritmasını 4,037 birim artırmaktadır. Benzer şekilde iyi kategorisindeki artış 3,388, orta kategorisindeki artış 2,357 ve kötü kategorisindeki artış da kişilerin mutlu olarak nitelendirilmesi yönündeki fark oranının logaritmasını 1,860 birim artırmaktadır. Sağlık durumuna ilişkin referans kategori Çok kötü olarak atanmıştır. Buradan hareketle sağlık durumuna çok iyi yanıtı veren kişilerin mutlu olarak nitelendirilme olasılığı sağlık durumuna çok kötü yanıtı veren kişilere göre yaklaşık 23,9 kat daha fazladır. Benzer şekilde sağlık durumuna çok kötü yanıtı veren kişilere göre iyi yanıtı veren kişilerin 19,2 kat, orta yanıtı veren kişilerin 9,2 kat, kötü yanıtı veren kişilerin ise yaklaşık 5,5 kat daha mutlu olarak nitelendirilebileceği söylenebilir. Maddi Tatmin: Maddi tatminin yalnız 9. kategorisi istatistiksel olarak anlamlı bulunmuştur. Buna göre maddi tatmin düzeyine 9 puan veren kişiler için parametre kestirim değeri 1,704 olup, bu değişken kategorisindeki artış kişilerin mutlu olarak nitelendirilmesi yönündeki fark oranının logaritmasını 1,704 birim artırmaktadır. Maddi tatmin düzeyi için referans kategori Son derece tatminkar olarak atanmıştır. Buradan hareketle maddi tatmin düzeyine 9 puan veren kişilerin mutlu olarak nitelendirilme olasılığının maddi tatmin düzeyine son derece tatminkar yanıtı veren kişilere göre yaklaşık 5,2 kat daha fazla olduğu söylenebilir Karma Modelin Kestirimi Kestirilen üçüncü ve son model, Ek.4 ve Ek.5 te verilen nesnel ve öznel göstergeler üzerinden kurulan karma modeldir. Öznel ve nesnel göstergelerin mutluluk algısı üzerindeki etki düzeylerini saptamak üzere kurulan modele ilişkin sonuçlar aşağıdaki gibidir: 102

118 Tablo 25. Karma Model için Yineleme Geçmişi Yineleme -2 Log olabilirlik Sabit terimin katsayısı (β 0 ) 1 609,600 1,403 Adım ,614 1, ,510 1, ,510 1,740 İlk aşamada modele sabit terimin eklendiği ve bu aşamanın dördüncü yinelemesinde -2logL istatistiği 0,001 değerinin altında bir azalış gösterdiğinden yinelemelere son verildiği; dördüncü yineleme sonunda sabit terimin katsayısının 1,740 ve -2LogL istatistiğinin de 598,510 olarak elde edildiği söylenebilir. Tablo 26. Karma Model için Omnibus Testi Model Katsayıları Ki-kare sd P Adım 19,056 9,025 Blok 122,971 22,000 Model 122,971 22,000 Tablo 27. Nesnel Model Özeti ile Hosmer ve Lemeshow Uyum İyiliği Testi -2 Log olabilirlik Cox & Snell R 2 Nagelkerke R 2 sd P 475,539 0,159 0,279 15, ,045 Yalnız sabiti içeren modelin -2logL olabilirlik değeri 598,510; sabit ve bağımsız değişkenleri içeren modelin -2logL olabilirlik değeri ise 475,539 dır. Model Ki-Kare değeri olan 122,971 bu iki -2LogL olabilirlik değeri arasındaki farktır. Modelin istatistiksel anlamlılığının sınanmasında kullanılan olabilirlik oran testine ilişkin yokluk ve alternatif hipotez(i) şu şekilde kurulur: (Model genel olarak anlamlı değildir) (Model genel olarak anlamlıdır) Olabilirlik oran testine ilişkin test istatistiği için P=0,000<α=0,05 geçerli olduğundan yokluk hipotezi reddedilir. Yani kestirilen karma modelin genel olarak anlamlı olduğu söylenebilir. 103

119 Modelin Cox ve Snell R 2 ve Nagelkerke R 2 değerleri sırasıyla 0,159 ve 0,279 olarak bulunmuştur. Cox ve Snell R 2 değerine göre bağımsız değişkenlerdeki bir birimlik değişme kişilerin mutlu olarak nitelendirilmesi yönünde %15,9 seviyesinde, Nagelkerke R 2 değerine göre ise bağımsız değişkenlerdeki bir birimlik değişme kişilerin mutlu olarak nitelendirilmesi yönünde %27,9 oranında bir değişim yaratmaktadır. Modelin verilerle olan uyum iyiliğinin testinde yararlanılan Hosmer Lemeshow test istatistiğine ilişkin değerlendirmede yararlanılan hipotezler ise şu şekildedir: H 0 : Modelde uyum eksikliği yoktur. H 1 : Modelde uyum eksikliği vardır. test istatistiği için P=0,045<α=0,05 söz konusu olduğundan modelin verilerle uyumlu olduğunu ifade eden hipotezi geçerli değildir. Bu durumda, kestirilen karma modelin veri kümesine iyi uyum sağladığı söylenemez. Karma model için uygulanan analiz sonucunda oluşturulan doğru atama tablosu Tablo.28 de görülmektedir. Tablo 28 Karma Model için Doğru Atama Tablosu Kestirim değerleri Gözlenen değerler Mutluluk Algısı (Sıklık) Doğruluk Yüzdesi Mutsuz Mutlu Mutsuz Mutluluk Algısı Başlangıç Mutlu Toplam (%) 85,1 Mutsuz ,9 Mutluluk Algısı Analiz Sonucu Mutlu ,0 Toplam (%) 86,1 Başlangıçta doğruluk yüzdesi %85,1 iken analiz sonucunda bu oranın %1 lik artışla %86,1 e yükseldiği görülmektedir. Analizin uygulandığı 710 kişiden 592 kişinin doğru olarak mutlu, 19 kişinin ise yine doğru olarak mutsuz şeklinde nitelendirildiği söylenebilir. Yanlış sınıflandırma oranı ise % 13,9 dur. 29 da verilmiştir: Karma model için elde edilen EÇO katsayı kestirimlerine ilişkin sonuçlar Tablo 104

120 Tablo 29. Nesnel ve Öznel Göstergelere Göre Kestirim Sonuçları DeğiĢken SH W sd P GA %95 Alt sınır Üst sınır Sağlık Durumu 47, ,000 Sağ. Dur.(Çok iyi) 4,568 1,416 10, ,001 96,303 5, ,7780 Sağ. Dur. (İyi) 4,355 1,381 9, ,002 77,899 5, ,504 Sağ. Dur. (Orta) 3,190 1,386 5, ,021 24,284 1, ,5055 Sağ. Dur. (Kötü) 2,334 1,416 2, ,099 10,316 0, ,5974 Maddi Tatmin 30, ,000 Mad. Tat.(Hiç tatminkar değil) -1,027 0,711 2, ,148 0,358 0,0889 1,4416 Mad. Tat.(2) -1,497 0,784 3, ,056 0,224 0,0481 1,0401 Mad. Tat.(3) -1,060 0,714 2, ,138 0,347 0,0854 1,4055 Mad. Tat.(4) -0,045 0,745 0, ,952 0,956 0,2220 4,1143 Mad. Tat.(5) -0,305 0,629 0, ,628 0,737 0,2146 2,5311 Mad. Tat.(6) -0,094 0,628 0, ,880 0,910 0,2657 3,1153 Mad. Tat.(7) 0,882 0,662 1, ,183 2,416 0,6603 8,8401 Mad. Tat.(8) -0,098 0,668 0, ,884 0,907 0,2451 3,3556 Mad. Tat.(9) 2,487 1,367 3, ,069 12,030 0, ,4463 Demokrasinin Önemi 5, ,804 Demok. Ön.(Hiç öneli yok) -2,494 2,603 0, ,338 0,083 0, ,5874 Demok. Ön. (2) -1,489 1,329 1, ,263 0,226 0,0166 3,0523 Demok. Ön. (3) -24, ,970 0, ,000 0, Demok. Ön. (4) 18, ,969 0, , , Demok. Ön. (5) -0,880 0,935 0, ,347 0,415 0,0663 2,5923 Demok. Ön. (6) 19, ,049 0, , , Demok. Ön. (7) -0,186 0,490 0, ,705 0,831 0,3178 2,1700 Demok. Ön. (8) 0,416 0,388 1, ,284 1,516 0,7081 3,2466 Demok. Ön. (9) -0,246 0,309 0, ,426 0,782 0,4269 1,4325 Sabit -1,993 1,494 1, ,182 0,136 Tablo 29 daki sonuçlara göre karma modelde mutluluk algısını etkileyen değişkenlerin sağlık durumu, maddi tatmin düzeyi ve demokrasiye verilen önem olduğu belirlenmiştir. Kapsadığı değişkenler açısından öznel ve karma modelin aynı olduğu düşünülebilir. Ancak kestirim değerleri bakımından modeller arasında farklılık söz konusudur. Sağlık durumu hem öznel hem de karma modele alınan öznel nitelikli bir değişkendir. Öznel modelde tüm kategorileri için, karma modelde ise kötü kategorisi 105

121 dışındaki kategoriler için sağlık durumu değişkeninin %5 anlamlılık düzeyinde istatistiksel olarak anlamlı çıktığı söylenebilir. Karma modelde sağlık durumuna çok iyi yanıtı veren kişiler için parametre kestirim değeri 4,568 olup, bu değişken kategorisindeki artış kişilerin mutlu olarak nitelendirilmesi yönündeki fark oranının logaritmasını 4,568 birim artırmaktadır. Benzer şekilde iyi kategorisindeki artış 4,355, orta kategorisindeki artış da kişilerin mutlu olarak nitelendirilmesi yönündeki fark oranının logaritmasını 3,190 birim artırmaktadır. Genel sağlık durumuna ilişkin referans kategori Çok kötü olarak atanmıştır. Buradan hareketle sağlık durumuna çok iyi yanıtı veren kişilerin mutlu olarak nitelendirilme olasılığı sağlık durumuna çok kötü yanıtı veren kişilere göre yaklaşık 10,4 kat daha fazladır. Benzer şekilde sağlık durumuna çok kötü yanıtı veren kişilere göre iyi yanıtı veren kişilerin 9,9 kat, orta yanıtı veren kişilerin ise yaklaşık 5,3 kat daha mutlu olarak nitelendirilebileceği söylenebilir Kestirilen Modellerin Değerlendirilmesi Kestirilen modellere ilişkin elde edilen özet göstergeler Tablo 30 da görülmektedir. Tablo 30. Öznel, Nesnel ve Karma Modelin Özet Göstergeleri Gösterge Nesnel Model Öznel Model Karma Model -2 Log Olabilirlik 569, , ,539 Cox & Snell R 2 0,066 0,119 0,159 Nagelkerke R 2 0,115 0,214 0,279 Hosmer&Lemeshow (P) 0,862 0,701 0,045 Uygulanan olabilirlik oran testinde her üç modelin de genel olarak anlamlı olduğu belirlenmiştir. Hosmer-Lemeshow test sonucu değerlendirildiğinde ise nesnel ve öznel modelin verilerle iyi uyum gösterdiği, karma modelde ise uyum eksikliği bulunduğu saptanmıştır. Cox & Snell R 2 ve Nagelkerke R 2 değerlerinin en düşük bulunduğu model nesnel model iken, en yüksek değerli modelin karma model olduğu söylenebilir. 106

122 Mevcut göstergeler değerlendirildiğinde, karma modelin R 2 değeri en yüksek olsa da verilerle uyum eksikliği bulunması, hem nesnel hem öznel değişkenler işleme konulduğu halde yalnız öznel değişkenleri kapsaması, üstelik içerdiği değişkenlerin öznel modelin değişkenleri ile birebir aynı olması dolayısıyla tercih edilir bir model olduğu söylenemez. Hem nesnel hem de öznel modelin genel olarak anlamlı bulunduğu ve verilerle uyumlu olduğu belirlenmiştir. Cox & Snell R 2 ve Nagelkerke R 2 değerleri göz önüne alındığında ise öznel model için her iki R 2 değerinin de nesnel modelin değerlerine oranla yüksek olduğu görülmektedir. Diğer yönden, mevcut çalışmalarda mutluluk algısı yaş, gelir, eğitim durumu gibi değişkenlerle ilişkilendirilirken kestirilen nesnel modelde yalnızca çalışma durumu ve yaşanılan bölge ile ilişkilendirilmiş olması modellemede eksiklik olduğu yönünde bir soru işareti yaratmaktadır Lojistik Olasılık Kestirimlerine Göre ROC Eğrilerinin Kestirimi Tablo 30 da verilen özet göstergelere göre belirlenen etkin modelin, ROC Eğrisi Analizi ne göre yapılacak model karşılaştırmasında seçilecek model ile tutarlı olup olmadığı; ROC eğrisi analizinin model seçme ölçütü olarak uygun bir teknik olup olmadığı artı ve eksi yönleri ile aşağıda değerlendirilmektedir. Carsten Stephan, Sebastian Wesseling, Tania Schink ve Klaus Jung, 2003 yılında yayınlanan Comparison of Eight Computer Programs for Receiver-Operating Characteristic Analysis isimli çalışmalarında, ROC Eğrisi Analizi için matematiksel doğruluk, elde edilen sonuçların yeterliliği, kullanım kolaylığı ve diğer grafiksel programlar ile karşılaştırılabilirlik bakımından sekiz bilgisayar programını değerlendirmişlerdir. MedCalc ve SPSS programlarını da kapsayan bu çalışma sonucunda ROC eğrisi kestirimi için MedCalc %84 değerlendirme oranı ile en uygun üçüncü yöntem olarak belirlenirken, SPSS için bu oran %74 olarak saptanmıştır. Birden 107

123 fazla ROC eğrisi kestirimi için eğri karşılaştırma fonksiyonunun bulunmaması SPSS için diğer bir olumsuz özelliktir. 146 Modellerin olasılık kestirimlerinden hareketle elde edilen ROC eğrileri için hem SPSS hem de MedCalc sonuçlarına yer verilmektedir. Ancak, kestirilen ROC eğrilerinin karşılaştırılması SPSS ile mümkün olmadığından, hem ROC eğrisi kestirimine hem de kestirim değerlerinin karşılaştırılmasına olanak tanıyan MedCalc program sonuçlarının değerlendirilmesi tercih edilmektedir. MedCalc e ilişkin çıktı görselleri Ek.7-Ek14 te mevcuttur Nesnel Modele Göre ROC Eğrisi Kestirimi Nesnel model için elde edilen olasılık kestirimlerine göre MedCalc ile çizilen ROC eğrisine ilişkin bulgular aşağıdaki gibidir: Tablo 31. Nesnel Model için Kritik Değere Göre Belirlenen Koşullu Olasılık Kestirimleri T j DPO GA %95 DNO GA %95 >=0, ,00 99,7-100,0 0,00 0,0-1,9 >0, ,57 99,0-99,9 1,05 0,2-3,7 >0, ,57 99,0-99,9 2,09 0,6-5,3 >0,415 99,31 98,6-99,7 2,09 0,6-5,3 >0, ,13 98,4-99,6 2,62 0,9-6,0 >0, ,96 98,2-99,5 3,14 1,2-6,7 >0, 8257* 58,75 55,8-61,6 66,49 59,3-73,1 >0,9564 4,77 3,6-6,2 98,43 95,5-99,7 >0,9566 4,51 3,4-5,9 98,43 95,5-99,7 >0,9583 3,90 2,9-5,2 98,95 96,3-99,8 >0,9603 0,95 0,5-1,7 100,00 98,1-100,0 >0,9756 0,00 0,0-0,3 100,00 98,1-100,0 m=1154, (n-m)=191 olmak üzere, nesnel model için DPO ve YPO farkının en yüksek olduğu YI değeri 0,2524 ile t=0,8257 için sağlanmaktadır. Dolayısıyla en uygun DPO ve YPO çiftini veren yani en iyi ayırımı sağlayan eşik değerin nesnel model için 0,8257 olduğu söylenebilir. 146 Carsten Stephan, Sebastian Wesseling, Tania Schink ve Klaus Jung, Comparison of Eight Computer Programs for Receiver-Operating Characteristic Analysis, Clinical Chemistry, Vol.49, No.3, 2003, s.433 ve

124 DPO Tablo 32. Nesnel Modele İlişkin Kestirilen AUC Değeri AUC 0,664 SH 0,0193 GA %95 0,638-0,689 z- test istatistiği 8,497 AUC=0,5 için P 0,0001 AUC un [0,5-1,0] tanım aralığında değer aldığı ve 0,5 ten büyük değerler için anlamlı olabileceği düşünülürse, AUC için hipotezlerin ve şeklinde tek taraflı olarak kurulması uygun olur. şeklinde hesaplanan test istatistiği değerlendirildiğinde H 1 hipotezinin geçerli olduğu yani AUC kestiriminin %95 güvenle 0,5 değerinden büyük olduğu söylenebilir. (P>0,05) Tablo 33. SPSS ile Elde Edilen Nesnel Modele İlişkin AUC Kestirimi Asimp 95% GA AUC SH Asimp. P Üst Sınır Alt sınır 0,664 0,020 0,000 0,624 0,704 MedCalc ve SPSS sonuçları değerlendirildiğinde AUC kestirimlerinin eşdeğerli olduğu, ancak GA için farklılık bulunduğu görülmektedir YPO ġekil 7. Nesnel Modele İlişkin Kestirilen ROC Eğrisi 109

125 (2.40) ifadesinden hareketle nesnel modele ilişkin olasılık kestirimleri için hesaplanan Mann-Whitney U istatistiği üzerinden AUC değeri şu şekilde elde edilir (m=1154, (n-m)=191 ve Mann-Whitney U=74127,5) Hem SPSS hem de MedCalc te AUC kestirimi parametrik olmayan yaklaşıma göre yapıldığından, elde edilen değer ile Mann-Whitney U üzerinden hesaplanan AUC değerleri eşdeğer olmaktadır Öznel Modele Göre ROC Eğrisi Kestirimi Öznel model için elde edilen olasılık kestirimlerine göre MedCalc ile çizilen ROC eğrisine ilişkin bulgular aşağıdaki gibidir: Tablo 34. Öznel Model için Kritik Değere Göre Belirlenen Koşullu Olasılık Kestirimleri T j DPO GA %95 DNO GA %95 >=0 100,00 99,7-100,0 0,00 0,0-2,0 >0 100,00 99,7-100,0 0,53 0,09-2,9 >0, ,00 99,7-100,0 1,60 0,3-4,6 >0,122 99,91 99,5-100,0 1,60 0,3-4,6 >0, ,91 99,5-100,0 2,13 0,6-5,4 >0, ,82 99,4-100,0 2,66 0,9-6,1 >0,8791* 68,15 65,3-70,9 75,00 68,2-81,0 0,9891 0,54 0,2-1,2 100,00 98,0-100,0 >0,9902 0,45 0,1-1,0 100,00 98,0-100,0 >0,9923 0,36 0,1-0,9 100,00 98,0-100,0 >0,9946 0,27 0,06-0,8 100,00 98,0-100,0 >1 0,00 0,0-0,3 100,00 98,0-100,0 m=1121, (n-m)=188 olmak üzere, öznel model için DPO ve YPO farkının en yüksek olduğu YI değeri 0,4315 ile t=0,8791 için sağlanmaktadır. Dolayısıyla en uygun DPO ve YPO çiftini veren yani en iyi ayırımı sağlayan eşik değerin öznel model için 0,8791 olduğu söylenebilir. 110

126 DPO Tablo 35. Öznel Modele İlişkin Kestirilen AUC Değeri AUC 0,780 SH 0,0152 GA %95 0,756-0,802 z- test istatistiği 18,421 AUC=0,5 için P 0,0001 ve olmak üzere, şeklinde hesaplanan test istatistiği değerlendirildiğinde H 1 hipotezinin geçerli olduğu yani AUC kestiriminin %95 güvenle 0,5 değerinden büyük olduğu söylenebilir. (P>0,05) Tablo 36. SPSS ile Elde Edilen Öznel Modele İlişkin AUC Kestirimi Asimp. % 95 GA AUC SH Asimp. P Alt Sınır Alt sınır 0,780 0,017 0,000 0,745 0,814 MedCalc ve SPSS sonuçları değerlendirildiğinde AUC kestirimlerinin öznel model için de eşdeğerli olduğu, ancak GA için farklılık bulunduğu görülmektedir YPO ġekil 8. Öznel Modele İlişkin Kestirilen ROC Eğrisi Öznel modele ilişkin olasılık kestirimleri için hesaplanan Mann-Whitney U istatistiği üzerinden AUC değeri şu şekilde elde edilir: (m=1121, (n-m)=188 ve Mann- Whitney U=46453,5) 111

127 Öznel model için de hem SPSS hem de MedCalc te bulunan AUC kestirimi ile Mann-Whitney U ile elde edilen AUC değeri eşdeğer olup 0,780 dir Karma Modele Göre ROC Eğrisi Kestirimi Karma model için elde edilen olasılık kestirimlerine göre MedCalc ile çizilen ROC eğrisine ilişkin bulgular aşağıdaki gibidir: Tablo 37. Karma Model için Kritik Değere Göre Belirlenen Koşullu Olasılık Kestirimleri T j DPO GA %95 DNO GA %95 >=0 100,00 99,7-100,0 0,00 0,0-2,0 >0 100,00 99,7-100,0 0,53 0,09-2,9 >0, ,91 99,5-100,0 0,53 0,09-2,9 >0, ,91 99,5-100,0 1,60 0,3-4,6 >0, ,82 99,4-100,0 1,60 0,3-4,6 >0, ,82 99,4-100,0 2,13 0,6-5,4 >0,8734* 71,54 68,8-74,2 70,21 63,1-76,6 >0,9924 5,71 4,4-7,2 98,94 96,2-99,8 >0,9937 4,46 3,3-5,8 98,94 96,2-99,8 >0,9949 4,01 2,9-5,3 98,94 96,2-99,8 >0,9958 3,93 2,9-5,2 98,94 96,2-99,8 >1 0,00 0,0-0,3 100,00 98,0-100,0 m=1121, (n-m)=188 olmak üzere, karma model için DPO ve YPO farkının en yüksek olduğu YI değeri 0,4175 ile t=0,8734 için sağlanmaktadır. Dolayısıyla en uygun DPO ve YPO çiftini veren yani en iyi ayırımı sağlayan eşik değerin karma model için 0,8734 olduğu söylenebilir. Tablo 38. Karma Modele İlişkin Kestirilen AUC Değeri AUC 0,763 SH 0,016 GA %95 0,739-0,785 z- test istatistiği 16,438 AUC=0,5 için P 0,0001 ve olmak üzere, şeklinde hesaplanan test istatistiği değerlendirildiğinde H 1 hipotezinin geçerli olduğu 112

128 DPO yani AUC kestiriminin %95 güvenle 0,5 değerinden büyük olduğu söylenebilir. (P>0,05) Tablo 39. SPSS ile Elde Edilen Karma Modele İlişkin AUC Kestirimi Asimp 95% GA AUC SH Asimp. P Üst Sınır Alt sınır 0,763 0,019 0,000 0,726 0,800 MedCalc ve SPSS sonuçları değerlendirildiğinde AUC kestirimlerinin öznel model için de eşdeğerli olduğu, GA için farklılık bulunduğu görülmektedir YPO ġekil 9. Karma Modele İlişkin Kestirilen ROC Eğrisi Karma modele ilişkin olasılık kestirimleri için hesaplanan Mann-Whitney U istatistiği üzerinden AUC değeri şu şekilde elde edilir: (m=1121, (n-m)=188 ve Mann- Whitney U=49987,5) ROC eğrisi analizi ile ve Mann-Whitney U üzerinden elde edilen AUC değerleri eşdeğer olup 0,763 tür. 113

129 Son olarak karma model için de hem SPSS hem de MedCalc te bulunan AUC kestirimi ile Mann-Whitney U ile elde edilen AUC değerinin eşdeğerli olduğu (0,763) söylenebilir ROC Eğrisi Kestirimine Göre Model Seçimi SPSS te t=0.5 sınıflandırma eşik değeri için ikili lojistik regresyon analizi ile hesaplanan Öznel, Nesnel ve Karma modellere ilişkin kestirilen olasılıklar kullanılarak, MedCalc üzerinden elde edilen ROC eğrisi kestirimleri Tablo 40 ta verilmiştir. Tablo 40 Modellere İlişkin Karşılaştırmalı AUC Kestirimleri DeğiĢken AUC SH Güven Aralığı 95% Karma Model Olasılık Kestirimleri 0,763 0,016 0,739-0,785 Öznel Model Olasılık Kestirimleri 0,780 0,0152 0,756-0,802 Nesnel Model Olasılık Kestirimleri 0,666 0,0194 0,640-0,692 Modeller için hesaplanan tekil AUC kestirimleri ile üçlü karşılaştırmada elde edilen değerler Karma ve Öznel modeller için eşdeğerli bulunurken, Nesnel model için karşılaştırmada 0,002 birim yüksek bir kestirim söz konusudur. Bu farklılık, karşılaştırmada kullanılan pozitif ve negatif olgu sayısından (m=1121 ve (n-m)=188) ileri gelmektedir. Karma ve Öznel modeller için hem tekil kestirim hem de karşılaştırma (m=1121 ve (n-m)=188) için yapılırken, Nesnel modelin tekil AUC kestirimi m=1154 ve (n-m)=191 için yapılmıştır. Şekil 10 da nesnel, öznel ve karma modeller için kestirilen ROC eğrileri mevcuttur. Eğrilerin koordinat düzlemi üzerindeki konumlarına göre modeller arasında görsel karşılaştırma yapmak mümkündür. 114

130 DPO Öznel Model Nesnel Model Karma Model YPO ġekil 10. Öznel, Nesnel ve Karma Modellere Ait ROC Eğrilerinin Karşılaştırılması Tablo.40 dikkate alındığında, AUC değeri en yüksek ve standart hatası en düşük olan modelin öznel model olduğu görülmektedir. Şekil.10 a göre yapılan değerlendirmede ise mevcut olan üç eğri içinde sol üst köşeye en yakın olan, dolayısıyla da en iyi ayırım etkinliğini veren eğrinin öznel modele ait olan eğri olduğu görülmektedir. Model seçiminden önce yapılan önsel değerlendirme de dikkate alınarak, modellerin kestirilen AUC değerleri arasındaki farkın istatistiksel olarak anlamlı olup olmadığının sınanması gerekmektedir. Bu sınama, modellere ilişkin AUC değerlerinin ikili olarak karşılaştırmasıyla mümkündür: Tablo 41 Öznel ve Nesnel Modele İlişkin Kestirilen AUC Değerlerinin Karşılaştırılması 0,113 SH 0,0225 GA 95% 0,069-0,157 z- Test Ġstatistiği 5,028 P < 0,001 ve olmak üzere, (2.48) ifadesinde verilen aracılığıyla kestirilen test istatistiği için olduğundan H 1 hipotezinin kabul edileceği yani, öznel modele ilişkin 115

131 AUC kestirimi ile nesnel modele ilişkin AUC kestirimi arasında istatistiksel olarak anlamlı bir fark olduğu söylenebilir. ( Öznel; Nesnel modele ait AUC) Tablo 42 Öznel ve Karma Modele İlişkin Kestirilen AUC Değerlerinin Karşılaştırılması z test istatistiği için 0,0169 SH 0,00635 GA 95% 0, ,0294 z- Test Ġstatistiği 2,665 P 0,008 ve iken, olduğundan H 1 hipotezinin kabul edileceği; yani, Öznel; Karma modele ait AUC olmak üzere ile arasında istatistiksel olarak anlamlı bir fark olduğu söylenebilir. Tablo 43 Nesnel ve Karma Modele İlişkin Kestirilen AUC Değerlerinin Karşılaştırılması 0,0962 SH 0,0228 GA 95% 0,0514-0,141 z- Test Ġstatistiği 4,209 P < 0,001 ve olmak üzere, z test istatistiği için olduğundan, Nesnel; Karma modele ait AUC olmak üzere ve arasında istatistiksel olarak anlamlı bir fark olduğu, dolayısı ile H 1 hipotezinin kabul edileceği söylenebilir. Hem Öznel ve Nesnel Modele hem de Nesnel ve Karma Modele ait kestirilen AUC değerleri arasındaki alan farkına ilişkin hesaplanan test istatistiğinin olasılık değeri P<0,001 dir. Öznel ve Karma Modele ait kestirilen AUC değerleri arasındaki alan farkına ilişkin hesaplanan test istatistiğinin olasılık değeri ise P=0,008 dir. Her iki olasılık değeri de %5 olan anlamlılık düzeyinden küçük olduğundan modellere ait kestirilen AUC değerleri arasındaki alan farkı istatistiksel olarak anlamlı olsa da, Öznel ve Karma Modele ait AUC değerleri arasındaki farkın diğer iki modele ait AUC değerleri arasındaki farka göre istatistiksel olarak daha az anlamlı olduğu görülmektedir. 116

132 Sonuç olarak, ROC eğrisinin koordinat eksenindeki konumu, AUC değeri ve standart hatası dikkate alındığında Öznel, Nesnel ve Karma Modeller içinde en etkin modelin Öznel Model olduğu söylenebilir. 117

133 SONUÇ Lojistik regresyon analizi ile kestirilen modellerin etkinliklerin değerlendirilmesinde ve en iyi modelin belirlenmesinde sıklıkla kullanılan ölçütlere (Cox&Snell R 2, Nagelkerke R 2, Olabilirlik Oran Testi ve Hosmer-Lemeshow Uyum İyiliği Testi) seçenek olarak, ROC eğrisi kestirimine göre de model seçimi yapılabileceği önermesi gerek kuramsal açıdan gerekse uygulama üzerinde irdelenmiştir. İkili lojistik regresyon kestirimi ile elde edilen nesnel, öznel ve karma modellerin etkinlikleri hem lojistik regresyon seçim ölçütlerine göre, hem de modellere ilişkin olasılık kestirimlerinden hareketle elde edilen ROC eğrisi kestirimlerine göre incelenmiştir. Olabilirlik testinde tüm modellerin genel olarak anlamlı olduğu saptanmış; Hosmer-Lemeshow Uyum İyiliği Testine göre öznel ve nesnel modellerin verilerle uyumlu olduğu, karma modelin ise verilere iyi uyum göstermediği belirlenmiştir. Nagelkerke R 2 değeri en yüksek bulunan model 0,279 ile karma model iken, öznel model 0,214 değeri ile ikinci sırada yer almaktadır. Verilere iyi uyum göstermeyen bir modelin, veri uyumu iyi olarak belirlenen diğer modellere göre bağımlı değişken olan mutluluk algısını kişilerin mutlu olarak nitelendirilmesi yönünde daha yüksek olasılıkla kestirdiğini söylemek, birbiriyle çelişen iki ifadedir. Hem verilerle iyi uyum gösteren hem ikinci en yüksek R 2 değerine sahip olan hem de kapsadığı değişkenlere ve parametre anlamlılıklarına göre öznel modelin etkinliğinin diğer modellere göre daha iyi olduğu söylenebilir. ROC eğrisi kestirimine göre 0,789 ile en yüksek AUC değerine ve 0,0152 ile en düşük standart hataya öznel modelin sahiptir. Dolayısıyla ROC eğrisi kestirimine göre de en yüksek kestirim gücüne sahip olan modelin öznel model olduğunu söylemek mümkündür. AUC için tanım aralığı söz konusudur. AUC=0,780 değerinin Tablo.5 ten hareketle 0,7 AUC < 0,8 değer aralığında yer aldığı ve öznel modelin kabul edilebilir bir ayırım gücüne sahip olduğu söylenebilir. Karma modele ait değer de 118

134 0,763 ile aynı değer aralığında yer alsa da, öznel ve karma modellerin AUC değerleri arasında istatistiksel olarak anlamlı bir fark olduğu belirlendiğinden ROC eğrisi kestirimine göre tercih edilecek modelin %95 güvenle öznel model olduğunu söylemek mümkündür. Nagelkerke R 2 değerine göre yapılan değerlendirmelerde, R 2 nin tanım aralığında değer aldığı dikkate alınırsa karma model için 0,279, öznel model içinse 0,214 olarak bulunan değerlerin oldukça düşük olduğu görülmektedir. Sonuç olarak, bu uygulama için yapılan değerlendirmede en etkin modelin belirlenmesinde model seçim ölçütü olarak AUC kestirimlerini dikkate almanın daha uygun olacağı söylenebilir. 119

135 EKLER 120

136 EK 1. 0,9 AUC için Uygulama Örneği Uygulamanın amacı, glokom hastalığını etkileyen unsurlara ilişkin fikir sahibi olabilmek ve hangi etmenin hastalık üzerinde daha çok etkisi olduğunu belirleyebilmektir. Uygulama öncesinde hastalık hakkında ve tanı üzerinde etkili olabilecek unsurlar ile ilgili bir göz doktoru tarafından gerekli bilgilendirme yapılmıştır. Glokom, gözdeki sinir hücrelerinde oluşan kimi tepkimeler dolayısıyla sinirlerin hasar görmesi ya da ölmesi sonucu gelişen ilerleyici bir sinir hastalığıdır. Göz içinde üretilen göz sıvısının kan damarlarına geçemeyip gözde birikmesinden kaynaklanan basıncın yükselmesi olarak bilinen göz tansiyonu, glokom olma olasılığını artıran önemli bir faktördür. 45 yaşının üzerinde olanlar, migren, diabet gibi sistemik hastalığı bulunanlar, vücut tansiyonu çok yüksek ya da aşırı düşük olanlar ile ailesinde glokom hastalığı bulunanların glokom olma olasılığının yüksek olduğu söylenebilir. Glokom tanısı, standart göz muayenesinin yanısıra göz siniri ve görme alanı muayenesi ile ölçülen göz tansiyonu sonuçları dikkate alınarak konulur. 1 Glokom olma olasılığını yükselten risk faktörlerinden en çok etkisi olabilecek değişkenler göz tansiyonu ölçümleri, yaş, cinsiyet, genetik yatkınlık ve migren olarak belirlenmiştir. Tanı değişkeni bağımlı, yaş, cinsiyet, genetik yatkınlık ve migren değişkenleri ise bağımsız değişken olarak kullanılarak ikili lojistik regresyon analizi ile etkileşimlerin saptanması hedeflenmiştir. Ancak, migren ve genetik yatkınlık durumuna ilişkin soruların tüm hastalara değil de yalnız göz tansiyon ölçümleri yüksek çıkanlara sorulduğu fark edildiğinden sapma yaratmaması için bu iki değişkenin analizde kullanılmamasına karar verilmiştir. Uygulamanın yığınını belirli bir göz rahatsızlığı dolayısıyla hastaneye başvuran kişiler oluşmaktadır. Uygulamanın örneklemi, herhangi bir göz rahatsızlığı dolayısıyla Haziran 2009 tarihleri arasında İzmit Özel Çağın Göz Merkezi ne gelen toplam 719 kişiyi kapsamaktadır. 1 Kürşat Çağın, -Operatör Doktor- Glokom Hastalığı ve Tanıyı Etkileyen Unsurlar konulu görüşme, Kocaeli: 27 Şubat

137 EK 1. 0,9 AUC için Uygulama Örneği (Devam) Glokom Tanısına İlişkin Kullanılan Veriler Kişi No Tanı Göz Tansiyonu(mmHg) Yaş Cinsiyet Çeşitli şikayetlerle hastaneye başvuran 719 kişiden 27 sine, uygulanan tetkikler sonucunda glokom tanısı konulmuştur. (m:27,(n-m):692) Bu doğrultuda tanı bağımlı değişken, göz tansiyonu ölçümleri, yaş ve cinsiyet açıklayıcı değişkenler; α=0.05 ve sınıflara yapılacak atama için sınıflandırma eşik değeri t=0.5 olmak üzere ileriye doğru aşamalı değişken seçme tekniğinden (Forward Wald) yararlanılarak ikili lojistik regresyon analizi uygulanmıştır. Göz tansiyonu ölçümleri ve yaş değişkeni ile kurulan modele ilişkin sonuçlar aşağıdaki gibidir: İterasyon Geçmişi Yineleme -2 Log olabilirlik Sabit terimin katsayısı (β 0 ) Adım ,928-1, ,805-2, ,576-3, ,203-3, ,202-3, ,202-3,244 Değişkenler için kodlamalar şu şekildedir: Tanı, 0: Glokom değil, 1:Glokom; Cinsiyet, 0:Erkek, 1:Kadın. 122

138 EK 1. 0,9 AUC için Uygulama Örneği (Devam) İlk aşamada modele sabit terimin eklendiği ve bu aşamanın altıncı yinelemesinde -2logL istatistiği 0,001 değerinin altında bir azalış gösterdiğinden yinelemelere son verildiği; altıncı yineleme sonunda sabit terimin katsayısının -3,244 ve -2LogL istatistiğinin de 230,202 olarak elde edildiği söylenebilir. Omnibus Testi Model Katsayıları Ki-kare sd P. Step 20,732 1,000 Blok 181,665 2,000 Model 181,665 2,000 Model Özeti ve Hosmer ve Lemeshow Uyum İyiliği Testi -2 Log olabilirlik Cox & Snell R 2 Nagelkerke R 2 sd P 48,537 0,223 0,815 0, ,000 Yalnız sabiti içeren modelin -2logL olabilirlik değeri 230,202; sabit ve bağımsız değişkenleri içeren modelin -2logL olabilirlik değeri ise 48,537 dir. Model Ki- Kare değeri olan 181,665 bu iki -2LogL olabilirlik değeri arasındaki farktır. Söz konusu test sonucu anlamlılık düzeyi (P) 0,000 dir. Modelin istatistiksel anlamlılığının sınanmasında kullanılan olabilirlik oran testine ilişkin yokluk ve alternatif hipotez(i) şu şekilde kurulur: (Model genel olarak anlamlı değildir) (Model genel olarak anlamlıdır) P=0,000 < α=0,05 olduğundan yokluk hipotezi reddedilir. Yani kestirilen lojit modelin genel olarak anlamlı olduğu söylenebilir. Modelin Cox ve Snell R 2 ve Nagelkerke R 2 değerleri sırasıyla 0,223 ve 0,815 olarak bulunmuştur. Cox ve Snell R 2 değerine göre bağımsız değişkenlerdeki bir birimlik değişme tanı değişkeninin koşullu olasılığında %22,3 düzeyinde, Nagelkerke R 2 değerine göre ise bağımsız değişkenlerdeki bir birimlik değişme tanı değişkeninin koşullu olasılığında %81,5 oranında bir değişim yaratmaktadır. 123

139 EK 1. 0,9 AUC için Uygulama Örneği (Devam) Modelin verilerle olan uyum iyiliğinin testinde yararlanılan Hosmer Lemeshow test istatistiğine ilişkin değerlendirmede yararlanılan hipotezler ise şu şekildedir: H 0 : Model verileri itibariyle uygundur. H 1 : Model verileri itibariyle uygun değildir. test istatistiği için P=1,000>α=0,05 geçerli olduğundan modelin verilerle uyumlu olduğunu ifade eden modelin verilerle tam bir uyum sağlandığı söylenebilir. hipotezi reddedilemez. Olasılık değeri itibariyle Kestirilen Model için Doğru Atama Tablosu Kestirim değerleri Gözlenen değerler Glokom Tanısı (Sıklık) Doğruluk Yüzdesi Glokom degil Glokom Glokom degil Glokom Tanısı Başlangıç Glokom Toplam (%) 96,2 Glokom degil ,9 Glokom Tanısı Analiz sonucu Glokom ,9 Toplam (%) 99,4 Rassal olarak seçilen bir haftalık dönemde hastaneye başvuran 719 kişiden glokom tanısı konulanların sayısı 27 dir. 715 kişi için yani %99,4 oranında doğru tanı, 4 kişi için %0,6 oranında hatalı tanı konulduğu görülmektedir. Lojistik Modele İlişkin Kestirim Sonuçları GA %95 Değişken SH W sd P Alt sınır Üst sınır Tansiyon 0,280 0,069 16, ,000 1,323 1,156 1,514 Yaş 0,256 0,088 8, ,004 1,291 1,086 1,535 Sabit -23,413 5,272 19, ,000 0,000 Kestirim sonuçlarından hareketle, modele giren tüm değişkenlerin 0,05 anlamlılık düzeyinde istatistiksel olarak anlamlı olduğu görülmektedir. Göz tansiyon ölçümlerinin parametre kestirimi (0,28) pozitif değerli olduğundan, bu değişkendeki artış pozitif tanı konulma yönündeki fark oranının logaritmasını 0,28 birim artırmaktadır. 124

140 EK 1. 0,9 AUC için Uygulama Örneği (Devam) Yaş değişkenine ilişkin parametre kestirimi (0,256) de pozitif değerli olduğundan bu değişkendeki bir birimlik artış pozitif tanı konulma yönündeki fark oranının logaritmasını 0,256 birim artırmaktadır. Sabit terimdeki bir birimlik artışın ise pozitif tanı konulma yönündeki fark oranının logaritmasını küçülttüğü söylenebilir. değeri, modeldeki diğer değişkenler sabit tutulduğunda ilgili değişkendeki bir birimlik artışın bağımlı değişkenin pozitiflik oranında ne düzeyde bir değişim yaratacağını belirtir. Buna göre, Tansiyon değişkenindeki bir birimlik artış ile modelde 1,323 birim, Yaş değişkenindeki bir birimlik artış içinse modelde 1,291 birim artış sağlandığı söylenebilir. Uygulanan analiz sonucunda elde edilen olasılık kestirimlerine göre çizilen ROC eğrisine ilişkin bulgular aşağıdaki gibidir: Kritik Değere Göre Belirlenen ROC Eğrisi Koordinatları T j DPO GA %95 DNO GA %95 >=0 100,00 87,1-100,0 0,00 0,0-0,5 >0 100,00 87,1-100,0 17,20 14,5-20,2 >0 100,00 87,1-100,0 26,16 22,9-29,6 >0 100,00 87,1-100,0 31,79 28,3-35,4 >0 100,00 87,1-100,0 36,13 32,5-39,8 >0 100,00 87,1-100,0 38,44 34,8-42,2 >0 100,00 87,1-100,0 41,04 37,3-44,8 >0, ,00 87,1-100,0 43,50 39,8-47,3 >0,2326* 96,30 81,0-99,4 99,86 99,2-100,0 >0, ,81 4,3-33,7 99,86 99,2-100,0 >0, ,11 2,5-29,2 99,86 99,2-100,0 >0,9918 7,41 1,1-24,3 99,86 99,2-100,0 >0,9932 3,70 0,6-19,0 99,86 99,2-100,0 >0,9981 0,00 0,0-12,9 99,86 99,2-100,0 >1 0,00 0,0-12,9 100,00 99,5-100,0 DPO ve YPO farkının en yüksek olduğu değer 0,9616 ile t=0,2326 için sağlanmaktadır. Dolayısıyla en uygun DPO ve YPO çiftini veren yani en iyi ayırımı sağlayan eşik değerin 0,2326 olduğu söylenebilir. 125

141 YPO EK 1. 0,9 AUC için Uygulama Örneği (Devam) 100 Kestirilen ROC Eğrisi DPO AUC Değerine İlişkin Kestirim Sonuçları AUC 0,995 SH 0,00921 GA %95 0,987-0,999 z- test istatistiği 53,796 AUC=0,5 için P 0,0001 AUC un [0,5-1,0] tanım aralığında değer aldığı ve 0,5 ten büyük değerler için anlamlı olabileceği düşünülürse, AUC için hipotezlerin ve şeklinde tek taraflı olarak kurulması uygun olur. olarak hesaplanan test istatistiği için P< 0,05 olduğundan H 1 hipotezinin geçerli olduğu söylenebilir. Tablo 5 teki değerlere göre kestirilen model AUC=0,995 için üstün bir ayırım gücüne sahiptir. Lojistik modelin değerlendirilmesinde yararlanılan Nagelkerke R 2 de 0,815 bulunduğundan, elde edilen sonuçların tutarlı olduğu söylenebilir. 0,9 AUC durumunun ender rastlanılan bir durum olduğu ve modelle ilgili bir sorunun göstergesi olabileceği belirtilse de, bu uygulamada kestirilen model hem genel olarak hem de parametre bazında istatistiksel olarak anlamlı bulunmuştur. Sonuç olarak, daha büyük örnek hacmi için ve tanı üzerinde etkili olabilecek daha çeşitli değişkenler kullanılarak gerçekleştirilecek benzer bir analizde daha farklı sonuçlara ulaşılması mümkündür. 126

142 EK 2. Dünya Değerler Araştırması Anket Soru Formu S1. Şimdi soracaklarımdan her biri sizin için ne kadar önemlidir? Yani bunlar sizin için çok mu önemli, biraz mı önemli, pek önemli değil mi yoksa hiç önemi yok mu? Çok Önemli Biraz Önemli Pek Önemli Değil Hiç Önemli Değil FY CY S1.1 Aileniz S1.2 Dost ve arkadaşlarınız S1.3 Kendiniz için ayırdığınız boş zaman S1.4 Siyaset S1.5 İş ve çalışma S1.6 Din S2. Bugünlerde genel olarak mutlu olup olmadığını söyler misiniz? Mesela şu okuyacağım şıklardan hangisi, bugünlerdeki genel mutluluk durumunuzu en iyi tarif ediyor? Çok mutluyum Biraz mutluyum Pek mutlu değilim ya da Hiç mutlu değilim. S3. Genel olarak bugünlerde sağlık durumunuz nasıl? Çok mu iyi, iyi mi, orta halli mi, kötü mü, yoksa çok mu kötü? S4. Hanenizin maddi durumunu ne kadar tatmin edici buluyorsunuz? Eğer hanenizin maddi durumunu hiç tatminkar bulmuyorsanız 1, son derece tatminkar buluyorsanız 10 olmak üzere kendi durumunuza bir puan veriniz. S5. Siyasete ne derece ilgi duyduğunuzu söyler misiniz? Siyaset yani politika ile çok yakından mı, biraz mı ilgilisiniz? Pek ilgi duymaz mısınız? Yoksa siyasete hiç mi ilgi duymazsınız? S6. Sizin, kendiniz için demokratik yönetime sahip bir ülkede yaşamak ne kadar önemlidir? Eğer hiç önemi yok diyorsanız 1, vazgeçilmez önemde olduğunu düşünüyorsanız 10 olmak üzere kendi durumunuza göre bir puan veriniz. 1 Çok mutluyum 2. Biraz mutluyum 3. Pek mutlu değilim 4. Hiç mutlu değilim 888. FY 999. CY 1. Çok iyi 2. İyi 3. Orta 4. Kötü 5. Çok kötü 888. FY 999. CY 1. Hiç tatminkar değil Son derece tatminkar 888. FY 999. CY 1. Çok yakından ilgiliyim 2. Biraz ilgiliyim 3. Pek ilgi duymam 4. Hiç ilgi duymam 888. FY 999. CY 1. Hiç önemi yok Vazgeçilmez önemde 888. FY 999. CY Bazı soru kategorilerinde yer alan FY ve CY ifadeleri sırasıyla Fikri Yok ve Cevap Yok anlamındadır. 127

143 EK 2. Dünya Değerler Araştırması Anket Soru Formu (Devam) S7. Katılımcının cinsiyetini kodlayınız. S8. Kaç yaşındasınız? S9. Eğitim durumunuz nedir? En son hangi okulu bitirdiniz ya da yarım bıraktınız? S10. Bir işte çalışıyor musunuz? Yani şu anda para kazandığınız bir iş yapıyor musunuz? S11. Şu anki işinizde veya en son işinizde çalıştığınız sektör şunlardan hangisidir? S12. Hanenizin toplam aylık gelirinin şu gelir gruplarından hangisine en yakın olduğunu söyler misiniz? S13. Medeni durumunuz sayacaklarımdan hangisidir? S14. Şu anda anne ve babanızla birlikte mi yaşıyorsunuz? 1. Evet 2. Hayır 1. Erkek 2. Kadın ve üstü 1. Hiç okula gitmedim 2. İlkokuldan ayrıldım 3. İlkokul mezunuyum 4. Ortaokuldan ayrıldım 5. Ortaokul mezunuyum 6. Liseden ayrıldım 7. Lise mezunuyum 8. Üniversiteden ayrıldım 9. Üniversite mezunuyum 10. Şu anda lise öğrencisiyim 11. Şu anda üniversite öğrencisiyim 12. Lisansüstü 999. CY 1. Tam zamanlı 2. Yarı zamanlı 3. Kendi işimin sahibiyim 4. Emekli 5. Ev hanımı 6. Öğrenci 7. İş arıyorum 8. Diğer (Yazınız ) 1. Devlet/kamu kurumları/yerel yönetimleri 2. Özel sektör 3. Vakıf, dernek veya sivil toplum kuruluşları TL TL TL TL TL TL TL TL TL TL ve üstü 888. FY 999. CY 1. Evli 2. Evli gibi birlikte yaşıyorlar 3. Boşanmış 4. Evli fakat eşinden ayrı yaşıyor 5. Dul 6. Bekâr 999. CY 128

144 EK 2. Dünya Değerler Araştırması Anket Soru Formu (Devam) S15. Hiç çocuğunuz oldu mu? Olduysa şuanda hayatta olsun ya da olmasın, toplamda kaç çocuğunuz oldu? S16. Bir dine bağlı mısınız? Evet ise hangi dine? S17. Anketin uygulandığı bölge 0. Çocuk sahibi değil 1. Bir çocuk 2. İki çocuk 3. Üç çocuk 4. Dört çocuk 5. Beş çocuk 6. Altı çocuk 7. Yedi çocuk 8. Sekiz ve üstü çocuk 0. Hiçbir dine bağlı değil 1. Müslüman 2. Musevi 3. Gregoryen (Ermeni) 4. Rum Ortadoks 5. Diğer (Yazınız..) 888. FY 999. CY 1. İstanbul 2. Batı Marmara 3. Ege 4. Doğu Marmara 5. Batı Anadolu 6. Akdeniz 7. İç Anadolu 8. Batı Karadeniz 9. Doğu Karadeniz 10. Kuzeydoğu Anadolu 11. Ortadoğu Anadolu 12. Güneydoğu Anadolu 129

145 EK 3. Dünya Değerler Araştırması Anket Sonuçlarına İlişkin Veri Görseli Anket Soruları S1.1.Ailenin yaşamınızdaki önemi S1.2.Dost ve arkadaşlarınızın yaşamınızdaki önemi S1.3 Kendiniz için ayırdığınız boş zamanın yaşamınzdaki önemi S1.4.Siyasetin yaşamınızdaki önemi S1.5 İş ve çalışmanın yaşamınızdaki önemi S1.6 Dinin yaşamınızdaki önemi S2 Mutluluk algısı S3 Genel sağlık durumunuz S4 Hanedeki maddi durumun tatmin düzeyi S5 Siyasete olan ilgi düzeyiniz S6 Demokrasinin önemi S7 Cinsiyet S8 Yaş S9 Eğitim Düzeyi S10 Çalışma Durumu S11 Çalışılan Sektör S12 Gelir Durumu S13 Medeni Durum S14 Ailenizin yanında mı yaşıyorsunuz? S15 Sahip olunan çocuk sayısı S16 Dine bağlılık S17 Yaşanılan Bölge *: Birinci katılımcının verdiği yanıtlar Y1 * Y2 Y3 Y4 Y5 Y1345

146 Ek.4. Nesnel Nitelikli Göstergeler Seti Değişkenler Cinsiyet Yaş Eğitim Düzeyi Çalışma Durumu Çalışılan Sektör Medeni Durum Kategoriler 1: Erkek 2:Kadın 1: : : 50 ve üstü 1: Hiç okula gitmedim 2: İlkokuldan ayrıldım 3: İlkokul mezunuyum 4: Ortaokuldan ayrıldım 5: Ortaokul mezunuyum 6: Liseden ayrıldım 7: Lise mezunuyum 8: Üniversiteden ayrıldım 9: Üniversite mezunuyum 11: Şu anda lise öğrencisiyim 12: Şu anda üniversite öğrencisiyim 13: Lisansüstü 1: Tam zamanlı 2: Yarı zamanlı 3: Kendi işimin sahibiyim 4: Emekli 5: Ev hanımı 6: Öğrenci 7: İş arıyorum 8: Diğer 1: Devlet/kamu kurumları/yerel yönetimleri 2: Özel sektör 3: Vakıf, dernek veya sivil toplum kuruluşları 1: Evli 2: Evli gibi birlikte yaşıyorlar 3: Boşanmış 4: Evli fakat eşinden ayrı yaşıyor 5: Dul 6: Bekâr 131

147 Ek.4. Nesnel Nitelikli Göstergeler Seti (Devam) Gelir Durumu Yaşanılan Bölge Ailenizin yanında mı yaşıyorsunuz? Sahip olunan çocuk sayısı Dine bağlılık 1: 0-500TL 2: TL 3: TL 4: TL 5: TL 6: TL 7: TL 8: TL 9: TL 10: 3001 TL ve üstü 1: İstanbul 2: Batı Marmara 3: Ege 4: Doğu Marmara 5: Batı Anadolu 6: Akdeniz 7: İç Anadolu 8: Batı Karadeniz 9: Doğu Karadeniz 10: Kuzeydoğu Anadolu 11: Ortadoğu Anadolu 12: Güneydoğu Anadolu 1: Hayır 2: Evet 0: Çocuk sahibi değil 1: Bir çocuk 2: İki çocuk 3: Üç çocuk 4: Dört çocuk 5: Beş çocuk 6: Altı çocuk 7: Yedi çocuk 8: Sekiz ve üstü çocuk 1: Müslüman 5: Diğer 132

148 Ek.5. Öznel Nitelikli Göstergeler Seti Değişkenler Ailenin yaşamınızdaki önemi Dost ve arkadaşlarınızın yaşamınızdaki önemi Kendiniz için ayırdığınız boş zamanın yaşamınızdaki önemi Siyasetin yaşamınızdaki önemi İş ve çalışmanın yaşamınızdaki önemi Dinin yaşamınızdaki önemi Genel sağlık durumunuz Siyasete olan ilgi düzeyiniz Kategoriler 1: Çok önemli 2: Oldukça önemli 3: Çok önemli değil 4: Hiç önemli değil 1: Çok önemli 2: Oldukça önemli 3: Çok önemli değil 4: Hiç önemli değil 1: Çok önemli 2: Oldukça önemli 3: Çok önemli değil 4: Hiç önemli değil 1: Çok önemli 2: Oldukça önemli 3: Çok önemli değil 4: Hiç önemli değil 1: Çok önemli 2: Oldukça önemli 3: Çok önemli değil 4: Hiç önemli değil 1: Çok önemli 2: Oldukça önemli 3: Çok önemli değil 4: Hiç önemli değil 1: Çok iyi 2: İyi 3: Orta 4: Kötü 5: Çok kötü 1: Çok yakından ilgiliyim 2: Biraz ilgiliyim 3: Pek ilgi duymam 4: Hiç ilgi duymam 133

149 Ek.5. Öznel Nitelikli Göstergeler Seti (Devam) Hanedeki maddi durumun tatmin düzeyi Demokrasinin önemi 1: Hiç tatminkar değil Son derece tatminkar 1: Hiç önemi yok : Vazgeçilmez önemde 134

150 EK.6. Temsili Eşik Değerlere Göre Modeller için ROC Eğrisinin Elle Çizimi Mutluluk algısına ilişkin farklı sınıflandırma eşik değerleri kullanılarak elde edilen ikili lojistik regresyon modellerinin kestirilen olasılıkları eşdeğer olmakta; bu olasılıklar aracılığı ile çizilen ROC eğrileri ile bu eğrilerden elde edilen AUC kestirimleri de eşdeğerli bulunmaktadır. Her eşik değer için oluşturulan doğru atama tablosundaki doğruluk yüzdesinde ise küçük farklılıklar söz konusu olmaktadır. Farklı eşik değerlere göre oluşturulan doğru atama tablolarından hareketle koşullu olasılıkların hesaplanması ve ROC eğrisi çiziminin uygulama çalışması üzerinde gösterimi öznel, nesnel ve karma modellere göre şu şekilde yapılabilir: Nesnel Modelin Farklı Eşik Değerler için Kurulan Doğru Atama Tabloları Kestirim değerleri (Sıklık) Gözlenen değerler (Sıklık) Mutluluk Algısı Doğruluk Yüzdesi Mutsuz Mutlu Mutsuz Mutluluk Algısı t=0,01 Mutlu Toplam (%) 85 Mutsuz Mutluluk Algısı t=0,1 Mutlu Toplam (%) 85 Mutsuz Mutluluk Algısı t=0,2 Mutlu Toplam (%) 85 Mutsuz Mutluluk Algısı t=0,3 Mutlu Toplam (%) 85 Mutsuz ,8 Mutluluk Algısı t=0,4 Mutlu ,7 Toplam (%) 85 Mutsuz ,8 Mutluluk Algısı t=0,5 Mutlu ,4 Toplam (%) 84,7 Mutsuz ,7 Mutluluk Algısı t=0,6 Mutlu ,4 Toplam (%) 84,8 Mutsuz ,5 Mutluluk Algısı t=0,7 Mutlu Toplam (%) 83,7 135

151 (Duyarlılık) DPO EK.6. Temsili Eşik Değerlere Göre Modeller için ROC Eğrisinin Elle Çizimi (Devam) t=0,8 t=0,9 t=0,99 Mutluluk Algısı Mutsuz ,5 Mutlu ,9 Toplam (%) 73,7 Mutluluk Algısı Mutsuz ,5 Mutlu ,3 Toplam (%) 46,9 Mutluluk Algısı Mutsuz Mutlu Toplam (%) 15 Doğruluk yüzdeleri eşik değerlere göre değerlendirildiğinde, t=0.01, t=0.1, t=0.2, t=0.3 ve t=0.4 için doğruluk düzeyinin % 85 olduğu, t=0.5 ten itibaren oranın düşmeye başladığı görülmektedir. Doğru atama tabloları aracılığıyla bulunan koşullu olasılık kestirimleri ile bu değerlerle çizilen ROC eğrisi kestirimi şu şekildedir: >0,99 0,000 0,005 0,90 0,154 0,402 0,80 0,554 0,789 0,70 0,854 0,959 0,60 0,972 0,993 0,50 0,981 0,993 0,40 0,981 0,996 0,30 1,000 1,000 0,20 1,000 1,000 0,10 1,000 1,000 0,01 1,000 1,000 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 YPO (1- Özgüllük) Nesnel model için DPO ve YPO farkının en yüksek olduğu YI değeri 0,248 ile t=0,9 için sağlanmaktadır. Dolayısıyla en uygun DPO ve YPO çiftini veren yani en iyi ayırımı sağlayan eşik değerin nesnel model için 0,9 olduğu söylenebilir. Elde edilen ROC eğrisinde, eğri altındaki alanların trapez kuralına göre toplanmasıyla AUC=0,67 olarak belirlenmiştir. 136

152 EK.6. Temsili Eşik Değerlere Göre Modeller için ROC Eğrisinin Elle Çizimi (Devam) Öznel Modelin Farklı Eşik Değerler için Kurulan Doğru Atama Tabloları Kestirim değerleri (Sıklık) Gözlenen değerler(sıklık) Mutluluk Algısı Doğruluk Yüzdesi Mutsuz Mutlu Mutsuz ,5 Mutluluk Algısı t=0,01 Mutlu Toplam (%) 85,9 Mutsuz ,5 Mutluluk Algısı t=0,1 Mutlu Toplam (%) 85,9 Mutsuz ,2 Mutluluk Algısı t=0,2 Mutlu ,9 Toplam (%) 86 Mutsuz ,7 Mutluluk Algısı t=0,3 Mutlu ,8 Toplam (%) 86 Mutsuz ,3 Mutluluk Algısı t=0,4 Mutlu ,6 Toplam (%) 85,9 Mutsuz ,9 Mutluluk Algısı t=0,5 Mutlu ,3 Toplam (%) 85,9 Mutsuz ,5 Mutluluk Algısı t=0,6 Mutlu Toplam (%) 85 Mutsuz ,6 Mutluluk Algısı t=0,7 Mutlu ,2 Toplam (%) 84,6 Mutsuz ,4 Mutluluk Algısı t=0,8 Mutlu ,1 Toplam (%) 80 Mutsuz ,4 Mutluluk Algısı t=0,9 Mutlu ,6 Toplam (%) 61,7 Mutsuz Mutluluk Algısı t=0,99 Mutlu ,5 Toplam (%) 14,7 Doğruluk yüzdeleri eşik değerlere göre değerlendirildiğinde, en yüksek doğruluk düzeyinin%86 oranı ile t=0.2 ve t=0.3 için sağlandığı görülmektedir. 137

153 DPO (Duyarlılık) EK.6. Temsili Eşik Değerlere Göre Modeller için ROC Eğrisinin Elle Çizimi (Devam) Doğru atama tabloları aracılığıyla bulunan koşullu olasılık kestirimleri ile bu değerlerle çizilen ROC eğrisi kestirimi aşağıda görülmektedir. >0,99 0,000 0,005 0,90 0,196 0,586 0,80 0,446 0,841 0,70 0,674 0,931 0,60 0,755 0,949 0,50 0,891 0,983 0,40 0,967 0,996 0,30 0,973 0,998 0,20 0,978 0,999 0,10 0,995 1,000 0,01 0,995 1,000 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 Öznel model için DPO ve YPO farkının en yüksek Özgüllük) olduğu YI değeri 0,395 ile t=0,8 için sağlanmaktadır. Dolayısıyla en uygun DPO ve YPO çiftini veren yani en iyi ayırımı sağlayan eşik değerin nesnel model için 0,8 olduğu söylenebilir. Elde edilen ROC eğrisinde, eğri altındaki alanların trapez kuralına göre toplanmasıyla AUC=0,75 olarak belirlenmiştir. YPO (1- Karma Modelin Farklı Eşik Değerler için Kurulan Doğru Atama Tabloları Kestirim değerleri (Sıklık) Gözlenen değerler (Sıklık) Mutluluk Algısı Doğruluk Yüzdesi Mutsuz Mutlu t=0,01 Mutluluk Algısı Mutsuz ,9 Mutlu Toplam (%) 85,2 Mutsuz ,8 Mutluluk Algısı t=0,1 Mutlu Toplam (%) 85,6 Mutsuz ,8 Mutluluk Algısı t=0,2 Mutlu ,5 Toplam (%) 85,2 Mutsuz ,6 Mutluluk Algısı t=0,3 Mutlu ,3 Toplam (%) 85,5 138

154 DPO (Duyarlılık) EK.6. Temsili Eşik Değerlere Göre Modeller için ROC Eğrisinin Elle Çizimi (Devam) t=0,4 t=0,5 t=0,6 t=0,7 t=0,8 t=0,9 t=0,99 Mutluluk Algısı Mutsuz ,4 Mutlu ,7 Toplam (%) 85,5 Mutluluk Algısı Mutsuz ,9 Mutlu Toplam (%) 86,1 Mutluluk Algısı Mutsuz ,2 Mutlu ,2 Toplam (%) 84,5 Mutluluk Algısı Mutsuz Mutlu ,4 Toplam (%) 83,7 Mutluluk Algısı Mutsuz ,9 Mutlu ,9 Toplam (%) 80,7 Mutluluk Algısı Mutsuz ,9 Mutlu ,6 Toplam (%) 65,9 Mutluluk Algısı Mutsuz Mutlu ,3 Toplam (%) 22,8 Doğruluk yüzdeleri eşik değerlere göre değerlendirildiğinde, en yüksek doğruluk düzeyinin%86,1 oranı ile t=0.5 için sağlandığı görülmektedir. Doğru atama tabloları aracılığıyla bulunan koşullu olasılık kestirimleri ile bu değerlerle çizilen ROC eğrisi kestirimi şu şekildedir: >0,99 0,000 0,093 0,90 0,151 0,626 0,80 0,321 0,829 0,70 0,660 0,924 0,60 0,708 0,943 0,50 0,821 0,980 0,40 0,896 0,987 0,30 0,934 0,993 0,20 0,962 0,995 0,10 0,962 1,000 0,01 0,991 1,000 1,0 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0,0 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 YPO(1- Özgüllük) 139

155 EK.6. Temsili Eşik Değerlere Göre Modeller için ROC Eğrisinin Elle Çizimi (Devam) Karma model için DPO ve YPO farkının en yüksek olduğu YI değeri 0,508 ile t=0,8 için sağlanmaktadır. Dolayısıyla en uygun DPO ve YPO çiftini veren yani en iyi ayırımı sağlayan eşik değerin nesnel model için 0,8 olduğu söylenebilir. Elde edilen ROC eğrisinde, eğri altındaki alanların trapez kuralına göre toplanmasıyla AUC=0,78 olarak belirlenmiştir. Belirli eşik değerler için oluşturulan doğru atama tabloları aracılığıyla hesaplanan koşullu olasılıklar ile çizilen ROC eğrisi için trapez kuralına göre hesaplanan AUC değerlerinin sapmalı bulunduğu görülmüştür, Bu sebeple uygulamalarda genellikle ROC eğrisine ilişkin gerekli değerlerin hesaplanmasında geliştirilmiş çeşitli yazılım ve programlardan yararlanılmaktadır. ROC eğrisi analizinin uygulanabildiği Analyse-It, CMDT, SPSS, AccuROC, mroc, GraphROC ve ROCKIT programlarının karşılaştırıldığı bir değerlendirmede, ROC eğrisi analizinin en ucuz ve en kolay Analyse-It, AccuROC ve MedCalc programları ile yapılabildiği sonucuna varılmıştır. 140

156 EK.7. MedCalc te Açılan Boş Veri Sayfasının Görseli 141

157 EK.8. MedCalc te Oluşturulan Veri Sayfasının Görseli 142

158 EK.9. MedCalc te Tekil ROC Eğrisinin Kestirim Yolu Görseli 143

159 EK.10. MedCalc te Tekil ROC Eğrisi Kestirimi için Değişken Seçimi Görseli 144

160 EK.11. MedCalc te Tekil ROC Eğrisi Kestirim Sonucu Görseli 145

161 EK.12. MedCalc te ROC Eğrilerinin Karşılaştırılma Yolu Görseli 146

162 EK.13. MedCalc te Karşılaştırmalı ROC Eğrisi Kestirimi için Değişken Seçimi Görseli 147

163 EK.14. MedCalc te Karşılaştırmalı ROC Eğrisi Kestirim Sonucu Görseli 148

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1 3. TAHMİN 3.1. En Küçük Kareler (EKK) Yöntemi 1 En Küçük Kareler (EKK) yöntemi, regresyon çözümlemesinde en yaygın olarak kullanılan, daha sonra ele alınacak bazı varsayımlar altında çok aranan istatistiki

Detaylı

Ekonometri I VARSAYIMLARI

Ekonometri I VARSAYIMLARI Ekonometri I ÇOK DEĞİŞKENLİ REGRESYON MODELİNİN VARSAYIMLARI Hüseyin Taştan Temmuz 23, 2006 İçindekiler 1 Varsayım MLR.1: Parametrelerde Doğrusallık 1 2 Varsayım MLR.2: Rassal Örnekleme 1 3 Varsayım MLR.3:

Detaylı

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 ) 4. SUNUM 1 Gözlem ya da deneme sonucu elde edilmiş sonuçların, rastlantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel yöntemlere HİPOTEZ TESTLERİ denir. Sonuçların rastlantıya bağlı

Detaylı

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI ÖNSÖZ İÇİNDEKİLER III Bölüm 1 İSTATİSTİK ve SAYISAL BİLGİ 11 1.1 İstatistik ve Önemi 12 1.2 İstatistikte Temel Kavramlar 14 1.3 İstatistiğin Amacı 15 1.4 Veri Türleri 15 1.5 Veri Ölçüm Düzeyleri 16 1.6

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık Ders 8: Prof. Dr. İrfan KAYMAZ Tanım Tahmin (kestirim veya öngörü): Mevcut bilgi ve deneylere dayanarak olayın bütünü hakkında bir yargıya varmaktır. Bu anlamda, anakütleden çekilen

Detaylı

İÇİNDEKİLER 1. GİRİŞ...

İÇİNDEKİLER 1. GİRİŞ... İÇİNDEKİLER 1. GİRİŞ... 1 1.1. Regresyon Analizi... 1 1.2. Uygulama Alanları ve Veri Setleri... 2 1.3. Regresyon Analizinde Adımlar... 3 1.3.1. Problemin İfadesi... 3 1.3.2. Konu ile İlgili Potansiyel

Detaylı

İstatistiksel Kavramların Gözden Geçirilmesi

İstatistiksel Kavramların Gözden Geçirilmesi İstatistiksel Kavramların Gözden Geçirilmesi İstatistiksel Çıkarsama Ekonometri 1 Konu 3 Sürüm 2,0 (Ekim 2011) UADMK Açık Lisans Bilgisi İşbu belge, Creative Commons Attribution-Non-Commercial ShareAlike

Detaylı

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37 İÇİNDEKİLER BÖLÜM 1 Değişkenler ve Grafikler 1 İstatistik 1 Yığın ve Örnek; Tümevarımcı ve Betimleyici İstatistik 1 Değişkenler: Kesikli ve Sürekli 1 Verilerin Yuvarlanması Bilimsel Gösterim Anlamlı Rakamlar

Detaylı

İçindekiler. Ön Söz... xiii

İçindekiler. Ön Söz... xiii İçindekiler Ön Söz.................................................... xiii Bölüm 1 İstatistiğe Giriş....................................... 1 1.1 Giriş......................................................1

Detaylı

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız. Örnek Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız. i. ii. X 1 2 3 4 1 2 3 4 Y 2 3 4 5 4 3 2 1 Örnek Aşağıdaki veri

Detaylı

Appendix C: İstatistiksel Çıkarsama

Appendix C: İstatistiksel Çıkarsama Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Notları Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix C: İstatistiksel Çıkarsama

Detaylı

QUANTILE REGRESYON * Quantile Regression

QUANTILE REGRESYON * Quantile Regression QUANTILE REGRESYON * Quantile Regression Fikriye KURTOĞLU İstatistik Anabilim Dalı Olcay ARSLAN İstatistik Anabilim Dalı ÖZET Bu çalışmada, Lineer Regresyon analizinde kullanılan en küçük kareler yöntemine

Detaylı

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix C: İstatistiksel Çıkarsama Doç.

Detaylı

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER Gözden Geçirilmiş ve Genişletilmiş 8. Baskı Frekans Dağılımları Varyans Analizi Merkezsel

Detaylı

Nitel Tepki Bağlanım Modelleri

Nitel Tepki Bağlanım Modelleri Doğrusal-Dışı Yaklaşım ve Nitel Tepki Bağlanım Modelleri Doğrusal-Dışı Yaklaşım ve Ekonometri 2 Konu 18 Sürüm 2,0 (Ekim 2011) Doğrusal-Dışı Yaklaşım ve UADMK Açık Lisans Bilgisi İşbu belge, Creative Commons

Detaylı

OLASILIK ve KURAMSAL DAĞILIMLAR

OLASILIK ve KURAMSAL DAĞILIMLAR OLASILIK ve KURAMSAL DAĞILIMLAR Kuramsal Dağılımlar İstatistiksel çözümlemelerde; değişkenlerimizin dağılma özellikleri, çözümleme yönteminin seçimi ve sonuçlarının yorumlanmasında önemlidir. Dağılma özelliklerine

Detaylı

Matris Cebiriyle Çoklu Regresyon Modeli

Matris Cebiriyle Çoklu Regresyon Modeli Matris Cebiriyle Çoklu Regresyon Modeli Hüseyin Taştan Mart 00 Klasik Regresyon Modeli k açıklayıcı değişkenden oluşan regresyon modelini her gözlem i için aşağıdaki gibi yazabiliriz: y i β + β x i + β

Detaylı

SIRADAN EN KÜÇÜK KARELER (OLS)

SIRADAN EN KÜÇÜK KARELER (OLS) SIRADAN EN KÜÇÜK KARELER (OLS) YÖNTEMİNİN ASİMPTOTİK ÖZELLİKLERİ Hüseyin Taştan 1 1 Yıldız Teknik Üniversitesi İktisat Bölümü Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge

Detaylı

Korelasyon, Korelasyon Türleri ve Regresyon

Korelasyon, Korelasyon Türleri ve Regresyon Korelasyon, Korelasyon Türleri ve Regresyon İçerik Korelasyon Korelasyon Türleri Korelasyon Katsayısı Regresyon KORELASYON Korelasyon iki ya da daha fazla değişken arasındaki doğrusal ilişkiyi gösterir.

Detaylı

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım 2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI 2.1. Tanım Regresyon analizi, bir değişkenin başka bir veya daha fazla değişkene olan bağımlılığını inceler. Amaç, bağımlı değişkenin kitle ortalamasını, açıklayıcı

Detaylı

Mühendislikte İstatistiksel Yöntemler

Mühendislikte İstatistiksel Yöntemler Mühendislikte İstatistiksel Yöntemler BÖLÜM 7 TAHMİNLER Yrd. Doç. Dr. Fatih TOSUNOĞLU 1 Tahmin (kestirim veya öngörü): Mevcut bilgi ve deneylere dayanarak olayın bütünü hakkında bir yargıya varmaktır.

Detaylı

2. BASİT DOĞRUSAL REGRESYON 12

2. BASİT DOĞRUSAL REGRESYON 12 1. GİRİŞ 1 1.1 Regresyon ve Model Kurma / 1 1.2 Veri Toplama / 5 1.3 Regresyonun Kullanım Alanları / 9 1.4 Bilgisayarın Rolü / 10 2. BASİT DOĞRUSAL REGRESYON 12 2.1 Basit Doğrusal Regresyon Modeli / 12

Detaylı

İÇİNDEKİLER ÖN SÖZ...

İÇİNDEKİLER ÖN SÖZ... İÇİNDEKİLER ÖN SÖZ... v GİRİŞ... 1 1. İSTATİSTİK İN TARİHÇESİ... 1 2. İSTATİSTİK NEDİR?... 3 3. SAYISAL BİLGİDEN ANLAM ÇIKARILMASI... 4 4. BELİRSİZLİĞİN ELE ALINMASI... 4 5. ÖRNEKLEME... 5 6. İLİŞKİLERİN

Detaylı

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir. Koşullu Öngörümleme Ex - ante (tasarlanan - umulan) öngörümleme söz konusu iken açıklayıcı değişkenlerin hatasız bir şekilde bilindiği varsayımı gerçekçi olmayan bir varsayımdır. Çünkü bazı açıklayıcı

Detaylı

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN KORELASYON VE REGRESYON ANALİZİ Doç. Dr. Bahar TAŞDELEN Günlük hayattan birkaç örnek Gelişim dönemindeki bir çocuğun boyu ile kilosu arasındaki ilişki Bir ailenin tükettiği günlük ekmek sayısı ile ailenin

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık KORELASYON ve REGRESYON ANALİZİ Doç. Dr. İrfan KAYMAZ Tanım Bir değişkenin değerinin diğer değişkendeki veya değişkenlerdeki değişimlere bağlı olarak nasıl etkilendiğinin istatistiksel

Detaylı

YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI. Sibel SELİM 1 Efe SARIBAY 2

YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI. Sibel SELİM 1 Efe SARIBAY 2 Dokuz Eylül Üniversitesi Sosyal Bilimler Enstitüsü Dergisi Cilt 5, Sayı:2, 2003 YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI Sibel SELİM 1 Efe SARIBAY

Detaylı

BÖLÜM 13 HİPOTEZ TESTİ

BÖLÜM 13 HİPOTEZ TESTİ 1 BÖLÜM 13 HİPOTEZ TESTİ Bilimsel yöntem aşamalarıyla tanımlanmış sistematik bir bilgi üretme biçimidir. Bilimsel yöntemin aşamaları aşağıdaki gibi sıralanabilmektedir (Karasar, 2012): 1. Bir problemin

Detaylı

Ch. 5: SEKK (OLS) nin Asimptotik Özellikleri

Ch. 5: SEKK (OLS) nin Asimptotik Özellikleri Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Notları Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. ed., 2002, Thomson Learning. Ch. 5: SEKK (OLS) nin Asimptotik

Detaylı

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. ed., 2002, Thomson Learning. Ch. 5: SEKK (OLS) nin Asimptotik Özellikleri

Detaylı

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. ed., 2002, Thomson Learning. Ch. 5: SEKK (OLS) nin Asimptotik Özellikleri

Detaylı

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı ARAŞTIRMA MODELLİLERİNDE KULLANILACAK İSTATİSTİKLERİ BELİRLEME ÖLÇÜTLERİ Parametrik mi Parametrik Olmayan mı? Kullanılacak İstatistikleri Belirleme Ölçütleri Değişken Sayısı Tek değişkenli (X) İki değişkenli

Detaylı

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ TEMEL KAVRAMLAR PARAMETRE: Populasyonun sayısal açıklayıcı bir ölçüsüdür ve anakütledeki tüm elemanlar dikkate alınarak hesaplanabilir. Ana kütledeki

Detaylı

altında ilerde ele alınacaktır.

altında ilerde ele alınacaktır. YTÜ-İktisat İstatistik II Nokta Tahmin Yöntemleri 1 NOKTA TAHMİN YÖNTEMLERİ Şimdiye kadar verilmiş tahmin edicilerin sonlu örneklem ve asimptotik özelliklerini inceledik. Acaba bilinmeyen anakütle parametrelerini

Detaylı

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma... İçindekiler İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii BÖLÜM 1 Ölçme, İstatistik ve Araştırma...1 Ölçme Nedir?... 3 Ölçme Süreci... 3 Değişkenler

Detaylı

Appendix B: Olasılık ve Dağılım Teorisi

Appendix B: Olasılık ve Dağılım Teorisi Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Notları Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix B: Olasılık ve Dağılım

Detaylı

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1 İÇİNDEKİLER ÖNSÖZ... v 1. BÖLÜM Örneklem Genişliğinin Elde edilmesi... 1 1.1. Kitle ve Parametre... 1 1.2. Örneklem ve Tahmin Edici... 2 1.3. Basit Rastgele Örnekleme... 3 1.4. Tabakalı Rastgele Örnekleme...

Detaylı

A. Regresyon Katsayılarında Yapısal Kırılma Testleri

A. Regresyon Katsayılarında Yapısal Kırılma Testleri A. Regresyon Katsayılarında Yapısal Kırılma Testleri Durum I: Kırılma Tarihinin Bilinmesi Durumu Kırılmanın bilinen bir tarihte örneğin tarihinde olduğunu önceden bilinmesi durumunda uygulanır. Örneğin,

Detaylı

BÖLÜM 1: YAşAM ÇÖzÜMLEMEsİNE GİRİş... 1

BÖLÜM 1: YAşAM ÇÖzÜMLEMEsİNE GİRİş... 1 ÖN SÖZ...iii BÖLÜM 1: Yaşam Çözümlemesine Giriş... 1 1.1. Giriş... 1 1.2. Yaşam Süresi... 2 1.2.1. Yaşam süresi verilerinin çözümlenmesinde kullanılan fonksiyonlar... 3 1.2.1.1. Olasılık yoğunluk fonksiyonu...

Detaylı

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix B: Olasılık ve Dağılım Teorisi

Detaylı

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix B: Olasılık ve Dağılım Teorisi

Detaylı

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ 1 BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel

Detaylı

1. FARKLILIKLARIN TESPİTİNE YÖNELİK HİPOTEZ TESTLERİ

1. FARKLILIKLARIN TESPİTİNE YÖNELİK HİPOTEZ TESTLERİ 1. FARKLILIKLARIN TESPİTİNE YÖNELİK HİPOTEZ TESTLERİ Örneklem verileri kullanılan her çalışmada bir örneklem hatası çıkma riski her zaman söz konusudur. Dolayısıyla istatistikte bu örneklem hatasının meydana

Detaylı

İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications*

İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications* Ç.Ü. Fen Bilimleri Enstitüsü Yıl:010 Cilt:-1 İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications* Işıl FİDANOĞLU İstatistik Anabilim Dalı Fikri

Detaylı

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005 KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005 1 Karşılaştırma istatistiği Temel kavramlar: Örneklem ve evren:

Detaylı

OLS Yönteminin Asimptotik (Büyük Örneklem) Özellikleri SIRADAN EN KÜÇÜK KARELER (OLS) Asimptotik Özellikler: Tutarlılık. Asimptotik Özellikler

OLS Yönteminin Asimptotik (Büyük Örneklem) Özellikleri SIRADAN EN KÜÇÜK KARELER (OLS) Asimptotik Özellikler: Tutarlılık. Asimptotik Özellikler 1 SIRADAN EN KÜÇÜK KARELER (OLS) YÖNTEMİNİN ASİMPTOTİK ÖZELLİKLERİ Hüseyin Taştan 1 1 Yıldız Teknik Üniversitesi İktisat Bölümü Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge

Detaylı

0.04.03 Standart Hata İstatistikte hesaplanan her istatistik değerin mutlaka hatası da hesaplanmalıdır. Çünkü hesaplanan istatistikler, tahmini bir değer olduğu için mutlaka hataları da vardır. Standart

Detaylı

İÇİNDEKİLER BİRİNCİ KISIM: TASARIM PAZARLAMA ARAŞTIRMASINA GİRİŞ

İÇİNDEKİLER BİRİNCİ KISIM: TASARIM PAZARLAMA ARAŞTIRMASINA GİRİŞ İÇİNDEKİLER ÖNSÖZ... v TEŞEKKÜR... vi İKİNCİ BASKIYA ÖNSÖZ VE TEŞEKKÜR... vii İÇİNDEKİLER... ix ŞEKİLLER LİSTESİ... xviii TABLOLAR LİSTESİ... xx BİRİNCİ KISIM: TASARIM BİRİNCI BÖLÜM PAZARLAMA ARAŞTIRMASINA

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık -II Prof. Dr. İrfan KAYMAZ İki Ortalama Farkının Güven Aralığı Anakütle Varyansı Biliniyorsa İki ortalama arasındaki farkın dağılımına ilişkin Z değişkeni: Güven aralığı ifadesinde

Detaylı

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı REGRESYON ANALİZİ VE UYGULAMA Yrd. Doç. Dr. Hidayet Takcı htakci@cumhuriyet.edu.tr Sunum içeriği Bu sunumda; Lojistik regresyon konu anlatımı Basit doğrusal regresyon problem çözümleme Excel yardımıyla

Detaylı

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı KORELASYON VE REGRESYON ANALİZİ Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı İki ya da daha çok değişken arasında ilişki olup olmadığını, ilişki varsa yönünü ve gücünü inceleyen korelasyon

Detaylı

SÜREKLİ ŞANS DEĞİŞKENLERİ. Üstel Dağılım Normal Dağılım

SÜREKLİ ŞANS DEĞİŞKENLERİ. Üstel Dağılım Normal Dağılım SÜREKLİ ŞANS DEĞİŞKENLERİ Üstel Dağılım Normal Dağılım 1 Üstel Dağılım Meydana gelen iki olay arasındaki geçen süre veya bir başka ifadeyle ilgilenilen olayın ilk defa ortaya çıkması için geçen sürenin

Detaylı

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır. AED 310 İSTATİSTİK YANLILIK Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır. YANLILIK Yanlı bir araştırma tasarımı uygulandığında,

Detaylı

BÖLÜM 12 STUDENT T DAĞILIMI

BÖLÜM 12 STUDENT T DAĞILIMI 1 BÖLÜM 12 STUDENT T DAĞILIMI 'Student t dağılımı' ya da kısaca 't dağılımı'; normal dağılım ve Z dağılımının da içerisinde bulunduğu 'sürekli olasılık dağılımları' ailesinde yer alan dağılımlardan bir

Detaylı

MAK 210 SAYISAL ANALİZ

MAK 210 SAYISAL ANALİZ MAK 210 SAYISAL ANALİZ BÖLÜM 6- İSTATİSTİK VE REGRESYON ANALİZİ Doç. Dr. Ali Rıza YILDIZ 1 İSTATİSTİK VE REGRESYON ANALİZİ Bütün noktalardan geçen bir denklem bulmak yerine noktaları temsil eden, yani

Detaylı

Kazanımlar. Z puanları yerine T istatistiğini ne. zaman kullanacağını bilmek. t istatistiği ile hipotez test etmek

Kazanımlar. Z puanları yerine T istatistiğini ne. zaman kullanacağını bilmek. t istatistiği ile hipotez test etmek T testi Kazanımlar Z puanları yerine T istatistiğini ne 1 zaman kullanacağını bilmek 2 t istatistiği ile hipotez test etmek 3 Cohen ind sini ve etki büyüklüğünü hesaplamak 1 9.1 T İstatistiği: zalternatifi

Detaylı

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( )

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( ) İKİ DEĞİŞKENLİ OLASILIK Rassal bir deneme yapılmakta ve farklı iki olay ile ilgilenilmektedir. A 1, A 2,,A i olayları bağdaşmaz ve bütünü kapsayıcıdır. B 1, B 2,,B j olayları bağdaşmaz ve bütünü kapsayıcıdır.

Detaylı

LOJİSTİK REGRESYON ANALİZİ

LOJİSTİK REGRESYON ANALİZİ LOJİSTİK REGRESYON ANALİZİ Lojistik Regresyon Analizini daha kolay izleyebilmek için bazı terimleri tanımlayalım: 1. Değişken (incelenen özellik): Bireyden bireye farklı değerler alabilen özellik, fenomen

Detaylı

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü Mühendislikte İstatistiksel Yöntemler Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü 1 Araştırma sonuçlarının açıklanmasında frekans tablosu

Detaylı

TANI TESTLERINE GIRIŞ & ROC ANALİZİ

TANI TESTLERINE GIRIŞ & ROC ANALİZİ TANI TESTLERINE GIRIŞ & ROC ANALİZİ Yrd.Doç.Dr. Selçuk Korkmaz Trakya Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Turcosa Analitik Çözümlemeler selcukorkmaz@gmail.com ÇOCUK NEFROLOJİ DERNEĞİ

Detaylı

K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır.

K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır. İstatistiksel güven aralıkları uygulamalarında normallik (normal dağılıma uygunluk) oldukça önemlidir. Kullanılan parametrik istatistiksel tekniklerin geçerli olabilmesi için populasyon şans değişkeninin

Detaylı

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik 6.SUNUM İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik özellikleri (ortalama, varyans v.b. gibi) hakkında

Detaylı

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş Hipotez Testlerine Giriş Hipotez Testlerine Giriş Hipotez Testlerine Giriş Gözlem ya da deneme sonucu elde edilmiş sonuçların, raslantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel

Detaylı

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız. .4. Merkezi Eğilim ve Dağılım Ölçüleri Merkezi eğilim ölçüleri kitleye ilişkin bir değişkenin bütün farklı değerlerinin çevresinde toplandığı merkezi bir değeri gösterirler. Dağılım ölçüleri ise değişkenin

Detaylı

Kategorik Veri Analizi

Kategorik Veri Analizi Kategorik Veri Analizi 6.Sunum Yrd. Doç. Dr. Sedat ŞEN 1 ANALİZ TÜRLERİ Bağımlı Değ. Bağımsız Değ. Analiz Sürekli İki kategorili t-testi, Wilcoxon testi Sürekli Kategorik ANOVA, linear regresyon Sürekli

Detaylı

ARAġTIRMALARDA ÖLÇME VE ÖLÇEKLER. Kezban SEÇKİN Vildan GÜNEŞ

ARAġTIRMALARDA ÖLÇME VE ÖLÇEKLER. Kezban SEÇKİN Vildan GÜNEŞ ARAġTIRMALARDA ÖLÇME VE ÖLÇEKLER Kezban SEÇKİN Vildan GÜNEŞ Konu Başlıkları ÖLÇME ve ÖLÇEK ÖLÇEK TÜRLERĠ ÖLÇEKLERLE ĠLGĠLĠ ÖNEMLĠ NOKTALAR ÖLÇEĞĠN TAġIMASI GEREKEN ÖZELLĠKLER ÖLÇME HATALARI ÖLÇME VE ÖLÇEK

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık - I Prof. Dr. İrfan KAYMAZ Tanım Tahmin (kes1rim veya öngörü): Mevcut bilgi ve deneylere dayanarak olayın bütünü hakkında bir yargıya varmak7r. ü Bu anlamda, anakütleden çekilen

Detaylı

Akdeniz Üniversitesi

Akdeniz Üniversitesi F. Ders Tanıtım Formu Dersin Adı Öğretim Dili EKONOMETRİ I Türkçe Dersin Verildiği Düzey Ön Lisans ( ) Lisans (x ) Yüksek Lisans( ) Doktora( ) Eğitim Öğretim Sistemi Örgün Öğretim (x ) İkinci Örgün Öğretim

Detaylı

Parametrik Olmayan Testler. İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi

Parametrik Olmayan Testler. İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi Yrd. Doç. Dr. Neşet Demirci, Balıkesir Üniversitesi NEF Fizik Eğitimi Parametrik Olmayan Testler İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi Rank Korelasyon Parametrik

Detaylı

TANIMLAYICI İSTATİSTİKLER

TANIMLAYICI İSTATİSTİKLER TANIMLAYICI İSTATİSTİKLER Tanımlayıcı İstatistikler ve Grafikle Gösterim Grafik ve bir ölçüde tablolar değişkenlerin görsel bir özetini verirler. İdeal olarak burada değişkenlerin merkezi (ortalama) değerlerinin

Detaylı

Temel Kavramlar. Bağlanım Çözümlemesi. Temel Kavramlar. Ekonometri 1 Konu 6 Sürüm 2,0 (Ekim 2011)

Temel Kavramlar. Bağlanım Çözümlemesi. Temel Kavramlar. Ekonometri 1 Konu 6 Sürüm 2,0 (Ekim 2011) Bağlanım Çözümlemesi Temel Kavramlar Ekonometri 1 Konu 6 Sürüm 2,0 (Ekim 2011) UADMK Açık Lisans Bilgisi İşbu belge, Creative Commons Attribution-Non-Commercial ShareAlike 3.0 Unported (CC BY-NC-SA 3.0)

Detaylı

14 Ekim 2012. Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

14 Ekim 2012. Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi ÇOK DEĞİŞKENLİ REGRESYON ANALİZİ: ÇIKARSAMA Hüseyin Taştan 1 1 Yıldız Teknik Üniversitesi İktisat Bölümü Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge 14 Ekim 2012 Ekonometri

Detaylı

Ekonometri 1 Ders Notları

Ekonometri 1 Ders Notları Ekonometri 1 Ders Notları A. TALHA YALTA TÜRKİYE BİLİMLER AKADEMİSİ AÇIK DERS MALZEMELERİ PROJESİ SÜRÜM 2.0 EKİM 2011 İçindekiler 1 İstatistiksel Kavramların Gözden Geçirilmesi 1 1.1 Anlamlı Basamaklar

Detaylı

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5 Ders Kodu: 0010070021 Kredi: 3 / ECTS: 5 Yrd. Doç. Dr. Serkan DOĞANALP Necmettin Erbakan Üniversitesi Harita Mühendisliği Bölümü Konya 07.01.2015 1 Giriş 2 Giriş Matematiksel istatistiğin konusu yığın

Detaylı

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir. ÇIKARSAMALI İSTATİSTİKLER Çıkarsamalı istatistikler, örneklemden elde edilen değerler üzerinde kitleyi tanımlamak için uygulanan istatistiksel yöntemlerdir. Çıkarsamalı istatistikler; Tahmin Hipotez Testleri

Detaylı

13. Olasılık Dağılımlar

13. Olasılık Dağılımlar 13. Olasılık Dağılımlar Mühendislik alanında karşılaşılan fiziksel yada fiziksel olmayan rasgele değişken büyüklüklerin olasılık dağılımları için model alınabilecek çok sayıda sürekli ve kesikli fonksiyon

Detaylı

AMOS (Analysis of Moment Structures) ve Yapısal Eşitlik Modeli

AMOS (Analysis of Moment Structures) ve Yapısal Eşitlik Modeli AMOS (Analysis of Moment Structures) ve Yapısal Eşitlik Modeli Veri seti bulunur Değişkenler sürüklenerek kutucuklara yerleştirilir Hata terimi eklenir Mouse sağ tıklanır ve hata terimi tanımlanır.

Detaylı

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Yrd. Doç. Dr. Emre ATILGAN 1 RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Olasılığa ilişkin olayların çoğunluğunda, deneme sonuçlarının bir veya birkaç yönden incelenmesi

Detaylı

1 PAZARLAMA ARAŞTIRMASI

1 PAZARLAMA ARAŞTIRMASI İÇİNDEKİLER ÖNSÖZ III Bölüm 1 PAZARLAMA ARAŞTIRMASI 11 1.1. Pazarlama Araştırması Kavramı ve Kapsamı 12 1.2. Pazarlama Araştırmasının Tarihçesi 14 1.3. Pazarlama Araştırması Pazarlama Bilgi Sistemi ve

Detaylı

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin Ders 9: Kitle Ortalaması ve Varyansı için Tahmin Kitle ve Örneklem Örneklem Dağılımı Nokta Tahmini Tahmin Edicilerin Özellikleri Kitle ortalaması için Aralık Tahmini Kitle Standart Sapması için Aralık

Detaylı

İSTATİSTİK HAFTA. ÖRNEKLEME METOTLARI ve ÖRNEKLEM BÜYÜKLÜĞÜNÜN TESPİTİ

İSTATİSTİK HAFTA. ÖRNEKLEME METOTLARI ve ÖRNEKLEM BÜYÜKLÜĞÜNÜN TESPİTİ ÖRNEKLEME METOTLARI ve ÖRNEKLEM BÜYÜKLÜĞÜNÜN TESPİTİ HEDEFLER Bu üniteyi çalıştıktan sonra; Örneklemenin niçin ve nasıl yapılacağını öğreneceksiniz. Temel Örnekleme metotlarını öğreneceksiniz. Örneklem

Detaylı

SÜREKLİ RASSAL DEĞİŞKENLER

SÜREKLİ RASSAL DEĞİŞKENLER SÜREKLİ RASSAL DEĞİŞKENLER Sürekli Rassal Değişkenler Sürekli Rassal Değişken: Değerleriölçümyadatartımla elde edilen, bir başka anlatımla sayımla elde edilemeyen, değişkene sürekli rassal değişken denir.

Detaylı

Mann-Whitney U ve Wilcoxon T Testleri

Mann-Whitney U ve Wilcoxon T Testleri Mann-Whitney U ve Wilcoxon T Testleri Doç. Dr. Ertuğrul ÇOLAK Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Konu Başlıkları Parametrik olmayan yöntem Mann-Whitney U testinin

Detaylı

DERS BİLGİLERİ Ders Kodu Yarıyıl T+U Saat Kredi AKTS Çok Değişkenli İstatistik EKO428 Bahar Ön Koşul Dersin Dili

DERS BİLGİLERİ Ders Kodu Yarıyıl T+U Saat Kredi AKTS Çok Değişkenli İstatistik EKO428 Bahar Ön Koşul Dersin Dili DERS BİLGİLERİ Ders Kodu Yarıyıl T+U Saat Kredi AKTS Çok Değişkenli İstatistik EKO428 Bahar 3+0 3 3 Ön Koşul Yok Dersin Dili Türkçe Dersin Seviyesi Lisans Dersin Türü Seçmeli Dersi Veren Öğretim Elemanı

Detaylı

REGRESYON ANALĐZĐ. www.fikretgultekin.com 1

REGRESYON ANALĐZĐ. www.fikretgultekin.com 1 REGRESYON ANALĐZĐ Regresyon analizi, aralarında sebep-sonuç ilişkisi bulunan iki veya daha fazla değişken arasındaki ilişkiyi belirlemek ve bu ilişkiyi kullanarak o konu ile ilgili tahminler (estimation)

Detaylı

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3 KİTABIN İÇİNDEKİLER BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3 BÖLÜM-2.BİLİMSEL ARAŞTIRMA Belgesel Araştırmalar...7 Görgül Araştırmalar Tarama Tipi Araştırma...8

Detaylı

BASİT REGRESYON MODELİ

BASİT REGRESYON MODELİ BASİT REGRESYON MODELİ Hüseyin Taştan 1 1 Yıldız Teknik Üniversitesi İktisat Bölümü Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge 14 Ekim 2012 Ekonometri I: Basit Regresyon

Detaylı

Regresyon. Regresyon korelasyon ile yakından ilişkilidir

Regresyon. Regresyon korelasyon ile yakından ilişkilidir Regresyon Regresyona Giriş Regresyon korelasyon ile yakından ilişkilidir Regresyon bir bağımlı değişken ile (DV) bir veya daha fazla bağımsız değişken arasındaki doğrusal ilişkiyi inceler. DV için başka

Detaylı

Yrd. Doç. Dr. Mehmet Güçlü

Yrd. Doç. Dr. Mehmet Güçlü Dersin Adı DERS ÖĞRETİM PLANI Ekonometri I Dersin Kodu ECO 301 Dersin Türü (Zorunlu, Seçmeli) Dersin Seviyesi (Ön Lisans, Lisans, Yüksek Lisans, Doktora) Dersin AKTS Kredisi 6 Haftalık Ders Saati 4 Haftalık

Detaylı

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

rasgele değişkeninin olasılık yoğunluk fonksiyonu, 3.6. Bazı Sürekli Dağılımlar 3.6.1 Normal Dağılım Normal dağılım hem uygulamalı hem de teorik istatistikte kullanılan oldukça önemli bir dağılımdır. Normal dağılımın istatistikte önemli bir yerinin olmasının

Detaylı

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ I Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ II Yayın No : 2845 Teknik Dizisi : 158 1. Baskı Şubat 2013 İSTANBUL ISBN 978-605 - 377 868-4 Copyright Bu kitabın bu basısı için Türkiye deki yayın hakları BETA

Detaylı

ZAMAN SERİLERİNDE REGRESYON ANALİZİ

ZAMAN SERİLERİNDE REGRESYON ANALİZİ ZAMAN SERİLERİNDE REGRESYON ANALİZİ 1 1. GİRİŞ Trent, serinin genelinde yukarıya ya da aşağıya doğru olan hareketlere denmektedir. Bu hareket bazen düz bir doğru şeklinde olmaktadır. Bu tür harekete sahip

Detaylı

Olasılık ve Normal Dağılım

Olasılık ve Normal Dağılım Olasılık ve Normal Dağılım P = 0 İmkansız P =.5 Yarı yarıya P = 1 Kesin Yazı-Tura 1.5 2 1.5 2.5.5.25 Para atışı 10 kere tekrarlandığında Yazı Sayısı f % 0 3 30 1 6 60 2 1 10 Toplam 10 100 Atış 1000 kere

Detaylı

ĐST 474 Bayesci Đstatistik

ĐST 474 Bayesci Đstatistik ĐST 474 Bayesci Đstatistik Ders Sorumlusu: Dr. Haydar Demirhan haydarde@hacettepe.edu.tr Đnternet Sitesi: http://yunus.hacettepe.edu.tr/~haydarde Đçerik: Olasılık kuramının temel kavramları Bazı özel olasılık

Detaylı

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi DEĞİŞEN VARYANS Hüseyin Taştan 1 1 Yıldız Teknik Üniversitesi İktisat Bölümü Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge 14 Ekim 2012 Ekonometri I: Değişen Varyans

Detaylı

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ 1 BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel sayma

Detaylı

PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz.

PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz. PARAMETRİK TESTLER Tek Örneklem t-testi 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz. H0 (boş hipotez): 200 öğrencinin matematik dersinden aldıkları

Detaylı

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir. 4.SUNUM Genel olarak test istatistikleri Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri olmak üzere 2 grupta incelenebilir. 2 Ranj Çeyrek Kayma Çeyrekler Arası Açıklık Standart Sapma Varyans

Detaylı