TÜRKİYE DE RESMİ KURUMLARA DUYULAN GÜVENİN KATEGORİK REGRESYON VE LOJİSTİK REGRESYON ANALİZİ İLE İNCELENMESİ. Kadir GÜÇ

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "TÜRKİYE DE RESMİ KURUMLARA DUYULAN GÜVENİN KATEGORİK REGRESYON VE LOJİSTİK REGRESYON ANALİZİ İLE İNCELENMESİ. Kadir GÜÇ"

Transkript

1

2 TÜRKİYE DE RESMİ KURUMLARA DUYULAN GÜVENİN KATEGORİK REGRESYON VE LOJİSTİK REGRESYON ANALİZİ İLE İNCELENMESİ Kadir GÜÇ YÜKSEK LİSANS TEZİ İSTATİSTİK ANABİLİM DALI GAZİ ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ EKİM 2015

3 Kadir GÜÇ tarafından hazırlanan TÜRKİYE DE RESMİ KURUMLARA DUYULAN GÜVENİN KATEGORİK REGRESYON VE LOJİSTİK REGRESYON ANALİZİ İLE İNCELENMESİ adlı tez çalışması aşağıdaki jüri tarafından OY BİRLİĞİ ile Gazi Üniversitesi İstatistik Anabilim Dalında YÜKSEK LİSANS TEZİ olarak kabul edilmiştir. Danışman: Yrd. Doç. Dr. Emel BAŞAR İstatistik Anabilim Dalı, Gazi Üniversitesi Bu tezin, kapsam ve kalite olarak Yüksek Lisans Tezi olduğunu onaylıyorum... Başkan: Prof. Dr. Semra ORAL ERBAŞ İstatistik Anabilim Dalı, Gazi Üniversitesi Bu tezin, kapsam ve kalite olarak Yüksek Lisans Tezi olduğunu onaylıyorum... Üye: Doç. Dr. Cemal ATAKAN İstatistik Anabilim Dalı, Ankara Üniversitesi Bu tezin, kapsam ve kalite olarak Yüksek Lisans Tezi olduğunu onaylıyorum... Jüri tarafından kabul edilen bu tezin Yüksek Lisans Tezi olması için gerekli şartları yerine getirdiğini onaylıyorum. Tez Savunma Tarihi: 02/10/ Prof. Dr. Şeref SAĞIROĞLU Fen Bilimleri Enstitüsü Müdürü

4 ETİK BEYAN Gazi Üniversitesi Fen Bilimleri Enstitüsü Tez Yazım Kurallarına uygun olarak hazırladığım bu tez çalışmasında; Tez içinde sunduğum verileri, bilgileri ve dokümanları akademik ve etik kurallar çerçevesinde elde ettiğimi, Tüm bilgi, belge, değerlendirme ve sonuçları bilimsel etik ve ahlak kurallarına uygun olarak sunduğumu, Tez çalışmasında yararlandığım eserlerin tümüne uygun atıfta bulunarak kaynak gösterdiğimi, Kullanılan verilerde herhangi bir değişiklik yapmadığımı, Bu tezde sunduğum çalışmanın özgün olduğunu, bildirir, aksi bir durumda aleyhime doğabilecek tüm hak kayıplarını kabullendiğimi beyan ederim. Kadir GÜÇ 02/10/2015

5

6 iv TÜRKİYE DE RESMİ KURUMLARA DUYULAN GÜVENİN KATEGORİK REGRESYON VE LOJİSTİK REGRESYON ANALİZİ İLE İNCELENMESİ (Yüksek Lisans Tezi) Kadir GÜÇ GAZİ ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ Ekim 2015 ÖZET Bağımlı değişkeni kategorik olan modelleri açıklama amacı taşıyan lojistik regresyon analizi, sosyal bilim çalışmalarında sıklıkla kullanılmaktadır. Alternatif tekniklere göre varsayımlarının azlığı ve çıktılarının kolay yorumlanabilmesi, lojistik regresyon analizini cazip bir hale getirmektedir. Optimal ölçekleme tekniklerinden olan ve tıpkı lojistik regresyon gibi bağımlı değişkeni kategorik modelleri açıklamada kullanılan bir diğer teknik ise kategorik regresyon analizidir. Kategorik regresyon analizi de tıpkı lojistik regresyon gibi az sayıda varsayıma dayanmakta ve son derece etkin çözümler üretmektedir. Bu çalışmada, Bilgiç ve Akyürek (2009) tarafından hazırlanan Güneydoğu Sorununun Sosyolojik Analizi isimli çalışmadaki veriden yararlanılarak, ülkemizde Türk Silahlı Kuvvetlerine olan güven düzeyi ile çeşitli demografik değişkenler arasındaki ilişkiler, kategorik regresyon analizi ve lojistik regresyon analizi kullanılarak incelenecek ve benzer veri tipine sahip modelleri açıklamada kullanılan bu iki regresyon modelinin benzerlikleri ve farklılıkları ortaya konulmaya çalışılacaktır. Bilim Kodu : Anahtar Kelimeler : Optimal Ölçekleme, Kategorik Regresyon (CATREG), Lojistik Regresyon Sayfa Adedi : 75 Danışman : Yrd. Doç. Dr. Emel BAŞAR

7 v INVESTIGATION OF CONFIDENCE IN SOME GOVERNMENT AGENCIES IN TURKEY WITH CATEGORICAL REGRESSION AND LOGISTIC REGRESSION ANALYSIS (M. Sc. Thesis) Kadir GÜÇ GAZİ UNIVERSITY GRADUATE SCHOOL OF NATURAL AND APPLIED SCIENCES October 2015 ABSTRACT Logistic regression model which aims to explain the models whose dependent variable is categorical is frequently used in social science studies. In comparison with alternative techniques, exiguity of assumptions and easy interpretation of outputs make logistic regression analysis attractive. Just like logistic regression, another optimal scaling technique that aims to explain the models whose dependent variable is categorical is categorical regression analysis. Also, similar to logistic regression analysis, categorical regression has few assumptions and produce highly effective solutions. In this study, by benefiting from the study named Sociological Analysis of Southeast Problem by Bilgiç and Akyürek (2009), the relationships between the confidence level in Turkish Armed Forces and various demographic variables will be investigated using categorical regression analysis and logistic regression analysis. Also, the similarities and differences of these two regression models used to explain the models which have similar data types will be examined. Science Code : Key Words : Optimal Scaling, Categorical Regression (CATREG), Logistic Regression Page Number : 75 Supervisor : Assist. Prof. Dr. Emel BAŞAR

8 vi TEŞEKKÜR Hazırlamış olduğum tez çalışmasında beni her zaman motive eden; tez çalışmasını bitirmemde büyük katkıları olan ve belki de çalışmaya benden daha fazla emek veren saygıdeğer hocam Yrd. Doç. Dr. Emel BAŞAR a, tez jürisindeki değerleri katkıları için Doç. Dr. Cemal ATAKAN ve Prof. Dr. Semra ERBAŞ hocalarıma, tezin uygulama kısmında kullandığım verileri benimle paylaştıkları ve kullanmama müsaade ettikleri için saygıdeğer komutanlarım ve aynı zamanda hocalarım olan Dr. M. Sadi BİLGİÇ ve Dr. Salih AKYÜREK e, bunun yanı sıra görev yapmaktan her zaman gurur duyduğum Kara Harp Okulu Sosyoloji Bölümündeki mesai arkadaşlarıma ve özellikle bölüm başkanımız Doç. Dr. Öğ. Alb. Memet ERKENEKLİ ye, son olarak bana her zaman güvenen, karşılaştığım zorlukları aşabileceğim duygusunu aşılayan ve maddi manevi destekleriyle her zaman kendilerini yanımda hissettiğim annem Sabriye GÜÇ ve babam İhsan GÜÇ e sonsuz teşekkür ederim.

9 vii İÇİNDEKİLER Sayfa ÖZET... ABSTRACT... TEŞEKKÜR... İÇİNDEKİLER... ÇİZELGELERİN LİSTESİ... ŞEKİLLERİN LİSTESİ... SİMGELER VE KISALTMALAR... iv v vi vii x xii xiii 1. GİRİŞ OPTİMAL ÖLÇEKLEME TEKNİKLERİ İLE İLGİLİ GENEL BİLGİLER Optimal Ölçeklemenin Tanımı ve Amaçları Optimal Ölçeklemenin Gelişimi Optimal Ölçeklemede Değişken Kategorilerinin Kodlanması Optimal Ölçeklemede Sayısallaştırma (Quantification) ve Dönüşüm Grafikleri Optimal Ölçekleme Tekniklerinde Kayıp Fonksiyonu Kayıp fonksiyonu oluşturulurken kullanılan temel matrisler Homojenlik analizinde sayısallaştırma işlemi Homojenlik analizinde kayıp fonksiyonun hesaplanması Homojenlik Analizinde ALS Algoritmasının Uygulanması Optimal Ölçekleme Türleri ve Aralarındaki İlişkiler KATEGORİK REGRESYON ANALİZİ Kategorik Regresyon Analizinin Amacı ve Tarihçesi Kategorik Regresyonda Kayıp Fonksiyonu Kategorik Regresyona ALS Algoritmasının Uygulanması... 29

10 viii Sayfa 3.4. Kategorik Regresyonda Açıklayıcılık Katsayısı R 2 ve ANOVA Tablosu Kategorik Regresyonda Değişkenlerin Anlamlılığının Test Edilmesi Dönüşüm Sonrası Korelasyon Matrisi Kategorik Regresyonda Tolerans (Tolerance) Değeri Kategorik Regresyonda Kullanılan Korelasyon Katsayıları Sıfır sıralı (zero-order) korelasyon Kısmi (partial) korelasyon Kısım (part) korelasyon Kategorik Regresyonda Önemlilik (Importance) Katsayısı LOJİSTİK REGRESYON Lojistik Regresyonla İlgili Genel Bilgiler Lojistik Modelin Kurulması Lojistik Regresyonda Regresyon Katsayılarının Kestirimi En çok olabilirlik yöntemi Lojistik Regresyonda Değişkenlerin Önemliliğinin Test Edilmesi Lojistik Regresyonda Uyum İyiliği Testleri Lojistik Regresyonda Açıklayıcılık Katsayıları Lojistik Regresyon ile Kategorik Regresyon Arasındaki Farklar ve Benzerlikler UYGULAMA Uygulamada Kullanılacak Veri Seti Kategorik Regresyon Analizi Uygulaması Değişken sayısallaştırmaları Kategorik regresyon bulguları Sıralı Lojistik Regresyon Analizi Uygulaması Kategorik Regresyon ve Sıralı Lojistik Regresyon Sonuçlarının Karşılaştırılması... 63

11 ix Sayfa 5.5. Ortak Kategori Noktaları Grafiği SONUÇ VE TARTIŞMA KAYNAKÇA ÖZGEÇMİŞ... 75

12 x ÇİZELGELERİN LİSTESİ Çizelge Sayfa Çizelge 2.1. Yaş değişkeni için kodlama tercihleri... 7 Çizelge kişiye ilişkin örnek veri seti Çizelge 2.3. Veri setinin çapraz tablosu Çizelge 2.4. G gösterge matrisi (indikatör matris) Çizelge 2.5. D tekli marjinaller matrisi Çizelge 2.6. C ikili marjinaller matrisi Çizelge 3.1. Kategorik regresyonda ANOVA tablosu Çizelge 5.1. Çalışmada kullanılan değişkenler Çizelge 5.2. TSK ya duyulan güven düzeyi için sayısallaştırma Çizelge 5.3. Cinsiyet değişkeni için sayısallaştırma Çizelge 5.4. Medeni durum değişkeni için sayısallaştırma Çizelge 5.5. Konuşulan dil değişkeni için sayısallaştırma Çizelge 5.6. Meslek değişkeni için sayısallaştırma Çizelge 5.7. Mezhep değişkeni için sayısallaştırma Çizelge 5.8. Yaşanılan yer değişkeni için sayısallaştırma Çizelge 5.9. Gelir düzeyi değişkeni için sayısallaştırma Çizelge Namaz kılma sıklığı değişkeni için sayısallaştırma Çizelge Eğitim düzeyi değişkeni için sayısallaştırma Çizelge Kategoriler birleştirildikten sonra eğitim düzeyi değişkeni için sayısallaştırma Çizelge Yaş değişkeni için sayısallaştırma Çizelge Kategoriler birleştirildikten sonra yaş değişkeni için sayısallaştırma Çizelge Analizde kullanılan gözlem sayısı Çizelge Kayıp fonksiyonu için iterasyon geçmişi... 51

13 xi Çizelge Sayfa Çizelge Model anlamlılığı tablosu Çizelge Bağımsız değişken katsayılarının anlamlılığı tablosu Çizelge Değişken kategorilerinin etki katsayısı tablosu Çizelge Orijinal değişkenler arasındaki korelasyon katsayıları Çizelge Dönüştürülmüş değişkenler arasındaki korelasyon katsayıları Çizelge Korelasyon değerleri tablosu Çizelge Önemlilik ve tolerans değerleri Çizelge Paralellik testi Çizelge Model uyumu (model fitting) testi Çizelge Uyum iyiliği (goodness of fit) testleri Çizelge Pseudo R 2 istatistikleri Çizelge Parametre tahminleri (parameter estimates) tablosu... 61

14 xii ŞEKİLLERİN LİSTESİ Şekil Sayfa Şekil 2.1. Dönüşüm öncesi... 9 Şekil 2.2. Dönüşüm sonrası... 9 Şekil 5.1. Eğitim düzeyi değişkeni için dönüşüm grafiği Şekil 5.2. Kategoriler birleştirildikten sonra eğitim düzeyi değişkeni için dönüşüm grafiği Şekil 5.3. Yaş değişkeni için dönüşüm grafiği Şekil 5.4. Kategoriler birleştirildikten sonra yaş değişkeni için dönüşüm grafiği Şekil 5.5. Ortak kategori noktaları grafiği... 67

15 xiii SİMGELER VE KISALTMALAR Bu çalışmada kullanılmış bazı simgeler, açıklamaları ile birlikte aşağıda sunulmuştur. Kısaltmalar Açıklamalar ALS CATREG ÇDB DOTBA EÇO EKK HOMALS LR MORALS OVERALS PRINCALS WLIN WMON Alternating least squares Categorical regression analysis Çoklu doğrusal bağlantı Doğrusal olmayan temel bileşenler analizi En çok olabilirlik En küçük kareler Homogenity analysis Lojistik regresyon Multiple optimal regresssion via alternating least squares Nonlinear canonical correlation analysis Nonlinear principal component analysis Weighted linear regression Weighted monotonic regression

16

17 1 1. GİRİŞ Sosyal bilimler alanında yapılan pek çok çalışmada kategorik özellik taşıyan veriler kullanılmaktadır. Verilerin kategorik olması nedeniyle de, bilinen pek çok istatistiksel analiz tekniğinden yararlanmak mümkün olmamaktadır. Optimal ölçekleme olarak bilinen analiz teknikleri, kategorik veriler arasındaki ilişkilerin çok değişkenli bir şekilde ele alınıp analiz edilmesine imkan sağlamaktadır. Bu teknikler, işleyişindeki varsayımların azlığı ve görsel haritalar oluşturması bakımından da son derece kullanışlı olmaktadır. Optimal ölçekleme türleri, temel olarak homojenlik analizi (çoklu uyum analizi), doğrusal olmayan temel bileşenler analizi, doğrusal olmayan kanonik korelasyon analizi ve kategorik regresyon analizi olarak bilinmektedir. Bu yöntemlerin her biri, optimal ölçeklemenin temel tekniklerini kullanarak analizlerin gerçekleştirilmesini sağlamakla birlikte, aralarında benzerlikler ve farklılıklar bulunmaktadır. Optimal ölçekleme tekniklerinden biri olan kategorik regresyon analizi, bağımlı değişkeni kategorik olan modelleri çözümleme olanağı sağlamaktadır. Benzer şekilde lojistik regresyon analizi de bağımlı değişkeni kategorik olan modellerde sıklıkla kullanılmaktadır. Özellikle Türkiye de yapılan çalışmalarda kategorik regresyondan daha çok, lojistik regresyon analizinin kullanıldığı görülmektedir. Bu çalışmada, genel olarak optimal ölçekleme teknikleri gözden geçirilerek bu tekniklerden biri olan kategorik regresyon analizi ayrıntılı olarak incelenecektir. Aynı veri yapısına sahip değişkenler için kullanılan lojistik regresyon analizi ile kategorik regresyon analizi arasındaki benzerlikler ve farklılıklar ortaya konularak bir uygulama yapılacaktır. Ayrıca kategorik regresyonun, lojistik regresyona alternatif bir teknik olabileceğini ve bundan sonraki çalışmalarda kategorik regresyon analizinin daha sık ve etkin bir şekilde kullanılabileceğini göstermek amaçlanmaktadır. Çalışmanın birinci bölümünde, kategorik regresyon analizinin altyapısını oluşturan optimal ölçekleme tekniklerinin gelişimi, amaçları, kullanım alanları ve optimal ölçekleme türleri kısaca anlatılmıştır.

18 2 İkinci bölümde, kategorik regresyon analizi ayrıntılı bir şekilde anlatılmıştır. Üçüncü bölümde, lojistik regresyon analizi kısaca anlatılmış, kategorik regresyon analizi ile benzerlikleri ve farklılıkları vurgulanmıştır. Türkiye de çeşitli resmi kurumlara duyulan güven ile ilgili pek çok çalışma yapılmakta ve kamuoyunda paylaşılmaktadır. Ancak bu çalışmalar genelde betimsel düzeyde kalmakta, verinin ayrıntılı incelenmesini sağlayabilecek istatistiksel analizler yapılmamaktadır. Çalışmanın dördüncü bölümünde yer alan uygulamada, Bilgiç ve Akyürek (2009) tarafından yapılan ve 8607 kişilik bir örneklem grubuna uygulanarak hazırlanan Güneydoğu Sorununun Sosyolojik Analizi isimli çalışmadaki veriden yararlanılmıştır. Adı geçen çalışmada, Türk Silahlı Kuvvetleri ve devletin diğer kurumlarına olan güven düzeyi ile çeşitli demografik değişkenler yer almaktadır. Bu çalışmada ise, Türk Silahlı Kuvvetlerine duyulan güven ile çeşitli demografik değişkenler arasındaki ilişkiler, kategorik regresyon analizi ve lojistik regresyon analizi kullanılarak, demografik değişkenlerin TSK ya duyulan güveni ne derece açıklayabildiği ve hangi değişkenlerin güven düzeyinin açıklanmasında anlamlı etkiye sahip olduğu incelenmeye çalışılmış; kategorik regresyon ve lojistik regresyon sonuçları karşılaştırılarak elde edilen sonuçlar tartışılmıştır.

19 3 2. OPTİMAL ÖLÇEKLEME TEKNİKLERİ İLE İLGİLİ GENEL BİLGİLER 2.1. Optimal Ölçeklemenin Tanımı ve Amaçları Bilinen birçok istatistiksel teknik, verilerin sürekli olduğu, ana kütleden rastgele örneklem seçildiği ve normal dağılım varsayımının sağlandığı durumlarda kullanılabilmektedir. Fakat, sosyal bilimlerle ilgili çalışmalarda, bu varsayımlar çoğunlukla karşılanamamaktadır. Ana kütleden rastgele örneklem seçildiği durumlarda bile, veriler sürekli olmadığı takdirde, normal dağılım varsayımından bahsetmek mümkün olmamaktadır (Nishisato, 2004:3). Çok değişkenli analiz teknikleri, aralarında doğrusal ilişki bulunan ve genellikle nümerik özelliğe sahip değişkenler arasındaki ilişkilerin analiz edilmesine imkan sağlamaktadır. Fakat sosyal bilimler alanında yapılan pek çok çalışmada kategorik özellik taşıyan veriler kullanılmaktadır. Verilerin kategorik olması nedeniyle de bilinen pek çok istatistiksel analiz tekniğinden yararlanmak mümkün olmamaktadır (Giray, 2011:1). Optimal ölçekleme (optimal scaling) olarak bilinen analiz teknikleri; normal dağılım varsayımının sağlanmadığı, verilerin kategorik olduğu ve değişkenler arasında doğrusal olmayan ilişkilerin bulunduğu durumlarda, verilerin çok değişkenli bir şekilde ele alınıp analiz edilmesine imkan sağlamaktadır. Sosyal bilimler ve davranış bilimleri ile ilgili çalışmalarda kategorik verilere sıkça rastlanmaktadır. Bilinen çok değişkenli tekniklerin kategorik veriler için uyarlanmasıyla çeşitli analizler yapılmasına rağmen, çok fazla gözlem içeren ve çok fazla değişkenin bulunduğu veri setlerinde bu analizler yeterince etkin çözümler üretememektedir (Meulman ve Heiser, 2012:1). Optimal ölçekleme teknikleri, değişken kategorilerini sayısal hale getirerek bu problemleri ortadan kaldırmakta ve bu yöntemlerle kategorik verilerin çok değişkenli analizi yapılabilmektedir. Optimal ölçekleme teknikleri, verilerin kategorik veya nümerik düzeyde olduğu durumlarda kullanılan, ilgili veriyi açıklamayı ve betimlemeyi amaçlayan analiz teknikleri kümesidir. Optimal ölçeklemede amaç; n sayıda nesne (gözlem) ve m sayıda kategorik değişkenden oluşan veri setinin değişkenlerini, değişkenlerin ölçüm düzeylerini dikkate alarak daha küçük boyutlu uzayda göstermektir. Bu yöntemler, ele alınan değişkenlerin iki

20 4 boyutlu haritalarda grafiksel gösterimine de imkan sağlamaktadır. Bu tekniklerde kullanılan verilerin pozitif tamsayı olması gerekmektedir (Bayram ve Ertaş, 2001). Optimal ölçekleme teknikleri ile çok değişkenli çapraz tablolardaki her bir değişkenin kategorileri sayısallaştırılarak, bu kategoriler arasındaki ilişkiler grafiksel olarak incelenebilmektedir. Optimal ölçekleme teknikleri, ikiden çok değişken içeren tablolardaki bilginin iki boyutlu grafiksel gösterimini sağlaması ve işleyişindeki varsayımların azlığı nedeniyle son derece kullanışlı bir tekniktir. Optimal ölçeklemenin en önemli özelliklerinden biri de; parametre tahminlerini kullanarak verileri yorumlamak yerine, grafiksel gösterimlere dayalı yorumların yapılabilmesidir (Meulman ve Heiser, 2012:1; Alpar, 2013:365). Optimal ölçekleme genel olarak; Doğrusal haritalama yardımıyla boyut indirgemede Çok değişkenli verilerin analizinde uzaklık kestirimlerinde Nesneleri (gözlemleri) kümelemede Değişkenleri kümelemede Nesnelerin ve değişkenlerin iki boyutlu grafiksel gösteriminde Doğrusal olmayan ikili gösterimlerde Grafiklerin ve ağların oluşturulmasında kullanılmaktadır (Meulman, 2004). Değişkenler, ölçüm düzeyleri bakımından 4 temel kategoriye ayrılmaktadır. Bunlar nominal (sınıflama), ordinal (sıralama), aralıklı ve oransal ölçüm düzeyleridir. Sınıflama ve sıralama düzeyinde ölçülen değişkenler, kategorik değişkenler olarak bilinmektedir. Sınıflama ölçme düzeyi, gözlemlerin belirli bir özelliğe sahip olması bakımından ayırt edilmesini sağlayan ölçek tipidir. Değişkenin aldığı farklı durumlar rakamlarla ifade ediliyor olsa da bu rakamlar sadece etiket olarak anlam kazanmaktadır. Birimler arasında herhangi bir üstünlük söz konusu değildir. Sıralama ölçme düzeyi, gözlemlerin belirli bir özelliğe sahip olması bakımından ayırt edilmesini sağlamanın yanı sıra bu özelliğin önem derecesini de göstermektedir. Dolayısıyla, birimler arasında bir üstünlük sıralaması vardır. Aralıklı ve oransal ölçme düzeyleri ise, gerçek anlamda sayılardan oluşmaktadır. Bu şekilde

21 5 ölçülen verilere matematiksel işlemler uygulanabilir. Aralarındaki en önemli fark sıfır rakamının varlığıdır. Aralıklı ölçekte başlangıç noktası keyfi olup; sıfır yokluk ifade etmezken, oransal ölçekte sıfırın yokluk anlamı bulunmaktadır (Durmuş, Yurtkoru ve Çinko, 2013:8-10; Ünver, Gamgam ve Altunkaynak, 2013:14-18). Sınıflama ve sıralama özelliğine sahip kategorik bir değişken; belirli kategori kümelerinden oluşan bir ölçüm değerine sahiptir. Örnek olarak; politik düşünceler genellikle liberal, ılımlı, tutucu şeklindeki kategorilerle ölçülmektedir ya da bir hastalığın düzeyi ile ilgili teşhisler; başlangıç aşamasında ya da ileri düzeyde şeklinde ifade edilebilir (Agresti, 2007:1-2). Yukarıda verilen örneklerde olduğu gibi, sosyal bilimler alanında yapılan çalışmaların büyük çoğunluğunda değişkenlerin kategorik olduğu bilinmektedir. Dolayısıyla, kategorik verilerin çok değişkenli analizini sağlayacak yöntemlere ihtiyaç duyulmaktadır. Optimal ölçekleme teknikleri, bu sorunu ortadan kaldırmakta ve kategorik verilerin analizine imkan sağlamaktadır. Optimal ölçeklemenin amacı, çok değişkenli kategorik veri setlerinin içerdiği bilgiyi optimal biçimde ortaya çıkarmaktır. Bu teknikler, psikolojik ve klinik gözleme dayanan verilerde, öğretmen-öğrenci değerlendirme formlarında, anket türü tüm çalışmalarda kısacası kategorik düzeyde ölçülen değişkenlerin bulunduğu durumlarda kullanılabilmektedir (Nishisato, 2004:3). Optimal Ölçekleme genel olarak; Kesikli çok değişkenli verilerin, Sıralama (nominal) düzeyinde ölçülen verilerin, Tamamlanmamış (kayıp gözlem içeren) verilerin, Değişken çiftleri arasındaki doğrusal olmayan ilişkilerin bulunduğu durumların, Normal dağılım göstermeyen veri setlerinin, Sosyal ağlara ilişkin verilerin, Yakınlık ölçüleri içeren verilerin analizinde kullanılmaktadır (Meulman, 2004).

22 Optimal Ölçeklemenin Gelişimi Optimal Ölçeklemenin oluşumunu sağlayan fikirler, farklı kaynakların birleşimiyle ortaya çıkmıştır. İlk olarak, Greenacre (1984) tarafından uyum (correspondance) analizi olarak ortaya atılan teknik, ikili ölçekleme (dual scaling) (Nishisato, 1980, 1994) ve homojenlik analizi (Gifi, 1990) olarak geliştirilmiştir. Yakın dönemlerde farklı bilim adamları tarafından geliştirilen bu teknikler, optimal ölçeklemenin alt yapısını oluşturmaktadır. Bu analizlere katkı sağlayan daha eski çalışmalar ise Horst, Fisher, Guttman, Burt ve Hayashi tarafından yapılmıştır. Optimal Ölçekleme tekniklerine büyük bir güç katan analiz ise, Shepard (1962), Kruskal (1964) ve Guttman (1968) tarafından geliştirilen çok boyutlu ölçekleme (multidimensional scaling) analizidir. Çok boyutlu ölçeklemede, n sayıda gözlemin aralarındaki yakınlık ölçülerinden yararlanarak, daha küçük boyutlu bir uzayda gözlemler arasındaki uzaklıklar belirlenmeye çalışılmaktadır li ve 80 li yıllarda, optimal ölçekleme tekniklerine psikometrik alandan çok büyük katkılar geldiği görülmektedir. Young, de Leeuw, Takane (1976) ve Gifi (1981,1990) tarafından geliştirilen teknikler ile, optimal ölçekleme teknikleri daha kapsamlı ve sistematik bir hale dönüştürülmüştür. Özellikle Albert Gifi, optimal ölçekleme tekniklerine çok büyük katkılarda bulunmuş, daha sonraları kategorik verilerin kullanıldığı çok değişkenli analiz teknikleri, Gifi teknikleri olarak adlandırılmıştır. Gifi teknikleri, 1990 lı yıllardan sonra çok daha geniş bir kullanım alanı bulmuş ve çalışmalarda daha kapsamlı bir şekilde kullanılmaya başlanmıştır (Meulman, 2004). Optimal ölçekleme teknikleri birbirine yakın zamanlarda ve farklı ülkelerde çalışıldığı için farklı kaynaklarda dual scaling, additive scoring, optimal scoring, biplot, correspondance factor analysis, principal component analysis of qualitative data, recipnocal averaging, appropriate scoring, scalogram ve homogenity analysis gibi değişik isimlerle adlandırılmaktadır (Suner ve Çelikoğlu, 2008; Alpar, 2013:365).

23 Optimal Ölçeklemede Değişken Kategorilerinin Kodlanması Optimal ölçeklemede değişkenleri, aldığı değerler incelenmeden doğrudan analize dahil etmek pek sağlıklı sonuçlar vermemektedir. Bu nedenle, değişkenlerin yapısına göre bazı değişiklikler yapılarak, veriler optimal ölçekleme için uygun hale getirilmelidir. Örneğin, nümerik bir değişkeni kategorik hale getirerek ve doğrusal olmayan dönüşümler kullanarak daha küçük boyutlu çözümler elde edilebilir. Yaş değişkeni örnek olarak ele alınacak olursa; yaş nümerik bir değişken olmasına rağmen, 25 yaşın altındakiler, yaş arası ve 60 yaş ve üzerindekiler olmak üzere 3 gruplu kategorik değişken haline getirilebilir. İnsanların politik tercihlerinin ele alındığı başka bir örnekte, değişken sınıflama düzeyinde ölçülmesine rağmen, politik tercihler sol görüşten sağ görüşe göre bir ölçekleme yardımıyla sayısallaştırarak, sıralama düzeyine getirilebilir. Sonuç olarak; veri incelenerek, optimal ölçekleme için uygun hale getirilmeli, yorumlamayı kolaylaştıran bir yol bulunmalı ve anlamlı sonuç veren ölçek türü tercih edilmelidir (Giray, 2011:40; Meulman ve Heiser, 2012:3-5). Optimal ölçeklemede kodlama yapılırken sınıflama ve sıralama düzeyindeki değişkenler için başlangıç noktası 1 kabul edilir. Tüm kategorik değişkenlerin başlangıç noktasının 1 olması işleyiş açısından daha uygun olmaktadır. Nümerik değişkenler için ise kodlama yapılırken şöyle bir yol izlenmektedir; her bir kategori değerinden o veri setindeki en küçük değer çıkartılıp 1 eklemek suretiyle dönüşüm uygulanır. Böylelikle orijinal değişkenler arasındaki farklar, dönüştürülmüş değişkenlerde de aynen korunur. Aşağıdaki çizelgede yaş değişkeninin optimal ölçeklemede kullanılabilmesi için nasıl bir kodlamanın uygun olacağı anlatılacaktır. Çizelge Yaş değişkeni için kodlama tercihleri Kategori A B C

24 8 Çizelge 2.1. de yaş değişkeni için 3 farklı kodlama örneği yer almaktadır. Buna göre, A şeklinde yapılan bir kodlamada aradaki farklar korunmakta fakat, diğer kategori düzeyleri bu şekilde kodlanmadığı ve başlangıç noktası 1 alınmadığı için bu şekilde bir kodlama düzeni yetersiz kalmaktadır. B şeklinde yapılan bir kodlamada ise başlangıç değeri 1 olarak alınmakta fakat aradaki farklar korunamamaktadır. Aradaki farklar gözetilmeden yapılan böyle bir kodlamada yetersiz olmaktadır. C şeklinde yapılan kodlamada ise değişkenin aldığı her bir değerden, değişkene ilişkin en küçük değer çıkartılıp 1 eklemek suretiyle bir dönüşüm uygulanarak hem en küçük değer 1 olarak alınmakta hem de aradaki farklar korunmakta ve bu şekilde yapılan bir kodlama sayısal veriler için en uygun kodlama düzeni olmaktadır (Meulman ve Heiser,2011:5-6) Optimal Ölçeklemede Sayısallaştırma (Quantification) ve Dönüşüm Grafikleri Optimal ölçekleme tekniklerinde, kategorik değişkenlere sayısal değerler verilerek kategorik durumda bulunan değişkenler nümerik hale getirilmektedir. Kategorik değişkenlerin kategorilerine yeni ölçek değerlerinin atanması ve nümerik hale gelmesine sayısallaştırma (quantification) adı verilmektedir. Sayısallaştırma işlemi, bir sonraki adımda anlatılacak olan kayıp fonksiyonunu minimize edecek şekilde yapılmalıdır (Gifi, 1996:69). Sayısallaştırma işleminin nasıl gerçekleştirildiği bir sonraki bölümde anlatılacaktır. Optimal ölçeklemede değişkenlerin düzeylerini belirlemede sayısallaştırma işlemi sonucunda elde edilen dönüşüm grafiklerinden de yararlanılmaktadır. Dönüşüm grafikleri, optimal ölçekleme sonucunda elde edilen sayısal değerler ile orijinal kategoriler arasındaki ilişkileri göstermektedir. Bu grafikler, seçilen optimal ölçekleme düzeyinin ne derece uygun olduğunu belirtmektedir. Eğer değişken sınıflama veya sıralama düzeyinde ölçülmüşse, dönüşüm grafiklerinde durağan bölgeler oluşabilmekte, bu durumda değişkenlerin boyutlarının, durağan bölgeler dikkate alınarak birleştirilmesi gerekmektedir. Yani sayısallaştırılan değişkenlerin aynı değere sahip olmaları durumunda kategori birleştirmeleri yapılmalıdır (Meulman ve Heiser, 2012:3).

25 9 Örneğin eğitim düzeyi değişkeni için oluşturulan Şekil 2.1 deki dönüşüm grafiğine bakıldığında okur yazar olanlar ile ilkokul mezunlarının aynı sayısal değere sahip olduğu, yani durağan bir görünüm sergilediği görülmektedir. Yine aynı şekilde ortaokul ve lise mezunlarının da sayısallaştırıldıktan sonra aynı değere sahip oldukları görülmektedir. Bu durumda, durağan bölgelerin olduğu kategoriler için birleştirme yapılmış ve yeni dönüşüm grafiği Şekil 2.2 de verilmiştir. Görüldüğü üzere, eğitim düzeyi değişkeni için en başta 5 kategori mevcut iken, optimal ölçekleme ile sayısallaştırma yapıldıktan sonra eğitim değişkeni 3 alt kategoriye indirgenmiştir. 2,5 Eğitim Düzeyi 2,5 Eğitim Düzeyi 2 1,5 1 0, ,5 1 0,5 0 İlkokul ve altı Ortaokul-Lise üniversite Şekil 2.1. Dönüşüm öncesi Şekil 2.2. Dönüşüm sonrası Dönüşüm grafiklerinden yararlanılarak, kategorilerin birleştirilmesi ve yeniden analizlerin gerçekleştirilmesi ile daha güvenilir sonuçlara ulaşılabileceği öngörülmekle birlikte, aralarında anlamlı bir farklılık olup olmadığını görmek için hem dönüşüm uygulanmış hem de uygulanmamış değişkenlerle analiz yapılmalı ve sonuçlar karşılaştırılmalıdır (Van de Geer, 1993:7) Optimal Ölçekleme Tekniklerinde Kayıp Fonksiyonu Optimal ölçekleme tekniklerinin nasıl çalıştığını anlamak için aşağıda verilecek örnek veri setinden yararlanılarak tanımlanan matrisler üzerinden, kayıp fonksiyonu elde edilecektir.

26 Kayıp fonksiyonu oluşturulurken kullanılan temel matrisler Aşağıda 15 kişinin cinsiyet, eğitim düzeyi, yaşadığı yer ve kurumlara duyduğu güven düzeyi bilgilerini içeren, örnek bir veri seti oluşturulmuştur. Çizelge kişiye ilişkin örnek veri seti Sıra No Cinsiyet Eğitim Düzeyi Yaşadığı Yer Güven Düzeyi 1 Erkek İlköğretim Kent Tamamen Güveniyorum 2 Erkek İlköğretim Kır Güveniyorum 3 Kadın Üniversite Kent Hiç Güvenmiyorum 4 Kadın İlköğretim Kır Güveniyorum 5 Erkek Lise Kır Tamamen Güveniyorum 6 Kadın Üniversite Kır Hiç Güvenmiyorum 7 Erkek Lise Kent Tamamen Güveniyorum 8 Erkek Üniversite Kent Hiç Güvenmiyorum 9 Kadın Üniversite Kent Güvenmiyorum 10 Kadın İlköğretim Kır Güveniyorum 11 Kadın Lise Kent Tamamen Güveniyorum 12 Erkek İlköğretim Kent Tamamen Güveniyorum 13 Kadın İlköğretim Kır Güveniyorum 14 Erkek Üniversite Kent Hiç Güvenmiyorum 15 Kadın İlköğretim Kır Güveniyorum Veri setini analize hazır hale getirebilmek için öncelikle kişilerin tamamının tüm bilgilerini içeren aşağıdaki çapraz tablo oluşturulmuştur. Çizelge 2.3. Veri setinin çapraz tablosu Güven Düzeyi* Cinsiyet Eğitim İkamet Toplam İlköğretim Kent 2 2 Kır 1 1 Erkek Lise Kent 1 1 Kır 1 1 Üniversite Kent 2 2 Kır İlköğretim Kent Kır 4 4 Kadın Lise Kent 1 1 Kır Üniversite Kent Kır 1 1 Toplam *Güven Düzeyinin altındaki rakamlar şu şekilde ifade edilmektedir. 1= Tamamen Güveniyorum 2= Güveniyorum 3=Güvenmiyorum 4=Hiç Güvenmiyorum

27 11 Bilindiği üzere bu tip çapraz tablolarda değişkenler arasındaki ilişkiler, ki-kare analizi ya da basit uyum (simple correspondance) analizi yardımıyla, yalnızca iki değişkeni içerecek şekilde incelenebilmektedir. Değişken sayısının üç ve daha fazla olduğu durumlarda ise, bu teknikler kullanılamamaktadır. Optimal ölçekleme teknikleri 3 ve daha fazla kategorik değişkenden oluşan veri setlerine ilişkin kategorik değişkenleri sayısallaştırarak ve bir kayıp fonksiyonu yardımıyla verilerin çok değişkenli bir şekilde analiz edilmesine imkan sağlamaktadır. Optimal ölçeklemenin nasıl işlediğinin anlamak için, optimal ölçeklemede temel matris olarak kullanılan ve analizlerin başlangıç noktası kabul edilen G gösterge matrisi Çizelge 2.4 te verilmiştir. Çizelge 2.4. G gösterge matrisi (indikatör matris) Sıra Cinsiyet Eğitim İkamet Güven Düzeyi* Nu. E K İÖ LİSE ÜNİ. KENT KIR Toplam *Güven Düzeyinin altındaki rakamlar şu şekilde ifade edilmektedir. 1= Tamamen Güveniyorum 2= Güveniyorum 3=Güvenmiyorum 4=Hiç Güvenmiyorum G matrisi şu şekilde yorumlanabilir. Örneğin, birinci bireyin cinsiyet bakımından 1 değerini alması o bireyin erkek olduğunu, eğitim düzeyi açısından ilköğretim mezunu olduğunu, ikamet yeri olarak kentte yaşadığını ve kurumlara güven açısından kurumlara tamamen güvendiğini belirtmektedir. Bu anlamda j değişken sayısı olmak üzere, G j matrisi, ilgilenilen satır ya da sütun, j. değişkenin özelliğini gösterdiğinde 1, göstermediğinde ise 0 değerini alan bir matris olarak bilinmektedir. Burada n ilgilenilen nesne (gözlem) sayısı, k J

28 12 ise değişken kategorilerini göstermek üzere G j (n x k J ) matrisi, her bir değişkene ilişkin bilgilerin yer aldığı ve tüm nesnelerin ilgilenilen değişkeninin hangi kategorisinde yer aldığını belirten binary (0-1) bir matris olarak tanımlanmaktadır. G j matrisinin elemanları (i = 1,2,., n, r = 1,2,, k J ) olmak üzere g (j)(ir) = 1 g (j)(ir) = 0 i. gözlem j. değişkenin r.kategorisinde ise i. gözlem j. değişkenin r. kategorisinde değilse biçiminde oluşturulmaktadır. Tüm değişkenler için hesaplanan G j matrislerinin birleştirilmesiyle, analizdeki tüm değişkenlerin yer aldığı ve Çizelge 2.4 te verilen G (n x k j ) süper matrisi oluşturulabilmektedir. Yukarıda anlatılan G matrisinde bireylere ilişkin tüm bilgiler yer almaktadır, ancak bu bilgi kısıtlı olmaktadır. Bu matris, her bir değişkenin kendi içindeki özelliği taşıyıp taşımadığını belirtmekle birlikte tek bir özelliği yansıtmaktadır. Veri setinin daha detaylı incelenmesini sağlayan bir diğer matris ise, tekli marjinaller matrisi olarak adlandırılan D matrisidir. D matrisinin köşegen elemanlarında her bir değişken kategorisinin kaç kez tekrarlandığı bilgisi yer almaktadır. Her bir değişken için köşegenlerinde marjinal frekansları içeren D J matrisi hesaplanabilmektedir. Her bir değişken kategorisi için hesaplanan D j matrislerinin birleştirilmesiyle, analizdeki tüm değişkenlerin yer aldığı ve Çizelge 2.5 te verilen D ( k j x k j ) matrisi oluşturulabilmektedir D matrisinin köşegen elemanlarında her bir kategorinin gözlenme sıklıkları yer almaktadır. Örneğin elimizdeki veri setinde 15 bireyin 7 sinin cinsiyeti erkek, 8 inin ise kadındır. Diğer değişkenlerin kategorileri de bu şekilde çizelgede görülebilmektedir.

29 13 Çizelge 2.5. D tekli marjinaller matrisi D Matrisİ Cinsiyet Eğitim İkamet Güven Düzeyi E K İÖ LİSE ÜNİ. KENT KIR Cinsiyet E K İÖ Eğitim LİSE ÜNİ İkamet KENT KIR Güven Düzeyi C = G G şeklinde hesaplanan k j x k j boyutlu matris ise, veri kümesindeki değişkenlerin ikili kombinasyonlarının kaç kez tekrarlandığı bilgisini içeren ve aynı zamanda homojenlik analizindeki hesaplamalarının alt yapısını oluşturan ve ikili marjinaller matrisi olarak bilinen bir diğer matristir. Bu matris, BURT Matrisi olarak da bilinmektedir (Greenacre, 1993). İkili marjinaller matrisi, köşegenlerindeki blokların kare matris olduğu ve köşegen elemanlarında her bir değişkenin kategorilerine ilişkin sıklık bilgisinin, köşegen dışındaki bloklarda ise değişkenler arasındaki ikili ilişkilerin yer aldığı bir matristir. C Matrisi iki yönlü çapraz tablo olduğu için, üç yönlü ve daha büyük mertebeden etkileşimler grafiksel gösterimde yer almaz. Bunun yerine çeşitli iki yönlü tablolar eş anlı olarak analiz edilir (Alpar, 2013: ).

30 14 Çizelge 2.6. C ikili marjinaller matrisi Cinsiyet Eğitim İkamet Güven Düzeyi E K İÖ LİSE ÜNİ. KENT KIR Cinsiyet E K İÖ Eğitim LİSE ÜNİ İkamet KENT KIR Güven Düzeyi C matrisi, Çizelge 2.6 da görüldüğü üzere köşegenlerinde D matrisinin bilgilerini de içermektedir, diğer satırlarında ise, o değişkenin diğer değişkenlerle ikili kombinasyonlarını göstermekte ve dolayısıyla veri seti hakkında daha kapsamlı bir bilgi sunmaktadır. Örneğin D matrisinde 7 bireyin erkek 8 inin ise kadın olduğu bilgisine ulaşılmaktadır. Görüldüğü üzere bu bilgi, C matrisinin köşegen elemanlarında mevcuttur. Ayrıca, erkek olan 7 bireyden 3 ünün ilkokul mezunu, 2 sinin lise mezunu olduğu ve 2 sinin de üniversite mezunu olduğu görülmektedir. Aynı şekilde 8 kadın bireyin, 4 ünün ilkokul mezunu, 1 inin lise mezunu 3 ünün ise üniversite mezunu olduğu bilgisine ulaşılabilmektedir. Yani tüm değişken kategorileri arasındaki ikili ilişkiler C matrisinde yer almaktadır (Gifi, 1996:67-68).

31 Homojenlik analizinde sayısallaştırma işlemi Optimal ölçeklemede değişkenler arasındaki ilişkiler incelenirken, değişkenlerin orijinal kategorik hali değil, doğrusal olmayan dönüşümlerle sayısal hale getirildikten sonraki hali ile analiz sürecine devam edilmektedir. Aşağıda sayısallaştırma işleminin ne şekilde yapılacağı ve özelikleri anlatılacaktır. n sayıda gözlemin değişkenlerine ilişkin k j sayıdaki kategorisinin sayısallaştırılması, k j kategorilerinin y j vektöründeki sayısal değerleri yardımıyla yapılmaktadır. Her bir değişken kategorisine ilişkin sayısallaştırma işlemi, p boyut sayısı ve sayısallaştırılmış değişken q j (n x p) olmak üzere, n boyutlu bir vektör olarak aşağıdaki şekilde ifade edilmektedir. q j = G j y j (j = 1,2,., m) Burada G j (n x k J ) matrisi, her bir değişkene ilişkin bilgilerin yer aldığı ve tüm nesnelerin ilgilenilen değişkeninin hangi kategorisinde yer aldığını belirten binary (0-1) bir matristir. Analizde yer alan j değişkenlerine ilişkin q j vektörlerinin ortalaması x; m değişken sayısını göstermek üzere, x = qj m şeklinde ifade edilmektedir. Buradan hareketle, y j (k j x p) vektörü; D J (k j x k j ); j. değişkenin tekli marjinaller matrisi ve G J ; j. değişkenin gösterge matrisi olmak üzere, y j = D j 1 G j x biçiminde hesaplanmaktadır.

32 16 Sonuç olarak, her bir değişkene ilişkin kategori sayısallaştırmaları, q j = G j D j 1 G j x biçiminde ifade edilebilmektedir (Gifi, 1996:69-70). q j vektörü, optimal ölçekleme tekniklerinin alt yapısını oluşturan ve kategorik düzeyde ele alınan değişkenlerin kategorilerini sayısallaştıran bir matris olarak bilinmektedir. Optimal ölçeklemede daha sonraki aşamalar, bu sayısallaştırmalar yardımıyla yapılabilmektedir. Daha sonraki süreçte, değişkenlerin düzeylerine atanan bu sayısal değerler, iki boyutlu bir uzayda gösterilmekte ve optimal ölçekleme tekniklerinin en önemli avantajlarından biri olan görsel haritalar oluşturularak, değişkenler arasındaki ilişkiler bu grafikler yardımıyla incelenebilmektedir. Optimal ölçeklemede, sayısallaştırma işlemi tekli ya da çoklu olmak üzere iki şekilde yapılabilmektedir. Eğer değişkenler, sıralama düzeyinde ölçülmüş ise tekli sayısallaştırma yapılmaktadır. Tekli sayısallaştırmanın gerçekleştirilebildiği analizlerde, ölçek düzeyi kısıtları ve değişken kategorileri aralarındaki farklar belirlenebildiğinden aralıklı ve oransal ölçek türüne sahip değişkenlerin bulunduğu durumlarda da kullanılabilmekte ve tekrar bir sayısallaştırma yapılması gerekmemektedir. Diğer yandan, sınıflama düzeyinde ölçülen değişkenlerin kategorileri arasında bir üstünlük olmadığından, birden fazla (çoklu) sayısallaştırma işlemi yapılabilmektedir. Çoklu sayısallaştırma durumunda, analizlere ölçek kısıtları dahil edilememekte, her bir değişken için birbirinden bağımsız p adet sayısallaştırma yapılmaktadır. Yani analizin p boyutunda birbirinden farklı, bağımsız sayısallaştırmalar söz konusu ise çoklu sayısallaştırma, diğer durumlarda ise tekli sayısallaştırma yapılacaktır (Gifi, 1996:70; Michailidis ve de Leeuw, 1998:319) Homojenlik analizinde kayıp fonksiyonun hesaplanması Optimal ölçeklemeye dayalı doğrusal olmayan çok değişkenli teknikler için Albert Gifi kapsamlı bir bilgi sunmaktadır (Gifi, 1990). Gifi tekniklerinin başlangıç noktası kategorik verilere dayalı G gösterge matrisinin kullanılmasıdır. Bu matris kullanılarak kategorik yapıdaki değişkenler sayısallaştırılır. Daha sonra, bilinmeyen nesne ve kategori skorlarını

33 17 içeren kayıp fonksiyonu oluşturulur. Bir sonraki aşamada ise, kayıp fonksiyonu en küçük değerini alana kadar iterasyona devam edilir. Gifi tekniklerindeki temel amaç, değişkenleri çoklu bir şekilde ele aldığından oluşabilecek bilgi kaybını (açıklanamayan varyansı) en aza indirgemektir. Kategorik düzeyde ele alınan değişkenler için hesaplanan kayıp fonksiyonunu, iterasyonlarla optimum düzeye getirinceye kadar yapılan bu işleme optimal ölçekleme süreci adı verilmektedir (Mair ve de Leeuw, 2007). Homojenlik analizi, optimal ölçeklemeli çok değişkenli analiz tekniklerinin temelini oluşturmaktadır. Burada değişkenlere farklı kısıtlar uygulanması ile, optimal ölçeklemenin diğer türleri elde edilebilmektedir; fakat hepsinin başlangıç noktası yukarıda anlatılan ve homojenlik analizinin temelini oluşturan kayıp fonksiyonuna dayanmaktadır. Gifi sisteminde Dalgalı En Küçük Kareler (Alternating Least Squares) yöntemi uygulanarak, kategorik değişkenler optimal ölçekleme ile karakterize edilir. Geometrik açıdan incelendiğinde homojenlik analizi, düşük boyutlu bir uzayda nesneleri ve kategorileri haritalamayı amaçlamaktadır. Her bir gözlemin; analizde yer alan tüm değişkenlerin ilgili kategorileri ile bir bağlantısı (kenarı) bulunmaktadır. Amaç; bu kenar uzunluklarının kareler toplamını en küçük yapan bir grafik çizmektir (Michailidis ve de Leeuw, 1998:307; Bülbül ve Giray, 2012). Kenar uzunlukları, homojenlik analizi nde yer alan temel matrisler yardımıyla ifade edilmektedir. Bu temel matrisler; G j gösterge matrisi, y j kategori sayısallaştırmaları matrisi ve X nesne skorları matrisidir. Analize konu olan tüm nesneler satırlarda, j. değişkenin kategorileri ise sütunlarda gösterilmek üzere; G j matrisi tüm nesnelerin ilgilenilen değişkenin hangi kategorisinde yer aldıklarını belirten bir matristir. y j (k J x p) matrisi; j. değişkenin kategorilerine tayin edilen yeni ölçek noktalarının yer aldığı kategori sayısallaştırmaları matrisidir. X (n x p) matrisi ise, her bir nesnenin daha küçük boyutlu uzaydaki koordinatlarını gösteren ve kategori sayısallaştırmaları ve gösterge matrisleri baz alınarak hesaplanan ortalama nesne skorları matrisidir (Bülbül ve Giray, 2012).

34 18 Yukarıda tanımlanan temel matrisler yardımıyla bir kenarın uzunluğu, (X G 1 y 1 ) biçiminde ifade edilebilir. İlgilenilen nesnenin tam olarak tanımının yapılması için tüm değişkenlerin ilgili kategorilerine ilişkin (X G 1 y 1 ),.., (X G m y m ) uzunluklarının da dikkate alınması gerekmektedir. Herhangi bir nesnenin, toplam değişken sayısı olan m adet kenarı olacaktır. Herhangi bir kenar için temsili bir ifadeye [(X G 1 y 1 ) (X G m y m ) 2 ]/m şeklinde ulaşılabilir. Analizde, bu ifadenin en küçük değerini alması amaçlanmaktadır. Bir sonraki adımda verilen fonksiyon, σ(x: y 1,, y m )= m 1 m j=1( X G j y j ) 2 =m 1 m j=1 tr ( X G j y j ) (X G j y j ) aynı ifadenin farklı şekilde gösterimidir ve kayıp fonksiyonu olarak adlandırılmaktadır (Michidialidis ve de Leeuw, 1998:308) Homojenlik Analizinde ALS Algoritmasının Uygulanması Homojenlik analizinde, kayıp fonksiyonunu minimize etmek için Alternating Least Squares (Dalgalı En Küçük Kareler) yöntemi kullanılmaktadır. ALS yöntemi, homojenlik analizinde elde edilen kayıp fonksiyonunun minimize edilmesi için bir takım kısıtlar oluşturan ve bu

35 19 kısıtlar yardımıyla optimum fonksiyonu elde etmemize olanak sağlayan iteratif bir tekniktir. ALS yöntemine göre, X =0 ve y j =0 durumundan kaçınabilmek için; X X = ni ve u X = 0 kısıtları fonksiyona eklenmelidir. Burada u, elemanları 1 olan p boyutlu bir vektör olup, X matrisi ile çarpılmakta ve sonuç 0 çıkmaktadır. Bu kısıt, sütun ortalamalarının sapmalarını 0 yapmayı garantilemekte ve çizimlerin merkezinin orjine alınmasını sağlamaktadır. Diğer kısıtta ise, X nesne skorları matrisi kendi transpozu ile çarpılmakta ve kısıt gereği bu değer n e eşit çıkmaktadır. Böylelikle nesne skorlarının varyansının 1 olması ve nesne skorları değerlerinin birbirlerinden bağımsız olması sağlanacaktır. Kısıtlar ile nesne skorları, ortalaması 0 ve varyansı 1 olan standart normal değişkenler haline dönüştürülecektir. Bu nedenle bu kısıtlar normalizasyon kısıtları olarak bilinmektedir (Kooij, Meulman ve Heiser, 2006; Giray, 2011:69). ALS algoritmasına göre 3 adımda işlemler gerçekleştirilmektedir. Birinci adımda kayıp fonksiyonu, X değerleri sabit tutulup y j değerleri üzerinden minimum yapılmaya çalışılır. D j = G j G j olmak üzere D j y j = G j X eşitliği X değerleri sabit tutulduğunda y j= D j j G j X olarak elde edilir. İkinci adımda ise, kayıp fonksiyonu bu sefer y j ler sabit tutularak, X değerleri üzerinden minimize edilmekte ve,

36 20 m X = m 1 G j y j j=1 olarak elde edilmektedir. Algoritmanın üçüncü ve son adımında ise, X nesne skorları, sütun merkezli olarak merkezileştirilir ve Gram-Schmidt süreci kullanılarak; X = ngram (W) olmak üzere, W = X u(u X /n) biçiminde ortonormalleştirilir. Bu adımlar, kayıp fonksiyonu değerleri arasındaki farklar çok küçük bir sayıya ulaşıncaya kadar tekrar edilir. Yapılan bu işlemlere dalgalı en küçük kareler kullanılarak elde edilen homojenlik analizi adı verilmektedir (Michidialidis ve de Leeuw, 1998:309; Yazıcı, Öğüş, Ankaralı ve Gürbüz,2010) Optimal Ölçekleme Türleri ve Aralarındaki İlişkiler Optimal ölçekleme türleri, temel olarak çoklu uyum analizi (homojenlik analizi, karşılık getirme analizi), doğrusal olmayan temel bileşenler analizi, doğrusal olmayan kanonik korelasyon analizi ve kategorik regresyon analizi olarak bilinmektedir. Bu yöntemlerin her biri, optimal ölçekleme alt yapısını kullanarak analizlerin gerçekleştirilmesini sağlamakla birlikte aralarında benzerlikler ve farklılıklar bulunmaktadır. Bu bölümde, optimal ölçekleme türlerinin alt yapısını oluşturan basit uyum analizinden (simple correspondance analysis) kısaca bahsedildikten sonra, optimal ölçekleme türleri ve aralarındaki ilişkiler anlatılacaktır. Optimal ölçeklemenin temelini oluşturan ve iki kategorik değişken çifti arasındaki ilişkinin analiz edilmesine olanak sağlayan, aynı zamanda çoklu uyum analizin alt yapısını oluşturan analiz tekniği basit uyum analizi olarak bilinmektedir.

37 21 Basit uyum analizi, çapraz tabloların satır ve sütun değişkenleri arasındaki benzerlik ve farklılıkların yorumlanmasını sağlayan ve hangi kategorilerin daha benzer olduklarını bulmayı amaçlayan bir yöntemdir. Basit uyum analizinde, kategorik değişkenler arasındaki ilişkilerin daha küçük boyutlu bir uzayda analizi ve gösterimi amaçlanmaktadır. Basit uyum analizi, incelenen değişkenlerin kategorik özellik gösterdiği ve gözlem sayısının az olduğu durumlarda ki-kare analizi yerine kullanılabilmektedir (Uzgören, 2007; Suner ve Çelikoğlu, 2008). Uyum analizi, incelenecek değişken sayısının ikiden fazla olduğu durumlarda da kullanılabilmekte ve çoklu uyum analizi olarak adlandırılmaktadır. Çok boyutlu tablolar, bu analiz yardımıyla incelenebilmektedir. Çoklu uyum analizinin, basit uyum analizinden farkı, sadece değişken sayısı ile alakalı olmayıp, aynı zamanda optimal ölçekleme alt yapısını kullanarak analiz sürecine devam etmesidir. Ayrıca tekil değer ayrıştırması (singular value decomposition) olarak bilinen teknik ile de çoklu uyum analizi hesaplamaları yapılabilmektedir. Optimal ölçekleme tekniklerinin en basit hali, çoklu uyum analizi (homojenlik analizi ) (homogenity analysis) olarak bilinen tekniktir. Homojenlik analizinde sadece sınıflama düzeyinde ölçülen değişkenler arasındaki ilişkiler ele alınmaktadır (Meulman ve Heiser, 2012:55). Analizde, nesnelere ve değişkenlerin kategorilerine sayısal değerler atanarak, kategorik veriler sayısallaştırılmaktadır. Böylelikle, aynı kategorideki nesneler grafikte birbirine yakın yerlerde konumlanmakta; farklı kategorilerdeki nesneler ise birbirlerinden uzak yerlerde yer almaktadır (Bayram ve Ertaş, 2001). Homojenlik analizi Gifi tekniklerinde HOMALS olarak bilinmektedir. Optimal ölçeklemenin bir diğer türü ise, doğrusal olmayan temel bileşenler analizi (nonlinear principal component analysis) dir. Doğrusal olmayan temel bileşenler analizinde, homojenlik analizinden farklı olarak hem sıralama, hem sınıflama hem de oransal düzeyde ölçülen değişkenler arasındaki ilişkiler test edilebilmektedir. Doğrusal olmayan temel bileşenler analizi, aralarında doğrusal olmayan ilişki bulunan nümerik ve kategorik değişkenleri içeren veri kümeleri için sayısal ve görsel sonuçlar veren bir boyut indirgeme yöntemidir. Doğrusal olmayan temel bileşenler analizi, öncelikle değişkenleri

38 22 birbirinden bağımsız olacak şekilde daha küçük bir kümeye indirgemekte ve orijinal verideki bilginin önemli bir kısmını dikkate almaktadır (Bayram ve Ertaş, 2001). Analizin işleyişindeki temel mantık, temel bileşenler analizindeki gibi boyut indirgemek ve açıklanamayan varyansı mümkün olduğunca minimuma düşürmektir. Analiz, Gifi tekniklerinde PRINCALS olarak adlandırılmaktadır. Değişkenler farklı değişken kümeleri şeklinde ele alınıp, bu kümeler arasındaki ilişkiler incelenmek istenirse bu sefer de doğrusal olmayan kanonik korelasyon analizi (nonlinear canonical correlation analysis) kullanılabilmektedir. Doğrusal olmayan kanonik korelasyon analizinde hem kategorik hem de sayısal değişken türleri arasındaki ilişkiler incelenebilmektedir. Doğrusal olmayan kanonik korelasyon analizinde, değişkenlerin kendi aralarındaki korelasyonları kullanmak yerine, değişkenleri kümeler halinde ele alıp, kümeler arasındaki korelasyonlar analiz edilmekte ve kümeler arasındaki benzerlikler araştırılmaktadır. Analiz, Gifi tekniklerinde OVERALS olarak adlandırılmaktadır. (Meulman ve Heiser, 2012:40). Doğrusal olmayan kanonik korelasyon analizinde, eğer kümelerden birinde yalnızca tek bir değişken varsa ve bu değişken bağımlı değişken olarak ele alınıp diğer kümedeki değişkenler ise bağımsız değişkenler olarak belirlenirse, bu sefer de analiz kategorik regresyon (categorical regression) analizine dönüşecektir. Kategorik regresyon, optimal ölçekleme tekniklerine dayanan ve Gifi tekniğine göre geliştirilmiş çok değişkenli bir analiz tekniğidir. Bu teknik, Gifi sisteminde CATREG olarak bilinmektedir. CATREG, değişken kümelerinin birinde tek bir nümerik değişkenin bulunduğu, doğrusal olmayan kanonik korelasyon analizi ile benzerlik göstermektedir (Cengiz, 2008; Meulman ve Heiser, 2012:15). CATREG, kategorik değişkenlerin dönüşümlerle nümerik hale getirilmesiyle, doğrusal regresyon analizi ile eş hale gelmektedir (Capretz ve Ho, 2010). Kategorik regresyon analizi optimal ölçekleme alt yapısına dayandığından dolayı çalışmanın ilk bölümünde optimal ölçekleme teknikleri ve özellikleri anlatılmaya çalışılmıştır. İkinci bölümde ise, kategorik regresyonun amaçları, geçmişi, formülasyonu ve literatürde şimdiye kadar kategorik regresyon hakkında yapılmış çalışmalar aktarılmaya çalışılacaktır.

39 23 3. KATEGORİK REGRESYON ANALİZİ 3.1. Kategorik Regresyon Analizinin Amacı ve Tarihçesi Pek çok istatistiksel analiz, değişkenler arasındaki doğrusal ilişkilere dayanmaktadır. Kişi yaşlandıkça, kan basıncı artar şeklindeki bir varsayımı doğrusal ilişkilerle açıklayabiliriz; fakat, kan basıncı aşırı yüksek ya da aşırı düşük olduğunda migren hastalığı ile karşılaşma sıklığı artar şeklinde doğrusal olmayan bir ilişki içeren bir varsayım işin içerisine girdiğinde, doğrusal ilişkiye dayanan regresyon modelleri ile çok etkin çözümler üretmek mümkün olmamaktadır (Nishisato, 2004:3). Doğrusal modeller anlaması, yorumlaması ve uygulaması kolay ve basit modeller olmasına rağmen, bağımsız değişkenlerin kategorik, bağımlı değişkenin ise nümerik olduğu durumlarda, normallik, varyans homojenliği, geniş örneklem çapı ve değişkenler arasında otokorelasyon olmaması gibi varsayımların sağlanması zorlaşmaktadır. Bununla birlikte, doğrusal modellerle karşılaştırıldığında daha karmaşık olan ve optimal ölçekleme gibi daha ayrıntılı incelemeyi içeren kategorik regresyon analizinin kullanılmasının bir çok avantajı olduğu bilinmektedir. Öncelikle kategorik regresyon analizi çok az varsayıma dayanmaktadır. Örneğin, kategorik regresyonda değişken kategorileri eş anlı olarak kodlandığı için, örneklem çapının doğrusal modellerdeki kadar geniş olmasına gerek duyulmamaktadır. Ayrıca, bağımsız değişken düzeyinin p adet olduğu doğrusal bir modelde p-1 adet değişken düzeyi katsayısı tahmin edilmesi gerekirken, kategorik regresyonda tek bir katsayının tahmini yeterli olmaktadır. Üstelik doğrusal modeller, sadece doğrusal ilişkilerin bulunduğu durumlarda kullanılırken, kategorik regresyon doğrusal olmayan ilişkilerin bulunduğu veri setlerinde de kullanılabilmektedir (Shrestha, 2009). Optimal ölçeklemeye dayalı kategorik regresyon analizi, değişkenler arasında hem doğrusal hem de doğrusal olmayan ilişkilerin bulunduğu, bağımlı değişkenin kategorik biçimde olduğu durumlarda kullanılabilen çok değişkenli bir tekniktir. İşleyişindeki varsayımların azlığı nedeniyle de sosyal bilimlerde sıklıkla kullanılan bir regresyon modelidir.

40 24 Andrews ve Messenger (1973) tarafından ileri sürülen ve çok değişkenli nominal ölçek analizinin özelliklerinin anlatıldığı çalışma, kategorik regresyonun temellerinin atıldığı ilk çalışma olarak bilinmektedir. Daha sonra Bernhardt ve Kinnear (1976), kategorik regresyon adını ilk defa literatürde kullanarak, çok değişkenli nominal ölçek analizinin pazarlama araştırmalarında kullanılabileceğini ve alternatif tekniklere göre bu analizin daha iyi sonuçlar ürettiğini belirtmişlerdir. Kategorik değişkenlerin dönüştürülmesi ve analizlere dahil edilmesi, geçmiş dönemlerde istatistiksel çalışmalarda önemli bir yer tutmuştur yılında geliştirilen ve parametrik dönüşümler kullanan Box-Cox modeli, monoton dönüşümleri içeren daha genel modeller (Kruskal, 1965), Young ve ark. (1976) tarafından geliştirilen MORALS (Multiple optimal regression via alternating least squares) olarak bilinen model ve daha birçok çalışma dönüştürülmüş değişkenlerin regresyon analizinde kullanılabileceğini göstermektedir (Kooij ve ark, 2006). Yukarıda anlatılan ve dönüştürülmüş kategorik değişkenlerin regresyon analizinde kullanılmasına imkan sağlayan birçok farklı teknik olmakla birlikte, Gifi (1990) tarafından ortaya atılan ve Kooij, Meulman ve Heiser tarafından daha ayrıntılı çalışmalarla geliştirilen kategorik regresyon analizi son yıllarda daha sık kullanılmaya başlamıştır. CATREG daha az varsayım gerektirmesi, uygulama alanının geniş olması ve bilgisayar programlarında da uygulamasının yapılabilmesi sebebiyle, daha çok kategorik verilerin bulunduğu sosyal bilim çalışmalarında kullanılabilecek etkin bir regresyon modeli olmaktadır (Cengiz,2008). Son yıllarda CATREG analizi kullanılarak yapılan çalışmalardan bazıları aşağıda özetlenmiştir. Wu (1993) yaptığı çalışmada, daha çok analitik kimyada kullanılan istatistiksel teknikleri içeren kemometri (chemometris) çalışmalarında kategorik regresyon analizinin de kullanılabileceğini göstermiştir. Cecil (2006) yaptığı çalışmada daha çok Kanada ve Amerika da öğrencilerin kendi okullarına bağlılığını ölçmek için kullanılan ve NSSE (National Survey of Student Engagement) testi olarak bilinen teste verdikleri cevaplarla, yine öğrencilerin eleştirel

41 25 düşünme performasını ölçen ve CAT (Critical Thinking Assesment Test) olarak bilinen teste verdikleri cevaplar arasında bir ilişki olup olmadığını kategorik regresyon analizi ile incelemeye çalışmıştır. Duran (2007) yaptığı çalışmada, kategorik regresyon analizini kullanarak hastanelerdeki kalite yönetimiyle, hizmet kalite performansı arasındaki ilişkiyi incelemeye çalışmıştır. Shrestha (2009) yaptığı çalışmada, mutfaklardaki hava kirliliğini etkileyen faktörleri kategorik regresyon yardımıyla incelemiş ve CO seviyesi, evin türü ve ventilasyon durumunun mutfaklardaki PM10 gazı oranını etkilediğini tespit etmiştir. Lanzotti, Tarantino ve Matrone (2009) yaptıkları çalışmada, yeni bir ürün tasarlanırken yararlanılan Kansei mühendisliğinin bir uygulamasını yapmış ve Kansei mühendisliği uygulamalarında hem kategorik regresyon hem de lojistik regresyon analizinin kullanılabileceğini belirtmişlerdir. Uygulamada, küçük farklılıklar olmakla birlikte, yöntemlerin benzer sonuçlar verdiğini saptamışlardır. Cengiz (2008) yaptığı çalışmada, kategorik regresyon yardımıyla öğrencilerin benlik saygılarını etkileyen değişkenleri belirlemeye çalışmış ve öğretmenin çalışma süresinin ve kendi mesleği dışında bir iş yapmamasının, öğrencilerin benlik saygısını etkileyen önemli faktörler olduğunu ortaya çıkarmıştır. Ramos ve Carvalho (2011) yaptıkları çalışmada, yükseköğretimde sayısal ağırlıklı derslerdeki (istatistik, muhasebe, temel matematik vb.) başarının hangi etkenlere bağlı olduğunu ölçmeye çalışmış ve cinsiyet, öğrencinin üniversitede kaçıncı senesi olduğu ve öğrencilerin öğrenim gördüğü bölümün önemli faktörler olduğunu saptamışlardır. Schlegel, Krezel ve Mc Manus (2011) yaptıkları çalışmada kategorik regresyon analizi ve yapay sinir ağlarını kullanarak, Avustralya da insanların ikamet ettiği konutların hangi risk faktörleriyle ilişkili olduğunu incelemeye çalışmışlardır. Ponnam, Sahoo ve Balaji (2011) yaptıkları çalışmada, Hindistan fast-food sektöründe müşteri memnuniyetini etkileyen faktörlerin neler olduğunu incelemiş ve yemeğin lezzeti,

42 26 hızlı servis süresi, servis edilen yemeğin bol olmasının, değişen menülerin ve tematik mekanın müşteri memnuniyetini etkileyen önemli değişkenler olduğunu tespit etmişlerdir. Ready (2012) yaptığı çalışmada, gazetelerin sarı sayfalarında verilen iş ilanlarının, okuyucular tarafından nasıl algılandığını ve hangi özelliklere sahip ilanların daha fazla geri dönüş aldığını belirlemek için kategorik regresyon analizini kullanmış ve verilen ilanın puntosunun büyüklüğünün, renginin, başlığının ve ilanın görünüm tipinin etkili değişkenler olduğunu belirlemiştir. Altaş ve Giray (2013) yaptıkları çalışmada, Dünyadaki en önemli sorun algısını kategorik regresyon ve homojenlik analizi ile incelemiş ve yaş, eğitim ve gelir düzeyi değişkeninin, Dünya daki en önemli problem algısı üzerinde anlamlı bir etkiye sahip olduğunu, cinsiyet değişkeninin ise anlamlı bir etkisinin olmadığını saptamışlardır. Çilan ve Can (2014) yaptıkları çalışmada, MBA öğrencilerinin akademik performansını etkileyen değişkenlerin neler olduğunu belirlemek için kategorik regresyon analizini kullanmış ve yaş, derslere katılım oranı, lisans mezuniyet puanı, ALES Puanı ve medeni durum değişkenlerinin öğrencilerin akademik performanslarını etkilediğini tespit etmişlerdir. Gürdal (2014) yaptığı çalışmada, geliştirilecek bir telefon için çeşitli özellikler belirlemiş ve bu özelliklerden hangilerinin daha önemli olduğunu saptamak için kategorik regresyon analizini kullanmıştır. Koeppe (2014) yaptığı çalışmada, Yedinci Gün Adventist (Seventh-Day Adventist) kilisesi olarak bilinen ve Protestan Hristiyan Mezhebine bağlı olan kişilerin psikoloji, danışmanlık ve ruh sağlığı ile ilgili görüşlerini ve tavırlarını ortaya çıkarabilmek amacıyla kategorik regresyon analizini kullanmıştır. Rouse (2014) yaptığı çalışmada, kategorik regresyon analizini kullanarak, sürücü adaylarının sınavı geçmelerinde etkili olan faktörlerin neler olduğunu belirlemeye çalışmıştır.

43 Kategorik Regresyonda Kayıp Fonksiyonu Doğrusal regresyon modellerinde değişkenler genellikle nümerik olmakta, kategorik değişkenler ise ikili ya da çoklu bir biçimde kodlanarak analize dahil edilebilmektedir. Kodlanan bu değişkenlerin her biri için bir katsayı tahmin edilmekle birlikte, değişken düzeyleri rasgele kodlanmaktadır. Kategorilerin bu şekilde keyfi olarak kodlanması, her bir model için farklı bir sonuç verecek ve bu da yapılacak yorumların farklılaşmasına ve doğru modelin seçiminde zorluk meydana gelmesine neden olacaktır (Cengiz, 2008; Meulman ve Heiser, 2012:40). Bu tür değişkenlerden oluşan veri setlerinde kategorik regresyon analizi tercih edilmektedir. Kategorik regresyon analizi, değişken düzeylerindeki dönüşümlerin doğrusal olmaması sebebiyle, doğrusal regresyon gibi çalışmamaktadır. CATREG değişkenlerin kategorik yapıda olduğu durumlarda kullanılmaktadır. Şayet değişkenler kategorik yapıda değilse, bu durumda değişkenler için kategorileştirme yapılması sağlanmalıdır. Kategorik regresyon analizinde değişkenler, orijinal kategorilerinin özelliklerini yansıtacak şekilde sayısallaştırılmakta ve sayısallaştırılan bu değişkenler nümerik değişkenler gibi regresyon modelinde yer almaktadır. Sayısallaştırma sürecinde en uygun regresyon denkleminin elde edilmesi amaçlanmaktadır. En uygun modeli bulmak için ise doğrusal olmayan dönüşümler uygulanmaktadır. Bu dönüşümler, bağımsız değişkenler ile bağımlı değişkenler arasındaki ilişkiyi maksimum yapacak şekilde tasarlanmaktadır (Kooij ve ark, 2006; Meulman ve Heiser, 2012:40). Kategorik regresyon, optimal ölçekleme alt yapısına dayanan ve dönüştürülmüş değişkenlere uygulanabilen çok değişkenli bir regresyon tekniğidir. Kategorik regresyon tekniği, değişkenlerin doğrusal olmayan dönüşümlerine dayanmaktadır. Kategorik değişkenler, en uygun regresyon katsayılarına ulaşabilmek için, optimal ölçekleme altyapısı kullanılarak sayısal hale dönüştürülmektedir. Değişkenler sayısallaştırıldıktan sonra, regresyon katsayılarının tahmini, doğrusal regresyondakine benzer şekilde yapılmaktadır. Kategorik regresyon sürecinde öncelikle sayısallaştırmalar yapılmakta ardından regresyon katsayıları tahmin edilmekte ve kayıp fonksiyonu hesaplanmaktadır. Daha sonra bir önceki adımda elde edilen kayıp fonksiyonu ile karşılaştırma yapılarak

44 28 aralarındaki fark anlamsız oluncaya kadar iterasyonlar devam etmekte ve amaç fonksiyonunun optimizasyonu sağlandığında iterasyonlar durdurulmaktadır (Kooij ve ark, 2006; Cengiz, 2008). Kategorik regresyonda kayıp fonksiyonu, m m σ(y r ; b; y j ) = (G r y r b J G j y j ) (G r y r b J G j y j ) j=1 j=1 biçimindedir. Burada, j (1,2, m) bağımsız değişkenler, r ise bağımlı değişken olmak üzere ve y r : Bağımlı değişken için kategori sayısallaştırmalarını y j : Bağımsız değişkenler için kategori sayısallaştırmalarını b j : j. değişken için regresyon katsayısını G r : Bağımlı değişken için 0 ve 1 değerlerinden oluşan G gösterge matrisini G j : Bağımlı değişken için 0 ve 1 değerlerinden oluşan G gösterge matrisini göstermektedir. Modelin kayıp fonksiyonu, 0 öklit normu (uzaklığı) kullanılarak da ifade edilebilmektedir. Bunun amacı, tüm dönüştürülmüş değişkenlerin merkezileştirilmesi ve kareler toplamının N olacak şekilde normlaştırılmasıdır. Burada, N toplam gözlem sayısını ifade etmektedir. Bir önceki bölümde anlatılan sayısallaştırma formülüne bakıldığında, sayısallaştırma vektörü y j ve gösterge matrisi G j dikkate alınarak her bir değişken için dönüşüm formülü hesaplanmaktadır. Öklit normu üzerinden kayıp fonksiyonu yazıldığında, q r = G r y r bağımlı değişken ve q j = G j y j bağımsız değişken sayısallaştırmalarını göstermek üzere;

45 29 2 m L (q r : q 1, q j : b 1,, b j ) = G r y r b j G j y j şeklinde de ifade edilebilmektedir. j=1 Kategorik regresyonda ALS algoritması yardımıyla; sayısallaştırmalar tekrardan yapılmakta ve katsayılar hesaplanmaktadır. Kayıp fonksiyonu minimum değerine ulaştığında iterasyonlar durdurulmaktadır (Kooij ve ark, 2006) Kategorik Regresyona ALS Algoritmasının Uygulanması Kategorik regresyon algoritması iki adımdan oluşmaktadır. İlk adımda bağımsız değişkenin sayısallaştırma vektörü ve regresyon katsayıları sabit tutularak bağımlı değişkenin sayısallaştırma vektörü tahmin edilir. Bilindiği üzere, optimal ölçeklemede sayısallaştırma yapılırken değişkenlerin ölçme düzeyleri dikkate alınarak, tekli ya da çoklu şekilde sayısallaştırmalar yapılabilmektedir. Kategorik regresyon analizinde bağımlı değişken nominal olduğunda, sayısallaştırma vektörü y r şeklinde gösterilmektedir. D r = G r G r bağımsız değişken kategorilerinin tekli marjinallerini içeren bir vektör olmak üzere, bağımlı değişken sayısallaştırmaları; m y r = D 1 r G r b j G j y j j=1 şeklinde hesaplanabilmektedir. Burada y r nominal düzeyde ölçülen değişkenler için standardize edilmemiş kategori sayısallaştırmalarını ifade etmektedir. Ordinal ya da nümerik değişkenler için sayısallaştırma yapılırken öncelikle nominal değişkenler için hesaplanan y r ye bir takım kısıtlar eklenmelidir. Ordinal değişkenler için, ağırlıklandırılmış monotonik regresyon (weighted monotonic regression (WMON)) yöntemi kullanılarak y r monotonik azalan hale getirilir. WMON yöntemi uygulandığında

46 30 kategori sayısallaştırmaları y r şeklinde gösterilmektedir. Nümerik değişkenler için ise, ağırlıklandırılmış doğrusal regresyon (weighted linear regression (WLIN)) süreci işletilerek y r kategori sayısallaştırmaları elde edilebilmektedir. Kategori sayısallaştırmalarına bu şekilde kısıtlar eklendikten sonra, y r kullanılarak sayısallaştırmalar; y r + = N 1/2 y r (y r D r y r ) 1/2 şeklinde elde edilebilmektedir. İkinci adımda ise, bağımlı değişkenin sayısallaştırma vektörü sabit tutularak bağımsız değişkenler ve regresyon katsayıları tahmin edilir. Bu yaklaşım literatürde backfitting olarak bilinmektedir. Bu yaklaşımı, Kruskal (1965), De Leeuw ve ark. (1976) ve Gifi (1990) analizlerde uygulamışlardır. Burada öncelikle tahmin edilen değişkenler için bağımsız değişkenlerin toplam katkısını gösteren m v = b j G j y j j=1 vektörü hesaplanır. Daha sonra j inci değişkenin sayısallaştırmasını belirlemek için, v vektöründen j inci değişkenin tahmin değerine katkısı çıkartılır, v j = v- b j G j y j Bir sonraki adımda nominal değişkenler için kategori sayısallaştırmaları; y j= (D j 1 G j ) (G r y r 0 v j ) şeklinde elde edilmektedir.

47 31 Ordinal ya da nümerik değişkenler için sayısallaştırma yapılırken bir önceki adımda gösterildiği üzere WMON ve WLIN süreçleri uygulanarak kısıtlar eklenir bu şekilde ordinal ve nümerik değişkenler için kategori sayısallaştırmaları y j + vektörü elde edilir. Daha sonra, regresyon katsayıları olan b j değerleri ; b j + = N 1 v jd j y j + şeklinde hesaplanır ve son olarak; j inci değişkenin güncelleştirilmiş katkısı tahmin değerine eklenir ve v= v j + b j + G j y j + değeri hesaplanır. Tüm bağımsız değişkenler bu şekilde güncellenene kadar, kategori sayısallaştırmaları ve regresyon katsayılarının hesaplanmasına devam edilir. Yukarıda anlatılan adımlar hesaplanan kayıplar arasındaki fark anlamsız oluncaya kadar tekrar edilir ve optimal katsayılara ulaşıldığında adımlar durdurulur (Kooij ve ark, 2006) Kategorik Regresyonda Açıklayıcılık Katsayısı R 2 ve ANOVA Tablosu Bağımsız değişkenlerin bağımlı değişkeni ne oranda açıklayabildiğini göstermek için kullanılan belirleyicilik katsayısı, kategorik regresyonda da hesaplanabilmektedir. Kategorik regresyonda açıklayıcılık katsayısı, N analizde kullanılan toplam nesne (gözlem) sayısı olmak üzere, R 2 = N 1/2 (G r y r ) v (v v) 1/2 şeklinde hesaplanmaktadır. Bu şekilde hesaplanan R 2 istatistiği aynı zamanda Çoklu (Multiple) R 2 olarak da adlandırılmaktadır.

48 32 Düzeltilmiş (Adjusted) R 2 istatistiği ise, u: 1 lerden oluşan p boyutlu vektör ve f serbestlik derecesi olmak üzere, Adj R 2 = 1 (1 R 2 )(N 1)(N 1 u f) şeklinde hesaplanmaktadır (IBM SPSS Algorithms, 2011:125). Kurulan regresyon modelinin anlamlı olup olmadığını test etmek için kullanılan ANOVA tablosu ise aşağıdaki şekilde kurulmaktadır. Çizelge 3.1. Kategorik regresyonda ANOVA tablosu Kareler Toplamı Serbestlik derecesi Kareler Ortalaması Regresyon NR 2 u f KO reg = NR2 u f Hatalar N(1 R 2 ) N 1 u f KO hata = N(1 R2 ) N 1 u f Toplam N N 1 F değeri KO reg KO hata 3.5. Kategorik Regresyonda Değişkenlerin Anlamlılığının Test Edilmesi Kategorik regresyonda modelde yer alan her bir değişkenin anlamlılığını test etmek için F istatistiği kullanılır. 1 R 2 Beta j = b j, SE(Beta j ) = ( ) 1/2 olmak üzere, (N 1 u f)t j F j = ( Beta j SE(Beta j ) ) 2 şeklinde hesaplanmaktadır. Hesaplanan bu değerler, F tablo değerleri ile karşılaştırılarak, değişkenlerin önemliliğine karar verilmektedir (IBM SPSS Algorithms, 2011: ) Dönüşüm Sonrası Korelasyon Matrisi Kategorik regresyonda modelde kullanılan bağımsız değişkenler arasındaki ilişkiler, korelasyon matrisi yardımıyla incelenebilmektedir. Bağımsız değişkenler arasındaki

49 33 korelasyonlara bakılarak, çoklu doğrusal bağlantı (ÇDB) problemi tespit edilebilmektedir. Aralarında yüksek korelasyon olan değişkenler, tutarsız tahminlere neden olmaktadır. Bu nedenle, aralarında yüksek korelasyon olan değişkenler belirlenerek ÇDB problemine yol açabilecek değişkenler analizden çıkarılmalıdır. Bilindiği üzere kategorik regresyonda değişkenlere bazı doğrusal olmayan dönüşümler uygulanarak analiz sürecine devam edilmektedir. Değişkenler arasındaki ilişkileri yansıtmak amacıyla oluşturulan korelasyon matrisi, q j = G j y j lerden oluşan yani j inci bağımsız değişken için oluşturulan sayısallaştırma değerleri ve olmak üzere, Q analizdeki tüm bağımsız değişken sayısallaştırmalarını kapsayan matris R = N 1 Q Q şeklinde oluşturulmaktadır. Aynı şekilde, orijinal bağımsız değişkenler arasındaki ilişkiyi veren korelasyon matrisi de değişkenlerin orijinal hallerinden yararlanılarak oluşturulabilmektedir. Dönüşüm yapılmış değişkenler arasındaki korelasyonlar daima orijinal değişkenler arasındaki korelasyonlardan yüksek çıkmaktadır. Bu da optimal ölçeklemede kullanılan algoritma ve kısıtlardan kaynaklanmaktadır (IBM SPSS Algorithms, 2011: ; Meulman ve Heiser, 2012: ) Kategorik Regresyonda Tolerans (Tolerance) Değeri Kategorik regresyonda hesaplanan tolerans değeri, modelde yer alan bağımsız değişkenlerin bağımlı değişkenle ne ölçüde ilişkili olduğunu yansıtmaktadır. R p, dönüştürülmüş bağımsız değişkenler arasında oluşturulan diyagonal bir korelasyon matrisi olmak üzere, j. değişkenin tolerans değeri

50 34 1 t j = r pjj şeklinde hesaplanmaktadır. Aynı şekilde orijinal bağımsız değişkenler arasındaki ilişkiyi yansıtan korelasyon matrisinden yararlanılarak, dönüşüm öncesi tolerans değerleri de hesaplanabilmektedir. 1 e yakın tolerans değerleri, bağımsız değişkenlerin bağımlı değişkeni iyi tahmin edemediğini göstermektedir. Öte yandan çok küçük tolerans değerlerine sahip değişkenlerin de, modele kısıtlı bir bilgi sağladığı ve hesaplamalarda problemlere yol açtığı görülmektedir (IBM SPSS Algorithms, 2011:127; Meulman ve Heiser, 2012:108) Kategorik Regresyonda Kullanılan Korelasyon Katsayıları Bağımsız değişkenlerin regresyon modeline katkısını yorumlamak için yalnızca regresyon katsayılarını yorumlamak yeterli değildir. Buna ek olarak, kategorik regresyonda değişkenler arasındaki ilişkilerin incelenebilmesi amacıyla, sıfır sıralı korelasyon, kısmi korelasyon ve kısım korelasyonu olmak üzere üç adet farklı korelasyon katsayısı hesaplanabilmektedir. Hesaplanan her bir korelasyon katsayısının, farklı yönleri ve özellikleri bulunmaktadır Sıfır sıralı (zero-order) korelasyon Kategorik regresyonda hesaplanan sıfır sıralı korelasyon değeri, dönüştürülmüş bağımlı değişken ile her bir dönüştürülmüş bağımsız değişken arasındaki ilişkiyi yansıtan bir ölçüdür. Kategorik regresyonda sıfır sıralı korelasyon, r rj = N 1 (G r y r ) G j y j şeklinde hesaplanmaktadır.

51 35 Bu korelasyon değeri, bağımlı değişken ile bağımsız değişkenler arasındaki ilişkinin derecesini yansıtmaktadır Kısmi (partial) korelasyon Bir regresyon modelinde birden çok bağımsız değişken bulunabilmektedir. Böyle durumlarda, modeldeki diğer bağımsız değişkenler, bağımlı değişkenin tahmininde ilgilenilen değişkenin modele katkısını azaltabilmektedir. Bu durumu ortadan kaldırmak ve ilgilenilen değişkenin tek başına modele ne oranda katkı sağladığını belirtmek üzere hesaplanan kısmi korelasyon katsayısı, diğer bağımsız değişkenlerin etkisi kaldırıldığında ilgilenilen bağımsız değişken ile bağımlı değişken arasındaki ilişkiyi yansıtmaktadır. Kısmi korelasyon katsayısı, hem bağımlı değişken hem de bağımsız değişkenden diğer bağımsız değişkenlerin doğrusal etkisini ortadan kaldırmaktadır. Kısmi korelasyonun karesi alındığında çıkan sonuç ise, diğer bağımsız değişkenler modelde yer almadığında o değişkenin bağımlı değişken üzerindeki değişimi tek başına hangi oranda açıklayabildiğini göstermektedir. b j, j. değişkenin katsayısı ve t j, j. değişken için hesaplanan tolerans değeri olmak üzere kısmı korelasyon katsayısı, Partialr j = b j (( 1 R2 1 ) + b 2 2 t j ) j şeklinde hesaplanmaktadır Kısım (part) korelasyon Hem bağımlı değişken hem de bağımsız değişkenden diğer bağımsız değişkenlerin doğrusal etkisini ortadan kaldırmak yerine, sadece ilgilenilen bağımsız değişkenden diğer bağımsız değişkenlerin etkilerini kaldırarak hesaplanan korelasyon katsayısı, kısım korelasyon olarak adlandırılmaktadır. Bu korelasyon katsayısının, kısmi korelasyondan farkı, yalnızca bağımsız değişkenden diğer bağımsız değişkenlerin etkisini kaldırmaktır. Dolayısıyla diğer bağımsız değişkenlerin bağımlı değişkene olan etkileri ortadan kaldırılmamaktadır. Kısım korelasyonun karesi alındığında çıkan sonuç, tıpkı kısmi

52 36 korelasyon gibi yorumlanmaktadır fakat, diğer bağımsız değişkenlerin bağımlı değişkene olan etkileri ortadan kaldırılmadığından, kısım korelasyon katsayısı, kısmi korelasyon katsayısından daima küçük çıkmaktadır. b j, j. değişkenin katsayısı ve t j, j. değişken için hesaplanan tolerans değeri olmak üzere, kısım korelasyon katsayısı Part j = b j t j 1/2 şeklinde hesaplanmaktadır (IBM SPSS Algorithms, 2011:127; Meulman ve Heiser, 2012: ) Kategorik Regresyonda Önemlilik (Importance) Katsayısı Regresyon katsayıları ve korelasyonlara ek olarak, Pratt in (1987) göreli önem derecesi ölçümü, bir regresyon modelinde hangi değişkenlerin katkısının daha fazla olduğunu belirleyebilmemize olanak sağlamaktadır. Bu katsayı, kategorik regresyon modelinde yer alan bağımsız değişkenlerin, ne ölçüde önemli olduklarını yani diğer bir deyişle önem düzeylerini yansıtmaktadır. Ayrıca, her bir değişken için hesaplanan önemlilik katsayılarının toplanmasıyla, modeldeki tüm bağımsız değişkenlerin modeli hangi oranda açıklayabildiğini hesaplamak amacıyla da kullanılabilmektedir. Bu katsayı -1 ile 1 arasında değer almaktadır veçok yüksek negatif önemlilik değerlerinin, çoklu doğrusal bağlantı problemi yaratabileceği ifade edilmektedir. Kategorik regresyonda hesaplanan önemlilik katsayısı; r 0 rj, sıfır sıralı korelasyon değeri ve b j, j. değişkenin katsayısı olmak üzere, Imp j = b j r 0 rj / R 2 şeklinde hesaplanmaktadır (IBM SPSS Algorithms, 2011:127; Meulman ve Heiser, 2012:108).

53 37 4. LOJİSTİK REGRESYON 4.1. Lojistik Regresyonla İlgili Genel Bilgiler Son yıllarda popüler olan ve özellikle sağlık bilimleri ve sosyal bilimlerle ilgili çalışmalarda sıklıkla kullanılan lojistik regresyon analizi, tıpkı doğrusal regresyondaki gibi bağımsız değişkenlerle bağımlı değişken arasındaki ilişkiyi açıklayabilmeyi amaçlamaktadır. Lojistik regresyon analizini diğer regresyon tekniklerinden farklı kılan özelliği, bağımlı değişkenin kategorik olmasıdır (Tabachnick ve Fidell, 2001:437). Lojistik regresyonu üstün kılan bir diğer özellik ise, normallik, varyans-kovaryans matrislerinin eşitliği, doğrusallık gibi varsayımların sağlanmadığı durumlarda da kullanılabilmesidir (Kalaycı, 2010:273). Sonuçların kolaylıkla yorumlanabilmesi de analizi avantajlı bir hale getirmektedir. Lojistik regresyon sağlık bilimlerinde hasta/hasta değil çıktısını elde etmek amacı ile kullanılırken, davranış bilimlerinde davranış bozukluğuna sahip/sahip değil, eğitim bilimlerinde başarılı/başarılı değil çıktılarının elde edilmesi amacı ile kullanılabilmektedir. Ayrıca, kategorik bir kriter tarafından üretilen doğrusal olmayan ilişkiler sürekli ve kategorik değişkenlere modellenebilir ve olasılık tahminleri hesaplanabilir (Hosmer ve Lemeshow, 2013). Lojistik Regresyon Analizi, sınıflama ve atama işlemi yapmaya yardımcı olan bir regresyon tekniğidir. Bu teknikle, bağımlı değişken üzerinde bağımsız değişkenlerin etkileri belirlenebilmektedir. Lojistik regresyonda amaç, iki ya da daha fazla gruba yapılan üyelik tahminidir. Yani, bireylerin hangi grubun üyesi olduğunu kestirmede kullanılabilecek bir regresyon modeli oluşturmak amaçlanmaktadır. Lojistik regresyon tekniğinde bağımlı değişkenin değerinin kestirilmesi ile ilgilenilmemektedir. Bunun yerine, bağımlı değişkenin 1 değerini alması olasılığı kestirilmeye çalışılmaktadır. Elde edilen sonuç bir olasılık değeri olduğu için sadece 0 ile 1 arasında değer alabilmektedir. Buna göre analizin amaçlarından biri, sınıflandırma, diğeri ise bağımlı ve bağımsız değişkenler arasındaki ilişkileri araştırmaktır (Alpar, 2013:645; Çokluk, Şekercioğlu ve Büyüköztürk, 2014:57-59).

54 38 Lojistik regresyon, bağımlı değişkenin yapısına göre üçe ayrılmaktadır. Bu modellerden İki kategorili (binary) lojistik regresyon, kategorik bağımlı değişkenin ikili (örn: müşteriye kredi verip vermeme) olduğu durumlarda kullanılmaktadır. Literatürde sıklıkla kullanılan lojistik regresyon yöntemi iki kategorili lojistik regresyon yöntemidir. Kategorik bağımlı değişkenin ikiden çok kategorili olduğu durumlarda ise çok kategorili (multinominal) lojistik regresyon modeli kullanılırken; çok kategorili ve sıralı bir yapı söz konusu ise (Örn: hastanın kanseri başlangıç düzeyinde, orta düzeyde, ileri düzeyde) sıralı (ordinal) lojistik regresyon modeli kullanılmaktadır (Alpar, 2013:703). Bilindiği üzere, doğrusal regresyon analizinde, bağımlı değişken nümerik olduğundan en küçük kareler yöntemi kullanılarak parametre tahminleri yapılmaktadır. Fakat, bağımlı ve bağımsız değişkenleri barındıran çoklu bir regresyon modelinde, bağımlı değişken kategorik olduğunda EKK tekniğiyle elde edilen tahminler yetersiz kalmaktadır. Bunun nedeni, tahmin edilen varyansların minimum olmaması ve regresyonda hesaplanan hataların normal dağılıma uymamasıdır. Böyle bir durumda, EKK tekniğine dayalı regresyon modeline alternatif olarak lojistik regresyon olarak bilinen teknik ile analizler yapılabilmektedir Yani, lojistik regresyon analizi, bağımlı değişkenin iki ya da fazla kategorili niteliksel veri tipinde olduğu ve hataların normal dağılıma uymadığı durumlarda çözümlemeler yapılmasına olanak sağlamaktadır (Kalaycı, 2010:273; Alpar, 2013:647) Lojistik Modelin Kurulması X: bağımsız değişkene ait veri matrisi olmak üzere X = x olduğunda tanımlanan olayın olma olasılığı (Y = 1), π olsun. Şayet π yi tanımlamak için doğrusal model kullanılırsa, π (x) = P (Y = 1 / X = x) = β 0 + β 1x + ε modeli elde edilir Fakat bu doğrusal fonksiyonun sonucu 0 ile 1 arasında sınırlı olmadığından, olasılığı modellemek için kullanılamaz.

55 39 Lojistik regresyon modellerini tahmin etmek için en sık kullanılan ve en iyi çözümler üreten teknik, en çok olabilirlik (maximum likelihood) tekniğidir. Lojistik regresyon analizinde, bağımsız değişkenlere göre bağımlı değişkenin kategorilerinin beklenen değerleri olasılık olarak elde edilir. Bu nedenle, parametre değerlerinin tahmininde doğrusal bir model elde etmek için lojistik fonksiyon kullanılır. Lojistik fonksiyon kullanıldığında Y nin 1 olma olasılığı: π (x)= P (Y=1 / X=x) = e β 0+ β1x 1+ e β 0+ β1x = 1 1+ e (β 0+ β1x) şeklinde hesaplanır. Yukarıda verilen ve doğrusal olmayan lojistik regresyon, lojit dönüşüm uygulandığında doğrusallaştırılabilmektedir. Lojit dönüşüm bir olayın odds unun doğal logaritması alınarak yapılır. Odds, herhangi bir olayın gözlenme olasılığının, gözlenmeme olasılığına oranı olarak tanımlanmaktadır. Odds oranı ise, iki oddsun birbirine oranı olmakta ve iki değişken arasındaki ilişkinin bir ölçüsü olmaktadır (Kleinbaum, 1994:19; Field, 2009). Yukarıda belirtildiği gibi bir olayın oddsu π/(1- π) ya da p/ (1 p) olarak verilir ve bu oran 0 ile sonsuz arasında değer alabilir. Lojit π (x) = g(x)=ln ( π (x) 1 π (x) ) Yukarıdaki şekilde, oddsların doğal logaritması alındığında yani lojit dönüşüm uygulandığında lojitler ile + arasında değer alabilmektedir. Lojistik regresyon modeli, yanıt değişkeninin odds u türünden π (x) 1 π (x) ) ( = eβ 0+ β 1 x şeklinde yazılabilir.

56 40 Odds un doğal logaritması alındığında ise model doğrusal hale dönüşmektedir. g(x)=ln ( π (x) 1 π (x) ) = ln eβ 0+ β 1 x = β 0 + β 1 x Eşitlikten de görüleceği üzere, lojit dönüşüm β parametrelerinin doğrusal bir fonksiyonunu oluşturmaktadır. Lojistik regresyon modelinin tek varsayımı da lojit ile bağımsız değişkenler arasındaki ilişkilerin doğrusal olmasıdır. Doğrusal regresyonda sonuç çıkarımı yapıldığı durumlarda, artıklar (residuals) 0 ortalama ve sabit varyansla normal dağılım gösterirken, lojistik regresyonda 0 ortalama ve dağılmaktadır (Alpar, 2013: ). π (1 π) varyansla binom 4.3. Lojistik Regresyonda Regresyon Katsayılarının Kestirimi Lojistik Regresyonda, regresyon katsayılarının kestirimi yapılırken genellikle en çok olabilirlik (maximum likelihood) yöntemi kullanılmaktadır. Bunun yanısıra minimum logit ki-kare yöntemi, ağırlıklandırılmış iteratif en küçük kareler yöntemi, diskriminant analiz yöntemi de katsayı kestirimlerinde kullanılmaktadır. Örneklemin sayısı arttıkça, EÇO yöntemi ile ağırlıklandırılmış iteratif EKK kestiricilerinin dağılım özellikleri iteratif olarak aynı olmaktadır. Diskriminant fonksiyon kestirim yöntemi ise, bağımsız değişkenlerin normal dağılım gösterdiği durumlarda kullanılmaktadır. Bağımsız değişkenler arasında kesikli değişkenlere sıkça rastlandığından normallik varsayımı çoğu zaman sağlanamamakta ve dolayısıyla katsayılar olduğundan daha büyük kestirilmektedir. Sonuç olarak regresyon katsayılarının kestiriminde pek çok yöntem olmasına rağmen en etkin, yansız ve tutarlı kestirimlerin EÇO yöntemi ile yapıldığı görülmektedir (Başarır, 1990:12-13; Alpar, 2013: ).

57 En çok olabilirlik yöntemi En çok olabilirlik fonksiyonu, lojistik fonksiyon yardımıyla aşağıdaki gibi elde edilmektedir. Bir olayın başarı olasılığı π, başarısız olma olasılığı ise 1-π olmak üzere i inci gözlem için başarı olasılığı, π (y i /x i ) = π i y i (1 π i ) 1 y i : 1,.,n şeklinde hesaplanmaktadır. Bu olasılık n adet gözlem için olabilirlik fonksiyonu olarak, L(y/x) = P (y/x i ) = π i y i (1 π i ) 1 y i n i=1 şeklinde yazılabilir. En çok olabilirlik yöntemi p adet bağımsız değişkene ilişkin β ların kestirimini sonuç değişkeni y nin gözlenme olabilirliğini maksimum yapacak biçimde bulmayı hedeflemektedir. Yani, β katsayılarının olabilirlik fonksiyonu L yi maksimum yapacak şekilde kestirmek gerekmektedir. Bu durumda lojistik modelin olabilirlik fonksiyonunun logaritması, n logl ( y x, β) = y ilog π i + (1 y i )log(1 π i ) i=1 şeklinde olup, bu denklemin β ya göre birinci türevi, n (y i π i )x ij = 0 i=1 j = 1,.., p olmak üzere, olabilirlik denklemini vermektedir.

58 42 Bu denklem yardımıyla iteratif bir yolla olabilirlik fonksiyonunu maksimum yapacak şekilde β kestirim değerleri elde edilmeye çalışılmakta ve yakınsama sağlandığında iterasyonlar durdurulmaktadır (Burmaoğlu, 2009:55-56) Lojistik Regresyonda Değişkenlerin Önemliliğinin Test Edilmesi Lojistik regresyon modelinde katsayı kestirimleri yapıldıktan sonra, modelde yer alan değişkenlerin önemlilikleri test edilmektedir. Yani varsayılan değişken modelde yer aldığında daha iyi ve daha doğru kestirimler elde edilebiliyorsa o değişkenin önemli olduğuna karar verilmektedir. Modeldeki değişkenlerin önemliliği, olabilirlik Oranı, Wald Testi İstatistiği ya da Skor testi ile incelenebilmektedir. Modeldeki bağımsız değişkenlerin hangilerinin modelde kalacağına bu istatistikler ile karar verilmektedir. Bu testler arasında en yaygın olarak kullanılanı ise Wald testi olarak bilinmektedir (Alpar, 2013: ; Field, 2009) Lojistik Regresyonda Uyum İyiliği Testleri Uyum iyiliği testleri, lojistik regresyon analizi sonucunda elde edilen modelin sonuç değişkenini tanımlamada ne kadar etkili olduğunu belirlemek için kullanılmaktadır. Modellerin uyum iyiliğinin belirlenmesinde, pearson ki-kare testi, sapma (deviance) istatistiği, Hosmer-Lemeshow testi ve doğru sınıflandırma tablosundan yararlanılmaktadır Lojistik Regresyonda Açıklayıcılık Katsayıları Lojistik regresyon analizinde modelin uyum iyiliğini belirlemek için çeşitli yalancı (pseudo) R 2 istatistikleri geliştirilmiştir. Lojistik regresyonda hesaplanan R 2 değerleri modele uyumun bir göstergesi olarak kullanılmakta ve alternatif modeller arasında hangi modelin daha uygun olduğunu belirleme amacı taşımaktadır. Doğrusal regresyonda hesaplanan R 2 değerleri ise, bağımsız değişkenlerin bağımlı değişkeni ne oranda açıklayabildiğini yansıtmaktadır. Lojistik regresyonda, doğrusal regresyondaki R 2 nin doğrudan bir karşılığı yoktur. Dolayısıyla aynı şekilde yorumlanamamaktadırlar. Lojistik regresyonda hesaplanan R 2 değerleri, doğrusal regresyondaki R 2 değerlerine kıyasla daha küçük çıkma eğilimindedirler. 0,20 ile 0,40 arasındaki bir R 2 değerinin bir modelin uyumu için yüksek

59 43 olduğu söylenebilir (Alpar,2013: ). Lojistik regresyonda, Mc Faden R 2, Nagelkerke R 2 ve Cox-Snell R 2 olmak üzere üç R 2 istatistiği hesaplanabilmekte ve benzer şekilde yorumlanmaktadır. Doğrusal regresyonda olduğu gibi logit R 2 değerleri de 0 ile 1 arasında değişmektedir. Bu değerler 1 e yaklaştıkça model uyumu iyileşmektedir Lojistik Regresyon ile Kategorik Regresyon Arasındaki Farklar ve Benzerlikler 1-) Hem lojistik regresyon hem de kategorik regresyon, bağımlı değişkeni kategorik olan modelleri açıklamak amacıyla kullanılmaktadır. Analizlerde yer alan bağımsız değişkenler ise, her iki modelde de nümerik ya da kategorik olabilmektedir. 2-) Lojistik regresyon odds oranları ve lojit model yardımıyla analiz sürecini devam ettirirken, kategorik regresyon optimal ölçekleme alt yapısını kullanmaktadır. Lojistik regresyonda maximum likelihood tahminleri elde edilirken, kategorik regresyon ise ALS algoritmasına dayanmaktadır. 3-) Lojistik regresyon analizinde bağımlı değişkenin tahmininden ziyade; bireylerin bağımsız değişkenin hangi kümesine (kategorisine) atanma olasılıkları ile ilgilenilmektedir. Kategorik regresyon analizinde ise, tıpkı doğrusal regresyonda olduğu gibi elde edilen model denklemi bağımlı değişkeni tahmin etmeyi amaçlamaktadır. 4-) Lojistik regresyonda hesaplanan yalancı (pseudo) R 2 değerleri, bağımsız değişkenlerin bağımlı değişkeni açıklama (yordama) gücünü yansıtmaktan ziyade, kurulan modellerden hangisinin daha iyi olduğuna karar vermek amacıyla kullanılmaktadır. Kategorik regresyonda hesaplanan çoklu (multiple) R 2 değeri ise, tıpkı doğrusal regresyonda olduğu gibi bağımsız değişkenlerin bağımlı değişkeni ne oranda açıklayabildiğini göstermektedir. 5-) Hem lojistik regresyonda hem de kategorik regresyonda hangi bağımsız değişkenlerin bağımlı değişkeni açıklayabildiğini, yani hangi değişkenlerin bağımlı değişken üzerinde anlamlı bir etkiye sahip olduğunu anlamamızı sağlayan F ve Wald istatistikleri hesaplanmaktadır. Kategorik regresyonda ise buna ek olarak önemlilik (importance) olarak bilinen başka bir istatistik ile değişkenlerin önemlilik derecesi belirlenebilmektedir.

60 44 6-) Sosyal bilimlerde yapılan çalışmalarda lojistik regresyon analizinin sıklıkla kullanılmasının sebebi, son derece az varsayıma dayanmasıdır. Kategorik regresyon da tıpkı lojistik regresyon gibi az sayıda varsayıma dayanmaktadır. Ancak özellikle ülkemizde, lojistik regresyonla ilgili birçok çalışma yapılmışken, kategorik regresyonla ilgili az sayıda çalışmanın olması dikkat çekmektedir.

61 45 5. UYGULAMA Çalışmanın bu bölümünde, Bilgiç ve Akyürek (2009) tarafından yapılan ve 8607 kişilik bir örneklem grubuna uygulanarak hazırlanan Güneydoğu Sorununun Sosyolojik Analizi isimli çalışmadaki veriden yararlanılmıştır. Adı geçen çalışmada, Türk Silahlı Kuvvetleri ve devletin diğer kurumlarına olan güven düzeyi ile çeşitli demografik değişkenler yer almaktadır Uygulamada Kullanılacak Veri Seti Bu bölümde, Türk Silahlı Kuvvetlerine duyulan güven ile çeşitli demografik değişkenler arasındaki ilişkiler, kategorik regresyon analizi ve sıralı lojistik regresyon analizi kullanılarak incelenmeye çalışılacaktır. Çalışmada ele alınan değişkenler ve özellikleri aşağıdaki çizelgede verilmiştir. Çizelge 5.1. Çalışmada kullanılan değişkenler Değişken Namaz Kılma Sıklığı Yaş Cinsiyet Medeni Durum Eğitim Durumu Değişken Kategorileri (1) Hiç Namaz Kılmam (2) Sadece Bayram ve Cuma Namazlarına Giderim (3) Günlük Namazlarımı Fırsat Buldukça Kılarım (4) Günlük Namazlarımı Tam Olarak Kılarım (1) (2) (3) (4) 55 üstü (1) Kadın (2) Erkek (1) Evli (2) Bekar (3) Dul-Boşanmış-Ayrı Yaşıyor (1) Okuryazar Değil (2) Okur-Yazar (3) İlköğretim (İlk-Orta Okul) (4) Orta Öğretim (Lise) (5) Ön Lisans-Lisans (6) Lisans Üstü Değişkenlerin Düzeyi Sınıflama Sıralama Sınıflama Sınıflama Sıralama

62 46 Çizelge 5.1. (devam). Çalışmada kullanılan değişkenler Değişken Konuşulan Dil Yaşanılan Yer Aylık Gelir Meslek Mezhep Bağımlı Değişken TSK ya Güven Düzeyi Değişken Kategorileri Değişkenlerin Düzeyi (1) Kürtçe (2) Türkçe Sınıflama (3) Arapça (4) Zazaca (1) Kırsal (2) Kent Sınıflama (1) TL (2) TL Sıralama (3) TL (4) 4000 TL ve Üzeri (1) İşsiz (2) Kamu Çalışanı (3) Özel Sektör İşçi (4) Serbest Meslek-Esnaf-Tüccar Sınıflama (5) Çiftçi (6) Ev Kadını (7) Öğrenci (1) Hanefi (2) Şafii Sınıflama (3) Alevi (1) Hiç Güvenmiyorum (2) Güvenmiyorum Sıralama (3) Güveniyorum (4) Tamamen Güveniyorum Çizelge 5.1 de yer alan değişkenlerden, TSK ya güven düzeyi bağımlı değişken, diğer 10 değişken ise bağımsız değişken olarak ele alınıp değişkenler arasındaki ilişkiler incelenecektir Kategorik Regresyon Analizi Uygulaması Bu bölümde devletin resmi kurumlarından Türk Silahlı Kuvvetlerine duyulan güvenin, diğer bağımsız değişkenlerle ilişkisi kategorik regresyon analizi kullanılarak incelenecektir. Analizler, IBM SPSS Categories 22.0 modülünden yararlanılarak yapılmıştır Değişken sayısallaştırmaları Optimal ölçekleme tekniklerinin en önemli özelliklerinden biri değişken kategorilerini sayısallaştırarak, analiz sürecine devam etmesidir. Bunun için öncelikle aşağıdaki çizelgelerde değişken düzeylerinin sayısallaştırılmış hali verilecektir.

63 47 Çizelge 5.2. TSK ya duyulan güven düzeyi için sayısallaştırma Kategori Frekans Sayısallaştırma Hiç Güvenmiyorum 411-1,670 Güvenmiyorum 508-1,216 Güveniyorum 954,174 Tamamen Güveniyorum 1164,977 Çizelge 5.3. Cinsiyet değişkeni için sayısallaştırma Kategori Frekans Sayısallaştırma Kadın 784 1,695 Erkek ,590 Çizelge 5.4. Medeni durum değişkeni için sayısallaştırma Kategori Frekans Sayısallaştırma Evli ,733 Bekar ,312 Dul-Boşanmış-Ayrı Yaşıyor 61 2,003 Çizelge 5.5. Konuşulan dil değişkeni için sayısallaştırma Kategori Frekans Sayısallaştırma Kürtçe ,895 Türkçe ,367 Arapça 136 1,265 Zazaca 155,145 Çizelge 5.6. Meslek değişkeni için sayısallaştırma Kategori Frekans Sayısallaştırma İşsiz 291-1,313 Kamu Çalışanı 467 1,457 Özel Sektör İşçi 443 -,552 Serbest Meslek-Esnaf-Tüccar 591,045 Çiftçi 318,544 Ev Kadını 439 1,495 Öğrenci 488,826 Çizelge 5.7. Mezhep değişkeni için sayısallaştırma Kategori Frekans Sayısallaştırma Hanefi 1614,935 Şafii ,101 Alevi 129,661

64 48 Çizelge 5.8. Yaşanılan yer değişkeni için sayısallaştırma Kategori Frekans Sayısallaştırma Kırsal 679 1,864 Kent ,537 Çizelge 5.9. Gelir düzeyi değişkeni için sayısallaştırma Kategori Frekans Sayısallaştırma TL , TL 964, TL 293 1, TL ve Üzeri 42 7,280 Çizelge Namaz kılma sıklığı değişkeni için sayısallaştırma Kategori Frekans Sayısallaştırma Hiç Namaz Kılmam 302-2,925 Sadece Bayram Ve Cuma Namazlarına Giderim 375 -,668 Günlük Namazlarımı Fırsat Buldukça Kılarım 915 -,010 Günlük Namazlarımı Tam Olarak Kılarım 1445,445 Çizelge Eğitim düzeyi değişkeni için sayısallaştırma Kategori Frekans Sayısallaştırma Okuryazar Değil 141 -,886 Okur-Yazar 256 -,886 İlköğretim (İlk-Orta Okul) ,886 Orta Öğretim (Lise) 871,274 Ön Lisans-Lisans 637 1,642 Lisans Üstü 28 1,642 Çizelge 5.11 e bakıldığında eğitim düzeyi değişkeninin kategorileri sayısallaştırıldığında bazı kategorilerin aynı değerleri aldığı görülmektedir. Böyle durumlarda aynı değeri alan kategoriler birleştirilerek analiz sürecine devam edilir.

65 49 Kategori birleştirmeleri dönüşüm grafiklerinden faydalanılarak da elde edilebilmektedir. Şekil 5.1. Eğitim düzeyi değişkeni için dönüşüm grafiği Çizelge 5.11 den faydalanılarak hazırlanan şekil 5.1. de de görüldüğü üzere, aynı sayısal değere sahip kategori düzeylerinin birleştirilmesi gerekmektedir. Yani grafikte durağan bölge oluşması, kategori birleştirmesi yapılmasını gerektirmektedir. Bu grafikten faydalanılarak hazırlanan eğitim düzeyi değişkeninin yeni hali Çizelge 5.12 ve Şekil 5.2 de verilmiştir. Çizelge Kategoriler birleştirildikten sonra eğitim düzeyi değişkeni için sayısallaştırma Kategori Frekans Sayısallaştırma İlköğretim ve Altı ,887 Lise 871,276 Ön Lisans ve Üstü 665 1,640 Şekil 5.2. Kategoriler birleştirildikten sonra eğitim düzeyi değişkeni için dönüşüm grafiği

66 50 Çizelge Yaş değişkeni için sayısallaştırma Kategori Frekans Sayısallaştırma , , , yaş ve üzeri 150 1,711 Çizelge 5.13 te görüldüğü üzere bazı kategoriler aynı sayısal değere sahiptir. Bu durumda kategoriler birleştirilerek aşağıda verilen Çizelge 5.14 oluşturulmuştur. Çizelge Kategoriler birleştirildikten sonra yaş değişkeni için sayısallaştırma Kategori Frekans Sayısallaştırma , ve üstü 773 1,711 Yaş değişkenin dönüşüm öncesi ve sonrası grafikleri sırasıyla Şekil 5.3 ve Şekil 5.4 te verilmiştir. Şekil 5.3. Yaş değişkeni için dönüşüm grafiği Şekil 5.4. Kategoriler birleştirildikten sonra yaş değişkeni için dönüşüm grafiği

67 51 Yukarıda yapılan sayısallaştırmalar sonucunda elde edilen modelle ilgili tablolar bir sonraki bölümde verilmektedir Kategorik regresyon bulguları Çizelge Analizde kullanılan gözlem sayısı Geçerli Aktif Gözlem Sayısı (Active Cases) 3037 Kayıp Değer Gözlem Sayısı(Missing Values) 5570 Toplam 8607 Çizelge 5.15 e bakıldığında toplam 8607 kişilik gözlemden 5570 inin kayıp gözlem olduğu ve 3037 kişilik bir veri seti ile analizlerin yapıldığı görülmektedir. Çizelge Kayıp fonksiyonu için iterasyon geçmişi Multiple(Çoklu) R Değeri Tahmin Hatası Tahmin Hatasındaki Azalma İterasyon Sayısı 0,000,000 1,186,814 -,814 2,196,804,010 3,197,803,001 4,198,802,000 Çizelge 5.16 ya bakıldığında 4 iterasyon sonucunda kayıp fonksiyonun minimizasyonunun sağlandığı görülmektedir. İterasyonlar, yakınsama sağlandığı ve geçerli test değerine ulaşıldığı için 4.aşamada durdurulmuştur. Çizelge Model anlamlılığı tablosu Kareler Toplamı s.d. Kareler Ortalaması F p değeri Regresyon 600, ,004 30,905,000 Hata 2436, ,809 Toplam 3037, Multiple (Çoklu) R = 0,445 R 2 = 0,198 Düzeltilmiş R 2 = 0,191 Çizelge 5.17 ye bakıldığında kategorik regresyon sonucunda kurulan model istatistiksel bakımdan anlamlı bulunmuştur (F=30,905; p=,00). Modelin çoklu R değeri 0,445; R 2 değeri ise 0,198 bulunmuştur ve demografik değişkenlerin TSK ya güven düzeyini yaklaşık olarak %20 oranında açıklayabildiği sonucuna ulaşılmıştır.

68 52 Çizelge Bağımsız değişken katsayılarının anlamlılığı tablosu Standartlaştırılmış Katsayılar Değişkenler Beta Standart Hata s.d. F p değeri Namaz Kılma Sıklığı,092, ,269,000 Yaş,014,018 1,559,455 Cinsiyet,031, ,027,155 Medeni Durum,004,014 2,074,928 Eğitim Durumu -,170, ,047,000 Konuşulan Dil,297, ,122,000 Meslek,079, ,717,000 Mezhep,168, ,073,000 Yaşanılan Yer,017, ,593,207 Aylık Gelir,069, ,340,000 Çizelge 5.18 e bakıldığında namaz kılma sıklığı, eğitim durumu, konuşulan dil, meslek, mezhep ve aylık gelir değişkenlerinin TSK ya olan güveni açıklamada anlamlı bir etkiye sahip olduğu görülmektedir (tümünde p<,05). Yaş, cinsiyet, medeni durum ve yaşanılan yer değişkenlerinin ise TSK ya duyulan güveni açıklamada anlamlı bir etkilerinin olmadığı görülmektedir (tümünde p>,05). Çizelge Değişken kategorilerinin etki katsayısı tablosu Değişken Konuşulan Dil Eğitim Durumu Mezhep Meslek Namaz Kılma Sıklığı Aylık gelir Değişken Kategorileri Kategori Sayısallaştırılmaları β katsayısı Değişken Kategorilerinin Etki Katsayısı Kürtçe -0,895-0,266 Türkçe 1,367 0,406 0,297 Arapça 1,265 0,376 Zazaca 0,145 0,043 İlköğretim ve altı -0,887 0,151-0,170 Lise 0,276-0,047 Önlisans ve üstü 1,640-0,279 Hanefi 0,935 0,157 0,168 Şafii -1,101-0,184 Alevi 0,661 0,111 İşsiz -1,313-0,104 Kamu çalışanı 1,457 0,115 İşçi (Özel) -0,552-0,044 0,079 Serbest meslek -0,045-0,0035 Çiftçi 0,544 0,043 Ev kadını 1,495 0,118 Öğrenci 0,826 0,065 Hiç namaz kılmam -2,295-0,211 Sadece Cuma ve -0,668-0,061 Bayram namazlarına giderim 0,092 Namazlarımı fırsat -0,10-0,0092 buldukça kılarım Namazlarımı düzenli 0,445 0,041 olarak kılarım ,424-0, ,052 0,069 0, ,301 0, ve üstü 7,280 0,502

69 53 Kategorik regresyon sonucunda elde edilen β katsayıları ile optimal ölçekleme ile elde edilen değişken kategorilerinin sayısallaştırılmış değerlerinin çarpılması sonucunda etki katsayıları hesaplanabilmektedir. Etki katsayıları, bağımsız değişken kategorilerinin bağımlı değişkenle ne yönlü bir ilişki içerisinde olduğunu göstermektedir. Etki katsayısının yüksek olması; ilgili değişken düzeyinin bağımlı değişkenle yüksek derecede ilişkili olduğunu belirtmektedir. Çizelge 5.19 da yalnızca kategorik regresyon sonucunda modele anlamlı katkı yapan altı değişkenin kategorilerinin etki katsayıları incelendiğinde; Türkçe (0,406) ve Arapça (0,376) konuşan bireylerin, TSK ya daha fazla güvendikleri; Kürtçe (-0,266) konuşan bireylerin ise, TSK ya güvenle ters bir ilişki içerisinde oldukları görülmektedir. Zazaca (0,043) konuşan bireylerin ise, TSK ya güvenle pozitif bir ilişki içerisinde olduğu, fakat bu değişken düzeyinin etkisinin son derece düşük olduğu görülmektedir. Eğitim düzeyi değişkeninin kategorileri incelendiğinde; ön lisans ve üstü mezunlarının (-0,279) TSK ya güvenmedikleri; ilköğretim mezunu ve daha düşük eğitime (0,151) sahip bireylerin ise, TSK ya güven ile pozitif bir ilişki içerisinde oldukları görülmektedir. Lise mezunlarının (-0,047) ise TSK ya güvenle negatif bir ilişki içerisinde olduğu, fakat bu değişken düzeyinin etkisinin son derece düşük olduğu görülmektedir. Mezhep değişkeni incelendiğinde; Hanefi (0,157) ve alevi bireylerin (0,111) TSK ya daha fazla güvendikleri; şafii (-0,184) bireylerin ise TSK ya güvenle ters bir ilişki içerisinde oldukları görülmektedir. Meslek değişkeni incelendiğinde; kamuda görev yapan (0,115) ve ev hanımı (0,118) olan bireylerin TSK ya daha fazla güvendikleri, işsiz bireylerin (-0,104) ise TSK ya güvenle ters bir ilişki içerisinde oldukları görülmektedir. Meslek değişkeninin diğer kategorilerinin etki katsayıları son derece düşük olduğundan bu kategoriler değerlendirmeye alınmamıştır. Namaz kılma sıklığı değişkenine bakıldığında; hiç namaz kılmayan bireylerin (-0,211) TSK ya güvenmedikleri görülmektedir. Namaz kılma sıklığı değişkenin diğer kategorilerinin

70 54 etki katsayıları son derece düşük olduğundan, bu kategoriler değerlendirmeye alınmamıştır. Aylık gelir değişkeni incelendiğinde, 4000 TL ve üzerinde gelire sahip bireylerin (0,502) TSK ya daha fazla güvendikleri görülmektedir. Aylık gelir değişkeninin diğer kategorilerinin etki katsayıları son derece düşük olduğundan, bu kategoriler değerlendirmeye alınmamıştır. Sonuç olarak; etki katsayıları açısından TSK ya güvenen bireylerin sırasıyla; 4000 TL ve üstü maaş alan, Türkçe ve Arapça konuşan, mezhebi Hanefi olan, ilköğretim ve daha düşük eğitim seviyesinde olan, ev kadını olan, kamuda çalışan ve mezhebi Alevi olan kişilerden oluştuğu görülmektedir. TSK ya güvenmeyen bireylerin ise sırasıyla; önlisans ve üstü eğitime sahip, Kürtçe konuşan, hiç namaz kılmayan, mezhebi Şafii olan ve işsiz kişilerden oluştuğu görülmektedir. Diğer değişken kategorileri ise düşük etki katsayılarına sahip olduğu için sonuçlar yorumlanmamıştır. Çizelge Orijinal değişkenler arasındaki korelasyon katsayıları Namaz Kılma Yaş Cinsiyet Medeni Durum Eğitim Konuşulan Durumu Dil Meslek Mezhep Yaşanılan Yer Aylık Gelir Namaz Kılma 1,000 Yaş,099 1,000 Cinsiyet -,068,042 1,000 Medeni Durum -,133 -,287 -,057 1,000 Eğitim Durumu,020 -,336,103,295 1,000 Konuşulan Dil,022 -,057 -,059 -,009,116 1,000 Meslek,037 -,080 -,317,242 -,034,002 1,000 Mezhep -,194,005 -,011,069 -,051 -,106 -,010 1,000 Yaşanılan yer -,051 -,055 -,096,069,083,059,028 -,081 1,000 Aylık Gelir -,098 -,075 -,002,088,315,056 -,097,026,094 1,000 Kategorik regresyon analizinde bağımsız değişkenler arasındaki ilişkiler incelenebilmektedir. Çizelge 5.20 deki orijinal değişkenler arasındaki korelasyonlara bakıldığında en yüksek pozitif korelasyonun 0,315 değeri ile eğitim durumu ile aylık gelir

71 55 değişkenleri arasında ve 0,295 değeri ile medeni durum ile eğitim durumu arasında olduğu görülmektedir. Değişkenler arasındaki en yüksek negatif korelasyonlara bakıldığında ise, eğitim durumu ile yaş değişkeni arasında - 0,336, ve meslek ile cinsiyet değişkeni arasında - 0,317 lik bir korelasyon olduğu görülmektedir. Tabloya bakıldığında en düşük korelasyona sahip değişkenler ise 0,002 değeri ile meslek ve konuşulan dil, yine aynı şekilde -0,002 değeri ile cinsiyet ve aylık gelir değişkenleridir. Mezhep ile yaş ve medeni durum ile konuşulan dil değişkenleri arasında da son derece düşük bir korelasyon mevcuttur. Çizelge Dönüştürülmüş değişkenler arasındaki korelasyon katsayıları Namaz Kılma Namaz Kılma 1,000 Yaş Cinsiyet Medeni Durum Eğitim Durumu Konuşulan Dil Meslek Mezhep Yaşanılan Yer Aylık Gelir Yaş,057 1,000 Cinsiyet -,077 -,042 1,000 Medeni Durum Eğitim Durumu Konuşulan Dil Meslek Mezhep Yaşanılan yer Aylık Gelir -,122 -,331,036 1,000 -,021 -,330 -,101,327 1,000,030 -,045,082 -,033,102 1,000,008 -,099 -,391,140,420,027 1,000,109 -,006,018 -,046,059,449,024 1,000,055,055 -,096 -,072 -,084 -,073,040 -,099 1,000 -,086 -,055,009,075,218,030,141,003 -,067 1,000 Kategorik regresyon analizinde sayısallaştırma işlemi yapıldıktan sonra değişkenlere ALS algoritması yardımıyla bazı dönüşümler uygulanmaktadır. Çizelge 5.21 de bağımsız değişkenlere dönüşümler uygulandıktan sonra hesaplanan korelasyon katsayıları yer almaktadır. Esasında analizler yapılırken dönüşüm yapılmış değişkenler ile analiz süreci devam ettirilmektedir, bu nedenle Çizelge 5.20 de verilen orijinal değişkenler arasındaki korelasyon katsayılarından ziyade dönüştürülmüş değişkenler arasındaki korelasyon katsayılarına bakılarak değişkenler arasındaki ilişkiler yorumlanmalıdır.

72 56 Çizelge 5.21 e bakıldığında dönüştürülmüş değişkenler arasında en yüksek pozitif korelasyonun 0,449 değeri ile konuşulan dil ve mezhep değişkeni ve 0,420 değeri ile meslek ile eğitim durumu arasında olduğu görülmektedir. Ayrıca, medeni durum ile eğitim durumu değişkenleri arasında 0,327 lik bir korelasyon mevcuttur. Değişkenler arasındaki en yüksek negatif korelasyonlara bakıldığında ise, - 0,391 değeri ile meslek ile cinsiyet değişkenleri arasında ters bir ilişki olduğu görülmektedir. Yaş ile medeni durum ve yaş ile eğitim durumu değişkenleri arasında da negatif korelasyonlar bulunmaktadır. Tabloya bakıldığında en düşük korelasyona sahip değişkenler ise 0,003 değeri ile mezhep ve aylık gelir değişkenleridir. Aynı şekilde namaz kılma sıklığı ile meslek, yaş ile mezhep ve cinsiyet ile aylık gelir değişkenleri arasında son derece düşük ilişkilerolduğu görülmektedir. Çizelge Korelasyon değerleri tablosu Korelasyonlar Değişkenler Sıfır sıralı Kısmi Kısım Namaz Kılma Sıklığı,128,100,090 Yaş,055,014,013 Cinsiyet,035,031,028 Medeni Durum -,079,004,003 Eğitim Durumu -,121 -,154 -,139 Konuşulan Dil,358,282,263 Meslek -,001,073,066 Mezhep,302,164,149 Yaşanılan Yer,003,019,017 Aylık Gelir -,095 -,075 -,067 Kategorik regresyonda hesaplanan sıfır sıralı (zero-order) korelasyon değeri, dönüştürülmüş bağımlı değişken ile dönüştürülmüş bağımsız değişkenler arasındaki ilişkiyi yansıtan bir ölçü olmaktadır. Çizelge 5.22 ye bakıldığında, bağımlı değişken olan TSK ya güven düzeyi ile en yüksek ilişkiye sahip değişkenlerin sırasıyla konuşulan dil ve mezhep değişkenleri olduğu görülmektedir. Meslek ve yaşanılan yer değişkenlerinin ise TSK ya güven ile çok düşük bir ilişkiye sahip olduğu görülmektedir. Kısmi korelasyon değerleri incelendiğinde en yüksek değere sahip değişkenin konuşulan dil olduğu görülmektedir. Bu katsayının karesi alındığında (0,282 2 = 0,08), TSK ya güven düzeyi olan bağımlı değişkenden ve konuşulan dil değişkeninden diğer bağımsız

73 57 değişkenlerin etkisinin arındırılmasından sonra, konuşulan dil değişkeninin TSK ya güven düzeyindeki değişimin yaklaşık %8 ini açıklayabildiğini söyleyebiliriz. Konuşulan dil değişkeninden sonra, bağımlı değişkendeki değişimi açıklayabilen diğer değişkenler sırasıyla; mezhep, eğitim durumu ve namaz kılma sıklığı değişkenleridir. Kısım korelasyon değerlerine incelendiğinde, en yüksek değere sahip değişkenin diğer korelasyon katsayılarında olduğu gibi konuşulan dil değişkeni olduğu görülmektedir. Bu katsayının karesi alındığında (0,263 2 = 0,07), diğer bağımsız değişkenlerin konuşulan dil değişkeninden etkilerinin kaldırılmasından sonra, konuşulan dil değişkeninin TSK ya güven düzeyindeki değişimin yaklaşık %7 sini açıklayabildiğini söyleyebiliriz. Konuşulan dil değişkeninin kısmi korelasyonun karesinin, kısım korelasyonun karesinden yaklaşık %1 yüksek olduğu görülmektedir. Bu farklılık, diğer bağımsız değişkenlerin, bağımlı değişkenden etkilerinin kaldırılmamasından kaynaklanmaktadır. Tabloya bakıldığı zaman, tüm değişkenlerin kısmi korelasyon katsayılarının, kısım korelasyon katsayılarından yüksek olduğu görülmektedir. Çizelge Önemlilik ve tolerans değerleri Değişkenler Önemlilik (Importance) Değerleri Tolerans (Tolerance) Değerleri Dönüşüm Öncesi Dönüşüm Sonrası Namaz Kılma Sıklığı,059,960,664 Yaş,004,830,850 Cinsiyet,005,817,746 Medeni Durum -,002,817,684 Eğitim Durumu,104,673,963 Konuşulan Dil,539,783,818 Meslek -,001,693,934 Mezhep,257,783,957 Yaşanılan Yer,000,964,870 Aylık Gelir,033,937,912 Önemlilik katsayısı; kategorik regresyon modelinde yer alan bağımsız değişkenlerin, ne ölçüde önemli olduklarını, diğer bir deyişle önem düzeylerini yansıtmaktadır. Çizelge 5.23 e bakıldığında, modelde yer alan en önemli değişkenlerin konuşulan dil, mezhep ve eğitim durumu olduğu görülmektedir. Ayrıca, önemlilik değerleri arasında çok yüksek

74 58 negatif değerlerin (-1 e yakın) olmaması modelde çoklu doğrusal bağlantı problemi olmadığını göstermektedir. Kategorik regresyonda hesaplanan tolerans değeri, modelde yer alan bağımsız değişkenlerin kendi aralarında ne ölçüde ilişkili olduğunu yansıtmaktadır. Dönüşüm sonrası tolerans değerlerine bakıldığında namaz kılma sıklığı, cinsiyet ve eğitim durumu değişkeni haricindeki diğer tüm tolerans değerlerinin son derece yüksek olduğu ve bağımsız değişkenler arasında yüksek bir korelasyonun olduğu görülmektedir. Esasında tolerans değerlerinin 1 e yakın olması bu modelde bağımsız değişkenlerin bağımlı değişkeni pek de iyi tahmin edemediğini göstermektedir. R 2 değerine bakıldığında bu katsayının çok yüksek olmadığı ve bağımsız değişkenlerin bağımlı değişkeni ancak %20 oranında açıklayabildiği görülmektedir Sıralı Lojistik Regresyon Analizi Uygulaması Sıralı lojistik regresyon analizi, bağımlı değişkenin kategorik ve sıralı olduğu durumlarda kullanılmaktadır. Analizde bağımlı değişken olan TSK ya güven düzeyi değişkeninin düzeyleri (hiç güvenmiyorum, güvenmiyorum, güveniyorum, tamamen güveniyorum) şeklinde olduğundan TSK ya güven düzeyi ile demografik değişkenler arasındaki ilişkiyi inceleyebilmek amacıyla veri setine sıralı lojistik regresyon analizi uygulanmıştır. Uygulanan analiz sonucunda elde edilen sonuçlar aşağıdaki tablolarda verilecektir. Sıralı lojistik regresyonda paralellik varsayımı son derece önem arz etmektedir. Paralellik varsayımı, parametrelerin tahmini değerlerinin bağımlı değişkenin tüm kategorileri için aynı noktadan geçip geçmediğini test etmektedir (Akın ve Şentürk, 2012). Paralellik testinde hipotezler: H 0 : Bağımlı değişkenin parametre tahminleri aynı kesme noktasından geçmektedir. H 1 : Bağımlı değişkenin parametre tahminleri farklı kesme noktasından geçmektedir şeklinde kurulmaktadır.

75 59 Çizelge Paralellik testi Model -2 Log Olabilirlik Ki-kare s.d. p değeri Yokluk Hipotezi 6202,320 Genel Model 6062,024 59,466 60,284 Bağlantı fonksiyonu: Probit Paralellik testi sonuçlarına bakıldığında bağımlı değişkenin tüm kategorilerinin aynı kesme noktasından geçtiği görülmektedir (χ 2 = 59,466, p >,05). Yani, TSK ya güven düzeyi değişkeninin tüm kategorileri birbirine paraleldir ve aynı noktadan geçmektedir. Modeldeki bağımsız değişkenlerin modele katkı yapıp yapmadığını belirlemek amacıyla, model uyumu testi sonuçlarına bakılmalıdır. Model uyumu testinde hipotezler: H 0 : Bağımsız değişkenlerin yer aldığı modelle, bağımsız değişkenleri içermeyen model arasında bağımsız değişkenlerin etkisi açısından anlamlı bir fark yoktur. H 1 : Bağımsız değişkenlerin yer aldığı modelle, bağımsız değişkenleri içermeyen model arasında bağımsız değişkenlerin etkisi açısından anlamlı bir fark vardır şeklinde kurulmaktadır. Çizelge Model uyumu (model fitting) testi Model Yalnızca Sabiti İçeren Model 6827,729-2 Log Olabilirlik Ki-kare s.d. p değeri Final Modeli 6202, ,409 30,000 Bağlantı fonksiyonu: Probit Model uyumu testi sonuçlarına bakıldığında, kurulan lojit model istatistiksel olarak anlamlı bulunmuştur (χ 2 = 625,409, p <,05). Yani modele dahil edilen bağımsız değişkenler, modele anlamlı bir katkı yapmakta ve kurulan model istatistiksel olarak anlamlı olmaktadır.

76 60 Modelin uyumunu değerlendirmek için kullanılan diğer testler ise, pearson ve sapma testleri olarak bilinmektedir. Uyum iyiliği testleri için hipotezler benzer şekilde kurulmaktadır. H 0 : Modelde değişken düzeylerine atanması beklenen frekanslarla, analiz sonucu gözlenen frekanslar birbirine eşittir (O ij = E ij ) H 1 : Modelde değişken düzeylerine atanması beklenen frekanslarla, analiz sonucu gözlenen frekanslar birbirinden farklıdır (O ij E ij ) Çizelge Uyum iyiliği (goodness of fit) testleri Ki-kare s.d. p değeri Pearson Testi 6210, ,653 Sapma Testi 5503, ,000 Uyum iyiliği testleri sonuçlarına bakıldığında H 0 hipotezi reddedilememektedir. Yani hem pearson hem de sapma testinde, değişken düzeylerine atanması beklenen frekanslarla, gözlenen frekanslar birbirine eşit çıkmaktadır (her iki test için de p>,05). Bu da, model uyumunun yeterli düzeyde olduğunu ortaya koymaktadır. Ayrıca, pseudo R 2 istatistikleri, sıralı lojistik regresyon analizinde model uyumu için hesaplanan diğer değerler olarak karşımıza çıkmaktadır. Lojistik regresyonda hesaplanan R 2 istatistikleri doğrusal regresyondaki gibi yorumlanamamaktadır. Burada hesaplanan değerler, bağımsız değişkenlerin bağımlı değişkeni ne oranda açıklayabildiğini göstermekten ziyade, modelin uyum düzeyi hakkında bilgi vermektedir ve genellikle doğrusal regresyonda hesaplanan R 2 değerlerinden küçük değerler almaktadır. 0,20 ile 0,40 arasındaki R 2 değerlerinin modelin uyumu için, yeterli olabilmektedir. Çizelge Pseudo R 2 istatistikleri Cox and Snell,186 Nagelkerke,201 McFadden,079 Çizelge 5.27 ye bakıldığında Cox and Snell R 2 değerinin 0,186, Nagelkerke R 2 değerinin 0,201 ve Mc Fadden R 2 istatistiğinin 0,079 olduğu görülmektedir. Yani modelin orta düzey bir uyum gösterdiği söylenebilir.

77 61 Sıralı lojistik regresyonda parametre anlamlılıklarının incelenmesi diğer lojistik modellere göre farklılık göstermektedir. Burada, her bir değişkenin son kategorisi, referans kategori olarak ele alınıp; değerlendirmeler bu referans kategorilere göre yapılmaktadır. Çizelge Parametre tahminleri (parameter estimates) tablosu (Bağımlı Değişken) Threshold Bağımsız Değişken Düzeyleri (Location) Tahmin Değeri Standart Hata Wald p değeri [TSK ya Güven = 1] -1,113,390 8,142,004 [TSK ya Güven = 2] -,154,389,157,692 [TSK ya Güven = 3],916,389 5,554,018 [Namaz Kılma Sıklığı=1] -,591,142 17,417,000 [Namaz Kılma Sıklığı=2],070,117,359,549 [Namaz Kılma Sıklığı=3] -,052,081,401,526 [Namaz Kılma Sıklığı=4] 0 a [Yaş=1] -,019,200,009,922 [Yaş=2] -,092,176,274,600 [Yaş=3] -,043,177,060,807 [Yaş=4] 0 a [Cinsiyet=1],621,284 10,256,000 [Cinsiyet=2] 0 a [Medeni durum=1] -,089,256,119,730 [Medeni durum=2] -,115,275,176,675 [Medeni durum=3] 0 a [Eğitim durumu=1],541,408 1,756,185 [Eğitim durumu=2],550,386 2,035,154 [Eğitim durumu=3],582,369 2,485,115 [Eğitim durumu=4],108,364,088,766 [Eğitim durumu=5] -,330,362,829,363 [Eğitim durumu=6] 0 a [Konuşulan dil=1] -,521,156 11,158,000 [Konuşulan dil=2],940,168 17,424,000 [Konuşulan dil=3],699,223 11,043,000 [Konuşulan dil=4] 0 a [Meslek=1],256,155 3,435,067 [Meslek=2],104,146,511,475 [Meslek=3] -,238,140 2,900,089 [Meslek=4] -,112,142,627,429 [Meslek=5],001,169,000,993 [Meslek=6],352,178 4,555,029 [Meslek=7] 0 a [Mezhep=1],559,204 7,487,006 [Mezhep=2] -,108,203,281,596 [Mezhep=3] 0 a [Yaşanılan yer=1],013,087,023,879 [Yaşanılan yer=2] 0 a [Aylık gelir=1],026,306 1,855,621 [Aylık gelir=2],984,295 11,133,001 [Aylık gelir=3],948,294 10,375,001 [Aylık gelir=4] α : Referans kategorilerini ifade etmektedir. 0 a

78 62 Çizelge 5.28 de her bir bağımsız değişken düzeyinin regresyon katsayılarının tahmin değerleri verilmektedir. Çizelgeye bakıldığında, yaş, medeni durum, eğitim durumu ve yaşanılan yer değişkenlerinin hiçbir düzeyinin bağımlı değişkenle anlamlı bir ilişkisi olmadığı görülmektedir (tümünde; p>,05). Namaz kılma sıklığı, cinsiyet, konuşulan dil, meslek, mezhep ve aylık gelir değişkenlerinin bazı düzeylerinin ise bağımlı değişkenle anlamlı ilişkileri (p değerleri <,05 olduğu için) bulunmaktadır. Aşağıda anlamlı bulunan bu değişken düzeylerinin bağımlı değişkenle nasıl bir ilişki içerisinde oldukları verilmektedir. Namaz kılma sıklığı değişkeninin düzeyleri incelendiğinde, hiç namaz kılmayan bireylerin referans kategori olan günlük namazlarımı tam olarak kılarım diyen bireylere göre TSK ya güven açısından daha düşük bir düzeye sahip oldukları (β 1 =,591,) görülmektedir. Namaz kılma sıklığı değişkeninin diğer kategorilerinin ise bağımlı değişken olan TSK ya güven ile anlamlı bir ilişkisi bulunmamaktadır. Cinsiyet değişkeni incelendiğinde, kadın bireylerin referans kategori olan erkeklere göre TSK ya daha fazla güvendikleri (β 1 = 0,621) görülmektedir. Konuşulan dil değişkeninin düzeyleri incelendiğinde, Kürtçe konuşan bireylerin referans kategori olan Zazaca konuşan bireylere göre TSK ya güven açısından daha düşük bir düzeye sahip olduğu (β 1 = 0,521), Türkçe ve Arapça konuşan bireylerin ise Zazaca konuşanlara göre sırasıyla, TSK ya daha fazla güvendikleri (β 2 = 0,940, β 3 = 0,699) görülmektedir. Meslek değişkeninin düzeyleri incelendiğinde, ev hanımlarının referans kategori olan öğrencilere göre TSK ya daha fazla güvendikleri (β 1 = 0,352) görülmektedir. Meslek değişkeninin diğer kategorilerinin ise bağımlı değişken olan TSK ya güven ile anlamlı bir ilişkisi bulunmamaktadır. Mezhep değişkeni incelendiğinde, mezhebi hanefi olanların referans kategori olan alevi bireylere göre TSK ya daha fazla güvendikleri (β 1 = 0,559) görülmektedir. Mezhep

79 63 değişkeninin diğer kategorilerinin ise bağımlı değişken olan TSK ya güven ile anlamlı bir ilişkisi bulunmamaktadır. Aylık gelir değişkeni incelendiğinde, geliri TL ve TL arasinda olan bireylerin referans kategori olan 4000 TL ve üzeri maaş alan bireylere göre sırasıyla, TSK ya daha fazla güvendikleri (β 2 = 0,984, β 3 = 0,948) görülmektedir Kategorik Regresyon ve Sıralı Lojistik Regresyon Sonuçlarının Karşılaştırılması 1-) Uygulama sonuçlarına bakıldığında; hem kategorik regresyon hem de sıralı lojistik regresyon modellerinin anlamlı sonuçlar ürettiği görülmektedir. Kategorik regresyonda kurulan modelin anlamlılığı için ANOVA tablosundan faydalanılmış ve model istatistiksel olarak anlamlı bulunmuştur (p<,05). Sıralı lojistik regresyonda ise, paralellik testi ile bağımlı değişken kategorilerinin aynı eğime sahip oldukları saptanmış (p>,05) ve model uyumu testiyle de bağımsız değişkenlerin modele anlamlı bir katkı yaptığı belirlenmiştir (p<,05). 2-) Kategorik regresyonda bağımsız değişken katsayılarının anlamlılıkları incelendiğinde, TSK ya duyulan güveni açıklamada en etkili değişkenlerin; konuşulan dil, mezhep, meslek, eğitim durumu, namaz kılma sıklığı ve aylık gelir değişkenleri olduğu görülmüştür. Sıralı lojistik regresyon analizi sonucunda ise, konuşulan dil, namaz kılma sıklığı, cinsiyet, mezhep ve aylık gelir değişkenlerinin bağımlı değişkeni açıklamada anlamlı bulunduğu görülmüştür. Burada, kategorik regresyonda modele anlamlı katkı yapan meslek ve eğitim durumu değişkenlerinin sıralı lojistik regresyon modelinde istatistiksel bakımdan anlamlı olmadığı görülmektedir. Kategorik regresyon modelinde anlamlı çıkmayan cinsiyet değişkeninin ise sıralı lojistik modelde anlamlı olduğu görülmektedir. 3-) Kategorik regresyonda hesaplanan çoklu (multiple) R 2 değeri, tıpkı doğrusal regresyonda olduğu gibi bağımsız değişkenlerin bağımlı değişkeni ne oranda açıklayabildiğini göstermektedir. Kategorik regresyonda hesaplanan çoklu R 2 istatistiğinin 0,198 olduğu görülmekte ve bu oran demografik değişkenlerin TSK ya güven düzeyini yaklaşık olarak %20 oranında açıklayabildiğini göstermektedir. Sıralı

80 64 lojistik regresyonda hesaplanan pseudo R 2 değerleri ise, bağımsız değişkenlerin bağımlı değişkeni açıklama gücünü yansıtmaktan ziyade, modelin uyum iyiliği için kullanılmaktadır. Bu değerler incelendiğinde, Cox and Snell R 2 değerinin 0,186, Nagelkerke R 2 değerinin 0,201 ve Mc Fadden R 2 istatistiğinin 0,079 olduğu görülmektedir. Yani sıralı lojistik model, orta düzey bir uyum göstermektedir. 4-) Sıralı lojistik regresyon ve kategorik regresyonda bağımsız değişken kategorilerinin bağımlı değişkenle nasıl bir ilişki içerisinde olduğunu elde edebilmek mümkündür. Burada değişken kategorileri açısından karşılaştırma yapılırken her iki regresyon modelinde de modele anlamlı katkı yapan; konuşulan dil, mezhep, namaz kılma sıklığı ve aylık gelir değişkenleri incelenmiştir. Bu açıdan değişken düzeyleri karşılaştırıldığında; Sıralı lojistik regresyon analizi sonucunda konuşulan dil değişkeninin düzeyleri incelendiğinde, Kürtçe konuşan bireylerin TSK ya güven ile negatif bir ilişkiye sahip olduğu Türkçe ve Arapça konuşan bireylerin ise, TSK ya güven ile pozitif bir ilişki içerisinde oldukları görülmektedir. Kategorik regresyon sonucunda ise; Türkçe ve Arapça konuşan bireylerin, TSK ya daha fazla güvendikleri; Kürtçe konuşan bireylerin ise, TSK ya güvenle ters bir ilişki içerisinde oldukları görülmektedir. Sıralı lojistik regresyon analizi sonucunda mezhep değişkeni incelendiğinde, mezhebi Hanefi olanların TSK ya güven ile pozitif bir ilişkiye sahip oldukları görülmektedir. Kategorik regresyon sonucunda ise; Hanefi ve alevi bireylerin TSK ya daha fazla güvendikleri; şafii bireylerin ise TSK ya güvenle ters bir ilişki içerisinde oldukları görülmektedir. Sıralı lojistik regresyon analizi sonucunda namaz kılma sıklığı değişkeninin düzeyleri incelendiğinde, hiç namaz kılmayan bireylerin TSK ya güven ile ters ilişki içerisinde oldukları görülmektedir. Kategorik regresyon sonucunda ise sıralı lojistik regresyonda olduğu gibi hiç namaz kılmayan bireylerin TSK ya güvenmedikleri görülmektedir.

81 65 Sıralı lojistik regresyon analizi sonucunda aylık gelir değişkeni incelendiğinde, geliri TL ve TL arasinda olan bireylerin TSK ya güven ile pozitif yönlü bir ilişki içerisinde oldukları görülmektedir. Fakat elde edilen gelir arttıkça, TSK ya olan güvenin biraz daha azaldığı görülmektedir. Kategorik regresyonda ise 4000 TL ve üzerinde gelire sahip bireylerin TSK ya daha fazla güvendikleri görülmektedir. Sıralı lojistik regresyon ve kategorik regresyon sonucunda elde edilen değişken kategorilerinin bağımlı değişkenle ilişkileri incelendiğinde; sonuçların birbirine çok benzer olduğu görülmektedir. Fakat, sıralı lojistik regresyonda değişken kategorileri için Wald istatistikleri kullanılarak değişken kategorilerinin anlamlılıkları incelenirken, kategorik regresyonda anlamlılık testi bulunmamakta; bunun yerine etki katsayılarına bakılarak değişken kategorilerinin önemliliğine karar verilmektedir. 5-) Kategorik regresyon analizinde, sıralı lojistik regresyonda hesaplanmayan korelasyon değerleri elde edilebilmektedir. Kategorik regresyonda hesaplanan sıfır sıralı korelasyon değeri, dönüştürülmüş bağımlı değişken ile dönüştürülmüş bağımsız değişkenler arasındaki ilişkiyi yansıtan bir ölçü iken, kısmi korelasyon ve kısım korelasyon katsayıları ise bağımsız değişkenlerin bağımlı değişkeni ne oranda açıklayabildiğini göstermektedir. 6-) Kategorik regresyonda hesaplanan önemlilik ve tolerans istatistikleri, sıralı lojistik regresyonda yer almamaktadır. Önemlilik değerleri, kategorik regresyon modelinde yer alan bağımsız değişkenlerden hangilerinin modele katkı yaptığını yansıtmaktadır. Tolerans değerleri ise, bağımsız değişkenlerin bağımlı değişkeni açıklamada ne oranda etkili olduğunu göstermektedir. Yukarıdaki maddeler birlikte değerlendirildiğinde; kategorik regresyon ve sıralı lojistik regresyon sonuçları arasında bazı farklılıklar olmakla birlikte, elde edilen sonuçların büyük ölçüde örtüştüğü görülmektedir. İncelenen veri setinin bir takım özelliklerinin kategorik regresyon analizi ile, bir takım başka özelliklerinin ise sıralı lojistik regresyon analizi ile açıklanabileceği görülmektedir, fakat kategorik regresyonda bir çok katsayının hesaplanabildiği ve veriyi daha ayrıntılı inceleyebildiği görülmektedir. Sonuç olarak; bu iki analiz ayrı ayrı kullanılarak veriler çözümlenebildiği gibi, her iki analizin birlikte

82 66 kullanılmasıyla incelenen veri seti hakkında daha ayrıntılı incelemeler yapılabileceği sonucuna varılmaktadır Ortak Kategori Noktaları Grafiği Optimal ölçekleme tekniklerinin en önemli özelliklerinden biri; grafikler yardımıyla, değişkenler arasındaki ilişkilerin görsel olarak incelenebilmesidir. Elimizdeki veri setine kategorik regresyon ve sıralı lojistik regresyon analizi uygulanmış ve elde edilen sonuçlar uygulama kısmında değerlendirilmiştir. Değişkenler arasındaki ilişkileri tüm değişkenlerin düzeylerini içerecek şekilde, ortak kategori noktaları grafiği ile görsel olarak özetlemek mümkün olmaktadır. Şekil 5.5 e bakıldığında hangi değişken düzeylerinin birbirine ne ölçüde yakın ya da uzak olduğu görülmektedir. Bu grafik, veri setine optimal ölçekleme tekniklerinden olan doğrusal olmayan temel bileşenler analizi (DOTBA) uygulanması sonucu elde edilen bir grafiktir. Bu grafiği elde edebilmek için DOTBA kullanılmasının sebebi, sıralama düzeyinde ölçülen değişkenlerin de veri setinde yer almasıdır. Grafikte değişken düzeyleri arasındaki ilişkiler incelenirken, sadece kategorik regresyon sonucunda modele anlamlı katkı yapan (p <,05) değişkenler ele alınmış, diğer değişkenler içinse bir değerlendirme yapılmamıştır. Şekil 5.5 teki ortak kategori noktaları grafiği incelendiğinde, İşsiz olan, sadece cuma ve bayram namazlarına giden ve mezhebi şafi olanların TSK ya hiç güvenmedikleri Serbest meslekle uğraşan, Kürtçe konuşan, TL arasında geliri olan bireylerin TSK ya güvenmedikleri Günlük namazlarını düzenli olarak kılan ve mezhebi alevi olan bireylerin TSK ya güvendikleri Ev hanımı olan, mezhebi Hanefi olan, Türkçe konuşan bireylerin ise TSK ya tamamen güvendikleri görülmektedir.

83 Şekil 5.5. Ortak kategori noktaları grafiği 67

84 68

85 69 6. SONUÇ VE TARTIŞMA Sosyal bilim çalışmalarında kategorik özellik taşıyan değişkenler sıklıkla kullanılmaktadır. Değişkenlerin kategorik olması nedeniyle de, doğrusal modellerde etkin çözümler üretebilen pek çok istatistiksel teknik gerekli varsayımları karşılayamamakta, bundan dolayı kategorik değişkenlerin bulunduğu modeller için bilinen istatistiksel tekniklerin dışında yeni tekniklere ihtiyaç doğmaktadır. Optimal ölçekleme olarak bilinen teknikler, değişkenlerin kategorik özellik gösterdiği durumlarda, verilerin çok değişkenli analizine imkan sağlayan ve kategorik değişkenlerin düzeylerini sayısallaştırarak doğrusal modellerdeki gibi etkin çözümler üretebilen teknikler kümesi olarak karşımıza çıkmaktadır. Bilindiği üzere, bağımlı değişkeni kategorik olan modelleri çözümlemede, sıklıkla lojistik regresyon analizi kullanılmaktadır, bunun başlıca sebepleri, lojistik regresyona alternatif olabilecek diskriminant analizi ve kümeleme analizine göre analizin daha az varsayım gerektirmesi ve çıktılarının kolaylıkla yorumlanabilmesidir. Optimal ölçekleme türlerinden olan ve kategorik regresyon olarak bilinen analiz de tıpkı lojistik regresyon gibi, bağımlı değişkeni kategorik olan modellerde kullanılabilmekte ve lojistik regresyon gibi az sayıda varsayıma dayanmaktadır. Bu çalışmada, birbirine benzer veri tiplerine sahip modelleri açıklamada kullanılan bu iki regresyon analizinin karşılaştırması amaçlanmış ve bir uygulama yapılarak çıktılar yorumlanmıştır. Yapılan analizler sonucunda, her iki regresyon modelinin de elimizdeki veri setini çözümleme imkanı sağladığı ve uygulamada benzer sonuçlar ürettiği görülmektedir. Bu iki analiz temel çıktıları itibariyle karşılaştırıldığında; kategorik regresyonda, bir çok katsayısının (tolerans, önemlilik, kısmi ve kısım korelasyonlar) hesaplanabildiği ve bu yönüyle değişkenler arasındaki ilişkileri farklı yönlerden analiz etme imkanı sağladığı görülmektedir. Bunun yanı sıra, sıralı lojistik regresyonda hesaplanan R 2 istatistiğinin, bağımsız değişkenlerin bağımlı değişkeni ne oranda açıklayabildiğini göstermekten ziyade, modelin uyumu için kullanıldığı bilinmektedir. Kategorik regresyonda hesaplanan çoklu R 2 istatistiği, bu eksikliği ortadan kaldırmakta ve doğrusal regresyondaki gibi yorumlanabilen bir R 2 istatistiği kategorik regresyonda elde edilebilmektedir.

86 70 Çalışmanın uygulama bölümünde, kategorik regresyon analizi sonucunda kurulan model istatistiksel olarak anlamlı bulunmuş, TSK ya duyulan güveni açıklamada en etkili değişkenlerin sırasıyla, konuşulan dil, mezhep, meslek, eğitim durumu, namaz kılma sıklığı ve aylık gelir değişkenleri olduğu görülmüştür. Sıralı lojistik regresyon analizi sonuçları değerlendirildiğinde ise, model uyumunun orta düzeyde olduğu ve konuşulan dil, cinsiyet, namaz kılma sıklığı, mezhep ve aylık gelir değişkenlerinin bağımlı değişkeni açıklamada anlamlı bulunduğu görülmüştür. Bunun yanı sıra, her iki analize ait diğer çıktılar uygulama bölümünde karşılaştırılmış ve değişkenler arasındaki ilişkiler aktarılmıştır. Sonuç olarak kategorik regresyon, sıralı lojistik regresyon ve optimal ölçekleme sonucu elde edilen kategori noktaları grafiği incelendiğinde, sonuçların küçük farklılıklar olmakla birlikte benzer olduğu, fakat bu üç yöntemin birlikte kullanılmasıyla daha kapsamlı değerlendirmelerin yapılabildiği görülmüştür. Çalışma genel olarak değerlendirildiğinde, optimal ölçekleme tekniklerinden olan kategorik regresyonun, lojistik regresyona alternatif bir teknik olabileceği ve kategorik değişkenlerin yer aldığı modellerde, kategorik regresyon ve diğer optimal ölçekleme teknikleri ile çözümlemelerin yapılabileceği görülmüştür.

87 71 KAYNAKÇA Agresti, A. (2007). Categorical Data Analysis, 2. Edition, John Wiley & Sons Publication, New Jersey. Akın, H.B. ve Şentürk, E. (2012). Bireylerin Mutluluk Düzeylerinin Ordinal Lojistik Regresyon Analizi ile İncelenmesi, Öneri Dergisi, 10(37); Alpar, R. (2013). Uygulamalı Çok Değişkenli İstatistiksel Yöntemler, Detay Yayıncılık, Ankara. Altaş, D. ve Giray, S. (2013). Dünyadaki En Önemli Problem Algısının Optimal Ölçeklemeli Çok Değişkenli İstatistiksel Yöntemlerle İncelenmesi, Öneri Dergisi, 10(39); Andrews, F. M. and Messenger, R.C. (1973). Multivariate Nominal Scale Analysis, 1. Edition, Institute for Social Research, The University of Michigan. Başarır, G. (1990). Çok Değişkenli Verilerde Ayrımsama Sorunu ve Lojistik Regresyon Analizi, Yayınlanmamış Doktora Tezi, Hacettepe Üniversitesi Fen Bilimleri Enstitüsü. Bayram, N. ve Ertaş, S. (2001). Tüketim Harcamaları Davranış Biçimi: PRINCALS ve OVERALS Yaklaşımı, V. Ulusal Ekonometri ve İstatistik Enstitüsü: İstatistik Araştırma Sempozyumu. Bernhardt, K. and Kinnear, T. (1976). Categorical Regression in Marketing, Journal of Business Research, 4(4); Bilgiç, M.S. ve Akyürek, S. (2009). Güneydoğu Sorununun Sosyolojik Analizi (Yayınlanmamış Araştırma Raporu), Bilge Adamlar Stratejik Araştırmalar Merkezi (BİLGESAM), Ankara. Burmaoğlu, S. (2009). Birleşmiş Milletler Kalkınma Programı Beşeri Kalkınma Endeksi Verilerini Kullanarak Diskriminant Analizi, Lojistik Regresyon ve Yapay Sinir Ağlarının Sınıflandırma Başarılarının Değerlendirilmesi, Yayınlanmamış Doktora Tezi, Atatürk Üniversitesi Sosyal Bilimler Enstitüsü. Bülbül, Ş., Giray, S. (2012). İş ve Özel Yaşam (İş Dışı Yaşam) Memnuniyeti Arasındaki İlişki Yapısının Doğrusal Olmayan Kanonik Korelasyon Analizi ile İncelenmesi, Anadolu Üniversitesi Sosyal Bilimler Dergisi, 12(4); Capretz, Xu, J. and Ho, F.D. (2010). Buiding an OSS Quality Estimation Model with CATREG, International Journal on Computer Science and Engineering, 2(6); Cecil, M.J. (2006). The Relationship Between Student Responses on the National Survey Of Student Engagement (Nsse) and Performance on the Critical-Thinking Assessment Test (Cat), Unpublished Ph.D.Thesis, Tennessee Technological University Faculty of the Graduate School, USA.

88 72 Cengiz, D. (2008). Kategorik Regresyon Analizi ile Öğrencilerin Benlik Algılarını Etkileyen Özelliklerin Belirlenmesi, Öneri Dergisi, 8(29); Çilan, Ç.A. ve Can, M. (2014). Measuring Factors Effecting MBA Students Academic Performance by Using Categorical Regression Analysis: A Case Study of Institution of Business Economics, Istanbul University, Procedia - Social and Behavioral Sciences (122); Çokluk, Ö., Şekercioğlu, G. ve Büyüköztürk, Ş. (2014). Sosyal Bilimler için Çok Değişkenli İstatistik: SPSS ve LISREL Uygulamaları, 3.Baskı, Pegem Akademi Yayınları, Ankara. De Leeuw, J., Young, F.W. and Takane, Y. (1976). Additive Structure in Qualitative Data, Psychometrika, (41); Duran, C. (2007). Yönetimde Kalite Güvence Sistemleri ve Hastanelerde Bir Uygulama, Yayınlanmamış Doktora Tezi, Gazi Üniversitesi Sosyal Bilimler Enstitüsü. Durmuş, B., Yurtkoru, E.S. ve Çinko, M. (2013). Sosyal Bilimlerde SPSS ile Veri Analizi, 5.Baskı, Beta Yayınevi, İstanbul. Field, A. (2009). Discovering Statistics Using SPSS, Sage Publications, London. Gifi, A. (1981). Nonlinear Multivariate Analysis, John Wiley & Sons, 1st Edition, New York. Gifi, A. (1990). Nonlinear Multivariate Analysis, John Wiley & Sons, 2nd Editon, New York. Gifi, A. (1996). Nonlinear Multivariate Analysis, John Wiley & Sons, 3rd Editon, New York. Giray, S. (2011). Doğrusal Olmayan Kanonik Korelasyon Analizi ve Yaşam Memnuniyeti Üzerine Bir Uygulama, Yayınlanmamış Doktora Tezi, Marmara Üniversitesi Sosyal Bilimler Enstitüsü. Greenacre, M.J. (1984). Theory and Applications of Correspondance Analysis, London Academic Press. Greenacre, M.J. (1993). Correspondence Analysis in Practice, 2.Edition, Bocu Raton: Chapman & Hall Publication. Guttman, L. (1968). A General Nonmetric Technique for Finding the Smallest Coordinate Space for a Configuration of Points, Psychometrika, (33); Gürdal, H. (2014). Kansei Mühendisliği ve Akıllı Cep Telefonu Dış Görünüm Tasarım Örneği, Yayınlanmamış Yüksek Lisans Tezi, Anadolu Üniversitesi Sosyal Bilimler Enstitüsü. Hosmer, D.W. and Lemeshow, S. (2013). Applied Logistic Regression, John Wiley & Sons, Canada. IBM SPSS Statistics 20.0 Algorithms, (2011). SPSS, Inc., USA. Kalaycı, Ş. (2010). SPSS Uygulamalı Çok Değişkenli İstatistik Teknikleri, 3.Baskı, Asil Yayınevi, Ankara.

89 73 Kleinbaum, D.G. (1994). Logistic Regression: A Self-Learning Text, 1.Edition. Springer- Verlag Publication, NewYork. Koeppe, K. (2014). Attitudes And Beliefs of Seventh-Day Adventists Concerning Psychology, Counseling and Mental Health Issues, Unpublished Master Thesis, Andrews University School of Education, USA. Kooij, A.J., Van Der, Meulman, J.J. and Heiser, W.J. (2006). Local Minima in Categorical Multiple Regression, Computational Statistics & Data Analysis, 50(2); Kruskal, J.B. (1964). Multidimensional Scaling by Optimizing Goodness Of Fit to a Nonmetric Hypothesis, Pschyometrika, (29); Kruskal, J.B. (1965). Analysis of Factorial Experiments by Estimating Monotone Transformarions of the Data, J. Roy Stastical Soc.Ser., (B27); Lanzotti, A., Tarantino,P. and Matrone, G. (2008). An Empirical Approach to Optimal Experimental Design Selection and Data Analysis for the Synthesis Phase of Kansei Engineering, Proceedings of 11th QMOD Conference, Helsinborg, Sweden. Mair,P. and De Leeuw, J. (2007). A General Framework for Multivariate Analysis with Optimal Scaling: The R Package Aspect, Department of Statistics Papers, University Of California. Meulman, J. J. and Heiser, W. J. (2012). SPSS Categories 20.0, SPSS Inc., USA. Meulman, J.J (2004). Optimal Scaling Methods for Multivariate Categorical Data Analysis, SPSS White Paper. Michailidis, G. and De Leeuw, J. (1998). The Gifi System of Descriptive Multivariate Analysis, Statistical Science, 13(4); Nishisato, S. (1980). Analysis of Categorical Data: Dual Scaling and its Applications, 1st Edition, University of Toronto Press, Toronto. Nishisato, S. (1994). Elements of Dual Scaling: An Introduction to Practical Data Analysis, Hillsdale, NJ: Lawrence Erlbaum. Nishisato, S. (2004). Dual Scaling: in The SAGE Handbook of Quantitative Methodology for the Social Sciences, Editor: David Kaplan, Sage Publications, California. Ponnam, A., Sahoo, D. and Balaji, M. (2011). Satisfaction-Based Segmentation:Application Of Kano Model in Indian Fast-Food Industry, Journal of Targeting, Measurement and Analysis for Marketing, (19); Pratt, J.W. (1987). Dividing the indivisible: Using simple symmetry to partition variance explained, Proceedings of the Second International Conference in Statistics, University of Tampere, Finland, Ramos, M. and Carvalho, H. (2011). Perceptions of Quantitative Methods in Higher Education: Mapping Student Profiles, Springer Science and Business Media B.V.

90 74 Ready, J. (2012). Categorical Regression Analysis of Yellow Pages Advertising, Unpublished Master Thesis, Walden University, USA. Rouse,E.W. (2014). Test Drivers of Candidate Pass Rates: A Predictive Model for Professional Certification Exams, Unpublished Ph.D.Thesis, Northcentral University, Graduate Faculty of the School of Business and Technology Management,, USA. Schlegel, N.Y., Krezel, Z.A. and Mc Manus,K.J. (2011). Data Mining Techniques for Assesment of Factors Contributing to Damage of Residential Houses in Australia, Proceedings of Second International Conference on Soft Computing Technology in Civil, Structural and Environmental Engineering, Scotland, Shepard, R.N. (1962). The Analysis of Proximities: Multidimensional Scaling with an Unknown Distance Function, Psychometrika, (27); Shrestha,S.L. (2009). Categorical Regression Models with Optimal Scaling for Predicting Indoor Air Pollution Concentrations inside Kitchens in Nepalese Households, Nepal Journal of Science and Technology, (10); Suner, A. ve Çelikoğlu, C. (2008). Uygunluk Analizinin Benzer Çok Değişkenli Analiz Yöntemleri ile Karşılaştırılması, İstatistikçiler Dergisi, (1); Tabachnick, B. G. and Fidel, L.S. (2001). Using Multivariate Statistics, Fourth Edition, MA: Allyn & Bacon, Inc. Uzgören, N. (2007). Uyum Analizinin Teorik Esasları ve Regresyon Analizi İle Benzerliğinin Grafiksel Boyutta Karşılaştırılması, Dumlupınar Üniversitesi Sosyal Bilimler Dergisi, (18). Ünver, Ö., Gamgam, H. ve Altunkaynak, B. (2013). Temel İstatistiksel Yöntemler, 7.Baskı, Seçkin Yayıncılık, Ankara. Van de G. and John, P. (1993). Multivariate Analysis of Categorical Data: Theory. 2. Edition. Sage Publication, California. Wu, J. (1993). New Approaches Using Chemometric Methods: Categorical Regression Analysis and Comparison of Maximum-Minimum Distance Clustering with Other Methods, Unpublished Ph.D.Thesis, City University of New York Graduate Faculty in Chemistry, USA. Yazıcı, A.C., Öğüş,E., Ankaralı, H. ve Gürbüz, F. (2010). An Application of Nonlinear Canonical Correlation Analysis on Medical Data, Turkish Journal of Medical Sciences, 40(3); Young, F.W., De Leeuw, J. and Takane, Y. (1976). Regression with Qualitative and Quantitative Variables: An Alternating Least Squares Method with Optimal Scaling Features, Psychometrika, (41);

91 75 ÖZGEÇMİŞ Kişisel Bilgiler Soyadı, adı Uyruğu Doğum tarihi ve yeri Medeni hali Telefon GÜÇ, Kadir : T.C. : , İstanbul : Bekâr : 0 (312) (Dahili:4346) : kguec@kho.edu.tr Eğitim Derece Yüksek Lisans Eğitim Birimi Gazi Üniversitesi/İstatistik Mezuniyet tarihi Devam ediyor Lisans İstanbul Ticaret Üniversitesi/İstatistik 2011 Lise Vefa Poyraz Lisesi (Y.D.A.) 2006 İş Deneyimi Yıl Yer Görev 2013-Halen Kara Harp Okulu Araştırma Görevlisi Yabancı Dil İngilizce Yayınlar Yıldız, M., Güç, K., Erdem, S. (2014). Stresle Başa Çıkma Tutumlarının İnsani Değerler Açısından İncelenmesi: Kamu Kurumu Çalışanları Üzerine Bir Çalışma, 2.Ulusal Örgütsel Davranış Kongresi, Melikşah Üniversitesi, 7-9 Kasım 2014 Kaba, İ., Erol, M. Güç, K. (2015). Yetişkin Yaşam Doyum Ölçeği (YYDÖ): Geçerlik ve Güvenirlik Çalışması, 24.Ulusal Eğitim Bilimleri Kongresi, Niğde Üniversitesi, Nisan 2015 Güç, K., Başar, E. (2015). Investigation Of Confidence to Turkish Armed Forces with Optimal Scaling Methods, 16th International Symposium on Econometrics, Operation Research and Statistics, Trakya University, 7-12 May 2015 Hobiler : Halı Sahada Futbol Oynama, Tiyatro

92 GAZİ GELECEKTİR

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ 1 BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık KORELASYON ve REGRESYON ANALİZİ Doç. Dr. İrfan KAYMAZ Tanım Bir değişkenin değerinin diğer değişkendeki veya değişkenlerdeki değişimlere bağlı olarak nasıl etkilendiğinin istatistiksel

Detaylı

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı ARAŞTIRMA MODELLİLERİNDE KULLANILACAK İSTATİSTİKLERİ BELİRLEME ÖLÇÜTLERİ Parametrik mi Parametrik Olmayan mı? Kullanılacak İstatistikleri Belirleme Ölçütleri Değişken Sayısı Tek değişkenli (X) İki değişkenli

Detaylı

BÖLÜM 2 VERİ SETİNİN HAZIRLANMASI VE DÜZENLENMESİ

BÖLÜM 2 VERİ SETİNİN HAZIRLANMASI VE DÜZENLENMESİ 1 BÖLÜM 2 VERİ SETİNİN HAZIRLANMASI VE DÜZENLENMESİ Veri seti; satırlarında gözlem birimleri, sütunlarında ise değişkenler bulunan iki boyutlu bir matristir. Satır ve sütunların kesişim bölgelerine 'hücre

Detaylı

BÖLÜM 13 HİPOTEZ TESTİ

BÖLÜM 13 HİPOTEZ TESTİ 1 BÖLÜM 13 HİPOTEZ TESTİ Bilimsel yöntem aşamalarıyla tanımlanmış sistematik bir bilgi üretme biçimidir. Bilimsel yöntemin aşamaları aşağıdaki gibi sıralanabilmektedir (Karasar, 2012): 1. Bir problemin

Detaylı

İÇİNDEKİLER ÖN SÖZ...

İÇİNDEKİLER ÖN SÖZ... İÇİNDEKİLER ÖN SÖZ... v GİRİŞ... 1 1. İSTATİSTİK İN TARİHÇESİ... 1 2. İSTATİSTİK NEDİR?... 3 3. SAYISAL BİLGİDEN ANLAM ÇIKARILMASI... 4 4. BELİRSİZLİĞİN ELE ALINMASI... 4 5. ÖRNEKLEME... 5 6. İLİŞKİLERİN

Detaylı

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ 1 BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel sayma

Detaylı

ÖRNEK BULGULAR. Tablo 1: Tanımlayıcı özelliklerin dağılımı

ÖRNEK BULGULAR. Tablo 1: Tanımlayıcı özelliklerin dağılımı BULGULAR Çalışma tarihleri arasında Hastanesi Kliniği nde toplam 512 olgu ile gerçekleştirilmiştir. Olguların yaşları 18 ile 28 arasında değişmekte olup ortalama 21,10±1,61 yıldır. Olguların %66,4 ü (n=340)

Detaylı

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı REGRESYON ANALİZİ VE UYGULAMA Yrd. Doç. Dr. Hidayet Takcı htakci@cumhuriyet.edu.tr Sunum içeriği Bu sunumda; Lojistik regresyon konu anlatımı Basit doğrusal regresyon problem çözümleme Excel yardımıyla

Detaylı

Korelasyon, Korelasyon Türleri ve Regresyon

Korelasyon, Korelasyon Türleri ve Regresyon Korelasyon, Korelasyon Türleri ve Regresyon İçerik Korelasyon Korelasyon Türleri Korelasyon Katsayısı Regresyon KORELASYON Korelasyon iki ya da daha fazla değişken arasındaki doğrusal ilişkiyi gösterir.

Detaylı

İstatistikçiler Dergisi

İstatistikçiler Dergisi www.istatistikciler.org İstatistikçiler Dergisi 1 (2008) 9-15 İstatistikçiler Dergisi UYGUNLUK ANALİZİNİN BENZER ÇOK DEĞİŞKENLİ ANALİZ YÖNTEMLERİ İLE KARŞILAŞTIRILMASI Aslı SUNER Dokuz Eylül Üniversitesi

Detaylı

DOĞRUSAL OLMAYAN KANONİK KORELASYON ANALİZİ VE LOKANTA MÜŞTERİLERİNİN MEMNUNİYETİ ÜZERİNDE BİR UYGULAMA

DOĞRUSAL OLMAYAN KANONİK KORELASYON ANALİZİ VE LOKANTA MÜŞTERİLERİNİN MEMNUNİYETİ ÜZERİNDE BİR UYGULAMA EKEV AKADEMİ DERGİSİ Yıl: 16 Sayı: 51 (Bahar 2012) 357 DOĞRUSAL OLMAYAN KANONİK KORELASYON ANALİZİ VE LOKANTA MÜŞTERİLERİNİN MEMNUNİYETİ ÜZERİNDE BİR UYGULAMA Zeynep FİLİZ (*) Sıdıka Kolukısaoğlu (**)

Detaylı

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37 İÇİNDEKİLER BÖLÜM 1 Değişkenler ve Grafikler 1 İstatistik 1 Yığın ve Örnek; Tümevarımcı ve Betimleyici İstatistik 1 Değişkenler: Kesikli ve Sürekli 1 Verilerin Yuvarlanması Bilimsel Gösterim Anlamlı Rakamlar

Detaylı

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız. .4. Merkezi Eğilim ve Dağılım Ölçüleri Merkezi eğilim ölçüleri kitleye ilişkin bir değişkenin bütün farklı değerlerinin çevresinde toplandığı merkezi bir değeri gösterirler. Dağılım ölçüleri ise değişkenin

Detaylı

Zeliha SARAÇLI Arþ. Gör., Eskiþehir Osmangazi Üniversitesi Ýþletme Bölümü zelihak@ogu.edu.tr

Zeliha SARAÇLI Arþ. Gör., Eskiþehir Osmangazi Üniversitesi Ýþletme Bölümü zelihak@ogu.edu.tr skiþehir Osmangazi Üniversitesi ÝÝBF. Öðrencilerinin Demografik Özellikleri ile Üniversite Sorunlarý Arasýndaki Ýliþkinin Doðrusal Olmayan anonik orelasyon Analizi ile Ýncelenmesi Zeliha SARAÇLI Arþ. Gör.,

Detaylı

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız. Örnek Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız. i. ii. X 1 2 3 4 1 2 3 4 Y 2 3 4 5 4 3 2 1 Örnek Aşağıdaki veri

Detaylı

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ I Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ II Yayın No : 2845 Teknik Dizisi : 158 1. Baskı Şubat 2013 İSTANBUL ISBN 978-605 - 377 868-4 Copyright Bu kitabın bu basısı için Türkiye deki yayın hakları BETA

Detaylı

YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI. Sibel SELİM 1 Efe SARIBAY 2

YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI. Sibel SELİM 1 Efe SARIBAY 2 Dokuz Eylül Üniversitesi Sosyal Bilimler Enstitüsü Dergisi Cilt 5, Sayı:2, 2003 YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI Sibel SELİM 1 Efe SARIBAY

Detaylı

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1 3. TAHMİN 3.1. En Küçük Kareler (EKK) Yöntemi 1 En Küçük Kareler (EKK) yöntemi, regresyon çözümlemesinde en yaygın olarak kullanılan, daha sonra ele alınacak bazı varsayımlar altında çok aranan istatistiki

Detaylı

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN KORELASYON VE REGRESYON ANALİZİ Doç. Dr. Bahar TAŞDELEN Günlük hayattan birkaç örnek Gelişim dönemindeki bir çocuğun boyu ile kilosu arasındaki ilişki Bir ailenin tükettiği günlük ekmek sayısı ile ailenin

Detaylı

2- VERİLERİN TOPLANMASI

2- VERİLERİN TOPLANMASI 2- VERİLERİN TOPLANMASI Bu bölümde yararlanılan kaynaklar: İşletme İstatistiğine Giriş (Prof. Dr. İsmail Hakkı Armutlulu) ve İşletme İstatistiğinin Temelleri (Bowerman, O Connell, Murphree, Orris Editör:

Detaylı

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER Gözden Geçirilmiş ve Genişletilmiş 8. Baskı Frekans Dağılımları Varyans Analizi Merkezsel

Detaylı

2. BASİT DOĞRUSAL REGRESYON 12

2. BASİT DOĞRUSAL REGRESYON 12 1. GİRİŞ 1 1.1 Regresyon ve Model Kurma / 1 1.2 Veri Toplama / 5 1.3 Regresyonun Kullanım Alanları / 9 1.4 Bilgisayarın Rolü / 10 2. BASİT DOĞRUSAL REGRESYON 12 2.1 Basit Doğrusal Regresyon Modeli / 12

Detaylı

GİRİŞ. Bilimsel Araştırma: Bilimsel bilgi elde etme süreci olarak tanımlanabilir.

GİRİŞ. Bilimsel Araştırma: Bilimsel bilgi elde etme süreci olarak tanımlanabilir. VERİ ANALİZİ GİRİŞ Bilimsel Araştırma: Bilimsel bilgi elde etme süreci olarak tanımlanabilir. Bilimsel Bilgi: Kaynağı ve elde edilme süreçleri belli olan bilgidir. Sosyal İlişkiler Görgül Bulgular İşlevsel

Detaylı

İSTATİSTİKTE TEMEL KAVRAMLAR

İSTATİSTİKTE TEMEL KAVRAMLAR İSTATİSTİKTE TEMEL KAVRAMLAR 1. ve 2. Hafta İstatistik Nedir? Bir tanım olarak istatistik; belirsizlik altında bir konuda karar verebilmek amacıyla, ilgilenilen konuya ilişkin verilerin toplanması, düzenlenmesi,

Detaylı

MEÜ. SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ DERS TANIMI FORMU

MEÜ. SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ DERS TANIMI FORMU MEÜ. SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ DERS TANIMI FORMU Dersin Adı-Kodu: BİS 601 Örnek Genişliği ve Güç Programın Adı: Biyoistatistik Dersin düzeyi Doktora Ders saatleri ve Teori Uyg. Lab. Proje/Alan Çalışması

Detaylı

BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr 1 Bir değişkenin değerinin,

Detaylı

BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr

Detaylı

ÇOK DEĞĐŞKENLĐ ĐSTATĐSTĐKLERĐN ARAŞTIRMALARDA KULLANIMI

ÇOK DEĞĐŞKENLĐ ĐSTATĐSTĐKLERĐN ARAŞTIRMALARDA KULLANIMI ÇOK DEĞĐŞKENLĐ ĐSTATĐSTĐKLERĐN ARAŞTIRMALARDA KULLANIMI Araştırmalarda incelenen olaylar göstermektedir ki tek değişkenli istatistiklerin kullanılması problemi açıklamakta yetersiz ve eksik kalmaktadır.

Detaylı

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma... İçindekiler İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii BÖLÜM 1 Ölçme, İstatistik ve Araştırma...1 Ölçme Nedir?... 3 Ölçme Süreci... 3 Değişkenler

Detaylı

İSTATİSTİK I KISA ÖZET KOLAYAOF

İSTATİSTİK I KISA ÖZET KOLAYAOF DİKKATİNİZE: BURADA SADECE ÖZETİN İLK ÜNİTESİ SİZE ÖRNEK OLARAK GÖSTERİLMİŞTİR. ÖZETİN TAMAMININ KAÇ SAYFA OLDUĞUNU ÜNİTELERİ İÇİNDEKİLER BÖLÜMÜNDEN GÖREBİLİRSİNİZ. İSTATİSTİK I KISA ÖZET KOLAYAOF 2 Kolayaof.com

Detaylı

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ DÖNEM I-I. DERS KURULU Konu: Bilimsel yöntem ve istatistik Amaç: Biyoistatistiğin tıptaki önemini kavrar ve sonraki dersler için gerekli terminolojiye hakim olur.

Detaylı

Tekrarlı Ölçümler ANOVA

Tekrarlı Ölçümler ANOVA Tekrarlı Ölçümler ANOVA Repeated Measures ANOVA Aynı veya ilişkili örneklemlerin tekrarlı ölçümlerinin ortalamalarının aynı olup olmadığını test eder. Farklı zamanlardaki ölçümlerde aynı (ilişkili) kişiler

Detaylı

UYGULAMA 1 SPSS E GİRİŞ. SPSS; File, Edit, View, Data, Transform, Analyze, Graphs, Utilities, Window, Help adlı 10 adet program menüsü içermektedir.

UYGULAMA 1 SPSS E GİRİŞ. SPSS; File, Edit, View, Data, Transform, Analyze, Graphs, Utilities, Window, Help adlı 10 adet program menüsü içermektedir. 1 UYGULAMA 1 SPSS E GİRİŞ SPSS; File, Edit, View, Data, Transform, Analyze, Graphs, Utilities, Window, Help adlı 10 adet program menüsü içermektedir. Bu menülerin işlevleri ve alt menüleri ile komutları

Detaylı

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 ) 4. SUNUM 1 Gözlem ya da deneme sonucu elde edilmiş sonuçların, rastlantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel yöntemlere HİPOTEZ TESTLERİ denir. Sonuçların rastlantıya bağlı

Detaylı

ÜNİTE:1. İstatistiğin Tanımı, Temel Kavramlar ve İstatistik Eğitimi ÜNİTE:2. Veri Derleme, Düzenleme ve Grafiksel Çözümleme ÜNİTE:3

ÜNİTE:1. İstatistiğin Tanımı, Temel Kavramlar ve İstatistik Eğitimi ÜNİTE:2. Veri Derleme, Düzenleme ve Grafiksel Çözümleme ÜNİTE:3 ÜNİTE:1 İstatistiğin Tanımı, Temel Kavramlar ve İstatistik Eğitimi ÜNİTE:2 Veri Derleme, Düzenleme ve Grafiksel Çözümleme ÜNİTE:3 Ortalamalar, Değişkenlik ve Dağılma Ölçüleri ÜNİTE:4 Endeksler ÜNİTE:5

Detaylı

OLASILIK ve KURAMSAL DAĞILIMLAR

OLASILIK ve KURAMSAL DAĞILIMLAR OLASILIK ve KURAMSAL DAĞILIMLAR Kuramsal Dağılımlar İstatistiksel çözümlemelerde; değişkenlerimizin dağılma özellikleri, çözümleme yönteminin seçimi ve sonuçlarının yorumlanmasında önemlidir. Dağılma özelliklerine

Detaylı

Matris Cebiriyle Çoklu Regresyon Modeli

Matris Cebiriyle Çoklu Regresyon Modeli Matris Cebiriyle Çoklu Regresyon Modeli Hüseyin Taştan Mart 00 Klasik Regresyon Modeli k açıklayıcı değişkenden oluşan regresyon modelini her gözlem i için aşağıdaki gibi yazabiliriz: y i β + β x i + β

Detaylı

İÇİNDEKİLER 1. GİRİŞ...

İÇİNDEKİLER 1. GİRİŞ... İÇİNDEKİLER 1. GİRİŞ... 1 1.1. Regresyon Analizi... 1 1.2. Uygulama Alanları ve Veri Setleri... 2 1.3. Regresyon Analizinde Adımlar... 3 1.3.1. Problemin İfadesi... 3 1.3.2. Konu ile İlgili Potansiyel

Detaylı

Ders 8: Verilerin Düzenlenmesi ve Analizi

Ders 8: Verilerin Düzenlenmesi ve Analizi Ders 8: Verilerin Düzenlenmesi ve Analizi Betimsel İstatistik Merkezsel Eğilim Ölçüleri Dağılım Ölçüleri Grafiksel Gösterimler Bir kitlenin tamamını, ya da kitleden alınan bir örneklemi özetlemekle (betimlemekle)

Detaylı

İçindekiler. Pazarlama Araştırmalarının Önemi

İçindekiler. Pazarlama Araştırmalarının Önemi İçindekiler Birinci Bölüm Pazarlama Araştırmalarının Önemi 1.1. PAZARLAMA ARAŞTIRMALARININ TANIMI VE ÖNEMİ... 1 1.2. PAZARLAMA ARAŞTIRMASI İŞLEVİNİN İŞLETME ORGANİZASYONU İÇİNDEKİ YERİ... 5 1.3. PAZARLAMA

Detaylı

TEZSİZ YÜKSEK LİSANS PROJE ONAY FORMU. Eğitim Bilimleri Anabilim Dalı Eğitim Yönetimi, Denetimi, Planlaması ve Ekonomisi

TEZSİZ YÜKSEK LİSANS PROJE ONAY FORMU. Eğitim Bilimleri Anabilim Dalı Eğitim Yönetimi, Denetimi, Planlaması ve Ekonomisi III TEZSİZ YÜKSEK LİSANS PROJE ONAY FORMU Eğitim Bilimleri Anabilim Dalı Eğitim Yönetimi, Denetimi, Planlaması ve Ekonomisi Bilim Dalı öğrencisi Taşkın Osman YILDIZ tarafından hazırlanan Lise Öğrencilerinin

Detaylı

BİYOİSTATİSTİK. Uygulama 6. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK. Uygulama 6. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK Uygulama 6 Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr Soru 1 İlaç malzemelerinin kalitesini

Detaylı

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir. ÇIKARSAMALI İSTATİSTİKLER Çıkarsamalı istatistikler, örneklemden elde edilen değerler üzerinde kitleyi tanımlamak için uygulanan istatistiksel yöntemlerdir. Çıkarsamalı istatistikler; Tahmin Hipotez Testleri

Detaylı

QUANTILE REGRESYON * Quantile Regression

QUANTILE REGRESYON * Quantile Regression QUANTILE REGRESYON * Quantile Regression Fikriye KURTOĞLU İstatistik Anabilim Dalı Olcay ARSLAN İstatistik Anabilim Dalı ÖZET Bu çalışmada, Lineer Regresyon analizinde kullanılan en küçük kareler yöntemine

Detaylı

Sosyodemografik Özellikler ile Mutluluk Algısı Arasındaki İlişki Yapısının Analizi

Sosyodemografik Özellikler ile Mutluluk Algısı Arasındaki İlişki Yapısının Analizi EGE AKADEMİK BAKIŞ / EGE ACADEMIC REVIEW Cilt: 11 Özel Sayı 2011 ss. 113-123 Sosyodemografik Özellikler ile Mutluluk Algısı Arasındaki İlişki Yapısının Analizi Analysis of the Relationship Structure Between

Detaylı

İçindekiler. Ön Söz... xiii

İçindekiler. Ön Söz... xiii İçindekiler Ön Söz.................................................... xiii Bölüm 1 İstatistiğe Giriş....................................... 1 1.1 Giriş......................................................1

Detaylı

Geçmişten Günümüze Kastamonu Üniversitesi Dergisi: Yayımlanan Çalışmalar Üzerine Bir Araştırma 1

Geçmişten Günümüze Kastamonu Üniversitesi Dergisi: Yayımlanan Çalışmalar Üzerine Bir Araştırma 1 Mart 2017 Cilt:25 No:2 Kastamonu Eğitim Dergisi xii-xxi Geçmişten Günümüze Kastamonu Üniversitesi Dergisi: Yayımlanan Çalışmalar Üzerine Bir Araştırma 1 Lütfi İNCİKABI, Samet KORKMAZ, Perihan AYANOĞLU,

Detaylı

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir. BÖLÜM 1: FREKANS DAĞILIMLARI 1.1. Giriş İstatistik, rasgelelik içeren olaylar, süreçler, sistemler hakkında modeller kurmada, gözlemlere dayanarak bu modellerin geçerliliğini sınamada ve bu modellerden

Detaylı

1: DENEYLERİN TASARIMI VE ANALİZİ...

1: DENEYLERİN TASARIMI VE ANALİZİ... İÇİNDEKİLER Bölüm 1: DENEYLERİN TASARIMI VE ANALİZİ... 1 1.1. Deneyin Stratejisi... 1 1.2. Deneysel Tasarımın Bazı Tipik Örnekleri... 11 1.3. Temel Kurallar... 16 1.4. Deneyleri Tasarlama Prensipleri...

Detaylı

İSTATİSTİK STATISTICS (2+0) Yrd.Doç.Dr. Nil TOPLAN SAÜ.MÜH. FAK. METALURJİ VE MALZEME MÜH. BÖLÜMÜ ÖĞRETİM ÜYESİ ÖĞRETİM YILI

İSTATİSTİK STATISTICS (2+0) Yrd.Doç.Dr. Nil TOPLAN SAÜ.MÜH. FAK. METALURJİ VE MALZEME MÜH. BÖLÜMÜ ÖĞRETİM ÜYESİ ÖĞRETİM YILI İSTATİSTİK STATISTICS (+) Yrd.Doç.Dr. Nil TOPLAN SAÜ.MÜH. FAK. METALURJİ VE MALZEME MÜH. BÖLÜMÜ ÖĞRETİM ÜYESİ ÖĞRETİM YILI KONU BAŞLIKLARI :. İSTATİSTİĞE GİRİŞ. VERİLERİN DÜZENLENMESİ. MERKEZİ EĞİLİM ÖLÇÜLERİ.

Detaylı

İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications*

İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications* Ç.Ü. Fen Bilimleri Enstitüsü Yıl:010 Cilt:-1 İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications* Işıl FİDANOĞLU İstatistik Anabilim Dalı Fikri

Detaylı

BÖLÜM 12 STUDENT T DAĞILIMI

BÖLÜM 12 STUDENT T DAĞILIMI 1 BÖLÜM 12 STUDENT T DAĞILIMI 'Student t dağılımı' ya da kısaca 't dağılımı'; normal dağılım ve Z dağılımının da içerisinde bulunduğu 'sürekli olasılık dağılımları' ailesinde yer alan dağılımlardan bir

Detaylı

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI ÖNSÖZ İÇİNDEKİLER III Bölüm 1 İSTATİSTİK ve SAYISAL BİLGİ 11 1.1 İstatistik ve Önemi 12 1.2 İstatistikte Temel Kavramlar 14 1.3 İstatistiğin Amacı 15 1.4 Veri Türleri 15 1.5 Veri Ölçüm Düzeyleri 16 1.6

Detaylı

Duygu Aktürk 1* Geliş Tarihi: 27.07.2015 Kabul Tarihi: 24.08.2015

Duygu Aktürk 1* Geliş Tarihi: 27.07.2015 Kabul Tarihi: 24.08.2015 Geleneksel ve Organik Olarak Yetiştirilen Tarım Ürünlerine Karşı Tüketici Taleplerinin Doğrusal Olmayan Kanonik Korelasyon Analizi ile Değerlendirilmesi Duygu Aktürk 1* 1 Çanakkale Onsekiz Mart Üniversitesi,

Detaylı

Evren (Popülasyon) Araştırma kapsamına giren tüm elemanların oluşturduğu grup. Araştırma sonuçlarının genelleneceği grup

Evren (Popülasyon) Araştırma kapsamına giren tüm elemanların oluşturduğu grup. Araştırma sonuçlarının genelleneceği grup Evren (Popülasyon) Araştırma kapsamına giren tüm elemanların oluşturduğu grup Araştırma sonuçlarının genelleneceği grup Evrendeğer (Parametre): Değişkenlerin evrendeki değerleri µ : Evren Ortalaması σ

Detaylı

İÇİNDEKİLER. Birinci Bölüm UYGULAMA VERİLERİ

İÇİNDEKİLER. Birinci Bölüm UYGULAMA VERİLERİ İÇİNDEKİLER Birinci Bölüm UYGULAMA VERİLERİ VERİ GRUBU 1. Yüzücü ve Atlet Verileri... 1 VERİ GRUBU 2. Sutopu, Basketbol ve Voleybol Oyuncuları Verileri... 4 VERİ 3. Solunum Yolları Verisi... 7 VERİ 4.

Detaylı

LOJİSTİK REGRESYON ANALİZİ

LOJİSTİK REGRESYON ANALİZİ LOJİSTİK REGRESYON ANALİZİ Lojistik Regresyon Analizini daha kolay izleyebilmek için bazı terimleri tanımlayalım: 1. Değişken (incelenen özellik): Bireyden bireye farklı değerler alabilen özellik, fenomen

Detaylı

2. Klasik Kümeler-Bulanık Kümeler

2. Klasik Kümeler-Bulanık Kümeler 2. Klasik Kümeler-Bulanık Kümeler Klasik Küme Teorisi Klasik kümelerde bir nesnenin bir kümeye üye olması ve üye olmaması söz konusudur. Bu yaklaşıma göre istediğimiz özelliğe sahip olan bir birey, eleman

Detaylı

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ 1 İstatistik İstatistik, belirsizliğin veya eksik bilginin söz konusu olduğu durumlarda çıkarımlar yapmak ve karar vermek için sayısal verilerin

Detaylı

UYGUN HİPOTEZ TESTİNİN SEÇİMİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

UYGUN HİPOTEZ TESTİNİN SEÇİMİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı UYGUN HİPOTEZ TESTİNİN SEÇİMİ Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı ÖNEMLİLİK (Hipotez) TESTLERİ ü Önemlilik testleri, araştırma sonucunda elde edilen değerlerin ya da varılan

Detaylı

DÜNYADAKİ EN ÖNEMLİ SORUN ALGISININ OPTİMAL ÖLÇEKLEMELİ ÇOK DEĞİŞKENLİ İSTATİSTİKSEL YÖNTEMLER İLE İNCELENMESİ

DÜNYADAKİ EN ÖNEMLİ SORUN ALGISININ OPTİMAL ÖLÇEKLEMELİ ÇOK DEĞİŞKENLİ İSTATİSTİKSEL YÖNTEMLER İLE İNCELENMESİ Öneri.C.10.S.39. Ocak.2013.135-142. DÜNYADAKİ EN ÖNEMLİ SORUN ALGISININ OPTİMAL ÖLÇEKLEMELİ ÇOK DEĞİŞKENLİ İSTATİSTİKSEL YÖNTEMLER İLE İNCELENMESİ Dilek ALTAŞ 1, Selay GİRAY 2 1 Marmara Üniversitesi, İktisat

Detaylı

BÖLÜM 4 FREKANS DAĞILIMLARININ GRAFİKLE GÖSTERİLMESİ

BÖLÜM 4 FREKANS DAĞILIMLARININ GRAFİKLE GÖSTERİLMESİ BÖLÜM 4 FREKANS DAĞILIMLARININ GRAFİKLE GÖSTERİLMESİ Frekans dağılımlarının betimlenmesinde frekans tablolarının kullanılmasının yanı sıra grafik gösterimleri de sıklıkla kullanılmaktadır. Grafikler, görselliği

Detaylı

T.C. AMASYA ÜNİVERSİTESİ FEN BİLİMLER ENSTİTÜSÜ BİLİM DALI XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXX

T.C. AMASYA ÜNİVERSİTESİ FEN BİLİMLER ENSTİTÜSÜ BİLİM DALI XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXX EK [1] Dış Kapak Örneği Arial, 14 punto,ortalı,tek satır aralığı, büyük harf, bold. T.C. AMASYA ÜNİVERSİTESİ FEN BİLİMLER ENSTİTÜSÜ ANA BİLİM DALI BİLİM DALI 1,5 satır aralıklı 7 boşluk Tez Başlığı, ortalı,

Detaylı

Makale Gönderim Tarihi: Yayına Kabul Tarihi: DOI: /kauiibfd

Makale Gönderim Tarihi: Yayına Kabul Tarihi: DOI: /kauiibfd ÇALIŞANLARIN SOSYAL HAYAT TUTUMLARININ, DEMOGRAFİK ÖZELLİKLERİNE GÖRE OPTİMAL ÖLÇEKLEME TEKNİKLERİ İLE İNCELENMESİ Makale Gönderim Tarihi: 16.02.2018 Yayına Kabul Tarihi: 28.09.2018 Halim KAZAN Prof. Dr.

Detaylı

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1 İÇİNDEKİLER ÖNSÖZ... v 1. BÖLÜM Örneklem Genişliğinin Elde edilmesi... 1 1.1. Kitle ve Parametre... 1 1.2. Örneklem ve Tahmin Edici... 2 1.3. Basit Rastgele Örnekleme... 3 1.4. Tabakalı Rastgele Örnekleme...

Detaylı

İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t test) Ölçümle

Detaylı

Kaynak: A. İŞLİER, TESİS PLANLAMASI, 1997

Kaynak: A. İŞLİER, TESİS PLANLAMASI, 1997 Mühendislik Fakültesi Endüstri Mühendisliği Bölümü Doç. Dr. Nil ARAS ENM411 Tesis Planlaması 2016-2017 Güz Dönemi Kaynak: A. İŞLİER, TESİS PLANLAMASI, 1997 2 Tesis Yer Seçimi Problemi (TYSP) TEK AMAÇLI

Detaylı

TEMEL EĞİTİMDEN ORTAÖĞRETİME GEÇİŞ ORTAK SINAV BAŞARISININ ÇEŞİTLİ DEĞİŞKENLER AÇISINDAN İNCELENMESİ

TEMEL EĞİTİMDEN ORTAÖĞRETİME GEÇİŞ ORTAK SINAV BAŞARISININ ÇEŞİTLİ DEĞİŞKENLER AÇISINDAN İNCELENMESİ T.C. MİLLÎ EĞİTİM BAKANLIĞI ÖLÇME, DEĞERLENDİRME VE SINAV HİZMETLERİ GENEL MÜDÜRLÜĞÜ VERİ ANALİZİ, İZLEME VE DEĞERLENDİRME DAİRE BAŞKANLIĞI TEMEL EĞİTİMDEN ORTAÖĞRETİME GEÇİŞ ORTAK SINAV BAŞARISININ ÇEŞİTLİ

Detaylı

01.02.2013. Statistical Package for the Social Sciences

01.02.2013. Statistical Package for the Social Sciences Hipotezlerin test edilip onaylanması için çeşitli istatistiksel testler kullanılmaktadır. Fakat... Her istatistik teknik her tür analize elverişli değildir. Modele veya hipoteze uygun test istatistiği

Detaylı

İÇİNDEKİLER BİRİNCİ KISIM: TASARIM PAZARLAMA ARAŞTIRMASINA GİRİŞ

İÇİNDEKİLER BİRİNCİ KISIM: TASARIM PAZARLAMA ARAŞTIRMASINA GİRİŞ İÇİNDEKİLER ÖNSÖZ... v TEŞEKKÜR... vi İKİNCİ BASKIYA ÖNSÖZ VE TEŞEKKÜR... vii İÇİNDEKİLER... ix ŞEKİLLER LİSTESİ... xviii TABLOLAR LİSTESİ... xx BİRİNCİ KISIM: TASARIM BİRİNCI BÖLÜM PAZARLAMA ARAŞTIRMASINA

Detaylı

SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER. Abdullah Can

SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER. Abdullah Can SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER SPSS in üzerinde işlem yapılabilecek iki ana ekran görünümü vardır. DATA VIEW (VERİ görünümü) VARIABLE VIEW (DEĞİŞKEN görünümü) 1 DATA VIEW (VERİ görünümü) İstatistiksel

Detaylı

Uyum Analizi (Correspondence Analysis)

Uyum Analizi (Correspondence Analysis) YBS Ansiklopedi wwwybsansiklopedicom Cilt 3, Sayı 1, Mart 2016 Uyum Analizi (Correspondence Analysis) Abdullah Faruk KILIÇ a a Adıyaman University, Department of Educational Science Özet Bu yazıda uyum

Detaylı

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş Hipotez Testlerine Giriş Hipotez Testlerine Giriş Hipotez Testlerine Giriş Gözlem ya da deneme sonucu elde edilmiş sonuçların, raslantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel

Detaylı

Ekonometri I VARSAYIMLARI

Ekonometri I VARSAYIMLARI Ekonometri I ÇOK DEĞİŞKENLİ REGRESYON MODELİNİN VARSAYIMLARI Hüseyin Taştan Temmuz 23, 2006 İçindekiler 1 Varsayım MLR.1: Parametrelerde Doğrusallık 1 2 Varsayım MLR.2: Rassal Örnekleme 1 3 Varsayım MLR.3:

Detaylı

BÖLÜM 8 BİLGİSAYAR UYGULAMALARI - 2

BÖLÜM 8 BİLGİSAYAR UYGULAMALARI - 2 1 BÖLÜM 8 BİLGİSAYAR UYGULAMALARI - 2 Bu bölümde bir veri seti üzerinde betimsel istatistiklerin kestiriminde SPSS paket programının kullanımı açıklanmaktadır. Açıklamalar bir örnek üzerinde hareketle

Detaylı

BÖLÜM 1 İSTATİSTİK İLE İLGİLİ BAZI TEMEL KAVRAMLAR

BÖLÜM 1 İSTATİSTİK İLE İLGİLİ BAZI TEMEL KAVRAMLAR 1 BÖLÜM 1 İSTATİSTİK İLE İLGİLİ BAZI TEMEL KAVRAMLAR İstatistik öğrenmelerinde sıklıkla karşılaşılacak olan temel bazı kavramlar, eğitim alanına yönelik örnekleriyle birlikte aşağıda açıklanmaktadır. 1.1.

Detaylı

İstatistik Temel Kavramlar- Devam

İstatistik Temel Kavramlar- Devam İstatistik Temel Kavramlar- Devam 26.12.2016 Dr. Seher Yalçın 1 Değişken türleri Değişken; gözlemden gözleme farklı değerler alabilen objelere, niteliklere ya da durumlara denir (Arıcı, 2006). Bir özellik

Detaylı

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın. KUKLA DEĞİŞKENLİ MODELLER Bir kukla değişkenli modeller (Varyans Analiz Modelleri) Kukla değişkenlerin diğer kantitatif değişkenlerle alındığı modeller (Kovaryans Analizi Modeller) Kukla değişkenlerin

Detaylı

İSTATİSTİK 1. Ankara Üniversitesi Eğitim Bilimleri Fakültesi Ölçme ve Değerlendirme Anabilim Dalı. Yrd. Doç. Dr. C. Deha DOĞAN

İSTATİSTİK 1. Ankara Üniversitesi Eğitim Bilimleri Fakültesi Ölçme ve Değerlendirme Anabilim Dalı. Yrd. Doç. Dr. C. Deha DOĞAN İSTATİSTİK 1 Ankara Üniversitesi Eğitim Bilimleri Fakültesi Ölçme ve Değerlendirme Anabilim Dalı Yrd. Doç. Dr. C. Deha DOĞAN 4. ÇEŞİT YALAN VARDIR, BEYAZ YALAN YALAN KUYRUKLU YALAN İSTATİSTİK Rakamlar

Detaylı

TANIMLAYICI İSTATİSTİKLER

TANIMLAYICI İSTATİSTİKLER TANIMLAYICI İSTATİSTİKLER Tanımlayıcı İstatistikler ve Grafikle Gösterim Grafik ve bir ölçüde tablolar değişkenlerin görsel bir özetini verirler. İdeal olarak burada değişkenlerin merkezi (ortalama) değerlerinin

Detaylı

2001 ve 2008 Yılında Oluşan Krizlerin Faktör Analizi ile Açıklanması

2001 ve 2008 Yılında Oluşan Krizlerin Faktör Analizi ile Açıklanması 2001 ve 2008 Yılında Oluşan Krizlerin Faktör Analizi ile Açıklanması Mahmut YARDIMCIOĞLU Özet Genel anlamda krizler ekonominin olağan bir parçası haline gelmiştir. Sıklıkla görülen bu krizlerin istatistiksel

Detaylı

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3 KİTABIN İÇİNDEKİLER BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3 BÖLÜM-2.BİLİMSEL ARAŞTIRMA Belgesel Araştırmalar...7 Görgül Araştırmalar Tarama Tipi Araştırma...8

Detaylı

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ SAKARYA ÜNİVERSİTESİ BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ Hafta 11 Yrd. Doç. Dr. Halil İbrahim CEBECİ Bu ders içeriğinin basım, yayım ve satış hakları Sakarya Üniversitesi ne aittir. "Uzaktan

Detaylı

SPSS Uygulamalı Çok Değişkenli İstatistik Teknikleri

SPSS Uygulamalı Çok Değişkenli İstatistik Teknikleri Elementary Education Online, 12(1), k: 1 6, 2013. İlköğretim Online, 12(1), b:1 6, 2013. [Online]: http://ilkogretim online.org.tr KİTAP İNCELEMESİ SPSS Uygulamalı Çok Değişkenli İstatistik Teknikleri

Detaylı

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı KORELASYON VE REGRESYON ANALİZİ Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı İki ya da daha çok değişken arasında ilişki olup olmadığını, ilişki varsa yönünü ve gücünü inceleyen korelasyon

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık Rastgele Değişkenlerin Dağılımları I Prof. Dr. İrfan KAYMAZ Ders konusu Bu derste; Rastgele değişkenlerin tanımı ve sınıflandırılması Olasılık kütle fonksiyonu Olasılık yoğunluk

Detaylı

MATRİSEL ÇÖZÜM TABLOLARIYLA DUYARLILIK ANALİZİ

MATRİSEL ÇÖZÜM TABLOLARIYLA DUYARLILIK ANALİZİ SİMPLEKS TABLONUN YORUMU MATRİSEL ÇÖZÜM TABLOLARIYLA DUYARLILIK ANALİZİ Şu ana kadar verilen bir DP probleminin çözümünü ve çözüm şartlarını inceledik. Eğer orijinal modelin parametrelerinde bazı değişiklikler

Detaylı

İLERİ ARAŞTIRMA SORU HAVUZU

İLERİ ARAŞTIRMA SORU HAVUZU 1 ) Bir ölçümde bağımlı değişkenlerdeki farklılıkların bağımsız değişkenlerdeki farklılıkları nasıl etkilediğini aşağıdakilerden hangisi ölçer? A) Bağımlı Değişken B) Bağımsız Değişken C) Boş Değişken

Detaylı

UYGULAMA 2 TABLO YAPIMI

UYGULAMA 2 TABLO YAPIMI 1 UYGULAMA 2 TABLO YAPIMI Amaç: SPSS 10 istatistiksel paket programında veri girişi ve tablo yapımı. SPSS 10 istatistiksel paket programı ilk açıldığında ekrana gelen görüntü aşağıdaki gibidir. Bu pencere

Detaylı

Genel Graf Üzerinde Mutlak 1-merkez

Genel Graf Üzerinde Mutlak 1-merkez Genel Graf Üzerinde Mutlak 1-merkez Çözüm yöntemine geçmeden önce bazı tanımlara ihtiyaç vardır. Dikkate alınan G grafındaki düğümleri 1 den n e kadar numaralandırın. Uzunluğu a(i, j)>0 olarak verilen

Detaylı

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr İçerik Kümeleme İşlemleri Kümeleme Tanımı Kümeleme Uygulamaları Kümeleme Yöntemleri Kümeleme (Clustering) Kümeleme birbirine

Detaylı

ZAMAN SERİLERİNDE REGRESYON ANALİZİ

ZAMAN SERİLERİNDE REGRESYON ANALİZİ ZAMAN SERİLERİNDE REGRESYON ANALİZİ 1 1. GİRİŞ Trent, serinin genelinde yukarıya ya da aşağıya doğru olan hareketlere denmektedir. Bu hareket bazen düz bir doğru şeklinde olmaktadır. Bu tür harekete sahip

Detaylı

MehmetAli CANDAN. İstatistik ve Analiz Yöntemleri. Uygulamalı Eğitimi. Mali Müşavir, Eğitmen İşletme Bilim Uzmanı

MehmetAli CANDAN. İstatistik ve Analiz Yöntemleri. Uygulamalı Eğitimi. Mali Müşavir, Eğitmen İşletme Bilim Uzmanı İstatistik ve Analiz Yöntemleri Uygulamalı Eğitimi MehmetAli CANDAN Mali Müşavir, Eğitmen İşletme Bilim Uzmanı İstatistik Nedir? Araştırma Nedir? Ölçek Türleri ve Ölçek Belirleme Verileri Analize Hazırlama

Detaylı

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN Tanımlayıcı İstatistikler Yrd. Doç. Dr. Emre ATILGAN 1 Tanımlayıcı İstatistikler Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri 2 3 Aritmetik Ortalama Aritmetik ortalama,

Detaylı

İÇİNDEKİLER ÖNSÖZ Bölüm 1 SAYILAR 11 Bölüm 2 KÜMELER 31 Bölüm 3 FONKSİYONLAR

İÇİNDEKİLER ÖNSÖZ Bölüm 1 SAYILAR 11 Bölüm 2 KÜMELER 31 Bölüm 3 FONKSİYONLAR İÇİNDEKİLER ÖNSÖZ III Bölüm 1 SAYILAR 11 1.1. Sayı Kümeleri 12 1.1.1.Doğal Sayılar Kümesi 12 1.1.2.Tam Sayılar Kümesi 13 1.1.3.Rasyonel Sayılar Kümesi 14 1.1.4. İrrasyonel Sayılar Kümesi 16 1.1.5. Gerçel

Detaylı

Maksimizasyon s.t. İşçilik, saat) (Kil, kg)

Maksimizasyon s.t. İşçilik, saat) (Kil, kg) Simplex ile Çözüm Yöntemi Doç. Dr. Fazıl GÖKGÖZ 1 Doğrusal Programlama Modeli Maksimizasyon s.t. İşçilik, saat) (Kil, kg) 2 Doç. Dr. Fazıl GÖKGÖZ Yrd.Doç. Dr. Fazıl GÖKGÖZ 1 Modelin Standard Hali Maksimizasyon

Detaylı