KATEGORİK VERİLERİN ANALİZİ (Uyum İyiliği, Bağımsızlık ve Dağılıma Uygunluk Testleri)

Benzer belgeler
çözümlemesi; beklenen değer ile gözlenen değer arasındaki farkın araştırılması için kullanılır.(aralarındaki fark anlamlı mı?)

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Hazırlayan. Ramazan ANĞAY Kİ-KARE TEST İSTATİSTİĞİ

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

χ 2 Testi Mühendislikte İstatistik Yöntemler Bağımsızlık Testi Homojenlik Testi Uygunluk Testi

Parametrik Olmayan İstatistiksel Yöntemler IST

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

İstatistik ve Olasılık

İstatistik ve Olasılık

Yrd. Doç. Dr. Neşet Demirci, Balıkesir Üniversitesi NEF Fizik Eğitimi. Parametrik Olmayan Testler. Ki-kare (Chi-Square) Testi

Kİ-KARE (χ 2 ) TESTİ ve Mc NEMAR TESTİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

BÖLÜM 12 STUDENT T DAĞILIMI

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

MATE 211 BİYOİSTATİSTİK DÖNEM SONU SINAVI

NORMAL DAĞILIM VE ÖNEMLİLİK TESTLERİ İLE İLGİLİ PROBLEMLER

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

ANADOLU ÜNİVERSİTESİ. ENM 317 MÜHENDİSLİK İSTATİSTİĞİ İYİ UYUM TESTİ Prof.Dr. Nihal ERGİNEL

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

Ki- Kare Testi ANADOLU ÜNİVERSİTESİ. ENM 317 MÜHENDİSLİK İSTATİSTİĞİ İYİ UYUM TESTİ Prof.Dr. Nihal ERGİNEL

Parametrik Olmayan İstatistik. Prof. Dr. Cenk ÖZLER

Farklı iki ilaç(a,b) kullanan iki grupta kan pıhtılaşma zamanları farklı mıdır?

Kİ KARE TESTLERİ. Biyoistatistik (Ders 2: Ki Kare Testleri) Kİ-KARE TESTLERİ. Sağlıktan Yakınma Sigara Var Yok Toplam. İçen. İçmeyen.

İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı


İstatistik ve Olasılık

BÖLÜM 10 ÖRNEKLEME YÖNTEMLERİ

EME 3105 SİSTEM SİMÜLASYONU. Girdi Analizi Prosedürü. Dağılıma Uyum Testleri. Dağılıma Uyumun Kontrol Edilmesi. Girdi Analizi-II Ders 9

Önemlilik Testleri. Prof.Dr.İhsan HALİFEOĞLU

Bir Normal Dağılım Ortalaması İçin Testler

İstatistik ve Olasılık

K BAĞIMSIZ ÖRNEKLEM HİPOTEZ TESTLERİ

Hipotez Testleri. Mühendislikte İstatistik Yöntemler

BİYOİSTATİSTİK Olasılıkta Temel Kavramlar Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

EME Sistem Simülasyonu. Girdi Analizi Prosedürü. Olasılık Çizgesi. Dağılıma Uyumun Kontrol Edilmesi. Dağılıma İyi Uyum Testleri Ders 10

İki ortalama arasındaki farkın önemlilik testi

Sürekli Rastsal Değişkenler

OLASILIK ve KURAMSAL DAĞILIMLAR

Parametrik Olmayan İstatistik. Prof. Dr. Cenk ÖZLER

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Merkezi Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz.

Hipotez. Hipotez Testleri. Y. Doç. Dr. İbrahim Turan Nisan 2011

İstatistik Yöntemleri ve Hipotez Testleri

ĠKĠ ÖRNEKLEM TESTLERĠ

istatistik El 10 1_ ve 2_ sorular a Ş3 gldakl bilgilere göre Al 4 Bl 6 cı 7 Dl 8 Al 5 B) 12 CL 27 D) 28 E) 35 2Q 10 BS 4200-A

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Hipotez Testi. gibi hususlar ayrıbirer hipotezin konusudur. () Kafkas Üniversitesi May 23, / 11

HİPOTEZ TESTLERİ HİPOTEZ NEDİR?

Mühendislikte İstatistiksel Yöntemler

BİYOİSTATİSTİK. Uygulama 4. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Kategorik Veri Analizi

Herhangi bir oranın belli bir değere eşit olmadığını test etmek için kullanılır.

BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

İSTATİSTİK II. Hipotez Testleri 1

Evren (Popülasyon) Araştırma kapsamına giren tüm elemanların oluşturduğu grup. Araştırma sonuçlarının genelleneceği grup

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

Merkezi Yığılma ve Dağılım Ölçüleri

İkiden Çok Grup Karşılaştırmaları

2x2 ve rxc Boyutlu Tablolarla Hipotez Testleri

UYGUN HİPOTEZ TESTİNİN SEÇİMİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

HİPOTEZ TESTLERİ. Yrd. Doç. Dr. Emre ATILGAN

BÖLÜM 13 HİPOTEZ TESTİ

İstatistiksel Yorumlama

ĐŞLE 544 ĐSTATĐSTĐK ARA SINAV 11 Mayıs 2006

MATE211 BİYOİSTATİSTİK

İstatistiksel Karar Verme

Student t Testi. Doç. Dr. Ertuğrul ÇOLAK. Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

BİYOİSTATİSTİK PARAMETRİK TESTLER

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

İÇİNDEKİLER ÖN SÖZ...

MAK 210 SAYISAL ANALİZ

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

Ders 8: Verilerin Düzenlenmesi ve Analizi

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

Nokta ve Aralık Tahmini Merkezi Limit Teoremi Örneklem Dağılımı Hipotez Testlerine Giriş

Ankara Üniversitesi, SBF İstatistik 2 Ders Notları Prof. Dr. Onur Özsoy 1

İSTATİSTİK STATISTICS (2+0) Yrd.Doç.Dr. Nil TOPLAN SAÜ.MÜH. FAK. METALURJİ VE MALZEME MÜH. BÖLÜMÜ ÖĞRETİM ÜYESİ ÖĞRETİM YILI

İstatistik ve Olasılık

BİYOİSTATİSTİK. Uygulama 6. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Parametrik Olmayan Testler. İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

ÜSTEL DÜZLEŞTİRME YÖNTEMİ

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5

Parametrik Olmayan İstatistiksel Yöntemler IST

İSTATİSTİK. Bölüm 1 Giriş. Ankara Üniversitesi SBF İstatistik 1 Ders Notları Prof. Dr. Onur Özsoy 4/4/2018

İçindekiler. Ön Söz... xiii

Kalitatif Veri. 1. Kalitatif random değişkenler sınıflanabilen yanıtlar vermektedir. Örnek: cinsiyet (Erkek, Kız)

BİYOİSTATİSTİK Tek Örneklem ve İki Örneklem Hipotez Testleri Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

Olasılık ve Normal Dağılım

İstatistik ve Olasılık

Ki-Kare Bağımsızlık Analizi

Verilerin Düzenlenmesi

BİYOİSTATİSTİK Bazı Olasılık Dağılışları Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

DENEY 2. A) Bilgi Dağılım Fonksiyonunun Bulunması 1. ÖN BİLGİ

İstatistik ve Olasılık

Transkript:

KATEGORİK VERİLERİN ANALİZİ (Uyum İyiliği, Bağımsızlık ve Dağılıma Uygunluk Testleri) Günümüzde yapılan birçok araştırmada nitel değişkenler kullanılmaktadır. Göz rengi, saç rengi gibi bazı değişkenler yapıları gereği nitel olarak gözlenirler. Bunun yanında nicel olan bazı değişkenler de sınıflandırılarak nitel hale dönüştürülebilir. Örneğin belli bir bitkinin boyu göz önüne alındığında; bu bitkinin boyu cm olarak ölçülebileceği gibi belli bir cm den uzun ya da kısa olmak üzere iki sınıfa ayrılarak da incelenebilir. Böylece aslında nicel olan bir değişken nitel olarak gözlenmiş olur. Nitel yapıya sahip değişkenler üzerinde yapılan gözlemler genel olarak, belli özelliğe sahip olanların sayısı biçiminde ifade edilir. Örneğin bir sınıftaki renkli gözlü öğrencilerin sayısı ya da boyu 160 cm den kısa olanların sayısı gibi. Elimizde bu şekilde ölçülen değişkenlere ait gözlemler olduğunda bunlara ilişkin sonuç çıkarımı için daha önceki bölümlerde ifade ettiğimiz testleri kullanmak uygun değildir. Bu gibi durumlarda Ki-kare testleri kullanılmaktadır. 1. Uyum İyiliği Testleri Birçok araştırmada gözlenen frekansların hipotezinde öne sürülen teorik frekanslara uygun olup olmadığı araştırılmak istenir. Örneğin belli bir hastalığa yakalanan kişilerin kan gruplarının dağılımının normal kitledeki dağılıma uygun olup olmadığı araştırılmak istenebilir. Bu şekilde gözlenen frekansların beklenen teorik frekanslar uyup uymadığı araştırıldığında aşağıda verilen değeri kullanılır, Burada, : Gözlenen (deneysel) frekans : Beklenen (kuramsal) frekans k : Sınıf sayısı dır. Eşitlikten de kolayca anlaşılacağı üzere eğer gözlenen frekanslar beklenen frekanslara yakın ise değeri küçük, aksi halde değeri büyük çıkacaktır. Buna göre değerinin büyük çıkması hipotezinin reddedilmesine neden olacaktır. Hesaplanan bu değeri yaklaşık olarak dağılımına sahip olur ve tablosu kullanılarak hipotez reddedilir ya da edilemez. Eğer beklenen frekanslar hesaplanırken örneklem verilerinden yararlanarak parametre tahmini yapılmamışsa hesaplanan bu değeri yaklaşık olarak serbestlik derecesi olan dağılımına sahip olacaktır. Aksi takdirde kaç tane parametre tahmini yapıldı ise o kadar serbestlik derecesinden düşülerek serbestlik derecesi hesaplanacaktır. 1

Örnek: Dört çocuklu 100 ailede erkek çocukların dağılımı aşağıda verildiği gibidir. Erkek Çocuk Sayısı Aile Sayısı 0 7 1 23 2 36 3 20 4 14 Erkek çocukların dağılımın Binom dağılımına uyumunu 0.05 anlam düzeyinde test ediniz. Çözüm: Hipotez aşağıda verildiği gibi olacaktır. Erkek çocukların sayısının dağılımı Binom dağılımına uygundur Erkek çocukların sayısının dağılımı Binom dağılımına uygun değildir İlk olarak Binom dağılımının parametreleri olan n ve p değerleri belirlenmelidir. 4 çocuklu ailelerden örnek alındığı için dür. Fakat, değeri bilinmediği için tahmin edilmesi gerekir. Hesaplanan bu p değeri ve verilen n değeri kullanılarak beklenen frekansları bulmak için ilk olarak aşağıdaki olasılıklar hesaplanmalıdır. Beklenen frekansları bulmak için bulunan bu olasılıklar aile sayısı olan 100 değeri ile çarpılmalıdır. 100 aileden 5 tanesinin 0 erkek çocuğa sahip olması beklenir 2

olacak şekilde yuvarlatmalar yapılmalıdır. Tablo değerine bakabilmek için serbestlik derecesi belirlenmelidir. Bir parametre örnekten tahmin edildi buna göre, olup olarak bulunur. olduğundan reddedilemez. Yani, erkek çocukların dağılımı Binom dağılımına uygundur şeklinde yorum yapılabilir. testleri, uyum iyiliği testlerinin yanında bağımsızlık ve homojenliklerin test edilmesinde de kullanılır. testi yapabilmek için gözlemler çapraz tablolar ile özetlenirler. a) Tek Gruplu Çapraz Tablo Burada incelenen gözlemler belirli bir özelliğe göre düzeylere ayrılmıştır. Genellikle uyum iyiliği testlerinde kullanılır. Sınıflar 1 2 3 4 Frekanslar Test istatistiği; biçiminde hesaplanır. Burada; : Ki-kare değeri : Gözlenen (deneysel) frekans : Beklenen (kuramsal) frekans k : Sınıf sayısı 3

dir. b) Çapraz Tablo ya da Y 1 2 Toplam X 1 2 Toplam olmak üzere çapraz tablo için; ile hesaplanır. Görüldüğü gibi, bu formül ile beklenen frekansların hesaplanması gerekmez, sadece gözlenen frekanslar kullanılır. c) R xc Tipinde Çapraz Tablo R : Satır sayısı C : Sütun sayısı olmak üzere, Y 1 2 X 1 2 C Toplam R Toplam 4

:gözlenen frekans :beklenen frekans çözümlemesi yapılırken dikkat edilmesi gereken bir takım kurallar vardır; 1) Yapılacak tahminlerin güvenilir olması için beklenen frekansların en az 5 olması istenir. Eğer 5 ten az beklenen (kuramsal) frekans değeri varsa, bu frekansın yer aldığı satır ya da sütun tablodaki uygun bir satır ya da sütun ile birleştirilir. 2) Uygulamada genellikle gözlem sayısı ve serbestlik derecesi 1 olduğunda Yates düzeltmesi yapılması gerektiği söylenir. Bu durumda değişkeninin düzeltilmiş ve düzeltilmemiş değerlerinin karşılaştırılmasında yarar vardır; eğer her iki değeri birbirinden çok farklı ise denek sayısı yetersizdir, örneklem genişliği artırılmalıdır. 3) i.inci satırdaki gözlenen frekans ile i.inci satırdaki beklenen frekans toplamları birbirine eşit olmalıdır. Aynı şekilde j.inci sütundaki gözlenen frekans ile j.inci satırdaki beklenen frekans toplamları birbirine eşit olmalıdır. 4) düzeninde çapraz tabloda 5 den az sayıda gözlenen frekans varsa, önemlilik testi Fisher in özel eşitliği uygulanarak yapılır. Sayımla Belirtilen Kitlelerde Bağımsızlık Kontrolü İki ya da daha çok grubun bağımsız olup olmadığı kontrol edilir. Veriler çapraz tablo üzerinde gösterilebilir. 1. Hipotez kurulur. :birimin i inci satır ve j inci sütuna düşme olasılığı :birimin i inci satıra düşmesi olasılığı :birimin j inci sütuna düşmesi olasılığı : Değişkenler bağımsızdır.(gruplar arası fark yoktur.) : Değişkenler bağımlıdır.(gruplar arası fark vardır.) 5

2. Test istatistiği belirlenir. tablosu düzenlenir ve kuramsal sıklığı (i inci satır, j inci sütuna düşmesi gereken frekans) şöyle bulunur: Burada, ve dir. Buradan,, R:satır sayısı C:sütun sayısı :gözlenen frekans Yates Düzeltmeli Formülü düzeninde çapraz tablolar için;, Yates düzeltmeli 3. Yorum ve karar ise red edilir. Bir değişkenin ikiden çok düzeyi olduğunda ya da ikiden çok grup karşılaştırıldığında, gruplar arası fark önemli ise, gruplardan hangisinin diğerlerinden önemli derecede farklı olduğunu araştırmak gerekir. Bu nedenle en büyük değerine sahip olan grup işlemden çıkarılır. Geriye kalan gruplar için, hipotez kabul edilinceye kadar işlemlere devam edilir. 6

Örnek: Yurtta kalıp kalmamayla başarı arasında bir ilişki var mıdır? düzeyinde test ediniz. anlam Başarısız Başarılı Çok başarılı Toplam Yurtta kalan 45 35 20 100 Yurtta kalmayan 15 85 10 110 Toplam 60 120 30 200 1. :Yurtta kalıp kalmamayla başarı arasında ilişki yoktur. : Yurtta kalıp kalmamayla başarı arasında ilişki vardır. 2. 3. olduğundan red edilir. Yorum: Yurtta kalıp kalmamayla başarı arasında bir ilişkinin olduğu %99 güven düzeyinde söylenebilir. Örnek. Rasgele seçilen 100 kişiye yapılan bir ankete göre yeni bir ürünün beğenilip beğenilmemesinin cinsiyete göre dağılımı aşağıdaki tabloda verilmiştir. Cinsiyetin ürünün beğenilip beğenilmemesiyle ilgisi var mıdır, anlam düzeyinde test ediniz. Beğendi Beğenmedi Toplam Kadın 50=a 12=b 62=A Erkek 20=c 18=d 38=B Toplam 70=C 30=D 100=n lik bir tablo lerden herhangi biri 5 ten küçük değil. :Cinsiyet ile ürünü beğenip beğenmeme arasında ilgi yoktur. : Cinsiyet ile ürünü beğenip beğenmeme arasında ilgi vardır. 7

olduğundan red edilir. Yani, Cinsiyetin ürünü beğenip beğenmeme üzerinde önemli bir etkisi olduğu söylenebilir. 8