HİPOTEZ TESTLERİ Yrd. Doç. Dr. Emre ATILGAN
Hipotez Nedir? HİPOTEZ: parametre hakkındaki bir inanıştır. Parametre hakkındaki inanışı test etmek için hipotez testi yapılır. Hipotez testleri sayesinde örneklemden elde edilen istatistikler aracılığıyla anakütle parametreleri hakkında karar verilir. Anakütle parametreleri hakkında karar verirken doğru ya da yanlış olması muhtemel yargılardan hareket edilir. İstatistiksel hipotez: bir ya da daha fazla ana kütleye ilişkin olarak ileri sürülen ve teorik bir dağılım varsayımı altında, parametrik değerin belirli bir değere eşit olduğunu veya iki ya da daha fazla ana kütle parametresinin birbirlerine eşit olduğunu belirten ve geçerliliği istatistiksel testlerle denetlenen bir önermedir. Ör: «Bu sınıfın not ortalamasının 70 olduğuna inanıyorum.» 2
Hipotez Testi Nedir? XX μμ = HHHHHHHH İstatistiksel hipotez testleri ortaya çıkan bu hataların/farkların tesadüfi mi, önemli mi veya anlamlı mu olduğunu ortaya koyan bir süreçtir 3
Hipotez Testi Aşamaları 1. H 0 Hipotezinin Belirlenmesi ve Formüle edilmesi: 2. H 1 Seçenek Hipotezinin Belirlenmesi ve Formüle edilmesi: 3. I. Tip hatanın olasılığı olan α nın belirlenmesi 4. Hipotezler için uygun test veya test istatistiğinin belirlenmesi 5. Belirlenen I. Tip hataya Bağlı Olarak H 0 Hipotezi için Kabul ve Red Bölgelerinin Saptanması 6. İstatistiksel Karar 4
H 0 Hipotezinin Belirlenmesi İstatistiksel hipotez testlerinde, test edilecek olan hipotezi ifade eder. Sıfır hipotezleri genellikle ispatlanmak istenenin tam tersini belirtecek şekilde kurulur. Ör: Sınıfın not ortalaması 50 dir. (Test amacımız sınıf ortalamasının 50 den farklı olduğunu ortaya koymaktır) HH 0 : μμ = 50 Ör: Kolesterolü normal kitlenin ortalaması 180 dir. (Amacımız örneklem değerleri ile bulunan kolestrol otalama değerinin 180 den farklı olduğunu ortaya koymaktır) HH 00 : μμ = 180 Sıfır hipotezleri genellikle ispatlanmak istenenin tam tersini belirtecek şekilde kurulur. 5
H 1 Seçenek Hipotezinin Belirlenmesi Eşit olmama, farklılık, belirli bir değerden daha büyük olma, belirli bir değerden daha küçük olma, parametreler arasındaki farkın sıfır olmadığı gibi kavramları ileri süren bir istatistiksel hipotezdir Alternatif/karşıt hipotez H 1 i le gösterilir. İstatistiksel hipotez testlerinde karşıt hipotezler, test edilecek olan sıfır hipotezinin tersi olan iddia öne sürülerek oluşturulur ve genellikle ispatlanmak istenen durum bu hipotezde belirtilir. 6
Tek ana kütle parametresinin belli bir değere eşit olup olmadığına ilişkin hipotez testleri: HH 00 : μμ = μμ 00 HH 00 : PP = PP 00 HH 11 : μμ μμ 00 HH 11 : μμ > μμ 00 HH 11 : μμ < μμ 00 HH 11 : PP PP 00 HH 11 : PP > PP 00 HH 11 : PP < PP 00 İki ana kütleye ait parametrelerin birbirlerine eşit olup olmadığına ilişkin hipotez Testleri: HH 00 : μμ 11 = μμ 22 HH 00 : PP 11 = PP 22 HH 11 : μμ 11 μμ 2 HH 11 : PP 11 PP 2 HH 11 : μμ 11 > μμ 2 HH 11 : PP 11 > PP 2 HH 11 : μμ 11 < μμ 2 HH 11 : PP 11 < PP 2 7
I. Tip hatanın olasılığı olan α nın belirlenmesi İstatistiksel hipotez testlerinin tümü H 0 hipotezinin doğru olduğu varsayımı altında gerçekleştirilir. Araştırmacı, çalışmasına başlamadan önce tip I hata olasılığı için belirli bir değer öngörürür. Bu değer alfa (α) değeri ile gösterilir ve genellikle 0.05 veya 0.01 gibi küçük değerler olarak alınır. Diyelim ki, çalışmamızın başında tip I hata olasılığını α=0.05 olarak öngördük. Bunun anlamı H 0 gerçekte doğru iken onu yanlışlıkla red etme olasılığımız maksimum %5 olmalı. İstatistiksel paket programları, bir hipotez testi sonucunda gerçekleşen I. tip hata miktarını hesaplar ve bu değere p değeri denir. P değeri önceden belirlenmiş α değeri ile karşılaştırılarak karar verilir. P α ise H 0 red edilir. Bunun anlamı, H 0 ı red etmekle gerçekleşen yanılgı öngörülenden küçüktür. Dolayısıyla rahatlıkla H 0 red edilebilir. P > α ise H 0 kabul edilir. Bunun anlamı gerçekleşen yanılgı öngörülenden küçük olmadığı için H 0 red edilemez. 8
Hipotez Testi Hataları Hipotez testi sonucunda verilen karar H 0 kabul edildi H 0 Reddedildi H 0 doğru Doğru karar (1-α) Güven düzeyi I. Tip Hata (α) α hatası Gerçek H 0 yanlış II. Tip Hata (β) Doğru Karar (1-β) Testin Gücü α ve β ters ilişkilidir. Her iki hatayı aynı anda azaltamayız. 9
H 0 Hipotezi için «RED» Bölgeleri 10
Hipotez Çiftleri: H 0 : µ = µ 0 ÇİFT TARAFLI TEST H 0 RED α/2 H RED 0 α/2 H 1 : µ µ 0 0 Z H 1 : µ > µ 0 TEK TARAFLI TEST α H 0 : µ µ 0 H 0 RED (Sağ taraf testi) 0 Z H 0 : µ µ 0 TEK TARAFLI TEST H 0 RED α H 1 : µ < µ 0 (Sol taraf testi) 0 Z 11
12
Test İstatistiğinin Belirlenmesi Kitle ortalamasının anlamlılık testinde daha önce belirtilen koşullar sağlandığında yararlanılacak test istatistiği, n, örneklemdeki denek sayısını göstermek üzere Kitle varyansı bilindiğinde, Kitle varyansı bilinmediğinde, 13
Z istatistiği için H 0 Kabul ve Red Bölgeleri H 1 Tek Yönlü α 0 Z α Kabul Bölgesi Red Bölgesi H 1 İki Yönlü α/2 -Z α/2 0 Z α/2 α/2 Red Bölgesi Kabul Bölgesi Red Bölgesi 14
t istatistiği için H 0 Kabul ve Red Bölgeleri H 1 Tek Yönlü 0 t α,n-1 α H 1 İki Yönlü α/2 -t α/2,n-1 0 t α/2,n-1 α/2 15
Standart Normal Dağılım Tablosu 16
t Dağılımı Tablosu 17
H 0 için kabul ve red kriterleri Z > Z α ya da Z > Z α/2 t > t α ya da t > t α/2 H 0 Red t < t α ya da t < t α/2 Z < Z α ya da Z < Z α/2 P < α ya da P < α/2 P > α ya da P > α/2 H 0 Kabul H 0 Red H 0 Kabul 18
Örnek: Bir fabrikada üretilmekte olan vidaların boylarının ortalaması 100 mm, ve standart sapması 2 mm olan normal dağılım gösterdikleri bilinmektedir. Makinalarda olan bir arıza giderildikten sonra üretilen vidalardan alınan 9 vidalık bir örneğin bot ortalaması 102 mm olarak bulunmuştur. Makinalardaki arıza giderilirken vidaların boyunun ayarı bozulmuş mudur? α=0.05 için test ediniz ve yorumlayınız. 1. Adım: Hipotezlerin belirlenmesi H 0 : µ = 100mm H 1 : µ 100mm 2. Adım: Test istatistiğinin hesaplanması µ=100mm σ =2m m n=9 Z hesap = X µ = 102 100 = 3 σ 2 9 n X =102mm 19
4. Adım: İstatistiksel karşılaştırmanın yapılması: H 0 RED H 0 RED α /2 =.025 α /2 =.025 0 -Z tablo = -1.96 Z tablo = 1.96 5. Adım: Karar verme ve yorumlama: Z hesap =3 Z hesap değeri H 0 RED bölgesine düştüğü için H 0 hipotezi reddedilir, yani vidaları boy ortalaması 100 mm den farklıdır, makinanın ayarı bozulmuştur.
Örnek: Kolesterol ortalaması 190 standart sapması 45 olan 100 kişilik çalışma örnekleminin ortalaması 180, standart sapması 58 olan bir kitleye ait midir? x = 190 S = 45 n = 100 μ = 180 σ = 58 α/2 H 1 : μ = 180 H : μ 0 180 -t α/2,n-1 0 t α/2,n-1 190 180 t = = 172. 58/ 100 α = 0.05 t 99,0.025) ( = 1,98 t hesap =1.72< t tablo =1.98 H 0 Kabul edilir. 21
Örnek: Bu sene Trakya Ünv. Sağlık Yönetimi bölümünden mezun olacak öğrencilerin mezuniyet not ortalamalarının 70 olduğu iddia edilmektedir. Bu amaçla mezuniyet sonrası 36 öğrencilik bir örnek alınmış ve mezuniyet ortalamalarının 66, standart sapmasının 12 olduğu bulunmuştur. Bu veriler çerçevesinde iddiayı α=0.01 için test ediniz. H 0 : µ=70 H 1 : µ 70 α = 0.01 için z tablo değeri 2.58 z hes < z tab H 0 red edilemez
Tek Taraflı Z Testi Örneği Bir kutu mısır gevreğinin ağırlığının 368 gr dan fazla olduğu iddia edilmektedir. Ayrıca σ = 15 gram olduğunu belirtmiştir. n= 25 kutuluk bir örnek alınmış ve X = 372.5 gr. olarak bulunmuştur. 0.05 seviyesinde test ediniz. 23
Çözüm H0: µ 368 H1: µ > 368 α = 0.05 n = 25 Kritik değer: RED bölgesi α=.05 0 Z Z hesap =1.5 Z tablo =1.645 Z = Test İstatistiği: X µ 372.5 368 = = +1.50 σ 15 n 25 Karar: α =.05 için H 0 hipotezi reddedilemez. Yorum: Ortalamanın 368 gr.dan fazla olduğuna dair yeterli kanıt yoktur. 24
ORANLARLA İLGİLİ HİPOTEZ TESTİ H 0 : P = P 0 Çift Kuyruk Testi H 1 : P P 0 Sol Kuyruk Testi Sağ Kuyruk Testi H 0 : P P 0 H 1 : P< P 0 H 0 : P P 0 H 1 : P > P 0 Örnekten hesaplanan oran p ile gösterilirse oranlarla ilgili test istatistiği; ZZ = pp PP ss pp = pp PP PP(1 PP) nn 25
Örnek: Bir bölgeden rasgele seçilen 125 yetişkinin 10 unda beslenme bozukluğu görüldüğüne göre bu bölgede beslenme bozukluğu görülme sıklığı 0.06 dan büyük kabul edilebilir mi? p=0.08, P=0.06, n=125 H 0 : P = 0.06 H 1 : P > 0.06 0.08 0.06 z = = (0.06)(0.94) 125 0,941 α=0.05 için Z 0.05 =1.645. H 0 Kabul. Bu örneklemin çekildiği kitlede beslenme bozukluğu sıklığı 0.06 ya eşittir. 26