HİPOTEZ TESTLERİ HİPOTEZ NEDİR? Örnekleme ile test edilmeye çalışılan bir popülasyonun ilgili parametresi hakkında ortaya sunulan iddiadır. Örneğin; A dersi için vize ortalaması 50 nin altındadır Firestone ve Lassa firmalarının ürettikleri lastiklerin kaliteleri aynıdır. Görüldüğü gibi bir konu hakkında öne sürülen ve doğruluğu henüz ispatlanmamış görüşler hipotezlerdir.hipotezler üzerinde çeşitli işlemler yapılarak ifadenin doğruluğu/yanlışlığı araştırılır.
HİPOTEZ TESTİ VE AŞAMALARI Popülasyonu incelemeye yönelik yapılan çalışmalar ve bunların raporlanması ile hipotezin kabul edilip edilmeyeceğinin belirlenmesi işlemine hipotez testidenir. Hipotez testi aslında bir nevi karşılaştırma ve seçim işlemi olduğu için birden fazla hipoteze ihtiyaç duyulur. Bu hipotezlere ise alternatif hipotez denir. 3 Hipotez testi 5 aşamalıdır: -)NULL ve ALTERNATİF HİPOTEZLERİN BELİRLENMESİ:Popülasyon parametresine genellikle belli bir değer atanır ve bu öne sürülen temel iddia null hipotezidir. Null hipotezi sıfır/başlangıç hipotezi olarak da bilinir. H 0 ile gösterilir. Mevcut veriler null hipotezinin doğruluğu hakkında şüphe uyandırdığında kıyas yapmak için ortaya sunulan ikinci hipotez alternatif hipotezdir. Yapılan işlemler eğer H 0 ı yanlış çıkarırsa bu H A nın kabulü anlamına gelir. 4
-)ÖNEM veya RİSK DERECESİNİN BELİRLENMESİ:Genellikle risk derecesi olarak %5=0,05 ve %=0,0 kullanılmakla birlikte bu tercihi bir durumdur. Risk derecesi temelde doğru olan null hipotezinin reddedilme olasılığını gösterir. Risk derecesini belirleyerek hipotez testi sırasında yapılabilecek hataları minimuma indirmek isteriz. Bir hipotez testi sırasında null hipotezinin doğruluk/yanlışlık ve kabul/reddedilme durumlarına göre tip hata yapılabilir.(.tip ve.tip hata) 5.. Null hipotezi doğru iken reddedilirse. tip hata, yanlış iken kabul edilirse.tip hata yapılmış olur. Alınan karar Null hipotezi kabul etme Null hipotezi reddetme Null hipotez i doğru Doğru karar. Tip hata Null hipotezi yanlış. Tip hata yorumsuz 6 3
3-)İSTATİSTİKSEL TEST METODUNUN BELİRLENMESİ: Örneğin F,t,ki kare istatistiksel testleri kullanılarak null hipotezi ile ilgili değerin bulunması işlemidir. 4-)NULL HİPOTEZİNİN KABUL/RED DURUMUNUN BELİRLENMESİ:yukarıdaki maddede (3) bulunacak değerin durumuna göre null hipotezinin kabul/red koşullarının belirlenmesidir. 5-)NULL HİPOTEZİ İÇİN KARAR VERME:Yapılan işlem sonuçlarına göre null hipotezinin kabul edilip edilmeyeceği belirlenir. 7 -)Null Ve Alternatif Hipotezleri Belirlemek Ders geçmek için gerekli minimum notun ortalama 60 olduğu bir sınıftan seçilen 40 öğrencinin aldığı notların ortalaması 64 olsun. Bu durumda popülasyonun (sınıfın) gerçek ortalaması 60 ın üzerinde midir? H 0 :µ=60 H A :µ>60 8 4
-)Önem Derecesini(α)Belirlemek Null hipotezini gerçekten doğru iken reddetme olasılığının yani önem derecesinin α=0,05 olduğunu kabul edelim. Bu durumda grafiksel bir açıklama yapacak olursak 9 3-)Hipotez Testinin Yönünü Belirlemek Alternatif hipotez için yazılan duruma göre hipotez testi tek yönlü ya da iki yönlü olabilir. Tek yönlü hipotez testi için αdirek alınır iken iki yönlü hipotez testinde alan belirlenirken α yerine α/ değeri ile işlem yapılır. Aşağıda alternatif hipotezin durumuna göre grafiksel gösterimler verilmiştir.( ve durumları < ve < için de aynıdır.) 0 5
H A :µ 60 (tek yönlü) H A :µ 60 (tek yönlü) H A :µ 60 (çift yönlü) 4-)Kritik Değeri Veya Değerleri Belirlemek Null hipotezinin doğru olduğu varsayımı ile olasılığı - αolan değer aranan kritik değerdir. İlgili istatistik testi için değişmekle birlikte kritik değer standart normal dağılımlar için z * ile gösterilir. Eğer popülasyon için standart sapma değeri biliniyor ise ya da gözlem sayısı n 30 ise 0,5-αdeğerine karşılık gelen z değeri tablodan bulunur ve aranan z * değeri odur. 6
.. Örneğimizdeki α=0,05 için n=40 olduğundan standart dağılım tablosu kullanılırsa tabloda 0,5-0,05=0,45 değerine karşılık gelen z değeri,645 olduğundan aranan kritik değer z * =,645 dir. 3 5-)Test İstatistiğini Belirlemek Ve Kritik Değer İle Karşılaştırmak µ=popülasyonun ortalaması σ=popülasyonun standart sapması s=örneklemin standart sapması X=örneklemin ortalaması z=kritik değer olmak üzere; Popülasyona ait standart sapma biliniyor ise; z = x µ σ Popülasyonun standart sapması bilinmiyor ve n 30 ise σyerine s alınarak z değeri bulunur. Daha sonra z ile z * değeri karşılaştırılarak karara varılır. n 4 7
ÖZETLE... H 0 ve H A hipotezleri belirlenir. αtespit edilir 3. Hipotez testinin yönü belirlenir 4. Kritik değer z * bulunur 5. Test istatistiği yapılarak z değeri bulunur ve karşılaştırma ile karar verilir. 5 ÖRNEK H 0 :µ=50 ve H A :µ 50 olmak üzere örnek ortalaması 49, örneklemdeki veri sayısı ise 36 dır. Popülasyonun standart sapması 5 iken hipotez için %5 risk alındığında a) Hipotez testinin yönünü belirleyin b) Null hipotezi ile ilgili karar verin c) Verilen karar ile ilgili güven durumu yani p değeri nedir? 6 8
Çözüm: a) H 0 hipotezine göre popülasyon ortalaması 50den büyük de olabilir küçük de. Bu sebeple bir yönlendirme yapılmadığı için hipotez testi çift yönlüdür. ( den de anlaşılacağı gibi) b) α=0,05 olmak üzere çift yönlü hipotez testi olduğu için α/=0,05 ile işlem yapılır. Buna göre 0.5-0.05=0.475 olasılığına karşılık gelen z değeri tablodan.96 olarak bulunur. O halde aranan z * =.96 dır. Diğer taraftan formül yardımı ile z=(49-50) /(5/ 36)= -. bulunur. Şimdi z ile z * değerlerini karşılaştırıp karar verelim: 7 şekilde de görüldüğü gibi bulunan z= -, değeri taralı alanın dışında kaldığı için H 0 hipotezi kabul edilmelidir. c) Verdiğimiz karardan ne kadar emin olduğumuzu öğrenebilmek için z değerinin bulunan değerin üzerinde olabilme olasılığını (p değerini) bulmalıyız. P(z< -.)=0,5-0,3849=0.5dir. Fakat testimiz çift yönlü olduğu için bunun iki katı aranan p değeri olur. Yani p=x0.5=0,30 dir. p>αolduğu için null hipotezi kabul edilmelidir. Bulunan p değeri popülasyonun ortalamasının 50nin altında ya da üstünde olması (H a nın doğru olma olasılığı) olasılığının %.5 olduğunu söyler. 8 9
ÖRNEK Rasgele seçilen 5 kutu mısır gevreğinin ortalaması 37.5gr. ve üretici firmanın belirlemelerine göre standart sapma 5gr dır. Bu durumda 0.05 önem derecesi ile bir kutu mısır gevreğinin 368gr üzerinde olmasını test ediniz. ÇÖZÜM: verilere göre H 0 :µ 368 H A :µ>368 α=0.05 n=5 σ=5 X=37.5 9.. Veriler değerler formülde yerine yazılır ise; 37.5 368 z = =.5 bulunur. Diğer taraftan 5 5 α=0.05 için standart normal dağılım tablosundan 0.5-0.05=0.45 değerine karşılık gelen z * =.645dir. z=.5 değeri taralı alanın dışında olduğundan null hipotezi kabul edilir. YORUM:mısır gevreklerinin kutularının ortalama 368gr ın üzerinde olduğuna dair yeterli bir bilgi yoktur. 0 0
ÖDEV ;) H 0 :µ 0 VE H A :µ>0 olmak üzere a) Hipotez testinin yönü nedir? b) Null hipotezi hakkında ne karar verilmelidir? c) Verilen karar ile ilgili güven durumu nasıldır? (örnek ortalaması,örnekteki veri sayısı 36,popülasyonun standart sapması 3 ve risk derecesi %dir.) Alternatif hipotez a)h A :µ<µ 0 (tek yönlü) b)h A : µ>µ 0 (tek yönlü) c)h A : µ µ 0 (çift yönlü) Test istatistiği (H 0 hipotezinin doğru olduğu varsayılırsa) z 0 µ 0 x = σ n α ya göre test kriteri a) b) p değerine göre test kriteri a) p=p(z<z 0 ) b) p=p(z>z 0 ) z 0 veya x = s µ 0 n c) c)p=p(z> z 0 )
HİPOTEZ TESTİ Şimdiye kadar yaptığımız incelemelerde bir tek popülasyonun parametrelerine ilişkin hipotezleri test ettik. Fakat her zaman bizden tek bir popülasyonda inceleme yapmamız istenmeyebilir. Bazı durumlarda iki farklı popülasyonun parametreleri üzerinden hipotezleri test etmemiz gerekebilir. Böyle bir durumda yapılması gerekenleri gösterelim: 3 İKİ POPÜLASYONA AİT HİPOTEZ TESTİ Burada amaç verilen iki örnek ortalamasının aynı ortalamalı iki popülasyondan gelip gelmediğini araştırmaktır. Tek popülasyon için hipotez testi sırasında izlenen adımlar (5adım) aynen takip edilir. Fakat bunu farklı kılan özellik z değerinin hesaplanış şeklidir. 4
Formüldeki gösterimler aynı olmakla birlikte indis olarak yazılan sayı parametrenin ait olduğu popülasyonu gösterir.(. veya. popülasyon) burada z değeri ise şu şekilde hesaplanır: z = x s n + x s n 5 ÖRNEK: farklı hastanenin acil servisine gelen hastalara müdahale süresi tablo ile verilmiştir. Buna göre % risk ile numune hastanesinin acil servisi sigorta hastanesinin acil servisinden daha mı hızlı olarak hastalara müdahale etmektedir? hastane numune sigorta Ortalama süre Örnek standart Sapması 5.5 dak. 0.4 dak. 50 Örnek sayısı 5.3 dak. 0.3 dak. 00 6 3
H 0 :µ =µ VE H A :µ >µ z = 50 Çözüm 5.5 5.3 0.4 + 0.3 00 = 3. α=0.0 için 0.5-0.0=0.49 değerine karşılık gelen z * =.33 bulunur. O halde z ile z * karşılaştırılırsa H 0 hipotezi reddedilmelidir. (alternatif hipotez % risk altında kabul edilir.)yani numune hastanesi sigorta hastanesinden daha hızlı acil müdahale yapabilmektedir. 7.. p=p(z>3.)=0.5-0.499=0.00 olmak üzere p değeri risk derecesinden küçük olduğu için null hipotezinin doğru olmama ihtimali çok yüksektir. 8 4
z Testi Ve t Testi Karşılaştırması z testi Standart normal dağılıma bağlı olarak yapılır. Popülasyon varyansı bilindiği zaman veya n>30 olduğu durumlarda hipotez testi z testi ile yapılır. t testi Örneklemdeki veri sayısına göre şekil olarak farklılık gösterir. n büyüdükçe normal dağılıma yaklaşır. t testi için serbestlik derecesi df:n- önemlidir. Popülasyonun varyansı bilinmediğinde ya da n<30 olduğunda t testi ile hipotez testleri yapılır. 9 t DAĞILIMLARI Varyans tahmini olarak belirlendiği kesin olmadığı durumlarda t testi için ; µ=test edilen popülasyonun ortalaması s=örnek standart sapması n=örnekteki veri sayısı X=örnek ortalaması olmak üzere t = x µ s n 30 5
ÖRNEK: Yüksek lisans dersindeki öğrencilerin araştırma metotları hakkında iyi bir bilgiye sahip olup olmadıklarını ölçmek istiyoruz.6 sınıftan rasgele alınan öğrencileri yaptığımız sınav sonucunda sınıfın en az 70 alması gerekmektedir. Test sonucunda öğrencilerin notları sırasıyla 6,9,75,68,83,95 ise ilgili hipotez testini yapınız. (risk derecesini 0.05 alınız) 3 Çözüm: H 0 :µ 70 VE H A :µ>70 Tek yönlü hipotez testi söz konusudur ve α=0.05 ve df=n-=5 serbestlik derecesi için ilgili kritik değer t tablosundan belirlenir ise t * =.05 bulunur. Diğer yandan formül kullanılarak t değeri hesaplanır ise s=3.7 X=79.7 µ=70 n=6 olmak üzere t=.7 bulunur. t * >t olduğu için (t değeri kabul bölgesinde) null hipotezi kabul edilir. 3 6
ÖRNEK: Kuzey Kıbrıs ta rasgele 36 seçim noktasındaki ortalama seçmen sayısı 37.5 ve standart sapma seçmen olarak belirlenmiştir.0.05 önem derecesi ile seçim noktalarının her birinde 368 den az ya da çok seçmenin oy kullanmış olabileceğini test edelim: ÇÖZÜM: n=36, X=37.5, s=, α=0.05, µ=368 olarak verilmiştir. 33 H 0 :µ=368 ve H 0 :µ 368 olmak üzere çift yönlü t testi söz konusudur. df:n-=35 serbestlik derecesi ve α/=0.05 anlamlılık düzeyi için t tablosundan kritik değer t * =.030 olarak belirlenir. Diğer taraftan ilgili hesaplamalar ile formülden aranan t=.5 olarak bulunur. t ve t * değerleri karşılaştırıldığında t değerinin red bölgesi içinde olduğu görülür. Bu sebeple null hipotezi kabul edilemez. Sonuç olarak popülasyonun ortalamasının 368 olmadığına dair deliller mevcuttur diyebiliriz. 34 7
ÖDEV ;) Yukarıdaki örneği aynı verileri kullanarak seçim noktalarının her birinde 368den fazla seçmenin oy kullanmış olmasını test ederek çözünüz. 35 Bağımsız İki Popülasyon İçin t Testi Uygulanması Birbirinden bağımsız fakat benzer standart sapmalara sahip iki popülasyon incelenebilir. Popülasyonlar normal ya da normale yakın dağılım sergilemelidir. Yani n>30 ya da 30 a yakın değerler olmalıdır. 36 8
Uygun şartları sağlayan iki popülasyonu karşılaştırmada kullanılacak değişkenler ve formüller şöyle özetlenebilir: n i : i. örnekteki veri sayısı (i=,) X i : i. örnek ortalaması (i=,) s i : i. örneğin varyansı (i=,) df: serbestlik derecesi=n +n - s p : popülasyon varyansının birleştirilmiş tahmini s p ( = t = n ) s s n p x ( + n n + ( n x + ) n ) s 37 9