İSTATİSTİK 2 Hipotez Testi 21/03/2012 AYŞE S. ÇAĞLI aysecagli@beykent.edu.tr 1
Güven aralığı ve Hipotez testi Güven aralığı µ? µ? Veriler, bir değer aralığında hangi değeri gösteriyor? (Parametrenin gerçek değeri hakkında bir bilgimiz yok.) Veriler, daha önceden belirlenmiş bir değeri gösteriyor mu? (Parametrenin değeri hakkında bir fikrimiz var.) µ 0? 2
Hipotez nedir? Hipotez, karşılaşılan bir durum hakkında yapılan bir önermedir. İstatistikte, hipotez, bir anakütle paramatresi hakkında yapılan bir önermedir: Mesela, anakütle ortalaması Örnek: Bu şehirdeki ortalama aylık cep telefonu faturası μ = 42TL 3
Hipotez Testi nedir? Bir hipotez testi, iki tür hipotez oluşturmakla başlar: Sıfır hipotezi Alternatif (Karşıt) hipotez Sıfır hipotezi, arada fark yoktur, fark sıfırdır şeklinde kurulur. Hipotez testi, sıfır hipotezinin (H 0 ) doğru olduğu varsayımı ile başlar. Bir hipotez testinin amacı, sıfır hipotezinin (karşıt hipotez leyhine) reddedilip edilmemesine karar vermektedir. 4
Sıfır hipotezi, H 0 Test edilecek varsayımı ifade eder. Örnek: Amerikan evlerindeki ortalama TV sayısı 3 tür. H 0 : μ 3 Her zaman bir anakütle parametresi hakkındadır, asla örneklem istatistiği hakkında değildir. H 0 : μ 3 : X 3 H 0 5
Sıfır hipotezi, H 0 Anakütle parametresinin önceden belirlenmiş, bilinen değerinde herhangi bir farklılığın beklenmediğini ifade eden hipotezdir. Her zaman şu işaretleri içerir : =,, H 0 a aykırı yeterli kanıt bulunmadıkça bu hipotez geçerli sayılır. Suçluluğu ispat edilene kadar masum olma durumu gibi. 6
Alternatif (Karşıt) Hipotez, H 1 İlgili anakütle parametresinin bilinen değerinde istatistiksel olarak anlamlı farkların beklendiğini ifade eder. Ör. Amerikan evlerindeki ortalama TV sayısı 3 değildir: ( H 1 : μ 3 ) Asla şu işaretleri içermez : =,, Eğer doğru olduğunu destekleyen yeterli kanıt bulunursa, H 1 desteklenir ve H 0 reddedilir. 7
Alternatif (Karşıt) Hipotez, H 1 Eğer amaç, µ nün belirli bir değerden (µ₀), farklı olup olmadığını belirlemek ise, alternatif hipotezi şu şekilde yazılır : H 1 : µ µ₀ Bu durumda, hipotez testine iki-yönlü denir. Eğer amaç, µ nün belirli bir değerden (µ₀) düşük olup olmadığını belirlemek ise, alternatif hipotezi şu şekilde yazılır : H 1 : µ < µ₀ Bu durumda, hipotez testine tek yönlü (sol taraflı) denir. Eğer amaç, µ nün belirli bir değerden (µ₀) yüksek olup olmadığını belirlemek ise, alternatif hipotezi şu şekilde yazılır : H 1 : µ > µ₀ Bu durumda, hipotez testine tek yönlü (sağtaraflı) denir. 8
Hipotezleri tanımlama Örnek : Anakütle ortalamasının 3 olmadığını test edin. Etaplar: Soruyu istatistiksel olarak yazın : (µ 3) Sorunun tersini istatistiksel olarak yazın (µ = 3) Bağdaşmaz ve bütünü kapsayıcı olacak şekilde olmalı. Alternatif hipotezi seçin (µ 3) Yazılmış olan iki önermeden içinde şu işaretlerden birini bulunduranı seçin :, <, > Sıfır hipotezini seçin (µ = 3) 9
Hipotezleri tanımlama Anakütlenin ortalama TV seyretme süresi 12 saat midir? Soruyu istatistiksel olarak yazın : µ = 12 Sorunun tersini istatistiksel olarak yazın: µ 12 Alternatif hipotezi seçin : H 1 : µ 12 Sıfır hipotezini seçin : H 0 : µ = 12 10
Hipotezleri tanımlama Anakütlenin ortalama TV seyretme süresi 12 saatten farklı mıdır? Soruyu istatistiksel olarak yazın : µ 12 Sorunun tersini istatistiksel olarak yazın: µ = 12 Alternatif hipotezi seçin : H 1 : µ 12 Sıfır hipotezini seçin : H 0 : µ = 12 11
Hipotezleri tanımlama Bir şapkanın ortalama maliyeti 20$ dan az ya da ona eşit midir? Soruyu istatistiksel olarak yazın : µ 20 Sorunun tersini istatistiksel olarak yazın : µ > 20 Alternatif hipotezi seçin : H 1 : µ > 20 Sıfır hipotezini seçin : H 0 : µ = 20 12
Hipotezleri tanımlama Bir kitapçıda yapılan ortalama harcama 25 $ dan fazla mıdır? Soruyu istatistiksel olarak yazın µ > 25 Sorunun tersini istatistiksel olarak yazın : µ 25 Alternatif hipotezi seçin : H 1 : µ > 25 Sıfır hipotezini seçin : H 0 : µ = 25 13
Hipotez testinde yapılan hatalar Karar H 0 ın red edilmemesi H 0 Doğru Doğru karar Olasılık :1 α Doğal durum H 0 Yanlış II. Tip hata Olasılık : β H 0 ın reddi 14 I. Tip hata Olasılık : α (anlamlılık düzeyi) Doğru karar Olasılık :1 β ( testin gücü)
I. Ve II. Tip Hatalar arasındaki ilişki I. ve II. Tip hatalar aynı anda gerçekleşemez. I. Tip hata yalnızca H 0 doğru olduğunda olur. II. Tip hata yalnızca H 0 yanlış olduğunda olur. Eğer I. Tip hata olasılığı artarsa ( ), II. Tip hata olasılığı azalır (β ) Anlamlılık seviyesi ( ) arttıkça, testin gücü de (1 β) artar. 15
Anlamlılık seviyesi, H 0 doğru olduğunda, örneklem istatistiğinin alabileceği pek mümkün olmayan değerlerin oranını verir. Örnekleme dağılımında red bölgesini tanımlar., ile gösterilir 16 Yaygın kullanılan seviyeler 0,01 ; 0,05 ; 0,10 Araştırmacı tarafından test başlangıcında belirlenir. Testin kritik değer(ler)ini verir.
Anlamlılık seviyesi ve Red bölgesi Anlamlılık seviyesi = Kritik değer H 0 : μ = 3 H 1 : μ 3 H 0 : μ 3 H 1 : μ > 3 İki yönlü test Sağ taraflı test /2 0 0 /2 Red bölgesi taralı olarak gösteriliyor. 17 H 0 : μ 3 H 1 : μ < 3 Sol taraflı test 0
Ortalama için Hipotez testi (σ biliniyor) Amaç : Anakütle ortalaması, µ, için hipotez testi uygulamak Varsayımlar: Rasgele örneklem Normal anakütle σ biliniyor Etap 1: Sıfır hipotezi H 0 : µ = µ₀, belirlenir. Alternatif hipotez olarak da aşağıdaki 3 durumdan biri belirlenir. H 1 : µ µ₀ veya H 1 : µ < µ₀ veya H 1 : µ > µ₀ (iki yönlü) (sol taraflı) (sağ taraflı) 18
Ortalama için Hipotez testi (σ biliniyor) Etap 2: Anlamlılık seviyesi α belirlenir Etap 3: Sıfır hipotezinde geçen değerin z değeri hesaplanır. z 0 = x μ 0 σ/ n Step 4: Kritik değerler bulunur ±z α/2 veya z α veya z α (İki yönlü) (Sol taraflı) (Sağ taraflı) 19
Ortalama için Hipotez testi (σ biliniyor) H 0 red edilemez H 0 red H 0 red red red red edilemez edilemez red İki yönlü Sol taraflı Sağ taraflı Etap 5: Eğer z 0 red bölgesine düşüyorsa, H 0 reddedilir, yoksa, H 0 reddedilmez. Etap 6 : Hipotez testinin sonuçları yorumlanır. 20
Ortalama için Hipotez testi (σ biliniyor) Tek taraflı Test İki taraflı Test H 0 : µ = µ 0 H 0 : µ = µ 0 H a : µ < or > µ 0 H a : µ µ 0 Test istatistiği: Test istatistiği: z x 0 x z x 0 x Red bölgesi: Red bölgesi: z > z α z > z α/2 21
Örnek1: Ortalama için sağ taraflı test Telefon sanayiindeki bir yönetici müşterilerin aylık cep telefonu faturalarında bir artış olduğunu ve artık ortalama faturanın 52TL nin üstünde olduğunu düşünüyor. Şirket bu düşünceyi test etmek istiyor. ( = 10) Hipotezleri tanımla: H 0 : μ 52 ortalama 52 TL den yüksek değil. H 1 : μ > 52 ortalama 52 TL den yüksek. (yani, yöneticinin düşüncesini destekleyen yeterli kanıt var.) 22
Örnek1: Red bölgeleri bulunur. Test için anlamlılık seviyesi = 0.10 seçildi. Red bölgesi: H 0 red = 0.10 Eğer H 0 reddedilemez 0 x μ0 z 1.28 σ/ n 1.28 H 0 Reddedilir ise, H 0 reddedilir. 23
Örnek1 : Örneklem sonucu Örneklemden yola çıkarak, test istatistiği hesaplanır Şu değerleri veren bir örneklem varsayıyoruz: n = 64, x = 53.1 ( = 10) Test istatistiği: x μ 53.1 52 z 0 σ 10 n 64 0.88 24
Örnek1 : Karar H 0 reddilir = 0.10 H 0 reddedilemez 0 z = 0.88 1.28 H 0 reddedilir H 0 reddedilemez çünkü z = 0.88 < 1.28 Yorum: telefon faturalarının 52 TL nin üstünde olduğunu destekleyen yeterli kanıt yoktur. 25
Örnek 2 «Amerika da evlerde bulunan ortalama TV sayısı 3 tür» önermesini test edin. (σ = 0.8 olarak varsayalım) Sıfır ve alternatif hipotezleri yazın H 0 : μ = 3, H 1 : μ 3 (Bu bir iki yönlü test olacaktır) Anlamlılık seviyesini belirleyin Bu test için = 0.05 seçilmiş olsun Örneklem büyüklüğü seçin. n = 100 olacak şekilde bir örneklem seçilmiştir. 26
Örnek 2 Kritik değerleri belirleyin = 0.05 için kritik z değerleri ±1.96 dır. Test istatistiğini hesaplayın Örneklem sonuçlarının şu şekilde olduğunu varsayalım. n = 100, x = 2.84 (σ = 0.8) Öyleyse, test istatistiği : X μ0 2.84 3 0.16 z 2.0 σ 0.8 0.08 n 100 27
Örnek 2 Test istatistiği red bölgesinde mi? Eğer z < 1.96 veya z > 1.96 ise, H 0 ı reddederiz. Aksi durumda, H 0 reddedilmez. = 0.05/2 H 0 reddedilir H 0 reddedilemez z = 1.96 0 +z = +1.96 = 0.05/2 H 0 reddedilir z = 2.0 < 1.96, Demekki test istatistiği red bölgesinde. 28
Örnek 2 Sonucu yorumla!!! = 0.05/2 = 0.05/2 H 0 reddedilir H 0 reddedilemez H 0 reddedilir z = 1.96 0 2.0 +z = +1.96 z = 2.0 < 1.96 olduğu için sıfır hipotezini reddettik. Demekki, Amerika da evlerde bulunan ortalama TV sayısının 3 olmadığı yönünde yeterli kanıt vardır. 29
Örnek 3 Futbol hakemleri tarafından kuralların yeniden yorumlanması sonucunda maç başına düşen sarı kart sayısında bir artış olması bekleniyor. Şimdiye kadar maç başına düşen ortalama sarı kart sayısı 4, standart sapması da 0,5 olsun. 121 maçlık bir örneklemden elde edilen verilere göre maç başına ortalama 4,7 sarı kart çıktığı hesaplanmıştır. %5 lik anlamlılık seviyesinde, gerçekten sarı kartlarda artış olmuş mudur? Hipotezleri oluşturun: H 0 : μ = 4, H 1 : μ 4 Anlamlılık seviyesi 0,05 Kritik z değerleri ±1,96 dır. 30 ( İki yönlü test)
Örnek 3 Örneklem ortalaması x = 4,7 Örneklem büyüklüğü n = 121 Test istatiğini hesaplayın: z x 4,7 4 0,064 0 0 s x 10,94 H 0 reddedilir H 0 reddedilir H 0 reddedilmez 0,025 0,025-1,96 +1,96 10,94 Sonuç ve yorum: z₀ red bölgesine düştüğü için, H 0 reddedilir. Demekki,sarı kart sayısında bir artış olduğu konusunda yeterli kanıt vardır. 31