Hipotez Testleri
Hipotez Testinin Temelleri Tanımlar: Hipotez teori, önerme yada birinin araştırdığı bir iddiadır. Boş Hipotez, H 0 popülasyon parametresi ile ilgili şu anda kabul edilen değeri tanımlamaktadır. Alternatif Hipotez, H a test edilen iddiayı tanımlamaktadır; boş hipotezin matematiksel olarak karşıtıdır. Hipotez Testi rakip durumdaki iki hipotezin, toplanan verilere dayanarak, karşılaştırılmasıdır.
Hipotez Testi: Hipotez testi, popülasyon parametreleri hakkında yapılmış olan varsayımların, belli bir güven derecesinde kabul veya reddedilme sürecidir. Toplanan verilerden, boş hipotezi çürütecek kadar kuvvetli bir kanıt elde edilmedikçe, boş hipotez doğru olarak kabul edilir.
Boş ve alternatif hipotezleri belirtiniz: Eğitimciler, öğrencilerin genel olarak haftada ortalama 15 saat ve daha az çalıştığını belirtmektedirler. Eğitim araştırmaları yapan bir Profesör ise aslında öğrencilerin genel kabul görmüş ortalamadan daha fazla ders çalıştıklarını öne sürmektedir. Çözüm: İddia: Matematik karşıtı: Öğrenciler haftada 15 saatten daha fazla ders çalışmaktadırlar. m > 15 m 15 H 0 : m 15 H a : m > 15
Tanımlar: Test İstatistiği örneklemden toplanan verilere dayanarak hesaplanan ve hipotez testi için kullanılan bir değerdir. Anlamlılık Düzeyi, a test edilen iddiayı tanımlamaktadır; boş hipotezin matematiksel karşıtıdır. Güven düzeyinin de tamamlayıcısıdır. a = 1 c.
Hipotez Testi nin Aşamaları 1. Boş ve alternatif hipotezler belirlenir. 2. Test istatistiği belirlenir. 3. a değerine bağlı olarak red bölgesi oluşturulur. 4. Veriler toplanır ve gerekli olan örnek istatistiği hesaplanır. 5. Sonuca varılır.
Hipotez Testlerindeki Muhtemel Sonuçlar 1. Boş hipotez reddedilir. 2. Boş hipotez reddedilmez.
Hipotez Testi Türleri: Alternatif Hipotez < değer > değer değer Test Türü Sol kuyruk testi Sağ kuyruk testi Çift kuyruk test
Ortalamalar İçin Hipotez Testi (Küçük Örneklemler) Küçük Örneklemler, n < 30, İçin Test İstatistiği: s.d. = n 1 Örneklemden toplanan verilere dayanarak hesaplanan test istatistiğinin istatistiki olarak anlamlı olup olmadığının belirlenmesi için kritik değere bakılır. Küçük örneklemler için kritik değerler için t-dağılımından faydalanılır.
Red Bölgesinin Bulunması İçin Gerekenler: 1. Hipotez testinin türü. 2. Anlamlılık düzeyi, a. Red Bölgesinin Bulunması: 1. Red bölgesinin sınırını belirlemek için kritik değere, t c, bakılır. 2. Örnekleme dayanarak hesaplanan test istatistiği, a alanının içine denk geliyorsa, H 0 reddedilir.
Sol kuyruk testleri için red bölgesi [H a < içerir]: Reddet Reddetme t t a ise reddet
Sağ kuyruk testleri için red bölgesi [H a > içerir]: Reddetme Reddet t t a ise reddet
Çift kuyruk testleri için red bölgesi [H a içerir]: Reddet Reddetme Reddet t t a/2 ise reddet
Aşağıdaki durum için sonuca ulaşınız: Öğrencilerin dönem başına ortalama 9 dan daha fazla park cezası aldığı iddia edilmektedir. Bunu test etmek için 27 öğrenciden oluşan bir örneklem seçilmiş olup, dönem başına alınan park cezası ort. = 9.8 ve s.s.=1.5 olarak hesaplanmıştır (a = 0.10). Çözüm: n = 27, m = 9, = 9.8, s = 1.5, s.d. = 26, a = 0.10 H 0 : m 9 H a : m > 9 t 0.10 = 1.315 2.771 t istatistiği, t a değerinden büyüktür; boş hipotez reddedilir.
Hipotezi test edip sonuca ulaşınız: Bir mağazanın eski yöneticisi, pazarlama stratejisini müşterilerin ortalama 100TL ve daha az para harcadığı üzerine oluşturmuştur. Yeni gelen mağaza yöneticisi ise, müşterilerin daha fazla para harcadığını öne sürmektedir. 24 müşteriden veri toplanmış olup, ort.=104.93tl harcadıkları tespit edilmiştir (s.s.=9.07). Yeni mağaza yöneticisinin iddiasını, 0.010 anlamlılık düzeyinde test ediniz. Çözüm: H 0 : H a : s.d. = 23, a = 0.010 t 0.010 = 2.500 m 100 m > 100 t t a (yada t > 2.500) ise reddet.
Çözüm (devam): n = 24, m = 100, = 104.93, s = 9.07, 2.663 Hesaplanan t değeri, t a dan büyük olduğu için, boş hipotez reddedilir.
Ortalamalar İçin Hipotez Testi (Büyük Örneklemler) Büyük Örneklemler İçin Test İstatistiği, n 30: Örnekleme dayanarak hesaplanan test istatistiğinin istatistiki olarak anlamlı olup olmadığını tespit etmek için kritik değere bakılır. c Tek kuyruk testi Çift kuyruk testi 0.90 1.28 ±1.645 0.95 1.645 ±1.96 0.98 2.05 ±2.33 0.99 2.33 ±2.575
Hipotezi test edip sonuca ulaşınız: 2006 da yayınlanan bir raporda Türkiye de bayanlar için ortalama evlenme yaşı 25 olduğu belirtilmiştir. Bir araştırmacı ise bu yaşın İstanbul için çok düşük olduğunu öne sürmektedir. 213 bayandan oluşan bir örnekleme dayanarak ortalama evlenme yaşını 25.4 olarak hesaplamıştır (s.s.=2.3). %95 güven düzeyine dayanarak, toplanan verilerin araştırmacının iddiasını destekleyip desteklemediğini test ediniz. Çözüm: H 0 : H a : m 25 m > 25 c = 0.95 z c = 1.645 z z c, yani z 1.645 ise reddet.
Çözüm (devamı): n = 213, m = 25, = 25.4, s = 2.3, 2.54 Hesaplanan z değeri, z c den daha büyüktür; boş hipotez reddedilir.
p-değeri: p-değeri, boş hipotezin (H 0 ) reddini sağlayan en küçük anlamlılık düzeyidir. p-değeri, aynı zamanda gözlemlenen anlamlılık düzeyi olarak da ifade edilmektedir.
p-değerini hesaplayınız: Aşağıdaki değerlere göre p-değerini hesaplayınız. Test istatistiği: z = 1.34. Hipotezler: H 0 : m 0.15 H a : m < 0.15 Çözüm: Alternatif hipoteze göre sol kuyruk testi olduğu anlaşılmaktadır. Bu ise z nin -1.34 den daha az olma olasılığını belirtir. p = 0.0901
p-değerini hesaplayınız: Aşağıdaki değerlere göre p-değerini hesaplayınız. Test istatistiği: z = 2.78. Hipotezler: H 0 : m 0.43 H a : m > 0.43 Çözüm: Alternatif hipoteze göre sağ kuyruk testi olduğu anlaşılmaktadır. Bu ise z nin 2.78 den daha fazla olma olasılığını belirtir. p = 0.0027
p-değerini hesaplayınız: Aşağıdaki değerlere göre p-değerini hesaplayınız. Test istatistiği: z = -2.15. Hipotezler: H 0 : m = 0.78 H a : m 0.78 Solution: Alternatif hipoteze göre çift kuyruk testi olduğu anlaşılmaktadır. Bu ise z nin -2.15 den daha az veya 2.15 den daha fazla olma olasılığını belirtir. p = 0.0158 (2) = 0.0316
p-değeri kullanılarak yapılan hipotez testi sonuçları: 1. p a ise boş hipotez reddedilir. 2. p > a ise boş hipotez reddedilmez.
Aşağıdaki durum için sonuca ulaşınız: Aşağıdaki veriler için p-değerini hesaplayınız ve ilgili alpha değeri için sonuca ulaşınız. a. z = 1.34 için sol kuyruk testi (a = 0.05). p = 0.0901 dir, yani 0.05 den büyüktür. Boş hipotez reddedilmez. b. z = 2.15 için çift kuyruk tesi (a = 0.10). p = 0.0158(2) = 0.0316 dir, yani 0.10 dan küçüktür. Boş hipotez reddedilir.
p-değeri kullanılarak yapılan hipotez testi aşamaları: 1. Boş ve alternatif hipotezler belirlenir. 2. Test istatistiği hesaplanır. 3. Anlamlılık düzeyi belirlenir. 4. Veriler toplanır ve gerekli olan örnek istatistikleri hesaplanır. 5. p-değeri, belirlenen anlamlılık düzeyi ile karşılaştırılır. 6. Sonuca ulaşılır.
Hipotezi test edip sonuca ulaşınız: Yapılan bir araştırmaya göre Avrupa daki kadınların ortalama olarak 1.48 çocuğu olduğu tespit edilmiştir. Dünya çapında faaliyet gösteren bir kuruma göre ise Almanya daki doğurganlık oranlarının farklı olduğunu ileri sürmektedir. Bu iddiayı test etmek için, 128 Alman bayanla yapılan anket sonuçlarına göre Alman bayanların ort. 1.39 çocuğu olduğunu belirlemiştir (s.s.=0.84). %90 güven düzeyine göre, verilerin bu iddiayı destekleyip desteklemediğini test ediniz. Çözüm: c = 0.90 a = 0.10 H 0 : H a : m = 1.48 m 1.48 p < a (veya p < 0.10) ise reddet.
Çözüm (devamı): n = 128, m = 1.48, = 1.39, s = 0.84, 1.21 Çift kuyruk testidir; p = 0.1131(2) = 0.2262. p, a dan büyük olduğu için boş hipotez reddedilmemiştir. Veri toplanarak elde edilen kanıt ilgili kurumun iddiasını %90 güven düzeyinde desteklememiştir.
Hipotez Testleri (İki yada Daha Fazla Popülasyon İçin)
İki Ortalama İçin Hipotez Testi (Büyük ve Bağımsız Örneklemler) Boş ve alternatif hipotezi belirleyiniz: Popülasyon 1 in ortalamasının Popülasyon 2 nin ortalamasından daha az olduğu varsayımına dayanarak hipotezleri yazınız. Çözüm: İddia: Popülasyon 1 in ortalamasının Popülasyon 2 nin ortalamasından daha az. m 1 < m 2 yada m 1 m 2 < 0 Matematiksel karşıtı: m 1 m 2 yada m 1 m 2 0 H 0 : H a : m 1 m 2 0 m 1 m 2 < 0
Boş ve alternatif hipotezi belirleyiniz: Popülasyon 1 in ortalamasının Popülasyon 2 nin ortalamasından 20 birim daha fazla olduğu varsayımına dayanarak hipotezleri yazınız. Çözüm: İddia: Popülasyon 1 in ortalaması Popülasyon 2 nin ortalamasından 20 birim daha fazla. m 1 > m 2 + 20 yada m 1 m 2 > 20 Matematiksel karşıtı: m 1 m 2 + 20 yada m 1 m 2 20 H 0 : H a : m 1 m 2 20 m 1 m 2 > 20
Boş ve alternatif hipotezi belirleyiniz: Popülasyon 1 in ortalamasının Popülasyon 2 nin ortalamasına eşit olmadığı varsayımına dayanarak hipotezleri yazınız. Çözüm: İddia: Popülasyon 1 in ortalaması Popülasyon 2 nin ortalamasına eşit değil. m 1 m 2 yada m 1 m 2 0 Matematiksel karşıtı: m 1 = m 2 yada m 1 m 2 = 0 H 0 : m 1 m 2 = 0 H a : m 1 m 2 0
Büyük Örneklemler, n 30, İçin Test İstatistiği: p-değerini bulmak için öncelikle örneklemden toplanan verilere dayanarak z-değeri hesaplanır. Sonra ilgili z-değerine karşılık gelen olasılık değeri bulunur.
p-değerini kullanarak yapılan hipotez testi sonuçları: 1. p a ise boş hipotez reddedilir. 2. p > a ise boş hipotez reddedilmez.
Hipotezi test edip sonuca ulaşınız: Türkiye de bulunan iki üniversitenin spor akademileri, kendi öğrencilerinin fiziksel durumlarının daha iyi olduklarını düşünmektedir. Araştırmacı olarak iki üniversitenin spor akademisi öğrencilerinin spora ayırdıkları toplam saat arasında bir fark olduğunu test etmeniz istenmektedir. Birinci üniversiteden seçilen 36 öğrencinin haftada ortalama 2.9 saat spor yaptıkları (s.s.=1.1 saat), ikinci üniversiteden seçilen 38 öğrencinin ise haftada ortalama 2.7 saat spor yaptıkları (s.s.=1.0 saat) belirlenmiştir. 0.05 lik bir anlamlılık düzeyi kullanarak, hipotez testini uygulayınız. Solution: H 0 : H a : m 1 m 2 = 0 m 1 m 2 0 a = 0.05 p < a (yada p < 0.05) ise reddet.
Çözüm (devamı): n 1 = 36, 1 = 2.9, s 1 = 1.1, n 2 = 38, 2 = 2.7, s 2 = 1.0 0.82 Çift kuyruklu test olduğu için, p = 0.2061(2) = 0.4122. p, a dan büyük olduğu için boş hipotez reddedilmemiştir. 0.05 almalılık düzeyinde, öğrencilerin fiziksel durumları arasında bir farkın olduğuna yönelik yeterli kanıt bulunamamıştır.
İki Ortalama İçin Hipotez Testi (Küçük ve Bağımsız Örneklemler) Kriterler: Örneklemler bağımsızdır. Örneklemlerin seçildiği her bir popülasyonun dağılımı normaldir. Bir yada her bir örneklem için n < 30. Her bir popülasyon için bilinmemektedir.
Küçük Örnekler, n < 30, İçin Test İstatistiği: s.d.= n 1 1 ve n 2 1 den küçük olanı
Red Bölgeleri: Sol kuyruk testi için, t t a ise H 0 reddedilir. Sağ kuyruk testi için, t t a ise H 0 reddedilir. Çift kuyruk testi için, t t a/2 ise H 0 reddedilir.
Aşağıdaki durum için sonuca ulaşınız: A şirketi, B şirketine nazaran,vergi beyannamesini kendilerinde yapan mükelleflerin daha fazla vergi iadesi aldıklarını iddia etmektedir. Seçilen 15 kişiye dayanarak A firmasının mükelleflerinin ort. $942 vergi iadesi (s.s.=$103); seçilen 18 kişiye dayanarak B firmasının mükelleflerinin $898 vergi iadesi (s.s.=$95) aldığı belirlenmiştir. İddiayı 0.05 düzeyinde test ediniz. Popülasyonların normal olarak dağıldığını varsayınız. Her iki firma büyük bir şehrin iki farklı bölgesinde faaliyet gösterdiği için, iki popülasyonun varyanslarının eşit olmadığını varsayınız. Çözüm: H 0 : H a : m 1 m 2 0 m 1 m 2 > 0 a = 0.05, s.d. = 14 t 0.05 = 1.761 t t a (yada t 1.761) ise reddet.
Çözüm (devamı): n 1 = 15, 1 = 942, s 1 = 103, n 2 = 18, 2 = 898, s 2 = 95 1.266 t, t a dan küçük olduğundan dolayı, boş hipotez reddedilmemiştir. 0.05 anlamlılık düzeyinde, A firmasının mükelleflerinin B firmasından daha fazla vergi iadesi aldıkları konusunda yeterli kanıt bulunamamıştır.
ANOVA (ANalysis Of VAriance ) Varyans Analizi ANOVA Testi: 1. Tüm popülasyonların dağılımı yaklaşık olarak normaldir. 2. Popülasyonların varyansı aynıdır. 3. Her bir popülasyondan rastsal ve bağımsız örneklemler seçilmektedir.
Boş ve Alternatif Hipotezler H 0 : m 1 = m 2 = = m n. H a : En az bir ortalama diğerlerinden farklıdır.
ANOVA Tablosu: Değişim Kaynağı Gruplar Arası Gruplar İçi Kareler Toplamı Serbestlik Derecesi Ortalama Kare GAKT k 1 GAKT/k 1 GIKT n k GIKT/n k Toplam GAKT+GIKT n 1 F İstatistiği GAKT/k 1 GIKT/n k
Gruplar Arası Kareler Toplamı (GAKT): k = popülasyon sayısı n i = popülasyon i nin örneklem büyüklüğü = i. popülasyondan gelen örneklem ortalaması
Gruplar İçi Kareler Toplamı (GIKT):
Gruplar Arası Ortalama Kare: GAKT / k 1 Gruplar İçi Ortalama Kare: GIKT / n k
ANOVA İçin Test İstatistiği F = (GAKT / k 1) / (GIKT / n k) Örneklemden toplanan verilere dayanarak hesaplanan test istatistiğinin istatistiki olarak anlamlı olup olmadığının belirlenmesi için kritik değere bakılır. Kritik değerler için F-dağılımı tablosu kullanılmaktadır. F kritik değer F a, k-1, n-k
Red Bölgesi: Reddetme Reddet F test > F a, k-1, n-k ise H 0 reddedilir. yada p a ise H 0 reddedilir.
Aşağıdaki durum için sonuca ulaşınız: C Vitamininin soğuk algınlığına etkisini araştıran tıp araştırmacıları, yaptıkları akademik çalışmaya katılanları 3 gruba ayırmıştır: 1) günlük 1000 mg C Vitamini alanlar, 2) günlük 500 mg C Vitamini alanlar, 3) C Vitamini almayanlar. Çalışmaya katılanlar bir yıl takip edilmiştir ve soğuk algınlığına yakalanma zamanı ve sayıları belirlenmiştir. Bu verileri kullanarak, ANOVA testi uygulanmış olup, aşağıdaki tabloda ANOVA sonuçları verilmiştir. Ne yazık ki, ANOVA tablosundaki bazı hücreler silinmiştir!!! a. ANOVA tablosundaki boşlukları doldurunuz. b. Belli bir miktar C Vitamini alanlar ve hiç C Vitamini almayanlar arasında yıl başına düşen soğuk algınlığı sayısı bakımından bir fark olup olmaması konusunda araştırmacıların elinde yeterli kanıt var mıdır (0.05 anlamlılık düzeyinde)? c. ANOVA tablosuna dayanarak, bir grubun diğer bir gruptan daha az soğuk algınlığına yakalandığı sonucuna varılabilir mi? Kareler Toplamı S.D. Ortalama Kare F İstatistiği p-değeri Gruplar Arası 2 1.4288 0.4288 Gruplar İçi 49.2030 Total 52.0606 32 F Kritik değer
Aşağıdaki durum için sonuca ulaşınız: C Vitamininin soğuk algınlığına etkisini araştıran tıp araştırmacıları, yaptıkları akademik çalışmaya katılanları 3 gruba ayırmıştır: 1) günlük 1000 mg C Vitamini alanlar, 2) günlük 500 mg C Vitamini alanlar, 3) C Vitamini almayanlar. Çalışmaya katılanlar bir yıl takip edilmiştir ve soğuk algınlığına yakalanma zamanı ve sayıları belirlenmiştir. Bu verileri kullanarak, ANOVA testi uygulanmış olup, aşağıdaki tabloda ANOVA sonuçları verilmiştir. Ne yazık ki, ANOVA tablosundaki bazı hücreler silinmiştir!!! a. ANOVA tablosundaki boşlukları doldurunuz. b. Belli bir miktar C Vitamini alanlar ve hiç C Vitamini almayanlar arasında yıl başına düşen soğuk algınlığı sayısı bakımından bir fark olup olmaması konusunda araştırmacıların elinde yeterli kanıt var mıdır (0.05 anlamlılık düzeyinde)? c. ANOVA tablosuna dayanarak, bir grubun diğer bir gruptan daha az soğuk algınlığına yakalandığı sonucuna varılabilir mi? Kareler Toplamı S.D. Ortalama Kare F İstatistiği p-değeri F Kritik değer Gruplar Arası 2.8576 2 1.4288 0.8712 0.4288 3.3158 Gruplar İçi 49.2030 30 1.6401 Total 52.0606 32
Çözüm: b. Boş ve alternatif hipotezleri belirleyiniz: H 0 : H a : m 1 = m 2 = = m n. En az bir ortalama diğerlerinden farklıdır. a = 0.05 ve p = 0.4288 dir. p, a dan büyük olduğundan dolayı boş hipotez reddedilmez. Sonuç: Belli bir miktar C Vitamini alanlar ve hiç C Vitamini almayanlar arasında yıl başına düşen soğuk algınlığı sayısı bakımından bir fark olup olmaması konusunda araştırmacıların elinde, 0.05 anlamlılık düzeyinde, yeterli kanıt yoktur.
Çözüm: c. ANOVA testi, popülasyon ortalamalarından en azından birinin diğerlerinden farklı olduğunu gösterir; fakat hangi popülasyon ortalamasının ne kadar fark gösterdiğini belirtmez. Dolayısıyla ANOVA tablosu, hangi grubun daha az sayıda soğuk algınlığına yakalandığı konusunda bilgi vermez.