Hipotez Testi Rehberi Orhan Çevik İstanbul, 30 Ağustos 2014
Hipotezler Sıfır Hipotezi: H 0 Aksi kanıtlanmadığı sürece doğru olduğu düşünülen varsayımdır. H 0 ın kanıta ihtiyacı yoktur. H 0 ı ret etmek için ciddi kanıt gerekir. Genellikle Etki Yoktur, Değişiklik Yoktur veya Fark Yoktur türünden ifadelerdir (=). ÖRNEĞİN: X in a olduğu durumda elde edilen Y değerlerinin ortalaması ile X in b olduğu durumda elde edilen Y değerlerinin ortalaması arasında fark yoktur (m a = m b ), veya X in a olduğu durumda elde edilen Y değerlerinin değişkenliği ile X in b olduğu durumda elde edilen Y değerlerinin değişkenliği arasında fark yoktur (s 2 a = s 2 b ), veya X in a olduğu durumda elde edilen başarı oranı ile X in b olduğu durumda elde edilen başarı oranı arasında fark yoktur (P a = P b ), veya., veya kısaca x in seviyesi değiştiği zaman y nin değeri değişmez veya x in y ye etkisi yoktur Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 2
Hipotezler Alternatif Hipotez: H a Yeterli kanıt bulunup H 0 ret edildiğinde doğru olduğu düşünülen şeydir. Kanıta ihtiyacı olan hipotezdir. Genellikle Etki Vardır, Değişiklik Vardır veya Fark Vardır türünden ifadelerdir (<,,>). ÖRNEĞİN: X in a olduğu durumda elde edilen Y değerlerinin ortalaması, X in b olduğu durumda elde edilen Y değerlerinin ortalamasından büyüktür (m a > m b ), veya X in a olduğu durumda elde edilen Y değerlerinin değişkenliği, X in b olduğu durumda elde edilen Y değerlerinin değişkenliğinden küçüktür (s 2 a < s 2 b ), veya X in a olduğu durumda elde edilen başarı oranı, X in b olduğu durumda elde edilen başarı oranından farklıdır (P a P b ), veya., veya kısaca x in seviyesi değiştiği zaman y nin değeri değişir veya x in y ye etkisi vardır Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 3
Suçlu Karar Suçlu Değil Çağdaş Yargı Sistemi Sanığın suçlu olduğu kanıtlanıncaya kadar masum kabul edildiği çağdaş yargı sisteminin de yaptığı hipotez testidir: Gerçek Durum Suçlu Değil Suçlu H 0 : Sanık masumdur (aksi kanıtlanmadığı sürece doğru olduğu düşünülen) Doğru Karar Suçlu Serbest Kalır H a : Sanık suçludur (iddia kanıtlanmalıdır) Masum Cezalandırılır (Suçlu Serbest Kalır) Doğru Karar Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 4
Karar Hipotez Testi Hataları Tip I hata Sıfır hipotezini aslında doğru olduğu halde reddetmek Tip I hata yapma olasılığı (riski) a ile gösterilir, (0< a <1) a üretici (veya tedarikçi) riski olarak da bilinir Gerçek Durum H 0 Doğru H a Doğru Tip II hata Sıfır hipotezini aslında yanlış olduğu halde kabul etmek Tip II hata yapma olasılığı (riski) b ile gösterilir, (0< b <1) b tüketici (veya müşteri) riski olarak da bilinir H0 Doğru Ha Doğru Doğru Karar Tip I Hata Tip II Hata Doğru Karar Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 5
Hipotez Testinin Temeli Araştırın/İnceleyin/Gözlemleyin Hipotezleri Oluşturun Yanlışlama Koşulunu Belirleyin Sıfır Hipotezinin Doğru Olduğu Durumdaki Modeli Oluşturun Veriyi Toplayın ve Model ile Uyuşup Uyuşmadığını Test Edin Varsayımlarınızı oluşturun ( 0 Hipotezi ve Alternatif Hipotez ). Ne büyüklükteki bir çelişkinin 0 Hipotezi ni reddetmek için yeterli olacağına karar verin (ne ile karşılaşırsak varsayımımızın yanlış olduğunu kabul ederiz?). 0 Hipotezi nin doğru olduğu durumdaki dağılımı (ana kütleyi) modelleyin ve yanlışlama koşulunu bu modele yerleştirin. Çelişkinin büyüklüğünü hesaplayın ( 0 Hipotezi doğru olsaydı böyle bir şeyle karşılaşma olasılığı): Anlamlılık Değeri (Significance Value) Yanlışlama koşuluyla karşılaştırın. Pratik Sonuca Çevirin Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 6
Hipotez Testi Reçetesi Ön Çalışmaları Tamamlayın Hipotezleri Oluşturun Yanlışlama Koşulunu Belirleyin Uygun Hipotez Testini Seçin Örnek Büyüklüğünü Hesaplayın Veriyi Toplayın Testi Yapın ve Sonuçları Yorumlayın Pratik Sonuca Çevirin H 0 : Fark YOK (=) H a : Fark VAR (<,, >) a (genellikle 0.05) HİPOTEZ TESTİ YOL HARİTASI d ve b yı belirledikten sonra Rastlantısal, bağımsız ve hesaplanan miktarda p-değeri ni a ile karşılaştırın (anlamlılık değerini yanlışlama koşulu ile karşılaştırın). Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 7
Hipotez Testi Reçetesi Ön Çalışmaları Tamamlayın Hipotezleri Oluşturun Yanlışlama Koşulunu Belirleyin Uygun Hipotez Testini Seçin Örnek Büyüklüğünü Hesaplayın Veriyi Toplayın Testi Yapın ve Sonuçları Yorumlayın Pratik Sonuca Çevirin H 0 : Fark YOK (=) H a : Fark VAR (<,, >) a (genellikle 0.05) HİPOTEZ TESTİ YOL HARİTASI d ve b yı belirledikten sonra Rastlantısal, bağımsız ve hesaplanan miktarda p-değeri ni a ile karşılaştırın (anlamlılık değerini yanlışlama koşulu ile karşılaştırın). Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 8
Kutsal Üçlü 1. Pratik Problem: (Hipotez testini yapan kişiden karar vermesi beklenen konu) 2. -y: Ne? Nasıl Ölçülüyor (veri tipi), Ölçüm Sistemi Yeterli mi? -x: Ne (y nin neye göre farklılık gösterip göstermediğini anlamaya çalışıyoruz)? x in seviyeleri 3. Hipotezler: H 0 : (=) x in seviyesi değiştiği zaman y değişmez. H a : (<,,>) x in seviyesi değiştiği zaman y değişir. Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 9
Hipotez Testi Reçetesi Ön Çalışmaları Tamamlayın Hipotezleri Oluşturun Yanlışlama Koşulunu Belirleyin Uygun Hipotez Testini Seçin Örnek Büyüklüğünü Hesaplayın Veriyi Toplayın Testi Yapın ve Sonuçları Yorumlayın Pratik Sonuca Çevirin H 0 : Fark YOK (=) H a : Fark VAR (<,, >) a (genellikle 0,05) HİPOTEZ TESTİ YOL HARİTASI d ve b yı belirledikten sonra Rastlantısal, bağımsız ve hesaplanan miktarda p-değeri ni a ile karşılaştırın (anlamlılık değerini yanlışlama koşulu ile karşılaştırın). Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 10
Yanlışlama Koşulu: a (Tip I Hata Yapma Riski) Doğru olduğu halde H 0 ı ret etme riski: a Yüzde kaçlık bir Tip I hata yapma riski ile karar vermek istiyorsunuz? Ne büyüklükteki bir çelişkinin Sıfır Hipotezi ni reddetmek için yeterli olacağına karar verin (ne ile karşılaşırsanız varsayımınızın yanlış olduğunu kabul edersiniz?). Üzerinde çalışılan karakteristik müşteriye veya kullanıcıya fiziksel hasar verme riski taşıyan bir karakteristik değil ise genellikle: a = 0,05 (%5) Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 11
Hipotez Testi Reçetesi Ön Çalışmaları Tamamlayın Hipotezleri Oluşturun Yanlışlama Koşulunu Belirleyin Uygun Hipotez Testini Seçin Örnek Büyüklüğünü Hesaplayın Veriyi Toplayın Testi Yapın ve Sonuçları Yorumlayın Pratik Sonuca Çevirin H 0 : Fark YOK (=) H a : Fark VAR (<,, >) a (genellikle 0.05) HİPOTEZ TESTİ YOL HARİTASI d ve b yı belirledikten sonra Rastlantısal, bağımsız ve hesaplanan miktarda p-değeri ni a ile karşılaştırın (anlamlılık değerini yanlışlama koşulu ile karşılaştırın). Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 12
Hipotez Testi Reçetesi Ön Çalışmaları Tamamlayın Hipotezleri Oluşturun Yanlışlama Koşulunu Belirleyin Uygun Hipotez Testini Seçin Örnek Büyüklüğünü Hesaplayın Veriyi Toplayın Testi Yapın ve Sonuçları Yorumlayın Pratik Sonuca Çevirin H 0 : Fark YOK (=) H a : Fark VAR (<,, >) a (genellikle 0.05) HİPOTEZ TESTİ YOL HARİTASI d ve b yı belirledikten sonra Rastlantısal, bağımsız ve hesaplanan miktarda p-değeri ni a ile karşılaştırın (anlamlılık değerini yanlışlama koşulu ile karşılaştırın). Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 14
Örnek Büyüklüğü: n= f(d, b, α, Test Yöntemi, H a ) d: Kritik Fark ne büyüklükte bir farkı ayırt etmek istiyorsunuz? Ne büyüklükteki bir fark iş sonuçlarına etkisi açısından önemli (ayırt edilmesi gereken) bir farktır? b: d yı (kritik farkı) yüzde kaçlık bir gözden kaçırma (yakalayamama) riskiyle aramak istiyorsunuz? b: Tip II hata yapma riski (alternatif hipotez doğru olduğu halde onu reddetme riski) veya Güç: d yı (kritik farkı) yüzde kaçlık bir yakalama şansı ile aramak istiyorsunuz? Güç = 1 b Üzerinde çalışılan karakteristik müşteriye veya kullanıcıya fiziksel hasar verme riski taşıyan bir karakteristik değil ise genellikle: b = 0,10 (%10) Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 15
Hipotez Testi Reçetesi Ön Çalışmaları Tamamlayın Hipotezleri Oluşturun Yanlışlama Koşulunu Belirleyin Uygun Hipotez Testini Seçin Örnek Büyüklüğünü Hesaplayın Veriyi Toplayın Testi Yapın ve Sonuçları Yorumlayın Pratik Sonuca Çevirin H 0 : Fark YOK (=) H a : Fark VAR (<,, >) a (genellikle 0.05) HİPOTEZ TESTİ YOL HARİTASI d ve b yı belirledikten sonra Rastlantısal, bağımsız ve hesaplanan miktarda p-değeri ni a ile karşılaştırın (anlamlılık değerini yanlışlama koşulu ile karşılaştırın). Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 16
Veriyi Toplayın Sahaya çıkın Hesaplanan miktarda veriyi toplayın Rastlantısal Bağımsız DİKKAT: Ölçümleri yapacağınız ölçüm sisteminin uygunluğundan emin olun. Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 17
Hipotez Testi Reçetesi Ön Çalışmaları Tamamlayın Hipotezleri Oluşturun Yanlışlama Koşulunu Belirleyin Uygun Hipotez Testini Seçin Örnek Büyüklüğünü Hesaplayın Veriyi Toplayın Testi Yapın ve Sonuçları Yorumlayın Pratik Sonuca Çevirin H 0 : Fark YOK (=) H a : Fark VAR (<,, >) a (genellikle 0.05) HİPOTEZ TESTİ YOL HARİTASI d ve b yı belirledikten sonra Rastlantısal, bağımsız ve hesaplanan miktarda p-değeri ni a ile karşılaştırın (anlamlılık değerini yanlışlama koşulu ile karşılaştırın). Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 18
Testi Yapın ve Sonuçları Yorumlayın Veriden hesaplanan değer: P-değeri (anlamlılık değeri significance value) a dan (anlamlılık düzeyi - significance level) küçük ise 0 Hipotezini reddedin. Eğer P-değeri < a ise H 0 Ret İstatistik sonucu herkesin anlayacağı dilden pratik sonuca çevirin ve dokümante edin Bir sonraki hamleye karar verin P-değeri: H 0 ın doğru olduğu durumda bu büyüklükte veya daha büyük bir fark ile rastlantısal olarak karşılaşma olasılığı Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 19
EKLER Hipotez Testi Örnekleri
1-Örnek Z testi (1-Sample Z test) 1-Örnek t testi (1-Sample t test) 2-Örnek t testi (2-Sample t test) Ki-Kare testi (Chi-Square test) F testi (F test) Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 21
1-Örnek Z testi P-value < a Z Hesaplanan x X = s : örneklerin m AnaKütle Hedef n ortalaması s AnaKütle : ana kütlenin bilinen standart sapması m Hedef : H 0 ın doğru olduğu durumdaki ana kütle ortalaması n: örnek büyüklüğü Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 22
1-Örnek Z testi - Grafiksel H a : m < m Hedef Z Hesaplanan Z a Z Hesaplanan < Z a Z Hesaplanan = X s m AnaKütle Hedef n H a : m > m Hedef Z Hesaplanan > Z 1 a Z Hesaplanan H a : m m Hedef ; Z Hesapl. < Z (a/2) veya Z Hesapl. >Z (1 a//2) Z Hesaplanan Z Hesaplanan Z 1 a Za/2 Z1 a/2 Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 23
1-Örnek t testi - s Ana Kütle bilinmediğinde P-value < a t Hesaplanan x = X : örneklerin m s n Hedef ortalaması s: örneklerin standart sapması m Hedef : H 0 ın doğru olduğu durumdaki anakütle ortalaması n: örnek büyüklüğü df: n-1 Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 24
1-Örnek t testi - Grafiksel H a : m < m Hedef t Hesaplanan t (n-1),a t Hesaplanan < t (n-1),a t Hesaplanan = X m s n Hedef H a : m > m Hedef t Hesaplanan > t (n-1),(1 a) H a : m m Hedef t Hesapl. < t (n-1),(a/2) veya t Hesapl. >t (n-1),(1 a//2) t Hesaplanan t Hesaplanan t Hesaplanan t (n-1),(1 a) t (n-1),a/2 t (n-1),(1 a/2) Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 25
2-Örnek t testi t Hesaplanan = s Havuz X 1 X 1 n 1 2 1 n 2 P-value < a x, 1 x 2 : örneklerin ortalamaları S Havuz : Havuzlanmış (pooled) standart sapma n 1, n 2 : örnek büyüklükleri df = (n 1-1)+(n 2-1) Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 26
2-Örnek t testi - Grafiksel H a : m < m Hedef t Hesaplanan t df,a t Hesaplanan < t df,a t Hesaplanan = s Havuz X 1 X 1 n 1 2 1 n 2 H a : m > m Hedef t Hesaplanan > t df,(1 a) H a : m m Hedef ; t Hesapl. < t df,(a/2) veya t Hesapl. >t df,(1 a//2) t Hesaplanan t Hesaplanan t Hesaplanan t df,(1 a) t df,a/2 t df,(1 a/2) Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 27
Ki-Kare testi 2 ( n 1) Hesaplanan = s s 2 Hedef 2 s 2 : örneklerin varyansı s 2 Hedef: H 0 ın doğru olduğu durumdaki ana kütle varyansı n: örnek büyüklüğü df = n - 1 P-value < a Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 28
Ki-Kare testi - Grafiksel 2 Kritik(df,a) 2 Hesaplanan H a : σ 2 < σ 2 Hedef χ 2 Hes < χ 2 (df, α/2) 2 ( n 1) Hesaplanan = s s 2 Hedef 2 H a : σ 2 > σ 2 Hedef H a : σ 2 σ 2 Hedef χ 2 Hesaplanan > χ 2 (df, 1-α) 2 Kritik(df,1-a) 2 Hesaplanan 2 Krit(df,a/2) 2 Hes 2 Krit(df,1-a/2) χ 2 Hes < χ 2 (df, α/2) veya χ 2 Hes > χ 2 (df, 1-α/2) 2 Hesaplanan Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 29
F testi F Hesaplanan = s s 2 1 2 2 P-value < a n 1 ve n 2 ana kütle 1 ve 2 nin örnek büyüklükleri s 1 2 ve s 2 2 örneklerin varyansları df 1 = n 1 1, df 2 = n 2 1 Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 30
F testi - Grafiksel F Kritik(df1, df2, a) F Hesaplanan H a : σ 2 1 < σ 2 2 F Hesaplanan < F (df1, df2, α) F Hesaplanan = s s 2 1 2 2 H a : σ 2 1 > σ 2 2 F Hesaplanan > F (df1, df2, 1-α) F Kritik(df1, df2, 1-a) F Hesaplanan F Krit(df1, df2, a/2) H a : σ 2 1 σ 2 2 F Hes < F (df1, df2, α/2) F F Krit(df1, df2, 1-a/2) Hes veya F Hes > F (df1, df2, 1-α/2) F Hesaplanan Tüm hakları Orhan Çevik'e aittir. Akademik amaçlar dışında izinsiz alıntı yapılamaz, çoğaltılamaz ve kopyalanamaz. 31
orhan@orhancevik.com www.orhancevik.com