Örneklem Dağılımları & Hipotez Testleri Örneklem Dağılımı Ortalama veya korelasyon gibi istatistiklerin dağılımıdır Çıkarımsal istatistikte örneklem dağılımı temel fikirlerden biridir. Çıkarımsal istatistik = Evren hakkında çıkarımlarda bulunmayı amaçlar. Bunun için genellikle örneklem dağılımın ortalama ve standart sapmasını inceleriz Özellikle, örneklem dağılımının standart sapması standart hata olarak adlandırılır ve de çıkarımsal istatistikte önemli bir rol oynar.
(Örnek) Evren 100 kişiden oluşsun. Bu kişilerin IQ puanları ölçülmüş olsun. 1. Varyalım biz 100 gözlemden sadece 5 kişiyi örneklem olarak seçiyoruz. 2. O zaman IQ puanlarının ortalaması bu 5 kişinin verisine dayanarak hesaplanır. 3. Bu arada 100 kişiden 5 kişiyi seçmenin 75,287,520 farklı yolu vardır. 4. Bu 75 milyon örneklemin her biri ortalama verisini üretir. n=5 örneklemler X 1 Evren N=100 XR75 milyon r 2 r 3 Eğer 75 milyon örneklemin IQ puanlarının ortlamalarının dağılımından bahsediyorsak, bu dağılıma ortalamaların örneklem dağılımı denilir.
Ortalamaların Örneklem Dağılımı Merkezi Limit Teoremi Ortalamaların örneklem dağılımı, evrenin dağılımının şeklinden bağımsız biçimde, n arttıkça normal dağılıma yaklaşır. Buna merkezi limit teoremi denir. (Şekil) (G & H, pp.236-237)
Yukarıdaki grafiklerden de görüldüğü üzere; Örneklem dağılımının şekli her üç durumda da normal dağılıma yaklaşmıştır. Örneklem dağılımındaki değişkenliğin büyüklüğü n (örneklem büyüklüğü) n arttıkça küçülür. Örneklem dağılımının standart sapmasıyla (örn., standard hata) n in büyüklüğü ilişkilidir. X ortalamasının standard hatası σ σ = X n σ X ile temsil edilir ve hesabı σ X değişkeninin standar sapması, ve n örneklem büyüklüğüdür.
(örnek) σ = 15, n = 2 σ = σ X n = 15 2 = 15 1.414 = 10.61 Bu bilgiden yola çıkarak ne söyleyebiliriz? Evrenin ortalamasının μ = 100, olduğunu varsayarsak μ ± 1σ X = 100 ± 10.61 = [89.39, 110.61] Bu aralık gözlemlerin %68 içerir (bu durumda, olası örneklem ortalamalarının). Elimizde X in tesadüfi (random) bir örnkelemi var ise, (X 1σ) bu aralığın evrenin gerçek ortalaması µ yü içerme olasılığı % 68
Pratikte, olasılıktan bahsederken daha geniş bir aralık kullanılır (%95) bu aralık örneklem istatistiğinin %95 ini kapsar. Daha önceki bilgilerimizden normal dağılımda μ ± 2σ aralığının verilerin 95.44% kapsadığını biliyoruz. Tam olarak 95% olamsı için aralık μ ± 1.96σ. (Nasıl biliyoruz?) Z tablolarından veya SPSS ten IDF.NORMAL fonksiyonu ile. IDF.NORMAL(.975, 0, 1).975, olmasının nedeni örneklem dağılımın her iki kuruğunda %2.5 toplamda % 5 olması. Yorumu (Eğer birçok örneklemimiz varsa) %95 aralığı evrenin gerçek ortalamasını ( μ ) kapsar (içerir). (Gerçekte elimizde tesadüfi olarak seçilmiş tek bir örneklem var) Bu aralığın evrenin gerçek ortalamasını ( μ ) kapsama olasığı 95%. Eğer aralık dar ise, X in µ ye yakın olduğundan emin olabiliriz. (düşük belirsizlik = küçük standart hata). Eğer aralık geniş ise, X in µ ye yakın olduğundan emin olamayız (yüksek belirsizlik = büyük standart hata)
(örnek) σ = 15, n = 5 σ = σ X n = 15 5 = 15 2.236 = 6.71 Varsayalım X = 110, X ± 1.96 σ X = 110 ± 1.96(6.71) = 110 ± 13.15 = [96.85, 123.15] % 95 olasılıkla, bu aralık gerçek ortalamayı kapsar. Bu aralığa örneklem ortalamasının 95% güven aralığı denir. Güven aralığından Hipotez Testlerine X = 110, ortalamanın %95 güven aralığı ( σ = 15 ve n = 5) σ X 6.71 X ± 1.96 σ X = 110 ± 1.96(6.71) = 110 ± 13.15 = [96.85, 123.15] Şimdi hipotez oluşturalım: gerçek ortalama 95 (μ = 95). (Bu μ=95 değeri tamamen keyfidir, fakat değer açıkça belirtilmelidir.) % 95 güven aralığı hipotetik μ yü içermez. Başka bir deyişle bu hipotetik μ nün %95 güven aralığının X = 110 u kapsamayacağını söylemektir.
Bu, eğer gerçekte μ = 95 ise, X = 110 örneklemini gözlemenin nadir olacağı anlamına gelir. Bu sebeple örneklemimizin olağandışı olduğunu söylemek yerine μ = 95 olmasının olası olmadığı sonucuna varma eğilimindeyiz. Örneklemimizin olağan bir örneklem olduğuna inanmalıyız değil mi? (Grafik gösterim) X in µ etrafındaki örneklem dağılımı X ± 1.96 σ X = [96.85, 123.15] μ-1.96se= 81.85 μ=95 μ+1.96se= 108.15 X = 110 Bu aralık eğer μ = 95 ise örneklemin % 95 ini kapsar. Gözlemlenen örneklemde X = 110 Olduğundan bu aralık dışındadır, gözlemlenen örneklem olağan dışıdır (bütün vakaların % 5 daha az), eğer μ = 95 ise. Bu yüzden, μ = 95 olamaz.
Hipotez Testlerinin Formülüze edilmesi Oluşturduğumuz (μ = 95) hipotezine yokluk hipotezi denir, ve; H 0 : μ = 95 ile gösterilir. Elimizdeki istatistik için güven aralığı H 0 ı kapsamazsa H 0 hipotezi reddedilir. Sonuç: Elimizde μ nun 95 ten farklı olduğunu söylemek için yeterli delilimiz var Elimizdeki istatistik için güven aralığı H 0 ı kapsarsa, H 0 hipotezini reddetmeyiz.. Sonuç: Elimizde μ nun 95 ten farklı olduğunu söylemek için yeterli delilimiz yok. Tip I Hata Oranı (α) Güven Aralığını (GA) hesaplamak için kullanılan yüzde önemli midir? Evet. % 95 durumu için GA, % 100 % 95= % 5 oranında GA vakaları kapsamaz. Yani, vakaların % 5 inin GA gözlenmesi oldukça nadirdir, çünkü bu gözlemler μ ye göre oldukça yüksek veya düşük değerlerdir. Bu yüzden, olağandışı gözlemleri tanımlayan yüzdeye karar vermek bizim nesnel (kişisel) kararımızdır. Bu ölçüt ( örnekteki %5) α olarak adlandırılır, oran ölçeğinde ifade edilir (örnekte α = 0.05).
α hakkında bilgi α H 0 ı hatalı olarak reddetme olasılığının miktarıdır (H 0 doğru iken H 0 ı reddetme olasılığı.) H 0 ı hatalı olarak reddetmeye Tip I hata denir. α ya aynı zamanda Tip I hata oranı denir. Ayrıca, α Tip I hatanın tolerans seviyesidir. α =.05 olduğunda, bu bize kararlarımızda %5 Tip I hatayı tolere ettiğimizi gösterir. α nın yanlış yorumlarından biri: H 0 reddedildiğinde H 0 ın doğru olma olasılığı. Hata Türleri ve Güç Reddet H 0 Reddetme H 0 H 0 doğru Tip I hata α 1 α H 0 yanlış Güç 1 β Tip II hata β β, H 0 yanlış iken, hatalı olarak H 0 ı reddetmeme oranıdır. (Tip II hata oranı) β α nın fonksiyonudur örneklem büyüklüğü veetki büyüklüğü gibi faktörlerden etkilenir. Diğer faktörler sabit tutulduğunda, α nın küçülmesi, β yı arttırır.
Tip I & II hata örnekleri H 0 doğru (Hasta kanser) H 0 yanlış (Hasta kanser değil.) (Doktor hastanın kanser olmadığını söyledi.) Reddet H 0 (Doktor hastanın kanser olduğunu söyledi..) Reddetme H 0 Önemli hata Tip I hata α Doğru karar 1 α Doğru karar Güç 1 β Tip II hata β
p değeri ne kadar küçük olursa H 0 ı reddetme konusunda o kadar emin oluruz. Karar verme kuralı p < α olduğunda H 0. reddet örnek p=.001 p > α olduğunda H 0. reddetme örnek p=.069
Reddetme Ölçütü- H 0 (örneğimizde) p-değeri α = 0.05 den küçük ise. (p =.013) Güven aralığının %95 H 0 belirttiği X içermez. (95% GA = [96.85, 123.15], H 0 : μ = 95). X μ mutlak değeri 1.96 σ X den büyüktür. (1.96 σ X = 1.96*6.71=13.15, X μ = 110 95 = 15). Reddetme Ölçütü H 0 (genel olarak) p-değeri α dan küçüktür. %100(1 α) GA H 0 belirttiği değeri içermez. İstatistik Z α se den büyüktür Z α örneklem dağılımındaki belli bir α değerine karşılık gelen değerdir (H) 0 se istatistiğin standard hatasıdır. Z α se genellikle kritik değer olarak anılır.
İstatistiksel Hipotezleri Test etmenin 5 adımı: 1. Test edilecek yokluk hipotezini oluştur. 2. α yı belirle (Tip-I hata yapma derecesi). 3. İstatistikleri hesapla. 4. Karar vermede kullanılacal üç kriterden birini elde et; Güven aralığı Kritik değer p-değeri 5. H 0 reddetme veya reddetmeme konusunda karar ver. (Örnek) n=25 evlatlık çocuğun ortalama IQ puanları X = 96 1. Yokluk hipotezi H 0 : μ=100 2. Tolere edilebilir Tip I hata yapma riski α=.05 3. İstatistikler elde edilir. a. IQ puanlarının evrene ait varyansını σ = 15 alırsak standard hata is σ = σ X n = 15 = 3.0 25 b. O zaman, the z-puanları dağılımı X = 96 ise z = X μ = 96 100 = 1.33 σ X 3 (Bu z-istatistiği.)
4. Karar verme kriterini elde et ve 5. Karar ver. a-1. Güven ararlığı X için X ± Z α se = 96 ± 1.96(3.0) = 96 ± 5.88 = [90.12, 101.88] Bu aralık H 0 ın belirttiği (μ = 100) içerdiği için H 0 reddedilmez. a-2. z için güven ararlığı z ± Z α = 1.33 ± 1.96 = [ 3.29,.66] Bu aralık H 0 ın belirttiği (ζ = 0), içerdiği için H 0 reddedilmez. b-1. Kritik değer X = Z α se = 1.96(3.0) = 5.88 Örneklem ortalaması ile H 0 belirttiği değer arasındaki farkın mutlak değeri( 96 100 = 4) kritik değerden küçük olduğu için H 0 reddedilmez. b-2. Kritik değer z = Z α = 1.96 İstatistiğin mutlak değeri (1.33) kritik değerden küçük olduğu için H 0 reddedilmez.
c. p-değeri İstatistik z = 1.33 idi. Bu istatistiğe karşılık gelen p değerini bulmak için, μ = 100 dan (veya ζ = 0) farklılaşan vakaların oranını bul, z değerinden pozitif ve negatif yönde büyük olanları H 0 Örneklem Dağılımı p-değeri A + B B A z = 1.33 μ=100 ζ=0 z = 1.33 A değerini bulmak için, standart normal dağılım tablosuna bak z = 1.33 değerini ara. z nin üstündeki.0918 değerini oku B nin değeri A, dağılım simetrik olduğu için aynıdır. Burdan, p = A + B = 2(.0918) =.1836 Alternatif olarak, SPSS te CDF.NORMAL fonksiyonunu kullan. p-değeri α dan büyük olduğu için, H 0 reddedilmez. Not: Üç metodun hepsi her zaman H 0 için aynı kararla sonuçlanmalıdır (aynı α-seviyesinde).
Tek Örneklem t-testi Pratikte biz genellikle evren verisinin σ standart sapmasını bilmeyiz. σ yı örneklemden kestirmeliyiz s Eğer standard hatayı (s X ),bulmak için σ yerine s kullanırsak, X örneklem dağılımı tam olarak normal dağılmaz. Dağılımın şekli hala simetriktir, ama normal dağılıma göre biraz daha düzlenmiştir. Bu eğilim küçük n lerde daha çok göze çarpar. n büyüdükçe, örneklem dağılımı hemen hemen normal dağılıma denktir. Bu yüzden, σ değerini bilmediğimiz zamanlar, normal dağılımdan başka bir dağılım olduğunu varsaymalıyız. t-dağılımını örneklem dağılımı olarak kullanırız.
(Örnek) n = 25 evlatlık çocuğun IQ puanlarının ortalam. X = 96 1. Yokluk hipotezi H 0 : μ=100 2. α=.05 3. İstatistiği bul. a. IQ puanlarının evrene ait standart sapmasını bilmediğini varsay, fakat örneklemin S=15 inden kestir s = s = 15 = 3.0 X n 25 b. O zaman, t-istatistiği X = 96 için t = X μ = 96 100 = 1.33 s X 3 4. Karar verme kriterini bul ve 5. Karar ver. a-1. Güven aralığı: X X ± t α2 s X = 96 ± 2.064(3.0) = 96 ± 6.192 = [89.781, 112.192] Bu aralık H 0 ın belirttiği (μ = 100) içerdiği için H 0 reddedilmez. (not) t α2 bulmak için kitap sonunda t-tablosuna bak. 1. α 2 =.05 sütunu ara, 2. Uygun v değerini bul. Örneğimizde, v = 25 1 = 24. v değerine serbestlik derecesi denir. Tek-örneklem t-testi için, v = n 1 dir.
a-2. Güven aralığı (t) t ± t α2 = 1.33 ± 2.064 = 1.33 ± 2.064 = [ 3.394,.734] Bu aralık H 0 ın belirttiği (μ = 100) içerdiği için H 0 reddedilmez. For the CI around t, it should be t ± t α2 because the standard deviation of the sampling distribution (standard hata) is 1. For the CI around X, it should be X ± t α2 s X because the standard deviation of the sampling distribution is s X. b. Kritik Değer Kritik Değer t için t α2 = 2.064 İstatistiğin mutlak değeri (t = 1.33) kritik değerden küçük olduğu için H 0 reddedilmez. Kritik Değer X μ t α2 s X = 6.192 Örneklem ortalaması ile H 0 ın belirttiği değer arasındaki farkın mutlak değeri( 100-95 = 5) kritik değerden küçük olduğu için H 0 reddedilmez.. Pratikte, t için krtitik değerin kullanımı daha yaygındır.
c. p-değeri İstatistik değeri t = 1.33. Bu istatistiğe karşılık gelen p değerini bulmak için, Grafikte gösterilen A + B oranlarının toplamına eşittir. H 0 örneklem dağılımı: μ = 100 p-değeri A + B B A t = 1.33 μ=100 τ=0 t = 1.33 SPSS compute işlemi ile: Boş bir veri sayfası aç. Birinci hücreye tıkla. Transform Compute seç Target Variable adını belirle. Numeric Expression kutusuna tıkla. 2*CDF.T(-1.33,24) yaz Bu.196 değerini verecektir p-değeri α dan büyük olduğu için, H 0 reddedilmez.
p-değerinin hesaplanması (t = 1.33, v = 24) CDF.T(1.33, 24) sonucu ne? CDF.T(1.33, 24) CDF.T(-1.33, 24) 1 - CDF.T(1.33, 24) t = 1.33 t = 0 t = 1.33 So, p-value of t = 1.33 can be computed by: 2 * (1 CDF.T(1.33, 24)) or 2* CDF.T(-1.33, 24) Güç H 0 yanlışken, doğru reddetme olasılığıdır 1 β yı ne büyütür? Ortalamalar arasındaki büyük fark. (Büyük etki büyüklüğü) Büyük α. Örneklem dağılımın dar olması. (Büyük örneklem büyüklüğü)
SPSS te Tek-örneklem t-testi Analyze Compare Means One-Sample T Testi seç T est edilecek değişkeni seç. H 0 değerini belirle (Test değeri). Eğer α-seviyesini değiştirmek isterseniz, Options, tıkla ve uygun değeri belirle (%). Yönlü ve. Yönsüz Hipotezler Eğer H 0 : μ = 100 reddedersek, kararımız μ 100 olacaktır. Bu iki durum ortaya koyar μ < 100 or μ > 100. Bu yüzden, H 0 : μ = 100 yönsüz bir hipotezdir. Bu hipoteze eşlik eden test iki yönlü testtir. Eğer H 0 : μ 100 reddedersek, kararımız μ > 100 olacaktır. Eğer H 0 : μ 100 reddedersek, kararımız μ < 100 olacaktır. Bu yüzden, H 0 : μ 100 ve H 0 : μ 100 yönlü hipotelerdir. Bu tip yokluk hipotezleri tek yönlü hipotez testleridir
İki yönlü ve. Tek yönlü Test H 0 reddetmek için farkın ne kadar büyük olması gerekir? Yeterince güçlü bir dayanağınız olmadıkça tek yönlü testler önerilmez. Tek yönlü Tip I & II Hataların Grafik Gösterimi H 0 H 0 : μ > 3 H 1 α 1-β -3 β H 1 : μ 3-3