Parametrik Olmayan İstatistik Prof. Dr. Cenk ÖZLER
Not: Beklenen Frekansı 5 in altında olan gruplar varsa, bu gruplar bir önceki veya bir sonraki grupla birleştirilir. Hipotezler χ 2 Dağılışa Uyum Testi H 0 : Anakütlenin dağılışı dır. H 0 : Anakütlenin dağılışı Normal dir. H 0 : Anakütlenin dağılışı parametreleri veya parametresi olan dır. (Parametre yok) (Parametre yok) (Parametre var) H 0 : Anakütlenin dağılışı parametreleri μ = 50 ve = 10 olan Normal dir. (Parametre var) Test İstatistiği χ 2 = (G i B i ) 2 Ret Bölgesi B i Eğer χ 2 2 > χ α,v ise H 0 reddedilir. v= n e -1-g n e : Grup Sayısı g: Örnekten tahmin edilen parametre sayısı
Dağılışa Uyum Testleri (Kesikli Uniform Dağılış) Örnek: Bir lotoda kazanan numara 4 hanelidir. (4416, 1083 gibi) kazanan numaralardaki haneler şansa bağlıdır. Kazanan hanelerin ana kütlesinin tek düzen olduğu varsayılıyor. Lotoda gelebilecek sayılar 0,1,2,3,4,5,6,7,8,9 dur ve her birinin kazanan sayı olma olasılığı eşittir (1/k=1/10). A isimli kişi kazanan numaraları bir yere yazıyor ve geçmişte en sık kazanan /karşılaşılan 4 sayıyı kullanarak düzenli bir şekilde oyun oynuyor. 400 kazanan sayı bir şans örneği olarak test için kullanılmıştır ve tabloda verilmiştir. =0.05 seviyesinde örnek dağılımının tek düzen olup olmadığını test ediniz. Sayılar Gözlemler 0 41 1 54 2 31 3 39 4 35 5 36 6 56 7 38 8 31 9 39 400
Dağılışa Uyum Testleri (Kesikli Uniform Dağılış) H 0 : Dağılış kesikli uniform dur. H 1 : Dağılış kesikli uniform değildir. p x = 1 k 1 ve Bi pi N 400 40 elde edilir. 10 Sayılar Gözlemler (G i ) Beklenen (B i ) G i -B i (G i -B i ) 2 (G i -B i ) 2 / B i 0 41 40 1 1 0,025 1 54 40 14 196 4,900 2 31 40-9 81 2,025 3 39 40-1 1 0,025 4 35 40-5 25 0,625 5 36 40-4 16 0,400 6 56 40 16 256 6,400 7 38 40-2 4 0,100 8 31 40-9 81 2,025 9 39 40-1 1 0,025 400 χ 2 =16,550 n e =10, 2 sd=n e 1 g=10-1-0=9, χ 0.05,9 = 16.919 bulunur. 2 χ 0.05,9 > χ 2 olduğundan H 0 reddedilemez.
Dağılışa Uyum Testleri (Binom Dağılışı) Örnek: Fizz şirketi silindir üretmektedir ve üretilen bu silindirler 20 lik kutularda satılmaktadır. Zaman zaman silindirler kusurlu çıkabilmektedir. Bu durumda müşteriler kutuyu olduğu gibi iade etmektedirler. Firmanın kalite kontrol müdürü ise kutulardaki kusurlu silindir sayısının Binom dağılımı gösterdiğini iddia etmektedir. Bunu test etmek amacıyla rasgele 100 kutu seçilmiş ve kutulardaki kusurlu sayılarına ilişkin frekans tablosu aşağıda oluşturulmuştur. 0.05 önem seviyesinde kutulardaki kusurlu sayılarının Binom dağılışı gösterdiği söylenebilir mi? Kutulardaki Kusurlu Sayısı Gözlenen Kutu Sayısı 0 39 1 34 2 20 3 4 4 1 5 2 6 veya daha fazla 0
H 0 : Dağılış n=20 olan Binom dur. H 1 : Dağılış n=20 olan Binom değildir. Dağılışa Uyum Testleri (Binom Dağılışı) p yi bilmediğimiz için öncelikle verilerden p yi tahmin etmemiz gerekir. 100 adet kutu seçilmiş ve her kutuda 20 adet silindir bulunmaktadır.(100*20=2000 silindir kontrol edilmiştir.) Toplam kusurlu sayısı=(0*39)+(1*34)+(2*20)+(3*4)+(4*1)+(5*2)=100 p = 100 2000 = 0.05 bulunur. P X = 0 = 20 0 0.050 0.95 20 = 0.3585 (veya kümülatif Binom tablosundan) (Sadece X=0 için hesaplanmıştır Kutulardaki Kusurlu Gözlenen Kutu Sayısı Beklenen Kutu Sayısı P(x) Sayısı (x) (G i ) (B i = N P(x)) 0 39 0.3585 100*0.3585=35.85 1 34 0.3773 100*0.3773=37.73 2 20 0.1887 100*0.1887=18.87 3 4 0.0596 100*0.0596=5.96 4 1 0.0133 100*0.0133=1.33 5 2 0.0023 100*0.0023=0.23 6 veya daha fazla 0 0.0003 100*0.0003=0.03 TOPLAM N =100
Dağılışa Uyum Testleri (Binom Dağılışı) Beklenen frekansı 5 ten az olan gruplar bir önceki grupla birleştirilir. Kutulardaki Kusurlu Gözlenen Kutu Sayısı Beklenen Kutu Sayısı P(x) Sayısı (x) (G i ) ( 0 39 0.3585 100*0.3585=35.85 1 34 0.3773 100*0.3773=37.73 2 20 0.1887 100*0.1887=18.87 3 4 0.0596 100*0.0596=5.96 4 1 0.0133 100*0.0133=1.33 5 2 0.0023 100*0.0023=0.23 6 veya daha fazla 0 0.0003 100*0.0003=0.03 TOPLAM N=100 Bu işlem yapıldıktan sonra yeni durum; Kutulardaki Kusurlu Sayısı (x) Gözlenen Kutu Sayısı Beklenen Kutu Sayısı 0 39 35.85 1 34 37.73 2 20 18.87 3 veya üzeri 7 7.55 χ 2 = (39 35.85)2 35.85 + (34 37.73)2 37.73 + (20 18.87)2 18.87 + (7 7.55)2 7.55 =0.7533 2 v=4-1-1=2 olur. χ 0.05,2 =5.991bulunur. 2 χ 0.05,2 > χ 2 olduğundan H 0 reddedilemez.
Dağılışa Uyum Testleri (Poisson Dağılışı) Örnek: Bir meşrubat dolum makinesinin günde ortalama 3 defa arızadan dolayı durduğu iddia edilmektedir. Bunu test etmek amacıyla üretim müdürü 120 iş gününü rastgele seçmiş ve bu 120 gündeki arıza duruş sayılarını tablodaki gibi kaydetmiştir. %5 önem seviyesinde arıza duruş sayılarının λ=3 olan Poisson dağılışına uyduğu söylenebilir mi? Duruş Sayısı (x) Gün Sayısı (Gi) 0 3 1 20 2 29 3 22 4 23 5 10 6 ve üzeri 13
Dağılışa Uyum Testleri (Poisson Dağılışı) H 0 : Arıza duruşlarının sayısı λ=3 olan Poisson dağılışına uyar. H 1 : Arıza duruşlarının sayısı λ=3 olan Poisson dağılışına uymaz. λ=3 ve N=120 soruda verilmiştir. Buna göre Poisson dağılışının olasılık fonksiyonu kullanılarak olasılıklar hesaplanır. f x = e λ λ x x! olasılık fonksiyonundan X=0 için f X = 0 = e 3 3 0 olasılıklar N ile çarpılarak beklenen frekanslar bulunur. (B 1 =0.0498*120=5.976) Duruş Sayısı (x) Gün Sayısı (G i ) P(X=x) Beklenen Gün Sayısı (B i ) 0 3 0.0408 0.0498*120=5.976 1 20 0.1494 17.928 2 29 0.2240 26.880 3 22 0.2240 26.880 4 23 0.1680 20.160 5 10 0.1008 12.096 6 ve üzeri 13 0.0840 10.080 0! = 0.0498 elde edilir. Elde edilen bu χ 2 = 4.383 bulunur. 2 2 v=7-1-0=6 dir. χ 0.05,6 = 12.592 bulunur ve χ 0.05,2 > χ 2 olduğundan H 0 reddedilemez.
Dağılışa Uyum Testleri (Normal Dağılış) f 0 Örnek: Bir restaurantta günlük içme suyu tüketiminin dağılışı araştırılmak istenmektedir. 200 günlük bir örnek alınarak günlük içme suyu tüketimi litre cinsinden tabloda verilmiştir. %5 önem seviyesinde restaurantın günlük içme suyu tüketim miktarının normal dağılışa uygun olup olmadığını araştırınız. Su Tüketim Miktarı Gün Sayısı (G i ) 34 den az 0 34-35.5 dan az 13 35.5-37 den az 20 37-38.5 dan az 35 38.5-40 dan az 43 40-41.5 dan az 51 41.5-43 den az 27 43-44.5 dan az 10 44.5-46 dan az 1 46 dan fazla 0
H 0 : Anakütlenin dağılışı Normal dir. H 0 : Anakütlenin dağılışı Normal değildir. Anakütleye ait parametreler verilmediği için örnekten parametreler tahmin edilir. x = 40 lt ve s = 2.5 lt elde edilir. (Hesaplamalar verilmemiştir.) P X < 34 = P z < 34 40 2.5 = P z < 2.4 = 0.5 0.4918 = 0.0082 elde edilir. Su Tüketim f 0 Gün Sayısı Beklenen Gün sayısı Miktarı (G i ) P(X x) (B i ) 34 den az 0 0.0082 200*0.0082=1.64 34-35.5 dan az 13 0.0277 5.54 35.5-37 den az 20 0.0792 15.84 37-38.5 dan az 35 0.1592 31.84 38.5-40 dan az 43 0.2257 45.14 40-41.5 dan az 51 0.2257 45.14 41.5-43 den az 27 0.1592 31.84 43-44.5 dan az 10 0.0792 15.84 44.5-46 dan az 1 0.0277 5.54 46 dan fazla 0 0.0082 1.64 Beklenen frekansı 5 ten az olan gruplar bir önceki veya bir sonraki gruplarla birleştirilmiştir. χ 2 = (13 7.18)2 7.18 + + (1 7.18)2 7.18 = 15.1940 bulunur. 2 v=8-1-2=5 olur ve ve χ 0.05,5 = 11.070 olur. χ 2 2 > χ 0.05,5 olduğundan H 0 reddedilir.