Parametrik Olmayan İstatistiksel Yöntemler IST-435-5- DEÜ İstatistik Bölümü 8 Güz Non-Parametric Statistics Nominal Ordinal Interval One Sample Tests Binomial test Run test Kolmogrov-Smirnov test X test Sign test Wilcoxon Rank test Related Mc Nemar test Sign test Walsh Test Wilcoxon Signed Rank test Randomization test Two Sample Tests Unrelated Fisher Exact Probability test X test Median test Mann-Whitney U test Kolmogrov-Smirnov test Ansari-Bradley Mood Testi test Moses test Related Cochran Q test Friedman F test Page test k - Samples Tests Unrelated X test Kruskal-Wallis test Median test Jonckheere-Terpstra test
İki Dağılım Parametresinin Eşitliği akkında Yapılan Çıkarsamalar Bazı durumlarda dağılım (yayılım) ölçüsü olan iki parametrenin eşitliğinin bilinmesine ihtiyaç duyulur. İki ortalama farkına ilişkin test yaparken kitle varyansları bilinmiyor ise, bu bilgiye özellikle küçük örneklem genişliklerinde ihtiyaç vardır (t dağılımının serbestlik derecesinin belirlenmesi için). İki kitlenin dağılım parametrelerinin eşitliğinin testi için bilinen parametrik yöntem Ftestidir. Ancak hipotezi için F-testi yapabilmek kitle dağılımlarının normal olmasını gerektirir. 3 İki Dağılım Parametresinin Eşitliği akkında Yapılan Çıkarsamalar Kitle dağılımlarının normal olmadığı durumda parametrik olmayan istatistiksel yöntemlerden Ansari Bradley testi, Mood Testi ve Moses testi kullanılabilir. Bu testlerin temel özellikleri örneklemlerin çekildikleri kitlelerin dağılımlarına bağlı olmamalarıdır. 4
3 5 Moses Testi (Moses, 963)/Varsayımlar Veriler iki bağımsız rassal örneklemden oluşur. Birinci örneklem birinci kitleden seçilmiş X,X,,X n değerlerinden ve ikinci örneklem ikinci kitleden seçilmiş Y,Y,,Y n değerlerinden oluşur. Veri ölçeği en az aralıklıdır. Kitle dağılımları süreklidir ve aynı şekle sahiptir. İki örneklem birbirinden bağımsızdır. 6 Moses Testi/ipotezler A B C
Moses Testi/Test İstatistiği Kısaca test istatistiği şu şekilde elde edilir. ) X örneklemini rasgele eşit genişlikli alt örneklemlere ayır. ) Y örneklemini rasgele eşit genişlikli alt örneklemlere ayır. 3) er alt grup için gözlemlerin grup aritmetik ortalamasından farklarının kareler toplamları bulunur. 4) Elde edilen bu sonuçlar Mann-Whitney testinde kullanılır. 7 Moses Testi/Test İstatistiği Test istatistiğini daha detaylı bir şekilde de açıklayabiliriz. ) X gözlemleri k birim genişlikte m tane alt örnekleme rassal olarak ayrılır (geriye kalan gözlemler göz ardı edilir). ) Y gözlemleri k birim genişlikte m tane alt örnekleme rassal olarak ayrılır (geriye kalan gözlemler göz ardı edilir). k nın değerinin olabildiğince büyük olması istenir (ancak dan büyük olmamalı) m ve m nin konum testinin uygulanabilir olmasını sağlayacak şekilde anlamlı sonuçlar verebilecek büyüklükte olması gerekir. 8 4
Moses Testi/Test İstatistiği 3) er bir alt örneklem için gözlemlerin grup ortalamasından farklarının karelerinin toplamı elde edilir. X in m tane alt grubuna ait kareler toplamı C,C,,C m Y nin m tane alt grubuna ait kareler toplamı D,D,,D m 4) Mann-Whitney testindeki X ve Y lerin yerine C ve D ler, n ve n yerine de m ve m kullanılır. 9 Moses Testi/Test İstatistiği m T S m ( S=R i (R i X gözlemlerine ait (.örneklem) rank) ) 5
Moses Testi/Karar Kuralı A B C A tablodan bakılan w α/ değeri ile test istatistiği karşılaştırılır (w -α/ =m m w α/ ). T<w α/ veya T > w -α/ ise reddedilir. B T nin yeterince büyük değerleri içi reddedilir. T>w -α ise reddedilir (w -α =m m w α ). C T nin yeterince küçük değerleri içi reddedilir. T<w α ise reddedilir. Moses Testi/Örnek Kamu çalışanlarının aylık sosyal amaçlı harcamalarına ilişkin dağılım parametresinin özel sektörde çalışanların aylık sosyal amaçlı harcamalarına ilişkin dağılım parametresinden farklı olduğu öne sürülmüştür. Kamudan ve özel sektörden 6 çalışan rassal olarak seçilerek aylık sosyal amaçlı harcamaları (TL) aşağıdaki gibi saptanmıştır. %5 önem düzeyinde iddiayı araştırınız. 6
Moses Testi/Örnek n =, n =6, n*=48 k=5 alınırsa m =4, m =5 olur, X i lerde, Y i lerde örneklem birimi işlem dışı kalır. Rassal alt örneklemleri oluşturulur. 3 Moses Testi/Örnek Rassal alt örneklemleri oluşturalım (X i lerde ve 9 işlem dışı) (Y i lerde 9 işlem dışı) 4 7
Moses Testi/Örnek m =4, m =5, α=.5, Mann-Whitney tablosundan w α/ =, w -α/ =m *m -w α/ = 4*5-=8 S m ( m ) 4*5 T S (T < w α/ veya T > w -α/ ise reddedilir.) < T<w α/ olduğundan red! 5 Örnek A ve B dershanelerine giden öğrencilerin YLS sınavından aldıkları puanların medyanların birbirinden farklı olduğu iddia edilmektedir. A dershanesinden, B den 5 öğrenci rassal olarak seçilmiş ve LYS sınavından almış oldukları puanlar aşağıdaki tabloda verilmiştir. 6 8
Örnek ) İddiayı %5 önem düzeyinde medyan testi ile araştırınız. ) %5 önem düzeyinde A dershanesine gidenlerin B dershanesine gidenlerden daha başarılı olduğu iddiasını Mann-Whitney testi ile araştırınız. 3) Yukarıdaki verileri kullanarak A ve B dershanesine giden öğrencilerin LYS sınavından aldıkları puanların dağılım parametrelerinin farklı olup olmadığını Moses testi ile araştırınız (=.5). 7 Mood Testi / Varsayımlar İki kitleye ait dağılım parametrelerinin eşitliği için yapılabilecek testlerden biri Mood testidir (Mood,954). Varsayımlar n n olmak üzere veriler X,X,,X n ve Y,Y,,Y n değerlerinden oluşur. Ölçme en az sıralı ölçektedir. İlgili değişken süreklidir. Kitlelerin medyanları aynıdır. 8 9
9 Mood Testi / ipotezler A B C Mood Testi/Test İstatistiği Kısaca test istatistiği şu şekilde elde edilir. ) n +n =n olacak şekilde birleştirilmiş örneklem oluşturulur. ) Bu örneklemdeki değerler ranklanır. (aynı değerler önce ranklanır sonra rank ortalaması verilir.) 3) X gözlemlerine ait (.örneklem) rank değerleri (r i ) kullanılarak M istatistiği aşağıdaki gibi hesaplanır. Mood M test istatistiği; n i i n r M
Mood Testi/Karar Kuralı A B C A tablodan bakılan M α/ değeri ile test istatistiği karşılaştırılır. M M α/ veya M > M -α/ ise reddedilir. B M nin yeterince büyük değerleri içi reddedilir. M>M -α ise reddedilir. C M nin yeterince küçük değerleri içi reddedilir. M M α ise reddedilir. Mood Testi/Örnek Özel sektörde çalışanların aylık sosyal amaçlı harcamalarına ilişkin dağılım parametresinin kamu çalışanlarının aylık sosyal amaçlı harcamalarına ilişkin dağılım parametresinden büyük olduğu öne sürülmüştür. Kamudan 8 ve özel sektörden 7 çalışan rassal olarak seçilerek aylık sosyal amaçlı harcamaları (TL) aşağıdaki gibi saptanmıştır. %5 önem düzeyinde iddiayı araştırınız. Özel 5 35 5 8 55 4 Kamu 4 6 8 3 3 3 45
Mood Testi/Örnek n+n=n=5 Özel 5 35 5 8 55 4 r(xi) 3 4 5 4 Kamu 4 6 8 3 3 3 45 r(yi) 9 5 6 8 3 7 M n i n ri 3 Mood Testi/Örnek (n+)/=(5+)/=8 Özel 5 35 5 8 55 4 r(xi) 3 4 5 4 r(xi)-8-5 4 6 7-7 -4-6 (r(xi)-8) 5 6 36 49 49 6 36 M n i ri n 5 6 36 49 49 6 36 7 4
Mood Testi/Örnek n=7, n=8 ve -α=.95 için tablo değeri bulunur; Tablodan P(M 84)=.9455 olduğundan tablo değeri M =84 alınır. M hesap >M tablo olduğundan o reddedilir. Özel sektörde çalışanların aylık sosyal amaçlı harcamalarına ilişkin dağılım parametresinin kamu çalışanlarının aylık sosyal amaçlı harcamalarına ilişkin dağılım parametresinden büyük olduğu söylenebilir. 5 Mood Testi/Örnek P-değeri P(M 7) tablodan yaklaşık olarak bulunabilir. n=7, n=8 için P(M )=.995P(M>)=-.995=.48 P-değeri P(M 7)<.48 olarak tahmin edilebilir. 6 3
Mood Testi/Örnek Matematik bölümü öğrencilerinin istatistik notlarına ait dağılış parametresinin Fizik bölümü öğrencilerinin istatistik notlarına ait dağılış parametresinden küçük olduğu iddia edilmektedir. er iki bölümden de rasgele seçilen öğrencilerin notları aşağıda verilmiştir. %5 önem düzeyinde iddiayı araştırınız. Matematik 6 4 45 5 Fizik 8 3 6 9 7 Mood Testi/Örnek n+n=n=9 Matematik 6 4 45 5 r(xi) 6 3 4 5 Fizik 8 3 6 9 r(yi) 8 7 9 M n i n ri 8 4
Mood Testi/Örnek (n+)/=(9+)/=5 Matematik 6 4 45 5 r(xi) 6 3 4 5 r(xi)-5 - - (r(xi)-5) 4 M n i ri n 4 6 9 Mood Testi/Örnek n=4, n=5 ve α=.5 için tablo değeri bulunur; Tablodan P(M )=.397 olduğundan tablo değeri M= alınır. M hesap <M tablo olduğundan o reddedilir. Matematik bölümü öğrencilerinin istatistik notlarına ait dağılış parametresinin Fizik bölümü öğrencilerinin istatistik notlarına ait dağılış parametresinden küçük olduğu söylenebilir. P-değeri? 3 5
Mood Testi/Örnek 3 Yeni bir yöntem ile tedavi edilen hastaların iyileşme sürelerine ilişkin dağılım parametresinin klasik yöntem ile tedavi edilen hastaların iyileşme sürelerine ilişkin dağılım parametresinden farklı olduğu öne sürülmektedir. Rassal olarak seçilen ve yeni yöntem (X) ve klasik yöntem (Y) ile tedavi edilen hastaların iyileşme süreleri aşağıda verilmiştir. %5 önem düzeyinde iddiayı araştırınız. Yeni Yöntem(X) 4 3 36 7 37 Klasik Yöntem(Y) 34 6 8 3 5 33 3 Mood Testi/Örnek 3 n+n=n=3 M n i ri n 85 n=6, n=7 ve α/=.5 için tablo değeri bulunur; Tablodan P(M 38)=.4 olduğundan alt tablo değeri M α/ =38 alınır. Ayrıca tablodan P(M 9)=.9749 olduğundan üst tablo değeri M -α/ =9 alınır. 39<85<9 olduğundan o reddedilemez. P-değeri? 3 6
Mood Testi Büyük Örneklem Yaklaşımı n veya n dan büyük ise tablo kullanılamaz. Bu durumda M istatistiğinin örnekleme dağılımının normal dağılıma yaklaşımından yararlanılır. Büyük örneklemler için M istatistiğinin beklenen değeri ve varyansı n E( M ) n n n n n 4 V ( M ) Birleştirilmiş örneklem hacmi n>3 ise 8 z n 3 fakat tabloyu kullanmak mümkün değilse z n n M nn 8 n n M nn 8 n n 4 n n n n 4 8 n n 4 ~ N(,) ~ N(,) Not Aynı değerli gözlemlere ortalama sıra sayısı verilir. Ancak n küçük iken aynı değerli gözlemler M değerini oldukça fazla etkiler. Aynı değerli gözlemler az sayıda iken n ve n büyük ise aynı değerli gözlemler işleme dahil edilmeyebilir. 33 7