DÖNEM I BİYOİSTATİSTİK, HALK SAĞLIĞI ve RUH SAĞLIĞI DERS KURULU DERS NOTLARI Yrd.Doç.Dr.İsmail YILDIZ 31.01.014 Cuma, Saat:09.30-10.0: Non-parametrik testlere Giriş 31.01.014 Cuma, Saat:10.0-1.30: Mann Whitney U testi ve Wilcoxon testi NON-PARAMETRİK TESTLER GENEL TANIM VE KAVRAMLAR Medikal ve biyolojik değişkenlerin bir çoğunun nicel, bazıların ise nitel özellikte olduğunu belirtmiştik Genelde nicel değişkenlerin verileri Aralıklı ya da Orantılı ölçekle elde edilirken, nitel değişkenlerin verileri İsimsel ya da Sıralı ölçekle elde edilirler. Aralıklı ve Orantılı ölçekli verilerde dağılım varsayımları kurulur, parametreler hesaplanır. İsimsel ve Sıralı ölçekli verilerde parametre tahminleri yapılamaz. Ancak kategorilere göre Oransal tahminler yapılabilir. Nicel değişkenlerin verileri Aralıklar ya da Orantılı ölçekle elde edilir.bu nicel verilerde toplum bilgileri kullanılarak hız, oran gibi değerler hesaplanırken bazı hipotez testleri uygulanır. Bu testlere parametrik testler denir. Toplum parametresinin hesaplanamadığı ya da belirli bir dağılım varsayımı yapılamadığı ölçümlemenin İsimsel, Sıralı ya da Aralıklı bir yöntemle yapılmış olduğu durumlarda uygulanan testlere ise parametrik olmayan testler denir. Nonparametrik testlere geçmeden önce genel olarak testlerin nasıl belirlendiğini gösteren akış şemasını verelim: 1
VERİLERİN ÖZELLİĞİ (ÖLÇÜM BİÇİMİ) ÖLÇÜM(NİCEL) SAYIM(NİTEL) KARŞILAŞTIRILACAK GRUPLARIN ÖZELLİKLERİ KARŞILAŞTIRILACAK GRUPLARIN ÖZELLİKLERİ BAĞIMSIZ BAĞIMLI BAĞIMSIZ BAĞIMLI 1 3 4
1 GRUP SAYISI İKİ ÜÇ+ VARSAYIMLAR VARSAYIMLAR Var Yok Var Yok P(Ölçüm) NP(Sayı) P(Ölçüm) NP(Sayı) Bağımsız t testi (Independent samples t test.two sample t test) Mann.Whitney U testi. (Two Independent samples) Varyans Analizi (Tek faktörlü ise One way, iki faktörlü ise Two way, çok faktörlü ise GLM veya balanced (ANOVA) Kruskal Wallis Testi (Tek fatörlü ise Kruskal Walls veya Mood medyan, iki faktörlü ise Fredman testi) 3
GRUP SAYISI İKİ ÜÇ+ Var VARSAYIMLAR Yok Tekrarlı ölçümlerde Varyans Analizi (İki Yönlü ANOVA) NP(Sayım) Freadman ANOVA) P(Ölçüm) (Parametrik) NP(Sayım) (NonParametrik ) Paired t testi (Paired samples t testi)(*) ya da Z testi veya bir örnek t testi (t sample Z, t sample T) (**) Wilconon eşleştirilmiş iki örnek testi (*) veya İşaret testi (Sign test) (**) * : İki grupta tüm denekler incelendi ise. ** : İki grupta tüm denekler incelenmedi ise. 4
3 ÇAPRAZ TABLO ŞEKLİ R * 1 1 * C * R * * C R * C Ki Kare uygunluk testi (+) veya Kolmogorov Simimov testi (1- Sample K-S. (- Independent samples) Ki Kare bağımsızlık (ilişki) testi (+) veya iki yüzde arasındaki farkın önemlilik testi) (t testi) Ki Kare bağımsızlık veya gruplar arası farkın önemlilik testi(++) + : Beklenen değerler 5 ten büyükse; Pearson Khi Kare, 5-5 arası ise; Yates Khi Kare, 5 ten Küçükse; Fisher Kesin Khi Kare veya Kolmogorov Smimov testi. ++ : 5 ten büyük beklenen değer sayısı toplam göz sayısının %0 sini aşarsa, tablonun sıra veya sütunlarında birleştirmeler yapılır. * : İki gözlemde de tüm denekler incelendi ise. ** : İki gözlemde de tüm denekler incelenmedi ise. 5
4 ÇAPRAZ TABLO ŞEKLİ * R * C Bağımlı gruplarda Khi Kare testi (McNemar testi..related samples) veya bağımlı gruplarda iki yüzde arasındaki farkın önemlilik testi (*) Veya Evren oranı önemlilik testi (**) (++), Kendall W testi, (Ochran Q testi (k- related samples) + : Beklenen değerler 5 ten büyükse; Pearson Khi Kare, 5-5 arası ise; Yates Khi Kare, 5 ten Küçükse; Fisher Kesin Khi Kare veya Kolmogorov Smimov testi. ++ : 5 ten büyük beklenen değer sayısı toplam göz sayısının %0 sini aşarsa, tablonun sıra veya sütunlarında birleştirmeler yapılır. * : İki gözlemde de tüm denekler incelendi ise. ** : İki gözlemde de tüm denekler incelenmedi ise. Parametrik olmayan testler aşağıdaki durumlarda uygulanır: 6
Veriler isimsel ya da sıralı ölçekle elde edilmiş ise, Aralıklı ya da orantılı ölçekli veriler katekorize edilerek, gruplayarak isimsel ya da sıralı biçime indirgenmiş ise, Ölçülen değerler skor değerler ya da yaklaşık aralıklı diye tanımlanabilecek bir ölçme aracı (Liker, Thurstone, Goodman, vb. ölçekli araçlar) ile elde edilmiş iseler, Verilerin doğrudan ölçme, sayma yolu ile değil de belirli kriterler kullanılarak hesapla (çarpma, bölme, katlarını alma vb.) elde edilmiş ise, Parametrik değerden çok dağılım varsayımları test edilmek isteniyor ise,bu dağılımları bilinen dağılımlar yerine herhangi bir dağılım olarak tanımlamak uygun görülüyorsa, Araştırıcı, belli bir dağılım varsayımını, parametreyi kabul etmek zorunluluğunda kalmaksızın serbest ve arzu edilen kalıplar içinde yeni ve parametrik sınırlarda bir yere oturtulamayan hipotezlerini test etmek istiyorsa, Veri setinde gözlem sayıları çok az ise, gözlemlerin değişim aralığı çok fazla ve türdeş olmayan bir yapı oluşturuyor ise, Verilerin analizinde belirli bir parametrik değer göz önüne alınmaksızın kurulan H 0 ve H 1 hipotezlerini test etmek için, parametrik olmayan testlerden yararlanılır. Çok sayıda parametrik olmayan test bulunmaktadır. Bu testlerin bazıları parametrik olmayan alternatifleridir. Nonparametrik testlerden en sık kullanılanları aşağıdaki şekilde sıralanır. 7
1- Kikare testi - McNemar testi 3- Kolmogorov-Smirnov (K-S) testi 4- Mann -Whitney U testi 5- Wilcoxon T testi 6- İşaret (SING) testi 7- Diziler testi ( Runs) 8- Kruskal-Wallis ( K-W ) testi 9- Mood Medyan testi 10- Friedman iki yölü varyans analizi testi 11- Kendal W testi 1- Cochran Q testi NON PARAMETRİK TESTLERİ ÖZETLERSEK; 1- Khi Kare uygunluk testi = 1XR veya CX1 - Khi Kare Bağımsızlık = X veya RXC 3- İkili Bağımlı olan testler grubu( li, Bağımlı) a-mc-namer Testi (X) b-wilcoxon c-işaret (Ortanca) 4-Üçlü bağımlı olan testler grubu (3 lü, Bağımlı) a-fredman b-kendal W (Aynı popülasyondan) c-cochran (0 ve 1) 5-RUN testi = Dizi olacak, Mean, Mod veya Medyan dikkate alınacak. 6-Üçlü Bağımsız Testler Grubu (3 lü Bağımsız) 8
a-kruskall Wallis (>5) b-mood Medyan (<5) 7- İkili Bağımsız olan testler grubu( li, Bağımsız) a-mann Whitney U (>5 li değerler) b-kolmogrow Smirrov (<5 li değerler) i-iki() örnek Kolmogrow Smirov ii-tek(1)örnek Kolmogrow Smiro 8-Aynı kategroride gözüken farklı testler a-khi Kare uygunluk (1XR veya 1XC ise) b-kolmogrow smirrov (<5 ise) c-run (Dizi özelliği varsa) Analizlerdeki test değerleri= T, F, r, Khi Kare, Testin Adı, Testin değeri veya Z şeklinde verilir. Testleri Aşağıdaki gibi Yorumlamalıyız: Olasılık Hipotez Sonuç P>0.05 ns olup H 0 Kabul, H 1 Red Önemsiz P<0.05 * olup H 0 Red, H 1 Kabul Önemli P<0.01 ** olup H 0 Red, H 1 Kabul Çok Önemli P<0.001 *** olup H 0 Red, H 1 Kabul İleri Düzeyde Önemli 9
MANN- WHITNEY U TESTİ n 1 ve n hacimli bağımsız iki örneğin aynı medyanlı populasyondan alınmış rasgele örnekler olup olmadığını test etmek için Mann-Whitney U testi uygulanır. Bağımsız iki örneklem t testinin parametrik olmayan alternatifidir. Mann-Whitney U testinde test edilen hipotezler aşağıdaki gibidir. H 0 : n 1 ve n veri setleri aynı medyanlı dağılıma sahiptir. H 1 : Örnekler farklı medyanlı dağılımların örnekleridir. H 1 : n 1 veri setinin gözlemlerinin yarısından fazlası diğer setten farklıdır. U testi uygulamak için n 1 ve n hacimli iki örnek bir tek dizi (genel dizi) haline getirilir ve dizideki gözlemlerin sıralama puanları bulunur. Küçükten büyüğe doğru her gözlemin genel dizide kaçıncı sırada yer aldığı belirlenir. Sıralı Dizi yeniden ele alınır ve her verinin hangi örneğe ait olduğu dikkate alınarak sıralama puanları örneklere göre toplanır. 1. örneğe ait gözlemlerin sıralama puanları toplamı R 1,. örneğe ait olanları toplamı R bulunur. Birim sayıları ve toplam sıralama puanlarından yararlanarak U 1 ve U test istatistikleri hesaplanır. U 1 ve U test istatistikleri aşağıdaki gibi hesaplanır. U n ( n 1) n ( n 1) 1 1 1 n1 * n R1 U n1 * n R U 1 ve U den küçük olanı U test istatistiği olarak alınır. 10
Eğer U 1 U ise U=U 1, U 1 >U ise U=U alınır. n 1 >0 ve n >0 ise U nun önemliliği normal yaklaşımla bulunur. Bunun için U nun ortalama ve standart sapması istatistiği aşağıdaki gibi hesaplanır. bulunur ve z test U ( n1)(n )/ U ( n1)(n )(n1 n 1 1) U U z U U ( n )( n ( n )( n 1 1 ) / )( n1 n 1 1) Z test istatistiği N(0,1) parametreli standart normal dağılım gösterir ve önemliliği aşağıdaki gibi belirlenir. Z < 1.96 ise P >0.05ns H 0 Kabul Z 1.96 ise P <0.05 * H 0 Red Z.58 ise P <0.01 ** H 0 Red Z 3.8 ise P <0.001 *** H 0 Red Örnek: Rasgele seçilen 0 X hastası iki gruba ayrılmıştır. Gruptaki 1 hasta A yöntemi ile. Gruptaki 8 hasta da B yöntemi ile tedavi edilmişlerdir. Bu hastalara iyileşme durumlarına göre verilen puanlar aşağıdaki tabloda verilmiştir. A ve B yöntemi arasında fark var mıdır? Test ederek tartışınız. 11
Tablo: Hastaların A ve B yöntemleri ile tadavisi sonucu elde edilen puanlar Tablo: Hastalara A ve B tedavi yöntemi uygulandıktan sonra elde edilen puanlar n (n 1) 1(1 1) n * n 1 1 n (n 1) 1 R 1 8 100 74U n * n 1 R 1 U1 1 (1)(8)/ z (1)(8)(1 8 1) 1 U=, Z=-.01, P<0.05*. A ve B tedavi yöntemleri arasında fark vardır..01 1
WILCOXON T TESTİ Wilcoxon testi, bağımlı iki örnek testidir. Eleştirilmiş ( paired ) t testinin parametrik olmayan alternatifidir. n birimlik örnekten elde edilen iki gözlem seti farkının ortancası sıfır(sıfır medyanlı) olan toplumdan çekilmiş rasgele örnek olup olmadığını test eder (H 0 : OD=0, H 1 :OD 0). Wilcoxon T testinin uygulama aşamaları aşağıdaki gibidir. 1. Wilcoxon T testinde Hipotezler aşağıdaki gibi kurulur H 0 : Eş deneme sonuçları eşittir. Deneme sonuçları arasındaki pozitif ve negatif farklar toplamı birbirine eşittir. H 1 : Eş deneme sonuçları birbirine eşit değildir. Negatif farkların toplamı pozitif farkların toplamına göre çok küçüktür ya da büyüktür.. Sıralama ya da aralıklı ölçekle elde edilmiş eş deneme sonuçları arasındaki farklar cebirsel olarak belirlenir. Bu farklar işaretlerine bakılmaksızın önce büyüklük sırasına konur ve farkların sıralama puanları bulunur. Sıralama puanlarına ait oldukları farkların işaretleri verilir. Sıralama puanları işaretlerine göre ayrı ayrı toplanır. + puanların toplamı T(+) ve sıralama puanlarının toplamı T(-) ayrı ayrı bulunur. NOT: Eğer eşler arası fark sıfır ise o eş denemeden çıkarılır, sadece farkları sıfırdan farklı olan çiftler analize alınır. 3. + ve - değerli sıralama puanları toplamlarından mutlak değeri küçük olan toplama T istatistiği denir. Eğer T(+) > T(-) ise T= T(-) değilse T=T(+) Farkların sıralaması yapılırken, farklardan birbirine eşit olanlarına sıralama değerlerinin ortalaması verilir. 13
4. T istatistiğinin gözlenme olasılığı ve önemliliği belirlenir. T nin gözlenme olasılığı birim sayısına bağlı olarak iki şekilde belirlenir. Eğer birim sayısı 6 n 5 ise Wilcoxon T kritik değerleri tablosundan yararlanılır. Bu tablodaki T kritik değerleri dikkate alınarak T nin önemliliği aşağıdaki koşullara göre belirlenir. T > T ise P > H 0 kabul T < T ise P < H 0 red Eğer n>5 ise T nin T N( T ; T ) parametreli Normal dağılım gösterdiği varsayımından yararlanılarak T nin gözlenme olasılığı ve önemliliği; T nin ortalama ve standart hatası; T ( n)( n 1) 4 şeklinde hesaplanarak T ( n)( n 1)(n 1) 4 T T Z T test istatistiği hesaplanır. Z nin önemliliği Z testinde olduğu gibi belirlenir. Örnek: 7 bireyden oluşan bir grubun öntest ve sontest sonucu elde edilen P puanları Tabloda verilmiştir. Öntest ve Sontest puanları arasındaki fark önemli midir? Test ederek tartışınız. Öntest ve Sontest puanları arasındaki farklar alınır (d i ) farklar işaret gözetmeksizin küçükten büyüğe doğru sıralanır (r i ) sıralama puanları işaretlerine göre tekrar yazılır. Sonuçlar Tablo daki gibidir. Tablo- Yedi bireyin öntest ve sontest P puanları 14
Örnekte negatif sıralama puanları toplamı T(-)=-0, pozitif sıralama puanları toplamı T(+)=7 olarak bulunur. Pozitif sıralama puanları toplamı, negatif sıralama puanları toplamından mutlak değer olarak küçük olduğu için T istatistiği T=T(+)=7 olarak alınır. Normal varsayıma göre test istatistiği, (7)(7 1) (7)(7 1)( * 7 1) T 14 T 5. 916 4 4 T Z T T 7 14 1.18 5.916 T=7, Z=-1.18, P>0.05 ns.. Örneğe alınan 7 bireyin öntest ve sontest P puanları arasında fark yoktur. 15
ÖRNEKLER 1- Wilcoxon T Testi Wilcoxon testi, bağımlı iki örnek testidir. Eleştirilmiş ( paired ) t testinin parametrik olmayan alternatifidir. n birimlik örnekten elde edilen iki gözlem seti farkının ortancası sıfır olan toplumdan çekilmiş rasgele örnek olup olmadığını test eder. Örnek: Sekiz bireyden oluşan bir grubun ön test ve son test sonucu elde edilen K puanları aşağıdaki şekilde verilmiştir. Ön test ve son test puanları Birim no Öntest Sontest Fark Sıralama İşaretli sıralama 1 53 48 5 47 37 10 6 6 3 38 51-13 7-7 4 48 48 0 - - 5 51 53-1 -1 6 67 74-7 3,5-3,5 7 74 67 7 3,5 3,5 8 48 57-9 5-5 arasındaki fark önemli midir? Çözüm: 1- Öntest ve sontest adlı iki değişken oluşturulur ve altına değerleri girilir. - Analiz> Nonparametric Tests>-Related Samples seçeneği tıklanır. 16
3- Gelen pencerede test (pairs) List alanına iki değişken taşınır. 4- Test type seçenekleri içinden Wilcoxon test tipi işaretlenir ve OK tıklanır. 17
5- Testin sonucunda P=0,67>0,05 bulunur. 6- Çıkan test sonucunda eş gözlem arasında önemli düzeyde farklılık yoktur. Bireylerin öntest ve sontest puanları arsında önemli farklılık bulunmamıştır. - Mann Whitney U Testi n 1 ve n hacimli bağımsız iki örneğin aynı medyanlı populasyondan alınmış rasgele örnekler olup olmadığını test etmek için Mann-Whitney U testi uygulanır. Bağımsız iki örneklem t testinin parametrik olmayan alternatifidir. Örnek: açık kalp ameliyatı olmak üzere hazırlanmış 8 erkek ve 8 kadın hasta rasgele seçilmiş ve bu hastalara psikolojik yönden rahatlatıcı A ilacı uygulanmıştır. Bu hastaların ameliyata alınırken psikolojik durumları bir testle saptanarak psikolojik durumları puanlandırılmıştır.bulgular aşağıdaki şekilde verilmiştir. 18
A ilacı ameliyat öncesi hastaların psikolojik durumlarını iyileştirme açısından kadın erkek farklılığına neden olan bir etkiye sahip midir? E K K K K E E E E K E K K E K E 1 3 5 34 37 43 44 45 49 65 70 74 80 83 86 9 1 3 4 5 6 7 8 9 10 11 1 13 14 15 16 Çözüm: 1- Erkek ve kadın hastaların psikolojik puanları sırasıyla ek sütununa bu değerlerin grup kodları grup sütununa girilir. - Analiz >Nonparametric Tests > independent Samples seçeneği işaretlenir. 19
1- Gelen pencerede Test Variable List alanına ek değişkeni, Grouping Variable alanına grup değişkeni taşınır. - Test Type seçeneğinden Mann- Whitney U seçeneği işaretlenir. 0
3- Define Groups seçeneğinden örnek kodlarının maksimum ve minimum değerleri belirlenir. 4- Continue ve OK tıklanır. 7-Mann-Whitney U testine bakılır. 8- Bu çıktıya göre P=0,674>0,05 elde edilir. Buna göre kadın ve erkek hastaların psikolojik durumlarını iyileştirme açısından A ilacı kadın ve erkek farklılığına neden olan önemli bir etkiye sahip değildir. 1
KAYNAKLAR [1] ÖZDAMAR, K., Paket Programlar ile İstatistiksel Veri Analizi I-II, Kaan Kitabevi, ESKİŞEHİR, 1999. [] ÖZDAMAR, K., SPSS ile Biyoistatistik, Kaan Kitabevi, ESKİŞEHİR, 1999. [3] HAYRAN, M., ÖZDEMİR, O., Bilgisayar İstatistik ve Tıp, HYB, MEDAR, ANKARA, 1996. [4] SPSS Base 7.5 Applications Guide, http://www.spss.com.tr/ [5] CHARLES R.H., Deney Düzenlemede İstatistiksel Yöntemler. [6] SÜMBÜLOĞLU, K., SÜMBÜLOĞLU, V., Biyoistatistik [7] KAN, İ., Biyoistatistik [8] ÖZDAMAR, K., Biyoistatistik. [9] SPSS, SPSS Base 7.5 Applications Guide [10] SPSS, SPSS Interactive Graphics 10.0 [11] BÜYÜKÖZTÜRK, Ş., Veri Analizi El Kitabı, Pegema Yayıncılık, ANKARA, 00. [1] ÇELİK, Y. Biyoistatistik; Araştırma İlkeleri, Yeni bir yaklaşım, Dicle Üniversitesi Yayınları.