GRUPLARARASI VE GRUPİÇİ KARŞILAŞTIRMA YÖNTEMLERİ Uzm. Derya ÖZTUNA Yrd. Doç. Dr. Atilla Halil ELHAN 1. ÖNEMLİLİK (HİPOTEZ) TESTLERİ Önemlilik testleri, araştırma sonucunda elde edilen değerlerin ya da varılan sonuçların istatistiksel olarak önem taşıyıp taşımadığını bir diğer deyişle anlamlı olup olmadığını test etmek için başvurulan yöntemlerdir. Hipotez testlerinin amacı; araştırmacılara evrenden çekilen örneklem(ler) yardımıyla evren hakkında bir karara varma konusunda yardımcı olmaktır. Önemlilik testlerinden elde edilen sonuçlara göre bazı kararlara varıldığı için önemlilik testlerinin doğru ve uygun olarak seçilmesi çok önemlidir. 1.1. Önemlilik Testleri Hakkında Genel Bilgiler 1.1.1.Hipotezler Önemlilik testleri hipotezleri test etmek için yapılır. Bu yüzden bazen önemlilik testi yerine hipotez testi de denmektedir. İstatistiksel hipotezler örneklemlerin çekildiği evren parametreleri ile ilgili önermelerdir. İstatistikte kullanılan iki tür hipotez vardır. H 0 H 1 Farksızlık hipotezi, Sıfır hipotezi, Yokluk hipotezi Alternatif hipotez, Seçenek hipotez Test sonucunda H 0 kabul edilirse H 1 ret edilir. H 0 ret edilirse H 1 kabul edilir. Hipotezler tek yönlü (one-sided) ya da çift yönlü (two-sided) olarak kurulabilir. Tek yönlü hipoteze örnek; H 0 : µ =20 ya da H 0 : µ =20 H 1 : µ <20 H 1 : µ >20 İki yönlü hipoteze örnek; H 0 : µ =20 H 1 : µ 20 Örneğin; H 0 = İki grubun ortalaması arasında fark yoktur.
Yaş ve boy değişkenleri ilişkisizdir. A ilacı ile B ilacının iyileştirme yüzdeleri arasında fark yoktur. H 1 =İki grubun ortalaması farklıdır. Yaş ve boy değişkenleri ilişkilidir. A ilacı ile B ilacının iyileştirme yüzdeleri arasında fark vardır. 1.1.2. Yanılma Düzeyi/Önemlilik Seviyesi (α ) Tablo1: Araştırma ve Evren Sonuçlarına İlişkin Çapraz Tablo GERÇEK (Evren) ARAŞTIRMA SONUÇLARI Tedaviler Tedaviler farklı (Örneklem) farklıdır değildir Tedaviler farklıdır Doğru (1-β ) Tip I Hata (α) Tedaviler farklı değildir Tip II Hata (β ) Doğru Yanılma düzeyi / Önemlilik seviyesi, doğru sıfır hipotezinin reddedilmesi (Tip I hata) olup buna α denir ve genellikle 0.05 olarak alınır. Gerçekte bir fark olduğu halde yapılan araştırma sonucunda bir fark bulunmamasından kaynaklanan Tip II hatanın oluşma ihtimalini belirten değere de beta seviyesi denir. Tip II hata yapma olasılığı genellikle 0.20 olarak alınır. Yani araştırma sonucunda gerçekte olan bir farkı atlama şansı 1/5 oranındadır. 1-Beta= Testin Gücünü ifade eder. 1.1.3. P Değeri P, gruplar arasında fark vardır, ya da ilişki vardır derken yapılan hata miktarı, Ho hipotezi doğru iken onu yanlışlıkla reddetme olasılığı, evrende olmayan ve örneklemde gözlenen ilişki ya da farklılığın tamamen şans eseri olarak ortaya çıkma olasılığı olarak tanımlanabilir. Örneğin; 30 kişilik bir çalışmada kilo ile kolesterol düzeyi arasındaki ilişki r=0.70 ve p=0.02 olarak bulunsun. Aslında kitlede (yani gerçekte) r=0 iken r nin şans eseri olarak 0.70 çıkma olasılığı 0.02 dir. Burada iki olasılık mümkündür. 1- Gerçekten şans eseri olarak r=0.70 olarak bulunmuştur. 2- H 0 hipotezi doğru değildir. Gerçekte ilişki anlamlıdır. P değeri istatistiksel testin uygulanmasından sonra elde edilir. Paket programların tümü sonuç aşamasında elde edilen test istatistiklerine ilişkin p değerini direkt olarak verir. p>0.05 p<0.05 p<0.01 Gruplar arasında fark yoktur. Gruplar arasında fark vardır.
p<0.001 1.2. Önemlilik Testlerinin Seçiminde Kullanılan Kriterler Önemlilik testleri en genel anlamda ikiye ayrılır: 1- ler 2- Parametrik olmayan testler lerde ham veriler üzerinden ortalama, varyans gibi ölçütler elde edilerek işlemler yapılır. Parametrik olmayan testlerde ise ham veriler sıralanır ve sıra numaraları verilir. İşlemler bu sıra numaraları üzerinden yapılır. ler, parametrik olmayan testlere göre daha güçlü testlerdir. Fakat kullanılabilmeleri için bazı n sağlanması gerekir. Uygun test seçimi aşağıdaki durumlara bağlıdır: 1- Verilerin ölçüm biçimi Verilerin ölçüm biçimi kullanılacak testin seçimini etkileyen en önemli faktörlerden biridir. Sunumumuzda testlerin sınıflaması sayımla (nitel) ve ölçümle (nicel) belirtilen değişkenler için ayrı ayrı yapılmıştır. düzeyi Tablo 2: Değişken Türleri Nitel veriler Sınıflanabilir nitel veri (Nominal) Kan grupları 1: 0 grubu 2: A grubu 3: B grubu 4: AB grubu Nicel veriler Sürekli nicel veri (Metric Continuous) Kan basıncı, boy, kilo, yaş, hemoglobin sayısı, Sıralanabilir nitel veri (Ordinal) Eğitim Durumu 1: Okur-yazar değil 2: İlköğretim 3: Lise 4: Üniversite 5: Yüksek lisans/doktora Kesikli nicel veri (Metric Discrete) Çocuk sayısı, geçirilen operasyon Haftada geçirilen astım krizi sayısı 2- İncelenen grupların bağımlı ya da bağımsız olması İncelenen grupların bağımsız olması grupların ayrı bireylerden oluşması bir diğer deyişle bir grupta bulunan bir deneğin diğer grupta bulunmaması demektir. Örneğin kadın ve erkeklerde açlık kan şekeri düzeylerini karşılaştırırken gruplar bağımsızdır. Bir denek üzerinde birden çok gözlem yapıldığında gruplar bağımlı olur. Örneğin; kadınlarda açlık kan şekeri ve tokluk kan şekeri düzeyleri karşılaştırılırken gruplar bağımlıdır. lık için bir başka örnek şöyledir. İki doktorun teşhis tutarlılığını ölçmek için aynı hastaların her iki doktor tarafından muayene edilmesi durumunda gruplar bağımlı olur.
3-Verilerin Dağılımı - Normal Dağılım İstatistiksel analiz yapılırken dağılımın özelliği çok önemlidir. Çünkü parametrik testlerin uygulanabilmesi için dağılımın normal ya da normale yakın olması gerekir. Genellikle ölçümle elde edilen sürekli veriler normal dağılıma uyma eğilimi gösterirler. Ancak ölçüm biçimi sıralanabilir nitel olan bir değişkenin kategori sayısı altıdan büyükse ve denek sayısı yeterliyse normal dağılıma uyma ihtimali büyüktür. Normal Dağılım 25 20 Frekans 15 10 5 0 6,1-8,0 8,1-10,0 10,1-12,0 12,1-14,0 14,1-16,0 Hemoglobin Düzeyi Grafik 1: Hemoglobin Düzeylerinin Frekans Dağılımı Hemoglobin düzeyi ölçümlerine ait yukarıdaki histogram incelendiğinde, ölçümlerin büyük bir bölümünün ortalama etrafında yoğunlaştığı ve ortalamadan uzaklaştıkça frekans sayılarının azaldığı görülür. Sürekli nicel veri tipinde olan değişkenlerin çoğu (özellikle denek sayısı arttıkça) bu tür bir dağılım gösterme eğilimindedir. Şekil olarak çan a benzeyen ve simetrik bir yapıya sahip olan bu tür dağılıma normal dağılım denir. 4- Örneklem büyüklüğü Gruplardaki denek sayısı arttıkça kullanılan testin gücü ve güvenilirliği artar. Gruplardaki denek sayısı fazla ise verilerin normal dağılıma uyma ihtimali artar dolayısıyla kullanma şansı artmış olur. Gruplardaki denek sayısı az olduğunda ise (30 un altında) genellikle parametrik olmayan testler tercih edilir.
VERİ ÖLÇÜMLE(NİCEL) ELDE EDİLDİĞİNDE VE GRUPLAR BAĞIMSIZ OLDUĞUNDA; Veri tipi: Ölçüm Grupların bağımlılık durumu: Karşılaştırılacak grup sayısı: İki Karşılaştırılacak grup sayısı: Üç ya da daha fazla sağlanmadığında sağlandığında sağlanmadığında sağlandığında Mann Whitney U testi İki ortalama arasındaki farkın önemlilik testi (Student's t test) Kruskal Wallis Varyans Analizi Varyans Analizi VERİ ÖLÇÜMLE (NİCEL) ELDE EDİLDİĞİNDE VE GRUPLAR BAĞIMLI OLDUĞUNDA; Veri Tipi : Ölçüm Grupların bağımlılık durumu: Karşılaştırılacak grup sayısı: İki Karşılaştırılacak grup sayısı: Üç ve daha fazla sağlanmadığında sağlandığında sağlanmadığında sağlandığında Wilcoxon Testi İki eş arasındaki farkın önemlilik testi (Paired t test) Friedman Testi Tekrarlı ölçümlerde Varyans analizi VERİ SAYIMLA(NİTEL) ELDE EDİLDİĞİNDE;
Grupların bağımlılık durumu: Grupların bağımlılık durumu: Karşılaştırılacak grup sayısı: İki (2x2) Karşılaştırılacak grup sayısı: Üç + (nx2),(2xm),(nxm) Karşılaştırılacak grup sayısı: İki (2x2) Beklenen değer 5'den büyükse Beklenen değer 5'den küçükse Ki-Kare testi Mc Nemar Testi Ki-kare testi veya iki yüzde arasındaki farkın önemlilik testi Fisher Exact test Aşağıdaki hipotezleri test etmek için hangi önemlilik testleri kullanılmalıdır? Örnek 1. Düşük doğum ağırlıklı 35 ve Normal doğum ağırlıklı 30 bebeğin annelerinin yaş ortalamaları karşılaştırılmak isteniyor. Sürekli nicel veri Soru 3. Karşılaştırılacak grup sayısı? İki 35 ve 30 kişi Soru 5. Her bir grupta yaş değerleri normal dağılıma uyuyor mu? Normal dağılıma uygun Bu bilgilere göre gruplarda yaş ortalamalarının İki ortalama arasındaki farkın önemlilik testi (Student s t testi) kullanılarak test edilmesine karar verilmiştir. Örnek 2. Düşük doğum ağırlıklı çocuk sahibi olan 35 kadın ve normal ağırlıklı çocuk sahibi olan 30 kadında gebelik sayıları karşılaştırılmak isteniyor. Kesikli nicel veri Soru 3. Karşılaştırılacak grup sayısı
İki Birinci grupta 35, ikinci grupta 30 kişi Soru 5. Gebelik sayıları normal dağılıma uyuyor mu? Normal dağılıma uygun değil Bu bilgilere göre gruplarda gebelik sayısı ortancalarının farklı olup olmadığı Mann Whitney U testi kullanılarak karşılaştırılmalıdır. Örnek 3. 30 annenin doğum öncesi ve doğum sonrası kilo ortalamaları karşılaştırılmak isteniyor. Soru 1. Karşılaştırılacak değişkenlerin ölçüm biçimi nedir? Sürekli nicel veri Soru 3. Karşılaştırılacak grup sayısı? İki 30 kişi Soru 5. Kilo değerleri arasındaki fark normal dağılıma uyuyor mu? Normal dağılıma uygun Bu bilgilere göre doğum öncesi ve doğum sonrası kilo ortalamalarının İki eş arasındaki farkın önemlilik testi (Paired t testi) kullanılarak test edilmesine karar verilmiştir. Örnek 4. 25 bebeğin doğumda ve doğumdan 6 ay sonraki Apgar skorları karşılaştırılmak isteniyor. Sıralanabilir Nitel Veri (10 lu) Soru 3. Karşılaştırılacak grup sayısı İki Her grupta 25 kişi Soru 5. Apgar skorları arasındaki fark normal dağılıma uyuyor mu? Normal dağılıma uygun değil Bu bilgilere göre doğumda ve doğumdan 6 ay sonraki Apgar skorlarının ortancalarının farklı olup olmadığı Wilcoxon testi kullanılarak karşılaştırılmalıdır.
Örnek 5. Dört ayrı hepatit türünde sedimantasyon ortalamaları karşılaştırılmak isteniyor. Sürekli nicel veri Soru 3. Karşılaştırılacak grup sayısı? Dört Her grupta 35 kişi Soru 5. Her bir grupta sedimantasyon değerleri normal dağılıma uyuyor mu? Normal dağılıma uygun Bu bilgilere göre hepatit türlerinde sedimantasyon ortalamalarının Varyans Analizi kullanılarak test edilmesine karar verilmiştir. Örnek 6. Kanserin 3 değişik evresinde AgNor değerleri karşılaştırılmak isteniyor. Sürekli nicel veri Soru 3. Karşılaştırılacak grup sayısı Dört İki grupta 10, iki grupta 8 Soru 5. Her bir grupta AgNor değerleri normal dağılıma uyuyor mu? Normal dağılıma uygun değil Bu bilgilere göre evrelerdeki AgNor değerleri ortancalarının farklı olup olmadığı Kruskal- Wallis Varyans Analizi kullanılarak karşılaştırılmalıdır. Örnek 7. 32 bireyin diyet öncesi, diyet sonrası ve diyetten 3 ay sonraki beden-kitle indeksi (BMI) değerleri karşılaştırılmak isteniyor. Sürekli nicel veri Soru 3. Karşılaştırılacak grup sayısı?
Üç 32 kişi Soru 5. BMI değerleri arasındaki farklar normal dağılıma uyuyor mu? Normal dağılıma uygun Bu bilgilere göre diyet öncesi, diyet sonrası ve diyetten 3 ay sonraki beden-kitle indeksi ortalamalarının Tekrarlı Ölçümlerde Varyans Analizi kullanılarak test edilmesine karar verilmiştir. Örnek 8. 15 bireyin ameliyat öncesi, ameliyatta ve ameliyat sonrası VAS skorları karşılaştırılmak isteniyor. Sıralanabilir nitel veri (10 lu) Soru 3. Karşılaştırılacak grup sayısı? Üç 15 kişi Soru 5. VAS skorları arasındaki farklar normal dağılıma uyuyor mu? Normal dağılıma uygun değil Bu bilgilere göre ameliyat öncesi, ameliyatta ve ameliyat sonrası VAS skorları ortalancalarının Friedman Testi kullanılarak test edilmesine karar verilmiştir. Örnek 9. Sigaranın Düşük doğum ağırlığına etkisini incelemek amacıyla Düşük doğum ağırlıklı çocuk sahibi olan ve olmayanlarda Sigara kullanma yüzdeleri karşılaştırılmak isteniyor. Sınıflanabilir Nitel Veri Soru 3. Karşılaştırılacak gruplarda kategori sayısı 2 x 2 Soru 4. Beklenen değeri 5 ten küçük bir göze var mı? Yok
Bu bilgilere göre Düşük Doğum Ağırlıklı çocuk sahibi olan ve olmayanlarda Sigara içme durumlarının farklı olup olmadığı Ki- Kare testi veya İki yüzde arasındaki farkın önemlilik testi kullanılarak test edilmelidir.(beklenen değerin 5 ten küçük olduğu göze olması durumunda Fisher in Kesin Ki-kare Testi kullanılarak test edilmelidir.) Örnek 10. Sosyoekonomik düzeyin Düşük doğum ağırlığına etkisini incelemek amacıyla Düşük doğum ağırlıklı çocuk sahibi olan ve olmayanların Sosyoekonomik düzeylerine göre dağılımları karşılaştırılmak isteniyor. Sıralanabilir Nitel Veri Soru 3. Karşılaştırılacak gruplarda kategori sayısı 2 x 3 Bu bilgilere göre Düşük Doğum Ağırlıklı çocuk sahibi olan ve olmayanların Sosyoekonomik düzeylerinin farklı olup olmadığı Çok-gözlü düzenlerde Ki- Kare testi kullanılarak test edilmelidir. Örnek 11. Aynı hastalar üzerinde uygulanan iki farklı yöntemin (PET ve SPECT) benzer tanı koyma olasılıkları (Pozitif/Negatif) karşılaştırılmak isteniyor. Sınıflanabilir Nitel Veri Soru 3. Karşılaştırılacak gruplarda kategori sayısı 2 x 2 Bu bilgilere göre PET ve SPECT yöntemlerinde tanı koyma olasılıklarının farklı olup olmadığı Mc-Nemar testi kullanılarak test edilmelidir. KAYNAKLAR 1. Akgül, A. (2003). Tıbbi Araştırmalarda İstatistiksel Analiz Teknikleri SPSS Uygulamaları (2. Baskı). Emek Ofset Ltd. Şti., Ankara. 2. Bowers, D. (2002). Medical Statistics from Scratch. John Wiley and Sons, Ltd., England. 3. Conover, W., J. (1980). Practical Nonparametric Statistics (2 nd Edition), John Wiley & Sons. 4. Dawson-Saunders B., Trapp, R., G. (1990). Basic and Clinical Biostatistics. Appleton & Lange. 5. Siegel, S., Castellan, N., J., Jr. (1988). Nonparametric Statistics for the Behavioral Sciences. McGraw-Hill Inc., New York. 6. Sümbüloğlu, K., Sümbüloğlu, V. (2002). Biyoistatistik (10. Baskı). Hatiboğlu Basım ve Yayım San. Tic. Ltd. Şti, Ankara. 7. Swinscow, T., D., V. (1997). Statistics at Square One (9 th Edition). BMJ Publishing Group. Erişim: [http://bmj.bmjjournals.com/collections/statsbk/13.shtml].