İKİDEN ÇOK BAĞIMSIZ GRUBUN KARŞILAŞTIRILMASI
Grup sayısı ikiye geçtiğinde tüm grupların bağımsız iki grup testleri ile ikişerli analiz düşünülebilir. Ancak bu yaklaşım, karşılaştırmalar bağımsız olmadığından α hata seviyesinde artışa, diğer bir deyişle (1- α) güven düzeyinde azalmaya neden olur. Üç grubun olduğu bir çalışmada bağımsız iki grup t testi ile µ 1 = µ 2, µ 1 = µ 3, µ 2 = µ 3 şeklinde üç test yaptığımızda, α=0.05 önem seviyesi, α I =1-(1-.05) 3 =0.143 şeklinde gerçekleşir.
Bu nedenle, 2 den fazla grup olan çalışmalarda her bir grubu ikişerli ikişerli karşılaştırmak yerine, bu amaca uygun yöntemleri kullanmak gerekir.
Tek Yönlü Varyans Analizi 2 ve daha çok bağımsız grubun ortalamalarını karşılaştırma için kullanılabilecek parametrik bir analiz yöntemidir. 2 grup olduğunda, varyansların homojenliği altında uygulanan t-testi ile aynı sonucu (p) verir [t 2 =F].
Veri yapısı: İki değişkenimiz vardır, bunlardan bir tanesi farklı işlemleri ya da uygulamaları ifade eden grup değişkenidir [faktör, bağımsız değişken]. Bu değişken genellikle nominal skalada [A, B ve C ilaçları], bazen de ordinal skalada [evre 1, 2, 3, 4] elde edilir. Diğeri ise bağımlı değişken dediğimiz ve grup değişkeninde yer alan sınıflar arasında ortalamalarını karşılaştırmak istediğimiz değişkendir. Nümerik skalada elde dilmiş olmalıdır.
İncelediğimiz değişken [ortalamalarını karşılaştırdığımız] bakımından, Grup değişkeninde yer alan sınıflardaki farklılığı doğru belirleyebilmek için, ölçüm yaptığımız deneysel ünitelerin homojen olması önemlidir. Aksi durumda daha karmaşık ANOVA modelleri kullanmak gerekir.
Varsayımları: Tüm gruplar Normal Dağılışlı Popülasyonlardan elde dilmiş bağımsız birer şans örneğidir. Bu popülasyonların varyansı eşittir. Varyans Analiz Tablosunun Oluşturulması: H = 0 µ 1 = µ 2 = µ 3 =.= µ k = µ H 1 : En az iki popülasyonun ortalamaları arasında farklılık vardır.
Örnek büyüklükleri eşit olmak zorunda değildir, ancak eşit ya da en azından yakın olmalarında yarar vardır. x ij : i. grupta j. bireyin ölçülen değeri. i = 1, 2,., k (k:grup sayısı) j = 1, 2,., n i (n i : i. gruptaki örnek büyüklüğü)
Varyans Analiz Tablosu: k : grup sayısı n = x = k i= 1 n i n (toplam gözlem sayısı) i x i. grupta yer alan n tane gözlemin toplamı i. ij j j1 = k x = x = n tane x gözleminin toplamı.. i. ij i= 1 k n i i=1 j= 1 x 2 ij = n tane gözleminin tek tek kareleri alınıp toplanması
Hipotezler hakkında karar: α önem seviyesinde GuKO F h = > F[k-1;n-k; α ] H 0 reddedilir. HKO F H reddedilmez. [k-1;n-k; α ] 0 Örnekten elde edilen verilere dayanarak H 0 hipotezi reddedilemez ise [F h F t ], çalışma, gruplar arasındaki farklılık anlamlı bulunmadı [p>α] şeklinde yorumlanarak çalışma tamamlanır. Ancak H 0 hipotezi reddedilirse [F h > F t ; p<α], yani gruplar arasındaki farklılık anlamlı bulunduğunda, bu farklılığın ne şekilde gerçekleştiğini belirlemek amacıyla varyans analizi yöntemine özel geliştirilmiş testler kullanılır [Kontrast yada Post Hoc Testler].
Normallik ve Varyans Homojenliği varsayımlarındaki sapmalarda yapılabilecekler Varyans Analiz yönteminde veriler simetrik özellikli popülasyonlardan geldiği durumlarda Normallik varsayımı gerçekleşmese bile, fazla problem yaşanmaz. Yani, elde edilen verilerden hesaplanan F h değerini, F tablo değeri ile karşılaştırarak Hipotezleri test etmek güvenlidir. Ancak varyans homojenliği [σ 1 2 = σ 22 = =σ k2 =σ 2 ] varsayımının yerine gelmediği durumlarda F h değerine göre yorum yapmak, yanlış sonuçlara neden olur. Özellikle, grupların örnek büyüklükleri de dengesiz ise hata daha da büyür.
Çözümler: 1. Varyans ortalamaya bağlı olarak azalma veya artmaya eğilimli bir istatistiktir. Bu da homojenlik varsayımını doğrudan etkiler. Bu gibi durumlarda x ij gözlemlerine, x ij, xij + 1, arcsin(x ij), log(x ij), log(x ij +1) gibi dönüşümler yapılarak, varyans homojenliği incelenebilir. 2. Hipotezler hakkındaki karar ANOVA tablosundaki F h yerine, Brown-Forsythe yada Welch istatistiklerine göre yapılabilir. Bu iki test One-Way ANOVA penceresindeki Options menüsünde yer alır. 3. Parametrik olmayan Kruskal-Wallis yöntemi kullanılır.
Özellikle, hem varyans homojenliği olmadığında hem de örnek büyüklükleri dengesiz (eşit olmaması) olduğunda Welch istatistiği diğer ikisine göre daha güçlüdür. Varyansların Homojenliği One-Way ANOVA penceresinde Options menüsü altındaki Homogeneity of variance test kutucuğu işaretlenerek gerçekleştirilir. σ 1 2 = σ 22 = =σ k2 =σ 2 hipotezi Levene testi ile kontrol edilir.
H 0 Hipotezi reddedildiğinde grup farklılıklarının incelenmesi: Çalışmanın öncesinde planlanmış bazı karşılaştırmalar yapmak (Konrast): µ 1 =1/3(µ 2 + µ 3 + µ 4 ) µ 1 = µ 2, µ 3 = µ 4 gibi One-Way ANOVA penceresinde Contrasts menüsünde tanımlanırlar.
Range Testleri [Post Hoc Range Tests]: Bu testler, grupları kendi içinde farklı olmayan homojen alt gruplara bölerler. k-grup karşılaştırılıyor ise homojen alt grup sayısı k olur. One-Way ANOVA penceresinde Post Hoc menüsünde yer alırlar. İkili Çoklu Karşılaştırmalar [Post Hoc Pairwise Multiple Comparisons]: Tüm grupları birbirleriyle ikişerli karşılaştırarak gerçekleştirilir.
Range Testleri ve İkili Karşılaştırma testleri, çalışma öncesinde belirlenmemiş karşılaştırmalar için kullanılır ve her iki test tipi de Post Hoc yöntemler adı altında toplanmışlardır. Varyanslar Homojen Tukey [Tukey s honestly], Hochberg s GT2, Gabriel, Scheffe testleri hem Range hem de İkili çoklu karşılaştırmaları verir. Tukey s b, S-N-K (Student-Newman-Keules), Duncan, R-E-G-W-F (Ryan-Einot-Gabriel-Welsch F test), R-E-G- W-Q (Ryan-Einot-Gabriel-Welsch Range test) ve Waller-Duncan yöntemleri, Range Testleri için kullanılabilir [homojen alt gruplar]. LSD, Benferroni, Sidak ve Dunnetyöntemleri, İkili çoklu karşılaştırmalar için kullanılır.
Bu üç gruptaki testler sadece Varyans Homojenliği altında kullanılabilir. Bu testlerde en çok kullanılan ikisi Tukey ve Bonferroni dir. Karşılaştırılan çift sayısı çok olduğunda Tukey, az olduğunda Bonferroni Testi tercih edilir. Bu testlerden Dunnett testi tek yönlü karşılaştırmalara olanak verir. Ancak, grupların sadece birisinin diğer gruplarla tek tek karşılaştırılması şeklinde gerçekleştirilebilir. Diğerleri ile karşılaştırılacak gruba k grup varsa, 1 ya da k değeri vermek gerekir.
Varyanslar Homojen Değil: Bunlar varyans homojenliği gerektirmeyen çoklu ikili karşılaştırma testleridir; Tamhane s T2, Dunnett s T3, Games-Howell ve Dunnett s C. Dunnett s T3 ve Dunnett s C daha tercih edilebilir testlerdir.
Kruskal-Wallis Testi k tane (k 2) birbirinden bağımsız örneğin, gelmiş oldukları popülasyonların medyanlarının eşit olup olmadığını test etmek için kullanılan Parametrik Olmayan bir yöntemdir. Mann-Whitney U testi geliştirilerek elde edilmiştir. Nümerik skalada elde edilen verilerde Tek-yönlü varyans analizinin varsayımları gerçekleştirmediği durumlarda ya da Ordinal skalada elde edilmiş verileri karşılaştırmak için kullanılır. SPSS de Analyze>Nonparametric Tests>K Independent Samples... menüsünde yer alır.
Uygulama: H 0 :M 1 =M 2 =M 3 =..=M k =M H 1 :En az iki M değeri arasında fark vardır. Mann-Whitney U testindeki gibi tüm gözlemlere (x ij ) sıra değerleri verilir. Daha sonra her bir grup için (k-grup) sıra değerleri toplanarak T 1, T 2,., T k istatistikleri elde edilir. H 0 ın doğruluğu altında, 10 T k 2 i 2 H= 3 (n + 1) ~ χ[sd= k 1] [Ki Kare dağılışı] n (n+1) i= 1 ni k: grup sayısı; n i : i. gruptaki gözlem sayısı (i=1, 2,.,k ) n k = n i= 1 i T i : i. gruptaki sıra değerlerinin toplamı H H >χ χ 2 [ α ;sd= k 1] 0 2 [ α ;sd= k 1] 0 H hipotezi reddedilir. H hipotezi reddedilmez.
X 2 dağılış yaklaşımının iyi olabilmesi için her bir grupta yer alan gözlem sayılarının 5 ve üzerinde olmalıdır (n i 5 i = 1, 2,.,k). Aksi durumda (exact) tam olasılıkların hesaplanması gerekir. H > X 2 [α; sd=k-1], yani H 0 hipotezi reddedildiğinde, gruplar arasındaki farklılığın anlamlı olduğuna karar verilir. Bu durumda grupların Varyans analizinde olduğu gibi ikili karşılaştırılması gerekir. Grupların ikili analizleri için özel bir yöntem yoktur. Bu amaçla Mann-Whitney U testi kullanılır. Ancak Mann-Whitney U testlerinde α önem seviyesi, α ı = α / (ikili karşılaştırma sayısı) şeklinde belirlenmelidir [Bonferroni Correction]. Örnek: k=3, H 0 hipotezi reddedildi, α = 0.05, M 1 =M 2,, M 1 =M 3, M 2 =M 3 karşılaştırmaları yapılacaksa 0.05 α= 0.0167 3 olarak seçilir.
REGRESYON ve KORELASYON Değişkenler Arası İlişkiler
Regresyon analizi, bir bağımlı değişken (Y) ile bir ya da daha çok bağımsız (X1, X2,X3,...) değişken arasındaki ilişkiyi yansıtan modeli (eşitliği) bulmaya yarayan bir yöntemdir. Bağımlı değişken ile bağımsız değişken/ler arasındaki ilişkinin doğrusal olduğu durumlarda, yöntem, Doğrusal Regresyon Analizi adını alır. Eğer bir Y değişkeni ile bir X değişkeni arasında doğrusal model aranıyor ise Y= β 0 + β 1 X + e eşitliğindeki β 0 ve β 1 parametre değerlerini tahmin etmek ve elde edilen modelin geçerliliğini test etmek amacıyla yapılan analiz Basit Doğrusal Regresyon Analizi olur.
Bağımsız X değişkeni ile bağımlı Y değişkeni arasında güçlü bir ilişki bulunursa, bu tahmin edilen model kullanılarak herhangi bir X değeri için Y nin alabileceği değer tahmin edilebilir.
Varsayımları: Bağımsız değişkenin her bir değeri (x i ) için, y i değişkeni normal dağılışa uyar. Bu normal dağılışlar, her bir x i değeri için,sabit bir σ 2 varyansına sahiptir. Bu iki değişken arasında doğrusal bir ilişki vardır. Gözlemler birbirlerinden bağımsız olarak elde edilirler. Basit Doğrusal Regresyon Analizinde gözlemler (x i,y i ) çiftleri şeklinde alınır.
Örnek: Süreye bağlı olarak, Ca salınımının incelendiği çalışmada aşağıdaki veriler elde edilmiş. X bağımsız değişkeni: Süre (saat) Y bağımlı değişkeni: Ca salınım miktarı (mg/dl) Öncelikle serpme (scatter) grafiği ile X ve Y arasında doğrusal ilişkinin varlığını incelemek gerekir.
Şekilden doğrusal ilişkinin varlığı belirlendikten sonra, En Küçük Kareler Yöntemine göre Y= β 0 + β 1 X + e modelindeki β 0 için b 0 ve β 1 için b 1 tahminleri elde edilir.
2 En küçük kareler yöntemi ei lerin minimize edilmesine dayanır. i= 1 b 1 : doğrunun eğimidir. ( x)( y) Aynı zamanda x deki 1 xy birim değişimin y de n oluşturduğu b = 1 2 2 ( x) 0 1 x b = y bx n değişimin büyüklüğünü verir. b 0 : doğrunun y eksenini kestiği noktadır ve x=0 da y nin aldığı değeri gösterir. Tahmin edilen denklemin geçerliliği varyans analiz tablosu oluşturularak test edilir. n
Varyans Analiz Tablosu: F RKT = > HKT F h [ α,sd = 1;sd = n 2] 1 2 Elde edilen denklemin X ile Y arasındaki doğrusal ilişkiyi açıklamakta önemli olduğuna karar verilir. 2 RKT R = GKT Belirleme katsayısı 1 e yakın olması model uyumunun iyi olduğunu gösterir.
Korelasyon Analizi Özellikle iki değişken arasındaki doğrusal ilişki incelenirken, regresyon analizinde olduğu gibi bağımlı ve bağımsız değişkenlerin tam olarak belirlenemediği durumlarda, korelasyon analizinden yararlanılabilir.
Pearson Korelasyon Analizi (x i,y i ) çiftleri nümerik skalada elde edilmelidir. Varsayımı: Her bir gözlem çiftinin iki değişkenli normal dağılıştan gelmektedir. r = ( )( ) xy x y / n 2 2 2 ( ) 2 ( ) x x /n y y /n İki değişkenin birlikte değişiminin ölçüsü olan korelasyon katsayısı r; -1 r 1 arasında değerler alabilir.
İlişki azalır -1 0 1 r Negatif yönde y artan doğrusal ilişki: x artarken y azalmaktadır r (tersi de geçerlidir). erlidir). Pozitif yönde y artan doğrusal ilişki: x artarken y de artar (tersi de geçerlidir). erlidir).
r>0 r<0 r=+1 r=0 r= - 1
Spearman Rho Korelasyon Analizi (x i,y i ) çifti iki değişkenli normal dağılış varsayımına uymadığı durumlarda, iki tane nümerik skalada elde edilmiş değişken için kullanıldığı gibi, değişkenlerden her ikisi de ordinal ya da biri ordinal diğeri nümerik olduğu durumlarda kullanılabilir. Özellikle, iki değişken arasında düz bir çizgi şeklinde ifade edilemese bile sürekli artan ya da azalan yapıda bir ilişki olduğu durumlarda yararlıdır.
Uygulamada X ve Y değişkenlerine ayrı ayrı en küçüğü 1 en büyüğü n olacak şekilde sıra değerleri verilir. Daha sonra her bir (x i,y i ) i=1,2,3...,n gözlem çifti için; d i =(x i nin sıra değeri - y i nin sıra değeri) farkı ve bu farkların karesi,d i ², hesaplanır; n 2 6 di i= 1 rs = 1 n(n 2 1) formülüyle Spearman rho korelasyon katsayısı hesaplanır. Yorumu pearson korelasyon katsayısında olduğu gibidir.
İki Yönlü Tablolarda Yapılan Bazı Hipotez Testleri Bağımsızlık Testleri İki nominal ya da biri ordinal diğeri nominal skalada elde edilmiş değişkenin bağımsızlığını test etmek için kullanılır. H 0 : X ile Y değişkenleri birbirinden bağı ğımsızdır. H 1 : X ile Y bağı ğımlıdır.
n n n h c i. ij j1 =.j ij i= 1 r r c.. ij i= 1 j= 1 0 = = = G G.. G H hipotezinin doğruluğu altında; nn i..j B ij = bulunur ve, n ( ) 2 r c Gij B 2 ij 2 ~ χ h [sd = (r 1) (c 1)] i= 1 j= 1 Bij χ = χ >χ 2 2 [sd = (r 1) (c 1)] 0 H hipotezi reddedilir.
r=2, c=2 olan 2x2 tablolarda χ = n(g G G G ) 2.. 11 22 12 21 kullanılabilir. n n n n 1. 2. 1. 2. 2 formülü Yates Düzeltmeli Formül: 2 χ = n (G G G G ) 0.5n ( ) 2.. 11 22 12 21.. n n n n 1. 2..1.2
2x2 tablolarda tüm beklenen değerlerin 5 ten büyük olduğu durumlarda Yates Düzeltmesi yapılarak kikare uygulaması önerilmektedir. Özellikle 5 ten küçük beklenen değerler olduğu durumlarda Fisher in Tam Olasılık Testi kullanılmalıdır. rxc tablolarda herhangi bir gözdeki beklenen değer 1 den küçük ise ve/veya 5 ten küçük olan gözlerin sayısı toplam göz sayısının %20 sinden çok ise, kikare testini kullanmak sakıncalıdır. Özellikle H 0 hipotezinin reddedildiği durumlarda çözüm grupları birleştirmek ya da sebep olan grupları analize almamaktır.
2x2 tablolarda Mc Nemar Testi 2 bağlantılı (eşleştirilmiş) dikotom değişkendeki değişimi ölçmek için kullanılan Parametrik olmayan bir yöntemdir. ( B C 1) B+ C 2 2 2 ~ χ[sd= 1] χ = H 0 : Önce sonra arasında farklılık k yoktur. H 1 : Önce sonra arasında farklılık k anlamlıdır.