6.DERS İki Varyansın Karşılaştırılması Comparing Two Variances t-testinde iki varyansın eşit kabul edilip edilmemesi için kullanılır 1
Varyans için ikili-örnek Testi ve gibi iki varyansı karşılaştırmak için, F-dağılımını kullanınız. İki farklı popülasyondan seçilen örneklerin varyansı s 1 ve s olsun. eğer iki populasyon da normal ve the populasyon varyansları ve eşit ise, bu tür örnekleme dağılımına F max -dağılımı denir s 1 her zaman büyük varyans için kullanılır. İki tane serbestlik derecesi vardır. Numeratör ve denominatör diye 0.8 0.7 0.6 0.5 0.4 0. 0. 0.1 0.0 d.f. N = 8 d.f. D = 0 0 1 4 5 F değeri sıfır veya pozitif olabilir
Varyanslar için F-Testi Normal dağılım gösteren iki popülasyondan seçilen örneklerin varyanslarının eşit olup olmadığını test etmek için, örnekler rastgele seçilmelidir. s 1 ve s örnek varyanslarını göstersin Örnek dağılımımız numeratörü d.f. = n 1 1 ve denominatörü d.f. = n 1 olan F max dağılımı gösterir. max Eşit varyanslı testler için sadece tek taraflı-sağ taraflı-f-testi kullanılmalıdır.hesap sonunda bulunan değeri kritik değer ile karşılaştırarak yorum yapılır. Çift taraflı test için de,sağ taraftaki kritik değer kullanılabilir ama bu durumda karşılaştırmada kullanılacak değer olur.
örnek Bir mühendis t-testi uygulayarak A arabasının benzin tüketiminin B den az olup olmadığını görmek istiyor. Rastele seçilen 16 adet A arabasının standart sapması 4.5 ve adet B arabasının standart sapması 4. dir. Mühendis kullanacağı t-testinde eşit varyans mı yoksa eşit olmayan varyansı kullanmalıdır? dir. 1. Boş ve altenatif hipotezi yazın.. Anlamlılık seviyesi:. A arabasının varyansı B den büyük,s 1 için A arabasının varyansı kullanılır. 4
. Örnek dağılımını belirleyiniz F dağılımı: d.f. N = 15, d.f. D = 1 0.8 0.7 0.6 0.5 0.4 0. 0. 0.1 0.0 4. Kritik değeri bul. 5. Reddetme bölgesini bul 0.05 0 1 4 5.5 6. İstatistiksel hesap yap: NOT: F max dağılımının ayrı tablosu vardır max
0.8 0.7 0.6 0.5 0.4 0. 0. 0.1 0.0 0.05 0 1 4 5 7. Karar ver F = 1.148 değeri reddetme bölgesinde değil, bu yüzden boş-nul hipotez reddedilemez yani kabul edilir. 8. Kararı yorumla Varyansların eşit oldmadığı iddiasını desteklemek için yeterince delil bulunamamış,ho reddedilememiştir bu yüzden uygulanacak t-testinde eşit varyans kullanılmalıdır. Varyanslar farklı olsa idi, Standar sapma için pooled havuzlu değer işlemleri yapılarak kullanılmalıdır. (d.f. için: n1+n alınmalı)
ANOVA Analysis of Variance İki ya da daha fazla popülasyon ortalamasını karşılaştırmak için kullanılan hipotez testi tekniğidir. 7
ANOVA için test istatistiği için F-testi kullanılır. F= Yöntemler arası varyans yöntemin etkisi+ kişisel farklılıklar+ deneysel hata = Yöntemler içi varyans kişisel farklılıklar+ deneysel hata Yöntemler arasındaki farklılık: uygulanan yöntemin etkisi,kişisel farklılık ve deneysel hatadan kaynaklanır Yöntemler içi farklılık: kişisel farklılık ve deneysel hatadan kaynaklanır. Yöntemin etkisi 0 ise F değeri 1 bulunur. H o doğru ise yöntemin etkisi sıfırdır bu yüzden F oranı 1 bulunur H o yanlış ise uygulanan yöntemin etkisi vardır ve F oranı 1 den büyük çıkar H 0 : (bütün popülasyon ortalamaları eşit.) H a : en azından bir tanesinin ortalaması diğerlerinden farklı. 8
Bağımsız ölçümler için ANOVA Varyanslar iki farklı şekilde hesaplanarak oranlanır bu değer F değerini verir 1. MS B, Arasındaki ortalamanın karesi, örnekler arasındaki varyans, her bir örneğe uygulanan yöntem farklılıkların ölçümü.... MS W, İçindeki ortalamanın karesi, örnek içindeki variance, aynı örneğin içindeki örnekleme hatasından kaynaklanan farklılıkların ölçümü Örnek varyansı s = SS df SS toplam =SS between +SS within d.f. toplam =df between +df within MS B = SS B df B MS W = SS W df W d.f.toplam=n-1 d.f.between=k-1 d.f.within=n-k 9
Arasındaki ortalamanın karesi Mean Square Between Her bir gruba farklı bir yöntem treatment. uygulanıyor. Genel ortalamadaki farklılık (grup içindeki bütün değerlerin ortalaması) ölçülür. treatment (veya faktör) bir örnekten diğerini ayıran değişkendir. Önce, SS B yi hesapla sonra serbestlik derecesi olan k 1e böl. (k = treatments uygulanan yöntem sayısı veya faktör sayısı.) Arasındaki: Uygulanan yöntemler arasındaki demek 10
İçindeki ortalamanın karesi Mean Square Within SS W yi hesapla ve N k ya böl, (serbestlik derecesine). Eğer MS B değeri MS W ye çok yakınsa uygulanan yöntemin etkili olmadığını gösterir ve F oranının değeri 1 yakın olur. Eğer MS B değeri önemli derecede MS W den büyükse bu uygulanan yöntemin veya faktörün etkili olduğunun bir göstergesi olabilir 11
Örnek Aşağıdaki tablo Amerikanın dört farklı bölgesinden rasgele seçilen müşterilerin yıllık okumak için harcadığı ortalama parayı $ cinsinden göstermektedir. anlamlılık seviyesine göre bu bölgeler arasındaki harcanan ortalama paranın farklı olduğu sonucuna varabilir misiniz? Kuzeydoğu Ortadoğu Güney Batı 08 58 141 109 0 144 16 46 169 46 158 167 76 10 14 164 119 99 14 108 184 1 69 199 171 04 1. Boş ve alternatif hipotezi yazınız H 0 : (bütün popülasyon ortalamaları aynı.) H a : en azından birinin ortalaması farklı. 1
. Anlamlılık seviyesini belirle. Örnekleme dağılımını belirle. F dağılımı ve d.f. N =, d.f. D = 0.8 0.7 0.6 0.5 0.4 0. 0. 0.1 0.0 0 1 4 5.4 4. Kritik değeri bul 5. Reddetme bölgesini bul. 0.10
6. İstatistiksel hesaplamaları yap. Kuzeydoğu Ortadoğu Güney Batı 08 58 141 109 0 144 46 169 46 158 167 76 10 14 164 119 99 14 184 1 69 199 171 16 108 04 Her örnek için ortalama ve varyansı hesapla. 177.00 15.71 Genel ortalama 4050.05 bütün değerlerin ortalaması. 1741.9 10.14 100.80
MS B hesabı ortalama n 1 185.14 7 66.6 46.8 177.00 6 0.00 0.0 15.71 7 1704.86 1194.0 4 10.14 7 1098.6 7687.8 15
MS W hesabı n s 1 7 988.66 5901.9 6 4050.05 050. 7 1741.9 10448.4 4 7 100.80 614.8
0.8 0.7 0.6 0.5 0.4 0. 0. 0.1 0.0 7. Kararını ver. 0.10 0 1 4 5.5 F = 1.669 değeri reddetme bölgesi içinde değil,boş hipotez reddedilemez, kabul edilir. 8. Interpret your decision. ortalamaların aynı olğu hakkındaki görüşü destekleyecek yeterince delil bulunamamıştır. Dört bölge içinde okumak için ortalama harcanan paralar eşittir.
Çıktı örneği-raporda sonuç yazma One-way Analysis of Variance Analysis of Variance Source DF SS MS F P Factor 0085 6695 1.61 0.15 Error 95857 4168 Total 6 1594 p-değerini kullanarak,boş hipotez reddedilemez, çünkü 0.15 > 0.10 dir. Dört bölgede okumak için harcanan paraların farklı olduğu görüşünu desteklemek için yeterince delil bulunamamıştır. Raporda Sonuç Yazma: F(,)= 1,61;p>.10 F(k-1,N-k)= F bulunan ; p<.05 18
ÖRNEK: Deneysel metot kullanılan bir araştırmada üç ağrı kesici(a,b ve C) ile birlikte bir de sahte-tatlandırıcı-ilaç kullanılıyor.veriler aşağıdaki gibi elde edilmiş olup ölçümler birbirinden bağımsızdır.bu ilaçlar arasında bir fark olup olmadığı hakkında ne söylenebilir?(ölçülen değerler, birbirinden bağımsız kişilerdeki ağrı geçme süresini s cinsinden göstermektedir.) Tatlandırıcı İlaç A İlaç B İlaç C 0 0 8 N:1 0 1 4 5 G:6 5 5 ΣX :178 T= T= T=1 T=18 =G/N= SS=6 SS= SS= SS=6 Hipotezleri belirle ve alfa seviyesini belirle df toplam,df B ve df W yi bul F oranı için MS B ve MS w yi hesapla ve kararı yorumla ve raporda belirt. 19
SS Toplam = ΣX G N = 178 6 1 = 70 SS W =ΣSS içinde =6+++6=16 SS B =SS toplam -SS W =70-16=54 VEYA SS B T = Σ n G N = + 1 + 18 + 6 1 = 54 MS B = SS MS W = SS B W =18/=9 =54/=18 =16/8= df B df W Bulunan sonuç kritik yani red bölgesinde 9> 4.07 olduğu için Ho yani değersiz hipotez reddedilir.yani, veriler desteklemektedir ki kullanılan ilaçlar arasında bir fark vardır. Yukarıdaki değerleri gösteren tablo ile F(,8)= 9.0, p<.05 yazılır. Peki hangisinin daha etkili olduğunu nasıl öğrenebiliriz? 0
POST HOC TEST Uygulanan metotlar arasında belli bir anlamlı farklılık bulunmuş ise yani Ho değersiz hipotez reddedilmiş ise hangi metodun daha etkili olduğunu anlamak için uygulanacak testlere post hoc test i denir 1. TUKEY S HONESTLY SIGNİFİCNAT DIFFERENCE (HSD) TEST. THE SCHEFFÉ TEST 1
HSD TEST HSD = q. MS n w q değeri tablo ile belirlenir Önceki ağrı kesici örneği için hangisinin etkili olduğunu bulalım: Alfa =.05 k=4 için q=4.5 bulunur ve MSw= ve n= idi buradan HSD=.70 bulunur. BU sonuç şu şekilde yorumlanır: Herhangi iki ilacın ortalama farkı bu bulunan değere eşit veya daha büyük olmalıdır.küçükse ikisi arasında fark yoktur büyükse ikisi arasında fark vardır demektir. Buna göre: ortalamalar: tatlandırıcının1, ilaç A nın 1, ilaç B nin 4 ve ilaç C nin 6 dir. Tatlandırıcı ile ilaç A ve B arasında fark yok, tatlandırıcı ile İlaç C ve ilaç A ile ilaç C arasında bir fark vardır. Verilerin ışığı altında söylenebilir ki: İlaç C,ilaç A ve tatlandırıcıdan daha iyidir.
THE SCHEFFÉ TEST Scheffe test iki örnek-yani metot-için F değerlerine göre aralarında bir fark olup olmadığını test etmektedir. MS B değeri için seçile iki örnek değerleri kullanılır. MS W için Anova daki değer kullanılır. İki örnek karşılaştırması olduğu halde scheffe testte k için (iki grup değil) toplam k değeri alınır.ve sonuçta bulunan F değeri iki grup için karşılaştırma değeridir. Anlamlı bir sonuç varsa seçilen bu iki grup arasında fark vardır şeklinde yorum yapılır. Toplam önceki örneğimizdeki gibi 4 grup varsa her ikili grup için ayrı ayrı F değerleri hesaplanıp ona göre yorum yapılmalıdır.
Tekrar ağrı kesici ilaç örneğine dönelim: Tatlandırıcı İlaç A İlaç B İlaç C 0 0 8 N:1 0 1 4 5 G:6 5 5 ΣX :178 T= T= T=1 T=18 =G/N= SS=6 SS= SS= SS=6 En büyük ile en küçük ortalamaya sahip olan iki örneği önce karşılaştırma yaparak sonuç anlamlı bulunursa sonra diğer ortalamalar karşılaştırılmaya devam edilmelidir. Şimdi tatlandırıcı ile İlaç C yi karşılaştıralım: T = Σ n G N SS B T SS B = Σ n G N = Formülü iki grup için uygulanır. G=+18=1 ve N=+=6 olarak değişir. Buradan: 18 + 1 6 = 7,5 MS B = SS B df B =7,5/=1,5 k-1= 4
MSW de bir deüişiklik yok normal ANOVA hesabındaki değer alınır: MS W = SS W df W reddetme bölgesi içinde olduğundan ikisi arasında anlamlı =16/8= buradan =1,5/=6.5 bulunur ve bu değer bir fark vardır denir. Diğer grupların anlamlı olup olmadıklarını aynı metotla siz deneyiniz!!! 5
F ile t arasındaki ilişki F=t bağıntısı vardır. Örnek ortalamalarında elde edilen farklılık t= Farklılığın şansla(hata ile) elde edilmesi Örnek ortalamalarının varyansı (farklılığı) F= Varyansın (farklılığın) şansla(hata ile) elde edilmesi %95 %95 -.101.101 4.41(.101) 6
Bağımsız ölçümler için kullanılan ANOVA nın kullanılması için aynen t-testi için olduğu gibi üç tane kabullenme varıdır, bunlar: 1. Herbir örnek için yapılan gözlem ve ölçümler birbirinden bağımsız olmalıdır. Örneğin seçildiği popülasyon normal olmalıdır. Örnek seçilen popülasyonlar eşit varyansa sahip olmalıdır.(homogenity of variance) ANOVA förmüllerini özetlersek: SS Toplam Toplam G = ΣX df=n-1 N Metotlar arası T G SS B = Σ n N MS=SS/d.f d.f.=k-1 Metotlar içinde SS W =ΣSS içinde MS=SS/d.f d.f.=n-k 7
Tekrarlı Ölçümler için ANOVA Yine null-boş hipotez yöntemler arasında bir farklılık yoktur der ve F değerine göre bu sonuç yorumlanır ancak burada sadece tekrarlı ölçümler söz konusudur. Yöntemler arası varyans yöntemin etkisi+ deneysel hata F= = Yöntemler içi varyans deneysel hata Bir örnekle açıklamaya çalışalım: Dört kişiye ait el beceri test puanları (belli bir deneme yaptıktan sonra her bir oturumun sonunda alınan puanlar) aşağıda verilmiştir. Buna göre tekrarlı ölçümler için ANOVA hesaplamalarını yapalım. Kişi Oturum1 oturum oturum P A 6 1 B 6 C 1 1 4 6 D 4 6 1 T 1 =8 T =10 T =18 SS 1 = SS =5 SS =11 G=6 ΣX =140 k= n=4 N=1 8
SS Toplam Toplam = ΣX G N df=n-1 1.adım Metotlar arası T G SS B = Σ n N df=k-1 SS arası Metotlar içinde SS W =ΣSS içinde df=n-k SS hata.adım p = Σ k G N SS B df=n-1 SS içinde -SS arası df=(n-k)-(n-1) Önce, toplam, arası ve içinde için SS hesabı yap sonra. adıma geç 9
SS Toplam = ΣX G N = 140 6 1 = SS B T = Σ n G N = 8 4 10 + 4 18 + 4 6 1 = 14 1.aşama SS W =ΣSS içinde =SS 1 +SS +SS =+5+11=18 SS kişişilera sı = Σ p k G N 1 = 6 + + SS hata =SS metotlar içinde -SS kişiler arası 6 1 + 6 1 = 1 d.f.toplam=n-1=1-1=11 d.f. B =k-1=-1=.aşama =18-1=6 Sonra MS ler hesaplanarak F bulunur d.f. W =N-k=1-=9 d.f. kişlerarası =n-1=4-1= d.f. hata =(N-k)-(n-1)=9-=6 0
MS B = SS B d.f. B MS Hata = SS hata d.f.hata = 14/ =7 =6/6 =1 Hata = 7/1 =7 F(,6)= 7.0, p <.05 1
ÖDEV Ders içinde kontrolü zor çocuklara yeni geliştirilen bir metot uygulanıyor ve bunun etkinliğini ölçmek için okul psikologu belli zaman aralıklarında seçilen bu 4 öğrenciye program başlamadan önce ve sonra testler uyguluyor. Bu test sonuçları aşağıdaki gibi tablo haline getirilmiştir. Buna göre hipotezlerinizi kurup bunu test ediniz. Kişi pro. önce 1.hafta sonra 1ay sonra 6ay sonra P A 8 1 1 1 B 4 1 1 0 6 C 6 0 10 D 8 4 1 16 T 1 =6 T =8 T =6 T 4 =4 SS 1 =11 SS = SS =9 SS 4 = n=4 k=4 N=16 G=44 ΣX = Cevap: F(,9)= 1.04, p <.05.. Post hoc test yine aynı yöntemlerle yapılır
Two-Factor ANOVA(bağımsız Ölçümler için) One-way ANOVA Two-way ANOVA veya li faktör ANOVA 18-li sınıf FAKTÖR B-Sınıf Büyüklüğü 4-lü sınıf 0lu sınıf FAKTÖR A Program Program I Program Program1 A1B1 program AB1 program1 A1B program AB program1 A1B program AB X faktörel dizayn örneği Faktör A ve Faktör B ve ikisinin etkileşimi(axb)ne göre bir çok boş ve alternatif hipotez yazmak mümkündür.
H o : µ A1 = µ A H 1 : µ A1 µ A H o : µ B1 = µ B = µ B H 1 : en azından bir ortalama diğerlerinden farklı H o : A ve B faktörleri arasında bir etkileşim yoktur H 1 : bir faktörün etkisi diğer faktöre bağlı yani faktörler arası bir etkileşim vardır A1 A B1 B 0 0 10 10 A 1 =0 A =10 B1 B 10 0 0 40 B1 B 10 0 0 10 15 5 15 15 B 1 =15 B =15 0 puan fark Fark yok Fark yok Ortalamalara göre hangi faktörler arasında nasıl bir etkileşim olduğu anlaşılabilir 0 0 15 15 Fark yok 4
Gösterim ve Formüller: Toplam değişkenlilik Metotlar arası değişkenlilik Metotlar içi değişkenlilik Faktör A daki değişkenlilk Faktör A daki değişkenlilk Faktör A daki değişkenlilk G:genel toplam değeri N: toplam sayı a :Faktör A b :Faktör B n:her bir metottaki sayı 5
Faktör B B1 B B A1 5 8 6 AB:5 SS:18 9 9 1 6 8 AB:45 SS:6 8 AB:0 SS:0 A1:90 Verilen değerlere ait faktör ANOVA işlemlerini yaparak değerlendiriniz? A 0 0 0 AB:5 SS:8 0 0 0 5 0 AB:5 SS:0 0 7 5 5 AB:0 SS:8 B1:0 B:50 B:40 A:0 N:0, G:10, ΣX =80 6
1.Adım: SS B SSToplam = Σ = ΣX AB n G N G N = 10 = 80 0 5 5 45 + 5 = 40 SS W =ΣSS içinde =SS 1 +SS +SS =18+6+0+8+0+8 =10.Adım: 0 + 5 5 + 5 5 + 5 0 + 5 10 0 = 0 SS toplam =SS W +SS B olduğunu görünüz SS SS SS A A A G = Σ A bn N 90 0 10 = + 15 15 0 = 10 SS SS SS B B B G = Σ an N 0 50 = + + 10 10 = 0 B 40 10 10 0 SS AXB =SS Barası -SS A -SS B =0-10-0 =80 7
Serbestlik derecesi hesapları df toplam =N-1=0-1=9 df içinde = Σ(n-1)=N-ab=0-x=4 df arasında =ab-1=6-1=5 dftoplam=dfiçinde+dfarasında df A =a-1=-1=1 df B =b-1=-1= df AXB =dfarasında-df A -df B =5-1-= veya df AxB =df A xdf B MS=SS/d.f A için MS B için MS AXB için MS MS A =SS A /d.f A =10/1=10 MS B =SS B /d.f B =0/=10 MS AxB =SS AxB /d.f AxB =80/=40 A, B ve AXB için ayrı ayrı F değeri bulunacaktır 8
Faktör A için: MS içinde =SS içinde /d.f içinde =10/4=5 Faktör B için: MS içinde =SS içinde /d.f içinde =10/4=5 F= MS A MS içinde =4 F(1,4)=4 =10/5 F= MS B MS içinde = F(,4)= =10/5 df A df içinde F= MS AXB MS içinde =40/5 df B df içinde =8 F(,4)=8 Eğer bu değerler reddetme bölgesinde ise hipotezdeki H o reddedilir df AxB df içinde 9
ÖDEV Yeme alışkanlığı ile şişmanlık arasındaki ilişkiyi araştırmada normal insanlarla şişmanlardan seçilen örneklerde boş mide-aç- ve dolu midelerle-tok ikenyemek yemeleri incelenmiş ve şu hipotez ortaya atılmıştır şişman kişiler aç veya tok olmaları fark etmeksizin yemeye yönelmektedir. Bunun için rastgele seçilen normal ve şişman kişilerden aç ve tok iken bir tür kraker yemeleri serbest bırakılmış ve kaçar adet kraker yemelerine göre değerlendirme yapılmış aşağıdaki sonuçlar elde edilmiştir. Burada iki bağımsız değişken: ağırlık(normal ve şişman) ve doygunluk (boş ve dolu mide) deneyden önce dolu mideye sahip olmaları için o kişilere istediği kadar yemek yedirilmiş-- Faktör A-doygunluk normal şişman Faktör B(doygunluk) Boş mide Dolu mide n=0 n=0 X= X=15 AB=440 AB=00 SS=1540 SS=170 n=0 n=0 X=17 X=18 AB=40 AB=60 SS=10 SS=166 A1=740 A=700 B1=780 B=660 G=1440 N=80 ΣX =1,86 40
Cevap: Source SS df MS F Betwen treatments 50 Factor A(weight) 0 1 0 0.8 Factor B(doygunluk) 180 1 180.54 AXB interaction 0 1 0 4.51 Within treatments 596 76 71 Total 5916 79 Etkileşim Yorumu Yenilen kraker sayısı Boş mide şişman normal dolu mide 41
ANCOVA Co-variate(birlikte değişken) olarak seçilen bağımsız değişkenin bağımlı değişken üzerine etkisi biliniyor ise diğer bağımsız değişkenlerin bağımlı değişken üzerine etkisini hesaplamak için ANCOVA kullanılmalıdır. Mesela öğrencilerin başarısı bağımlı değişkenimiz olsun, bağımsız değişkenimiz ise öğrencilerin ön bilgileri,cinsiyeti, sosya-ekomomik seviyeleri ve etnik durumları olsun. Araştırmacı öğrencilerin ön bilgilerinin başarıyı etkilediğini bildiği için bu bağımsız değişkeni covariate-birlikte değişken- olarak seçebilir. Bunun avantajı hesaplamalarda covariate olan değişkenin bağımlı değişken üzerindeki etkilerinin çıkarılarak diğerlerinin ne derece etkili olduğunu bulmamızı kolaylaştıracaktır. Bağımsız değişken Bağımlı değişken ANCOVA, ANOVA den fazla 1 tane MANCOVA den fazla veya fazla Faktör analizi nedir? Bütün ANOVA, ANCOVA,MANCOVA hesaplamaları MRC ile bulunabilir. MRC? 4