ANADOLU ÜNİVERSİTESİ ENM 317 MÜHENDİSLİK İSTATİSTİĞİ İYİ UYUM TESTİ Prof.Dr. Nihal ERGİNEL
İYİ UYUM TESTİ Rassal değişkenin olasılık yoğunluk fonksiyonunun ve parametresinin bilinmediği, ancak belirli bir parametre ile ilgili dağılımın test edildiği yöntemdir.
Ki- Kare Testi Bir değişkenin kendi sınıflandırmasına göre, gözlenen frekanslarının teorik(beklenen) frekanslar ile uygunluk gösterip göstermediğinin ortaya konmasıdır. Bir paranın 1000 kez atılması, bir zarın 600 kez atılması, günlük gazete satışlarının dağılımı gibi.
X rassal değişkeninden n birimlik rastgele örnekler alınmış olsun. Bu örneklerin k adet sınıfta histogramı çizilsin. O i : i. Sınıftaki gözlenen frekans (birim sayısı) E i : i. sınıftaki beklenen frekans olmak üzere, Test istatistiği : χ 0 2 = (Bu oranın dağılımı serbestlik derecesi k-p-1 olan yaklaşık χ 2 dağılımıdır. k: sınıf sayısı p: örnekten tahmin edilen parametre sayısı χ 2 yaklaşımı n büyüdükçe gelişir. ) Ki- Kare Testi k (O i E i ) 2 i=1 E i
Ki- Kare Testi Hipotezler : H 0 : Gözlenen ve beklenen frekanslar arasında fark yoktur, eşittir. H a : Gözlenen ve beklenen frekanslar arasında fark vardır. H 0 : Örnek ortalaması., standart sapması olan Normal dağılımdır. H a : Örnek ortalaması., standart sapması olan Normal dağılım değildir. Test istatistiği : χ 0 2 = i=1 k (O i E i ) 2 E i NOT: Eğer gözlenen frekans çok küçük ise, χ 2 dağılımı beklenen ile gözlenen frekansların farkların dağılımını temsil etmez. Eğer gözlenen frekans 3,4,5 gibi küçük sayılar ise bunları uygun sınıflar ile birleştirmek gerekiyor. Karar kuralı: χ 0 2 > χ α,k p 1 2.. H 0 red edilir.
Ki- Kare Testi ÖRNEK-1: Bir bilgisayar programını test etmek için 0-9 arasında 1000 adet rassal tamsayı türetilmiştir. Aşağıdaki tabloda her bir değerden türetilen sayıların adetleri verilmiştir. Buna göre rassal sayı türetimi doğru çalışmakta mıdır? (α =0,05) 0 1 2 3 4 5 6 7 8 9 Gözlenen frekans (O i ) Beklenen frekans (E i ) 94 93 112 101 104 95 100 99 108 94 100 100 100 100 100 100 100 100 100 100
Ki- Kare Testi ÇÖZÜM-1: Hipotezler: H 0 : Rassal sayılar düzgün dağılmıştır. H a : Rassal sayılar düzgün dağılmamıştır. Test istatistiği χ 0 2 = O i E i 2 E i Karar Kuralı χ 0 2 > χ 2 α,k p 1 H 0 red
ÇÖZÜM-1: İşlemler Ki- Kare Testi χ 0 2 = 94 100 2 100 χ 0 2 = 3,72 Sonuç: +.+ 94 100 2 100 i-) χ 0 2 = 3,72 < χ 2 0.05,9= 16,92..H 0 red edilemez. ii-) %95 güven seviyesinde rassal sayılar düzgün dağılmıştır.
Ki- Kare Testi ÖRNEK-2: Bir mağazada bir yıllık televizyon satışları incelenmiş ve aylara göre sayıları aşağıdaki gibi bulunmuştur. Buna göre; mağazanın aylık televizyon satışları arasında fark olup olmadığını bulunuz. α=0,05
Ki- Kare Testi ÇÖZÜM-2: Hipotezler: H 0 : Aylara göre satılan TV sayıları arasında fark yoktur. H a : Aylara göre satılan TV sayıları arasında fark vardır. Test istatistiği χ 0 2 = O i E i 2 E i Karar Kuralı χ 0 2 >χ 2 α,k p 1 H 0 red
ÇÖZÜM-2: İşlemler: Ki- Kare Testi Beklenen TV satış sayısı= 276 12 = 23 adet TV satışları E 1 = E 2 =..= E 12 = 23 χ 0 2 = 18 23 2 23 Sonuç: = 15,3 + 19 23 2 23 +.+ 21 23 2 23 i-) χ 0 2 = 15,3 < χ 2 0,05;10 = 18,3..H 0 red edilemez. ii-) %95 güven seviyesinde aylara göre TV satışı arasında fark yoktur.
ÖRNEK-3: Sınıflar (paket ağırlıkları gr) Frekans 94 X < 96 100 96 X < 98 200 98 X < 100 500 100 X < 102 150 102 X < 104 40 104 X < 106 10 Ki- Kare Testi Paket ağırlıklarına ilişkin yapılan bir çalışma için 1000 adet örnek alınmış ve ortalaması 99gr, standart sapması 1,63 gr olarak örnekten bulunmuştur. Paket ağırlıkları sınıflandırılmış ve aşağıda verilmiştir. Buna göre paket ağırlıklarının verilen ortalama ve standart sapma ile normal dağılıp dağılmadığını %99,5 güven seviyesinde test ediniz.
Ki- Kare Testi ÇÖZÜM-3: Hipotezler: H 0 : Paket ağırlıkları (99;2,66) ile Normal dağılmaktadır. H a : Paket ağırlıkları (99;2,66) ile Normal dağılmamaktadır. Test istatistiği χ 0 2 = O i E i 2 E i Karar Kuralı χ 0 2 > χ 2 α,k p 1 H 0 red
ÇÖZÜM-3: Ki- Kare Testi P 1 = P(94<X<96)= P( 94 99 1,63 = 0,4989-0,4671 = 0,0318 <z< 96 99 1,63 ) = P(-3,067<z<-1,84) P 2 = P(96<X98) = P(-1,84<z<-0,61) = 0,4671-0,2291= 0,238
ÇÖZÜM-3: Sonuç: i-) χ 0 2 = 195,94 > χ 2 0,005; 2=10,6.H 0 red ii-) %99,5 güven seviyesinde paket ağırlıkları (99;2,66) ile normal dağılmamaktadır.
Kolmogorov Smirnov Testi Gözlenen frekanslar ile beklenen frekansların birbirlerine ne düzeyde benzeştiğine dayanır. Ancak burada her gözlenen ve beklenen frekans yerine, birikimli frekansların dağılımının birbirine benzeşimi araştırılır.
Kolmogorov Smirnov Testi F(x)= P(X x) x rassal değişken değerinin χ değerine eşit ya da ondan küçük olması olasılığı ) H o hipotezi ile her sınıfa düşen birikimli frekansların gözlenen-beklenen büyüklüklerinin birbirine eşit olduğu, aralarındaki farkın (D değerleri) tesadüfen ortaya çıkabilecek derecede küçük, önemsiz farklar olduğu biçimindedir. D değerlerine ilişkin olasılıklar tablolaştırılmıştır. D 0 = max F 0 x S n (x) F 0 x =Beklenen birikimli frekans oranı S n (x) = Gözlenen birikimli frekans oranı
Kolmogorov Smirnov Testi Hipotezler : H 0 : Gözlenen ve beklenen frekanslar arasında fark yoktur, eşittir. H a : Gözlenen ve beklenen frekanslar arasında fark vardır. Test istatistiği: D 0 = max F 0 x S n (x) Karar kuralı: D 0 > D α;n..h 0 red
Kolmogorov Smirnov Testi ÖRNEK-1: Satış teknikleri ile ilgili bir çalışmada, ürün tercihlerine rafların etkisinin olup olmadığı araştırılmaktadır. Aynı ürün 5 rafa yerleştirilmiş ve alınan ürün miktarları gözlemlenmiştir. Buna göre rafların konumunun ürün tercihinde farklılık yaratıp yaratmadığını α= 0,05 anlam düzeyinde test ediniz. Raflar Ürün miktarı 1 0 2 2 3 0 4 10 5 8
Kolmogorov Smirnov Testi ÇÖZÜM-1: Hipotezler : H 0 : Beş raftaki alıcı sayıları arasında fark yoktur, eşittir. H a : Beş raftaki alıcı sayıları arasında fark vardır. Test istatistiği: D 0 = max F 0 x S n (x) Karar kuralı: D 0 > D α;n..h 0 red
Kolmogorov Smirnov Testi ÇÖZÜM-1: Raf no O İ E İ S 20 (x) F 0 (x) D 1 0 4 0/20=0 4/20=0,2 0,2 2 2 4 2/20=0,1 8/20=0,4 0,3 3 0 4 2/20=0,1 12/20=0,6 0,5 4 10 4 12/20=0,6 16/20=0,8 0,2 5 8 4 20/20=1 20/20=1 0 20 D 0 = max F 0 x S n (x) = O,5
Kolmogorov Smirnov Testi ÇÖZÜM-1: Sonuç: i-) D 0 = 0,5 >D 0,05;20 =0,294.H 0 red edilir. ii-) % 95 güven seviyesinde raf konumları arasındaki farkların ürün tercihlerine etkisi vardır.
Bağımsızlık Testi χ 2 Testi: İki değişken arasında bir ilişki söz konusu ise, bu ilişkinin varlığını ortaya koymak üzere Bağımsızlık testi adı altında χ 2 testi kullanılır. Bir ana kütleden alınan n birimlik örnek iki farklı kritere göre sınıflandırılmış olabilir. Bu test iki kriterin birbirleri ile istatistiksel olarak bağımsızlığının olup olmadığını ortaya koyar.
Bağımsızlık Testi- χ 2 Testi Örnek olarak, futbol maçı izleme ile cinsiyetin ilişkisinin olup olmadığı (bağımlılık bulunup bulunmadığı) ; televizyonda tercih edilen program türü ile öğrenim düzeyi arasında bir bağlantı olup olmadığı; çocuk sayısı ile annenin çalışma durumu, trafik cezaları ile bayan/erkek sürücü arasında bağlantı olup olmadığı gibi. Kriterler 1 2.. C 1 O 11 /E 11 O 12 /E 12 O 1c 2 O 21 /E 21.... r O rn O rc /E rc
Bağımsızlık Testi- χ 2 Testi Hipotezler: H 0 : 1. Kriter ile 2. Kriter birbirinden bağımsızdır. H a : 1. Kriter ile 2. Kriter birbirinden bağımlıdır. Test istatistiği: χ o 2 = r c (O ij E ij ) 2 i=1 j=1 E ij Karar kuralı: χ o 2 > χ 2 α;(r 1)(c 1) H 0 red
ÖRNEK-1: Bağımsızlık Testi- χ 2 Testi Bir firmada 3 farklı emekli planı bulunmaktadır. Bu emekli planları tercihleri ile kişilerin saat ücretli ve maaşlı çalışması arasında ilişki olup olmadığını, yani iki kriterin birbirinden bağımsız olup olmadığını α=0,05 anlam düzeyinde test ediniz. EM1 EM2 EM3 Toplam Maaşlı 160 140 40 340 Saat ücretli 40 60 60 160 Toplam 200 200 100 500
ÇÖZÜM-1: Hipotezler: H 0 : Çalışma şekli ile tercih edilen emekli planı birbirinden bağımsızdır. H a : Çalışma şekli ile tercih edilen emekli planı birbirine bağımlıdır. Test istatistiği: χ o 2 = Karar kuralı: r c (O ij E ij ) 2 i=1 j=1 E ij Bağımsızlık Testi- χ 2 Testi χ o 2 > χ 2 α;r 1;c 1 H 0 red
Bağımsızlık Testi- χ 2 Testi ÇÖZÜM-1: İşlemler: Beklenen değer= 500 340 500 * 200 500 * = 136 EM1 EM2 EM3 Toplam Maaşlı 160/136 140/136 40/68 340 Saat ücretli 40/64 60/64 60/32 160 Toplam 200 200 100 500 χ o 2 = (160 136)2 136 + (140 136)2 136 + + (60 32)2 32 = 49,63 Sonuç: i-) χ o 2 =49,63 > χ 2 0,05;2 = 5,99 H 0 red ii-) Çalışma şekli ile tercih edilen emekli planı birbirine bağımlıdır.
Homojenlik Testi Bağımsızlık testinde aynı ana kütleden çekilmiş örnekler söz konusu iken, homojenlik testinde n 1, n 2,.. büyüklüğündeki örneklerin farklı ana kütleden çekilmiş olması söz konusudur.
Homojenlik Testi Hipotezler: H 0 : Sayılar kriterlere homojen dağılmışlardır. H a : Sayılar kriterlere homojen dağılmamışlardır. Test istatistiği: χ o 2 = r c (O ij E ij ) 2 i=1 j=1 E ij Karar kuralı: χ o 2 > χ 2 α;r 1;c 1 H 0 red
Homojenlik Testi ÖRNEK-1: Farklı fakültelerde okuyan öğrencilerin, tiyatroya gidiş sıklıklarının aynı olup olmadığı incelemek istenmiştir. Bu amaçla Fen fakültesinden 40 öğrenci, İİBF den 42 öğrenci, İletişim fakültesinden 38 öğrenciye tiyatroya gidiş sıklığı sorulmuştur. Tablodaki verilere göre öğrencilerin, tiyatroya gidiş sıklıklarının homojen dağılıp dağılmadığını analiz ediniz. (α=0,05) Fen İİBF İletişim Toplam Sık 6 16 36 Seyrek 25 22 17 64 Hiç 9 6 5 20 Toplam 40 42 38 120
ÇÖZÜM-1: Hipotezler: H 0 :Öğrencilerin tiyatroya gidiş sıklıkları fakültelere homojen dağılmıştır. H a : Öğrencilerin tiyatroya gidiş sıklıkları fakültelere homojen dağılmamıştır. Test istatistiği: χ o 2 = Sonuç: Homojenlik Testi r c (O ij E ij ) 2 i=1 j=1 E ij Fen İİBF İletişim Toplam Sık 6/12 16/11,4 36 Seyrek 25/21,3 22/22,4 17/20,3 64 Hiç 9/6,7 6/7 5/6,3 20 Toplam 40 42 38 120 i-) χ o 2 =7,4 < χ 0,05;4 2 = 9,49 H 0 red edilemez ii-) %5 anlam seviyesinde farklı fakülte öğrencilerin tiyatroya gidiş sıklığı aynıdır.