ANADOLU ÜNİVERSİTESİ ENM 317 MÜHENDİSLİK İSTATİSTİĞİ İYİ UYUM TESTİ Prof.Dr. Nihal ERGİNEL İYİ UYUM TESTİ Rassal değişkenin olasılık yoğunluk fonksiyonunun ve parametresinin bilinmediği, ancak belirli bir parametre ile ilgili dağılımın test edildiği yöntemdir. Bir değişkenin kendi sınıflandırmasına göre, gözlenen frekanslarının teorik(beklenen) frekanslar ile uygunluk gösterip göstermediğinin ortaya konmasıdır. Bir paranın 1000 kez atılması, bir zarın 600 kez atılması, günlük gazete satışlarının dağılımı gibi.
X rassal değişkeninden n birimlik rastgele örnekler alınmış olsun. Bu örneklerin k adet sınıfta histogramı çizilsin. : i. Sınıftaki gözlenen frekans (birim sayısı) : i. sınıftaki beklenen frekans olmak üzere, Test istatistiği : (Bu oranın dağılımı serbestlik derecesi k-p-1 olan yaklaşık k: sınıf sayısı p: örnekten tahmin edilen parametre sayısı yaklaşımı n büyüdükçe gelişir. ) dağılımıdır. Hipotezler : : Gözlenen ve beklenen frekanslar arasında fark yoktur, eşittir. : Gözlenen ve beklenen frekanslar arasında fark vardır. : Örnek ortalaması., standart sapması olan Normal dağılımdır. : Örnek ortalaması., standart sapması olan Normal dağılım değildir. Test istatistiği : >.. red edilir. NOT: Eğer gözlenen frekans çok küçük ise, dağılımı beklenen ile gözlenen frekansların farkların dağılımını temsil etmez. Eğer gözlenen frekans 3,4,5 gibi küçük sayılar ise bunları uygun sınıflar ile birleştirmek gerekiyor. ÖRNEK-1: Bir bilgisayar programını test etmek için 0-9 arasında 1000 adet rassal tamsayı türetilmiştir. Aşağıdaki tabloda her bir değerden türetilen sayıların adetleri verilmiştir. Buna göre rassal sayı türetimi doğru çalışmakta mıdır? (α 0,05) 0 1 2 3 4 5 6 7 8 9 Gözlenen 94 93 112 101 104 95 100 99 108 94 frekans ( ) Beklenen frekans ( ) 100 100 100 100 100 100 100 100 100 100
: Rassal sayılar düzgün dağılmıştır. : Rassal sayılar düzgün dağılmamıştır. Test istatistiği Karar Kuralı İşlemler +.+ 3,72 i-) 3,72 < 16,92.. red edilemez. ii-) %95 güven seviyesinde rassal sayılar düzgün dağılmıştır. ÖRNEK-2: Bir mağazada bir yıllık televizyon satışları incelenmiş ve aylara göre sayıları aşağıdaki gibi bulunmuştur. Buna göre; mağazanın aylık televizyon satışları arasında fark olup olmadığını bulunuz. α0,05
ÇÖZÜM-2: : Aylara göre satılan TV sayıları arasında fark yoktur. : Aylara göre satılan TV sayıları arasında fark vardır. Test istatistiği Karar Kuralı ÇÖZÜM-2: İşlemler: Beklenen TV satış sayısı 23 adet TV satışları.. 23 + +.+ 15,3 i-) 15,3 < 18,3.. red edilemez. ii-) %95 güven seviyesinde aylara göre TV satışı arasında fark yoktur. ÖRNEK-3: Sınıflar (paket ağırlıkları gr) Frekans 94 X < 96 100 96 X < 98 200 98 X < 100 500 100 X < 102 150 102 X < 104 40 104 X < 106 10 Paket ağırlıklarına ilişkin yapılan bir çalışma için 1000 adet örnek alınmış ve ortalaması 99gr, standart sapması 1,63 gr olarak örnekten bulunmuştur. Paket ağırlıkları sınıflandırılmış ve aşağıda verilmiştir. Buna göre paket ağırlıklarının verilen ortalama ve standart sapma ile normal dağılıp dağılmadığını %99,5 güven seviyesinde test ediniz.
ÇÖZÜM-3: : Paket ağırlıkları (99;2,66) ile Normal dağılmaktadır. : Paket ağırlıkları (99;2,66) ile Normal dağılmamaktadır. Test istatistiği Karar Kuralı ÇÖZÜM-3: P(94<X<96) P( <z< ) P(-3,067<z<-1,84) 0,4989-0,4671 0,0318 P(96<X98) P(-1,84<z<-0,61) 0,4671-0,2291 0,238 ÇÖZÜM-3: i-) 195,94 > 10,6. red ii-) %99,5 güven seviyesinde paket ağırlıkları (99;2,66) ile normal dağılmamaktadır.
Gözlenen frekanslar ile beklenen frekansların birbirlerine ne düzeyde benzeştiğine dayanır. Ancak burada her gözlenen ve beklenen frekans yerine, birikimli frekansların dağılımının birbirine benzeşimi araştırılır. F(x) P( x) x rassal değişken değerinin χ değerine eşit ya da ondan küçük olması olasılığı ) hipotezi ile her sınıfa düşen birikimli frekansların gözlenen-beklenen büyüklüklerinin birbirine eşit olduğu, aralarındaki farkın (D değerleri) tesadüfen ortaya çıkabilecek derecede küçük, önemsiz farklar olduğu biçimindedir. D değerlerine ilişkin olasılıklar tablolaştırılmıştır. max Beklenen birikimli frekans oranı ) Gözlenen birikimli frekans oranı Hipotezler : : Gözlenen ve beklenen frekanslar arasında fark yoktur, eşittir. : Gözlenen ve beklenen frekanslar arasında fark vardır. max >.. red
ÖRNEK-1: Satış teknikleri ile ilgili bir çalışmada, ürün tercihlerine rafların etkisinin olup olmadığı araştırılmaktadır. Aynı ürün 5 rafa yerleştirilmiş ve alınan ürün miktarları gözlemlenmiştir. Buna göre rafların konumunun ürün tercihinde farklılık yaratıp yaratmadığını α 0,05 anlam düzeyinde test ediniz. Raflar Ürün miktarı 1 0 2 2 3 0 4 10 5 8 Hipotezler : : Beş raftaki alıcı sayıları arasında fark yoktur, eşittir. : Beş raftaki alıcı sayıları arasında fark vardır. max >.. red Raf no D 1 0 4 0/200 4/200,2 0,2 2 2 4 2/200,1 8/200,4 0,3 3 0 4 2/200,1 12/200,6 0,5 4 10 4 12/200,6 16/200,8 0,2 5 8 4 20/201 20/201 0 20 max O,5
i-) 0,5 > 0,294. red edilir. ii-) % 95 güven seviyesinde raf konumları arasındaki farkların ürün tercihlerine etkisi vardır. Testi: Bağımsızlık Testi İki değişken arasında bir ilişki söz konusu ise, bu ilişkinin varlığını ortaya koymak üzere Bağımsızlık testi adı altında testi kullanılır. Bir ana kütleden alınan n birimlik örnek iki farklı kritere göre sınıflandırılmış olabilir. Bu test iki kriterin birbirleri ile istatistiksel olarak bağımsızlığının olup olmadığını ortaya koyar. Bağımsızlık Testi- Örnek olarak, futbol maçı izleme ile cinsiyetin ilişkisinin olup olmadığı (bağımlılık bulunup bulunmadığı) ; televizyonda tercih edilen program türü ile öğrenim düzeyi arasında bir bağlantı olup olmadığı; çocuk sayısı ile annenin çalışma durumu, trafik cezaları ile bayan/erkek sürücü arasında bağlantı olup olmadığı gibi. Testi Kriterler 1 2.. C 1 /E 11 /E 12 2 /E 21.... r /E rc
Bağımsızlık Testi- Testi : 1. Kriter ile 2. Kriter birbirinden bağımsızdır. : 1. Kriter ile 2. Kriter birbirinden bağımlıdır. ÖRNEK-1: Bağımsızlık Testi- Testi Bir firmada 3 farklı emekli planı bulunmaktadır. Bu emekli planları tercihleri ile kişilerin saat ücretli ve maaşlı çalışması arasında ilişki olup olmadığını, yani iki kriterin birbirinden bağımsız olup olmadığını α0,05 anlam düzeyinde test ediniz. EM1 EM2 EM3 Toplam Maaşlı 160 140 40 340 Saat ücretli 40 60 60 160 Toplam 200 200 100 500 Bağımsızlık Testi- Testi : Çalışma şekli ile tercih edilen emekli planı birbirinden bağımsızdır. : Çalışma şekli ile tercih edilen emekli planı birbirine bağımlıdır.
İşlemler: Beklenen değer 500 * * 136 Bağımsızlık Testi- + + + 49,63 i-) 49,63 > 5,99 red ii-) Çalışma şekli ile tercih edilen emekli planı birbirine bağımlıdır. Testi EM1 EM2 EM3 Toplam Maaşlı 160/136 140/136 40/68 340 Saat ücretli 40/64 60/64 60/32 160 Toplam 200 200 100 500 Homojenlik Testi Bağımsızlık testinde aynı ana kütleden çekilmiş örnekler söz konusu iken, homojenlik testinde,,.. büyüklüğündeki örneklerin farklı ana kütleden çekilmiş olması söz konusudur. Homojenlik Testi : Sayılar kriterlere homojen dağılmışlardır. : Sayılar kriterlere homojen dağılmamışlardır.
ÖRNEK-1: Homojenlik Testi Farklı fakültelerde okuyan öğrencilerin, tiyatroya gidiş sıklıklarının aynı olup olmadığı incelemek istenmiştir. Bu amaçla Fen fakültesinden 40 öğrenci, İİBF den 42 öğrenci, İletişim fakültesinden 38 öğrenciye tiyatroya gidiş sıklığı sorulmuştur. Tablodaki verilere göre öğrencilerin, tiyatroya gidiş sıklıklarının homojen dağılıp dağılmadığını analiz ediniz. (α0,05) Fen İİBF İletişim Toplam Sık 6 16 36 Seyrek 25 22 17 64 Hiç 9 6 5 20 Toplam 40 42 38 120 :Öğrencilerin tiyatroya gidiş sıklıkları fakültelere homojen dağılmıştır. : Öğrencilerin tiyatroya gidiş sıklıkları fakültelere homojen dağılmamıştır. Homojenlik Testi Fen İİBF İletişim Toplam Sık 6/12 16/11,4 36 Seyrek 25/21,3 22/22,4 17/20,3 64 Hiç 9/6,7 6/7 5/6,3 20 Toplam 40 42 38 120 i-) 7,4 < 9,49 red edilemez ii-) %5 anlam seviyesinde farklı fakülte öğrencilerin tiyatroya gidiş sıklığı aynıdır.