EME 35 Girdi Analizi Prosedürü Sistem Simülasyonu Modellenecek sistemi (prosesi) dokümante et Veri toplamak için bir plan geliştir Veri topla Verilerin grafiksel ve istatistiksel analizini yap Dağılıma İyi Uyum Testleri Ders Olası dağılımları hipotez et Dağılımların parametrelerini tahmin et Hipotezlenen dağılımların uygunluğunu kontrol et Simulasyon çıktıları üzerinde girdilerin duyarlılığını kontrol et Dağılıma Uyumun Kontrol Edilmesi Olasılık Çizgesi 3 4 Dağılımının ne olduğunu bilmediğiniz bir ana kitleden (populasyon) alınan n birimlik örnekleminiz olduğunu varsayalım. Veri grubunun hipotezlenen bir dağılıma uyup uymadığını nasıl kontrol edebiliriz? İyi uyum testleriyle Grafiksel olarak olasılık çizgeleriyle
5 Dağılıma Uyum Testleri Uyum testleri, verilerin seçilen dağılıma ne kadar iyi uyduğunu gösterir. Verilerin uyumu, χ Ki-kare ( ) (Kesikli ve Sürekli dağılımlar) Kolmogorov Smirnov (Sadece Sürekli dağılımlar) Anderson Darling (Sadece Sürekli dağılımlar) testleriyle kontrol edilir. Bir Hipotezin Testi Belirli bir hipotez hakkında bir karara yol açan bir prosedürdür. Hipotez testi prosedürü, kitleden alınan bir rasgele örneklemdeki bilginin kullanılmasına dayanır. Eğer bu bilgi hipotezle tutarlı ise, hipotezin doğru olduğu sonucuna; eğer bu bilgi hipotez ile tutarlı değilse, hipotezin yanlış olduğu kararına varırız. Hipotez Testinin Adımları. Problemin içeriğinden ilgili parametreyi tanımla.. Sıfır Hipotezini (H )ifade et. 3. Uygun bir alternatif hipotez (H ) belirt. 4. Bir anlam düzeyi (önem düzeyi) α seç. 5. Uygun bir test İstatistiği belirle. 6. İstatistik için red bölgesini belirle. 7. Herhangi bir gerekli örneklem miktarı hesapla, bunları test istatistiği için denklemde yerine koy ve bu değeri hesapla. 8. H ın reddedilip reddedilmeyeceğine karar ver ve problem bağlamında bunu rapor et. Ki-kare ( χ ) İyi Uyum Testi H : Örneklem verileri hipotezlenen dağılıma uyar. H : Örneklem verileri hipotezlenen dağılıma uymaz. Test, Ki-kare dağılımına dayanır. G i, i. sınıf aralığında gözlenen frekans, B i, i. sınıf aralığında beklenen frekans olsun. Test İstatistiği: χ = i= f (x) χn α,v α χ x α, α,v n (b) k ( G i B i ) B i
Hipotez Testlerinde I.Tip ve II.Tip lar H doğru olduğu halde reddedildiğinde I. Tip yapılır. H yanlış olduğu halde kabul edildiğinde II.Tip yapılır. H Kabul KARAR H Red H Doğru Doğru Karar I. Tip H Yanlış II. Tip Doğru Karar α=p(h red H doğru)=p(i.tip ) β=p(h kabul H yanlış)=p(ii. Tip ) Örnek Testing for Goodness of Fit Belli bir ebattaki metal levha üzerindeki hata sayılarının Poisson dağılımına uyup, uymadığını araştıralım. 6 birimlik rassal örneklem alınmış ve aşağıda verilen hata sayıları gözlenmiştir. Gözlenen f i x SORU: Poisson Dağılımının Parametresini i nasıl i E[X] = λ = ** Bu örnekte, varsayılan Poisson tahmin edersiniz? f i dağılımının ortalaması bilinmemektedir, i ve örneklem verisinden tahmin edilmelidir. 3. +5.+ 9. + 4.3 = =.75 6 Örnek (devam) Örnek (devam) Example 9- Hipotezlenen λ=.75 hata/levha parametreli Poisson dağılımından i. sınıf aralığıyla ilgili p i olasılıklarını aşağıdaki gibi hesaplayabiliriz. Beklenen frekansları hesaplamak için örneklem büyüklüğü n=6 ve p i olasılıkları çarpılır. B i =n.p i f (x) = P(X = x) = e λ λ x x! x =,,,... Olasılık Beklenen.47*(6) (veya daha fazla) Eğer beklenen frekans 5 ten küçükse, önceki sınıfla birleştir: Gozlenen Beklenen (veya daha fazla) 3
Örnek (devam) Normal Dağılıma Sahip Bir Kitlenin Varyans χ.5, = 3.84 ve Standart Sapması İçin Hipotez Testi α=.5 anlam düzeyi seçerek 8 adımlı hipotez testi prosedürünü uygulayalım:. İlgili değişken, levha üzerindeki hata sayısının dağılımının uyumudur.. H : Lavha üzerindeki hata sayısı Poisson dağılımına uyar. 3. H : Levha üzerindeki hata sayısı Poisson dağılımına uymaz. 4. α=.5 5. Test İstatistigi: χ = Eğer H doğruysa, χ nin, k-p- serbestlik dereceli ki-kare dağılımına uyduğu gösterilebilir p: Hipotez edilen dağılımın parametre sayısı, k: Sınıf sayısıdır. k ( G i B i ) i= B i Örnek (devam) 6. Eger χ > χ.5, = 3.84 ise H red 7. Hesaplamalar: 3 8.3 χ = ( ) 5.4 + 8.3.4 ( ) + ( 3.44) =.94.44 8. SORU: Sonuclar: Testin sonucu ne olur? χ =.94 < χ.5, = 3.84 oldugu icin levha üzerindeki hata sayısının Poisson dagılımına uyduguna iliskin H hipotezini reddecek yeterli istatistiksel kanıt yoktur. n P-Değeri Yaklaşımı H ı reddetme kriteri olarak α nın kullanımı; H ın zayıf bir şekilde mi yoksa güçlü bir şekilde mi reddedildiğini söylemez. Bunu bilmek için P-Değeri yaklaşımını kullanırız: Tanım P değeri, verilen veriyle (H ) sıfır hipotezinin reddedilmesine yol açan en küçük anlam seviyesidir. P = P χ ( > χ ) ( χ Uyum testi icin) 4
f (x) P-Değeri Yaklaşımı χ n α,v χ α, n =.94 (b) P α x 3 8.3 χ = ( ) 8.3 =.94 P = P χ > χ.94 5.4 + ( ).4 + ( 3.44).44 ( ) = P( χ >.94) =? Örnekte, χ =.94 dir ve bu, tablodaki,7 ve 3,84 değerleri arasındadır. Bu nedenle, P değeri,.5 ve. arasında olmalıdır..5 < P <. Cumulative Distribution Function Chi-Square with DF x P( X <= x ),94,93589 P değeri=-,93589,86 Örnek (devam) H Kabul P=.86 H Red Test kriteri: P degeri > α ise H 'ı reddetme SORU: Testin P sonucu degeri α ise ne H olur? 'ı reddet Sonuç: α=.5<p=.86 olduğundan H Kabul 5