GİRDİ OLASILIK DAĞILIMININ SEÇİMİ ENM 36 BENZETİM DERS 4 GİRDİ OLASILIK DAĞILIMININ SEÇİMİ GİRDİ OLASILIK DAĞILIMININ SEÇİMİ Vrışlr rsı zmnlr vey tlep genişlikleri gibi rssl girdileri kullnn bir benzetimi gerçekleştirmek için, bu girdilerin olsılık dğılımlrının belirlenmesi gerekir. Bir benzetim modeline girdi rssl değişkenlerini temsil eden özel dğılımlr verildiğinde, benzetimin zmn boyunc çlışmsınd bu dğılımlrdn üretilen rssl değerler kullnılır. Bir benzetim, olsılık dğılımlrı ile sistemin her bir rssllık kynğının gösterilmesi gerekir. Prtikte krşımız çıkn sistemler bir y d dh fzl rssllık kynğın shiptirler. Girdiler için uygun dğılımlrın belirlenmesi, bir benzetim çlışmsının en önemli şmlrındn birisidir. Girdilerdeki htlı kbuller ( ynlış bir dğılımın seçimi gibi), sistem hkkınd kötü krrlrın verilmesinin sğlyn çıktılrın elde edilmesine sebep olur. Girdi dğılımlrının belirlenmesinde 4 dım: ) Verinin toplnmsı ) Dğılım ilesinin seçimi (üstel, norml vb.) 3) Prmetre thmini 4) Uygunluk testi Uygunluk testi ile seçilen dğılım kbul edilmez ise,. dım geri dönülür ve frklı bir dğılım seçilerek prosedür tekrrlnılır. Toplnn veri bilinen dğılımlrdn hiçbirine uymuyor ise, AMPİRİK DAĞILIM tnımlmsı ypılır.
VERİNİN TOPLANMASI İncelenen sistem için, bir benzetim modeli geliştirildikten sonrki dım, modelde kullnılck girdiler için sistemden verilerin toplnmsıdır. Veri toplmd şğıdki kurllr uyulmsı gerekir; - Sistem önceden gözlemlenmeli ve hngi verilerin toplnmsı gerektiğine, hngi zmnlrd verinin toplncğın krr verilmelidir. Veri toplmk için gerekli formlr hzırlnmlıdır. Nokt İsttistikleri: DAĞILIM AİLESİNİN SEÇİMİ Bzı özel dğılımlr özel isttistik değerlere shiptir. Bu isttistikler dtdn (veriden) elde edilir ve teorik dğılımın nokt isttistikleri ile krşılştırılır. - Girdi dğılımını belirlemek için yeterli verinin toplnmsı gerekir. 3- Sistemi iyi temsil edecek şekilde veri (homoen veri) toplnmlıdır. Bu nedenle, rdışık günlerin ynı zmn periyotlrınd ve ynı günün rdışık zmn periyotlrınd veriler toplnrk verinin homoenliği kontrol edilmelidir. Homoenliği kontrol etmek için kullnıln bir test örnekli t-testi dir. Bu test ile dğılımlrın ortlmlrının eşit olup olmdığı test edilir. 4- İki değişken rsınd bir ilişkinin olup olmdığının belirlenmesi gerekir. Sctter diygrmlrı kullnılrk ilişkinin vrlığı gözlemlenebilir. Regresyon nlizi de değişkenler rsınd ilişkinin belirlenmesinde kullnılmktdır. ) Ortlm, Medyn ve Vryns -Mod < Medyn < Ortlm ise dğılım SAĞA ÇARPIK -Mod > Medyn > Ortlm ise dğılım SOLA ÇARPIK DAĞILIM AİLESİNİN SEÇİMİ DAĞILIM AİLESİNİN SEÇİMİ Dğılım ilesinin seçiminde; nokt isttistikleri, ortlm, medyn, vryns değişim ktsyısı ve Lexis ornı Çrpıklık ve bsıklık ktsyısı histogrmlrdn yrrlnılır. b) Değişim Ktsyısı ve Lexis Ornı: Değişim ktsyısı, sürekli dğılımın şekli hkkınd bilgi shibi olmmızı sğlr. ˆ δ = s ( x) x δ = β β = x, x,..., Üstel dğılım için δˆ değeri e ykın ise, dğılımın üstel olduğunu gösterir. x n
DAĞILIM AİLESİNİN SEÇİMİ DAĞILIM AİLESİNİN SEÇİMİ Bzı sürekli dğılımlr için değişim ktsyısı c) Çrpıklık ve Bsıklık Ktsyısı: Çrpıklık ktsyısı, bir dğılımın simetriliğinin bir ölçüsüdür. = 0 ise dgilim simetrik 3 > 0ise dgilimsg crpiktir 3 < 0isedgilimsol crpiktir 3 Norml dğılım; = 0 3 Üstel dğılım; = 3 DAĞILIM AİLESİNİN SEÇİMİ DAĞILIM AİLESİNİN SEÇİMİ Lexis ornı; kesikli dğılımlr için kullnılır. Değişim ktsyısı ile ynı işleve shiptir. Bsıklık ktsyısı, dğılımın X eksenine ykınlığının bir ölçüsüdür. 4 E[( x µ ) ] 4 = ( σ ) n 4 [ X i x( n) ] / n i= ˆ 4 = ( s ( n)) Norml dğılım; = 3 4 Uniform dğılım; =.8 4 Üstel dğılım; 4 = 9
DAĞILIM AİLESİNİN SEÇİMİ DAĞILIM AİLESİNİN SEÇİMİ Histogrm: Bir histogrm, toplnn verinin (X,X,,X n ) dğılımı ile ilgili olsılık fonksiyonunun grfiksel thminidir. Bir histogrm, veri için bir model olrk rştırıln dğılımlr ile ilgili iyi bir ipucu verir. Veriden yrrlnılrk çizilen histogrm, teorik dğılımın şekliyle krşılştırılır. X,X,,X n gözlemler olsun. Gözlemler küçükten büyüğe sırlnır. X (),X (),,X (n) Açıklık (R= X (n) -X ()) eşit uzunlukt k rlığ bölünür. [ b0, b ],[ b, b ],...,[ b k, bk ] b = b b h :[b -, b ] :. rlığ düşen gözlemlerin ornı DAĞILIM AİLESİNİN SEÇİMİ PARAMETRE TAHMİNİ Arlık genişliğinin belirlenmesi Bir histogrmın çiziminde rlık genişliğinin belirlenmesi önemlidir. Arlık genişliğinin çok büyük y d küçük lınmsı ile çizilen histogrm, verinin hngi dğılımdn geldiğine dir iyi bir bilgi vermez. Bu nedenle frklı rlık genişliği değerleri için histogrm çizilerek, stndrt dğılımlrdn birisinin yoğunluk fonksiyonun benzeyen histogrm seçilmelidir. Arlık syısının belirlenmesi Montgomery e göre rlık syısı : n Blnk e göre rlık syısı; n < 50 ise 0-0 n > 50 ise 6-0 [ Mx deg er] [ Min deg er] b = Arlik syisi Veriler için uygun bir (y d birkç) dğılım belirlendikten sonr, bu dğılımın benzetimde kullnımı için prmetre değerlerinin belirlenmesi gerekir. Elde edilen X,X,,X n verileri, dğılımın prmetrelerinin thmin edilmesi için kullnılır. Bir thminci, verinin nümerik bir fonksiyonudur. Bir dğılımın prmetresinin ( y d prmetrelerini) thmin etmek için kullnıln çeşitli metotlr vrdır. Bunlr; ) Mximum Likelihood thmin edici (MLE) ) En küçük kreler thmin edici 3) Moment metodu
PARAMETRE TAHMİNİ PARAMETRE TAHMİNİ Kesikli Dğılım: Veriye giydirilen dğılımın bir kesikli dğılım olduğunu kbul edilsin. Bu dğılımın bir prmetresi olsun. θ : Dğılımın prmetresi p θ (x): Dğılımın olsılık fonksiyonu X,X,,X n : : gözlemlenen veriler Likelihood fonksiyonu, L(θ), şğıdki gibi tnımlnır. L(θ)= p θ (X ). p θ (X ). p θ (X 3 ) p θ (X n ) L(θ); veriler bğımsız olduğundn dolyı bileşik olsılık fonksiyonu dur. θ : bilinmeyen prmetrenin değeri ise, L(θ); gözlemlenen verinin elde edilme olsılığını verir. Örnek: Bernoulli dğılımın prmetresini MLE ile thmin ediniz. PARAMETRE TAHMİNİ θ nın bilinmeyen değerinin MLE; L(θ) yı mksimize eden değer olrk tnımlnır. i) ln L L(θ) ; (logritm fonksiyonu rtn bir fonksiyon olduğundn, L(θ) nın mksimizsyonu ln L(θ) nın mksimizsyonun eşdeğerdir. Hesplmsı dh kolydır. ) ln L( θ ) ii) = 0 ˆ θ elde edilir. ( θ )
PARAMETRE TAHMİNİ Sürekli Dğılım: Veriye giydirilen dğılımın bir sürekli dğılım olduğunu kbul edilsin. θ : Dğılımın prmetresi f θ (x): Dğılımın olsılık yoğunluk fonksiyonu Likelihood fonksiyonu, L(θ), şğıdki gibi tnımlnır. L(θ)= f θ (X ). f θ (X ). f θ (X 3 ) f θ (X n ) lnl(θ) lınır ln L( θ ) = 0 ile θ prmetresi thmin edilir. θ PARAMETRE TAHMİNİ Örnek: Üstel dğılımın prmetresini, β, MLE ile thmin edilmesi. e f ( x) = β 0 x β x > 0, β > 0 dd Uygunluk testi, X,X,,X n gözlemlerinin Fˆ dğılım fonksiyonu ile özel bir dğılımdn bğımsız örnekler olup olmdığını belirlemek için kullnıln bir isttistiksel hipotez testidir. Bir uygunluk testi, şğıdki hipotezi test etmek için kullnılır. H 0 : X i gözlemleri, Fˆ dğılım fonksiyonu ile bğımsız özdeş dğılmış rssl değişkenlerdir.
i) Ki Kre (χ ) Testi χ testi; histogrm ile giydirilen olsılık yoğunluk fonksiyonunun bir forml (resmi) krşılştırılmsıdır. Sürekli y d kesikli durumd χ test isttistiğini hesplmk için giydirilen dğılımın tüm lnı k rdışık ln bölünür. [ 0, ), [, ),, [ k-, k ); [ -, ). Arlık; 0 = - ise [-,) Test isttistiği N np k ( ) χ = n χ ~ χ k = np χ χ k, ise (-) güvenlik düzeyinde veri düşünülen dğılım uygundur. H 0 hipotezi red edilmez. k= ise [ k-, ) X, X,, X n gözlem değerleri olduğund; N :. Arlıktki gözlem syısı; k = N = n n gozlemsyisi p :. rlığ düşme olsılığı ( giydirilen dğılımdn örnekleme ypılsydı; p :. rlığ düşen Xi lerin ornı) p = fˆ( x) dx X i Pˆ( x ) i x surekli x kesikli E[( -, )]:. rlığ düşen gözlem syısının beklenen değeri E[( -, )] = np Bir χ testini gerçekleştirme de en büyük zorluk rlık syısının ve rlık genişliğinin seçilmesidir. Öneri: p değerlerinin yklşık olrk eşit seçilmesidir. E = np 5 Kesikli ve sürekli dğılımlr için geçerlidir. Sürekli dğılım için χ testinin kullnılmsınd; p = k Yndki tblod, sürekli veriler için örnek genişliğine bğlı olrk sınıf rlıklrının syısını vermektedir. n E = np 5 n. 5 k k 5 Kesikli dğılımlrd eşit olsılık rlıklrını elde etmek koly değildir.
ÖRNEK: Bir kvşkt sbh stleri 7.00 ve 7.05 rsınd 5 dkiklık bir süre için 5 iş gününde 0 hftlık bir peryott rblrın syısı tutulmuş. Aşğıdki tblod 5 dkiklık bir zmn rlığınd rb gelişlerinin syısı verilmiştir. (Bnks & Crson, 984) ÇÖZÜM: 0; 5 dkiklık süreler için kez hiç rb gelmediğini gösterir. ; 5 dkiklık süreler için 0 kez rb geldiğini gösterir. Bu verilerin histogrmı çizildiğinde sıklık 0 8 3 6 4 0 8 0 4 5 6 6 7 8 4 9 0 0 x
ÇÖZÜM: Verilerin histogrmı, Poisson dğılımın olsılık fonksiyonu şekline benzediğinden dolyı, verilerin Poisson dğılım ship olduğunu kbul edilsin. Poisson dğılımın prmetresi λ =3.64 olrk thmin edilmiştir. Hipotez: H0: Veriler, Poisson dğılımdn gelmektedir. ÇÖZÜM: H: Veriler, Poisson dğılımdn gelmemektedir. λ x e λ x! Poisson dğılımın olsılık fonksiyonu; p( x) = 0 x = 0,,,... dd χ 0 =7.68 dir. serbestlik derecesi k-s-=7--=5; =0.05 için χ =. χ 0 > χ 0.05,5 H 0 hipotezi red ÇÖZÜM: λˆ =3.64 için, x in tblodki değerlerinin orty çıkm olsılıklrı; p(0)=0.06 p(6)=0.085 p()=0.096 p(7)=0.044 p()=0.74 p(8)=0.00 p(3)=0 p(9)=0.008 p(4)=0.9 p(0)=0.003 p(5)=0.40 p()=0.00 E i = np i E =00*(0.06)=.6 ÖRNEK: Rssl olrk seçilen 50 det elektronik chip in yşm süreleri tutulmuştur. Bunlr; Elektronik chiplerin yşm sürelerinin üstel dğılım ship olup olmdığını Ki-Kre testi ile test ediniz.
ÇÖZÜM: Ki-Kre testini gerçekleştirmek için öncelikle veriler küçükten büyüğe sırlnır. Eşit olsılıklı rlıklr ile Ki-Kre testini gerçekleştirmek için, sınıf rlıklrının sınırlrı belirlenmelidir. n=50 için k 0 np 5 50 5 k 0 k k = 8 için p = 0.5 Her rlığın son noktsı üstel dğılımın dğılım fonksiyonundn hesplnır. ÇÖZÜM:
İlk rlık; [-, ) ve son rlık [ k -, ) Aynı problem için k=8 ve p=0.5 µ F( ) = 0.5 = φ = φ(.5) = µ. 5σ σ Tüm rlıklrın sınır değerleri χ = 39.6 χ 0 0.05,6 =.6 χ > 0 χ 0.05,6 H 0 hipotezi red AMPİRİK (GÖZLEMSEL) DAĞILIMLAR ÖRNEK: Ki-Kre testinde Norml dğılım için rlıklrın hesplnmsı Norml dğılım için kümültif dğılım fonksiyonu; x µ F( x ) = φ x σ i : i. rlığın sınır değeri olmk üzere x = i lınırs i µ F( i ) = φ i =,,..., k σ Veriye uygun bir teorik dğılımın bulunmdığı durumlrd Ampirik dğılımlrdn yrrlnılır. Sürekli Dğılımlr için; Oriinl veri mevcuts; Toplnn veriler küçükten büyüğe sırlnır. X (), X () X (n) Sürekli, piecewise-doğrusl dğılım fonksiyonu tnımlnır.
AMPİRİK (GÖZLEMSEL) DAĞILIMLAR AMPİRİK (GÖZLEMSEL) DAĞILIMLAR 0 x < X ( ) i x X ( i ) F( x ) = + X ( i ) x < X ( i+ ) n ( n )( X ( i+ ) X ( i ) ) X ( n ) x Prtikte, çoğu sürekli dğılım sğ çrpıktır. Gözlem syısı (n), yeterli büyüklükte değilse, dğılım sğ uç noktsındn çok z gözleme ship olbiliriz. Dezvntlrı; ) Simülsyon sırsınd bu dğılımdn üretilen rssl değer X() den küçük ve X (n) den büyük olmz. ) f(x) in ortlmsı, gözlemlerin örnek ortlmsın eşit değildir. Çünkü, bu uç noktdn gözlem elde etme olsılığı zdır. Bu durumd, yukrıd tnımlnn Ampirik dğılımlr, bu uç noktlrdn gözlem elde etmeye izin vermezler. AMPİRİK (GÖZLEMSEL) DAĞILIMLAR AMPİRİK (GÖZLEMSEL) DAĞILIMLAR Gruplndırılmış veri mevcuts; X i lerin değerleri bilinmediğinden dolyı frklı bir yklşım kullnılır. [ 0, ), [, ),., [ k-, k) ; k rdışık rlık olsun.. rlık, n gözlemi içermektedir. n + n + + n k = n gözlem syısı Sürekli piecewise doğrusl mpirik dğılım fonksiyonu G; G 0 x G( ) + [ G( ) G( )] x < ( x ) = x < x k 0 Kesikli Dğılımlr için; X, X, X n oriinl veri mevcuts, mpirik dğılım tnımlmk çok kolydır. Mümkün her x değeri için mpirik fonksiyon p(x); x e eşit X i lerin ornı olrk tnımlnır. F( x ) = P( x X ) = p( x ) x X i < x < Gruplndırılmış kesikli veri için; Bir rlıktki x in mümkün değerleri için p(x) lerin toplmı; bu rlıktki X i lerin ornın eşittir. G ) = 0, ( n + n + n +... + n ) G( ) = n 3 ( 0
VERİ ELDE ETMEK MÜMKÜN DEĞİLSE VERİ ELDE ETMEK MÜMKÜN DEĞİLSE Bzı durumlrd, ilgilenilen rssl değişkenler için veri toplmk mümkün olmybilir. Bu durumlr; ) Üzerinde çlışıln sistem mevcut değilse ) Sistem mevcut nck, simülsyon çlışmsı için yrıln süre, verinin toplnmsı ve nlizi için yeterli değilse. Verinin yokluğund, bir dğılımın seçilmesi için litertürde sezgisel yklşım vrdır. İlgilenilen rssl değişkenin, sürekli bir rssl değişken olduğunu kbul edilsin (X). X rssl değişkeni, bir işin gerçekleştirilme zmnı olrk düşünülebilir. Örneğin; rızlnn bir mkinenin tmir zmnı. VERİ ELDE ETMEK MÜMKÜN DEĞİLSE VERİ ELDE ETMEK MÜMKÜN DEĞİLSE Her iki sezgisel yklşımd Birinci dım; [, b] rlığını belirlemektir [P(X< or X>b)=0]. ve b nin subektif thminlerini elde etmek için uzmnlrın fikirleri lınır. [ ve b] değerleri, bir işin gerçekleştirilmesi için en iyimser ve en kötümser zmnlrdır. İkinci dım; X in bir gösterimi olrk düşünülebilecek bir olsılık yoğunluk fonksiyonunun belirlenmesidir.. Sezgisel Yklşım; üçgen dğılımın kullnılmsıdır. Bu yklşımd, uzmnlrdn işin en olsı bitirilme zmnı öğrenilir. c, X in dğılımının mod değeridir., b ve c değeri verildiğinde, X rssl değişkeni; [,b] ve mod c ile üçgen dğılım ship olduğu kbul edilir.. Sezgisel Yklşım; Bet dğılımını kullnmktır. Bu yklşımd, X r.d. nin, [,b] rlığınd ve şekil prmetreleri ile Bet dğılımın ship olduğu kbul edilir. Bu yklşımd, ve prmetrelerinin nsıl seçileceği problemi vrdır. Çeşitli öneriler; ) X r.d. nin [,b] rlığınd orty çıkm olsılığı eşit ise, = = seçilir. Bu durumd elde edilen dğılım uniform dğılımdır. X~Uni(,b) b) X r.d. nin olsılık yoğunluk fonksiyonunun sğ çrpık olduğu kbul edilir. (Bir işin gerçekleşme zmnı ile ilgili dğılımlr genellikle sğ çrpıktır.) bu durumd Bet dğılımınd, > > dir. Ortlmsı µ, mod c ile bir Bet dğılımı verildiğinde
µ ve c nin subektif thminleri verildiğinde ) ( µ + + = b ) )( ( + + = b c ) )( ( ) )( ( ~ b c b c = µ µ b = µ µ ) ~ ( ~ VERİ ELDE ETMEK MÜMKÜN DEĞİLSE BETA DAĞILIMI: BETA DAĞILIMI: BETA DAĞILIMI:
BETA DAĞILIMI: GAMMA DAĞILIMI Kullnım lnlrı; ) Veri yokluğund bir rssl değişkenin dğılımı olrk kullnılbilir. ) Bir yığın içindeki htlı prçlrın ornı 3) Bir işi tmmlm zmnı (Örn; bir PERT şebekesinde) GAMMA DAĞILIMI Norml dğılımın olsılık yoğunluk fonksiyonu, çn eğrisi şeklindedir ve simetriktir. GAMMA DAĞILIMI Bzı durumlrd, tsrımcının ilgilendiği değişken bir çrpık (skewed) dğılım ship olbilir. Gmm dğılımı d bir çrpık dğılımıdır. Gmm dğılımını tnımlmk için, mtemtiğin çeşitli dllrındn önemli bir rolü oln bir fonksiyonu öğrenmek gerekir. > 0 için, gmm fonksiyonu şğıdki gibi tnımlnbilir. x ( ) = x e dx 0 Γ
GAMMA DAĞILIMI WEIBULL DAĞILIMI Norml, gmm, üstel ve uniform dğılımlrı, sürekli değişkenlerin olsılık modellerinin belirlenmesinde çok sık yrrlnıln dğılımlrdır. Anck, prtikte gözlemlenen verinin bir setine bu dğılımlrdn hiçbirisi tm olrk temsil etmeyebilir. Weibull dğılım ilesi, İsveçli fizikçi Wloddi Weibull trfındn 939 yılınd bulunmuştur. ( x β ) x e β f ( x;, β ) = 0 x > 0 dd GAMMA DAĞILIMI WEIBULL DAĞILIMI Kullnım yerleri; Müşteri servisi, Mkine tmiri gibi elle ypıln işlerin tmmlnm zmnı gmm dğılımı olbilir. Bir mlın ylık stış miktrı.
WEIBULL DAĞILIMI WEIBULL DAĞILIMI Kullnım yerleri; Güvenilirlikle ilgili değişkenler, genellikle bir Weibull dğılım ile tnımlnır. Bir ekipmnın bir prçsının rızlnm zmnı y d bir elektronik prçnın ortlm yşm süresi için değerlerin üretilmesinde Weibull dğılım kullnılbilir. Aynı zmnd, bir işin tmmlnm zmnı Weibull dğılım uyun olbilir.