9. Ders Đstatstkte Mote Carlo Çalışmaları Đstatstk rasgelelk olgusu çere olay süreç ve sstemler modellemesde özellkle bu modellerde souç çıkarmada ve bu modeller geçerllğ sıamada kullaıla bazı blg ve yötemler sağlaya br blm dalıdır. Đstatstkte smülasyo; eğtmde kavramları kavratılmasıda öreklem brer foksyou ola statstkler dağılımları le lgl aaltk olarak elde edlemeye bazı özellkler rdelemesde tahm edcler ylk ölçütlere göre karşılaştırılmasıda test foksyolarıı güç foksyou değerledrmelerde so yıllarda çok kullaıla bootstrap gb yede öreklem tekklerde beklee değer ya tegral hesabı yapıla Mote Carlo tegrasyouda ve başka brçok kouda kullaılmaktadır. Acak statstktek smülasyou amacı olgu veya sstem smülasyoudak amaçlarda farklıdır. Öreğ br bez stasyou le lgl kuyruk model üzerde yapıla smülasyou amacı sstemdek bekleme zamaıı ve malyet e küçük yapacak şeklde hzmet brmler sayısıı belrlemek olablr. Burada statstk blm açısıda br amaç yoktur. Gamma dağılımı ç parametre tahmde mometler ve e-çok olablrlk tahm edclerde hags hata kareler ölçütüe göre daha ydr sorusuu cevabı smülasyo yaparak verlmeye çalışıldığıda burada statstksel br amaç söz kousudur. Özellkle bu soruya aaltk olarak cevap verlemyorsa smülasyo öem kazamaktadır. Acak smülasyou spatı yer tutacağı saılması. Smülasyo br spat yötem değldr. Smülasyoa öreklerle doğruyu yalışı tespt etme bazı durumlarda aaltk olarak çözülemeye problemlere çözüm yolu getrme baze de keds e y çözüm yoluu suduğu br yötem olarak bakablrz.
Öreklem Đstatstkler ve Dağılımları Bell br rasgelelk olgusuu modelleye olasılık dağılımı F olsu.... bağımsız ve ayı F dağılımlı rasgele değşkeler ya F dağılımıda br öreklem olmak üzere bu kısaca... öreklem ( F ) bçmde gösterlr. Öreklem Borel ölçüleblr herhag br T(... ) foksyoua statstk der. Đstatstkler brer rasgele değşkedr veya rasgele vektördür. Brçok durumda statstkler öreklem karmaşık foksyou olduklarıda dağılımlarıı buluması kolay olmamaktadır. Öreklem statstkler arasıda öreklem ortalamasıı çok özel br yer vardır. Öreğ öreklem N ( µ σ ) ormal dağılımda alıdığıda ~ N( µ σ / ) dır. N ( µ σ ) dağılımıı olasılık yoğuluk foksyouu grafğ ve bu dağılımda alıa brmlk öreklemler ç smülasyo le gözlee x x... x öreklem ortalamalarıı hstogramları aşağıdadır.. close all; clear all; subplot(3); fplot('/sqrt(*p)*exp(-.*(x-)^)'[-4 4]'k') for : ; xrad()+; xort()mea(x); ed subplot(34) ; hst(xort) ; ttle('') for : ;xrad()+; xort()mea(x); ed subplot(3) ; hst(xort) ; ttle('') for : ; xrad()+; xort()mea(x); ed subplot(36); hst(xort): ttle('')
.4.3.. -4-4.. Öreklem α β parametrel Γ ( α β ) Gamma dağılımıda alıdığıda ~ Γ ( α β / ) dır. Öreğ Γ( α β / ) dağılımıı olasılık yoğuluk foksyouu grafğ ve bu dağılımda alıa brmlk öreklemler ç smülasyo le gözlee x x... x öreklem ortalamalarıı hstogramları aşağıdak gbdr..8.6.4. 4....
Öreklem olasılık yoğuluk foksyou x b ( b) < x < b f ( x) d. y. ola dağılımda alıdığıda dağılımı edr? b ( b ( )) parametres b 3 olması durumuda olasılık yoğuluk foksyouu grafğ ve olasılık yoğuluk foksyou bu ola dağılımda alıa brmlk öreklemler ç smülasyo le gözlee x x... x öreklem ortalamalarıı hstogramları aşağıdak gbdr..8.6.4. 4.... Öreklem olasılık foksyou f ( x) x 34 6 ola dağılımda 6 alıdığıda dağılımı edr? Olasılık foksyouu grafğ ve brmlk öreklemler ç smülasyo le gözlee x x... x öreklem ortalamalarıı hstogramları aşağıdadır...4.3.. 4 6 4 6 4 6
Dağılımda bağımsız olarak ya dağılım e olursa olsu öreklem ortalaması le lgl aşağıdak k teorem söz kousudur. Beklee değer µ ve varyası σ solu ola br dağılımda alıa... öreklem ç: - Zayıf Büyük Sayılar Kauu p - Merkez Lmt Teorem dır. µ ( ε > ç lm P ( µ < ε ) ) E( Var( ) ) µ d Z ~ N () σ / Bu k teorem söyledkler alamak ç ç çzle yukarıdak hstogramları yede gözde geçrz. Ayrıca düzgü br tavla zarıı atılması deey modelleye f ( x) x 34 6 dağılımıda 6 üretle sayıları dzs...... ve ortalamalar dzs...... olmak üzere smülasyo soucu elde edle yörügeler aşağıdak gb olmuştur. Öreklem hacm arttıkça öreklem ortalaması ktle ortalamasıa daha yakı br çevrede salımaktadır. 6 4 3 4 6 6 4 3 4 6
Öreklem statstkler arasıda öreklem ortalamasıı yaıda öeml ola kc br statstk S ( ) öreklem varyasıdır. Bldğ gb öreklem N ( µ σ ) dağılımıda alıdığıda ( ) S σ ~ χ ( ) dır. Öreklem Γ ( α β ) dağılımıda alıdığıda S ' dağılımı edr? Smülasyo yaparak S ' dağılımıı rdelemeye çalışalım. Öreğ N ( µ σ ) dağılımıda alıa brmlk öreklemler ç smülasyo le gözlee aşağıdak gbdr. s s öreklem varyaslarıı hstogramları s... 3.4.3.. - 8 8 8 6 6 6 4 4 4 4 4
Γ( α β / ) dağılımıda alıa brmlk öreklemler ç smülasyo le gözlee aşağıdadır. s s öreklem varyaslarıı hstogramları s... 3.8.6.4. 4 8 6 4 4 Normal dağılımda öreklem ortalaması le S öreklem varyası bağımsız statstklerdr. Gamma dağılımıda durum edr? le bağımsızlığı smülasyo yaparak rdeleeblr m? S ' Hstogram gb frekas polgou da br statstktr (Br rasgele elemadır). Öreğ N ( µ σ ) dağılımıda alıa 6 brmlk smülasyola üretle br öreklem ç hstogram le frekas polgou aşağıdak gbdr..4.3.. - -4-3 - - 3 4 6 - -.... 3 3.
Hstogram le frekas polgouu ortaya çıkardığı görsel etk N ( µ σ ) dağılımıı olasılık yoğuluk foksyouu grafğ bçm le lgldr. Eğer düşey ekse frekas yere frekas bölü hstogram alaı olarak ölçekledrlrse frekas plogou le olasılık yoğuluk foksyou arasıdak uyum ayı grafk üzerde görüleblr. Öreklem hacm arttıkça bu uyum daha y olmaktadır.. 6.4.3...4 - - 3 4 6.3.. - - 3 4 Hstogramı lgl dağılımı bçm hakkıda fkr verdğ; N ( µ σ ) dağılımıı olasılık yoğuluk foksyouu brmlk öreklem ç hstogramı ve ç üretle adet öreklem ortalaması ç üst üste çzle aşağıdak hstogramları gözde geçrz..4.3.. -4-3 - - 3 4 3-4 -3 - - 3 4
Br statstk ola öreklem ortalamasıı dağılımıı bçm smülasyo le görülmek stedğde dağılımıda çok sayıda gözlem alııp hstogram çzleblr. Acak yukarıdak öreklerde bu böyle yapılmadı. Örekleme yapıla dağılımı kedsde ( ktle dağılımıda ) öreklemler üretlp (sözde öreklemler) öreklem br foksyou ola statstğ ( ) değer hesaplaarak elde edle değerler le hstogram çzld. Kısaca belrlemş br dağılımda çok kez (öreğ kez) tae sayı ( brmlk örek) üretlp aldığı değer hstogramı çzld. Gerçekte buu yapmak demek ktlede kez örek almak ya kez örekleme yapmak demektr. Acak örekleme br kez yapılmaktadır. Baze ö araştırma telğde küçük çaplı br örekleme ve ardıda asıl örekleme baze de doğrulama amaçlı ye küçük çaplı örekleme yapılablr ama kez öreklemey bırakı k kez ble örekleme olmaz. Olsa y olur masraflar karşılaırsa. Bootstrap Öreklemes Öreklemey tekrarlamak ve çok kez yapmak elverşl değldr. Elmzde sadece br ver (data gözlemler) bulumaktadır. Ver alıdığı ktle ortalamasıı tahm etmek stemşsek elmzde tahm olarak örek ortalaması bulumaktadır. Ktle dağılımı hakkıda hçbr varsayım yapılmamışsa küçük hacml öreklemede ktle ortalaması ç güve aralığı söyleyemeyz aralık tahm yapamayız. Bu gb soruları altıda kalmak ç elmzdek ver le lgl yede hacmlk öreklemeler yapılıp lgl statstğ değer çok kez gözlep dağılımı hakkıda fkr elde edleblr. Yede hacmlk öreklemeler asıl yapılablr? Gözlee verler lgl dağılımı temsl ettğ ve öreklem dağılım foksyou { : x } F ˆ #... ( x) ı F yere alıableceğ düşüces le Fˆ 'da brmlk öreklemler smülasyo le üretleblr. Bulara bootstrap öreklemler der.
Fˆ 'da brmlk br öreklem üretmek x x... x verlerde adel olarak kez çeklş yapmak demektr (öreğ x x... x değerler tae top üzere yazılıp adel olarak çeklş yapmak demektr). Böylece bootstrap öreklemler (örekler) çok kolay br şeklde üretleblr. Üretle B tae bootstrap öreklem ç öreklem ortalaması x... x xb olarak gözledğde bu gözlemler hstogramı ' dağılımı hakkıda fkr verecektr. Üretle B tae bootstrap öreklem ç hstogramı S öreklem varyası s olarak gözledğde buları s... sb S ' dağılımı hakkıda fkr verecektr. Üretle B tae bootstrap öreklem ç M öreklem medyaı m... m mb olarak gözledğde buları hstogramı M ' dağılımı hakkıda fkr verecektr. Fe Fakültes öğrecler arasıda rasgele seçle 6 öğrecye haftada evde kaç saat ders çalıştıkları sorulduğuda aşağıdak verler gözlemştr.. 3 4 9. 4 8. 4 9 4 7 4. 8 6 6 7 3 3 7 3 7 3 4 7 4 4 3 7 9 6 9. 8 6 4 8 6 4 4 6 8 4 6
%Bootstrap clc; close all ; clear all load ver ; hst(ver) for B: for :6 secfx(rad*6)+; x()ver(sec); ed Bvaryas(B)std(x)^; Bort(B)mea(x); Bmedya(B)meda(x) ed fgure; subplot(3); hst(bort) ;ttle('ortalama') subplot(3) ; hst(bvaryas) ;ttle('varyas') subplot(33) ; hst(bmedya) ; ttle('medya') 6 Ortalama Varyas Medya 4 4 4 3 3 3 4 4 Bootstrap öreklemler br tür yede alımış öreklemler olarak düşüüldüğüde bootstrap br yede örekleme (resamplg) tekğdr. Brçok yede örekleme tekkler vardır. Bularda brs Jackfe'dır. Jackfe tekğde tae gözlemde brs dışarıda bırakılıp dğerler le brmlk ye br öreklem oluşturulmaktadır. Bu şeklde sadece tae farklı öreklem oluşturulablr. Bootstrap tekğde se steldğ kadar ye öreklem oluşturulablr.
Parametre Tahm Rasgelelk olgusuu modelleye olasılık dağılımıı bçm blmes ya model olarak kullaılablecek dağılımlar ales blmes ve bu ale br parametre le modellemş olması durumuda problem bu parametre belrlemese drgemektedr. Parametre kümes Θ ve... öreklem F( ; θ ) θ Θ olmak üzere θ parametres tahm etmek ç kullaılacak br T(... ) statstğ (tahm edcs) belrlemes gerekmektedr. Burada brbr le lgl k soru söz kousudur. Bularda brs tahm edclerde araa özellkler eler olmalı ve dğer de tahm edcler bulma yötemdr. Öreğ N ( µ σ ) dağılımıı parametreler eçok olablrlk tahm edcler µ ç ve σ ç S ( ) dır. yasız ve S yasız değldr. Her ks de olasılıkta tutarlı ya p µ S p σ dır. µ parametres ayı zamada ktle medyaı olduğuda öreklem medyaı M de µ ç br tahm edc olarak düşüüleblr. M öreklem medyaı µ ç
yasız br tahm edc mdr? Hata Kareler Ortalaması (MSE) ölçütüe göre hags daha ydr? Bu soruları cevabı kolay görümemektedr. ve σ MSE( ) E( µ ) Var( ) MSE ( M ) E( M µ ) olmak üzere N ( µ σ ) dağılımıda ç kez smülasyo le gözlee x x... x ve m m... m değerler ç MSE ˆ ( ) MSE ˆ ( M ) ( ( x m µ ) µ ).966.697 olarak elde edlmştr. M ˆSE( ) değer değere ya / sayısıa yakı çıkması gerekmektedr. Mˆ SE( M ) değer hag sayıya yakı çıkması gerekmektedr. Buu blmyoruz. değl de kez ç M öreklem medyaı gözlep Mˆ SE( M ) hesapladığıda şekldek (aşağıda) gb br durum ortaya çıkmaktadır. Şeklde görüldüğü gb Mˆ SE( M ) değerler.38 gb br sayı etrafıda salımaktadır. MSE ( ) < MSE( M ) olduğu söyleeblr m? Evet. MSE ölçütüe göre öreklem ortalaması öreklem medyaıda daha y br tahm edcdr. Buu smülasyo le söyledğ uutulmamalıdır. Smülasyo sadece N ( µ σ ) dağılımı üzerde yapılmıştır. Acaba dğer ormal dağılımlarda durum edr? σ.44.4.4.38.36.34.3
Üstel dağılımı olasılık yoğuluk foksyou e f ( x) θ x θ x > d. y. ve beklee değer θ varyası θ ( θ ( )) parametres ç θ medyaı l() θ olmak üzere T T S T 3 M l() tahm edcler düşüülsü. Hags Hata Kareler Ortalaması ölçütüe göre daha y olduğuu smülasyo yaparak gözleyz (Aşağıdak matlab programıı kullaablrsz). clc; close all ;clear all teta; ; N; for :N x-teta*log(rad()); T()mea(x); T()std(x); T3()meda(x)/log(); ed MSETsum((T-teta).^)/ MSETsum((T-teta).^)/ MSET3sum((T3-teta).^)/ Bldğ gb Posso dağılımıda beklee değer le varyas brbre eşttr ve bu değer dağılımı parametres ola λ 'dır. λ parametres ç yasız brer tahm edc ola le S ( ) tahm edclerde hags daha küçük varyaslıdır? Teork ya aaltk olarak bu soruya cevap vermek braz zordur. Smülasyo le bu kolayca görüleblr.
Hpotez Test Đstatstksel hpotez dağılım hakkıda br öermedr. Öreğ br rasgelelk olgusuu modelleye dağılımı üstel olduğuu söylemes (dda edlmes) br hpotezdr. Br dağılımla lgl öreğ varyasıı bell br sayıda küçük olduğuu söylemes k değşkel br dağılımda değşkeler bağımsız olduğuu söylemes brer hpotezdr. Parametrelerle lgl hpotezlerde Θ parametre kümes olmak üzere parametre br Θ Θ kümesde bulumasıa veya kısaca Θ 'a hpotez der ve H le gösterlr. Θ Θ \ Θ 'ya da karşıt (alteratf) hpotez der ve H (veya H A ) le gösterlr. Hpotezler ve olmak üzere H H : θ Θ : θ Θ... öreklem F (.; θ ) θ Θ Θ Θ [ ] ϕ : R (... ) ϕ(... ) statstğ aldığı değer y φ... ) olduğuda: b ( p y) Beroull ( deemes başarı le souçladığıda H reddedls aks halde H kabul edls bçmde br karara götüre φ... ) statstğe rasgeleleştrlmş test ( foksyou (kısaca test foksyou) der. Eğer φ görütü kümes { } ya (... ) B R φ(... ) (... ) B bçmde se φ ye rasgeleleştrlmemş test foksyou B kümese H hpotez ç red bölges B kümese de H hpotez ç kabul bölges der.
olmak üzere Br φ test foksyou le lgl güç foksyou π : Θ Θ [ ] θ π ( θ ) ( H ı reddedlmes) { π ( θ ): Θ } α sup θ P θ φ değere test alam düzey der. Alam düzey H doğru ke H 'ı reddedlmes ya I. tp hata yapma olasılığı ç üst sıırdır. Alam düzey α ola test foksyoları arasıda tüm θ Θ ç β (θ ) değerler e büyük ola φ teste düzgü e güçlü test der. Geel olarak böyle φ testler bulmak mümkü olmamakla brlkte bazı durumlar öreğ bast hpotezler ç düzgü e güçlü test buluablmektedr. N( µ σ ) dağılımı ç H : µ H : µ hpotez le lgl φ >. <. test foksyou öerls. brmlk öreklem ç α P( >. / H doğ ru ) P( Z > ).436 dır. π güç foksyouu grafğ aşağıdadır. fplot('-ormcdf(*(.-x))+ormcdf(*(.8-x))'[- 3]).9.8.7.6..4.3.. - -.... 3
Güç foksyou smülasyo yaparak da çzdrleblr..9.8.7.6..4.3.. - -.... 3 % güç foksyou grafğ smülasyo yaparak çzdrmek clc : close all:clear all s; for mu-:.:3 say; ss+; for : xrad()+mu; ort()mea(x); f (ort()>.8) f (ort()<.) saysay+; ed ed ed olas-say/; guc(s)olas; ed mu-:.:3 plot(muguc'k')
Beroull dağılımı ( b ( p) p Θ () ) le lgl H : p.7 H : p <.7 ( Θ [.7 )) ( Θ (.7) ) hpotez test etmek amacıyla... öreklem b( ) p alıması durumu ç a) φ ) (... 6 7 b) φ ) (... 7 8 c) φ (... ). 6 7 8 test foksyoları öerls. Bu test foksyolarıda a le b şıkkıdakler rasgeleleştrlmemş c şıkkıdak test foksyou rasgeleleştrlmş br test foksyoudur. Bular ç π güç foksyolarıı grafkler aşağıda verlmştr.
%guc foksyou (teork) clc ;close all ;clear all s; for p.:.:.99 ss+; guca(s)bocdf(6p); ed s; for p.:.:.99 ss+; gucb(s)bocdf(7p); ed s; for p.:.:.99 ss+; gucc(s)bocdf(6p)+.*bopdf(7p); ed p.:.:.99 plot(pguca'k'pgucb'k--'pgucc'k-.') leged('a''b''c').9.8 a b c.7.6..4.3.....3.4..6.7.8.9
Güç foksyolarıı smülasyo yapılarak çzdrle grafkler aşağıda verlmştr. %güç foksyou (smülasyo) clc: close all: clear all:s; for p.:.:.99 ss+; guca(s)sum(sum(rad()<p)<6)/; ed s; for p.:.:.99 ss+; gucb(s)sum(sum(rad()<p)<7)/; ed s; for p.:.:.99 ss+; msum(rad()<p); m7sum(m7); redsum(rad(m7)<.); gucc(s)(sum(sum(rad()<p)<6)+red)/; ed p.:.:.99 plot(pguca'k'pgucb'k--'pgucc'k-.') leged('a''b''c').9.8 a b c.7.6..4.3.....3.4..6.7.8.9
P-Değer N( µ σ ) dağılımı le lgl ( σ bldğde) H : µ µ H µ µ ( µ > ) : µ hpotezler α alam düzeyde test edlmek stes. Bast hpotezler ç Neyma-Pearso Lemması yardımıyla elde edle düzgü e güçlü test foksyou φ... ( bçmdedr. c sabt > c ) < c P µ ( > ) α c - µ c - µ P ( > ) α σ/ σ/ c - µ c - µ P ( Z > ) α Z α σ/ σ/ c Z σ/ µ α + olarak buluur. φ test foksyou alışılagelmş olarak φ(... ) bçmde yazılır. Hesaplaa Z h - µ σ/ - µ σ/ - µ σ/ > Z < Z α α değer ormal dağılım tablosuda okua olduğuda H reddedlr. Bu hpotez ç p-değer z p P( Z > Z h ) e dz π Z h dır. Küçük p değerlerde H reddedlr. Z tablo değerde büyük Z α
P-değer Z h statstğ (rasgele değşke) br foksyou olduğuda keds de br rasgele değşkedr. Bu rasgele değşke P Z h le gösterls. P Z h rasgele değşke dağılımı edr? Sıfır hpotez doğru ke P Z h rasgele değşke dağılımıı smülasyo le görmeye çalışalım. Öreğ N ( µ σ 9) dağılımıda H : µ H : µ ç 6 olduğuda kez smülasyo yaparak bulua hstogramı sıfır hpotez gbdr. %Sıfır hpotez altıda clc;close all;clear all zh(mea(3*rad(6))-)/(3/sqrt(6)); p-ormcdf(zh);hst(p) P Z h değerler altıda ve karşıt hpotez altıda sırasıyla aşağıdak Sfr hpotez altda 6 Karst hpotez altda 8 4 6 3 4...3.4..6.7.8.9...3.4..6.7.8.9 Gerçekte sıfır hpotez doğru olduğuda p değer olasılık dağılımı düzgü dağılımdır. Dolayısıyla p değer le lgl yorumlamalar-da p değer büyük olması sıfır hpotez kabul edlmes alamıa gelp p değer büyüklüğüü br alamı yoktur.