. Ders ĐSTATĐSTĐKTE SĐMÜLASYON Tahm Edcler ve Test Đstatstkler Smülasyo le Karşılaştırılması Đstatstk rasgelelk olgusu çere olay süreç ve sstemler modellemesde özellkle bu modellerde souç çıkarmada ve bu modeller geçerllğ sıamada kullaıla bazı blg ve yötemler sağlaya br blm dalıdır. Đstatstkte smülasyo; eğtmde kavramları kavratılmasıda öreklem brer foksyou ola statstkler dağılımları le lgl aaltk olarak elde edlemeye bazı özellkler rdelemesde tahm edcler ylk ölçütlere göre karşılaştırılmasıda test foksyolarıı güç foksyou değerledrmelerde so yıllarda çok kullaıla bootstrap gb yede öreklem tekklerde beklee değer ya tegral hesabı yapıla Mote Carlo tegrasyouda ve başka brçok kouda kullaılmaktadır. Acak statstktek smülasyou amacı olgu veya sstem smülasyoudak amaçlarda farklıdır. Öreğ br bez stasyou le lgl kuyruk model üzerde yapıla smülasyou amacı sstemdek bekleme zamaıı ve malyet e küçük yapacak şeklde hzmet brmler sayısıı belrlemek olablr. Burada statstk blm açısıda br amaç yoktur. Gamma dağılımı ç parametre tahmde mometler ve e-çok olablrlk tahm edclerde hags hata kareler ölçütüe göre daha ydr sorusuu cevabı smülasyo yaparak verlmeye çalışıldığıda burada statstksel br amaç söz kousudur. Özellkle bu soruya aaltk olarak cevap verlemyorsa smülasyo öem kazamaktadır. Acak smülasyou spatı yer tutacağı saılması. Smülasyo br spat yötem değldr. Smülasyoa öreklerle doğruyu yalışı tespt etme bazı durumlarda aaltk olarak çözülemeye problemlere çözüm yolu getrme baze de keds e y çözüm yoluu suduğu br yötem olarak bakablrz.
Öreklem Đstatstkler ve Dağılımları Đstatstk eğtmdek smülasyou uçak plotu eğtmdek smülasyoda ayırt edlmes gerekmektedr. Plot eğtmde su olarak smülasyo le yaratıla ortamlar çde (Bularda rasgelelk de buluablr.) plota br davraış bçm kazadırılmak stemekte veya kazadığı davraışları sıaması yapılmaktadır. Đstatstk eğtmde öğreclere; gerçek düyadak rasgelelk olgusuu sezdrlmes sezdrldkte sora rdelemes rdeleme öeml br savhası ola rasgelelğ ölçülmes ya olasılık ölçüsü kavramıı zhlerde oluşturulması rasgelelk ortamıda hesap yapılması gb telkler kazadırılmak stemektedr. Öcek bölümlerdek öreklerde görüldüğü gb smülasyo statstkte eğtm amaçlı da kullaılablr.... Bell br rasgelelk olgusuu modelleye olasılık dağılımı F olsu. bağımsız ve ayı F dağılımlı rasgele değşkeler ya F dağılımıda br öreklem olmak üzere bu kısaca... öreklem ( F ) bçmde gösterlr. Öreklem Borel ölçüleblr herhag br T(... ) foksyoua statstk der. Đstatstkler brer rasgele değşkedr veya rasgele vektördür. Brçok durumda statstkler öreklem karmaşık foksyou olduklarıda dağılımlarıı buluması kolay olmamaktadır. Öreklem statstkler arasıda = = öreklem ortalamasıı çok özel br yer vardır. Öreğ öreklem N ( µ σ ) ormal dağılımda alıdığıda ~ N( µ σ / ) dır. N ( µ = σ = ) dağılımıı olasılık yoğuluk foksyouu grafğ ve bu dağılımda alıa = brmlk öreklemler ç smülasyo le gözlee x x... x öreklem ortalamalarıı hstogramları aşağıdadır.
close all; clear all ; subplot(3) ; fplot('/sqrt(*p)*exp(-.*(x-)^)'[-4 4]'k') for =: ; x=rad()+; xort()=mea(x); ed subplot(34) ; hst(xort) ; ttle('=') for =: ; x=rad()+; xort()=mea(x); ed subplot(3) ; hst(xort) ; ttle('=') for =: ; x=rad()+; xort()=mea(x); ed subplot(36) ; hst(xort): ttle('=').4.3.. -4-4 = = =.. Öreklem ~ ( α β / ) α β parametrel Γ ( α β ) Gamma dağılımıda alıdığıda Γ dır. Öreğ Γ( α = β = / ) dağılımıı olasılık yoğuluk foksyouu grafğ ve bu dağılımda alıa = brmlk öreklemler ç smülasyo le gözlee x x... x öreklem ortalamalarıı hstogramları aşağıdak gbdr..8.6.4. 4 = = =....
Öreklem olasılık yoğuluk foksyou x b ( b) < x < b f ( x) = d. y. ola dağılımda alıdığıda dağılımı edr? b ( b ( )) parametres b = 3 olması durumuda olasılık yoğuluk foksyouu grafğ ve olasılık yoğuluk foksyou bu ola dağılımda alıa = brmlk öreklemler ç smülasyo le gözlee x x... x öreklem ortalamalarıı hstogramları aşağıdak gbdr..8.6.4. 4 = = =.... Öreklem olasılık foksyou f ( x) = x = 346 6 ola dağılımda alıdığıda dağılımı edr? Olasılık foksyouu grafğ ve = brmlk öreklemler ç smülasyo le gözlee x x öreklem ortalamalarıı hstogramları aşağıdadır. x.....4.3.. = = = 4 6 4 6 4 6
Dağılımda bağımsız olarak ya dağılım e olursa olsu öreklem ortalaması le lgl aşağıdak k teorem söz kousudur. Beklee değer µ ve varyası σ solu ola br dağılımda alıa... öreklem ç - Zayıf Büyük Sayılar Kauu - Merkez Lmt Teorem = = p µ ( ε > ç lm P ( µ < ε) = ) E( = = Var( = ) ) = σ / µ d Z ~ N() dır. Bu k teorem söyledkler alamak ç = ç çzle yukarıdak hstogramları yede gözde geçrz. Düzgü br tavla zarıı atılması deey modelleye f ( x) = x = 346 6 dağılımıda üretle sayıları dzs...... ve ortalamalar dzs...... olmak üzere smülasyo soucu elde edle yörügeler aşağıdak gb olmuştur. Öreklem hacm arttıkça öreklem ortalaması ktle ortalamasıa daha yakı br çevrede salımaktadır. 6 4 3 4 6 6 4 3 4 6
Öreklem statstkler arasıda öreklem ortalamasıı yaıda öeml ola kc br statstk S = = ( ) öreklem varyasıdır. Bldğ gb öreklem N ( µ σ ) dağılımıda alıdığıda ( ) S σ ~ χ ( ) dır. Öreklem Γ ( α β ) dağılımıda alıdığıda S ' dağılımı edr? Smülasyo yaparak S ' dağılımıı rdelemeye çalışalım. Öreğ N ( µ = σ = ) dağılımıda alıa = brmlk öreklemler ç smülasyo le gözlee s s... s3 öreklem varyaslarıı hstogramları aşağıdak gbdr..4.3.. - 8 = 8 = 8 = 6 6 6 4 4 4 4 4
Γ( = β = / ) α dağılımıda alıa = brmlk öreklemler ç smülasyo le gözlee s s s öreklem varyaslarıı hstogramları aşağıdadır.... 3.8.6.4. 4 = = 8 = 6 4 4 Normal dağılımda öreklem ortalaması le S öreklem varyası bağımsız statstklerdr. Gamma dağılımıda durum edr? le S ' bağımsızlığı smülasyo yaparak rdeleeblr m? Hstogram gb frekas polgou da br statstktr (Br rasgele elemadır). Öreğ N ( µ = σ = ) dağılımıda alıa 6 brmlk smülasyola üretle br öreklem ç hstogram le frekas polgou aşağıdak gbdr..4.3.. - -4-3 - - 3 4 6 - -.... 3 3.
Hstogram le frekas polgouu ortaya çıkardığı görsel etk N ( µ = σ = ) dağılımıı olasılık yoğuluk foksyouu grafğ bçm le lgldr. Eğer düşey ekse frekas yere frekas bölü hstogram alaı olarak ölçekledrlrse frekas plogou le olasılık yoğuluk foksyou arasıdak uyum ayı grafk üzerde görüleblr. Öreklem hacm arttıkça bu uyum daha y olmaktadır.. =6.4.3...4 - - 3 4 =6.3.. - - 3 4 Hstogramları lgl dağılımları bçmler hakkıda fkr verdkler görmek ç N ( µ = σ = ) dağılımıı olasılık yoğuluk foksyouu = brmlk öreklem ç hstogramı ve = ç üretle adet öreklem ortalaması ç üst üste çzle aşağıdak hstogramları gözde geçrz..4.3.. -4-3 - - 3 4 3-4 -3 - - 3 4
Parametre Tahm Rasgelelk olgusuu modelleye olasılık dağılımıı bçm blmes ya model olarak kullaılablecek dağılımlar ales blmes ve bu ale br parametre le modellemş olması durumuda problem bu parametre belrlemese drgemektedr. Parametre kümes Θ ve... öreklem F( ; θ ) θ Θ olmak üzere θ parametres tahm etmek ç kullaılacak br T(... ) statstğ (tahm edcs) belrlemes gerekmektedr. Burada brbr le lgl k soru söz kousudur. Bularda brs tahm edclerde araa özellkler eler olmalı ve dğer de tahm edcler bulma yötemdr. Öreğ N ( µ σ ) dağılımıı parametreler eçok olablrlk tahm edcler µ ç ve σ ç = = S ( ) = = dır. yasız ve S yasız değldr. Her ks de olasılıkta tutarlı ya p µ S p σ dır. µ parametres ayı zamada ktle medyaı olduğuda öreklem medyaı M de µ ç br tahm edc olarak düşüüleblr. M öreklem medyaı µ ç yasız br tahm edc mdr? Hata Kareler Ortalaması (MSE) ölçütüe göre hags daha ydr? Bu soruları cevabı kolay görümemektedr. ve MSE( ) = E( σ µ ) = Var( ) =
MSE ( M ) = E( M µ ) olmak üzere N ( µ = σ = ) dağılımıda = ç kez smülasyo le gözlee değerler ç x x x...... m m m MSE ˆ ( ) = = ( x µ ) =.966 MSE ˆ ( M ) = = ( m µ ) =.697 olarak elde edlmştr. M SE( ) değer ˆ ˆ σ değere ya / sayısıa yakı çıkması gerekmektedr. MSE( M ) değer hag sayıya yakı çıkması gerekmektedr. Buu blmyoruz. değl de kez = ç M öreklem medyaı gözlep MSE( M ) hesapladığıda Şekl- 4.3'dek gb br durum ortaya çıkmaktadır. Şeklde görüldüğü gb ˆSE( M ) M değerler.38 gb br sayı etrafıda salımaktadır. ( ) MSE( M ) ˆ MSE < olduğu söyleeblr m? Evet. MSE ölçütüe göre öreklem ortalaması öreklem medyaıda daha y br tahm edcdr. Buu smülasyo le söyledğ uutulmamalıdır. Smülasyo sadece N ( µ = σ = ) dağılımı üzerde yapılmıştır. Acaba dğer ormal dağılımlarda durum edr?.44.4.4.38.36.34.3
Üstel dağılımı olasılık yoğuluk foksyou e f ( x) = θ x θ x > d. y. ve beklee değer θ varyası θ medyaı θ l() olmak üzere θ ( θ ( )) parametres ç T = T = S M T 3 = l() tahm edcler düşüülsü. Hags Hata Kareler Ortalaması ölçütüe göre daha y olduğuu smülasyo yaparak gözleyz (Aşağıdak matlab programıı kullaablrsz). clc close all clear all teta=; =; N=; for =:N x=-teta*log(rad()); T()=mea(x); T()=std(x); T3()=meda(x)/log(); ed MSET=sum((T-teta).^)/ MSET=sum((T-teta).^)/ MSET3=sum((T3-teta).^)/
Bldğ gb Posso dağılımıda beklee değer le varyas brbre eşttr ve bu değer dağılımı parametres ola λ 'dır. λ parametres ç yasız brer tahm edc ola = = le S = = ( ) tahm edclerde hags daha küçük varyaslıdır? Teork ya aaltk olarak bu soruya cevap vermek braz zordur. Smülasyo le bu kolayca görüleblr. Smülasyo tahm edcler bell ölçütlere (özellklere) göre karşılaştırılmasıda çok kullaıla br araçtır. Öcek kısımda geş br şeklde üzerde durulduğu gb smülasyo yaparak tahm edcler dğer özellkler de celeeblr.
Hpotez Test Đstatstksel hpotez dağılım hakkıda br öermedr. Öreğ br rasgelelk olgusuu modelleye dağılımı üstel olduğuu söylemes (dda edlmes) br hpotezdr. Br dağılımla lgl öreğ varyasıı bell br sayıda küçük olduğuu söylemes k değşkel br dağılımda değşkeler bağımsız olduğuu söylemes brer hpotezdr. Parametrelerle lgl hpotezlerde Θ parametre kümes olmak üzere parametre br Θ Θ kümesde bulumasıa veya kısaca Θ 'a hpotez der ve H le gösterlr. Θ = Θ \ Θ 'ya da karşıt (alteratf) hpotez der ve H (veya H A ) le gösterlr. Hpotezler H H : θ Θ : θ Θ ve... öreklem F (.; θ ) θ Θ = Θ Θ olmak üzere [ ] ϕ : R (... ) ϕ(... ) statstğ aldığı değer y = φ... ) olduğuda: b ( p = y) Beroull ( deemes başarı le souçladığıda H reddedls aks halde H kabul edls bçmde br karara götüre φ... ) statstğe ( rasgeleleştrlmş test foksyou (kısaca test foksyou) der. Eğer φ görütü kümes { } ya (... ) B R φ(... ) = (... ) B bçmde se φ ye rasgeleleştrlmemş test foksyou B kümese H hpotez ç red bölges B kümese de H hpotez ç kabul bölges der.
Br φ test foksyou le lgl güç foksyou olmak üzere π : Θ Θ [ ] θ π ( θ ) = ( H ı reddedlmes) { π ( θ ): Θ } α = sup θ P θ φ değere test alam düzey der. Alam düzey H doğru ke H 'ı reddedlmes ya I. tp hata yapma olasılığı ç üst sıırdır. Alam düzey α ola test foksyoları arasıda tüm θ Θ ç β (θ ) değerler e büyük ola φ teste düzgü e güçlü test der. Geel olarak böyle φ testler bulmak mümkü olmamakla brlkte bazı durumlar öreğ bast hpotezler ç düzgü e güçlü test buluablmektedr. Örek: N( µ σ = ) dağılımı ç : µ φ = >. H H : µ hpotez le lgl = <. test foksyou öerls. = brmlk öreklem ç α = P( >. / H doğ ru ) = P( Z > ) =.436 dır. π güç foksyouu grafğ aşağıdadır. fplot('-ormcdf(*(.-x))+ormcdf(*(.8-x))'[- 3]).9.8.7.6..4.3.. - -.... 3
Güç foksyou smülasyo yaparak da çzdrleblr..9.8.7.6..4.3.. - -.... 3 % güç foksyou grafğ smülasyo yaparak çzdrmek clc : close all:clear all s=; for mu=-:.:3 say=; s=s+; for =: x=rad()+mu; ort()=mea(x); f (ort()>.8) f (ort()<.) say=say+; ed ed ed olas=-say/; guc(s)=olas; ed mu=-:.:3 plot(muguc'k')
Örek: Beroull dağılımı ( b ( p) p Θ = () ) le lgl H : p.7 = H : p <.7 = ( Θ [.7 )) ( Θ (.7) ) hpotez test etmek amacıyla alıması durumu ç... öreklem b( p) a) φ ) = = (... = 6 7 b) φ ) = = (... = 7 8 c) φ (... ) =. = = = 6 = 7 8 test foksyoları öerls. Bu test foksyolarıda a le b şıkkıdakler rasgeleleştrlmemş c şıkkıdak test foksyou rasgeleleştrlmş br test foksyoudur. Bular ç π güç foksyolarıı grafkler aşağıda verlmştr.
%guc foksyou (teork) clc ;close all ;clear all s=; for p=.:.:.99 s=s+; guca(s)=bocdf(6p); ed s=; for p=.:.:.99 s=s+; gucb(s)=bocdf(7p); ed s=; for p=.:.:.99 s=s+; gucc(s)=bocdf(6p)+.*bopdf(7p); ed p=.:.:.99 plot(pguca'k'pgucb'k--'pgucc'k-.') leged('a''b''c').9.8 a b c.7.6..4.3.....3.4..6.7.8.9
Güç foksyolarıı smülasyo yapılarak çzdrle grafkler aşağıda verlmştr. %güç foksyou (smülasyo) clc: close all: clear all:s=; for p=.:.:.99 s=s+; guca(s)=sum(sum(rad()<p)<=6)/; ed s=; for p=.:.:.99 s=s+; gucb(s)=sum(sum(rad()<p)<=7)/; ed s=; for p=.:.:.99 s=s+; m=sum(rad()<p); m7=sum(m==7); red=sum(rad(m7)<.); gucc(s)=(sum(sum(rad()<p)<=6)+red)/; ed p=.:.:.99 plot(pguca'k'pgucb'k--'pgucc'k-.') leged('a''b''c').9.8 a b c.7.6..4.3.....3.4..6.7.8.9
P-Değer N( µ σ ) dağılımı le lgl ( σ bldğde) : µ = µ H H : µ = µ ( µ > µ ) hpotezler α alam düzeyde test edlmek stes. Bast hpotezler ç Neyma-Pearso Lemması yardımıyla elde edle düzgü e güçlü test foksyou φ... ( bçmdedr. c sabt P µ ( > ) = α c > c ) = < c - µ c - µ P ( > ) = α σ/ σ/ c - µ c - µ P ( Z > ) = α = Z α σ/ σ/ c = Z α σ/ + µ olarak buluur. φ test foksyou alışılagelmş olarak φ(... ) = bçmde yazılır. Hesaplaa Z h - µ = σ/ - µ σ/ - µ σ/ > Z < Z α α değer ormal dağılım tablosuda okua olduğuda H reddedlr. Bu hpotez ç p-değer z p = P( Z > Z h ) = e dz π Z h dır. Küçük p değerlerde H reddedlr. Z tablo değerde büyük = Z α
P-değer Z h statstğ (rasgele değşke) br foksyou olduğuda keds de br rasgele değşkedr. Bu rasgele değşke P Z le h gösterls. P Z rasgele değşke dağılımı edr? Sıfır hpotez doğru ke h P rasgele değşke dağılımıı smülasyo le görmeye çalışalım. Öreğ Z h N ( µ σ = 9) dağılımıda H : µ = H : µ = ç = 6 olduğuda kez smülasyo yaparak bulua P Z değerler h hstogramı sıfır hpotez altıda ve karşıt hpotez altıda sırasıyla aşağıdak gbdr. %Sıfır hpotez altıda clc;close all;clear all zh=(mea(3*rad(6))-)/(3/sqrt(6)); p=-ormcdf(zh);hst(p) Sfr hpotez altda 6 Karst hpotez altda 8 4 6 3 4...3.4..6.7.8.9...3.4..6.7.8.9 Gerçekte sıfır hpotez doğru olduğuda p değer olasılık dağılımı düzgü dağılımdır. Dolayısıyla p değer le lgl yorumlamalar-da p değer büyük olması sıfır hpotez kabul edlmes alamıa gelp p değer büyüklüğüü br alamı yoktur.
Smülasyou Tasarlaması ve Souçları Değerledrlmes