1 ölüm maçları İSTTİSTİKSEL THMİLEME VE YORUMLM SÜRECİ ÖREKLEME VE ÖREKLEME DĞILIMLRI u bölümde öğreeceklerz. Örekleme gereksm ve yötemler celemek. Örekleme hatası kavramıı taımlamak Örekleme dağılışı kavramıı taımlamak, _ Örek ortalamasıı örekleme dağılışıı ortalaması ve stadart sapmasıı belrlemek, Örek oraıı örekleme dağılışıı ortalaması ve stadart _ sapmasıı belrlemek Merkez Lmt Teorem ve çıkarsamalarıı kullamak, Ortalama ve ora ç öreklem dağılımı uygulamaları yapmak. www.mehmetaksarayl.com Dr. Mehmet KSRYLI Yorumlama sürec ç Örek? Tahmler ve testler Örek İstatstkler (, ps) Populasyo Örek 1.. 3. Test rmler İmhası Kalte Kotrol Doğru ve Güvelr Souçlar Pragmatk Sebepler Zama Malyet 3 4 Örek Tpler Örekleme Hatası (Samplg Error) Örek Tp Örek İstatstkler aktle Parametreler tahmlemek ç kullaılır. Olasılık Dışı Olasılık Sorular: Öreğ: pulasyo ortalamsıı (μ) tahmdr. Yargı Kota Ktle ast Şas Sstematk Tabakalı Kümel Farklı örekler aktle parametreler farklı tahmler verr. Örek souçları potasyel olarak değşkelk çerrler böylece; örekleme hatası ortaya çıkar. 5 6
7 Calculatg Samplg Error Samplg Error: The dfferece betwee a value (a statstc) computed from a sample ad the correspodg value (a parameter) computed from a populato Eample: (for the mea) Samplg Error - μ Eample If the populato mea s μ = 98.6 degrees ad a sample of = 5 temperatures yelds a sample mea of = 99. degrees, the the samplg error s μ 99. 98.6.6 degrees where: sample mea μ populato mea 8 Samplg Errors Farklı örekler farklı örekleme hataları verr. errors Örekleme hataları poztf veya egatf olablr. Örek büyüklüğü arttığıda örekleme hatası küçülür. Örekleme dağılımı Teork br olasılık dağılımı vardır. Şas değşke örek statstğdr. Örek ortalaması, örek oraı, vb. elrl br hacmde tüm mümkü örekler çeklmesyle oluşur. [, P( )] 9 1 Örek1 ssume there s a populato Populato sze =4 Radom varable,, s age of dvduals Values of : 18,,, 4 (years) C D Örek1 Summary Measures for the Populato Dstrbuto: P() μ 18 4 1. 4 ( μ) 18 4 σ.36 C D Uform Dstrbuto 11 1
13 ow cosder all possble samples of sze = 1 st d Observato Obs 18 4 18 18,18 18, 18, 18,4,18,,,4,18,,,4 4 4,18 4, 4, 4,4 possble samples (samplg wth replacemet) Örek1 Sample Meas 1st d Observato Obs 18 4 18 18 19 1 19 3 4 3 4 Samplg Dstrbuto of ll Sample Meas Sample Meas 1st d Observato Obs 18 4 18 18 19 1 19 3 4 3 4 P(). Örek1 Sample Meas Dstrbuto 18 19 3 4 (o loger uform) 14 _ Summary Measures of ths Samplg Dstrbuto: 18 19 1 4 μ 1 σ ( μ ) (18-1) (19-1) Örek1 (4-1) 1.58 Populato = 4 μ 1 σ.36 P(). Örek1 18 4 C D Comparg the Populato wth ts Samplg Dstrbuto Sample Meas Dstrbuto = μ 1 σ 1.58 P(). 18 19 3 4 _ 15 Örek Örek Populasyo Karakterstkler r populasyo varsayalım... Populasyo hacm, = 4 Şas değşke,, ş sırasıda yapıla hatalar değerler: 1,, 3, 4 olsu. Örek Ölçütler 1 1 5. ( ).. 11. Populasyo dağılımı 3 4 17 18
19 Örek = hacml tüm mümkü örekler Örek Tüm örek ortalamalarıı örekleme dağılımı örek örek ortalaması 1.. gözlem göz 3 4 1 1,1 1, 1,3 1,4,,,3,4 3 3,1 3, 3,3 3,4 4 4,1 4, 4,3 4,4 1.. Gözlem göz 3 4 1 1. 1.5..5 1.5..5 3. 3..5 3. 3.5 4.5 3. 3.5 4. örek ortalaması Örekleme dağılımı 1.. Gözlem Göz. 3 4 1 1. 1.5..5 1.5..5 3. 3..5 3. 3.5 4.5 3. 3.5 4. P().. 1. 1.5..5 3. 3.5 4. Yere koyarak örekleme Örek Tüm mümkü örek ortalamalarıı özet statstkler 1. 15. 4. 1 5. 1 ( ) (1. 5). (15. 5). (4. 5).. 79 P().. Örek Populasyo 3 4 5. 11. Populasyo ve örekleme dağılımlarıı karşılaştırılması Örekleme dağılışları P().. 1 1.5.5 3 3.5 4 5..79 1 Ortalamaı stadart hatası Tüm mümkü örek ortalamalarıı stadart sapmasıdır. Populasyou stadart sapmasıda küçüktür. Formülü: Fte Populato Correcto pply the Fte Populato Correcto f: the sample s large relatve to the populato ( s greater tha 5% of ) ad Samplg s wthout replacemet ( μ) z The σ 1 3 4
5 ormal populasyolarda örekleme Merkez eğlm Yayılım yere koyarak örekleme = 4 = 5 Populasyo dağılımı 5 = 1 Örekleme dağılımı 5 = =.5 Ortalamaı örekleme dağılışıı stadardze edlmes Z Örekleme dağılımı Stadart ormal dağılım Z = z = 1 Z 6 ormal olmaya populasyolarda örekleme Merkez eğlm Yayılım Yere koyarak örekleme = 4 = 5 Populasyo dağılımı 5 = 1 Örek dağılımı =3 = 1.8 Örek hacm arttıkça ( 3)... Merkez Lmt Teorem Örekleme dağılışı ormal dağılıma yaklaşır. 5 7 8 Farklı örek büyüklükler ( ) ve farklı populasyolar ç ı örekleme dağılışı If the Populato s ot ormal 9 Samplg dstrbuto propertes: Cetral Tedecy Varato μ μ σ σ (Samplg wth replacemet) Populato Dstrbuto Samplg Dstrbuto (becomes ormal as creases) Smaller sample sze μ μ Larger sample sze 3
31 Eample Suppose a populato has mea μ = 8 ad stadard devato σ = 3. Suppose a radom sample of sze = 36 s selected. What s the probablty that the sample mea s betwee 7.8 ad 8.? Soluto: Eample Eve f the populato s ot ormally dstrbuted, the cetral lmt theorem ca be used ( > 3) so the samplg dstrbuto of s appromately ormal μ wth mea = μ = 8 ad stadard devato σ σ 3.5 36 3 Eample Soluto -- fd z-scores: Populato Dstrbuto???????????? 7.8-8 μ - μ 8. - 8 P(7.8 μ 8.) P 3 σ 3 36 36 Samplg Dstrbuto Sample P(-.4 z.4) 18 Stadard ormal Dstrbuto Stadardze 7.8 8. -.4.4 μ 8 μ 8 μ z 554 +554 z 33 Populato Proportos, π π = the proporto of the populato havg some characterstc Sample proporto ( p ) provdes a estmate of π : p umber of successes the sample sample sze If two outcomes, p has a bomal dstrbuto 34 Samplg Dstrbuto of p ppromated by a ormal dstrbuto f: π (1 π) 5 where 5 μ p π ad Samplg Dstrbuto P(p)...4.6 8 1 p σ p π(1 π) (where π = populato proporto) 35 z-value for Proportos Stadardze p to a z value wth the formula: p π z σ If samplg s wthout replacemet ad s greater tha 5% of the populato sze, the σ p must use the fte populato correcto factor: p p π π(1 π) σ p π(1 π) 1 36
37 Eample If the true proporto of voters who support Proposto s π =.4, what s the probablty that a sample of sze yelds a sample proporto betwee.4 ad.45? Eample f π =.4 ad =, what s P(.4 p.45)? σ p Fd : σ p π(1 π).4(1.4).3464.e.: f π =.4 ad =, what s P(.4 p.45)? Covert to stadard ormal:.4.4.45.4 P(.4 p.45) P z.3464.3464 P( z 1.44) 38 Samplg Dstrbuto Eample f π =.4 ad =, what s P(.4 p.45)? Use stadard ormal table: P( z 1.44) =.451 Stadardzed ormal Dstrbuto.451 lıştırma Türk telekomda çalışa br operatörsüüz. Uzu mesafel telefo görüşmeler = 8dk. & = dk. İle ormal dağılmakta. Eğer 5 aramalık örekler seçersez örek ortalamalarıı % kaçı 7.8 & 8. dk. arasıda olacaktır? Stadardze.4.45 p 1.44 z 1984-1994 T/Maker Co. 39 4 Çözüm le Olasılıklar İç Z Değerler uluması Örekleme dağılımı =.4 78. 8 Z. 5 5 8. 8 Z. 5 5 Stadart ormal dağılım 915 915 Z = 1 83 7.8 8 8. -.5.5 Z 41 P(Z) = 17 se Z edr? 17 Z = 1 Z = 1 Z Stadart ormal olasılık Tablosu (Kısme).1 Z.....4.8.398.438.478..793.83.871 179 17 55 4
43 ÖREK: üyük br alışverş merkezde 15 YTL de fazla alışverş yapa müşterler %3 uu kred kartı kulladığı tespt edlmştr. 15 YTL de fazla alışverş yapa 1 müşter ç oraları öreklem dağılımıı stadart hatası edr? P 1 P 1 P.458 1 yı örek ç 15 YTL de fazla alışverş yapa 1 müşterde % le %5 kred kartı kullaması htmal hesaplayıız. p1 P. p P.5 Z1 8 Z 1.9 P1 P (1 ) P1 P (1 ) 1 1 33 61 8 1.9.4854 P(. P.5) P( 8 Z 1.9).4854 61 P(. P.5) 33 44 ORTLMLR RSI FRKLRI ÖREKLEME DĞILIMI Ortalamalar arası farkı örek dağılımıı ortalaması μ 1 μ ve stadart hatası da 1 le gösterlr. 1 Z 1 1 1 Örek: İk farklı u fabrkasıda paketlee stadart 1 kg lık u paketler test edlmş ve brc fabrkada alıa 1 paket ortalaması 1.3 kg, stadart sapması.4kg; kc fabrkada alıa 1 paket ortalaması.99 kg, stadart sapması.5 kg bulumuştur. akütle stadart sapmaları blmedğ ç örek stadart sapmalarıda hareketle ortalamalar arası farkı stadart hatası, s1 s 1 (.4) (.5) = 1 1 =.6 45 46 ORLR RSI FRKLRI ÖREKLEME DĞILIMI Oralar arası farkı örek dağılımıı ortalaması P 1 P ve stadart hatası da 1 le gösterlr. P1 1 P1 P 1 P P P Z p1p P1P P 1P P 1P 1 Örek: rc fabrkadak kusurlu mamul oraıı.8 ve kc fabrkadak kusurlu mamul oraıı.5 olduğu blmektedr. Tesadüf olarak brc fabrkada 1, kc fabrkada 15 mamul seçlmş ve brc örektek kusurlu mamul oraı.9, kc örektek kusurlu mamul oraı.6 olarak gözlemştr. ua göre kusur oraları arasıdak farkı stadart hatası: P P P1 1 P1 P 1 P P P.8.9.5.95 P P 1 15.34 47 48
49 lmeye populasyo parametreler tahmler... Ortalama Populasyo Örek statstğyle parametres Tahmle! Ora P p Varyas s Farklar 1 P ( ) P ( ) Sapmasız 3. Kararlılık Tahmleycler Özellkler 1. Sapmasızlık Sapmalı üyük örek hacm Küçük örek hacm P(). Etklk 5 P ( ) Tahmleycler Özellkler 1. Sapmasızlık Sapmasız Sapmalı brmlk ayı aakütlede farklı sayıda öreklem seçlebleceğ ç tahm edc değer de seçle örekleme göre değşmektedr. u durumda öreklem sayısı kadar elde edle tahm edc, br rassal değşke olup, ortalaması ve varyası ola br olasılık dağılımıa sahptr. u dağılımı beklee değer aakütle parametrese eşt olmasıa, dğer br fadeyle br statstğ beklee değer le blmeye aakütle parametres arasıdak farkı sıfıra eşt olmasıa sapmasızlık der. E() E() P( ). Tutarlılık (Kararlılık) üyük örek hacm Küçük örek hacm Öreklemdek brm sayısı sosuza doğru arttırıldığıda, tahm edc değer aakütle değere yaklaşması ve = olması durumuda aralarıdak farkı sıfıra mes özellğe tutarlılık der. lm P 1 ˆ, ı tutarlı tahmcsdr. 51 5 3. Etklk Etk Tahmc P() rde fazla sapmasızvetutarlı tahmc olması durumuda, br tahmc varyasıı, ayı aakütle parametres başka br tahmcs varyasıda daha küçük olması durumuda elde edle tahmclere etk tahmc adı verlmektedr. 53