İSTATİSTİKSEL TAHMİNLEME VE İSTATİSTİKSEL YORUMLAMA TAHMİNLEME SÜRECİ VE YORUMLAMA SÜRECİ ÖRNEKLEME TEORİSİ VE TAHMİN TEORİSİ ÖRNEKLEME VE ÖRNEKLEME ÖRNEKLEME DAĞILIMLARI VE ÖRNEKLEME DAĞILIMLARI
Yorumlama süreci Tahmiler ve testler Populasyo Örek İstatistikleri (, ps) Örek
Örek Tipleri Örek Tipi Olasılık Dışı Olasılık Basit Şas Sistematik Tabakalı Kümeli Yargı Kota Kitle 3
Niçi Örek? Aakütle parametrelerii örek değerleri(örek istatistikleri) yardımıyla tahmi edilmesie imka sağlamak moder istatistiği öemli bir görevidir. Aakütlei tamamı icelemez. Aakütlede bir şas öreği alıır. Elde edile örek değerlerii aakütle parametresi yerie kullaılması içi iki şart vardır: a. Örek şas öreği olmalı. Aakütledeki her birimi öreğe girme şası eşit olmalı b. Örek yeterice büyük olmalı 4
Örekleme; İadeli örekleme:çekile birimi aakütleye tekrar iade edilmesidir. İadesiz örekleme:çekile birim aakütleye iade edilmez. Bir aakütlede alıa şas öreklerii her birisi içi örek istatistikleri hesapladığıda örekleme dağılımları ortaya çıkar: Bir öreği ortalaması hesaplamışsa elde edile dağılımı ortalamaları örekleme dağılımı, i Her örek içi p oraları hesapladığıda oraları örek dağılımı elde edilir. 5
İki ayrı aakütlei karşılaştırılması yapılıyorsa farklarla ilgili örekleme dağılımı ortaya çıkar: Her iki aakütlede alıa A ve B büyüklüğüdeki örekleri ortalamaları hesaplamış ve bu A ve B değerleri arasıdaki farklar belirlemişse elde edile dağılım ortalamalar arası farkları örekleme dağılımıdır. Aakütlelerde alıa örekler içi oralar hesaplamış ve bu oraları aakütleler itibariyle gösterdikleri farklılıklar ortaya koulmuşsa elde edile dağılım oralar arası farkları örekleme dağılımıdır. 6
Bir populasyo parametresii tahmilemek içi şas değişkeleri kullaılır: Örek ortalaması, örek oraı, örek medyaı Örek hacmi arttıkça ( 30)... Merkezi Limit Teoremi Örekleme dağılışı ormal dağılıma yaklaşır. 7
ORTALAMALARIN ÖRNEKLEME DAĞILIMI Ortalamaları örekleme dağılımı aakütle ortalamasıı iyi bir tahmicisidir. Her biri hacimli çok sayıda öreğe ait ortalamaları gösterdiği dağımı değişkeliği tek öreği değişkeliğide daha azdır. Stadart sapma bir öreği değişkeliği hakkıda bilgi verirke, Ortalamaları örekleme dağılımıı değişkeliği stadart hatayla gösterilir. 8
Aşırı değerleri etkisii öemli ölçüde yok edilmesi, ortalamaları örekleme dağılımıı değişkeliğii azaltıcı bir faktördür. Aa kütle stadart sapması bilidiğide stadart hata x x eşitliğiyle hesaplaır. Stadart z değerleri Z x formulüyle hesaplaır. Ortalamaları örekleme dağılımıda x x yerii alır. x x 9
Herhagi bir Z değerii stadart Z değerie döüştürmeside x Z x x eşitliği kullaılır. Örekleme dağılımı Stadart ormal dağılım z = Z = 0 Z 0
Normal populasyoda örekleme Merkezi eğilim Yayılım yerie koyarak örekleme = 4 = 5 Populasyo dağılımı 50 = 0 Örekleme dağılımı =6 =.5 50
Alıştırma Türk telekomda çalışa bir operatörsüüz. Uzu mesafeli telefo görüşmeleri = 8 dk. & = dk. İle ormal dağılmakta. Eğer 5 aramalık örekler seçerseiz örek ortalamalarıı % kaçı 7.8 & 8. dk. arasıda olacaktır?
Çözüm Z 7. 8 8 5. 50 Örekleme dağılımı =.4 Z 8. 8 5. 50 Stadart ormal dağılım Z =.3830.95.95 7.8 8 8. -.50 0.50 Z 3
ORANLARIN ÖRNEKLEME DAĞILIMI Oraları örek dağılımıı ortalaması aakütle oraıa eşittir. P P Z P P P p P ÖRNEK: Büyük bir alışveriş merkezide 5000 YTL de fazla alışveriş yapa müşterileri %30 uu kredi kartı kulladığı tespit edilmiştir. 5000 YTL de fazla alışveriş yapa 00 müşteri içi oraları öreklem dağılımıı stadart hatası edir? P P 0.30 0.30 P 0.0458 00 4
ORANLARIN ÖRNEKLEME DAĞILIMI Ayı örek içi 5000 YTL de fazla alışveriş yapa 00 müşteride %0 ile %5 ii kredi kartı kullaması ihtimalii hesaplayıız. p P 0.0 0.30 p P 0.5 0.30 Z.09 P P 0.30( 0.30) P P 0.30( 0.30) 00 00 Z.8 0.33 0.36 -.8 -.09 0.4854 P(0.0 P 0.5) P(.8 Z.09) 0.4854 0.36 P(0.0 P 0.5) 0.33 5
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Ortalamalar arası farkı örek dağılımıı ortalaması μ μ ve stadart hatası da - ile gösterilir. Z 6
ORTALAMALAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Örek: İki farklı u fabrikasıda paketlee stadart kg lık u paketleri test edilmiş ve birici fabrikada alıa 00 paketi ortalaması.03 kg, stadart sapması 0.04kg; ikici fabrikada alıa 0 paketi ortalaması 0.99 kg, stadart sapması 0.05 kg bulumuştur. Aakütle stadart sapmaları bilimediği içi örek stadart sapmalarıda hareketle ortalamalar arası farkı stadart hatası, s s (0.04) (0.05) = 00 0 = 0.006 7
ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Oralar arası farkı örek dağılımıı ortalaması P P ve stadart hatası da - ile gösterilir. P P P P P P Z p p P P P P P P 8
ORANLAR ARASI FARKLARIN ÖRNEKLEME DAĞILIMI Örek: Birici fabrikadaki kusurlu mamul oraıı 0.08 ve ikici fabrikadaki kusurlu mamul oraıı 0.05 olduğu bilimektedir. Tesadüfi olarak birici fabrikada 00, ikici fabrikada 50 mamul seçilmiş ve birici örekteki kusurlu mamul oraı 0.09, ikici örekteki kusurlu mamul oraı 0.06 olarak gözlemiştir. Bua göre kusur oraları arasıdaki farkı stadart hatası: P P P P P P P P 0.08 0.9 0.05 0.95 P P 00 50 0.034 9
İstatistiksel metotlar İstatistiksel metotlar Taımlayıcı istatistikler Yorumlayıcı istatistikler Tahmileme Hipotez Testi 0
Yorumlayıcı İstatistikler Aralık tahmileme ve hipotez testlerii içerir. Amacı populasyo karakteristikleri hakkıda karar vermektir. Populasyo?
Tahmi süreci Populasyo Ortalama,, bilimiyor Şas öreği Ortalama = 50 %95 emiim ki,, 40 ile 60 arasıdadır.
Bilimeye populasyo parametreleri tahmileir... Ortalama Populasyo parametresii Örek istatistiğiyle Tahmile! Ora P p Varyas s Farklar 3
P() Tahmileyicileri Özellikleri Sapmasız A. Sapmasızlık Sapmalı B N birimlik ayı aakütlede farklı sayıda öreklem seçilebileceği içi tahmi edicii değeri de seçile örekleme göre değişmektedir. Bu durumda öreklem sayısı kadar elde edile tahmi edici, bir rassal değişke olup, ortalaması ve varyası ola bir olasılık dağılımıa sahiptir. Bu dağılımı beklee değerii aakütle parametresie eşit olmasıa, diğer bir ifadeyle bir istatistiği beklee değeri ile bilimeye aakütle parametresi arasıdaki farkı sıfıra eşit olmasıa sapmasızlık deir. E() E() 0 4
Tahmileyicileri Özellikleri. Tutarlılık (Kararlılık) P() Büyük örek hacmi A B Küçük örek hacmi Öreklemdeki birim sayısı sosuza doğru arttırıldığıda, tahmi edicii değerii aakütle değerie yaklaşması ve =N olması durumuda aralarıdaki farkı sıfıra imesi özelliğie tutarlılık deir. lim P ˆ, ı tutarlı tahmicisidir. 5
3. Etkilik P() Tahmileyicileri Özellikleri A B Etki Tahmici Birde fazla sapmasız ve tutarlı tahmici olması durumuda, bir tahmicii varyasıı, ayı aakütle parametresii başka bir tahmicisii varyasıda daha küçük olması durumuda elde edile tahmicilere etki tahmici adı verilmektedir. 6
İstatistiksel Tahmileme Nokta Tahmii Populasyo parametresii tek bir tahmi değerii verir s p σˆ Pˆ μˆ Aralık Tahmii Populasyo parametresii tahmi aralığıı verir. Nokta tahmii kullaılarak hesaplaır. 0.5 0.5 μ σ P 60 3.4.035 7
Bir değer aralığı verir. Güve Aralığı Tahmii Populasyo parametresie yakılık hakkıda bilgi verir. Olasılık terimleriyle ifade edilir. Güve Aralığı Tahmiii Elemaları Populasyo parametresii aralık içide bir yere düşmesii olasılığı Örek istatistiği Güve aralığı Alt güve sıırı 8 Üst güve sıırı 8
Güve aralığı Z Z _ x.58.645.645. 58.96. 96 Örekleri 90% Örekleri 95% Örekleri 99% 9
Güve Seviyesi Bilimeye populasyo parametresii aralık içie düşme olasılığıdır. %( - güve seviyesi : Parametrei aralık içide olmaması olasılığıdır. Tipik değerler %99, %95, %90 30
Aralıklar ve güve seviyesi Ortalamaı örekleme dağılımı aralık / Z ' da Z ' a kadaruzair - / x = _ x Çok sayıda aralık _ Aralıkları %( - ) ı yü kapsar. % sı kapsamaz. 3
Aralık geişliğii etkileye faktörler Verileri yayılımı ( Örek hacmi = / Güve seviyesi ( - ) Aralık Z 'da 'yauzair. Z 984-994 T/Maker Co. 3
33 Populasyo ortalamasıı güve aralığıı hesaplaması x x x x Z Z Hata Hata Z yada Hata Hata (5) (4) (3) () () Parametre= istatistik ±hata
Güve Aralığı Tahmileri Güve Aralıkları Ortalama Ora Varyas biliiyor 30 bilimiyor <30 Z dağılımı t dağılımı 34
ORTALAMALAR İÇİN GÜVEN ARALIĞI P z z _ x.58.645.645. 58.96. 96 Örekleri 90% Örekleri 95% Örekleri 99% 35
ORTALAMALAR İÇİN GÜVEN ARALIĞI Örek: Bir fabrikada üretile 00 mamulü ortalama ağırlığı 040 gr stadart sapması 5 gr bulumuştur. Bu imalat proseside üretile mamulleri ortalama ağırlığı %95 güvele hagi aralıktadır? %95 içi z değeri ±.96 0.475 /=0.05/=0.05 z=-.96 = 0 z=.96 Z 36
ORTALAMALAR İÇİN GÜVEN ARALIĞI P z z 5 5 P040.96 040.96 0.95 00 00 P 035. 044.9 0.95 37
Örek = 5 hacimli bir şas öreğii ortalaması = 50 dir. Populasyou stadart sapmasıı = 0 olduğu bilidiğie göre içi 95% lik güve aralığıı oluşturuuz. 50. 96 x x P( Zα/ μ Z α/ ) α 0 50. 96 5 0 5 P( )=0.95 46. 08 53. 9 P( )=0.95 38
Populasyou St.Sapması Bilimediğide ve 30 Olduğuda Ortalama İçi Güve Aralığı. Varsayımlar: POPULASYONUN stadart sapması bilimiyor Populasyo Normal dağılımlıdır.. Merkezi limit teoremi kullaılarak Z Dağılımı kullaılır. 3. Güve aralığı tahmii: Öreği st.sapması S x x P( Zα/ μ Z α/ ) α S 39
Populasyo st.sapması bilimediğide ve 30 olduğuda ortalama içi güve aralığı öreği Bir ampul şirketi yei bir ampul geliştirerek piyasaya sürüyor. Üretim badıda 00 taesi rassal olarak seçiliyor ve buları stadart sapması 40 saat, kulaım süreleri de ortalama olarak 80 saat buluuyor. =0.05 içi populasyo ortalamasıı güve aralığıı buluuz. Sx Sx P( Zα/ μ Zα/ ) α 40 40 P( 80.96 80.96 )=0.95 00 00 P(5.56 307.44) 0.95 Yorum: Şirketi ürettiği ampulleri ortalama ömrü, 0.95 olasılıkla 5.56 ile 307.44 saat arasıdadır. 40
Bir Oraı Güve Aralığı. Varsayımları İki kategorik çıktı vardır. Populasyo Biom dağılımı gösterir.. Güve aralığı tahmii: P( pˆ pˆ pˆ Z.S P pˆ Z.S ) α/ α/ α pˆ x Özellikli birim sayısı Örek hacmi S p ˆ pˆ. qˆ 4
ÖRNEK: Bir Oraı Güve Aralığı 400 lise öğreciside oluşa bir örekte 3 öğreci üiversite sıavıı kazamıştır. Üiversite öğrecilerii sıavı kazama oraı içi %95 lik güve aralığıı buluuz. pˆ 3 400 0.08 P( pˆ pˆ pˆ Zα/.S P pˆ Zα/.S ) α 0.08 0.08 0.08 0.08 P 0.08.96 P 0.08.96 0.95 400 400 P 0.053 P 0.07 0.95 4
43 İki Ortalamaı Farkı İçi Güve Aralığı Populasyo Varyasları Biliiyorsa: Z Z P / / α S S Z μ μ S S Z P α/, α/, Populasyo Varyasları Bilimiyor fakat > 30 olduğuda:
Populasyo st.sapması bilimediğide ve >30 olduğuda iki ortalama farkı içi güve aralığı öreği Bir yabacı dil kursuu A sııfıda bilgisayar destekli ve B sııfıda klasik yötemlerle eğitim verilmektedir. Kursu başlagıcıda 6 hafta sora her iki sııfa da ayı test uygulaarak souçlar karşılaştırılmıştır. A sııfıda rassal olarak seçile 40 öğrecii test soucuda elde ettiği ortalama başarı otu 86 ve stadart sapması, B sııfıda rassal olarak seçile 35 öğrecii ortalama başarı otu 7 ve stadart sapması 4 tür. Her iki sııftaki öğrecileri ortalama başarı otları arasıdaki farkı güve aralığıı %99 olasılıkla belirleyiiz. 86 S 40 7 S 4 35 44
Populasyo st.sapması bilimediğide ve >30 olduğuda iki ortalama farkı içi güve aralığı öreği 86 S 40 7 S 4 35 P P S S S S α/, α/, Z μ μ Z α 40 4 35 86 7.58 μ μ 86 7.58 0. 99 40 4 35 6.8 μ μ.8 0. 99 P 45
İki Ora Farkıı Güve Aralığı. Varsayımları İki kategorik çıktı vardır. Populasyolar Biom dağılımı gösterir.. Güve aralığı tahmii: pˆ pˆ Z S P P pˆ pˆ Z S Pr α/ pˆ pˆ α/ pˆ pˆ S pˆ pˆ pˆ.ˆ q pˆ.ˆ q İki ora farkıı stadart sapması 46
İki Ora Farkıı Güve Aralığıa Örek İki farklı ilacı bir hastalığı tedavi etme oralarıı farklı olup olmadığı kotrol edilmek istemektedir. Bu amaçla 000 er adet hasta üzeride A ve B ilaçları deesi. Tedavi souda A ve B ilaçlarıı uyguladığı hastaları sırasıyla 85 ve 760 ıı iyileştiği gözlediğie göre ilaçları hastalığı tedavi etme oralarıı farkıı %95 lik güve aralığıı buluuz. 85 760 = 000, = 000 pˆ 0,85 ˆ p 0, 760 000 000 S pˆ pˆ pˆ.qˆ pˆ.qˆ 0.85.( 0.85) 000 0.08 0.760.( 0.760) 000 47
İki Ora Farkıı Güve Aralığıa Örek pˆ pˆ Z S P P pˆ pˆ Z S Pr α/ pˆ pˆ α/ pˆ pˆ 0.8 0.760.960.08 P P 0.8 0.760.960.08 0. 95 r 0.09 P P 0.0 0. 95 Pr 48
STANDART SAPMA İÇİN GÜVEN ARALIĞI Örek stadart sapması s,aakütle stadart sapması ı okta tahmiidir. Nokta tahmiide hareketle aakütle stadart sapmasıı güve aralığı, s s Z s Z s / - / Z Z s Z s s Z s s 49
Stadart Sapmalar içi Güve Aralığıa Örek Bir makiada, bir hafta içerside yapıla 00 bilyeli yatağı çapları ölçülmüş ve ortalama.09 cm, stadart sapma ise 0. cm bulumuştur. Bütü bilyeli yatakları çaplarıa ait stadart sapmaı güve sıırlarıı buluuz. =00. 09 0. s 0. 0 0. 0..58 0..(00).58 0..(00 0.0958 0.4 50