Balıkesir Üiversitesi İşaat Mühedisliği Bölümü umutokka@balikesir.edu.tr İSTATİSTİK DERS NOTLARI Yrd. Doç. Dr. Umut OKKAN idrolik Aabilim Dalı
Balıkesir Üiversitesi İşaat Mühedisliği Bölümü Bölüm 5 Örekleme Dağılımları ve İstatistik ipotezler Örekleme Dağılımıı Taımı Asimptotik Örekleme Dağılımları Kesi Örekleme Dağılımları İstatistik ipotezler
Örekleme Dağılımıı Kavramı Taımı Bir rastgele değişkei herhagi bir β parametresii gerçek değeri hiçbir zama biliemez. Acak örekte parametrei tahmii ola b istatistiği elde edilebilir.. örek ( b ) N TOPLUM (β) N i. örek ( b ) i. örek ( b ) N N. örek ( b ) β parametresie karşı gele b istatistiğii ayı büyüklükte (N) çeşitli öreklerde hesaplaa değerleri de farklılık taşımakta ve bir dağılım göstermektedir. Bu dağılıma örekleme dağılımı deir.
Örekleme Dağılımıı Kavramı Taımı f() b PG ( Güve Düzeyi ) ( P G ) b E() b b b güve aralığı b ( P G ) Örekteki N elema sayısı artıkça belli bir güve düzeyie karşı gele güve aralığı daralmaktadır. Büyük öreklerde parametrei belli bir olasılıkla içide kalacağı güve aralığı daha küçük olduğuda parametre tahmiideki hata da az olur (Bayazıt&Yeğe, 3). N geçerli ise örekleme dağılımıa asimptotik dağılım deir.
Asimptotik Örekleme Dağılımları
Asimptotik Örekleme Dağılımları ÖRNEK-: 7 adet çelik putrel üzeride yapıla deeylerde kırılma yüküü ortalaması 849 kg, stadart sapması 4 kg bulumuştur. Ortalamaı %95 güve düzeyideki güve aralığıı asimptotik ormal dağılım kabulü ile buluuz. Var ( ) / N / N 4 / 7 76.98 kg PG.95 z.96 balt.96* 834 kg b.96* 864 kg üst 834 kg 864 kg 849 kg
Kesi Örekleme Dağılımları Küçük öreklerde (N 3) rastgele değişkei ormal dağılmış olması durumuda bazı özel istatistikler içi aalitik yollar ile dağılımlar taımlaabilmektedir. Ortalamaı kesi örekleme dağılımı Bu ifade öcede değiile asimptotik dağılımla ayıdır. Acak asimptotik dağılım değişkeii dağılımı e olursa olsu geçerli ike kesi dağılımı kullaılabilmesi içi değişkei ormal dağılmış olması gerekmektedir. u / N u istatistiğii kullaılabilmesi içi toplum parametresi ola σ parametresii bilimesi gerekmektedir. Bu pratikte mümkü olmadığıda t istatistiğii kullaılması daha uygudur. t s / N sˆ / N f() t İstatistiğii dağılımı s.d=n- ola studet-t dağılımıdır. t tablosu P(t>t α ) olasılığıı verir. t
Kesi Örekleme Dağılımları Stadart Normal t (s.d = 3) t (s.d = 5)
Kesi Örekleme Dağılımları Studet ı t tablosuu kullaımı: Tek yölü test içi (α) s.d.5..5. 3.78 6.34.87.886.9 = 3 s.d= - = =. / =.5 Tek yölü test içi (α).5 3.765.638.353 t değerleri.9 t Bkz. t, ki-kare, f tablosu.pdf
Kesi Örekleme Dağılımları t tablo değeri MS-Ecel ile hesaplaabilmektedir. Bkz. t-f-kikare_tablo.ls
Kesi Örekleme Dağılımları Stadart sapmaı örekleme dağılımı NS ( N ) Sˆ İstatistiğii dağılımı s.d=n- ola ki-kare dağılımıdır. Ki-kare istatistiği (chi-square) Ki-kare tablosu P ( ) olasılığıı verir. f ( ) İki öreği ( ve Y) varyasları açısıda ayı topluma ait olup olmadıkları ise F (Fisher) istatistiği ile gerçekleştirilebilir. F Sˆ / Sˆ / Y Y ( F içi) F istatistiğii dağılımı payıı s.d = N-, paydasıı s.d=ny- ola Fisher dağılımıdır. (agi varyas büyükse paya alıır!)
Kesi Örekleme Dağılımları ÖRNEK-: 7 adet çelik putrel üzeride yapıla deeylerde kırılma yüküü ortalaması 849 kg, stadart sapması 4 kg bulumuştur. a) Ortalamaı %95 güve düzeyideki güve aralığıı kesi örekleme dağılımı kullaarak buluuz. b) Ayı örek içi %9 güve düzeyide varyası güve aralığı edir? a) N<3 olduğuda t istatistiğii kullaılması daha uygudur. = 7 s.d= - = 6 = -.95=.5 / =.5 Tek yölü test içi (α) 838kg 849 kg 865kg ttablo t 6,.5.56 b.56* S N 849.56* 4 6 838 kg alt b.56* S N 849.56* 4 6 865kg üst Örek- i çözümüe kıyasla güve aralığı geişlemiştir. Küçük öreklerde t dağılımı kullaıldığıda güve aralığıı geişlemektedir.
Kesi Örekleme Dağılımları b).9.5.95 sd b alt sd b üst güve düzeyi içi ve tablo değerleri gereklidir 6içi 38.89.5 NS 7*4 83kg.5 38.89 6içi 5.38.95 NS 7*4 8884kg.95 5.38 Bua göre yukarıdaki değerleri kareköküü alıp toplumu stadart sapmasıı 333 kg ila 53 kg aralığıda kalacağıı söyleyebiliriz. İlave örekler içi bkz. Bayazıt & Yeğe (3) Mühedisler İçi İstatistik Birse Yayıevi
Kesi İstatistik Örekleme ipotezler Dağılımları Bir rastgele değişkei herhagi bir β parametresii gerçek değeri hiçbir zama biliemediğide bir karar vermek adıa β parametresi içi bir kabul yapılır. β= β İstatistik ipotez Bu kabulü doğruluğu örekte elde edile parametre değeri (b) ile kotrol edilir. İlgili istatistiği örekleme dağılımıı bilimesi şartıyla hipotezi kabul ya da reddie karar verilir. ipotezi kabul ya da reddie karar vermede öce bir alamlılık düzeyi (α) seçilir. Bu red bölgesii alaıı temsil eder. α değeri seçildikte sora karşıt hipoteze bağlı olarak red bölgesii bir parçalı ya da iki parçalı olup olmadığıa karar verilir. Bir hipotez testide iki hipotez yer alır: : Boş hipotez, sıfır hipotezi Daha öce doğru olduğu ispatlaa veya ortak kabul görmüş yargılara sıfır hipotezi( ) deir. İadığımız durum hipotezide yer alır. Aksi kaıtlamadıkça hipotezi doğru kabul edilir. : Karşıt (Alteratif) hipotez İddia edile durum hipotezide ele alıır. Sıfır hipotezide belirtile yargıı tersi bir yargıyı içide buludura hipoteze alteratif hipotez ( ) deir. Kedii kaıtlama zorululuğu hipotezie aittir.
: : Bir (tek)uçlu testler: : : Kesi İstatistik Örekleme ipotezler Dağılımları ÇİFT TARAFLI TEST (iki uçlu test) Sağ uç (kuyruk) testi f(b) f(b) RED / β Kabul bölgesi β Kabul bölgesi RED / RED b b f(b) : : Sol uç (kuyruk) testi RED β Kabul bölgesi b
Kesi İstatistik Örekleme ipotezler Dağılımları Test Kararı kabul ( reddedilemez) doğru Doğru karar (-α) Gerçek durum yalış Yalış karar II.tip hata() kabul ( kabul edilemez ) Yalış karar I.tip hata(α) Doğru karar - f(b) α isteildiği kadar küçültülemez! Pratikte %5 ve % gibi değerler seçilir. Kabul β β (gerçek) Red b
Kesi İstatistik Örekleme ipotezler Dağılımları ipotez Testide Test İstatistiğii Belirlemesi Ortalama ya da iki ortalama farkı içi biliiyor bilimiyor >3 3 Z istatistiği t istatistiği Varyaslar içi Bir varyas içi istatistiği İki varyas oraı içi F istatistiği
Kesi Örekleme Dağılımları İstatistik ipotezler bilidiğide Z test istatistiği Z bilimediğide fakat >3 olduğuda Z test istatistiği Z s s ORTALAMALARLA İLGİLİ İSTATİSTİK TESTLER 3 şartı sağlaıyor ve σ bilimiyor ise t istatistiği kullaılmalı! ˆ h t s s
Kesi İstatistik Örekleme ipotezler Dağılımları ÖRNEK-3: Bir fabrikada üretilmekte ola vidaları boylarıı ortalaması mm, ve stadart sapması mm ola ormal dağılım gösterdikleri bilimektedir. Makielerde ola bir arıza giderildikte sora üretile vidalarda alıa 9 vidalık bir öreği boy ortalaması mm olarak bulumuştur. Makielerdeki arıza giderilirke vidaları boyuu ayarı bozulmuş mudur? =.5 içi test ediiz ve yorumlayıız. : mm Z hesap 3 : mm 9 P G =.95 / =.5 / =.5 ztablo.96 -.96.96 Z
Kesi İstatistik Örekleme ipotezler Dağılımları RED RED / =.5 / =.5 Z tablo =.96 Z hesap =3 Karar verme ve yorumlama: Z hesap değeri red bölgesie düştüğü içi hipotezi kabul edilemez. Yai vidaları boy ortalaması mm de farklıdır. Makiei ayarı bozulmuştur yeide kalibre edilmesi gereklidir.
Kesi Örekleme Dağılımları İstatistik ipotezler İki ortalama farkı içi test istatistiği: ) ( ) ( ) ( Z biliiyor ise: Aakütle varyasları bilimediğide buları yerie örek varyasları kullaılır. Sıfır hipotezii doğru olduğu varsayımı ile hareket edildiğide - farkı sıfır kabul edilir.
Kesi Örekleme Dağılımları İstatistik ipotezler ) ( ) ( ) ( s s s Z ) ( ) ( s Z h bilimiyor fakat örek hacimleri >3 ise: s s s Sıfır hipotezi örekleri ayı aa kütlede alıdığıı belirttiği içi tersi ispatlamadığı sürece s ve s değerlerii birbiriyle homoje olduğuu varsayılır ve ortak varyas hesaplaır. bilimiyor fakat örek hacimleri 3 ise ) ( ) ( s t h ( ) ( ) s s s s.d t t kr -t kr α/ red red α/
Kesi İstatistik Örekleme ipotezler Dağılımları Aakütle Varyası İçi ipotez Testi Çift Kuyruk Testi : / / : χ, / kabul χ, / hesap S ( ) Sˆ Sağ Kuyruk Testi : : Sol Kuyruk Testi : : χ kabul, χ kabul,
Kesi İstatistik Örekleme ipotezler Dağılımları İki Varyası Durağalılığı Testi : F Testi Varyasları ve ola ormal dağılımlı iki aakütlede ve gözlemli bağımsız iki öreği varyasları s ve s olsu. İki aakütle varyasıı birbirie eşit olup olmadığıı test etmek içi F testi uygulaır. P G =-α F h Sˆ / Sˆ / ( F içi) h
Kesi İstatistik Örekleme ipotezler Dağılımları ÖRNEK-4: Bir işaat malzemeside asfalt oraıı ortalama %5 olması istemektedir. Üretile malzemelerde asfalt oraıı stadart sapması %.75 olmak üzere ormal dağıldığı varsayılıyor. Alıa üç malzeme öreğide asfalt oraı %4., 4.7 ve 3.7 olarak ölçülmüştür. a) asfalt oraıı ortalamasıı %5 e eşit olup olmadığıı % alamlılık düzeyide kotrol ediiz. : : %5 %5 %4. %4.7 %3.7 3 %4. / =.5 / =.5 Z hesap 4. 5.75 3.85 edf.9.5.95 z tablo.645.645.85 Z hesap Karar:.645 Z hesap değeri red bölgesie düştüğü içi hipotezi kabul edilemez.
Kesi İstatistik Örekleme ipotezler Dağılımları b) Asfalt oraı ortalamasıı %5 te alamlı derecede küçük olup olmadığıı % alamlılık düzeyide kotrol ediiz. : %5 : %5 =..8.85 Z hesap edf. z tablo.8 Karar: Z hesap değeri red bölgesie düştüğü içi hipotezi kabul edilemez. karşıt hipotezi kabul edilir ve bua göre, asfalt oraı ortalamasıı %5 te küçük olduğu % öem seviyeside söyleebilir.
Kesi İstatistik Örekleme ipotezler Dağılımları c) Toplum stadart sapma değerii bilimemesi halide asfalt oraıı ortalamasıı %5 e eşit olup olmadığıı % alamlılık düzeyide kotrol ediiz. 3 şartı sağlaıyor ve σ bilimiyor ise t istatistiği kullaılması uygu olur. t h s sˆ Veri sayısı az olduğuda örekte tarafsız stadart sapma hesaplaması uygu olacaktır. sˆ * (4. 4.) (4.7 4.) (3.7 4.) %.5 3 : : %5 %5 t h 4. 5.77 sˆ.5 3 s. d 3.5 t tablo.9 KARAR Red Kabul -.9 -.77.9 Red : : %5 hipotezi kabul edilir.
Kesi İstatistik Örekleme ipotezler Dağılımları d) Malzeme örekleride hesaplaa stadart sapmaı %.75 değeride farklı olup olmadığıı % alamlılık düzeyide kotrol ediiz. : (%.75) /=.5 /=.5 : (%.75) χ, / kabul χ, /.9 güve düzeyi içi ve tablo değerleri gereklidir sd sd içi 5.99.5 içi..95.5.95 ( ) Sˆ (3).5 hesap.89.95.89.5.75 : (%.75) kabul edilir.
Kesi İstatistik Örekleme ipotezler Dağılımları ÖRNEK-5: Bir meteoroloji istasyouda 6 yıllık sıcaklık gözlemide oluşa rassal bir öreklemde varyas 3.35 o C dir. yıllık gözlemde oluşa bağımsız bir rassal öreklemde ise varyas 98.4 o C dir. Bu iki veri setii varyaslarıı eşit olup olmadığıı % alamlılık düzeyide test ediiz. : : 6.9 güve düzeyi içi F.5 ve F.95 tablo değerleri gereklidir Pay s.d: -=5 payda s.d: -= F.5.85 F.39.95 F hesap s s 3.35 98.4.57 F.57 F.95.5 o hipotezi kabul edilir. Yai bu iki veri setii varyaslarıı % alamlılık düzeyide homoje olduğuu söyleyebiliriz.