İSTATİSTİK TAHMİN TEORİSİ Yrd. Doç. Dr. Bület İ. GONCALOĞLU Geellikle iki tür tahmide yararlaılmakta Nokta tahmii (Tek değer tahmii) Aa kitle parametreleri bilimediği hallerde öreklerde elde edilmiş değerlerde tahmi yapmaktır. Aralık tahmii Örekte elde edilmiş iki değer arasıdaki aralığı ifade etmekte ve aa kitle parametresii bu iki değer arasıda buluması beklemektedir.
Nokta tahmii Örekte hesaplaa x, s, s, p,... aa kütlei okta tahmiidir. 3 Aralık Tahmii μ ü Güve Aralığı Tahmii Aa kitle oraıı Güve Aralığı Tahmii Fark ve Toplamlar İçi Güve Aralığı Tahmii 4
Tahmileri Özellikleri Tahmileri başarılı olabilmesi içi: Sistematik hata içermemeli Tutarlı olmalı ( arttıkça aa kütle parametresie yakısamalı) Etki olmalı (değişkeliği (varyası) küçük olmalı) Yeterli olmalı (örekteki tüm bilgiler kullaılmalı) 5 Sistematik hata x i matematik ümidi (Beklee değeri) :E(x) Bir istatistiği matematik ümidi tahmi edilmek istee aa kütle parametresie eşit ise söz kousu istatistik sistematik hata içermiyor demektir. E(x) = μ 6 3
Tutarlılık Örek istatistiği, örek adedi arttıkça aa kütle parametresie yaklaşıyorsa örek istatistiği tutarlıdır deir. N içi x μ 7 Etkilik Değişkeliği az ola istatistik daha etkidir. Tahmii yapılmak istee parametre μ ise, hagi örek istatistiği (medya, aritmetik ortalama) μ etrafıda daha fazla toplamış ise (yai varyası daha az ise) o istatistik daha etkidir deir. E küçük varyasa sahip tahmi e etkidir 8 4
Yeterlilik Tahmi hesabıda örekteki bilgileri tamamı kullaılıyor ise tahmi yeterlidir. Öreği: μ ü tahmii içi aritmetik ortalama tüm örek verilerii kullaırke medya tümüü kullamaz. Bua göre aritmetik ortalama yeterli tahmidir. 9 Örek Bir gülük imalat ola 800 parça içide tesadüfi seçimle 0 parçalık bir örek seçilmiştir. Örekteki parçaları boyları ortalama 5.4 cm ve stadart sapma. cm olduğua göre; a) Gerçek ortalamayı b) Gerçek varyası sistematik hata içermeye ve etki tahmilerii buluuz. 0 5
Çözüm a) Aritmetik ortalama (5.4 cm) sistematik hata içermeye, etki tahmidir. b) s=. cm olduğuda s =4.84 cm, sistematik hata içermeye etki tahmii ise 0 ŝ = s = 4. 84 = 4. 88 0 Örek mevcudu Normal dağılıma sahip rastgele değişkelerde tahmi hatası e = z. x = z. Örek mevcudu z = e 6
μ ü Güve Aralığı Tahmii x z < μ < x + z =0.05 içi z =.96 μ, ortalamaları güve aralıklarıı % 95 ii içidedir. 3 Örek: Tesadüfi olarak seçilmiş 64 öğrecii boy uzulukları ortalaması 6 cm ve stadart sapma 4 cm dir. Okuldaki öğrecileri boy uzulukları ortalaması içi % 95 güve aralığı edir? Çözüm: % 95 içi z değeri.96 (tabloda) x z < μ < x + z 4 6. 96 < μ < 6+. 96 64 6. 0< μ < 6. 98 4 64 4 7
Aa kitle oraıı (П) Güve Aralığı Tahmii p ± z. p p z Π( Π) < Π < p + z Π( Π) =0.05 içi z =.96 p:örek oraı П:aa kütle oraı 5 Örek: Tesadüfi olarak seçilmiş 44 seçmei % 0 sii X partisii desteklediği görülmüştür. Bu oraı % 95 güve seviyeside güve aralığı edir? Çözüm: p z Π( Π) < Π < p + z Π( Π) 0. 0. 96 0. 0( 0. 0) < Π < 0. 0 +. 96 44 0. 0( 0. 0) 44 0.36<П<0.64 6 8
9 7 Fark ve Toplamlar İçi Güve Aralığı Tahmii S S z S S + ± S S z S S + ± + =0.05 içi z =.96 S, S Dağılımları ormal ola iki örek istatistiği. 8 Ortalama farkları içi güve aralığı X X. z X X ± z X X + ±
Ora farkları içi güve aralığı П - П içi güve aralığı (p p ) ± z Π( Π) Π( Π) + 9 İSTATİSTİK KARAR TEORİSİ Yrd. Doç. Dr. Bület İ. GONCALOĞLU 0 0
İSTATİSTİK KARAR TEORİSİ İstatistik karar: Belirli parametreleri doğruluğuu kabul veya reddi. Bir karara varabilmek içi bazı varsayımlar ileri sürülür bu varsayımlara hipotez deir. İstatistikte, tahmi ettiğimiz (hesapladığımız) değer ile aa kitle değeri arasıdaki farkı sıfır olduğuu varsayımıa sıfır hipotezi (H o ) deir. Sıfır hipotezii alteratifi H hipotezidir. Hipotezler: H 0 ve H / H 0 Kabul /
(Tip ) ve β (Tip ) Hataları Tip, Tip, β H 0 doğru Red H 0 yalış Kabul : testi alamlılık düzeyi 3 (Tip ) ve β (Tip ) Hataları yı küçültmek, β yı arttırır. β 4
Hipotez Testi Nasıl Yapılır?. Sıfır hipotezi ve alteratif hipotez belirleir. Testi alamlılık düzeyi seçilir 3. Kritik değer hesaplaır 4. Test değeri hesaplaır 5. Kritik değer ile test değeri karşılaştırılır. 5 Ortalamalarla ilgili hipotez testleri İki taraflı testler Tek taraflı testler z = x μ s Ortalama farkları ile ilgili testler z = x s x s + 6 3
Ortalamalarla ilgili hipotez testleri Örek: Bir bölgedeki aileleri yıllık ortalama gelirlerii.68 m TL olduğu tahmi edilmektedir. Bu bölgede tesadüfi olarak seçile 00 ailei yıllık gelir ortalaması.59 m TL ve stadart sapması 0.4 m TL olarak hesaplamıştır. 0.0 alamlılık düzeyi içi bölgedeki aileleri yıllık ortalama gelirlerii.68 m TL olduğuu söyleyebilir miyiz? 7 Ortalamalarla ilgili hipotez testleri Çözüm: İki taraflı test. H 0 : μ=.68 m TL H : μ.68 m TL Z=±.58 (kritik değer, tablo değeri). 59. 68 z = = 6. 49 0. 4 00 Mutlak değerce hesaplaa z kritik z de büyük olduğuda H 0 reddedilir. 8 4
Ortalamalarla ilgili hipotez testleri Örek: Bir fabrikaı hale kullamakta olduğu tezgah saatte ortalama 35 parça imal edebilmektedir. Yei tip tezgahı,çalışması esasıda tesadüfi olarak seçile 36 saat içide ortalama 38 parça imal ettiği ve stadart sapmaı 0 parça olduğu tespit edilmiştir. 0,0 alamlılık yüzeyi içi yei tezgahı diğeride üstü olduğuu söyleyebilir miyiz? 9 Ortalamalarla ilgili hipotez testleri Çözüm: Tek taraflı test. H 0 : μ=35 m TL H : μ>35 m TL Z=±.33 (kritik değer, tablo değeri) 38 35 z = =. 8 0 36 Hesaplaa z, kritik z de küçük olduğuda H 0 kabul edilir. 30 5
Oralarla ilgili hipotez testleri Örek oraı ile ilgili testler z = p Π Π( Π) Ora farkları ile ilgili testler p p z = p p p p = Π ( Π) Π( + Π ) 3 Küçük Öreklere Dayalı Tahmiler ve Hipotez Testleri (Studet (t) Dağılımı) 3 6
Örek mevcudu az (<30) ve aa kitle varyası bilimediği hallerde örek istatistiği aritmetik ortalamaı Dağılımı t Dağılımıa yaklaşmakta. 33 t Dağılımı Test istatistiği t = x μ s ile hesaplaır. t hesap < t kritik ise H o kabul. υ=- serbestlik derecesi. 34 7
Çift kuyruk sıaması içi öem düzeyi Derecesi (v) 0. 0. 0.05 0.0 0.0 0.00 3.08 6.3.7 3.8 63.66 636.6.89.9 4.30 6.96 9.9 3.60 3.64.35 3.8 4.54 5.84.9 4.53.3.78 3.75 4.60 8.6 5.48.0.57 3.36 4.03 6.87 6.44.94.45 3.4 3.7 5.96 7.4.89.36 3.00 3.50 5.4 8.40.86.3.90 3.36 5.04 9.38.83.6.8 3.5 4.78 0.37.8.3.76 3.7 4.59.36.80.0.7 3. 4.44.36.78.8.68 3.05 4.3 3.35.77.6.65 3.0 4. 4.35.76.4.6.98 4.4 5.34.75.3.60.95 4.07 6.34.75..58.9 4.0 7.33.74..57.90 3.97 8.33.73.0.55.88 3.9 9.33.73.09.54.86 3.88 0.33.7.09.53.85 3.85.3.7.08.5.83 3.8.3.7.07.5.8 3.79 3.3.7.07.50.8 3.77 4.3.7.06.49.80 3.75 5.3.7.06.49.79 3.73 30.3.70.04.46.75 3.65 35 t Dağılımıda ortalama içi güve aralığı x t s < μ < x + t s 36 8
Ortalamalarla ilgili hipotez testleri x μ İki taraflı testler t = s Tek taraflı testler Ortalama farkları ile ilgili testler Bağımsız iki örek t = x x + Bağımlı iki örek (d:fark) d t = (d d) 37 χ (Khi-Kare) Dağılımı Yrd. Doç. Dr. Bület İ. GONCALOĞLU 38 9
χ (Khi-Kare) Dağılımı Çok şıklı sayımlı deeylerde, araştırma souçlarıı frekas bakımıda kategorilere ayrılabildiği ve sürekli değişkelerle açıklamaı mümkü olmadığı hallerde Biom dağılımı yerie kullaılır. 39 χ (Khi-Kare) Dağılımı χ (f = g ft) f t χ hesap < χ tablo ise H o kabul. v=k- serbestlik derecesi 40 0
Serbestlik Derecesi =p(χ >χ,v ) (v) 0.005 0.0 0.03 0.05 0.0 0.5 0.50 0.75 0.90 0.95 0.98.00 7.88 6.63 5.0 3.84.7.3 0.45 0.0 0.0 0.00 0.00 0.00 0.60 9. 7.38 5.99 4.6.77.39 0.58 0. 0.0 0.05 0.0 3.84.34 9.35 7.8 6.5 4..37. 0.58 0.35 0. 0.07 4 4.86 3.8.4 9.49 7.78 5.39 3.36.9.06 0.7 0.48 0. 5 6.75 5.09.83.07 9.4 6.63 4.35.67.6.5 0.83 0.4 6 8.55 6.8 4.45.59 0.64 7.84 5.35 3.45.0.64.4 0.68 7 0.8 8.48 6.0 4.07.0 9.04 6.35 4.5.83.7.69 0.99 8.95 0.09 7.53 5.5 3.36 0. 7.34 5.07 3.49.73.8.34 9 3.59.67 9.0 6.9 4.68.39 8.34 5.90 4.7 3.33.70.73 0 5.9 3. 0.48 8.3 5.99.55 9.34 6.74 4.87 3.94 3.5.6 6.76 4.7.9 9.68 7.8 3.70 0.34 7.58 5.58 4.57 3.8.60 8.30 6. 3.34.03 8.55 4.85.34 8.44 6.30 5.3 4.40 3.07 3 9.8 7.69 4.74.36 9.8 5.98.34 9.30 7.04 5.89 5.0 3.57 4 3.3 9.4 6. 3.68.06 7. 3.34 0.7 7.79 6.57 5.63 4.07 5 3.80 30.58 7.49 5.00.3 8.5 4.34.04 8.55 7.6 6.6 4.60 6 34.7 3.00 8.85 6.30 3.54 9.37 5.34.9 9.3 7.96 6.9 5.4 7 35.7 33.4 30.9 7.59 4.77 0.49 6.34.79 0.09 8.67 7.56 5.70 8 37.6 34.8 3.53 8.87 5.99.60 7.34 3.68 0.86 9.39 8.3 6.6 9 38.58 36.9 3.85 30.4 7.0.7 8.34 4.56.65 0. 8.9 6.84 0 40.00 37.57 34.7 3.4 8.4 3.83 9.34 5.45.44 0.85 9.59 7.43 4.40 38.93 35.48 3.67 9.6 4.93 0.34 6.34 3.4.59 0.8 8.03 4.80 40.9 36.78 33.9 30.8 6.04.34 7.4 4.04.34 0.98 8.64 3 44.8 4.64 38.08 35.7 3.0 7.4.34 8.4 4.85 3.09.69 9.6 4 45.56 4.98 39.36 36.4 33.0 8.4 3.34 9.04 5.66 3.85.40 9.89 5 46.93 44.3 40.65 37.65 34.38 9.34 4.34 9.94 6.47 4.6 3. 0.5 30 53.67 50.89 46.98 43.77 40.6 34.80 9.34 4.48 0.60 8.49 6.79 3.79 4 χ (Khi-Kare) Dağılımı Tek yölü tablolar (tek satır) İki yölü tablolar (iki satır ve iki sütü) Çok yölü tablolar (ikide fazla satır, sütu) 4
χ (Khi-Kare) Dağılımı Örek: Bir şirkete yei gire 8 sekreteri test soucu belirli süre içide yaptıkları daktilo hataları tabloda verilmiştir. % 5 hata payı ile sekreterleri daktilo yazma kabiliyetlerii ayı olduğu söyleebilir mi? 3 4 5 6 7 8 Toplam Test (Gözlee) 3 7 4 4 6 9 5 40 Beklee 5 5 5 5 5 5 5 5 40 Çözüm: χ = (fg f ) f t t ( 3 5) = 5 ( 7 5) + 5 ( 5 5) +... + 5 = 7. υ=k-=8-=7 içi kritik değer (tablo değeri) 4.07 dir. Hesap değeri< tablo değeri olduğuda fark olmadığıı ileri süre sıfır hipotezi kabul edilir. 43 ÖRNEK: Eğitim durumlarıa göre 00 kişii gelirleri tabloda verilmiştir. Eğitim durumu ile gelir düzeyi arasıda bir bağlılık var mıdır? ilköğretim Lise Üiversite Toplam 500 TL i altıda 500 TL ve daha yüksek 50 50 0 0 40 0 0 80 Toplam 90 70 40 00 44
Teorik değerler ilköğretim Lise Üiversite Toplam 500 ytl i altıda 0*90/00=54 0*70/00=4 0*40/00= 4 0 500 ytl ve daha yüksek 80*90/00=36 80*70/00=8 80*40/00= 6 80 Toplam 90 70 40 00 χ = (fg f ) f t t ( 50 54) = 54 ( 50 4) + 4 ( 0 6) +... + 6 = 6, 9 υ=(k-)(h-)=(3-)(-) içi kritik değer (tablo değeri) =5,99 SONUÇ: Hesap değeri> tablo değeri olduğuda bağımlılık vardır. 45 Uygulama Aşağıdaki dağılımlara sahip rastgele değişkeler içi yukarıda alatılalarla ilgili birer örek çözüüz. χ dağılımı Studet (t) dağılımı 46 3