İstatistik ve Olasılığa Giriş Robert J. Beaver Barbara M. Beaver William Mendenhall Presentation designed and written by: Barbara M. Beaver İstatistik ve Olasılığa Giriş Ders 3 Verileri Sayısal Ölçütlerle İfade Etme Some graphic screen captures from Seeing Statistics Some images 001-(current year) www.arttoday.com Verileri Sayısal Ölçütlerle İfade Etme Verileri ifade etmek için grafik metodu her zaman yeterli olmayabilir. Sayısal ölçümler (Numerical measures) hem yığında hem de örnek te kullanılabilir. 1
Ortanın Ölçülmesi Veri dağılımının ortası yatay eksenin üzerinden ölçülür ve eksenin üzerindeki verileri eşit iki parçaya böler. Aritmetik Ortalama (Arithmetic Mean or Average) Bir gurup verinin mean i (Ortalaması) o verilerin toplamlarının verilerin sayısına oranı ile bulunur xi x = n = burada n = verilerin sayısı Verilerin tümünün toplamı Aritmetik Ortalama (Arithmetic Mean or Average) Bir yığının mean i (Ortalaması) o yığındaki tüm verilerin toplamlarının verilerin sayısına oranı ile bulunur = μ = N burada N= yığındaki verilerin sayısı Verilerin tümünün toplamı
Örnek: Veriler:, 9, 1,, 6 x μ i + 9 + 11+ + 6 33 = = = = 6. 6 N Eğer tüm yığını biliyorsak o zaman ortalama μ ( mü ) olur. Yas 33 41 49 7 6-33 - 41-49 - 7-6 - 73 Frekans f j 14 13 9 7 Örnek: Eğer sınıflanmış veriler verilirse: ej + e x j = 9 37 4 3 61 69 j+ 1 μ x f N j j = =.9 + 14.37 + 13.4 + 9.3 + 7.61+.69 0 90 = = 4.8 0 Ortanca (Median) Sıralanmış verilerin tam ortasında bulunan değere median (ortanca) denir. Ortancanın yeri 0.(n + 1) Tabi ki veriler sıralandıktan sonra 3
Örnek Gurubumuz:, 4, 9, 8, 6,, 3 n = 7 Sıralı :, 3, 4,, 6, 8, 9 Yeri: 0.(n + 1) = 0.(7 + 1) = 4.üncü Median = 4.üncü veri Gurubumuz:, 4, 9, 8, 6, n = 6 Sıra :, 4,, 6, 8, 9 Yeri: 0.(n + 1) = 0.(6 + 1) = 3. Median = ( + 6)/ =. 3üncü ve 4üncü verinin ortalaması Tepe değer (Mode) mode (Tepedeğer) bir gurup veride ençok tekrarlanan değerdir. Gurubumuz:, 4, 9, 8, 8,, 3 mode iki kez tekrarlanan 8 dir. Gurubumuz:,, 9, 8, 8,, 3 Hiç sorun değil Burada İki tane mod var 8 ve (bimodal) Gurubumuz:, 4, 9, 8,, 3 Hiç sorun değil Mode yok (her değer tektir). Örnek Eve dağıtılan süt şişelerinin sayısı verilmiştir: 0 0 1 1 1 1 1 3 3 3 3 3 4 4 4 Mean (Ortalama)? xi x = = =. n Median (Ortanca)? m = Mode(Tepedeger)? mode = Relative frequency 10/ 8/ 6/ 4/ / 0 0 1 Quarts 3 4 4
Uç Değerler Ortalama çok küçük veya çok büyük değerler için çok çabuk değişmektedir MY APPLET Eğer dağılımımız çarpıksa ortalama olarak medyan kullanılır. Uç Değerler Symmetric: Mean = Median Sağa çarpık: Mean > Median Sola Çarpık: Mean < Median Yayılım Ölçüleri (Measures of Variability) Yığının veya yığından elde edilen örneğin birim değerlerinin etrafında birimin değerini belirleyen ölçüdür.
Açıklık (Range) Açıklık, en büyük veri ile en küçük veri arasındaki fark. Örnek: Bir botanist çiçeğin taç yapraklarının sayısını kaydediyor. :, 1, 6, 8, 14 Bu durumda range R = 14 = 9. Hızlı ve kolay ancak sadece veriden sini kullanıyor. Varyans variance tüm değerlerin ortalama değerden olan farklarının ölçüdür. Çiçek Yaprakları:, 1, 6, 8, 14 4 = = 9 x 4 6 8 10 1 14 Varyans N elemanı bunan bir yığının varyansı denilen ölçüm, değerlerin ortalama değerden farklarının karelerinin ortalamasıdır. ( μ) σ = N Bir örneğin ortalaması ise ( xi x) s = n 1 6
Standart Sapma Standard Deviation Varyansı hesaplarken tüm farkların karesini almak suretiyle gerçek ölçümden uzaklaşmış olduk. Tekrar gerçek ölçüm aralığına dönmek için yapılacak işlem varyansın kare kökünü almaktır. Bunada Standart Sapma (Standard deviation), denir. Yığının Standart Sapması: σ = Örneğin Standart Sapması: s = σ s Bir Örneğin Varyansını Hesaplamanın İki farklı Yolu Top lam x 1 6 8 14 4 i xi x ( x x) -4 3-3 -1 0 i 16 9 9 1 60 Tanımdaki Formülü Kullanarak: ( xi x) s = n 1 s = s 60 = = 1 4 = 1 = 3.87 Bir Örneğin Varyansını Hesaplamanın İki farklı Yolu Sum 1 6 8 14 4 144 36 64 196 46 Hesaplama Yolu ile bulma: ( xi ) xi s = n n 1 4 46 = = 1 4 s = s = 1 = 3.87 7
Yüzdelikler İlgilendiğimiz ölçümün altında kaç tane ölçümün olduğunu bulmak için kullanılan ölçüme p th percentile denir. p % p th percentile (100-p) % x Örnek 16 ve daha büyük yaşta olan adamların % 90 ı haftada $319 lira veya daha fazla kazanmaktadır. 10% $319 90% BUREAU OF LABOR STATISTICS $319 10. yüzdelik dilimindedir. 0. Percentile. Percentile 7. Percentile Ortanca Alt Dörttebir (Q 1 ) Üst Dörttebir (Q 3 ) Quartiles ve IQR Alt dörttebir (Q 1 ) lik kısım x değerlerinin % den fazla ve % 7 den az olan kısımdır. Üst dörttebir (Q 3 ) ise x değerlerinin % 7 den fazla ve % den az olan kısımdır. Ortadaki 0% aralığı ise dörtlükler arası aralık, IQR = Q 3 Q 1 8
Örneklerin Dörtte birinin Hesabı (Q 1 ve Q 3 ), değerleri aşağıdaki gibi hesaplanır Q 1 in hesaplanışı 0.(n + 1) Q 3 in hesaplanışı 0.7(n + 1) Değerler sıralandıktan sonra eğer ölçüm sonucu tamsayı değilse değeri bulmak için yeni bir enterpolasyon yapılır. Örnek 18 değişik marka ayakkabının fiyatları aşağıda verilmiştir: 40 60 6 6 6 68 68 70 70 70 70 70 70 74 7 7 90 9 Q 1 = 0.(18 + 1) = 4.7 Q 3 = 0.7(18 + 1) = 14. Q 1 değeri 4. ve. sayı arasında ¾ orana sahip olan sayı, or Q 1 = 6 + 0.7(6-6) = 6. Örnek 18 değişik marka ayakkabının fiyatları aşağıda verilmiştir: 40 60 6 6 6 68 68 70 70 70 70 70 70 74 7 7 90 9 Q 1 = 0.(18 + 1) = 4.7 Q 3 = 0.7(18 + 1) = 14. Q 3 ise 14. ve 1. değerler arasında 1/4 orana sahip sayı, veya Q 3 = 7 + 0.(7-74) = 7. ve IQR = Q 3 Q 1 = 7. - 6 = 10. 9