Yayılma Ölçütleri Merkezi eğilim ölçüleri ile bir frekans dağılımının merkezi belirlenirken; yayılma ölçüleri ile değişkenliği veya yayılma düzeyini tespit eder. Bir başka ifade ile, bir veri setinin, belli bir merkez etrafında toplanma yoğunluğu, yayılma ölçüleriyle saptanır.
I. Aralık II. Kartil aralığı III. Mutlak sapma, IV. Varyans V. Standart sapma VI. Varyasyon katsayısı Yayılma ölçütleri
Aralık Veri setinin, en büyük ve en küçük değerleri arasındaki fark olarak hesaplanmaktadır. Rmax = X max - Xmin
Örnek İşletme no 1 2 3 4 5 Arazi genişliği (da) 5 10 4 3 8 Aralığın hesaplanması kolaydır. Ancak, değişkenliği duyarlı olarak ölçemez ve bilgilendirici değildir. Örneğin, aşağıda, aralık aynı olmakla birlikte, ikinci dağılımının, merkez etrafında daha az değişkenlikle toplandığı açıkça görülmektedir. I II
Kartil Aralığı Aralık, veri setindeki çok büyük ve çok küçük verilerde etkilenir. Bu nedenle, yayılma hakkında doğru bir bilgi sağlamayabilir. Uç veriler elendikten sonra, aralık hesaplanması bir çare olarak düşünülebilir. 3. kartil ile 1. kartil değerleri arasındaki farkı alarak hesapladığımız aralıkta, uç veriler dikkate alınmamış olacaktır. Bu şekilde hesaplanan aralık, kartil aralığı (intervention of quartile: IQ) olarak bilinir.
Örnek IQ = Q3 Q1 Burada: IQ = Kartil aralığı Q3 = 3. kartil değeri, Q1 = 1. kartil değeri 1 4 10 12 14 15 17 19 20 21 22 24 1. kartil: Q1 = X n+1/4 = X 12+1/4 = X 3 = 10 3. kartil: Q3 = X 3(n+1/4) = X 3(12+1/4) = X 9 = 20 IQ = Q3 Q1 = 20-10=10 Aralık değeri ; Rmax =Xmax Xmin Rmax= 24-1 =23
Mutlak Sapma Gözlemlerin, aritmetik ortalamadan farklarının mutlak değerleri toplanıp, gözlem sayısına bölünür. Formülü: a = Σ X - X / n Burada: a : mutlak sapma X : gözlem X: Aritmetik ortalama
X= (5+10+4+3+8) =6 5 Örnek İşletme no 1 2 3 4 5 Arazi genişliği (da) 5 10 4 3 8 a = 5 6 + 10 6 + 4 6 + 3 6 + 8 6 5 a = 1 + 4 + 2 + 3 + 2 5 = 12 5 = 2,4
İşletme no 1 2 3 4 5 Arazi genişliği (da) 7 8 4 3 8 X =6, a = 2.2 bulunur. İki veri setinin aritmetik ortalamaları aynı iken, mutlak sapmaları farklıdır. İlk veri seti, ikinciye göre daha fazla değişkenlik gösterdiği için, yayılması daha fazladır.
Varyans Bir veri setinin varyansı, gözlemlerin aritmetik ortalamasından ne kadar saptığını belirler. Varyans, gözlemlerin aritmetik ortalamadan farklarının karelerinin ortalamasıdır. Varyans birimi, verilerin birimiyle aynıdır (metre, kg, TL) Mutlak sapmada olduğu gibi, yayılması az olan veri setlerinin varyansı küçüktür. Anakitle ve örnek için farklı hesaplanır.
Anakitle varyansı: σ 2 = Burada: (X μ)2 N σ 2 : Anakitle varyansı X : Gözlem µ : Anakitle aritmetik ortalaması N : Anakitle Gözlem sayısı
İşletme no 1 2 3 4 5 Arazi genişliği (da) 5 10 4 3 8 μ=6 olduğuna göre; Gözlem (X) X-µ (X-µ) 2 5 5 6 = -1 1 10 10 6 = 4 16 4 4 6 = -2 4 3 3 6 = -3 9 8 8-6= 2 4 Toplam 0 34 σ 2 = 34 / 5 = 6.8
İkinci yöntem σ 2 = X2 ( x N N )2 = 214 5 =42.8-36=6.8 Gözlem (X) X 2 5 25 10 100 4 16 3 9 8 64 x=30 X 2 =214 ( 30 5 )2 iki formülden de aynı sonuç elde edilmiştir.
Örnek varyansın hesabı: S 2 = (X X)2 n 1 s 2 : Örnek varyansı X : Gözlem X : Örnek aritmetik ortalaması n : Gözlem sayısı
S 2 = (X X)2 n 1 = 8.5 Gözlem (X) (X-X) 2 5 (5-6) 2 = 1 10 (10-6) 2 =16 4 (4-6) 2 = 4 3 (3-6) 2 = 9 8 (8-6) 2 = 4 X=6 34
İkinci yöntem S 2 = x2 ( x)2 n n 1 = 214 (30)2 5 5 1 = 214 180 = 34 =8.5 4 4 Gözlem (X) X 2 5 25 10 100 4 16 3 9 8 64 Σ 30 214
Standart Sapma Varyansın karekökü, standart sapmayı verir. Standart sapma, veri setinin yayılma düzeyini belirler. Daha küçük standart sapma, daha az yayılma veya değişkenliği gösterir. Formülü, anakitle ve örnek için farklıdır.
Anakitle standart sapması: σ = (X μ) 2 N σ : Anakitle standart sapması X : Gözlem Kolay formül: σ = X 2 N ( x N )2 µ : Anakitle aritmetik ortalaması N : Anakitle Gözlem sayısı
Örnek standart sapması S = (X X) 2 n 1 Kolay formül: S: Örnek standart sapması X : Gözlem S = x)2 n n 1 x 2 ( X : Örnek aritmetik ortalaması n : Gözlem sayısı
Daha önce hesapladığımız anakitlenin varyansı: σ 2 =6.8 σ = σ 2 = 6.8 =2.60768 2.61 Daha önce hesapladığımız örnek varyansı: S 2 =8.5 S= S 2 = 8.5 =2.915475 2.92
Standart Sapmanın Yorumu X± (k)s aralığına düştüğü kabul edilir. Burada k, herhangi bir pozitif katsayıdır ve genellikle 1, 2 ya da 3 olarak kabul edilir. Deneysel olarak, çan eğrisine benzer bir dağılım gösteren veri setlerinde, verilerin belirtilen aralıklarda bulunma olasılıklarının: X± s Genellikle, %60 ila %80 arasındadır. Bu oran, simetrik dağılımlarda %70, sivri tepeli dağılımlarda %90 lara ulaşmaktadır. X± 2s Simetrik dağılımlarda %95. X± 3s Yaklaşık %100. olduğu saptanmıştır.
Örnek 246 örnekten oluşan bir araştırmada, çiftçilerin yıllık gübre harcamaları elde edilmiştir. Ortalama gübre kullanımına ilişkin harcaması, 20.02 TL/ay, standart sapması ise 3.49 TL/ay dır. Verilerin dağılımı çan şeklinde ve simetriktir. Deneysel oranları kullanarak, verilerin belirli aralıklarda bulunma olasılıklarını ve kaç gözlemin bu aralıklara girdiğini belirleyelim. 20.02 ± 1 (3.49) (20.02 3.49, 20.02 + 3.49) (16.53, 23.51) Gübre harcaması %70 i, 16.53 TL ile 23.51 TL arasındadır. Bu aralığa, %70 x 246 = 172.2=172 çiftçi girmektedir.
%95 20.02 ± 2 (3.49) (20.02 2(3.49), 20.02 + 2(3.49)) (13.04, 27) Gübre harcaması %95 i, 13.04 TL ile 27 TL arasındadır. Bu aralığa, %95 x 246 = 233.7=234 çiftçi girmektedir.
Standart sapmanın 2. yorumlama şeklini, Tchebychev kuralı denir. Bu kurala göre, aritmetik ortalaması µ, standart sapması σ olan bir anakitleyi oluşturan gözlemlerin en az: %100 (1-1/m 2 ) adedi, aritmetik ortalamanın m standart sapma çerçevesinde yer alır (m > 1 için µ ± mσ). Örneğin, m=2 iken, anakitleyi oluşturan gözlemlerin en az: %100 (1-1/2 2 ) = %75 i Gözlemlerin en az %75 i aritmetik ortalamanın sağında ve solundaki 2 standart sapmalık alanda yer alacaktır.
Aritmetik ortalaması µ=9 ve standart sapması σ=2 olan bir anakitlenin, farklı m değerleri için: m µ - mσ µ + mσ %100 (1-1/m 2 ) 1.5 9 (1.5 x 2)= 6 9+ (1.5 x 2) = 12 [1-(1/1.5 2 )]=55.6 2.0 9 (2 x 2)= 5 9 + (2 x 2) = 13 [1-(1/2 2 )]=75.0 2.5 9 (2 x 2.5)= 4 9+ (2 x 2.5) = 14 [1-(1/2.5 2 )]=84.0 3.0 9 (2 x 3.0)= 3 9+ (2 x 3.0) = 15 [1-(1/3 2 )]=88.9 Anakitleyi oluşturan gözlemlerin %55.6 sı, 6 ile 12 arasındaki gözlemlerdir. Yine anakitleyi oluşturan gözlemlerin en az %88.9 u, 3 ile 15 arasındaki gözlemlerdir. Ödev:%100 (1-1/m 2 )=95 olması için m kaç olmalıdır? Değerlerin %95 içindeki alt ve üst sınırı kaçtır?
Varyasyon (Değişkenlik) katsayısı Özellikle farklı birimlere sahip değişkenlerin karşılaştırılmasında, değişkenlik katsayısından yararlanılır. Örneğin, bireylerin ağırlık ve boyları; bir malın fiyatı ve talebi; hane halklarının gelir ve süt tüketimleri, farklı birimlere sahiptir. Değişkenlik katsayısının formülü: DK = (S / X). 100 Burada: DK : Değişkenlik katsayısı (%) S: Standart sapma X: Aritmetik ortalama
Öğrenci Ağırlık (kg) Boy (m) 1 70 1.62 2 72 1.75 3 78 1.80 4 85 1.98 5 70 1.55 s 6.48 0.167 Xort 75 1.74 DK (%) 8.6 9.6
Ödev n=25 Örnek hacmi 25 olan veri seti için; a) Aralık değerlerini, Kartil aralığını, Mutlak sapmasını, Varyans ve Standart sapma değerlerini hesaplayıp yorumlayınız. b) Aşağıdaki veri setine ilişkin Varyasyon değerini hesaplayıp yorumlayın İşletme Arazi genişliği (da) İlaç kullanımı (lt) 1 53 2.54 2 55 2.68 3 63 2.36 4 60 2.74 5 65 2.98