Merkezi Eğilim Ölçüleri 1) Parametrik merkezi eğilim ölçüleri Serinin bütün birimlerinden etkilenen merkezi eğilim ölçüleridir. 1) Aritmetik ortalama 2) Geometrik ortalama (G) 3) Harmonik ortalama (H) 2) Parametrik olmayan merkezi eğilim ölçüleri Serinin bütün birimlerinden etkilenmeyen merkezi eğilim ölçüleridir. 1) Tepe değeri (Mod) (X mod ) 2) Ortanca (Medyan) (X med )
Aritmetik ortalama Xort = Σ Xi/n = X1+X2+.+Xn / n 1 5 7 4 3 Beş işletmeye ait sağmal hayvan sayısı (baş) Σ Xi=1+5+7+4+3=20 = Σ Xi/n =20/5= 4
Burada: x : Örnek aritmetik ortalaması : Anakitle aritmetik ortalaması n N x i : Örnek büyüklüğü (i= 1. 2..n) : Anakitle büyüklüğü (i= 1. 2..n) : i nci deneğe ait veri
Excel de Aritmetik Ortalama
Sınıf genişliği 3-12 13-22 23-32 33-42 43-52 53-62 63-73 topla Sınıf değeri 8 18 28 38 48 58 68 Frekans 12 14 8 8 6 1 1 çarpım 96 252 224 304 288 58 68 50 1290 1290/50=25.8 Gerçekte=25.6
Ağırlıklı aritmetik ortalama Xort w = (Σ xi wi) / (Σ wi) İşletme no: 1 2 2 4 5 Verim (kg/da) 4400 4280 4500 4600 4300 Ekim alanı (da) 5 10 4 3 8 Toplam üretim 22000 42800 18000 13800 34400 (Σ xi*wi)=22000+42800+18000+13800+34400=131000 Σ wi=30 Xort w = 131000/30= 4366.667 kg/da ritmetik ortalaması Σ Xi/n =(4400+4280+4500+4600+4300)/30=22080/30= 4416 kg/da
Geometrik Ortalama G = n x1.x2 xn Ln G = 1/n (lnx1 + lnx2+ +lnxn) n: Gözlem sayısı x: Gözlem
İşletme no 1 2 3 4 5 Arazi genişliği (da) 5 10 4 3 8 G = n x1.x2 xn = 5 5x10x4x3x8 = 5 4800 = 5.4481 lng= 1/5 (ln5+ln10+ln4+ln3+ln8) = 1/5 (1.609438+2.302585 +1.386294+1.098612+2.079442)= (8.476371 / 5)= 1.695274 anti Ln=e(1.695274)=G=5.4481 aritmetik ortalaması Σ Xi/n =(5+10+4+3+8)/5=28/5= 5.6 da
Harmonik Ortalama 1/H = 1/n *Σ 1/xi İşletme no 1 2 3 4 5 Arazi genişliği (da) 5 10 4 3 8 1/H = 1/5*(1/5+1/10+1/4+1/3+1/8)=1/5*1.0083=0.20167 1/H=0.20167 H=4.9585
Mod Veri setindeki en çok tekrar eden gözlem, o veri setinin mod udur. Mod, veri setinin hakim değerini gösterir. Modu bulabilmek için, basit gruplandırma yapılır. Frekansı en fazla olan grup, mod değeridir. Bazı veri setlerinde, birden fazla mod bulunabilir. Eğer iki mod varsa, veri seti bimodaldir. Mod, veri setindeki çok büyük veya çok küçük değerlerden etkilenmez.
Mod 3 10 20 25 40 5 12 20 28 42 9 15 20 30 45 10 15 20 30 45 10 15 22 35 46 10 15 22 35 49 10 15 24 35 50 10 15 24 35 50 10 18 25 36 55 10 20 25 40 70 MOD kaçtır?
Sınıf genişliği 3-12 13-22 23-32 33-42 43-52 53-62 63-72 Gruplandırılmış verilerde Mod hesabı Sınıf Uçları 2.5-12.5 12.5-22.5 22.5-32.5 32.5-42.5 42.5-52.5 52.5-62.5 62.5-72.5 xmod = L1 + (Δ1/ Δ1+ Δ2). C Sınıf değeri 8 18 28 38 48 58 68 Frekans xmod =12.5+(2/2+6)*10=15 12 14 8 8 6 1 1 L 1 : Mod sınıfının alt ucu Δ 1 : Mod sınıfı frekansıyla, bir önceki sınıfın frekansı arasındaki fark Δ 2 : Mod sınıfı frekansıyla, bir sonraki sınıfın frekansı arasındaki fark c : Mod sınıfının büyüklüğü
3 10 20 25 40 5 12 20 28 42 9 15 20 30 45 10 15 20 30 45 10 15 22 35 46 10 15 22 35 49 10 15 24 35 50 10 15 24 35 50 10 18 25 36 55 10 20 25 40 70
Medyan Küçükten büyüğe sıralanmış bir veri setinde, ortada yer alan değer, medyandır. Medyan, veri setini ortadan ikiye böler. Verilerin %50 si medyanın altında, %50 si ise üstünde kalır. Medyan, veri setinin X (n+1/2) nci değeridir. Veri sayısı tek ise, medyanı bulmak kolaydır. Zira ortada tek bir değer vardır. Ancak veri sayısı çift olduğunda, ortada iki değer yer alacağından, bunların ortalaması olarak medyan bulunur.
3 10 20 25 40 5 12 20 28 42 9 15 20 30 45 10 15 20 30 45 10 15 22 35 46 10 15 22 35 49 10 15 24 35 50 10 15 24 35 50 10 18 25 36 55 10 20 25 40 70
Gruplandırılmış Verilerde Medyan X medyan = L1 + [(n/2 Σf m-1 )/ f m ]. c L 1 : Medyan sınıfının alt ucu Sınıf genişliği 3-12 13-22 23-32 33-42 43-52 53-62 63-72 Sınıf Uçları 2.5-12.5 12.5-22.5 22.5-32.5 32.5-42.5 42.5-52.5 52.5-62.5 62.5-72.5 Sınıf değeri 8 18 28 38 48 58 68 Frekans 12 14 8 8 6 1 1 En az ek. F. 12 26 34 42 48 49 50 n : Gözlem sayısı f m : Medyan sınıfının frekansı Σf m-1 : Medyan sınıfından bir önceki sınıfın den az eklemeli frekansı c : Medyan sınıfının büyüklüğü X medyan = 12.5 + [(50/2 12)/ 14]. 10=21.785=22 Bulunan bu değerin anlamı nedir?
Kartiller (Dörtte Birler) Küçükten büyüğe sıralanmış veri setinin %25 lik parçalarına denk gelen verilerdir. Üç adet dörtte bir bulunur. Birinci kartil (alt kartil= Q 1 ); İkinci kartil (orta kartil = Q 2 =Medyan); Üçüncü kartil (üst kartil = Q 3 ).
x 1 Q 1 Q 2 Q 3 x n Verilerin %25 i, alt kartil değerinin; %50 si orta kartil değerinin; %75 i ise üst kartil değerinin altında kalır. Verilerin %75 i, alt kartil değerinin; %50 si orta kartil değerinin; %25 i ise üst kartil değerinin üzerinde kalır. Verilerin %50 si alt ve üst kartil değerleri arasında yer alır.
Q1 =X (n+1/4) =X13 Q2 = X 2*(n+1/4) =(X25+ X26 ) Q3 = X 3*(n+1/4) =X38 3 10 20 25 40 5 12 20 28 42 9 15 20 30 45 10 15 20 30 45 10 15 22 35 46 10 15 22 35 49 10 15 24 35 50 10 15 24 35 50 10 18 25 36 55 10 20 25 40 70 Bulunan bu değerin anlamı nedir? Verilerimizin %75 si 35 nin altında, %75 i 15 nun üstündedir. Verilerimizin %50 si, 15 ile 35 arasında bulunmaktadır. Verilerin %50 si 22 den büyük yada küçüktür.
Kutu Grafik Kutu grafikle, kartiller, en küçük ve en büyük değerler aynı anda görülebilmektedir. Böylece veri setinin yayılımı, toplanma merkezi ve simetisi hakkında çok çabuk fikir sahibi olunabilir.
Bir şirketteki erkek çalışanların maaşlarından, Q 1 = 350, Q 3 = 900, x medyan = 500, x min = 200, x max = 1200 TL olduğu tespit edilmiştir. Şimdi bu parametreleri kullanarak, kutu grafiği çizelim. 100 200 300 400 500 600 700 800 900 1000 1100 1200 1300 Maaş (TL)
Kutu Grafik Erkek çalışanların maaşlarının yarısı, 350 TL ile 900 TL arasında yer almaktadır. Medyan çizgisi, kutunun sol kenarına yakın olduğundan, sağa çarpık olduğunu, bir başka ifadeyle, maaşların sağ tarafta toplandığını göstermektedir.
5.8. Onda Birler Sıralanmış bir veri setini 10 eşit parçaya ayıran gözlemlerin belirlenmesi, onda birler yardımıyla yapılır. Böylece veri setindeki gözlemlerin %10, %20,., %90 lık bölümünün, hangi değerin üzerinde veya altında kaldığı belirlenir. Bir veri setinde 9 adet onda bir vardır. Formülü: D1 = X (n+1/10) D2 = X 2(n+1/10).D9 = X 9(n+1)/10 x: gözlem n: gözlem sayısı
b) Verilerin %80 i hangi gözlemin altında yer alır? Eğer 8. onda biri bulduğumuz taktirde, verilerin %80 ı o gözlemin altında kalacaktır. D7 = X 8(50+1/10) = X 40.8 = 0.8(X40) + 0.2(X41) = 0.8 (40) + 0.2 (40) =40 Verilerimizin, %70 ı 40sayısının altında kalacaktır. 3 10 20 25 40 5 12 20 28 42 9 15 20 30 45 10 15 20 30 45 10 15 22 35 46 10 15 22 35 49 10 15 24 35 50 10 15 24 35 50 10 18 25 36 55 10 20 25 40 70
Yüzde Birler Sıralanmış bir veri setini 100 eşit parçaya ayıran gözlemlerin bulunmasında, yüzde birlerden yararlanılır. Onda birlerin daha duyarlı şeklidir. Formülü: x: Gözlem n= Gözlem sayısı P 1 = X (n+1/100) P 99 = X 99(n+1/100) P 35 = X 35(n+1/100)
Gruplandırılmış Verilerde Kartiller (Q3 ü hesaplayalım) Q k = L 1 + [(kn/4) (ΣfQ k -1)] / fq k ]. c k: Kartil sayısı L 1 : Sınıf genişliği 3-12 13-22 23-32 33-42 43-52 53-62 63-72 Sınıf Uçları 2.5-12.5 12.5-22.5 22.5-32.5 32.5-42.5 42.5-52.5 52.5-62.5 62.5-72.5 Sınıf değeri 8 18 28 38 48 58 68 Frekans Q k = 32.5+ [(3*50/4) (34)] / 8 ]. 10=36.9=40 12 14 8 8 6 1 1 En az ek. F. 12 26 34 42 48 49 50 Bulunan bu değerin anlamı nedir? Kartil sınıfının alt ucu N: gözlem sayısı f Qk : Kartil sınıfının frekansı Σ f Qk- 1 : Kartil sınıfından bir önceki sınıfın den az eklemeli frekansı c: Kartil sınıfının büyüklüğü
Q k = L 1 + [(kn/4) (ΣfQ k -1)] / fq k ]. c D k = L 1 + [(kn/10) (ΣfD k -1)] / fd k ]. c P k = L 1 + [(kn/100) (ΣfP k -1)] / fp k ]. c
Düzeltilmiş Aritmetik Ortalama Aritmetik ortalamanın önemli sakıncalarından biri olarak, uç değerlerden etkilenmesini göstermiştik. Uç değerler ayıklandığı taktirde, bu sakınca giderilmiş olacaktır. Uç değerleri ayıklamak için, 3 yöntemden yararlanılmaktadır 1. Kartiller 2. Kartil Aralığı 3. Yüzdebirler
Kartilleri Kullanarak Düzeltilmiş Aritmetik Ortalama Sıralanmış bir veri setinde, 1. kartilden küçük ve 3. kartilden büyük değerleri çıkarıp, geride kalan verilerle, düzeltilmiş aritmetik ortalama hesaplayabiliriz. Böylece, uç değerler ayıklanmış ve aritmetik ortalama üzerindeki etkileri giderilmiş olacaktır. Sıralanmış veri setimiz. 5 5 6 6 7 7 8 8 8 17 18 Önce mevcut haliyle aritmetik ortalama hesaplanır: X ort = 95 / 11 = 8.64
Şimdi 1. ve 3. kartili belirleyelim: Q 1 = X n+1/4 = X 11+1/4 = X 3 = 6 Q 3 = X 3(n+1)/4 = X 3(11+1)/4 = X 9 = 8 1. kartil olan 6 dan küçük ve 3. kartil olan 8 den büyük verileri çıkardıktan sonra veri setimiz: 5 5 6 6 7 7 8 8 8 17 18 6 6 7 7 8 8 8 Uç değerleri uzaklaştırdığımıza göre, artık düzeltilmiş aritmetik ortalamayı hesaplayabiliriz. X ort = 50 / 7 = 7.14 X ort = 95 / 11 = 8.64
Örnek 5-25 Bu örnekte de, bir önceki veri setini kullanarak, alt ve üst uçtaki yüzde 10 luk dilimleri çıkaralım. Bunun için %10 unu ve %90 ı bulmamız gerekecek. 5 5 6 6 7 7 8 8 8 17 18 P 10 = X 10(n+1)/100 = X 1.2 = 5 5(0.1)+5(0.9)=1+4=5 P 90 = X 90(n+1)/100 = X 10.8 = 17(0.1)+18(0.9)=1.7+16.2=17.9 Buna göre 5 ten küçük ve 17 9 den büyük veriler elenecektir. 5 ten küçük veri yoktur. 17.9 den büyük tek veri 18 dir. Tek uç değer 18 dir.
5 5 6 6 7 7 8 8 8 17 Buna göre düzeltilmiş aritmetik ortalama: X ort = 77 / 10 = 7.7
Ödev n=25 Örnek hacmi 25 olan veri seti hazırlayarak; 1) Aritmetik ortalamasını hesaplayın, 2) Geometrik ortalamasını hesaplayın, 3) Harmonik ortalamasını hesaplayın, 4) Mod ve medyan değerlerini hesaplayın, 5) Verileri Gruplandırılmış veriler şekline dönüştürerek aynı işlemleri tekrarlayın.