Prof.Dr.İhsan HALİFEOĞLU
Örnek: Aşağıda 100 yetişkine ilişkin kolesterol değerlerini sınıflandırılarak aritmetik ortalamasını bulunuz (sınıf aralığını 20 alınız). 2
x A fb C 229.5 n 40 20 100 221.5 3
Örnek:. Aşağıda yaşların verilen 56 öğretmenin yaşlarının aritmetik ortalaması nedir? (Sınıf aralığını 5 olarak alınız) 25 32 35 41 41 31 46 51 37 32 35 44 26 36 43 41 38 33 44 39 31 47 32 42 48 28 47 35 34 42 40 50 37 49 31 42 33 43 28 40 49 27 41 36 35 43 26 34 36 33 45 33 42 52 38 44 x A n fb C 4
Çözüm: Yaş Sınıf Değeri (SD) Frekans (f) b fb 25-29 27 6-3 -18 30-34 32 13-2 -26 35-39 37 11-1 -11 40-44 42 (SD) 16 0 0 45-49 47 7 +1 +7 50-54 52 3 +2 +6 Toplam 56-42 A = 42 C = 5 n = 56 Σfb = -42 Değerler formülde yerine yerleştirilir. x x fb A C n 38.25 42 42 56 x 5 38.25 5
Ortanca (medyan): Ortanca, düzensiz verileri küçükten büyüğe veya büyükten küçüğe doğru sıraladıktan sonra, sıralamanın tam orta noktasındaki değer olarak tanımlanabilir. Ortanca dağılımdaki aşırı değerlerden etkilenmez. Dağılımda aşırı değerler varsa aritmetik ortalamanın yerine ortanca kullanılabilir. Ortancada, dağılımdaki değerlerin yarısı ortancaya eşit veya daha küçük, yarısı da ortancaya eşit veya daha büyüktür. Ortancanın hesaplanması, aritmetik ortalamada olduğu gibi sınıflandırılmamış ve sınıflandırılmış verilerde farklı şekilde yapılır. 6
Ortancanın tespiti: Dağılımdaki değerler büyükten küçüğe veya küçükten büyüğe doğru sıralandığında ortadaki değer ortancadır. Sınıflanmamış Verilerde Ortancanın Hesaplanması 1) Denek sayısı tek ise [(n+1)/2] ci değer, 2) Denek sayısı çift ise tam orta noktada bir değer olmadığından [n/2] ci değer ile [(n+2)/2] ci değer toplanıp 2 ye bölünerek ortanca tespit edilir. 7
Örnek: 15 çocuğun vücut ağırlıkarı aşağıda verilmiştir. Ortancayı bulunuz 31.9 30.6 29.4 39.9 28.1 29.0 30.4 26.3 29.4 22.5 30.0 33.6 28.0 31.0 32.6 Önce değerleri küçükten büyüğe göre sıralayalım: 22.5 26.3 28.0 28.1 29 29.4 29.4 30.0 30.4 30.6 31.0 31.9 32.6 33.6 39.9 n sayısı tek olduğundan [(15+1)/2]=8 ci değer 30.0 ortancadır. Örnek sayısının 14 olduğunu yani 39.9 değerin olmadığını düşündüğümüzde ise ortanca [14/2]=7 ci ve [(14+2)/2]=8 ci değerlein toplamımının yarısıdır. Yani (29.4+30.0)/2=29.7 dir. 8
Örnek: 7 öğrencinin ağırlıkları (kg) 55, 46, 75, 45, 50, 58, 53 olarak bulunmuştur. Ortancayı bulmak için; Önce değerler küçükten büyüğe doğru ya da tersi sıralanır. 45, 46, 50, 53, 55, 58, 75 n=7 olduğundan (7+1) / 2 = 4 Ortanca 4 ncü değer olan 53 tür. 9
Denek sayısı çift ise; n/2 nci sıradaki değer ile (n+2)/2 nci sıradaki değer toplanıp 2 ye bölünerek ortanca bulunur. Örnek: 8 öğrencinin ağırlıkları (kg): 55, 46, 60, 45, 50, 58, 53, 80 olduğuna göre ortanca kaçtır? Önce değerler küçükten büyüğe doğru ya da tersi sıralanır. 45, 46, 50, 53, 55, 58, 60, 80 n=8 (çift) olduğundan 8/2 = 4 ve (8 + 2)/2 = 5 4. ve 5. değerler, 53 ve 55 in ortalaması olan (53+55) /2 = 54 ortancadır. 10
Sınıflanmış Verilerde Ortancanın Hesaplanması Sınıflandırılmış verilerde ortancanın hesaplanmasında sırası ile şu işlemler yapılır: 1. Sınıflar yazılır. 2. Her sınıfın frekansı yazılır. 3. Yığılımlı frekans (yf) bulunur. Yığılımlı frekans her sınıfın frekansının önceki frekanslarla toplamıdır. 11
Sınıflandırılmış verilerde ortanca formülü: n yfi 2 Ortanca L x C f Formülde: L = Ortancanın içinde bulunduğu sınıfın sınıf ara değeridir. Bu değer; ortancanın içinde bulunduğu sınıfın alt sınırı ile bir üstündeki sınıfın üst sınırının toplanıp ikiye bölünmesi ile elde edilir. yfi = Ortancanın içinde bulunduğu sınıfın bir üstündeki sınıfın yığılımlı frekansı. f = Ortancanın içinde bulunduğu sınıfın frekansı. C = Sınıf aralığı. n = denek sayısı. 12
Örnek: Aşağıdaki sınıflandırılmış verilerde ortancanın hesaplanması: Formüle yerleştirilecek değerleri bulmak için önce ortancanın hangi sınıfın içinde olduğunu bulmak gerekir. Bunun için, (n/2) =100/2=50 bulunur. 50 yığılımlı frekans kolonunda 67 nin içinde bulunduğundan ortancanın içinde bulunduğu sınıf 30 34 sınıfıdır. 13
L = (30+29)/2 = 29,5 n/ 2=50 yf = 37 C = 5 f = 30 Ortanca L n 2 yfi x C f 100 37 2 Ortanca 29.5 x 5 30 14 31.6
Tepe değeri (Mod): Sınıflanmamış verilerde tepe değeri en çok görülen, yani en çok tekrarlayan değerdir. Aşağıdaki dağılımda tepe değeri 11.0 dır. 10.5 10.0 10.4 11.0 11.0 11.6 12.0 11.8 11.0 11.0 13.6 14.0 10.1 12.3 11.5 Bir dağılımda aynı sayıdan görülen değişik değerler varsa tepe değeri kullanılmamalıdır. Aşağıdaki dağılımda tepe değeri olabilecek 3 değer (24, 31 ve 54) vardır. Birbirinden farklı bu 3 değerin üçünü de tepe değeri olarak kullanmanın bir anlamı yoktur. Böyle bir durumda tepe değeri uygun bir ölçüt olmamaktadır. 31.0 24.0 19.0 24.0 31.0 45.0 54.0 67.0 54.0 54.0 24.0 27.0 27.0 31.0 15
Örnek: Bir grubun matematik sınavından aldığı puanlar; 40, 40, 42, 42, 42, 43, 43, 43, 43, 45, 45, 50, 50, 55 ve 60 olsun. Bu dizide 43 en çok tekrarlanan değer olduğundan tepe değeri = 43 dür. Gözlem sonunda elde edilen ölçümlerin her birinin tekrar sayısı birbirine eşitse bu durumda tepe değeri olmaz. Örneğin; 45, 47, 55, 57, 60, 72, 77 ya da 45, 45, 50, 50, 56, 56, 58, 58, 60, 60, 75, 75 ve 80, 80 dizilerinde tepe değeri yoktur. Çünkü iki dizide de ölçümlerin hepsi eşit sayıda tekrarlanmıştır. 16
Ardışık iki ölçüm birbirine eşit sayıda ve öbür ölçümlerden daha çok tekrarlanmışsa, bu gibi durumlarda, tepe değeri ardışık iki ölçünün orta noktasıdır. Örnek: 50,50, 51, 51, 51, 52, 52, 52, 52, 53, 53, 53, 53, 54, 55, 55, 55 ve 56 şeklindeki bir dizide; Tepe değeri = 52,5 olur. Çünkü 52 ve 53 eşit sayıda ve öbür ölçümlerden daha çok tekrarlanmaktadır; bunların orta noktası da 52,5 dir. 17
Sınıflandırılmış verilerde tepe değeri en fazla frekansa sahip olan sınıfın değeridir. Ayrıca Sınıflandırılmış verilerde tepe değeri aşağıdaki formül kullanılarak da hesaplanır: d1 T.D. = L + C d 1+ d2 Bu formülde; TD = Tepe Değeri L= Frekansı en fazla olan sınıfın sınıf ara değeri d1 = Tepe sınıfı ile bir önceki sınıfın frekansları farkları d2 = Tepe sınıfı ile bir sonraki sınıfın frekansları farkları C= sınıf aralığı 18
Örnek: d1 T.D. = L + C d 1+ d2 Yukarıda frekansı en büyük değerin karşısındaki sınıf 15 19 sınıfıdır. Bu sınıfın sınıf ara değeri (14 + 15) / 2 = 14.5 dir. 19
Aritmetrik ortalama, ortanca ve tepe değeri ilişkileri: 1) Simetrik dağılımlarda aritmetrik ortalama, ortanca ve tepe değeri birbirine eşittir. 20
2) Sağa çarpık dağılımlarda küçük değerlerde bir yığılma olduğundan tepe değeri ortancadan, ortanca ise aritmetrik ortalamadan küçüktür. 21
3) Sola çarpık dağılımlarda büyük değerlerde yığılma olduğundan tepe değeri ortancadan ve ortanca da aritmetrik ortalamadan büyüktür. 22
Geometrik ortalama (G.O): Mikroorganizmaların çoğalması, nüfus artışı, fiyat artışı gibi birbirinin katları olarak çoğalan yani geometrik artış gösteren verilerde ortalama hesaplamak için kullanılan bir ortalama ölçüsüdür. n tane değerin birbiriyle çarpımlarının n inci kökü alınarak hesaplanır. Bu nedenle dağılımda negatif veya sıfır değerler varsa geometrik ortalama hesaplanamaz. Geometrik ortalamanın formülü: n Geometrik Ortalama ( G. O) = X 1. X 2... Xn Bu formül ile hesaplama yapabilmek için logaritma alınarak kolayca çözüme ulaşılabilir. Geometrik Ortalama ( G. O) = log 1 + log 2 +...log X X Xn n 23
Örnek 1: Bir bakterinin 5 farklı zamanda çoğalma miktarları (yüzde olarak) 2, 4, 8, 16 ve 32 olarak hesaplanmıştır. Bakteri çoğalma miktarları için geometrik ortalamayı hesaplayınız. G. O = 5 (2)(4)(8)16)(32) = 8.0 Örnek 2: Bir köyün 6 yıllık nüfusları 300, 325, 400, 545, 690 ve 850 olsun. Altı yıllık ortalama nedir? G. O. = 6 (300)(325)(400)(545)(690)(850) = 482 veya æ log 300 + log 325 + log 400 + log 545 + log 690 + log 850 ö G. O = Anti log ç = 482 è 6 ø 24
Harmonik ortalama (H.O): Uygulama alanı son derece sınırlıdır. Sabit ve değişken değerlerin yer değiştirebileceği hız, fiyat ve verimlilik hesaplarında uygulanır. Seride sıfır veya sıfırdan küçük terim varsa harmonik ortalama uygulanamaz. İstatistik serisi terimlerinin terslerinin aritmetrik ortalamasının tersi harmonik ortalamadır. H.O. n 1 xi 25
Örnek Harmonik ortalamanın kullanımı bir hız problemi örneği ile açıklayalım. A ve B şehirleri arasında y km uzunluktaki bir yolu 3 araba Z 1,Z 2 ve Z 3 zamanında gidiyor olsun. 26
A ve B şehirleri arasındaki yolu 1.araba 120 km/s, 2.araba 100 km/s ve 3.araba ise 50 km/s hızla gidiyor ise ortalama hız: bulunur. 27
Değişim Genişliği (D.G) Bir örnekteki en büyük gözlem değeri ile en küçük gözlem değeri arasındaki farktır. D.G=En büyük gözlem değeri En küçük gözlem değeri Değişim genişlikleri eşit bulunsa bile farklı rakamlardan oluşan gözlem değerlerinin birbirinden olan farklılıkları ortaya konamaz. 28
ÖRNEK : A örneği 5 11 14 5 8 10 16 21 Değişim Genişliği (DG)= 21-5=16 B örneği 5 14 13 12 14 17 16 21 Değişim Genişliği (DG)= 21-5=16 Değişim genişliği yaygın olarak kullanılan iyi bir değişim ölçüsü değildir. Çünkü sadece bir örnekteki en büyük gözlem değeri ile en küçük gözlem değeri arasındaki farkı verir. Örneği oluşturan tüm gözlem değerlerinin birbirinden olan farklılıkları hakkında bir bilgi vermez. 29
Ortalamadan Mutlak Sapma Bir örnekteki gözlem değerlerinin ortalamadan olan sapmalarının mutlak değerlerinin ortalamasına, ortalama sapma (O.S) denir. 30
Dikkat edilecek olursa, eşitlikte farkların mutlak değerleri alınmaktadır. Bu mutlak değer alma işlemi gerçekleştirilmez ise bir seride yer alan bütün terimlerin aritmetik ortalamadan sapmaları toplamı her zaman için 0 (sıfır) olacağından faydalı bir değer olmayacaktır. Medyan değeri kullanılarak hesaplanan medyan sapma için aşağıdaki eşitlik kullanılır. 31
Örnek: Piyasada satılmakta olan 500 gr. lık 6 yoğurt markasının kaymakları alınarak tartılmış ve 17, 17, 21, 24, 24, 27 gr. olarak bulunmuştur. Kaymak ağırlığı değişkeni için aralık değerini, ortalama ve medyan sapma değerlerini hesaplayınız. Çözüm: Önce kaymak ağırlığı değişkeni için değişim aralık değerini hesaplayalım. Değişim aralığı en büyük ve en küçük değer arasındaki farktır. Değişim aralığı= 27-17= 10 gr. dır. Ortalama ve medyan sapma değerlerini bulabilmek için öncelikle ortalama ve medyan değerlerinin bulunması gerekir. 32
Basit seride aritmetik ortalama eşitliği kullanılarak aritmetik ortalama hesaplanır. 17 17 21 24 24 27 x 6 130 6 21.67 Seri küçükten büyüğe sıralı verilmiştir. Seride 6 terim olduğuna göre, (n/2)=6/2=3. değer ve (6+2)/2=4. değerlerinin toplamının yarısı ortancayı verir. Seride yer alan 3. terim değeri 21 ve 4. terim değeri 24 olduğundan bu serinin medyanı 21 ve 24 değerlerinin ortalaması olan 22,50 dir. 33
Şimdi bu değerlerden yararlanarak izleyen tablo oluşturulabilir. Aritmetik ortalama=21.67 34
ÖRNEK : A ve B örneklerine ait ortalama sapma nedir? A B 7 5 11 14 14 13 5 12 8 14 10 17 16 16 21 21 35
Ortalama sapma hesaplanırken gözlem değerlerinin birbirinden olan farklılığı değil ortalamadan olan sapmaları dikkate alınır. Ortalama sapma istatistik testlere uygun bir değişim ölçüsü olmadığından tercih edilen değişim ölçüsü varyanstır. 36
ÇEYREK ve YÜZDELİKLER Ortalamalar dağılımın orta noktasını gösteren ölçülerdir. Çeyrek ve yüzdelikler ise dağılımın herhangi bir noktasını gösterirler. Örneğin, birinci çeyrek 25. yüzdeliktir (veya % 25. değerdir). İkinci çeyrek % 50. değer veya ortancadır. Üçüncü çeyrek 75. yüzdeliktir (veya % 75. değerdir). En çok kullanılan yüzdelikler birinci ve üçüncü çeyreklerdir. İstenilen herhangi bir yüzde değer de kolayca hesaplanabilir. 37