Prof.Dr.İhsan HALİFEOĞLU
FREKANS DAĞILIMLARINI TANIMLAYICI ÖLÇÜLER Düzenlenmiş verilerin yorumlanması ve daha ileri düzeydeki işlemler için verilerin bütününe ait tanımlayıcı ve özetleyici ölçülere ihtiyaç vardır. Bu ölçüler, verileri yalnızca özlü bir biçimde belirtmekle kalmaz karşılaştırmalara, genellemelere, yorumlamalara olanak sağlar. Araştırmalarda deneklerin kimi küçük, kimi orta kimi ise yüksek değerlerde olabilir. Bu değerlerin teker teker incelenmesi ya da en büyük ve en küçük değerleri belirtmek bir anlam taşımaz. 2
Örneğin, öğrencilerin istatistik dersi sınavında aldıkları puanların 45 95 arasında değiştiğini söylemek anlamlı değildir. Öğrencilerin çoğu 95 civarında puan almış bir veya iki tanesi 45 puan almış olabilir ya da çoğunluğu 45 civarında iken bir veya iki tanesi 95 puan almış olabilir. Dağılımın tümünü temsil edecek bir ölçüye gereksinim vardır. 3
Frekans dağılımlarını tanımlayıcı ölçüler iki genel başlık altında toplanabilir: 1. Yer gösteren ölçüler a. Merkez ölçüleri: Ortalamalar b. Çeyrek ve yüzdelikler 2. Yaygınlık ölçüleri a. Standart sapma b. Varyans c. Varyasyon katsayısı d. Standat hata 4
MERKEZİ EĞİLİM ÖLÇÜLERİ (ORTALAMALAR) Ortalama, dağılımın orta noktasını gösteren ve incelenen deneklerin değerlerinin tek bir değerle temsil etmektedir. İncelenen bireylere ait değerler yüksek, düşük veya orta olabilir. Bu değerler tek başına bir anlam ifade etmezken, tümünü temsil eden bir değer daha anlamlı olmaktadır.ortalamalar, merkezi eğilim ölçüleri olarak da adlandırılır. Çünkü gözlem değerleri ortalama etrafında toplanma eğilimi gösterilirler. Merkezi eğilim ölçüleri, bir örnekteki bireyleri temsil eden tipik değerlerdir 5
Merkezi eğilim ölçüleri aşağıda sıralandığı gibi 5 gruba ayrılır: Eğer sadece "ortalama" denirse bunun ile kastedilen "aritmetik ortalama"dır. 1.Aritmetik Ortalama (Mean), 2.Ortanca değer (Medyan), 3.Tepe Değeri (Mod), 4.Geometrik Ortalama, 5.Harmonik Ortalama. 6
Aritmetik Ortalama (mean) Deneklerin aldığı değerlerin toplanıp denek sayısına bölümüyle elde edilen matematiksel bir değerdir. Aşağıdaki formülde görüldüğü gibi hesaplanır. Örneğin ilgilenilen değişkenin 1, 3, 5, 8, 9 değerlerini aldığı bilindiğinde bu değişkenin aritmetik ortalaması, terimlerin matematiksel toplamı olan 26 değerinin (1+3+5+8+9) terim sayısı olan 5 e bölünmesiyle hesaplanır. Bu değişkenin aritmetik ortalaması 5,20 olacaktır. Bir seride yer alan gözlem birimleri x ile sembolize edilir, ayrıca bunların toplanacağını göstermek için sembolü kullanılır. 7
Bir seride aritmetik ortalama, seriyi oluşturan gözlem değerleri toplamı gözlem sayısına bölünerek hesaplanır. Eğer ana kütle aritmetik ortalaması hesaplanıyorsa aritmetik ortalama için μ sembolü kullanılırken aritmetik ortalama örneklem için hesaplanıyor ise kullanılır. x sembolü x x n 1 x2... xn i1 n n x i 8
A sınıfındaki 10 öğrencinin diploma notları; 65 54, 85, 72, 77, 58, 69, 62, 58 ve 60 oduğuna göre bu sınıfın ortalaması kaçtır? x x 1 x 2 Örnek: Bir şeker hastasının 15 günlük glukoz takibinde elde edilen glukoz x... xn i1 n n glukoz değeri nedir? Gün mg/dl şeker Gün n i 65 54 85 72 77 58 69 62 58 60 10 660 10 66 değerleri aşağıda verilmektedir. Ortalama mg/dl şeker Gün mg/dl şeker Gün mg/dl şeker Gün mg/dl şeker 1 2 3 160 175 154 4 5 6 170 168 161 7 8 9 166 171 170 10 11 12 175 159 160 13 14 15 161 166 154 x 160+175+154+170+168+161+166+171+170+175+159+160+161+166+154 = 15 =164.7 165 9
Bir dağılımda aşırı değerler varsa yapılacak işlemler şunlardır: 1. Kişilik farkına bağlı gerçek bir değer değilse ve olanak varsa ölçüm tekrarlanmalıdır. 2. Aşırı değerler değerlendirme dışı bırakılabilir. 3. Aşırı değerler alan bireylere diğer değerlere yakın bir değer atanabilir. Bunlar yapılamıyorsa aritmetik ortalama yerine başka bir ortalama ölçüsü, örneğin ortanca kullanılmalıdır. 10
Aşırı değerler katılarak ortalamanın hesaplanması sonuç gerçeği yansıtmayabilir veya yanlış yorumlamaya yol açar. Bir örnekle açıklanırsa; A hastalığına yakalanan kişilerin kanındaki bir maddenin artış gösterip göstermediğini incelemek için 10 hasta ve 10 sağlıklı kişide ölçüm yapılıyor ve aşağıdaki sonuçlar elde ediliyor. Aritmetrik ortalama Hasta 8 7 7 7 8 8 8 26 8 8 9.5 Sağlam 8 9 7 8 7 7 9 8 7 7 7.7 Hasta kişilerde aritmetrik ortalama 9.5, sağlıklı kişilerde ise 7.7 bulunmuştur. Her iki grupta değerler 7-9 arasında dağılım göstermektedir.ortalamanın daha düşük olması gerekirken hasta grubunda yüksek çıkmıştır. Bunu sebebi de ölçümlerden birinin uç değer (26) olmasıdır. 11
Şimdi bu aşırı değer yerine önerilen işlemleri uygulayalım: 1) Aşırı değer değerlendirme dışı bırakılıp örnek sayısı 9 alınırsa aritmetrik ortalama 7.67 olacaktır. Bu ortalama sağlam kişilerin ortalamasından (7.7) farksızdır. 2) Diğer değerlere yakın bir değer, örneğin 9 değerini tahmini olarak hasta değeri olarak kabul edersek ortalama 7.8 olacaktır. Bu ortalama da sağlam kişilerin ortalamasından (7.7) farksızdır. 3) Aritmetrik ortalama yerine ortancayı kullanırsak hasta kişilerde sadece 8, sağlam kişilerde ise 7.5 olacaktır. Bu iki değer de birbirine oldukça yakındır. 12
Sınıflandırılmış Verilerde Aritmetik Ortalama Veri sayısı çok olan araştırmalarda veya çalışmalarda aritmetik ortalamayı sınıflandırmadan hesaplamak, zor ve yorucudur. Ayrıca zaman alıcı ve hata yapma olasılığı fazladır.sınıflandırılmış verilerde aşağıdaki formül kullanılarak aritmetik ortalama hesaplanır. x A n fb C 13
Sınıflandırılmış verilerde aritmetik ortalama şu şekilde hesaplanır: 1. Sınıflar yazılır. 2. Sınıf değeri (SD) bulunur ve sınıfın karşısına yazılır. SD, sınıfın ortalamasıdır. Her sınıfın alt ve üst sınırları toplanarak ikiye bölünür. Çıkan sonuç SD yi oluşturur. 3. Her sınıfın frekansı karşısına yazılır. Frekans toplamı alınarak alt bölüme yazılır. 14
4. Çalışma birimi olarak adlandırılan b kolonu oluşturulur. Herhangi bir sınıfın (genellikle frekansı en büyük sınıfın karşısına) 0 değeri yazılır. Üste doğru eksi (-) olarak 1 den başlanarak ve birer artırılarak alta doğru artı (+) olarak 1 den başlanarak ve birer artırılarak çalışma birimleri yazılır 5. Frekansla çalışma biriminin çarpımları alınarak ve sınıfların karşısına yazılarak fb kolonu oluşturulur. Rakamların önündeki eksi ve artı işaretlerine dikkat ederek toplanır. Toplam fb (Σfb) bulunur, eksi veya artı olarak yazılır. 6. Değerler, formüle yerleştirilir ve aritmetik ortalama bulunur. 15
Sınıflandırılmış verilerde aritmetik ortalama aşağıdaki formül ile hesaplanır. x A n fb C Formülde: A: b kolonunda karşısına sıfır konulan sınıfın sınıf değeri (Genellikle frekansı yüksek olan sınıfın karşısına yazılır.) C: Sınıf aralığı Σfb: Frekansla çalışma biriminin çarpımlarının toplamı n: Denek sayısı 16
Örnek: Aşağıda 100 yetişkine ilişkin kolesterol değerlerini sınıflandırılarak aritmetik ortalamasını bulunuz (sınıf aralığını 20 alınız). 17
x A fb C 229.5 n 40 20 100 221.5 18
Örnek:. Aşağıda yaşların verilen 56 öğretmenin yaşlarının aritmetik ortalaması nedir? (Sınıf aralığını 5 olarak alınız) 25 32 35 41 41 31 46 51 37 32 35 44 26 36 43 41 38 33 44 39 31 47 32 42 48 28 47 35 34 42 40 50 37 49 31 42 33 43 28 40 49 27 41 36 35 43 26 34 36 33 45 33 42 52 38 44 x A n fb C 19
Çözüm: Yaş Sınıf Değeri (SD) Frekans (f) b fb 25-29 27 6-3 -18 30-34 32 13-2 -26 35-39 37 11-1 -11 40-44 42 (SD) 16 0 0 45-49 47 7 +1 +7 50-54 52 3 +2 +6 Toplam 56-42 A = 42 C = 5 n = 56 Σfb = -42 Değerler formülde yerine yerleştirilir. x x fb A C n 38.25 42 42 56 x 5 38.25 20
Ortanca (medyan): Ortanca, düzensiz verileri küçükten büyüğe veya büyükten küçüğe doğru sıraladıktan sonra, sıralamanın tam orta noktasındaki değer olarak tanımlanabilir. Ortanca dağılımdaki aşırı değerlerden etkilenmez. Dağılımda aşırı değerler varsa aritmetik ortalamanın yerine ortanca kullanılabilir. Ortancada, dağılımdaki değerlerin yarısı ortancaya eşit veya daha küçük, yarısı da ortancaya eşit veya daha büyüktür. Ortancanın hesaplanması, aritmetik ortalamada olduğu gibi sınıflandırılmamış ve sınıflandırılmış verilerde farklı şekilde yapılır. 21
Ortancanın tespiti: Dağılımdaki değerler büyükten küçüğe veya küçükten büyüğe doğru sıralandığında ortadaki değer ortancadır. Sınıflanmamış Verilerde Ortancanın Hesaplanması 1) Denek sayısı tek ise [(n+1)/2] ci değer, 2) Denek sayısı çift ise tam orta noktada bir değer olmadığından [n/2] ci değer ile [(n+2)/2] ci değer toplanıp 2 ye bölünerek ortanca tespit edilir. 22
Örnek: 15 çocuğun vücut ağırlıkarı aşağıda verilmiştir. Ortancayı bulunuz 31.9 30.6 29.4 39.9 28.1 29.0 30.4 26.3 29.4 22.5 30.0 33.6 28.0 31.0 32.6 Önce değerleri küçükten büyüğe göre sıralayalım: 22.5 26.3 28.0 28.1 29 29.4 29.4 30.0 30.4 30.6 31.0 31.9 32.6 33.6 39.9 n sayısı tek olduğundan [(15+1)/2]=8 ci değer 30.0 ortancadır. Örnek sayısının 14 olduğunu yani 39.9 değerin olmadığını düşündüğümüzde ise ortanca [14/2]=7 ci ve [(14+2)/2]=8 ci değerlein toplamımının yarısıdır. Yani (29.4+30.0)/2=29.7 dir. 23
Örnek: 7 öğrencinin ağırlıkları (kg) 55, 46, 75, 45, 50, 58, 53 olarak bulunmuştur. Ortancayı bulmak için; Önce değerler küçükten büyüğe doğru ya da tersi sıralanır. 45, 46, 50, 53, 55, 58, 75 n=7 olduğundan (7+1) / 2 = 4 Ortanca 4 ncü değer olan 53 tür. 24
Denek sayısı çift ise; n/2 nci sıradaki değer ile (n+2)/2 nci sıradaki değer toplanıp 2 ye bölünerek ortanca bulunur. Örnek: 8 öğrencinin ağırlıkları (kg): 55, 46, 60, 45, 50, 58, 53, 80 olduğuna göre ortanca kaçtır? Önce değerler küçükten büyüğe doğru ya da tersi sıralanır. 45, 46, 50, 53, 55, 58, 60, 80 n=8 (çift) olduğundan 8/2 = 4 ve (8 + 2)/2 = 5 4. ve 5. değerler, 53 ve 55 in ortalaması olan (53+55) /2 = 54 ortancadır. 25
Sınıflanmış Verilerde Ortancanın Hesaplanması Sınıflandırılmış verilerde ortancanın hesaplanmasında sırası ile şu işlemler yapılır: 1. Sınıflar yazılır. 2. Her sınıfın frekansı yazılır. 3. Yığılımlı frekans (yf) bulunur. Yığılımlı frekans her sınıfın frekansının önceki frekanslarla toplamıdır. 26
Sınıflandırılmış verilerde ortanca formülü: n yfi 2 Ortanca L x C f Formülde: L = Ortancanın içinde bulunduğu sınıfın sınıf ara değeridir. Bu değer; ortancanın içinde bulunduğu sınıfın alt sınırı ile bir üstündeki sınıfın üst sınırının toplanıp ikiye bölünmesi ile elde edilir. yfi = Ortancanın içinde bulunduğu sınıfın bir üstündeki sınıfın yığılımlı frekansı. f = Ortancanın içinde bulunduğu sınıfın frekansı. C = Sınıf aralığı. n = denek sayısı. 27
Örnek: Aşağıdaki sınıflandırılmış verilerde ortancanın hesaplanması: Formüle yerleştirilecek değerleri bulmak için önce ortancanın hangi sınıfın içinde olduğunu bulmak gerekir. Bunun için, (n/2) =100/2=50 bulunur. 50 yığılımlı frekans kolonunda 67 nin içinde bulunduğundan ortancanın içinde bulunduğu sınıf 30 34 sınıfıdır. 28
L = (30+29)/2 = 29,5 n/ 2=50 yf = 37 C = 5 f = 30 Ortanca L n 2 yfi x C f 100 37 2 Ortanca 29.5 x 5 30 29 31.6
Tepe değeri (Mod): Sınıflanmamış verilerde tepe değeri en çok görülen, yani en çok tekrarlayan değerdir. Aşağıdaki dağılımda tepe değeri 11.0 dır. 10.5 10.0 10.4 11.0 11.0 11.6 12.0 11.8 11.0 11.0 13.6 14.0 10.1 12.3 11.5 Bir dağılımda aynı sayıdan görülen değişik değerler varsa tepe değeri kullanılmamalıdır. Aşağıdaki dağılımda tepe değeri olabilecek 3 değer (24, 31 ve 54) vardır. Birbirinden farklı bu 3 değerin üçünü de tepe değeri olarak kullanmanın bir anlamı yoktur. Böyle bir durumda tepe değeri uygun bir ölçüt olmamaktadır. 31.0 24.0 19.0 24.0 31.0 45.0 54.0 67.0 54.0 54.0 24.0 27.0 27.0 31.0 30
Örnek: Bir grubun matematik sınavından aldığı puanlar; 40, 40, 42, 42, 42, 43, 43, 43, 43, 45, 45, 50, 50, 55 ve 60 olsun. Bu dizide 43 en çok tekrarlanan değer olduğundan tepe değeri = 43 dür. Gözlem sonunda elde edilen ölçümlerin her birinin tekrar sayısı birbirine eşitse bu durumda tepe değeri olmaz. Örneğin; 45, 47, 55, 57, 60, 72, 77 ya da 45, 45, 50, 50, 56, 56, 58, 58, 60, 60, 75, 75 ve 80, 80 dizilerinde tepe değeri yoktur. Çünkü iki dizide de ölçümlerin hepsi eşit sayıda tekrarlanmıştır. 31
Ardışık iki ölçüm birbirine eşit sayıda ve öbür ölçümlerden daha çok tekrarlanmışsa, bu gibi durumlarda, tepe değeri ardışık iki ölçünün orta noktasıdır. Örnek: 50,50, 51, 51, 51, 52, 52, 52, 52, 53, 53, 53, 53, 54, 55, 55, 55 ve 56 şeklindeki bir dizide; Tepe değeri = 52,5 olur. Çünkü 52 ve 53 eşit sayıda ve öbür ölçümlerden daha çok tekrarlanmaktadır; bunların orta noktası da 52,5 dir. 32
Sınıflandırılmış verilerde tepe değeri en fazla frekansa sahip olan sınıfın değeridir. Ayrıca Sınıflandırılmış verilerde tepe değeri aşağıdaki formül kullanılarak da hesaplanır: d1 T.D. = L + C d 1+ d2 Bu formülde; TD = Tepe Değeri L= Frekansı en fazla olan sınıfın sınıf ara değeri d1 = Tepe sınıfı ile bir önceki sınıfın frekansları farkları d2 = Tepe sınıfı ile bir sonraki sınıfın frekansları farkları C= sınıf aralığı 33
Örnek: d1 T.D. = L + C d 1+ d2 Yukarıda frekansı en büyük değerin karşısındaki sınıf 15 19 sınıfıdır. Bu sınıfın sınıf ara değeri (14 + 15) / 2 = 14.5 dir. 34
Aritmetrik ortalama, ortanca ve tepe değeri ilişkileri: 1) Simetrik dağılımlarda aritmetrik ortalama, ortanca ve tepe değeri birbirine eşittir. 35
2) Sağa çarpık dağılımlarda küçük değerlerde bir yığılma olduğundan tepe değeri ortancadan, ortanca ise aritmetrik ortalamadan küçüktür. 36
3) Sola çarpık dağılımlarda büyük değerlerde yığılma olduğundan tepe değeri ortancadan ve ortanca da aritmetrik ortalamadan büyüktür. 37