ORTALAMA ÖLÇÜLERİ Ünite 6 Öğr. Gör. Ali Onur CERRAH Araştırma sonucunda elde edilen nitelik değişkenler hakkında tablo ve grafikle bilgi sahibi olunurken, sayısal değişkenler hakkında bilgi sahibi olmanın yolu frekans dağılımlarını, yüzdeleri, yüzdelikleri ve grafikleri elde etmek idi. Bu yolla, dağılımın şekli, verilerin hangi sınıflarda yoğunlaştığı vb. sorulara yanıt bulunuyordu. Bunların dışında, sayısal değişkenleri tanımlamakta kullanılan birçok ölçü söz konusudur. Örneğin, bir sutopu antrenörü, şut antrenmanı amacıyla sutopu kalesini sadece sol ve sağ üst köşede topun geçeceği alan bırakarak bezle kapatsın. Antrenmandaki oyunculara bu boşlukları hedefleyen 20şer şut attırıp istatistiklerini de tutsun. Antrenmanın sonunda oyunculardan biri kendi performansı hakkında bilgi almak isterse, oyuncuya, kendi başarılışut sayısının yanında, çalışma sonrasında "takımın başarılışut sayısı ortalamasını;" da vermesi anlamlı olacaktır. Böylece, oyuncunun bu "ortalama" değere göre karşılaştırma yapması sağlanacaktır. Dağılımların orta noktalarını gösteren ölçüler, "merkez ölçüleri" olarak da bilinirler ve genellikle, dağılımdaki değerlerin en fazla yoğunlaştığı "bir merkez referans değerini" ifade ederler. Bu ölçüler yardımıyla, dağılımdaki değeri (ortalama açısından) temsil eden tek bir değer elde edilir. 1
Bu ölçüler arasında çok kullanılanları; aritmetik ortalama, ortanca tepe değeridir. Bunlara göre daha az kullanılan diğer iki ortalama ölçüsü; geometrik ortalama ve harmonik ortalamadır. ağırlıklı ortalamaya da bazı çalışmalarda başvurulur Aritmetik ortalama (ya da sadece "ortalama" sözcüğü de kullanılır) Çoğunlukla. tek tepeli simetrik bir yapıya sahip sürekli sayısal verilerde kullanılan bir ortalama ölçüsüdür. Bir büyüklük belirtmesi açısından kesikli sayısal verilerde de kullanılabilir. Örneğin A takımında maç başına sakatlanma ortalaması 1.2 olarak bulunmuş ise, "1.2" gibi bir sakatlık olmamakla birlikte bu değer bir büyüklük göstermesi açısından ele alınmalıdır. Aritmetik ortalama, x ile gösterilir ve sınıflandırılmamış ve sınıflandırılmış veriler için ayrı formüllerle hesaplanır. B) NİCELİK VERİLER 1) Kesikli Sayısal Veriler: Belirli bir aralıktaki tam sayıları alan veri türüdür. örn; akciğerlerdeki leke sayısı (3,5,7,10) gibi tam sayılardan oluşur. Sınıflandırılmamış Verilerde Aritmetik Ortalama Sınıflandırılmamış verilerde aritmetik ortalama, her bir gözleme ilişkin değerlerin toplamının denek sayısına bölünmesi ile bulunur 2) Sürekli Sayısal Veriler: Ölçümle belirtilirler ve bir aralıktaki bütün değerleri alırlar. Örn; boy uzunluğu değişkeni, sürekli sayısal veri tipinde bir değişkendir. Bir sporcunun boy uzunluğu 180-200cm arasında değişiyor ise 187.365 cm olabileceği gibi 190.34 de olabilir. 2
Sporcuların MaxVo2 değerlerinin ortalaması Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır. Ancak dağılımdaki aşırı değerlerden etkilenir. Örneğin 7 sporcunun spor yaşı sırasıyla 7 18 7 8 6 7 5 ise aritmetik ortalama 8.28 yıl olarak bulunur. Dikkat edilirse bu dağılımda, dağılımın ortalaması olan 8.28 den büyük sadece 1 değer (18) olmasına rağmen aritmetik ortalama bu değer nedeniyle, dağılımın genel eğiliminin üzerinde bir değer olarak bulunur. Ortanca (Medyan) 50. yüzdeliğe ortanca denir. Ortanca bir dağılımdaki değerleri iki eşit parçaya böler. Gözlemlerin %50 si ortancanın altında, %50 si üzerindedir. Ortanca aşırı gözlemlerin bulunduğu ve de özellikle dağılımın çarpık olduğu durumlarda kullanılan bir ortalama ölçüsüdür. Veri sınıflandırılmamış olduğunda ortanca değer aşağıdaki yöntemle de hesaplanabilir. 1) Buna göre, veriler küçükten büyüğe doğru sıraya dizildikten sonra; 2) gözlem sayısı tek sayılı bir değer ise ortanca; ((n + 1)/2) formülü ile, 3) gözlem sayısı çift sayılı bir değer ise ortanca; (n/2)'inci ile (n +2)/2 'inci gözlem değerlerinin toplanıp 2 'ye bölünmesi ile bulunur. 3
Örnek Elimizde basketbol genç milli takımına ilişkin bir veri grubundan rasgele seçilmiş 9 basketbolcunun milli olma sayıları (5 6 4 7 5 8 38 7 4) olsun. Sınıflandırılmamış verilerde ortancayı bulmak için veriler önce küçükten büyüğe doğru dizilir; (4 4 5 5 6 7 7 8 38). Buradan ortanca, denek sayısı tek sayılı bir değer olduğu için (9+1)/2=5. denek değeri olan 6'ya eşittir. Bu örneğe ilişkin aritmatik ortalama ise x = 9.3 olarak bulunur. Bu iki ortalama ölçüsü arasında oldukça fazla fark vardır. Çünkü aritmetik ortalama aşırı değerlerden etkilenir. Yukarıdaki dağılımda 38 değeri 3800 değeri ile yer değiştirse, aritmetik ortalama 427.3 gibi bir değer olarak bulunurken ortanca değer değişmeyecektir. Yukarıdaki açıklamalardan anlaşılacağı gibi, ortanca dağılımın orta noktası hakkında bilgi verirken aşırı değerlerden etkilenmez. Bu nedenle, dağılımda aşırı gözlemlerin bulunduğu ve de özellikle dağılımın çarpık olduğu durumlarda, ortalama ölçüsü olarak ortancanın kullanılması gerekir. Sınıflandırılmamış verilerde, gözlem sayısının çift sayılı olduğu durum için bir örnek veri; (15 21 17 42 18 19) şeklinde olsun. Verileri sıraya dizersek dağılım; 15 17 18 19 21 42 olur. Bu durumda ortanca; (n/2)=(6/2)=3. gözlem değeri ile (n+2)/2=(6+2)/2=4. gözlem değerinin yarısına eşit olacaktır. Buna göre ortanca (18+19)/2=18.5 olarak bulunur. Ortanca, aritmetik ortalamaya göre daha zayıf bir ortalama ölçüsüdür. Çünkü aritmetik ortalama tüm gözlemler dikkate alınarak hesaplanırken, ortanca en çok iki gözlem tarafından elde edilir. Bu durum ortancanın zayıf yönünü tanımlar. Buna göre, 18.5'in altında gözlemlerin % 50'si 3 gözlem, 18.5'in üzerinde gözlemlerin % 50'si 3 gözlem vardır. 4
Tepe Değeri (Mod) Tepe değeri dağılımda en fazla tekrarlanan değerdir. 1. Futbol liginde oynayan bir takım için "çok genç takım" nitelendirmesi yapılıyorsa aslında tepe değerinden söz edilmektedir. Tepe değerini hesaplamakta kullanılan bir formül yoktur. 13 26 19 16 19 18 19 19 şeklindeki bir dağılımda en çok tekrarlanan değer 19 olduğu için tepe değeri 19' dur. Her gözlemin tekrar sayısı aynı ise o dağılımda tepe değeri yoktur. Veriyi sınıflandırdığımızda, çoğunlukla en yüksek frekansa sahip tek bir sınıf vardır (tek tepeli dağılım). En yüksek frekansa sahip tek bir sınıfın olduğu dağılımlara tek tepeli dağılım denir. Bu durumda tepe değeri; frekansı en fazla olan sınıfın sınıf değeridir. Örneğin Tablo daki dağılım tek tepeli ve tepe değeri 57 mllkg/dk'dır [(55+59)/2]. Tek tepeli dağılımlarda tepe değeri ile aritmatik ortalama arasındaki fark büyüdükçe dağılımın çarpıklığı da artar. Bir dağılım birden çok tepe değeri olabilir. Eğer bir dağılımda veriler iki sınıfta yoğunlaşıyor ise bu dağılıma iki tepeli (bimodal) dağılım denirken, bu durumun 2 den fazla sınıfta ortaya çıkması durumunda dağılım çok tepeli dağılım adını alır. Tepe değeri nitelik verilerde de kullanılabilir. Örneğin, bir spor yüksek okul başvuranların çoğunluğu atletizm kökenli olabilir. Tepe değeri, aritmetik ortalama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür. Ancak, hesaplaması kolay olduğu için bir dağılımın ortalamasının kestirilmesi hakkında yaklaşık bilgi verir. Ancak tepe değerinin olumsuz yönleride vardır. - Yapılan sınıflamaya göre tepe değeri değişebilir. - Bazı dağılımlarda tepe değeri olmayabileceği gibi bazı dağılımlarda birden fazla tepe değeri olabilir. Birden çok tepe değeri olduğunda, ilgili dağılım tanımlamakta tepe değerinin kullanılması pek yararlı olmayacaktır. - Tepe değeri sonuç bir istatistik olup daha ileri hesaplamalar için pek kullanılmaz 5
Frekans Dağılımının Şekli ile Ortalama ölçüleri Arasındaki İlişki Kullanılacak ortalama ölçüsüne karar vermede veri tipi ve dağılımın şekli iki önemli parametredir. Bunlardan bazıları dağılım eğrileri şeklinde Grafikte verilmiştir. Frekans dağılımları elde edilip grafikleri çizildiğinde çok çeşitli şekiller elde edilebilir. Bir dağılım simetrikse ve Grafik 2.10-A daki gibi bir şekil gösteriyorsa Ortalama=Ortanca=Tepe değeri Eğer negatif çarpıksa aşırı gözlemler küçük değerlerde olacağı için aritmetik ortalama küçük değerlere doğru çekilir Ortalama Ortanca Tepe değer Pozitif çarpıksa Ortalama Ortanca Tepe Değer Çarpık ve simetrik tek tepeli dağılımlarda ortalama, ortanca ve tepe değeri arasındaki ilişkileri görmek amacıyla tablodaki veriler aşağıdaki grafikler ile gösterilmiş. Burada sınıflandırılmış veriler için kullanılan formül yardımıyla bulunan ortalama ölçüleri arasındaki ilişki gösterilmektedir 6
Özet Veriler sayısal ve dağılım simetrik ise ortalama ölçüsü olarak aritmetik ortalama kullanılır. Eğer veri sayısal ve çarpık ise (veride aşırı değerler var ise) ortancanın kullanılması daha uygundur. Ya da aritmetik ortalama ile birlikte ortanca değer de tanımlayıcı ölçü olarak verilmelidir. Aritmetik ortalama hesaplanırken dağılımdaki değerlerin tümü dikkate alınırken, ortanca ve tepe değeri hesaplanırken değerlerin tümü dikkate alınmaz. Örneğin ortanca hesabında en çok iki değeri dikkate almak yeterlidir. Tepe değeri de dağılımdaki değerlerin bir bölümünü dikkate alır. Aritmetik ortalama diğer bir çok istatistiksel işlemlerde kullanıldığı halde, ortanca ve tepedeğeri ortalama ölçüsü olmanın dışındaki amaçlar için pek kullanılmaz 7