IİSTATIİSTIİK Mustafa Sezer PEHLI VAN
İstatistik nedir? İstatistik, veri anlamına gelir, İstatistik, sayılarla uğraşan bir bilim dalıdır, İstatistik, eksik bilgiler kullanarak doğru sonuçlara ulaştıran bir bilim dalıdır, İstatistik, geçmiş ve şimdiki durumla ilgili toplanmış sayısal verileri geliştirilmiş olan bazı tekniklerle özetleme, yorumlama ve analiz ederek gelecek hakkında karar vermemizi kolaylaştıran bir bilim dalıdır. İstatistik diğer bilim dallarının teknolojisidir, İstatistik, verilerin toplanması, düzenlenmesi, özetlenmesi, sunulması, tahlil edilmesi ve bu verilerden bir sonuca varılabilmesi için kullanılan bilimsel yöntemler topluluğudur. İstatistikte verileri Nitel ve Nicel değişken olarak tanımlarız. Nicel Değişken: Belli bir ölçüm sonucu elde edilen değişlerdir. Sürekli ve Kesikli olarak ikiye ayrılır. Nitel Değişken: Nitelik belirten değişkenlerdir. Nitel değişkenlerin tamamı Kesiklidir. Nicel Değişken Nitel Değişken Sürekli Değişken Kesikli Değişken Ondalıklı olarak ifade edilen değerlerdir. Örneğin; kan tahlillerindeki biyokimyasal ölçüm değerleri vb Tamsayı olarak ifade edilen değerlerdir. Örneğin; bir klinikte günlük muayene olan hasta sayısı, ameliyat sayısı vb. Nitel değişkenler nitelik belirttiğinden tamamı Kesiklidir. Örneğin; muayene olan hastaların cinsiyeti, eğitim durumu, medeni halleri vb. İstatistikte veriler üzerinden; a) Tanımlayıcı İstatistik b) Çıkarsamalı İstatistik elde edilir.
TANIMLAYICI İSTATİSTİKLER Tanımlayıcı istatistikler çalışmaya konu olan örneklem üzerinden elde edilen değerlerdir. Veri setine ilişkin değerlerin tanımlanması için kullanılır. Sıra no Cinsiyet Yaş Boy Kilo 1 Kadın 36 163 46,1 2 Kadın 26 162 46,2 3 Erkek 55 178 95,3 4 Kadın 22 164 48,4 5 Kadın 25 165 48,7 6 Erkek 26 169 51,9 7 Kadın 41 147 67,2 8 Kadın 51 161 61,3 9 Kadın 35 165 74,0 10 Kadın 39 173 75,7 11 Erkek 25 197 92,0 12 Erkek 39 189 95,6 13 Kadın 35 174 59,6 14 Kadın 38 171 69,6 15 Kadın 26 149 47,3 16 Kadın 21 161 46,8 17 Kadın 41 165 61,0 18 Kadın 48 159 65,8 19 Kadın 57 160 82,4 20 Erkek 33 174 79,9
Tanımlayıcı istatistikler için öncelikle verilerin karmaşıklığının düzenlenmesi gerekir. Bu amaçla kullanılacak istatistik işlemleri; Tabloları Merkezi Eğilim Ölçüleri Merkezi Dağılım Ölçüleri Tablosu Temel istatistik göstergesidir. Karışık veri setleri, istenen değişkene göre düzenlenerek veri seti hakkında temel değerlerin elde edilmesini sağlar. tablolarında sınıf sayısının 7-15 arası olmasına özen gösterilmelidir. Sınıf sayısının 7 den az olması bilgi kaybına, 15 den çok olması ise yeterli biçimde özetlenememesine sebep olmaktadır. Kardiyoloji Polikliniğe Başvuran 20 Hastanın Cinsiyete Göre Tablosu Cinsiyet % Kadın 15 75 15 75 Erkek 5 25 20 100 Toplam 20 100
Kardiyoloji Polikliniğine Başvuran 20 Hastanın Yaş Grubuna Göre Dağılımı Yaş Grubu % 24 ve altı 2 10 2 10 25-30 5 25 7 35 31-35 3 15 10 50 36-40 4 20 14 70 41-45 2 10 16 80 46-50 1 5 17 85 51 ve üzeri 3 15 20 100 Toplam 20 100 Merkezi Eğilim Ölçüleri Veri seti değerleri üzerinden elde edilir. a) Aritmetik Ortalama, b) Mod (Tepe Değeri) c) Medyan (Ortanca) Merkezi eğilim ölçüsü olarak hesaplanmaktadır. a) Aritmetik Ortalama; Veri setindeki tüm değerlerin toplanıp veri adedine bölümünden elde edilir. xx = xx ii nn formulü ile hesaplanır. Bir veri setindeki tüm değerler için aritmetik ortalama tekdir. Her bir değerin aritmetik ortalamadan sapmaları(aralarındaki farklar) toplamları daima sıfırdır. (xx ii xx ) = 0 Aritmetik ortalama çok büyük/küçük değerden etkilenmektedir.
b) Mod (Tepe Değeri) Sınıflandırılmamış verilerde en çok tekrarlanan değer olarak tanımlanır. c) Medyan (Ortanca) Veri setinin orta noktası olarak tanımlanır. Polikliniğe başvuran hastaların boy uzunlukları için merkezi eğilim ölçüleri; Aritmetik Ortalama xx =167,35 Mod (Tepe Değeri) = 164 Medyan (Ortanca) = 164,5 Merkezi Dağılım Ölçüleri Merkezi Dağılım Ölüleri veri setinin dağılımı hakkında bilgi verir. a) Varyans ve Standart Sapma b) Değişim Aralığı c) Değişim Katsayısı a) Varyans (SS 22 ) ve Standart Sapma (S) Varyans: Veri setindeki değerlerin ortalamadan ayrılışlarının karelerinin aritmetik ortalamasıdır. Standart sapma, varyansın karekökü olarak tanımlanır. Varyans; formülü ile hesaplanır. SS 22 = (xx ii xx ) 22 nn 11 Varyans ve standart sapma veri setindeki değerlerin aritmetik ortalama etrafında dağılımı hakkında bilgi verir. b) Değişim Aralığı Sınıflandırılmamış veri setinde en büyük değer ile en küçük değer arasındaki fark olarak tanımlanır. DDDD = xx MMMMMM xx MMİNN c) Değişim Katsayısı Standart sapmanın aritmetik ortalamaya oranının yüzdesidir. DDDD = SS. 100 xx
Veri seti için; Ortalama = 167,35 Varyans = 137,61 Standart Sapma = 11,73 Değişim Aralığı = 50 Değişim Katsayısı = % 7,01 Değişim katsayısı, standart sapmanın, ortalamanın % 7,01 i olduğunu ifade etmektedir. TANIMLAYICI İSTATİSTİK Merkezi Eğilim Ölçüleri Merkezi Dağılım Ölçüleri Aritmetik Ortalama Varyans (S 2 ) ve Standart Sapma (S ) Mod (Tepe Değeri) Değişim Aralığı Medyan (Ortanca) Değişim Katsayısı