Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5
Sıklık Tabloları Veri dizisinde yer alan değerlerin tekrarlama sayılarını içeren tabloya sıklık tablosu denir. Tek değişken için çizilen sıklık tablolarına basit tablo veya marjinal tablo denir. Sayısal verilerde yer gösteren ölçüler ve konum ölçüleri bazı durumlarda veri dizisini özetlemekte yetersiz kalabilir. Bu nedenle tablo ve görselliği olan grafiklerden yararlanılır. Yorumlarken yüzdeler üzerinden yorum yapılır.
Sıklık Tabloları NEDİR? Grafikler bu tablolara göre oluşturulurlar. Dağılım özelliklerini görebilmek için verilerin sınıflandırılması ve sıklık tablolarının elde edilmesinden yararlanılabilir. Niteliksel değişkenler için sıklık tablosu oluşturulurken çeteleme yapılır. SAÇ RENGİ Sayı Yüzde SİYAH 26 52 KAHVERENGİ 14 28 SARI 3 6 BEYAZ 7 14 Toplam 50 100
Sıklık Tabloları Niceliksel değişkenler için sıklık tablosu oluşturulurken genellikle birleştirme yapılır. Sayısal değişkenlerde sınıflama yapılırken belli bir kural yoksa (BKI gibi) sınıf aralıkları eşittir. Yaş Sayı Yüzde 0-10 36 18 11-19 24 12 20-29 42 21 30-39 80 40 40-49 18 9 Toplam 200 100
Sınıflama Sayısal verileri kategorik hale getirmek için yapılır. Araştırıcı sayısal verileri amacına göre belirlediği sayıda sınıfa ayırabilir. Sınıflama yapılırken dikkat edilmesi gereken nokta, Her gözlem bir sınıfta yer almalıdır. Sınıf aralıkları bir birini içermemelidir.
Sınıflama Dağılım Aralığı: En büyük değer En küçük değer (R) Sınıf Sayısı: Veri dizisinde oluşturulacak sınıf sayısı (k) Sınıf: Bir alt ve üst sınır ile belirlenmiş veri grubu Sınıf Aralığı: Ardışık iki sınıfın alt ya da üst sınırları arasındaki fark (c) Sınıf Sınırları: Bir sınıfta yer alabilecek en küçük ve en büyük değerleri gösterir. A.S. (Alt Sınır) ve Ü.S. (Üst Sınır) Sınıf Değeri: Bir sınıfın alt ve üst sınırlarının ortalamasıdır. (s) Sınıf Sıklığı: Sınıftaki değer sayısını gösterir. (f) Sınıf Göreli Sıklığı(%): Sınıfın sıklığının toplam değer sayısı (n) içindeki payını gösterir. (%f)
Sınıflama Aşamaları 1. Uygun sınıf sayısı belirlenir ve dağılım aralığı hesaplanır. 2. Alt ve üst sınırlar belirlenerek sınıflar oluşturulur. 3. Her bir sınıfın eleman sayısı (mutlak sıklıklar) hesaplanır. 4. Göreli sıklıklar hesaplanır.
Örnek: Aşağıda 100 kişinin boy uzunluğu verilmiştir. 162 167 170 171 173 174 175 176 178 181 164 168 170 171 173 174 175 176 178 181 164 168 170 171 173 174 175 177 178 181 165 168 170 171 173 174 176 177 179 182 165 169 171 172 173 174 176 177 179 182 166 170 171 172 173 174 176 178 179 184 166 170 171 172 173 175 176 178 179 184 167 170 171 172 173 175 176 178 179 184 167 170 171 173 174 175 176 178 179 185 167 170 171 173 174 175 176 178 180 186 Sınıf sayısı ve dağılım aralığının hesaplanması R En büyük En küçük 186 162 24
Sınıf sayısı 5 olsun (Araştırıcı belirliyor) 24 Sınıf aralığı 4.8 5 Alt ve üst sınırların oluşturulması Gözlem değerleri tam sayı olduğundan sınıf aralığı 5 olarak alınır. Alt Sınır Üst Sınır 162 166.9 167 171.9 172 176.9 177 181.9 182 186.9
162 167 170 171 173 174 175 176 178 181 164 168 170 171 173 174 175 176 178 181 164 168 170 171 173 174 175 177 178 181 165 168 170 171 173 174 176 177 179 182 165 169 171 172 173 174 176 177 179 182 166 170 171 172 173 174 176 178 179 184 166 170 171 172 173 175 176 178 179 184 167 170 171 172 173 175 176 178 179 184 167 170 171 173 174 175 176 178 179 185 167 170 171 173 174 175 176 178 180 186 Sınıfın eleman sayılarının hesaplanması Alt Sınır Üst Sınır Mutlak Sıklık 162 166.9 7 167 171.9 27 172 176.9 38 177 181.9 21 182 186.9 7
Alt Sınır Üst Sınır Mutlak Sıklık Göreli Sıklık % Sınıf Değeri 162 166.9 7 7 (162+166.9)/2=164.45 167 171.9 27 27 169.45 172 176.9 38 38 174.45 177 181.9 21 21 179.45 182 186.9 7 7 184.45 Sınıflandırılmış tablodan ortalama, standart sapma, ortanca, tepe değeri gibi istatistikler hesaplanabilir. Sınıflandırılmış tablolarda hesaplama yapılırken o sınıftaki tüm gözlem değeri sınıf değerini alıyormuş gibi hesaplama yapılır.
A.S. Ü.S. Sıklık (f) Sınıf Değeri (s) f * s 162 166.9 7 164.45 1151.15 167 171.9 27 169.45 4575.15 172 176.9 38 174.45 6629.1 177 181.9 21 179.45 3768.45 182 186.9 7 184.45 1291.15 x k i 1 k i 1 fs i i f i S 2 i 1 i i n Aritmetik ortalama (Ham veriden elde edilen 173.91) k i 1 fs k i 1 f i k i 1 1 fs i f i i 2 x fs 1151.15... 1291.15 17415 174.15 f 100 100
Tablolar Tabloların amacı Elde edilen bulguların yazı metnine başvurmadan, açık kolay anlaşılır bir şekilde okuyucuya sunulmasını sağlamaktır. Bir tablodaki bulguların sunuluş biçimi; Yapılacak analizin amacına, kullanılacak istatistiksel yönteme, araştırıcının okuyucuya göstermek istediği veya okuyucunun dikkatini çekmek istediği konulara göre değişiklik gösterir.
Tablo 1. 60 bebeğin doğum ağırlıklarına göre dağılımı Doğum ağırlığı Sayı (Frekans) Göreli Frekans (%) <2500 gr 14 23.33 2500 gr 46 76.67 Toplam 60 100.00 Tablo 2. Yaş Gruplarına Göre Beden Kitle İndeksi Yaş Ortalama Std. Sapma En Küçük Değer En Büyük Değer 19-24 23.06 2.86 18.37 27.61 15 25-34 24.39 6.40 14.34 35.43 15 35-44 29.50 8.54 17.89 43.84 14 45-54 25.73 7.97 12.89 40.97 13 n
Grafikler Grafikler, tablo olarak özetlenen bilgilerin şekillerle ifade edilerek açık, kolay ve anlaşılabilir bir biçimde sunulmasını sağlar. Bir Grafikte İlgilenilen olayı tanımlayacak bir başlık olmalıdır. Grafikte yatay eksen (x ekseni) ve dikey eksen (y eksen) tanımlanmalıdır.
İstatistiksel Grafikler Veri dağılımımızın şeklini (yapısını) daha iyi tanımlamak için grafiklerden yardım alırız. Tablo olarak özetlenen bilgiler istenirse grafik olarak ta tanımlanabilir. Burada önemli bir husus veri tipimize göre grafik seçmemizdir. Tek bir değişkenin söz mevzusu olduğu durumlarda veri tipimize nazaran seçmemiz gereken grafik türleri şöyledir ;
a.nitel veriler için kullanılan grafikler Çubuk Grafiği (bar graph) Daire Dilim Grafikleri (pie chart Bindirme Grafikleri (stacked graph)
b.nicel (sayısal) veriler için kullanılan grafikler Histogram (histogram) Dağılım Polinomu (frequency polygon) Çizgi grafiği (line graph) Dal-yaprak grafiği (stem and leaf plot) Yığılımlı sıklık grafiği (cumulative frequency polynom) Kutu çizgi grafiği (box and whisker plot) ortalama Standart Sapma Grafiği (mean Standart deviation graph)
Grafikler Niteliksel Veri Niceliksel Veri * Çubuk Grafik * Daire Dilimleri Grafiği * Histogram * Çizgi grafiği * Ortalama - Standart Sapma Grafiği * Kutu - Çizgi Grafiği * Dal ve Yaprak Grafiği Grafikler oluşturulurken veri türüne (sayısal kategorik) ve değişken sayısına göre (tek değişkenli çok değişkenli) uygun grafik seçilmelidir.
Çubuk (Sütun) Grafiği Yatay eksen sınıfları, dikey eksen sayı (sıklık) yada yüzdeleri belirtir. Çubuklar arasında boşluk vardır ve çubukların genişliği birbirine eşittir.
Çubuk Grafiği (bar graph) Bir değişkenin kategorilerine ilişkin sıklık ya da yüzdelerin birbirinden ayrı çubuklarla yayınlandıği grafik türüdür.
POWER POİNT ÇUBUK GRAFİK YAPMAK
ÇUBUK GRAFİK ÜZERİNE ÇİFT TIKLA
Daire Dilimleri Grafiği Kan Grubu Sayı Yüzde Açı A 26 52 187.2 B 14 28 100.8 AB 3 6 21.6 O 7 14 50.4 Toplam 50 100 360 Her bir kategoriye ait açı hesaplanarak çizilir. Her bir daire dilimi yüzde veya açı ile ifade edilir.
Histogram Sürekli sayısal veriler için kullanılır. Çubuk grafiğine benzer ancak histogramda çubuk grafikten farklı olarak çubuklar bir birine bitişik olarak çizilir. Verinin yapısı hakkında bilgi verir. Yatay eksende sınıf değerleri bulunur. Dikey eksende ise sayı yada yüzde bulunur. Bu grafiğin şeklini değiştirmez.
Histogram 20 Boy uzunluğunun Histogram Grafiği 1 5 Sıklık 1 0 5 0 1 64 Simetrik yapı 1 68 1 72 1 76 Boy Uzunluğu 1 80 1 84
Çizgi Grafiği İlgilenilen özelliğin zaman içerisindeki değişimini göstermek için kullanılır. Bu grafikte ilgilenilen zaman noktasındaki sıklıkların çizgi ile birleştirilmesi yardımıyla elde edilir.
Ortalama - Standart Sapma Grafiği Ort + Std Sapma 1 Standart sapma Aritmetik Ortalama 1 Standart sapma Ort - Std Sapma Tek tepeli simetrik verilerde kullanılır.
Kutu Çizgi Grafiği Aşırı yada aykırı olmayan en büyük değer ÇAG 3. Çeyrek Ortanca 1. Çeyrek Aşırı yada aykırı olmayan en küçük değer Genellikle çarpık dağılımlarda kullanılır.
Karşılaştırma Ortalama standart sapma grafiği tek tepeli simetrik dağılımlarda kullanılır. Kutu-çizgi grafiği çarpık dağılımlarda kullanılabilir. Ortalama standart sapma grafiği aşırı değerlerden etkilenirken kutu çizgi grafiği aşırı değerlerden etkilenmez ve aşırı değerleri gösterir. Kutu çizgi grafiği verinin yapısı hakkında bilgi verir; ortalama standart sapma verinin yapısı hakkında bilgi vermez.
Sağa çarpık dağılım Çocuk Sayısı'nın Dağılımı 18 16 14 12 Sıklık 10 8 6 4 2 0 0 2 4 6 Çocuk Sayısı 8 10 Tepe değeri < Ortanca < Ortalama
Sola Çarpık Dağılım 12 Sınav Sonuçları'nın Dağılımı 10 8 Sıklık 6 4 2 0 50 60 70 80 Sınav Sonuçları 90 100 Tepe değeri > Ortanca > Ortalama
İki Tepeli Dağılım
İki Tepeli Dağılım
Dal-Yaprak Grafiği Dal Yaprak 4 0 1 3 5 2 4 4 5 6 6 1 2 2 5 6 7 8 9 7 1 1 2 3 3 4 4 4 4 4 5 8 1 3 4 5 6 6 7 8 9 0 1 4 6 7 9 Dal Yaprak 4 0 1 3 5 2 4 4 5 6 6 1 2 2 5 6 7 8 9 7 1 1 2 3 3 4 4 4 4 4 5 8 1 3 4 5 6 6 7 8 9 0 1 4 6 7 9 Aynı anda hem verileri hem de dağılımın yapısını gösterir. Verileri gösterdiği için bu grafik üzerinden ortalama, ortanca, tepe değeri gibi istatistikler hesaplanabilir.
ZİL ÇALDI PAYDOS DERS BİTTİ EVDE ÖDEV YAPMAYI UNUTMAYIN