İstatistik 1 BÖLÜM 2 VERİ SETLERİNİN ÖZETLENMESİNDE KULLANILAN SIKLIK DAĞILIM TABLOLARI VE GRAFİKSEL YÖNTEMLER 1
İşlenecek Konular VERİ TÜRLERİ VE SAYISAL OLMAYAN İSTATİSTİKSEL ÖZETLEME YÖNTEMLERİ Temel Kavramlar ve Tanımları Ölçümleme Dereceleri Veri Türleri ve Özetleme Yöntemleri 2
Temel Kavramlar ve Tanımları 1. Nominal ölçümleme elementin özelliğinin kategorize edilerek yansıtılmasıdır. 2. Ordinal ölçümleme nominal ölçünün özelliklerine sahip olan ve verilerin sıralanmasını sağlayan ölçümleme biçimidir. Ordinal veriler rakamsal veya bilgi içerikli olabilir. 3
Temel Kavramlar ve Tanımları 3. Aralık ölçümleme ordinal ölçümlemenin özelliklerine sahip olan ve veri değerlerine ilişkin aralığın sabit ölçü ile belirlenmesini sağlayan ölçümlemedir. Aralık sayısaldır. 4. Oran ölçümlemesi aralık ölçümlemesinin bütün özelliklerini taşıyan ve oran şeklinde oluşturulan ölçümlemedir. 4
Veri Türleri ve Özetleme Yöntemleri Veri Türleri Nicel Veriler a) aralık veri b) oran veri Nitel Veriler a) nominal veri b) ordinal veri Tablo Yöntemi ile Özetleme Mutlak Sıklık Dağılımı (MSD) -Relatif Sıklık dağılımı (RSD) -Birikimli MSD -Birikimli RSD Zaman serisi: Herhangi bir değişkenin belirli bir zamanda aldığı değerler dizinidir. Kesit veriler: Belirli bir zamanda aynı anda gözlemlenen değerlerdir. 5
Özetleme Yöntemleri Grafik Yöntemi ile Özetleme - Nokta grafikleri - Pasta grafikleri - Histogramlar - Sıklık Poligonları - Zaman serisi grafikleri - Çizgi grafikleri - Parçalı bar grafikleri - Box ve Whisker grafikleri - Gövde ve yaprak grafikleri 6
Özetleme Yöntemleri Grafik Yöntemi ile Özetleme -Bar grafikleri -Resim grafikleri -Pareto Histogramları 7
Verilerin Tablo Yöntemi ile Özetlenmesi Verilerin Tablo Yöntemi ile Özetlenmesi Sıklık dağılımı tablosu oluşturulurken izlenmesi gereken aşamalar şöyledir: (A) Veri setinde yer alan değişkenlerin nicel olması durumunda gözlemler küçükten büyüğe doğru sıralanır. (B) Gözlem sıklıkları (f i ) tek tek sayılır. Bu değerler sıklık dağılım tablosunun mutlak sıklık sütuna yazılır. (C) Gözlem sıklıkları hesaplanarak toplam gözlem sayısı elde edilir (n = Sf i ). (D) Relatif sıklıklar hesaplanır. (RS i = f i / n). (E) Birikimli sıklar hesaplanır. (BRS i = BS i + BRS i-1 ). 8
Verilerin Tablo Yöntemi ile Özetlenmesi Sıklık dağılım tabloları ve histogramlar oluşturulurken kullanılacak kısaltmalar şunlardır: n = gözlem sayısı f i = sıklık, değer yada aralık i RS i = relatif sıklık, değer yada aralık i BS i = birikimli sıklık, değer yada aralık i 9
Verilerin Tablo Yöntemi ile Özetlenmesi Örnek: Can a geçen hafta boyunca gelen telefon sayıları günler itibariyle şöyledir: Pazartesi: 20, Salı: 33, Çarşamba: 36, Perşembe: 22, Cuma: 40, Cumartesi: 38, Pazar: 17. Burada yer alan verileri tablo yöntemini kullanarak özetleyiniz. 10
Gün MS (fi) BMS RS (fi/n) BRS Pazartesi 20 20 0.097 0.097 Salı 33 20+33=53 0.160 0.097+0.160 =0.257 Çarşamba 36 Perşembe 22 Cuma 40 Cumartesi 38 Pazar 17 Toplam N=206 89 0.174 0.431 111 0.106 0.537 151 0.194 0.731 189 0.184 0.915 206 0.082 1.00 206 1.00 1.00 11
Sınıf Verilerin Tablo Yöntemi ile Sıklık Özetlenmesi Örnek: Veri seti Küçükten büyüğe doğru sıralı: 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Relatif Sıklık Yüzde 10 ile 20 arasında 3.15 15 20 ile 30 arasında 6.30 30 30 ile 40 arasında 5.25 25 40 ile 50 arasında 4.20 20 50 ile 60 arasında 2.10 10 Toplam 20 1 100 12
Sayısal Verilerin Grafikle Özeti: Histogram Örnek: Veri seti Küçükten büyüğe doğru sıralı 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Histogram Sınıf Aralığı sınırları Frequency 7 6 5 4 3 2 1 0 6 5 4 3 2 0 0 5 15 25 36 45 55 More Sınıf Orta Noktası Barlar arasında boşluk yoktur 13
Sayısal Verilerin Grafikle Özeti: Sıklık Poligonu Örnek: Veri seti Küçükten büyüğe doğru sıralı 12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58 Fr e q u e n c y 7 6 5 4 3 2 1 0 5 1 5 2 5 3 6 4 5 5 5 Mo r e 14
Sayısal Verilerin Grafikle Özeti: Birikimli Sıklık Örnek: Veri Data seti in Küçükten ordered array: büyüğe doğru sıralı 12, 12, 13, 13, 17, 17, 21, 21, 24, 24, 24, 26, 26, 27, 27, 27, 30, 30, 32, 32, 35, 35, 37, 37, 38, 38, 41, 41, 43, 43, 44, 44, 46, 46, 53, 53, 58 58 Birikimli Relatif Mutlak Birikimli Sınıf Sıklık Sıklık 10 ile 20 arasında 3 15 20 ile 30 arasında 9 45 30 ile 40 arasında 14 70 40 ile 50 arasında 18 90 50 ile 60 arasında 20 100 15
Sayısal Verilerin Grafikle Özeti: Ogive (Birikimli % Poligon Örnek: Veri Data seti in Küçükten ordered array: büyüğe doğru sıralı 12, 12, 13, 13, 17, 17, 21, 21, 24, 24, 24, 26, 26, 27, 27, 27, 30, 30, 32, 32, 35, 35, 37, 37, 38, 38, 41, 41, 43, 43, 44, 44, 46, 46, 53, 53, 58 58 Ogive 100 80 60 40 20 0 10 20 30 40 50 60 Sınıf Sınırları (Sınıf orta noktaları değil) 16
Sayısal Verilerin Grafikle Özeti: Nokta Grafikleri Total Year to Date Return (%) 40 30 20 10 0 Mutual Funds Scatter Plot 0 10 20 30 40 Net Asset Values 17
Özet Tablo: Sayısal Olmayan Veriler için Yatırım Türü Miktar Yüzde Milyar TL H. Senedi 46.5 42.27 Bono 32 29.09 Faiz 15.5 14.09 Döviz 16 14.55 Total 110 100 Değişkenler Kategoriktir 18
Bar Grafikleri Yatırım Türü Döviz Faiz Bonolar H. Senetleri 0 10 20 30 40 50 Miktar (milyar TL) 19
Pasta Grafikleri Döviz %15 Amount Invested in K$ Faiz % 14 H.Senedi % 42 Bono % 29 Değerler Yuvarlanmıştır 20
Pareto Diyagramı 45% 100% 40% 90% Barlar her bir türden yüzde kaç yatırıldı ğını gösterm ektedir 35% 30% 25% 20% 15% 10% 5% 0% Stocks Bonds Savings CD 80% 70% 60% 50% 40% 30% 20% 10% 0% Çizgi Grafiği Birikimli sıklıkları göstermekte dir. 21
Nitel Veri Setlerinin Tablo Yöntemi ile Özeti Kontenjans Tabloları: Milyar TL cinsinden yatırım Yatırım Yatırımcı A Yatırımcı B Yatırımcı C Toplam Türü H. Senedi 46.5 55 27.5 129 Bono 32 44 19 95 Faiz 15.5 20 13.5 49 Döviz 16 28 7 51 Total 110 147 67 324 22
Nitel Veri Setlerinin Grafik Yöntemi ile Özetlenmesi Yatırımcıların Karşılaştırılması Döviz Faiz Bono H. Senedi 0 10 20 30 40 50 60 Yatırımcı A Yatırımcı B Yatırımcı C 23
Grafikle Özetleme Yönteminde Önemli Noktalar Veri setleri, konunun özünü ve gerçek istatistiki bilgileri yansıtacak biçimde kullanıcıya sunulmalıdır. Veri setleri, Karmaşıklıkları ortadan kaldıracak biçimde sunulmalıdır. Birden fazla sayıda yöntemle sunulmalıdır. En verimli yöntemlerin kullanılması gerekir. Veri ile ilgili gerçekler yansıtılmalıdır. 24
Veri Setlerinin Sunumunda Ortaya Çıkan Hatalar Karmaşık Grafiklerin kullanımı Karşılaştırmalı temellerin belirtilmemiş olması Dikey eksenin yanlış değerlerle gösterilmesi veya dikey eksenin sıkıştırılması Dikey eksende başlangıç noktasının net olarak belirtilmemiş olması 25
Karmaşık Grafiklerin kullanımı Kötü Sunum İyi Sunum Asgari Ücret 1960: $1.00 1970: $1.60 1980: $3.10 1990: $3.80 4 2 0 $ Asgari Ücret 1960 1970 1980 1990 26
Karşılaştırmalı temellerin belirtilmemiş olması 300 200 Sıklık 0 Kötü Sunum Vizeden A Alan Öğrenciler. 1 2 3 4 30 10 % İyi Sunum Vizeden A Alan Öğrenciler. 1 2 3 4 27
Dikey Eksenin Sıkıştırılması 200 100 Kötü Sunum İyi Sunum 4 Aylık Satışlar 4 Aylık Satışlar Milyar TL 50 25 Milyar TL 0 Q1 Q2 Q3 Q4 0 Q1 Q2 Q3 Q4 28
Dikey Eksende Başlangıç Noktasının Belirtilmemiş Olması 45 42 39 36 Kötü Sunum Aylık Satışlar Milyar TL O Ş M N M H 45 42 39 36 0 İyi Sunum Aylık Satışlar Milyar TL O Ş M N M H 29