İstatistik ve Olasılık Ders 2: Prof. Dr. İrfan KAYMAZ
Tanım İnceleme sonucu elde edilen ham verilerin istatistiksel yöntemler kullanılarak özetlenmesi açıklayıcı istatistiği konusudur. Açıklayıcı istatistikte kullanılan yöntemler: Frekans Tabloları Şekiller ve Grafikler Histogram ve Frekans Poliganları Sütun ve Pasta Grafikleri
Frekans Tabloları Kullanılan en yaygın yöntemlerden biridir. Örnek Frekans Tablosu
Frekans Tabloları Verileri frekans tabloları yardımıyla sınıflandırmanın yararları şöyle özetlenebilir: İlgili değişkenin dağılımı hakkında bilgi alınabilir. Verilerin hangi değerler etrafında gruplandığı görülebilir. Ortalama, standart sapma ve varyans gibi değerler daha kolay hesaplanabilir. Bu yararlarına karşın verilerin sınıflandırılması sırasında (özellikle sınıf aralıklarının geniş tutulması halinde) bilgi ve hassasiyet kaybı olmaktadır. Çünkü, herhangi bir sınıfın aralığı içine düşen farklı değerler sadece o aralığın orta değeri ile temsil edilirler.
Frekans Tabloları Frekans tablolarının düzenlenmesinde aşağıdaki sıra izlenir: 1.Sınıf sayısı belirlenir (5 ila 20 arasında olur). Sturgess kuralı SS=1+3.2*log(n) 2. Verilerin değişim genişliği bulunur (DG=enbüyük değer - enküçük değer) 3. Yaklaşık sınıf aralığı bulunur (SA=DG/sınıf sayısı) 4. Birinci sınıfın alt limiti veri grubundaki en küçük değeri içine alacak şekilde belirlendikten sonra, hesaplanan sınıf aralığı bu değere eklenmek suretiyle diğer sınıfların alt limitleri oluşturulur. Bir sınıfın üst limitini bulmak için bir sonraki sınıfın alt limitinden belirli bir değer (veri grubunun özelliğine göre yeteri kadar küçük bir değer) çıkarılır. Böylece sınıf aralarına değer düşmesi önlendiği gibi, bir değerin iki ayrı sınıfa dahil edilmesi de engellenmiş olur. 5. Sonuncu sınıfın üst limiti veri grubundaki en büyük değeri içine alacak şekilde belirlenir.
Frekans Tabloları Frekans tablolarının düzenlenmesinde aşağıdaki sıra izlenir: 6. Sınıf limitlerinin ortalamaları alınarak sınıf değerleri (sınıf ortalamaları) belirlenir. 7. Veriler taranarak her sınıfa düşecek veri sayısı (frekans) belirlenir. Frekans tablosundaki her bir sınıf için nispi (oransal) frekans, eklemeli frekans ve eklemeli nispi(oransal) frekans değerleri hesaplanır. Nispi Frekans: bir sınıfın frekansının (n) toplam veri sayısına (N) bölünüp, 100 ile çarpılması ile elde edilir. Eklemeli Frekans: Herhangi bir sınıfın frekansı ile o sınıftan önceki sınıfların frekanslarının toplanması ile elde edilir. Eklemeli Nispi Frekans: bir sınıfın eklemeli frekansının toplam veri sayısına (N) bölünüp 100 ile çarpılmasıyla elde edilir.
Frekans Tabloları Örnek 1: Bir dolum tesisinde doldurulmakta olan bakliyat paketlerinden rastgele seçilen 40 paketin ağırlıkları kg olarak aşağıda verilmiştir. 2.3 4.1 3.6 4.5 3.1 3.8 3.2 2.8 3.3 1.6 3.1 3.2 3.7 3.1 4.7 3.9 2.6 4.2 3.2 3.6 2.8 3.4 3.8 3.1 3.3 3.0 3.6 4.3 3.1 4.2 1.8 3.4 4.7 3.9 3.4 2.7 3.6 3.2 4.4 3.5 Sınıf sayısını 7 alarak frekans tablosunu oluşturunuz. Nispi (izafi) frekansları, birikimli ve birikimli nispi frekansları hesaplayınız.
Frekans Tabloları Örnek 1 ÇÖZÜM: DG=4.7-1.6=3.1 SA=3.1/7=0.44 0.5 Veriler dikkate alınarak alt ve üst limitleri belirlemede kullanılacak yeterince küçük değer=0.1 olarak seçilebilir. Sınıf alt limitleri 1.6-0.1=1.5 1.5+0.5=2.0 2.0+0.5=2.5 3.0 3.5 4.0 4.5 Sınıf üst limitleri 2.0-0.1=1.9 1.9+0.5=2.4 2.4+0.5=2.9 3.4 3.9 4.4 4.9 Sınıf sınırları (2.0-1.9)/2=0.05 birinci sınıf için 1.5-0.05=1.45 ve 1.9+0.05=1.95 Nispi frekans (2/40)*100=%5 (1/40)*100=%2.5 (4/40)*100=%10
Frekans Tabloları Örnek 1 ÇÖZÜM: Frekans tablosunun tarama sütununa bakıldığında verilerin hangi değerler etrafında yoğunlaştığı ve veri grubuna ait dağılımın şekli kabaca görülmektedir
Şekiller ve Grafikler Anlamlı bilgileri çıkarabilmek için şekillerin ve grafiklerin çiziminde eksenlerin orantılı olmasına ve gerekli açıklayıcı bilgileri bulundurmasına dikkat edilmelidir. Verileri şekil ve grafiklerle göstermenin yararları aşağıdaki gibi özetlenebilir: Anlaşılabilirlik artırılır. Dikkat çekilecek hususlar belirtilir. Dağılımın biçimi hakkında bilgi sağlanır. Tahmin kolaylaşır 4 2 0-2 -4 2 1 0-1 -2-2 -1 0 1 2 60 40 20 0 1 2 1 2 3 4 5 6
Histogram ve Frekans Poligonları X eksenine sınıf sınırları, Y eksenine frekans değerleri yazılarak her bir sınıf için oluşturulan dikdörtgenlerin meydana getirdiği şekle histogram denir. Her bir dikdörtgenin alanı ilgili sınıfın frekansını ifade etmektedir. Örnek1 e göre oluşturulan frekans tablosunun histogramı yandaki gibi çizilebilir. Şekildeki dikdörtgenlerin orta noktalarının birleştirilmesiyle frekans poligonu elde edilir. Poligondaki kırık çizgilerin kaldırılmasıyla (bunun için gözlem sayısının yeterince artırılması gerekir) verilerin dağılım biçimi kabaca belirlenebilir.
Histogram ve Frekans Poligonları Dağılımın biçimine bakılarak veri grubu hakkında ilk basit değerlendirmeleri yapmak mümkündür. Sözgelimi, dağılımın simetrik değil de herhangi bir yöne çarpık olması; Örneklemenin hatalı yapıldığı, Ölçüm skalasının yanlış seçildiği, Örnek büyüklüğünün yetersiz olduğu anlamına gelebilir. Ayrıca çizilen histogramın veya frekans poligonunun tepe değerinin birden fazla olması; İlgili anakütlenin homojen olmadığını ve Örnek büyüklüğünün artırılması gerektiğini gösterir. İncelenen verilere ilişkin dağılım her zaman normal dağılım olmayabilir.
Histogram ve Frekans Poligonları Yukarıdaki frekans tablosunda verilen birikimli frekans değerleri Y eksenine, sınıf üst (veya alt) sınırları X eksenine yazılır ve ilgili değerler grafiğe noktalar halinde işlenip, bu noktalar birleştirilirse aşağıdaki birikimli frekans poligonu elde edilir Birikimli frekans poligonu yardımıyla belirli orandaki değerlerin hangi değerden daha küçük veya hangi değerden daha büyük olduğu belirlenebilir
Sütun ve Pasta Grafikleri Miktarlar arasındaki ilişkiyi göstermek için X eksenine sınıf veya alt sınırlar, Y eksenine mutlak veya nispi miktarlar yerleştirilerek çizilen grafiklerdir. Örnek 2: Kamu ve özel sektörleri tarafından yapılan şeker üretiminin yıllara göre dağılımı aşağıdaki tabloda verilmiştir. Verilere ait sütun grafiğini çiziniz. Yıllar 1967 1968 1969 1970 1975 Kamu 438301 411921 351619 315307 494000 Özel 224915 305700 235573 202703 312000 Toplam 663216 717621 587192 518010 806000
Sütun Grafiği Örnek 2 Çözüm:
Pasta Grafiği Bir bütünü meydana getiren parçaların ifade edilmesinde kullanılan grafiklerden biri de bölünmüş daire (pasta) grafikleridir. Bu grafikleri çizerken dairenin bütün alanı %100 kabul edilir. Merkezdeki 3.6 derecelik açı %1 e karşı geldiğinden (360/100=3.6) parçaların kaçar derece açıyla gösterileceği hesaplanır. Örneğin yan tarafta çizilen ve bir üniversitedeki faaliyetlerin dağılımını gösteren bölünmüş daire grafiği şöyle yorumlanabilir: Bu üniversitedeki faaliyetlerin %65 i eğitim-öğretim, %20 si araştırma, %15 ide yayın ve halk hizmeti olarak verilmektedir
Uygulama Örnekleri Uygulama 1: bir malzemenin dayanımı için yapılan testlerde aşağıdaki sonuçlar elde edilmiştir. Bu datalara ait histogramı çiziniz. 105 221 183 186 121 181 180 143 97 154... 153 174 120 168 167 141 245 228 174 199... 181 158 176 110 163 131 154 115 160 208... 158 133 207 180 190 193 194 133 156 123... 134 178 76 167 184 135 229 146 218 157... 101 171 165 172 158 169 199 151 142 163... 145 171 148 158 160 175 149 87 160 237... 150 135 196 201 200 176 150 170 118 149
Uygulama MATLAB Applications Örnekleri Uygulama 1: clear all;clc a=[105 221 183 186 121 181 180 143 97 154... 153 174 120 168 167 141 245 228 174 199... 181 158 176 110 163 131 154 115 160 208... 158 133 207 180 190 193 194 133 156 123... 134 178 76 167 184 135 229 146 218 157... 101 171 165 172 158 169 199 151 142 163... 145 171 148 158 160 175 149 87 160 237... 150 135 196 201 200 176 150 170 118 149]; 20 18 16 14 12 10 8 6 4 2 0 60 80 100 120 140 160 180 200 220 240 260 hist(a) hist(a,17) 12 10 8 6 4 2 0 60 80 100 120 140 160 180 200 220 240 260
Dersin Özeti Araştırmalar sonucu elde edilen veri grupları belirli bir şekilde sınıflandırılmadan veya uygun grafiklerle gösterilmeden veri grubu hakkında ilk basit değerlendirmeyi yapmanın mümkün olmadığı söylenebilir.
Gelecek dersin konusu Merkezi Eğilim ve Dağılma Ölçüleri.