ASTROİSTATİSTİK 2. KONU

Benzer belgeler
İstatistik ve Olasılık

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

İstatistik ve Olasılık

Mühendislikte İstatistiksel Yöntemler

Bölüm 2 VERİLERİN DERLENMESİ VE SUNUMU

Yrd. Doç. Dr. Sedat Şen 9/27/2018 2

Prof.Dr.İhsan HALİFEOĞLU

Bölüm 2. Frekans Dağılışları VERİLERİN DERLENMESİ VE SUNUMU. Frekans Tanımı. Verilerin Derlenmesi ve Sunulması

TEMEL İSTATİSTİK BİLGİSİ. İstatistiksel verileri tasnif etme Verilerin grafiklerle ifade edilmesi Vasat ölçüleri Standart puanlar

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

Prof.Dr.İhsan HALİFEOĞLU

TANIMLAYICI İSTATİSTİKLER

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

VERİLERİN GRAFİKLER YARDIMIYLA SUNUMU Daire Grafikleri Yardımıyla Verilerin Sunumu Sütun(Çubuk) Grafikleri Yardımıyla Sunumu

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

BÖLÜM 9 NORMAL DAĞILIM

İSTATİSTİK I KISA ÖZET KOLAYAOF

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

FREKANS VERİLERİ. Prof.Dr. Levent ŞENYAY III - 1

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

Mühendislikte İstatistik Yöntemler

SÜREKLĠ OLASILIK DAĞILIMLARI

Merkezi Eğilim ve Dağılım Ölçüleri

Merkezi eğilim ölçüleri ile bir frekans dağılımının merkezi belirlenirken; yayılma ölçüleri ile değişkenliği veya yayılma düzeyini tespit eder.

Yrd.Doç.Dr. Ali SICAK BEÜ. EREĞLİ EĞİTİM FAKÜLTESİ EĞİTİM BİLİMLERİ BÖLÜMÜ

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5

VERİLERİN SINIFLANDIRILMASI

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ TELAFĐ SINAVI SORULARI

Örnek...4 : İlk iki sınavında 75 ve 82 alan bir öğrencinin bu dersin ortalamasını 5 yapabilmek için son sınavdan kaç alması gerekmektedir?

Copyright 2004 Pearson Education, Inc. Slide 1

VERİ KÜMELERİNİ BETİMLEME

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ DÖNEM SONU SINAV SORULARI

BÖLÜM 1 GİRİŞ: İSTATİSTİĞİN MÜHENDİSLİKTEKİ ÖNEMİ

Prof.Dr.İhsan HALİFEOĞLU

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ BÜTÜNLEME SINAVI SORULARI

BÖLÜM 4 FREKANS DAĞILIMLARININ GRAFİKLE GÖSTERİLMESİ

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Merkezi Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Veri Analizi. Isınma Hareketleri. Test İstatistikleri. b) En çok tekrar eden: 7 (mod) c) Açıklık = En büyük En küçük = 10 1 = 9. d)

Verilerin Özetlenmesinde Kullanılan Tablolar ve Grafiksel Yöntemler

Verilerin Düzenlenmesi

ÖLÇME DEĞERLENDİRME ÜNİTE BAŞLIKLARI

VERİLERİ ÖZETLEME. Prof.Dr. Levent ŞENYAY III - 1

İSTATİSTİK MHN3120 Malzeme Mühendisliği

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

BÖLÜM 10 PUAN DÖNÜŞÜMLERİ

GRAFİK YORUMLAMA. 1 ) Sütun Grafiği : Belirli bir zaman aralığında bazı veri grup-

Bölüm 3. Tanımlayıcı İstatistikler

İÇİNDEKİLER ÖN SÖZ...

Sürekli Rastsal Değişkenler

BİYOİSTATİSTİK. Genel Uygulama 1. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Mühendislik Mekaniği Statik. Yrd.Doç.Dr. Akın Ataş

Değer Frekans

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

KONU2 MERKEZİ EĞİLİM ÖLÇÜLERİ EĞİLİM ÖLÇÜLERİ ANALİTİK ORTALAMALAR ANALİTİK OLMAYAN MERKEZİ. Aritmetik ortalama **Medyan(median)

istatistik 4. Bir frekans dağılımına ilişkin birikimli seriler 1. Birimlerle ilgili aşağıdaki ifadelerden hangisi

= 2 6 Türevsel denkleminin 1) denge değerlerinin bulunuz. 2) Bulmuş olduğunuz dengenin istikrarlı olup olmadığını tespit ediniz.

Test İstatistikleri AHMET SALİH ŞİMŞEK

BİYOİSTATİSTİK Grafikler Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Merkezi Yığılma ve Dağılım Ölçüleri

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

İNŞAAT MÜHENDİSLİĞİ BÖLÜMÜ ÖĞRENCİLERİNİN BAŞARI NOTLARININ DEĞERLENDİRİLMESİ. Tamer Yılmaz, Barış Yılmaz, Halim Sezici 1 ÖZET

Mühendislik Mekaniği Statik. Yrd.Doç.Dr. Akın Ataş

KALİTE KONTROL VE STANDARDİZASYON 7 Teknik

b) Aşağıda verilen tanımlamalardan herhangi 5 adeti yazılabilir. Aritmetik Ortalama: Geometrik Ortalama:

EĞİTİMDE ÖLÇME VE DEĞERLENDİRME UĞUR YILMAZER 1

Ölçme ve Değerlendirmenin. Eğitim Sistemi Açısından. Ölçme ve Değerlendirme. TESOY-Hafta Yrd. Doç. Dr.


AKSARAYLI TEMEL İSTATİSTİK YÖNTEMLER

BİYOİSTATİSTİK Tablo Hazırlama Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

ÖLÇME VE DEĞERLENDİRME. Antrenörlük Eğitimi 4. Sınıf. Ölçme ve Değerlendirme - Yrd. Doç. Dr. Yetkin Utku KAMUK

Tesadüfi Değişken. w ( )

ÖĞRENCİNİN ADI SOYADI:. NO:

KLASİK FRAKTALLAR FRAKTAL ÖZELLİKLERİ VE BOYUT

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

BÖLÜM 13 HİPOTEZ TESTİ

objektif değerlendirilmesini sağlayan bilim - veri arasındaki farkın olup olmadığını tespit

7. HAFTA. Verilerin düzenlenmesi Verilerin gruplandırılması Merkezi eğilim ölçüleri Merkezi dağılım ölçüleri Standart puanlar. Yrd. Doç. Dr.

Ders 1 Minitab da Grafiksel Analiz-I

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

Verilerin Özetlenmesinde Kullanılan Sayısal Yöntemler

2. Aşağıdaki pseudocode ile verilen satırlar işletilirse, cnt isimli değişkenin son değeri ne olur?

EĞĠTĠMDE ÖLÇME VE DEĞERLENDĠRME BÖLÜM IV Ölçme Sonuçları Üzerinde Ġstatistiksel ĠĢlemler VERİLERİN DÜZENLENMESİ VERİLERİN DÜZENLENMESİ

13. Olasılık Dağılımlar

İSTATİSTİK 1. Ankara Üniversitesi Eğitim Bilimleri Fakültesi Ölçme ve Değerlendirme Anabilim Dalı. Yrd. Doç. Dr. C. Deha DOĞAN

ANADOLU ÜNİVERSİTESİ İST 213 OLASILIK DERSİ TANIMLAR VE VERİ SINIFLAMASI

Ölçme Sonuçları Üzerinde İstatistiksel İşlemler

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik

İstatistik Nedir? Ders 1 Minitab da Grafiksel Analiz-I ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. İstatistiğin Konusu Olan Olaylar

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

İNŞAAT MÜHENDİSLİĞİNDE LİSANS SONRASI AKADEMİK EĞİTİM: SAYILARLA TÜRKİYE DEKİ MEVCUT DURUM

7. HAFTA. Verilerin düzenlenmesi Verilerin gruplandırılması Merkezi eğilim ölçüleri Merkezi dağılım ölçüleri Standart puanlar. Yrd. Doç. Dr.

Sözel ifadelerle açıklama 2. Tablolar halinde düzenleme 3. Grafikle gösterme

Fotogrametride işlem adımları

Bölüm 2. Verinin görsel betimlemesi. İstatistik Ders Notları 2018

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

SÜREKLİ RASSAL DEĞİŞKENLER

Transkript:

ASTROİSTATİSTİK 2. KONU Hazırlayan: Doç. Dr. Tolgahan KILIÇOĞLU 2. VERİLERİN SINIFLANMASI VE DAĞILIMLARININ SUNULMASI İstatistiktikte öncelikle çalışılacak verinin tanımlanmasına ihtiyaç duyulur. Veri tamamen rastgele midir yoksa belirli bir dağılım sergilemekte midir? Bu dağılımın şekli nasıldır? Bu noktada verinin gerekiyorsa gruplanması ve frekans dağılımının yapılması gerekir. Frekans dağılımı yapıldığında, örneğin, verinin iyi bilinen çan şekilli bir dağılım sergileyip sergilemediği ortaya konabilir. Tanımlamaların daha kolay yapılabilmelari için tablolar ve grafikler kullanılır. 2.1 Sınıflanmamış Veri ve Sınıflanmış Veri Çizelge 2.1 de Astronomi ve Uzay Bilimleri Bölümü erkek öğrencilerinin kiloları verilmektedir. Bu çizelgeye bakıldığında verilerin oldukça dağınık olduğu görülür. Böyle bir veriyi yorumlamak gerçekten zordur. İlk bakışta yetmişli rakamların biraz ağır bastığı görülse de net birşey söylemek ilk bakışta mümkün değildir. Çizelge 2.1 Astronomi ve Uzay Bilimleri Bölümü nde okuyan erkek öğrencilerin kiloları 73 76 69 73 73 68 87 72 70 89 77 71 100 78 102 71 81 75 103 77 61 87 77 66 62 87 71 71 73 112 78 94 70 85 75 72 82 75 78 73 69 79 73 70 62 93 79 70 82 69 75 79 71 Çizelge 2.2 Her kiloda kaç kişi var? Kilo Frek. Kilo Frek. Kilo Frek. Kilo Frek. Kilo Frek. Kilo Frek. Kilo Frek. 61 1 69 3 77 3 85 1 93 1 101 0 109 0 62 2 70 4 78 3 86 0 94 1 102 1 110 0 63 0 71 5 79 3 87 3 95 0 103 1 111 0 64 0 72 2 80 0 88 0 96 0 104 0 112 1 65 0 73 6 81 1 89 1 97 0 105 0 66 1 74 0 82 2 90 0 98 0 106 0 67 0 75 4 83 0 91 0 99 0 107 0 68 1 76 1 84 0 92 0 100 1 108 0 Top. 53

Bu veriyi daha iyi anlamlandırmak adına her kiloda kaç kişinin olduğunu (frekans dağılımı) yazabiliriz (Çizelge 2.2). Sınıflanmamış veriden oluşan bu yeni dağılımda verinin yapısı biraz daha net gözükmektedir. Çizelgede en çok rastlanılan kilo 73 kg dir. Bununla beraber 77 ile 79 kg arasında da oldukça öğrencinin olduğu görülmektedir. Ayrıca kiloların büyük bir bölümünün 69 ile 79 kg arasında olduğu görülmektedir. Kiloları tek tek ele almak işlerimizi kolaylaştırsa da aralığımız 1 kg olduğu için veriler hala çok dağınık gözükmektedir. Bunun nedeni 61 kg dan 112 kg a kadar 56 farklı değerin bulunmasıdır. Eğer verideki değişkenin alabileceği değerlerin sayısı 20 nin üzerindeyse Çizelge 2.2 ye benzer bir dağılım verinin anlaşılması adına çok faydalı değildir. Bu verilerin öncelikle sınıflanması uygun olacaktır. Eğer daha geniş kilo aralıkları için (örn., 65 ile 70 kg arasında olanlar gibi) bu dağılımı yaparsak veriler daha da anlamlı hale gelir. Eğer değişkenin alabileceği değerler 20 den azsa (örneğin, bir anketteki Astroistatistik dersini faydalı buluyororum. ifadesine Çok katılıyorum / katılıyorum / emin değilim / katılmıyorum / hiç katılmıyorum şeklinde 5 cevap verilebiliyorsa değişken sadece 5 değer alabilir) veri sınıflamasına gerek yoktur. 2.2 Verilerin Sınıflanması ve Frekans Dağılımı Bir veri sınıflara ayrıldığında, her sınıfta kaç adet birim olduğunun tespit ve ifade edilmesine frekans dağılımı denir. Peki frekans dağılımı için veriler kaç sınıfa bölünmelidir? Sınıfların genişlikleri nasıl olmalıdır? Frekans dağılımı elde edildikten sonra daha iyi nasıl betimlenebilir? İşte şimdi bu sorulara adım adım cevap vereceğiz. 2.2.1 Sınıf sayısının belirlenmesi Bir verinin kaç adet sınıfa bölüneceğine karar verilmesi gerekir. Gereğinden fazla sınıfa bölünmüş olan bir veri çok fazla bilgi içerir ve zor yorumlanır. Veri gerektiğinden az sınıfa bölünürse de detaylar kaybolacağından önemli bir bilginin gözden kaçırılmasına neden olabilir. Verinin kaç sınıfa bölüneceğine ilişkin kesin bir kural yoktur. Bu araştırmacının ne kadar detay istediğine bağlıdır. Eğer veriyi kaç sınıfa böleceğiniz hakkında hiçbir fikre sahip değilseniz 10 civarında sınıfa bölerek işe başlayabilirsiniz. Sınıf sayısını belirlemede bir diğer yaklaşım ise n veri sayısı olmak üzere n+1 ifadesinin verdiği sayının tam değerini almaktır. Örneğin Çizelge 2.1 de 53 kişinin kilo verisi bulunmaktadır. Bu durumda 53+1 8 sınıf kullanılabilir. Ancak burada verilen değerler sadece öneridir. Biz yukarıdaki kilo çizelgesi için 11 adet sınıf kullanacağız. 2.2.2 Sınıfların genişliğinin belirlenmesi Sınıf sayısı belirlendikten sonra sınıf genişliği aşağıdaki ifade ile belirlenir: [En Büyük Değer] [En Küçük Değer] [Sınıf Genişliği]= [Sınıf Sayısı] Örnek olarak Çizelge 2.1 deki veriler kullanılırsa; SG= 112 61 =4.63 11

elde edilir. Kolaylık olması açısından sınıf genişliğini bu veri için yaklaşık 5 olarak alalım. 2.2.3 Sınıfların sınırlarının belirlenmesi Sınıfların sayısı ve genişliği belirlendiğine göre en küçük değerden başlanılarak ve sınıf genişliği kadar atlanılarak sınıfların sınırları belirlenebilir. Örneğe geri dönersek en küçük değeri 61 olan ve sınıf genişliği 5 olan 11 sınıf aşağıdaki şekilde oluşturulabilir: 61 65 66 70 71 75 76 80 81 85 86 90 91 95 96 100 101 105 106 110 111 115 Çizelge 2.1 de en büyük kilo değeri 112 olmasına karşın yaptığımız sınıflama 115 e kadar gitmektedir. Bunun nedeni 4.63 olan sınıf genişliğini 5 e yuvarlamamızdır. Bu durumun oluşması sakıncalı bir durum değildir. Sınıfların sınırları belirlenirken iki basit ama önemli kurala her zaman dikkat edilmelidir: i) Sınıflar bütün değerleri kapsayacak şekilde seçilmeli ve aralarında boşluklar olmamalı (bir değer mutlaka bir sınıfa yazılabilmeli), ii) Bir sınıfın aralığı bir diğerinin aralığının bir bölümü ile çakışmamalıdır (bir değer sadece tek bir sınıfa yazılabilmelidir). Artık sınıfları da belirlediğimize göre frekans dağılımını yapabiliriz. 2.2.4 Frekans dağılımının yapılması Sınıflar belirlendikten artık yapılması gereken tek şey her sınıfa kaç üyenin düştüğünü belirlemektir. Böylece frekans dağılımı çizelgesi oluşturulmuş olur. Çizelge 2.1 deki verilerin sınıflandırılmış frekans dağılımı Çizelge 2.3 de verilmektedir. Çizelge 2.3 incelendiğinde artık ilgili öğrencilerin büyük bir bölümünün kilolarının 71 ile 75 kg arasında olduğu rahatlıkla söylenebilir. Ardından 76 80 kg ve 66 70 kg sınıfları gelir. Diğer kilolara sahip öğrenci sayısı oldukça azdır. Çizelgenin üçüncü ve dördüncü kolonunda birikimli frekans ve oransal frekans olarak adlandırılan iki ölçüt daha mevcuttur. Sınıf göstergesi sınıfın üst ve alt sınırının ortalamasıdır. Birikimli frekans bulunduğu sınıf ve bu sınıfın öncesinde bulunan sınıfların frekanslarının toplamıdır. Oransal frekans ise bir sınıfın frekansının toplam frekansa bölümü ile elde edilir.

i Birikimli frekans: bf i = f j Oransal Frekans: of i = f i j=0 n ve k n= f i i=0 Burada k sınıf miktarı n ise toplam gözlem sayısıdır. Oransal frekans verinin yorumlanmasında çok kullanışlıdır. Çünkü oransal frekans 100 ile çarpıldığında ilgili sınıfa giren birim sayısının toplam birim sayısına oranını verir. Örneğin, kiloları 71 ile 75 aralığında olan erkek öğrenciler bölümdeki tüm erkek öğrencilerin %32 sini (0.321 100) oluşturmaktadır. Oransal frekansın tüm gruplar için toplamının 1 olması gerekir. Ancak Çizelge 2.3 te bu toplam 1.001 olarak çıkmıştır. Bunun temel nedeni oransal frekanslar yuvarlanırken hataların birikmesidir. Noktadan sonra yeteri kadar hane bulunduğundan bu durumun pratikte bir zararı bulunmamaktadır. Çizelge 2.3 Kilo verilerinin sınıflandırılmış frekans dağılımı Sınıf Sınıf Göstergesi Frekans (f i) Birikimli frekans (bf i) Oransal frekans (of i) 61 65 63 3 3 0.057 66 70 68 9 12 0.170 71 75 73 17 29 0.321 76 80 78 10 39 0.189 81 85 83 4 43 0.075 86 90 88 4 47 0.075 91 95 93 2 49 0.038 96 100 98 1 50 0.019 101 105 103 2 52 0.038 106 110 108 0 52 0.000 111 115 113 1 53 0.019 Toplam: 53 1.001 2.3 Verilerin Grafikle Gösterilmesi Bir frekans dağılımını anlamanın veya ifade etmenin en güzel yollarından biri onu bir grafiğe aktarmaktır. Bunun için kullanılabilecek birçok farklı grafik türü bulunmaktadır. Ancak burada sadece sık kullanılan birkaç türden söz edeceğiz: Histogram, poligon, pasta dilimi. 2.3.1 Histogram Grafiği Histogram grafiği oluşturmak için öncelikle her sınıfı temsil eden bir ortalama değer belirlenir. Örneğin, 61 65 kg aralığını içeren sınıfı temsil eden ortalama değer (61+65)/2, yani 63 tür. Diğer sınıflar için de benzer şekilde ortalama değerler hesaplanır. Elde edilen bu değerler grafiğin x eksenine yerleştirilir. Y-eksenine ise frekans (Şekil 2.1), oransal frekans (Şekil 2.2) veya birikimli frekans (Şekil 2.3) yerleştirilerek histogram grafiği oluşturulur.

Şekil 2.1 Frekans dağılımının histogram grafiği ile gösterimi Şekil 2.2 Orantısal frekans kullanılarak oluşturulan histogram grafiği Şekil 2.3 Birikimli frekans kullanılarak oluşturulan histogram grafiği

2.3.2 Poligon Grafiği Poligon grafiği de histogram grafiğine çok benzer. Ancak histogram grafiğindeki çubuklar yerine her veri bir nokta ile gösterilir ve noktalar çizgilerle birleştirilir (bkz., Şekil 2.4). Şekil 2.4 Frekans dağılımının poligon grafiği ile gösterimi 2.3.3 Pasta Dilimi Grafiği Pasta dilimi grafiği de oldukça yaygın kullanılır. Şekil 2.5 te üstte frekans dağılımını verdiğimiz veri setinin pasta dilimi grafiği gösterilmektedir. Bu gösterimde baskın olan ve zayıf olan sınıflar hemen kendini göstermektedir. Ayrıca bu şekle bakıldığında en fazla öğrenci içeren iki sınıfın toplamının toplam öğrenci sayısının yarısından bir miktar fazlasını kapladığı görülmektedir. Pasta dilimi grafikleri genellikle az sayıda sınıf olduğu durumlarda frekanslar arasındaki farkların daha belirgin şekilde ifade edilmesi için kullanılır. Örneğin bir seçimin sonucunda partilerin dağılımları genellikle bu grafik türü ile verilmektedir. Şekil 2.5 Frekans dağılımının pasta dilimi grafiği ile gösterimi

2.4 Yaygın Dağılım Türleri Bir verinin frekans dağılımı yapıldığında dağılım farklı şekillere sahip olabilir. Veri hangi türde olursa olsun en olası durum verideki değişkenin belirli bir değer komşuluğunda daha çok olması ve bu değerden uzaklaştıkça sayının gittikçe azalmasıdır. Bu dağılım normal dağılım olarak bilinir ve matematiksel olarak Gauss eğrisi ile gösterilir (Şekil 2.6). Şekil 2.6 Normal Dağılım Normal dağılım günlük hayatta birçok durumda karşımıza çıkabilecek doğal bir dağılımdır. Örneğin, bir atış poligonunda hedefin üzerindeki mermi izlerinin dağılımı, üniversiteye giriş sınavında öğrencilerin notları, elmaların boyutları, insanların boyları veya kiloları (erkek/kadın ayrı ele alınmak üzere), IQ testi sonuçları, bir masanın boyutlarının farklı insanlar tarafından ölçümü, bir gökdelenin uzunluğunun insanlar tarafından tahmini, farklı kişiler tarafından kullanılan aynı marka cep telefonunun ilk kaç gün sonra bozulduğu, üzerinde 300 gr yazan çikolata paketlerinin ağırlığı, hayatınızda geçirdiğiniz günleri 1 den (berbattan) 10 a (müthişe) doğru numaralandırdığınızda oluşan dağılıım vs... Bir veri normal dağılım sergilediğinde oldukça kolay incelenebilmektedir. Bunun nedeni normal dağılımın yapısının iyi bilinmesi yani bir formülünün olmasıdır. Ancak bazen veriler normal dağılımdan saparak pozitif veya negatif çarpıklık sergileyebilirler (Şekil 2.6). Pozitif Çarpıklık Negatif Çarpıklık Şekil 2.6 Pozitif ve negatif çarpıklığa sahip dağılımlar Örneğin bir şehir için x ekseninde ev kiralarının miktarlarının olduğu y ekseninde evleri kiralayanların sayısının olduğu bir dağılım düşünelim. Eğer zengin insanların çoğunlukta

olduğu bir şehirde bulunmuyorsak bu dağılımın bir miktar negatif çarpık olduğu görülecektir. Negatif çarpıklık, normal dağılımın düşük değerlerinde fazladan sayımların olması anlamına gelir. Pozitif çarpıklık için tersi geçerlidir. Dağılım türlerinin başka bir yaygın türü ise bimodal (iki modlu) dağılımdır (Şekil 2.7). Hem düz lise mezunlarının hem de bir üniversitenin matematik bölümü mezunlarının birlikte girdiği bir sınav olduğunu düşünün. Böyle bir sınavda üniversite mezunlarının aldığı notların dağıllımı lise mezunlarına göre daha pozitif yöndedir. Ancak her iki grup da birlikte sınava girdiğinden notların dağılımının bimodal olması muhtemeldir. Bir dağılımda birden fazla modun olması genellikle verinin içerisinde birbirlerinden farklı birden fazla grubun olduğunu işaret eder. Şekil 2.7 Bimodal dağılım Bunun dışında veri burada sözünü etmediğimiz farklı dağılımlara da sahip olabilir. Genel olarak konuşmak gerekirse bir dağılımın normal dağılımından sapması veride sıradışı bazı durumların olduğunu, veri sayısının yeterli olmadığını veya verinin toplanmasında önyargı yaratan bir etmenin varlığını işaret edebilir. Ancak nadir de olsa bazı verilerin dağılımı doğası gereği normal dağılım sergilemez.