Bölüm 2. Verinin görsel betimlemesi. İstatistik Ders Notları 2018

Benzer belgeler
İSTATİSTİK I KISA ÖZET KOLAYAOF

GRAFİK YORUMLAMA. 1 ) Sütun Grafiği : Belirli bir zaman aralığında bazı veri grup-

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

İstatistik ve Olasılık

Mühendislikte İstatistiksel Yöntemler

Bölüm 2 VERİLERİN DERLENMESİ VE SUNUMU

İstatistik ve Olasılık

Örnek...4 : İlk iki sınavında 75 ve 82 alan bir öğrencinin bu dersin ortalamasını 5 yapabilmek için son sınavdan kaç alması gerekmektedir?

Yrd. Doç. Dr. Sedat Şen 9/27/2018 2

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

Bölüm 2. Frekans Dağılışları VERİLERİN DERLENMESİ VE SUNUMU. Frekans Tanımı. Verilerin Derlenmesi ve Sunulması

BÖLÜM 4 FREKANS DAĞILIMLARININ GRAFİKLE GÖSTERİLMESİ

Verilerin Özetlenmesinde Kullanılan Tablolar ve Grafiksel Yöntemler

Ders 8: Verilerin Düzenlenmesi ve Analizi

VERİ KÜMELERİNİ BETİMLEME

BİYOİSTATİSTİK. Ödev Çözümleri. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

TANIMLAYICI İSTATİSTİKLER

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5

Merkezi Eğilim ve Dağılım Ölçüleri

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

ALKÜ EKONOMİ ve FİNANS BÖLÜMÜ ISL 207 İSTATİSTİK I ALIŞTIRMALAR

İstatistik 1 BÖLÜM 2

Copyright 2004 Pearson Education, Inc. Slide 1

Prof.Dr.İhsan HALİFEOĞLU

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

Prof.Dr.İhsan HALİFEOĞLU

b) Aşağıda verilen tanımlamalardan herhangi 5 adeti yazılabilir. Aritmetik Ortalama: Geometrik Ortalama:

BİYOİSTATİSTİK Tablo Hazırlama Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

ÖĞRENCİNİN ADI SOYADI:. NO:

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

OLASILIK TEORİSİ VE İSTATİSTİK

İÇİNDEKİLER ÖN SÖZ...

BİYOİSTATİSTİK Grafikler Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK. Genel Uygulama 1. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Prof.Dr.İhsan HALİFEOĞLU

Mühendislikte İstatistik Yöntemler

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

Sürekli Rastsal Değişkenler

ÖZEL EGE İLKÖĞRETİM OKULU

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

BİL 810 İnşaat Mühendisliğinde Bilgisayar Uygulamaları

SÜREKLĠ OLASILIK DAĞILIMLARI

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

Verilerin Düzenlenmesi

DENEY 0. Bölüm 1 - Ölçme ve Hata Hesabı

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

İNŞAAT MÜHENDİSLİĞİ BÖLÜMÜ ÖĞRENCİLERİNİN BAŞARI NOTLARININ DEĞERLENDİRİLMESİ. Tamer Yılmaz, Barış Yılmaz, Halim Sezici 1 ÖZET

İstatistik ve Olasılık

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Merkezi Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

istatistik 4. Bir frekans dağılımına ilişkin birikimli seriler 1. Birimlerle ilgili aşağıdaki ifadelerden hangisi

İstatistik Temel Kavramlar- Devam

TEMEL İSTATİSTİK BİLGİSİ. İstatistiksel verileri tasnif etme Verilerin grafiklerle ifade edilmesi Vasat ölçüleri Standart puanlar

ĐŞLE 544 ĐSTATĐSTĐK ARA SINAV 11 Mayıs 2006

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

İle gösterilir. Kitle büyüklüğü içim N örneklem büyüklüğü için n kullanılmıştır.

BİYOİSTATİSTİK Merkezi Eğilim ve Değişim Ölçüleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

VERİLERİN GRAFİKLER YARDIMIYLA SUNUMU Daire Grafikleri Yardımıyla Verilerin Sunumu Sütun(Çubuk) Grafikleri Yardımıyla Sunumu

İSTATİSTİK 1. Ankara Üniversitesi Eğitim Bilimleri Fakültesi Ölçme ve Değerlendirme Anabilim Dalı. Yrd. Doç. Dr. C. Deha DOĞAN

ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. Nokta Grafikleri. Ders 2 Minitab da Grafiksel Analiz-II Tanımlayıcı İstatistikler

ÜNİTE:1. İstatistiğin Tanımı, Temel Kavramlar ve İstatistik Eğitimi ÜNİTE:2. Veri Derleme, Düzenleme ve Grafiksel Çözümleme ÜNİTE:3

İstatistik Dersi Çalışma Soruları Arasınav(Matematik Müh. Bölümü-2014)

Merkezi Yığılma ve Dağılım Ölçüleri

Bölüm 3 Merkezi Konum (Eğilim) Ölçüleri. Giriş Veri kümesi. Ortalamalar iki grupta incelenir. A. Duyarlı olan ortalama. B. Duyarlı olmayan ortalama

GİRİŞ. Bilimsel Araştırma: Bilimsel bilgi elde etme süreci olarak tanımlanabilir.

BÖLÜM 12 STUDENT T DAĞILIMI

T.C. MUĞLA SITKI KOÇMAN ÜNİVERSİTESİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ

İSTATİSTİKSEL PROSES KONTROLÜ

Değer Frekans

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik

ANADOLU ÜNİVERSİTESİ İST 213 OLASILIK DERSİ TANIMLAR VE VERİ SINIFLAMASI

Test İstatistikleri AHMET SALİH ŞİMŞEK

4. HİSTOGRAM. Tolerans Aralığı. Değişim Aralığı HEDEF. Üst Spesifikasyon Limiti. Alt Spesifikasyon Limiti

Veri Toplama, Verilerin Özetlenmesi ve Düzenlenmesi. BBY 606 Araştırma Yöntemleri

İSTATİSTİK DERS NOTLARI

Kesikli Şans Değişkenleri İçin; Olasılık Dağılımları Beklenen Değer ve Varyans Olasılık Hesaplamaları

Ders 1 Minitab da Grafiksel Analiz-I

OLASILIK ve KURAMSAL DAĞILIMLAR

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

KESİKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK DAĞILIMLARI. Bernoulli Dağılımı Binom Dağılımı Poisson Dağılımı

Veri Analizi. Isınma Hareketleri. Test İstatistikleri. b) En çok tekrar eden: 7 (mod) c) Açıklık = En büyük En küçük = 10 1 = 9. d)

Uygulama 3 Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

Tek Değişkenli ve Çok Değişkenli Tablolar ve Grafikler

Tek Değişkenli ve Çok Değişkenli Tablolar ve Grafikler

Yrd.Doç.Dr. Ali SICAK BEÜ. EREĞLİ EĞİTİM FAKÜLTESİ EĞİTİM BİLİMLERİ BÖLÜMÜ

İstatistik Nedir? Ders 1 Minitab da Grafiksel Analiz-I ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. İstatistiğin Konusu Olan Olaylar

BİYOİSTATİSTİK Bazı Olasılık Dağılışları Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

İstatistik. Temel Kavramlar Dr. Seher Yalçın 1

VERİ SETİNE GENEL BAKIŞ

a) Çıkarma işleminin; eksilen ile çıkanın ters işaretlisinin toplamı anlamına geldiğini kavrar.

Toplum ve Örnek. Temel Araştırma Düzenleri. Doç. Dr. Ertuğrul ÇOLAK. Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Tek Değişkenli ve Çok Değişkenli Tablolar ve Grafikler

IİSTATIİSTIİK. Mustafa Sezer PEHLI VAN

SÜREKLİ RASSAL DEĞİŞKENLER

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( )

BÖLÜM 9 NORMAL DAĞILIM

Faktöriyel: 1'den n'ye kadar olan tüm pozitif tamsayıların çarpımına, biçiminde gösterilir. Aynca; 0! = 1 ve 1!=1 1 dir. [Bunlar kabul değildir,

Tek Değişkenli ve Çok Değişkenli Tablolar ve Grafikler

İSTATİSTİK STATISTICS (2+0) Yrd.Doç.Dr. Nil TOPLAN SAÜ.MÜH. FAK. METALURJİ VE MALZEME MÜH. BÖLÜMÜ ÖĞRETİM ÜYESİ ÖĞRETİM YILI

Transkript:

Bölüm 2 Verinin görsel betimlemesi Bu bölümde bir kitle ya da rastgele örneklemdeki verinin görsel olarak betimlenmesi için kullanılan yöntemler tanıtılacaktır. Birinci kısımda önce bir nitel değişkenin sıklık(frekans) dağılımı çizelgesinin ve çiziminin oluşturulması, sonra iki nitel değişkenin çapraz çizelgelerin elde edilmesi ve yorumlanması ele alınacak bunlarla ilgili olarak sıklık dağılımların çubuk, pasta ve Pareto çizimleri verilecektir. İkinci kısımda nicel(sayısal) değişkenlerin sıklık dağılım çizelgeleri, sıklık çizimleri, birikim çizimleri, dağılımın biçimi, dal-yaprak gösterimleri ve serpilme-çizimleri tanıtılacaktır. İkinci kısımda ayrıca nicel veri olarak ele alınan zaman serisi verisi çizimlerine de değinilecektir. 2.1 Nitel değişkenleri betimleyen çizelge ve çizimler Nitel değişkenler, sıklık dağılımı çizelgeleri(tabloları) ile betimlenebileceği gibi, çubuk-çizimleri, pasta-çizimleri ve Pareto çizimleri ile de betimlenebilir. Genellikle hem çizelge hem de çizimler kullanılır. Sıklık (frekans) dağılımı, bir ya da birden fazla değişkene ait veriyi düzenlemeye yarayan bir çizelgedir. Tek bir değişkenin sıklık dağılımında iki sütun bulunur. Soldaki sütunda nitel değişkene ait sınıf ya da öbek(grup) adları sağdaki sütunda ise her sınıfın sıklığı yani o sınıfta kaç adet veri(gözlem) bulunduğu yer alır. Genellikle üçüncü bir sütun da kullanılır. Bu sütunda göreli sıklıklar yüzde sözcüğü ya da % işareti ile gösterilir. Göreli sıklıklar her sınıfın sıklığının toplam gözlem sayısına bölünüp ile çarpımından elde edilir. Örneğin ankete katılanların cinsiyet ayrımındaki sayıları sıklık dağılımını toplam içindeki oranları ise yüzdelik dağılımını verir. 5 kişi üzerinde anket yapılmış, 35 erkek 15 kadın sayıları sıklık dağılımını, bunların toplama oranları (%7) ve (%3) yüzdelik ya da göreli sıklık dağılımını gösterir. Bu dağılımlar bir çizelgede gösterilebilir: Sınıflar Sıklık Göreli sıklık(%) Erkek 35 7 Kadın 15 3 Toplam 5 Her öbeğin sıklığına dikkat çekmek için çubuk çizim kullanılır. 1

Sıklık 4 35 3 25 15 5 Cinsiyete göre sigara içenlerin sıklık dağılımı Erkek Sınıflar Kadın Daha fazla sayıda sınıf içeren değişkenlere ilişkin sıklık dağılımında, birikimli sıklık ve birikimli göreli sıklıklar da elde edilebilir. 5 kişilik örneklemde, sıralı ölçme düzeyine göre ölçülen eğitim düzeyi değişkenin sıklık, göreli sıklık, birikimli ve birikimli sıklık dağılımları aşağıdaki tablo düzenlenerek hepsi bir arada verilebilir. Eğitim Düzeyi Sıklık Göreli Sıklık(%) Birikimli Sıklık Birikimli Göreli Sıklık(%) İlköğr. 5 5 Lise 15 3 4 Önlisans 8 16 28 56 Lisans 4 48 96 Lisansüstü 2 4 5 Toplam 5 Nitel verilerin sıklık dağılımında sınıflardaki sıklığın yüksekliği bu sınıflarda yoğunlaşmanın fazla olduğunu gösterir. Yüzde dağılımları öğelerin bu sınıflarda bulunma oranlarını ve dar anlamda olasılıklarını gösterir. Birikimli göreli sıklık dağılımları ise örneklemdeki öğelerin % kaçının bu sınıf ve aşağısında eğitim gördüğünü gösterir. Örneğin deneklerin %56 inin eğitim düzeyi önlisans ve daha aşağıdadır. Çapraz çizelgeler Nitel değişkenler arasındaki ilişkileri betimlemek için çapraz çizelgeler oluşturulur. Çapraz çizelge, sınıflı(nominal) ya da sıra ölçekli iki değişken değerinin bütün bileşimlerin gözlem sayılarının dökümünü veriri. Satır sayısı r sütün sayısı c olan bir çapraz çizelgeye r x c çapraz çizelgesi denir. Örneğin insan kaynakları bölümü, sıralı ölçme düzeyinde ölçülmüş çalışanların iş memnuniyeti ile yine sıralı ölçekle ölçülmüş eğitim düzeyi arasında ilişki arar ve çapraz çizelge oluşturur. Üretim uzmanları üretim hatları ile başarım ölçümleri arasındaki ilişkiyi ele alır. Önceki örnekte ankete katılanlara sigara içip içmediği sorulmuş bunların cinsiyet ayırımda sıklık dağılımı 2x2 çapraz çizelgesi olarak verilmiştir. 2

Sigara içme Cinsiyet Evet Hayır Toplam Erkek 24 11 35 Kadın 5 15 Toplam 34 16 5 Çapraz çizelgelerin bileşenli çubuk-çizimleri ve kümeli çubuk-çizimleri yapılabilmektedir. Sigara içenlerin ve içmeyenlerin cinsiyete göre dağılımı (Kümeli çubuk-çizimi) 3 25 Erkek 15 5 Kadın Erkek Kadın Evet Hayır Sigara içenlerin ve içmeyenlerin cinsiyete göre dağılımı (Bileşenli çubuk-çizimi) 4 35 3 25 Kadın 15 5 Erkek Evet Kadın Erkek Hayır Pasta çizimleri Her sınıftaki sıklığın payına dikkat çekmek istenirse pasta çizim kullanılır. Daire(pasta) toplamı yansıtır, pasta parçaları ise toplam içindeki payları gösterir. Her parçanın alanı ilgili sıklıkla orantılı olacak biçimde çizilir. Örneğin FireFox tarayıcısının 11 yılında Avrupa piyasasındaki payı %37, 69 ise bu pasta içerisinde 36*.3769 derecelik, yani yaklaşık 98 derecelik bir açı ile gösterilir. 3

Firefox 37.69 Ot her s Oper a Internet Explorer 36.54 Google Chrome 16.3 Googl e Chr ome Saf ar i Fi r ef ox Safari 4.9 Opera 4.26 Inter net E xpl or er Others.58 Pareto çizimleri Pareto çizimleri sorun nedenlerinin sıklıklarını gösteren bir çubuk-çizimdir. En soldaki çubuk en sık karşılaşılan nedeni, sağa doğru olan diğer çubuklar gittikçe daha az sıklıktaki sorunları gösterir. Pareto-çizimi en önemli bir kaç sorunu bir sürü önemsiz sorundan ayırmada kullanılır. İtalyan iktisatçısı Vifredo Pareto nun buluşu pek çok alanda uygulanabilir. Sağlık sigortasında, ödeme talepleri çözümlenmesi ve ödenmesi sırasında bir sürü hatalı işlem yapılabilmektedir. Aşağıda hatalı işlemler çizelgesi ve Pareto çizimi verilmiştir. Sınıf Hata Türü Sıklık 1 İşlem ve tanı kodlaması 4 2 Sağlık hizmeti veren kurumun bilgileri 9 3 Hasta bilgileri 6 4 Fiyat tarifesi 17 5 Sözleşme uygulamaları 37 6 Sağlık hizmeti veren kurumun düzeltmeleri 7 7 Yazılım ve sistem hataları 4 45 4 35 3 25 15 5 İşlem ve tanı kodlaması Sözleşme uygulamaları Fiyat tarifesi Sağlık hizmeti veren kurumun bilgileri Sağlık hizmeti veren kurumun düzeltmeleri Sağlık hizmeti veren kurumun düzeltmeleri Yazılım ve sistem hataları 4

2.2 Nicel değişkenleri betimleyen çizelge ve çizimler Sıklık ve göreli sıklık dağılımları Nicel veri ile ölçülmüş bir değişkenin sıklık dağılımını bir çizelgede görebilmek de mümkündür. Bunun için önce belirli sayıda sınıf oluşturulur, sonra her gözlem, ait olduğu sınıfa atanır. Atama bittikten sonra sınıflara atanmış gözlemler sayılır. Her sınıftaki gözlem o sınıfın sıklık sayısıdır. Örneğin bir mahallede yaşayan bireyleri temsil eden kişilik bir rastgele örneklemde, bireylerin 5-88 aralığındaki yaşları, alt ve üst sınırları belirlenmiş 8 tane yaş sınıflarına atanır. Her sınıfa düşen birey sayısı o sınıfın sıklığını gösterir. Tüm sınıfların sıklıkları, sıklık dağılımı gösterir. Birikimli ve göreli birikimli sıklık dağılımları Birikimli sıklık dağımı her sınıfın üst sınırının altında kalan toplam gözlem sayısını içerir. Her sınıfın ve ondan önceki sınıfların içindeki sıklıkların toplamını olarak oluşturulur. Her sınıfın göreli birikimli sıklığını bulmak için o sınıfın birikimli sıklığı toplam gözlem sayısına bölünür. Aşağıdaki tabloda kişilik örneklemdeki bireylerin yaşlarına ilişkin sıklık ve birikimli sıklık dağılımları ile bunların göreli sıklık ve birikimli göreli sıklık dağılımları verilmiştir. Yaş Sınıfları Sıklık Göreli Sıklık (%) Birikimli Sıklık Göreli Birikimli Sıklık(%) 5-15 18 9 18 9 16-26 22 11 4 27-37 6 3 5 38-48 4 14 7 49-59 3 15 17 85 6-7 19 95 71-81 8 4 198 99 82-92 2 1 Toplam 1 Bu sıklık dağılımı üç adımda oluşturulabilir. Adım (1) de önce sınıf sayısı k, 5- arasında belirlenir. Bu örnekte 8 alındı. Daha küçük örneklemlerde sınıf sayısı % e kadar inebilir. Çok büyük örneklemlerde sınıf sayısı ye kadar çıkabilir. Sınıf sayısını araştırmacı belirler. Sınıf sayısının belirlenmesinde aşağıda verilen Sturges formülü de kullanılabilir: k= 1+3.3 log (n). Formülde n gözlem sayısıdır. Adım (2) de her sınıfın sınıf genişliği Sınıf genişliği= (en büyük gözlem değeri - en küçük gözlem değeri)/ sınıf sayısı eşitliği ile sınıf genişliği için bir değer elde edilir. Bu değer ondalıklı bir sayı ise yukarı yuvarlama ile yapılır ki bütün gözlemler kapsansın. Örneğimizde sınıf genişliği alt ve üst sınırlar dahil olmak üzere (88-5)/8=.37 eşitliğinden 11 olarak belirlenir. 5

Adım (3) te en küçük sayı ya da daha küçüğü birinci sınıfın alt sınırı olarak alınır, sınıflar her gözlemi içerecek ve sınıflar arasında kesişme olmayacak biçimde tüm sınıfların alt ve üst sınırları belirlenir. Her sınıfın sınırları açıkça belirtilmelidir. Örneğimizdeki en küçük sayı 5 olduğuna göre, alt sınır dahil olmak üzere sınıf genişliği 11 olacak biçimde üst sınır 15 olacak biçimde belirlenir. Böylece 5 ve 15 Örnekte, alt sınır 5 dahil olmak üzere sınıf genişliğinin 11 olması için üst sınır 15 olarak belirlenmiştir. Yaş tamsayı olarak kaydedildiğine göre sınıflarda bir keşişim olmayacaktır. Bu durumda ikinci sınıfın alt ve üst sınırları 16 ve 26 dır. Sıklık dağılımından, en yüksek sıklığın 6 kişi ile 27-37 yaş sınıfının (ya da grubunun) olduğu en düşüğünün ise bir kişi ile 82-92 yaş sınıfı olduğu anlaşılmaktadır. 38-48 yaş sınıfı örneklemin % sini oluşturmaktadır ve örneklemde 59 yaş ve aşağısında bulunan deneklerin yüzdesi %85 tir. Sınıf değeri her sınıftaki öğeleri temsil ettiği kabul edilirse, her sınıftaki sıklık sayısı bu sınıf değeri ile çarpılıp toplanırsa deneklerin toplam yaşı yaklaşık olarak elde edilebilir. Yaş Sınıfları Sınıf Değeri Sıklık Sınıfın Yaş Toplamı 5-15 18 18 16-26 21 22 462 27-37 32 6 19 38-48 43 4 17 49-59 54 3 16 6-7 65 13 71-81 76 8 68 82-92 87 2 174 Toplam 7984 2 kişinin yaşlarının aritmetik ortalamasının yaklaşık değeri 7984/=39.92 olarak hesaplanabilir. Daha sonra tanımını vereceğimiz sıklığı en yüksek sınıfın sınıf değeri tepe değeri olarak yorumlanabilir. Bu da 32 olup ortalamaya çok yakın olmayan bir değerdir. Sıklık ve birikim çizimleri Sıklık-çizimi, gösterilen değişkenin sınıf aralıklarının işaretlendiği, yatay eksene dikine çizilmiş bitişik çubuklardan oluşan bir çizimdir. Aralıklar sıklık dağılımı çizelgesindeki sınıflara karşılık gelir. Her çubuğun yüksekliği, o sınıftaki gözlem sayısıyla orantılıdır. Bu çizime histogram da denir. Eğer gözlemler merkezin iki yanında dengeli ya da yaklaşık aynı dağılmışsa o dağılıma bakışık(simetrik) denir. Eğer gözlemler merkezin iki tarafında bakışık dağılmamışsa o dağılıma bakışımsız ya da çarpık denir. Sağa çarpık dağılımın sağ kuyruğu sola çarpık dağılımın sağ kuyruğu daha uzundur. Birikim-çizimi birikimli sıklık dağılımının her sınıfının üst sınırının altında kalan gözlemlerin yüzde noktalarını birleştiren çizgidir. Bu çizime ojiv de denir. 6

Aşağıda, kişinin yaşlarının, sınıflara göre sıklık ve birikimli sıklık çizimleri verilmiştir. Bu çizimlerde sınıflar sıra numarası ile gösterilmiştir. Sıklık dağılımının bakışımsız olduğu sağa çarpık olduğu görülmektedir. Diğer iki çizimde göreli sıklık çizimi ile birikim çizimi verilmiştir. Tam sayı olmayan verilerde sıklık tablosu oluşturulurken kesirli sayılar kullanılabilir. Üst sınırlar alt sınıra sınıf genişliği eklenerek oluşturulur. Birinci sınıfın üst sınır değeri ikinci sınıfın alt sınır değeri olarak alınır. Diğer sınıfların alt ve üst sınır belirleme işlemi aynı biçimde yapılır. Alt ya da üst sınır değerlerinden hangisinin sınıflara dahil edilmediği açıkça belirtilir. Yaş gruplarına gör e sıklık dağılımı Y aş sınıf larına göre birikimli sıklık dağılımı 7 25 6 5 4 15 3 5 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 Göreli sıklık dağılımı Y aş sınıf l ar ına gör e gör el i bi r i k i m- çi z i mi 35 3 3 1 25 8 15 9 11 15 6 4 5 4 1 1 2 3 4 5 6 7 8 1 2 3 4 5 6 7 8 Dal-yaprak gösterimleri Betimleyici istatistikte veriyi betimlemek için dal-yaprak gösterimleri kullanılır. Dalyaprak gösterimleri küçük bir veri kümesinin örüntüsünü(yapısını) ortaya koyabilmektedir. Bu gösterimde veri, dal denilen sol basamaktaki sayıya göre öbeklere ayrışır. Yaprak denen sağdaki basamak bu öbeğin üyesini gösterir. Her daldan yapraklar, daldan uzaklaştıkça büyüyen bir sıraya göre dizilir. Her daldaki yaprak sayısı öbekteki(sınıftaki) sıklığı gösterir. Tek tek yapraklar her sınıftaki değerlerin kendisini belirtir. Aşağıda bir dal-yaprak gösterimi verilmiştir. Dönemsonu istatistik dersinin notlarından rastgele seçilmiş not, 87, 52, 62, 84, 78, 65, 78, 7, 72, 76 dır. Sıraya dizilmiş verinin dal-yaprak gösterimi aşağıda verilmiştir. 7

5 2 6 2 5 7 2 6 8 8 8 5 7 Serpilme-çizimleri İki değişken arasındaki ilişkiyi çizimlerle betimlemek için serpilme çizimleri kullanılır. Örneğin reklam harcamaları ile toplam kazanç, fiyat ile satış miktarı, kişi başına gelir ile çocuk ölümleri arasında ilişkiler bu çizimlerle betimlenebilir. Bu değişkenlerden birinin diğerine bağlı olarak değiştiği biliyor ya da ileri sürülüyorsa bağımlı değişken Y ekseninde bağımsız değişken X ekseninde gösterilir. Veri kümesinde her sayı çifti bir gözlemi temsil eder. Bu noktalar çizilerek serpilmeçizimi oluşturulur. Çizimlerden, iki değişken arasındaki olası bir ilişki ile birlikte değişim hangi aralıklarda yoğunlaştığı ve dışa düşen aşırı uç değerlerin belirlenmesi de mümkün olabilmektedir. Aşağıda çizelgede, rastgele çekilmiş 11 öğrencinin SAT Matematik puanı ile akademik ortalaması verilmiştir. Matematik SAT puanlarının akademik ortalamayı belirlediği varsayılarak, matematik puanı bağımsız akademik ortalama bağımlı değişken alınarak serpilme-çizimi elde edilmiştir. Zaman serisi verilerini betimleyen çizimler Zaman serisi, ilgilenilen bir değişkenin zaman içinde sıralanmış bir dizi ölçümüdür. Bir zaman noktasında yalnızca bir ölçüm yapılabilir ve ölçümlerin zaman içindeki sırası önemlidir. Zaman serisi çizimi, zaman serisinin belli zaman aralıklarıyla işaretlenmesidir. Genellikle elde edilen tüm seri işaretlenir, bazen belli zaman aralıklarıyla işaretlenir. Örneğin borsada bir pay senedinin anlık, saatlik, günlük kapanış fiyatları kaydedilmiş olabilir. Ancak bu pay senedinin zaman serisi günlük kapanışlar olarak oluşturulabilir ve zaman serisi çizimi elde edilebilir. Üniversiteye yıllık yeni öğrenci kaydı, yıllar boyunca gayri safi yurtiçi hasıla, günlük döviz kurları, Zaman serileri örnekleri arasında olarak, yıllık kamu gelirleri ve harcamaları, aylık ürün satışları, üç aylık şirket kârları, şirket Web sayfasındaki haftalık ziyaretçi sayısı zaman sersi örnekleri olarak sayılabilir. 8

Aşağıda ABD nin 5 fiyatları ile 1929-9 yılları boyunca hasılasının(milyar dolar) zaman serisi çizi verilmiştir. gayri safi yurtiçi ABD Doların Avro karşısındaki değerini gösteren döviz kuru zaman serisi çizimi şöyledir: Karşılaştırma yapmak amacıyla birden fazla zaman serisi çizimi bir arada gösterilebilir. Aşağıda 11 yılında, bir derginin Facebook ve Twitter daki hesaplarına gelen yeni ziyaretçi sayılarının zaman serisi çizimleri verilmiştir. Bu bilgi dergini pazarlama biriminin işine yarayabilir. 9

Alıştırmalar 1. Veri kümelerini sıklık dağılımı kullanarak göstermenin yararları nelerdir? Sıklık dağılımlarının grafiklerini kullanmanın yararları nelerdir? 2. Bir sıklık dağılımında sınıfların sayısı neden 5 ile arasında olmalıdır? 3. Göreli sıklık ile birikimli sıklık arasındaki fark nedir? 4. Aşağıda veri kümelerinin her biri için verilen en küçük değer(ek), en büyük değer(eb), sınıf sayısını(ss) kullanarak sınıf genişliğini, sınıfların alt sınırlarını ve üst sınırlarını bulunuz. a) EK =9, EB=64, SS=7 b) EK =12, EB=88, SS=6 c) EK =17, EB=135, SS=8 d) EK =54, EB=247, SS= 5. Aşağıdaki sıklık dağılımlarının sınıf genişliklerini, sınıf orta noktalarını, göreli sıklıklarını ve birikimli sıklıklarını bulunuz. Sınıf Sıklık Sınıf Sıklık 6. Aşağıdaki sıklık dağılımının grafiklerini kullanarak dağılımlardaki a) sınıf sayısını bulunuz,b) En küçük sıklığa sahip sınıfın sıklığını tahmin ediniz, c) En yüksek sıklığa sahip sınıfın sıklığını tahmin ediniz, d) Sınıf genişliğini bulunuz.

7. Aşağıda, -29 yaş aralığındaki kadınların boy uzunluklarının birikimçizimini (ojiv) kullanarak, a) Örneklemdeki kadınların sayısını b) Sıklıktaki en fazla artışın hangi boy uzunluğu grubunda olduğunu c) 72 inç boy uzunluğunun birikimli sıklığını, d) Birikimli sıklığı 25 olan boy uzunluğunu e) Kaç kadının 64 inç veya daha az boy uzunluğuna sahip olduğunu f) 62-66 inç boy uzunluğuna sahip kadınlarının sayısını g) 7 inç veya daha fazla boy uzunluğuna sahip kadınların sayısını bulunuz. 8. Bir günde internetten siyasi blog okuma süreleri aşağıda verilmiştir. a) 5 sınıf kullanarak sıklık dağılımını elde ediniz b)tabloda sınıf orta noktalarını, göreli sıklıkları, birikimli sıklıkları gösteriniz c) Hangi sınıflar en yüksek ve en düşük sıklığa sahiptir? 9. Aşağıda 11 yılında bir üniversitede kazanılan derecelerin sıklık ve göreli sıklık dağılımları verilmiştir. a) Pasta(dilim) çizimi yapmak için açıları hesaplayınız b) Göreli sıklık dağılımın pasta-çizimini yapınız. Derece Sıklık Göreli Sıklık Önlisans 942.265 Lisans 1716.483 Yüksek 731.6 Lisans Doktora 164.46 Açı - 11

. Aşağıdaki hangi histogram dağılımın simetrik, sola çarpık, sağa çarpık ve tekdüze(dikdörtgensel) olduğunu göstermektedir. 11. 3 ayrı modeldeki GPS cihazlarının piyasadaki satış fiyatları aşağıdaki gibi belirlenmiştir. Gözlemlerin yedi sınıflı sıklık dağılımını oluşturunuz. 12. İstatistik dersinin sınavına hazırlanan öğrencinin çalışmaya ayırdığı saatler için dal-yaprak gösterimini oluşturun 13. a) Aşağıdaki dal-yaprak gösterimini kullanarak veri listesini elde ediniz. b) Aşağıdaki dal-yaprak çizimine göre en küçük ve en büyük değeri bulunuz.. 14. Aşağıdaki dağılımların biçimlerini yazınız(simetrik, sağa veya sola çarpık) 12

15. Aşağıdaki sıklık çizelgesini kullanarak, a) Göreli sıklık dağılımını, b) Birikimli sıklık dağılımını, c) Birikimli göreli sıklık dağılımını gösterin Sınıf Sıklık < 8 < <3 13 3<4 12 4<5 6 16. Aşağıdaki verilerin serpilme-çizimini yapın: 17. Aşağıdaki çizelge bir e-ticaret sitesine girenlerin yaş sınıflarına göre göreli sıklık dağılımını göstermektedir. Yaş Sınıfı Göreli Sıklık(%) 18-25.3 26-35 18. 36-45 24.22 46-55 23. 56+ 24.38 a) Birikimli sıklık dağılımını elde oluşturun. b) Ziyaretçilerin yüzde kaçının yaşı 46 nın altındadır? c) Ziyaretçilerin yüzde kaçı en az 36 yaşındadır? 18. Bir fabrikadan rastgele seçilen çalışanın toplam çalıştığı yıl ve aylık geliri aşağıdaki çizelgede verilmiştir. Serpilme grafiğini çiziniz. İlişki olup olmadığını yorumlayınız. Çalıştığı yıl Aylık Ücret 5 3 4 325 8 4 4 2735 2 25 43 7 4165 6 3925 9 45 3 28 13

19. Bir şirket bir ürünün üretim hattında yedi olası arıza belirlemiştir. Aşağıdaki arıza sıklık tablosunda Pareto-çizimi düzenleyin ve yorumlayın. Arıza Kodu Sıklık A 11 B 68 C 13 D 85 E 8 F 5 G 3 a) Serpilme-çizimini oluşturunuz. b) Çalışılan yıl ile aylık ücret arasında bir ilişki olup olmadığı söylenebilir mi?. Aynı kıdem ve niteliğe sahip çalışanların gelir düzeylerinin cinsiyete göre çapraz çizelgesi aşağıda verilmiştir. Gelir düzeyi Düşük Orta Yüksek Toplam Cinsiyet Kadın 4 15 75 Erkek 3 6 25 115 Toplam 5 4 19 a) Çapraz çizelgenin cinsiyete göre ve gelir düzeylerine göre bileşenli çubuk çizimlerini yapınız. b) Çapraz çizelgenin cinsiyete ve gelir düzeylerine göre kümeli çubuk_çizimlerini yapınız. c) Gelirlerin cinsiyete göre göreli sıklık dağılımını oluşturunuz, d) Cinsiyetin gelir düzeylerine göre göreli sıklık dağılımını oluşturunuz. 21. Yeni açılan bir AVM deki günlük müşteri sayıları Pazartesi 525, Salı 54, Çarşamba 469, Perşembe 5, uma 586, Cumartesi 64, Pazar 7 olarak sayılmıştır. Müşteri sayılarının günlere göre zaman serisi çizimini yapınız. 14