VERİ KÜMELERİNİ BETİMLEME

Benzer belgeler
Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

İçindekiler. Ön Söz... xiii

TANIMLAYICI İSTATİSTİKLER

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

İÇİNDEKİLER ÖN SÖZ...

İstatistik ve Olasılığa Giriş. İstatistik ve Olasılığa Giriş. Ders 3 Verileri Sayısal Ölçütlerle İfade Etme. Verileri Sayısal Ölçütlerle İfade Etme

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5

Copyright 2004 Pearson Education, Inc. Slide 1

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

Mühendislikte İstatistik Yöntemler

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Merkezi Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

İSTATİSTİK MHN3120 Malzeme Mühendisliği

Örnek...4 : İlk iki sınavında 75 ve 82 alan bir öğrencinin bu dersin ortalamasını 5 yapabilmek için son sınavdan kaç alması gerekmektedir?

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

Bölüm 2 VERİLERİN DERLENMESİ VE SUNUMU

GRAFİK YORUMLAMA. 1 ) Sütun Grafiği : Belirli bir zaman aralığında bazı veri grup-

Ders 8: Verilerin Düzenlenmesi ve Analizi

Merkezi Yığılma ve Dağılım Ölçüleri

TEMEL İSTATİSTİK BİLGİSİ. İstatistiksel verileri tasnif etme Verilerin grafiklerle ifade edilmesi Vasat ölçüleri Standart puanlar

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

BÖLÜM 1 GİRİŞ: İSTATİSTİĞİN MÜHENDİSLİKTEKİ ÖNEMİ

Bölüm 2. Frekans Dağılışları VERİLERİN DERLENMESİ VE SUNUMU. Frekans Tanımı. Verilerin Derlenmesi ve Sunulması

Test İstatistikleri AHMET SALİH ŞİMŞEK

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ DÖNEM SONU SINAV SORULARI

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

OLASILIK ve KURAMSAL DAĞILIMLAR

BÖLÜM 4 FREKANS DAĞILIMLARININ GRAFİKLE GÖSTERİLMESİ

IİSTATIİSTIİK. Mustafa Sezer PEHLI VAN

Değer Frekans

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

Verilerin Özetlenmesinde Kullanılan Sayısal Yöntemler

Merkezi Eğilim ve Dağılım Ölçüleri

Veri Analizi. Isınma Hareketleri. Test İstatistikleri. b) En çok tekrar eden: 7 (mod) c) Açıklık = En büyük En küçük = 10 1 = 9. d)

VERİLERİ ÖZETLEME. Prof.Dr. Levent ŞENYAY III - 1

ÖLÇME VE DEĞERLENDİRME. Antrenörlük Eğitimi 4. Sınıf. Ölçme ve Değerlendirme - Yrd. Doç. Dr. Yetkin Utku KAMUK

DAĞILMA YADA DEĞİ KENLİK ÖLÇÜLERİ (MEASURE OF DISPERSION) Prof.Dr.A.KARACABEY Doç.Dr.F.GÖKGÖZ

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

Yrd. Doç. Dr. Sedat Şen 9/27/2018 2

b) Aşağıda verilen tanımlamalardan herhangi 5 adeti yazılabilir. Aritmetik Ortalama: Geometrik Ortalama:

İSTATİSTİK ÖRNEK SORULARI

ÖĞRENCİNİN ADI SOYADI:. NO:

Prof.Dr.İhsan HALİFEOĞLU

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ BÜTÜNLEME SINAVI SORULARI

3)Aşağıdaki tabloda gruplandırılmış bir veri kümesi bulunmaktadır. Bu veri kümesinin mutlak ortalamadan sapması aşağıdakilerden hangisidir?

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ TELAFĐ SINAVI SORULARI

İSTATİSTİK. İstatistik Nedir? İstatistiksel Araştırmanın Amacı

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER

Bölüm 3 Merkezi Konum (Eğilim) Ölçüleri. Giriş Veri kümesi. Ortalamalar iki grupta incelenir. A. Duyarlı olan ortalama. B. Duyarlı olmayan ortalama

İSTATİSTİKSEL VERİ ANALİZİ

BÖLÜM 9 NORMAL DAĞILIM

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik

VERİ SETİNE GENEL BAKIŞ

Prof.Dr.İhsan HALİFEOĞLU

ÖLÇME VE DEĞERLENDĠRME (3)

Ders 1 Minitab da Grafiksel Analiz-I

ANADOLU ÜNİVERSİTESİ İST 213 OLASILIK DERSİ TANIMLAR VE VERİ SINIFLAMASI

EĞĠTĠMDE ÖLÇME VE DEĞERLENDĠRME BÖLÜM IV Ölçme Sonuçları Üzerinde Ġstatistiksel ĠĢlemler VERİLERİN DÜZENLENMESİ VERİLERİN DÜZENLENMESİ

BİYOİSTATİSTİK. Genel Uygulama 1. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

İstatistik ve Olasılık

Grafik üzerindeki bilgiler özetlenmiştir. Veriler arasındaki ilişkiler görünür haldedir.

İstatistik Nedir? Ders 1 Minitab da Grafiksel Analiz-I ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. İstatistiğin Konusu Olan Olaylar

İstatistik ve Olasılık

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

FREKANS VERİLERİ. Prof.Dr. Levent ŞENYAY III - 1

Appendix B: Olasılık ve Dağılım Teorisi

ÖLÇME DEĞERLENDİRME ÜNİTE BAŞLIKLARI

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. Ders 2 Merkezi Eğilim Ölçüleri

13. Olasılık Dağılımlar

7. HAFTA. Verilerin düzenlenmesi Verilerin gruplandırılması Merkezi eğilim ölçüleri Merkezi dağılım ölçüleri Standart puanlar. Yrd. Doç. Dr.

İSTATİSTİK I KISA ÖZET KOLAYAOF

3/6/2014. Küresel Isınma. Öğrenme Amaçlarımız. Küresel Isınma. Aritmetik Ortalama. Veri Özetleme ve Gösterme

7. HAFTA. Verilerin düzenlenmesi Verilerin gruplandırılması Merkezi eğilim ölçüleri Merkezi dağılım ölçüleri Standart puanlar. Yrd. Doç. Dr.

Bölüm 3. Tanımlayıcı İstatistikler

İstatistik Nedir? İstatistiğin Önemi Nedir? Tanımlayıcı ve Çıkarımcı İstatistik ttitik Tanımlayıcı İstatistik Türleri Çıkarımcı İstatistiğin i iği

5. SUNUM. Verilerin düzenlenmesi Verilerin gruplandırılması Merkezi eğilim ölçüleri Merkezi dağılım ölçüleri Standart puanlar. Yrd. Doç. Dr.

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.


BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. Nokta Grafikleri. Ders 2 Minitab da Grafiksel Analiz-II Tanımlayıcı İstatistikler

ÜNİTE:1. İstatistiğin Tanımı, Temel Kavramlar ve İstatistik Eğitimi ÜNİTE:2. Veri Derleme, Düzenleme ve Grafiksel Çözümleme ÜNİTE:3

Yrd.Doç.Dr. Ali SICAK BEÜ. EREĞLİ EĞİTİM FAKÜLTESİ EĞİTİM BİLİMLERİ BÖLÜMÜ

İle gösterilir. Kitle büyüklüğü içim N örneklem büyüklüğü için n kullanılmıştır.

Prof.Dr.İhsan HALİFEOĞLU

EĞİTİMDE ÖLÇME VE DEĞERLENDİRME UĞUR YILMAZER 1

İstatistik ve Olasılık

250 BÜYÜK FİRMA VERİLERİNİN DEĞİŞKEN BAZINDA İNCELENMESİ

BÖLÜM 3 KURAMSAL ÇATI VE HİPOTEZ GELİŞ

VERİLERİN GRAFİKLER YARDIMIYLA SUNUMU Daire Grafikleri Yardımıyla Verilerin Sunumu Sütun(Çubuk) Grafikleri Yardımıyla Sunumu

17/01/2015. PowerPoint Template. Dr. S.Nihat ŞAD LOGO. İnönü University. Company Logo

Transkript:

BETİMLEYİCİ İSTATİSTİK

VERİ KÜMELERİNİ BETİMLEME Bir amaç için derlenen verilerin tamamının olduğu, veri kümesindeki birimlerin sayısal değerlerinden faydalanarak açık ve net bir şekilde ilgilenilen özellik hakkında bilgi edinilip, bu çalışmaların tablo, grafik ve merkezi eğilim ölçüleri kullanılarak sunulmasına veri kümelerinin betimlenmesi denir.

VERİ KÜMELERİNİ BETİMLEME Frekans tabloları ve grafikler Nispeten az sayıda farklı değere sahip bir veri kümesinin betimlenmesinde frekans tablosu kullanılabilir. Frekans tabloları verilerin aldığı değerlerin karşısına her bir verinin frekansının (tekrar sayısının) yazılması ile oluşturulur.

VERİ KÜMELERİNİ BETİMLEME Frekans Tabloları ve Grafikler Frekans tablosundaki yer alan farklı veri değerlerini yatay eksende yazarak her bir değişkeninin frekansını düşey eksende yüksekliklerle gösterdiğimiz grafiklere çizgi grafiği denir. Frekans tablosundaki verileri temsil eden bir başka grafik türü ise frekans çokgenleridir. Frekans çokgenleri her bir değişkenin değerinin karşılık geldiği noktaların düz çizgiler ile birleştirilmesi ile bulunur.

İlk yıl geliri verileri

İlk yıl geliri için frekans çokgeni

İlk yıl geliri için çubuk grafiği

İstatistik kütlesi n olan bir veri kümesini alalım. f, özel bir değişkenin frekansı olmak üzere, f n oranına bu değişkenin göreli frekansı denir. Bir değişkenin göreli frekansı bu değişkene sahip verilerin oranını verir. Veriler sayısal yapıda olmadığında göreli frekanslar kullanılır. Göreli frekanslar genellikle pasta grafikleri ile gösterilirler.

İlk Yıl Gelirleri

Gruplanmış Veriler, Histogramlar, Diyagramlar ve Kök ve Yaprak Grafikleri Veri kümesi içindeki birimlerin çok fazla olduğu veya nispeten çok faklı değer sayısı aldığı durumlarda değişkenleri gruplara veya sınıf aralıklarına bölünerek her bir sınıfın frekans değerinin karşısına yarılmasıyla elde edilen tabloya sınıflandırılmış frekans tablosu denir. Böyle verilere ise sınıflandırılmış veriler denir. Bir sınıfın uç noktalarına sınıfın sınırları denir. Veri sınıflarında sınıfın sol ucu sınıfa dahil edilirken sağ ucu dahil edilmez ve genellikle sınıf aralıkları zorunlu olmamakla birlikte eşit olarak alınır.

Bir Sınıf Frekans Tablosu

Bir frekans histogramı

Sınıf verilerinin birbirine bitişik çubuklar ile çizimine histogram denir. Bir histogram grafiğinin düşey ekseni ya sınıf frekansı yada sınıfın göreli frekansı ile temsil edilebilir. Sınıf frekansının verildiği grafikler frekans histogramı, göreli frekansların verildiği grafikler ise göreli frekans histogramı olarak adlandırılır.

Değişkenlerin kendileri ve varsa kendinden önceki değişkenlerin frekans yada göreli frekanslarının toplamına değişkenin birikimli frekansı denir. Birikimli frekansların değişkenlerin karşısına yazılmasıyla birikimli frekans tabloları oluşturularak veya diyagramlar yardımıyla veri kümeleri temsil edilebilir.

Birikimli bir frekans grafiği

Yaş Frekans 15 2 16 5 17 11 18 9 19 14 20 13 Yaş den fazla 15 54 16 52 17 47 18 36 19 27 20 13 Yaş den az 15 2 16 7 17 18 18 27 19 41 20 54

VERİ KÜMELERİNİ ÖZETLEME Örnek Ortalaması, Örnek Ortancası ve Örnek Tepe değeri n tane x 1, x 2,, x n sayısal değerinden oluşan bir veri kümesinin örnek ortalaması bu değerlerin aritmetik ortalaması ile bulunur. x in aritmetik ortalaması x = ile tanımlanır. n i=1 xi n

Türkiye Süper Ligi 2002-2016 yılları arasında futbol takımlarının şampiyon olma puanları sırasıyla aşağıda verilmiştir. 78, 85, 76, 80, 83, 70, 79, 71, 75, 82, 77, 71, 74, 77, 79 Buna göre ortalama şampiyon olma puanını belirleyiniz.

x f x 1 f 1 x 2 f 2 x n f n Frekans tablosunun aritmetik ortalaması x = x if i f i Yaş Frekans 15 2 16 5 17 11 18 9 19 14 20 13

n hacimli veri kümesinin değerleri küçükten büyüğe doğru sıralanarak, n tek ise (n + 1) 2. değer, n çift ise n 2. ve n 2 + 1. değerlerin ortalaması veri kümesinin örnek ortancasıdır (medyan). Veri kümesinin en çok tekrar eden veya frekans değeri en büyük olan değişkene örnek tepedeğeri denir (mod).

Yaş Frekans 15 2 16 5 17 11 18 9 19 14 20 13

Örnek Varyansı ve Örnek Standart Sapması Ele alınan veri kümesinin merkezi eğilimini betimleyen istatistiklerin yanında, aynı zamanda veri değerlerinin dağılımı veya değişkenliğini betimleyen istatistiklerde kullanılır. n değişkenden oluşan x 1, x 2,, x n veri kümesinin örnek varyansı s 2 = n i=1 x i x 2 n 1 ile tanımlanır. Örnek varyansın pozitif kareköküne örnek standart sapması denir.

A: 3, 4, 6, 7, 10 B: -20, 5, 15, 24

Örnek ortalaması, örnek tepedeğeri (mod), örnek ortancası(medyan) veri kümesinin merkezi eğilim ölçülerini tanımlar iken varyans ve standart sapma veri değerlerinin yayılışını veya değişkenliğini betimleyen istatistiklerdir.

Örnek Yüzdebirlikleri ve Kutu Grafikleri 0 p 1 olmak üzere, 100p. örnek yüzdebirliği kendisinden verilerin yüzde 100p sinin küçük veya eşit kaldığı veri değeridir. n hacimli bir veri kümesinin 100p. örnek yüzdebirliğini belirlemek için; Bu değerden küçük veya eşit kalan en az np sayıda değerin bulunması gerekir.

Bunun için; np bir tamsayı değilse; np den büyük en küçük tamsayıncı en küçük veri np bir tamsayı ise; np. ve np + 1. en küçük verilerin ortalaması 100p. yüzdebirliği verir.

Örneğin; n = 22 olan veri kümesi için p = 0.8 alalım. 100p = 100 0.8 = 80. örnek yüzde birliği np = 22 0.8 = 17.6 olur. 18. en küçük veri 80. örnek yüzde birliği verir.

Bir veri kümesinin; 25. örnek yüzdebirliğine birinci çeyreklik, 50. örnek yüzdebirliğine ikinci çeyreklik, 75. örnek yüzdebirliğine üçüncü çeyreklik denir.

36 farklı zamanda yapılmış olan gürültü büyüklüğü ölçümlerinin çeyrekliklerini

En büyük veri ile en küçük veri arasındaki fark açıklık, üçüncü çeyreklik ile birinci çeyreklik arasındaki fark çeyreklikler arası açıklık olarak adlandırılır.

CHEBYSHEV EŞİTSİZLİĞİ Bir veri kümesinin ortalaması x ve standart sapması s olsun. k 1 olmak üzere verilerin yüzde 100(1 1 k 2 ) den fazlası x ks, x + ks aralığındadır. Buna Chebyshev eşitsizliği denir.

En Çok Satan Araçlar k = 3 2 alınırsa verilerin yüzde 100 1 1 k 2 = 100 5 9 = 55.55 den fazlası x 3 2 s, x 3 s = (20 607,43 151) 2 aralığındadır. Gerçekte bu oran yüzde 90 dır.

NORMAL VERİ KÜMELERİ Uygulamada gözlemlenen büyük veri kümelerinin birçoğu benzer biçimi olan histogramlara sahiptir. Bu histogramlar örnek ortancasında zirveye ulaşır ve sonra bu noktanın her iki yanında çan biçimli simetrik bir tarzda azalır. Böyle veri kümelerinin normal olduğu söylenir ve histogramlarına normal histogramlar denir.

Normal bir veri kumesinin histogramı

Yaklaşık normal bir veri kümesinin histogramı

Sola çarpık bir veri kümesinin histogramı

Sağa çarpık bir veri kümesinin historagramı

İki tepedeğerli bir veri kümesinin histogramı

Gözlemsel Kural Yaklaşık normal dağılım gösteren bir veri kümesinin ortalaması x ve standart sapması s olsun. Bu durumda Verilerin yaklaşık %68 i x s, x + s Verilerin yaklaşık %95 i x 2s, x + 2s Verilerin yaklaşık %99.7 si x 3s, x + 3s aralığında kalır.

Bir sınıftaki öğrencilerin istatistik dersinden aldığı notlar; x = 70.57 ve s = 14.35olarak bulunur. x s, x + s =(56.2,84.9) %68 i (Gerçek oran=%53) x 2s, x + 2s =(41.8,99.2) %95 i (Gerçek oran=%100)

EŞLEŞTİRİLMİŞ VERİ KÜMELERİ VE ÖRNEK KORELASYON KATSAYISI Sıklıkla birbiriyle bazı ilişkilere sahip değer çiftlerinden oluşan veri kümeleriyle ilgilenilir. Böyle bir veri kümesinde her bir eleman bir x ve bir y değerine sahipse, i. veri noktası bir (x i, y i ) çiftiyle temsil edilir.

Eşleştirilmiş değerlerin veri kümesini resmetmenin yararlı bir yolu, x-ekseni verilerin x değerini ve y-ekseni verilerin y değerini göstermek üzere verileri iki boyutlu bir grafik üzerinde işaretlemektir. Böyle bir işaretlemeye serpme diyagramı denir.

Serpme diyagramı

Eşleştirilmiş veri kümelerinde büyük x değerlerinin büyük y değerleri ile eşleşme eğilimini ölçmede örnek korelasyon katsayısı istatistiği kullanılır. s x, x değişkeninin ve s y, y değişkeninin örnek standart sapmaları olmak üzere, (x i, y i ) veri çiftlerinin örnek korelasyon katsayısı olarak tanımlanır. Veri çiftleri r > 0 ise pozitif ilişkili ve r < 0 ise negatif ilişkilidir.

Örnek Korelasyonun Özellikleri Örnek korelasyonu -1 den büyük veya eşit ve 1 den küçük veya eşittir. Büyük x verilerinin büyük y verilerine bağlayacak şekilde bir doğru varsa korelasyon değeri 1 dir. (Doğrusal Korelasyon) Büyük x verilerinin küçük y verilerine bağlayacak şekilde bir doğru varsa korelasyon değeri -1 dir. Verilerinden herhangi birinin tamamına sabit bir sayı eklenmesi yada sabit bir sayıyla çarpılmasıyla korelasyon sayısı değişmez Korelasyon katsayısının mutlak değeri değişkenlerin arasındaki doğrusal ilişkinin gücünün göstergesidir.

Örnek korelasyon katsayıları

Örneğin; Sıcaklık ile arıza sayısı verilerinin korelasyonu r = 0.4189 olarak bulunmuştur. Bu gün ortası sıcaklık ile o gün üretilen arızalı parça sayısı arasında göreli olarak zayıf bir korelasyon olduğu anlamına gelir.

Korelasyon Nedenselliği Değil, Birlikteliği Ölçer r = 0.7638 olduğundan bireylerin okul yılı sayısı ve nabız sayısı arasında güçlü bir negatif korelasyon olduğu görülür. yüksek nabız sayısının düşük okul yılıyla ilişkili olduğunu gösterir.

Okul yılı ve nabız sayısı serpme diyagramı