Bir araştırma veya projenin içinde Veri Analizinin yeri:



Benzer belgeler
Değer Frekans

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

Ders 1 Minitab da Grafiksel Analiz-I

İstatistik Nedir? Ders 1 Minitab da Grafiksel Analiz-I ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. İstatistiğin Konusu Olan Olaylar

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

SÜREKLİ ŞANS DEĞİŞKENLERİ. Üstel Dağılım Normal Dağılım

VERİ KÜMELERİNİ BETİMLEME

Bölüm 2 VERİLERİN DERLENMESİ VE SUNUMU

Bölüm 2. Frekans Dağılışları VERİLERİN DERLENMESİ VE SUNUMU. Frekans Tanımı. Verilerin Derlenmesi ve Sunulması

13. Olasılık Dağılımlar

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

Ki- Kare Testi ANADOLU ÜNİVERSİTESİ. ENM 317 MÜHENDİSLİK İSTATİSTİĞİ İYİ UYUM TESTİ Prof.Dr. Nihal ERGİNEL

Üretim Süreci: Girdi İşlem Ürün (Sonuç) Araştırma Süreci: Hangi alanda olursa olsun araştırma bir BİLGİ ye ulaşma sürecidir.

İSTATİSTİKTE TEMEL KAVRAMLAR

Tesadüfi Değişken. w ( )

BÖLÜM 8 BİLGİSAYAR UYGULAMALARI - 2

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER

TANIMLAYICI İSTATİSTİKLER

BİYOİSTATİSTİK. Genel Uygulama 1. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

AKSARAYLI TEMEL İSTATİSTİK YÖNTEMLER

Kesikli Şans Değişkenleri İçin; Olasılık Dağılımları Beklenen Değer ve Varyans Olasılık Hesaplamaları

İSTATİSTİK DERS NOTLARI

ĐSTATĐSTĐK. Okan ERYĐĞĐT

Evren (Popülasyon) Araştırma kapsamına giren tüm elemanların oluşturduğu grup. Araştırma sonuçlarının genelleneceği grup

OLASILIK ve İSTATİSTİK Hipotez Testleri

Đst101 Olasılık ve Đstatistiğe Giriş

İÇİNDEKİLER. Ön Söz Saymanın Temel Kuralları Permütasyon (Sıralama) Kombinasyon (Gruplama) Binom Açılımı...

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

Su Ürünlerinde Temel İstatistik. Ders 2: Tanımlar

Değişken Türleri, Tanımlayıcı İstatistikler ve Normal Dağılım. Dr. Deniz Özel Erkan

Sıklık Tabloları, BASİT ve TEK değişkenli Grafikler Ders 3 ve 4 ve 5

OLASILIK ve KURAMSAL DAĞILIMLAR

3. Ders Çok Boyutlu (Değişkenli) Veri Analizi

VERİ MADENCİLİĞİ. Karar Ağacı Algoritmaları: SPRINT algoritması Öğr.Gör.İnan ÜNAL

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

İstatistik Temel Kavramlar- Devam

Uygulama 3 Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

Mühendislikte İstatistik Yöntemler

KESİKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK DAĞILIMLARI. Bernoulli Dağılımı Binom Dağılımı Poisson Dağılımı

5 kilolitre=..lt. 100 desilitre=.dekalitre. 150 gram=..dag g= mg. 0,2 ton =..gram. 20 dam =.m. 2 km =.cm. 3,5 h = dakika. 20 m 3 =.

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

GRAFİK YORUMLAMA. 1 ) Sütun Grafiği : Belirli bir zaman aralığında bazı veri grup-

HİPOTEZ TESTLERİ. Yrd. Doç. Dr. Emre ATILGAN

1. ÜNİTE 2. ÜNİTE 3. ÜNİTE. Bölüm 1 : Üslü Sayılar Bölüm 2 : Doğal Sayılar Bölüm 3 : Doğal Sayı Problemleri... 30

İSTATİSTİK MHN3120 Malzeme Mühendisliği

Dr. Mehmet AKSARAYLI

Mühendislikte İstatistik Yöntemler

SÜREKLİ RASSAL DEĞİŞKENLER

9. SINIF FİZİK YAZ TATİLİ ÖDEV KİTAPÇIĞI. MEV Koleji Özel Ankara Okulları

İçindekiler. Ön Söz... xiii

İstatistik ve Olasılık

6. Kütlesi 600 g ve öz ısısı c=0,3 cal/g.c olan cismin sıcaklığı 45 C den 75 C ye çıkarmak için gerekli ısı nedir?

BÖLÜM 4 FREKANS DAĞILIMLARININ GRAFİKLE GÖSTERİLMESİ

BİLİMSEL ARAŞTIRMA YÖNTEMLERİ. Bazı Temel Kavramlar

Deney Dizaynı ve Veri Analizi Ders Notları

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

DENİZ HARP OKULU TEMEL BİLİMLER BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

BİYOİSTATİSTİK Grafikler Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

BİYOİSTATİSTİK Tablo Hazırlama Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH


Ders 4: Rastgele Değişkenler ve Dağılımları

Kesikli ġans DeğiĢkenleri Ġçin; Olasılık Dağılımları Beklenen Değer ve Varyans Olasılık Hesaplamaları

ISI VE SICAKLIK. 1 cal = 4,18 j

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Copyright 2004 Pearson Education, Inc. Slide 1

ANADOLU ÜNİVERSİTESİ İST 213 OLASILIK DERSİ TANIMLAR VE VERİ SINIFLAMASI

ANADOLU ÜNİVERSİTESİ. ENM 317 MÜHENDİSLİK İSTATİSTİĞİ İYİ UYUM TESTİ Prof.Dr. Nihal ERGİNEL


Rastgele Değişkenlerin Dağılımları. Mühendislikte İstatistik Yöntemler

İSTATİSTİKSEL VERİ ANALİZİ

BİYOİSTATİSTİK. Ödev Çözümleri. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Farklı iki ilaç(a,b) kullanan iki grupta kan pıhtılaşma zamanları farklı mıdır?

Tablo (2): Atıştırma Sayısı ve Günlük Sınav Sayısı Atıştırma Sınav Sayısı (X)

İstatistik Giriş ve Temel Kavramlar. BBY606 Araştırma Yöntemleri Güleda Doğan

2- VERİLERİN TOPLANMASI

FREKANS VERİLERİ. Prof.Dr. Levent ŞENYAY III - 1

3)Aşağıdaki tabloda gruplandırılmış bir veri kümesi bulunmaktadır. Bu veri kümesinin mutlak ortalamadan sapması aşağıdakilerden hangisidir?

Yrd.Doç.Dr. Ali SICAK BEÜ. EREĞLİ EĞİTİM FAKÜLTESİ EĞİTİM BİLİMLERİ BÖLÜMÜ

b) Aşağıda verilen tanımlamalardan herhangi 5 adeti yazılabilir. Aritmetik Ortalama: Geometrik Ortalama:

İstatistik Nedir? İstatistiğin Önemi Nedir? Tanımlayıcı ve Çıkarımcı İstatistik ttitik Tanımlayıcı İstatistik Türleri Çıkarımcı İstatistiğin i iği

BÖLÜM 1 GİRİŞ: İSTATİSTİĞİN MÜHENDİSLİKTEKİ ÖNEMİ

ÖĞRENME ALANI: Kuvvet ve Hareket 2.ÜNİTE: Kaldırma Kuvveti ve Basınç. Kaldırma Kuvveti

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

İSTATİSTİK I KISA ÖZET KOLAYAOF

ASİSTAN ARŞ. GÖR. GÜL DAYAN

Bölüm 3. Tanımlayıcı İstatistikler

MADDE ve ÖZELLİKLERİ

BİYOİSTATİSTİK Olasılıkta Temel Kavramlar Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

GİRİŞ. Bilimsel Araştırma: Bilimsel bilgi elde etme süreci olarak tanımlanabilir.

1.58 arasındaki her bir değeri alabileceği için sürekli bir

Olasılık ve İstatistik Dersinin Öğretiminde Deney ve Simülasyon

2018 İKİNCİ SEVİYE AKTÜERLİK SINAVLARI RİSK ANALİZİ VE AKTÜERYAL MODELLEME 12 MAYIS 2018

SÜREKLĠ OLASILIK DAĞILIMLARI

Ders 8: Verilerin Düzenlenmesi ve Analizi

Yrd. Doç. Dr. Sedat Şen 9/27/2018 2

Transkript:

1. Ders Veri Analizine Giriş Bir araştırma veya projenin içinde Veri Analizinin yeri: Araştırma-Proje * Araştırma Konusunun ortaya atılması olgu ile ilgili değişkenlerin (ölçülecek-gözlenecek özelliklerin) belirlenmesi tahmin edilecek parametrelerin ve hipotezlerin öne sürülmesi amaçların yazılması *Araştırmanın maliyet ve zaman planlaması * Örnekleme ve Verilerin Toplanması * Veri Analizi * Rapor hazırlama * Projenin kapatılması Verilerin Elde Edilmesi: * Örnekleme çalışmaları (anket, yüzyüze görüşme, mektup, telefon, internet, ) * Gözlemleme (metereoloji, deprem, çevre, tıp, ) * Bilimsel çalışmalar ( tasarlanan deneylerden elde edilen gözlemler, ) * Veri Anbarları (arşivler, ulusal ve uluslar arası kurumlar, TÜĐK, Sağlık Bakanlığı, http://www.ncbi.nlm.nih.gov/genome/guide/human/, ) Verilerin Analize Hazırlanması (Verilerin Đşlenmesi) * Veri girişi * Kodlama, sayısallaştırma * Verilerin bilgisayar yazılımına uygun hale getirilmesi Verinin Analizi Đstatistiksel Sonuç Çıkarım * Kayıp veri sorununun çözülmesi * Đstatistiksel yöntemlerin işlerliği için gerekli varsayımların sınanması * Çıktıların elde edilip yorumlanması * Karar ve öneriler

R.Arıkan (1995) Araştırma Teknikleri ve Rapor Yazma, TUTĐBAY Yayınları

http://www.tuik.gov.tr/

http://www.tuik.gov.tr/pretablo.do?alt_id=25

http://www.ncbi.nlm.nih.gov/genome/guide/human/

http://www.ncbi.nlm.nih.gov/nuccore/nt_077402.2?from=1&to=257719&report=fasta >gi 224514618 ref NT_077402.2 Homo sapiens chromosome 1 genomic contig, GRCh37.p10 Primary Assembly TAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAAC CCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCAACCCTAACCCTAACCCTAACCCTAACCCTAA CCCTAACCCCTAACCCTAACCCTAACCCTAACCCTAACCTAACCCTAACCCTAACCCTAACCCTAACCCT AACCCTAACCCTAACCCTAACCCCTAACCCTAACCCTAAACCCTAAACCCTAACCCTAACCCTAACCCTA ACCCTAACCCCAACCCCAACCCCAACCCCAACCCCAACCCCAACCCTAACCCCTAACCCTAACCCTAACC CTACCCTAACCCTAACCCTAACCCTAACCCTAACCCTAACCCCTAACCCCTAACCCTAACCCTAACCCTA ACCCTAACCCTAACCCTAACCCCTAACCCTAACCCTAACCCTAACCCTCGCGGTACCCTCAGCCGGCCCG CCCGCCCGGGTCTGACCTGAGGAGAACTGTGCTCCGCCTTCAGAGTACCACCGAAATCTGTGCAGAGGAC AACGCAGCTCCGCCCTCGCGGTGCTCTCCGGGTCTGTGCTGAGGAGAACGCAACTCCGCCGTTGCAAAGG CGCGCCGCGCCGGCGCAGGCGCAGAGAGGCGCGCCGCGCCGGCGCAGGCGCAGAGAGGCGCGCCGCGCCG GCGCAGGCGCAGAGAGGCGCGCCGCGCCGGCGCAGGCGCAGAGAGGCGCGCCGCGCCGGCGCAGGCGCAG AGAGGCGCGCCGCGCCGGCGCAGGCGCAGACACATGCTAGCGCGTCGGGGTGGAGGCGTGGCGCAGGCGC AGAGAGGCGCGCCGCGCCGGCGCAGGCGCAGAGACACATGCTACCGCGTCCAGGGGTGGAGGCGTGGCGC AGGCGCAGAGAGGCGCACCGCGCCGGCGCAGGCGCAGAGACACATGCTAGCGCGTCCAGGGGTGGAGGCG TGGCGCAGGCGCAGAGACGCAAGCCTACGGGCGGGGGTTGGGGGGGCGTGTGTTGCAGGAGCAAAGTCGC ACGGCGCCGGGCTGGGGCGGGGGGAGGGTGGCGCCGTGCACGCGCAGAAACTCACGTCACGGTGGCGCGG CGCAGAGACGGGTAGAACCTCAGTAATCCGAAAAGCCGGGATCGACCGCCCCTTGCTTGCAGCCGGGCAC TACAGGACCCGCTTGCTCACGGTGCTGTGCCAGGGCGCCCCCTGCTGGCGACTAGGGCAACTGCAGGGCT CTCTTGCTTAGAGTGGTGGCCAGCGCCCCCTGCTGGCGCCGGGGCACTGCAGGGCCCTCTTGCTTACTGT ATAGTGGTGGCACGCCGCCTGCTGGCAGCTAGGGACATTGCAGGGTCCTCTTGCTCAAGGTGTAGTGGCA GCACGCCCACCTGCTGGCAGCTGGGGACACTGCCGGGCCCTCTTGCTCCAACAGTACTGGCGGATTATAG GGAAACACCCGGAGCATATGCTGTTTGGTCTCAGTAGACTCCTAAATATGGGATTCCTGGGTTTAAAAGT AAAAAATAAATATGTTTAATTTGTGAACTGATTACCATCAGAATTGTACTGTTCTGTATCCCACCAGCAA TGTCTAGGAATGCCTGTTTCTCCACAAAGTGTTTACTTTTGGATTTTTGCCAGTCTAACAGGTGAAGCCC TGGAGATTCTTATTAGTGATTTGGGCTGGGGCCTGGCCATGTGTATTTTTTTAAATTTCCACTGATGATT TTGCTGCATGGCCGGTGTTGAGAATGACTGCGCAAATTTGCCGGATTTCCTTTGCTGTTCCTGCATGTAG TTTAAACGAGATTGCCAGCACCGGGTATCATTCACCATTTTTCTTTTCGTTAACTTGCCGTCAGCCTTTT CTTTGACCTCTTCTTTCTGTTCATGTGTATTTGCTGTCTCTTAGCCCAGACTTCCCGTGTCCTTTCCACC GGGCCTTTGAGAGGTCACAGGGTCTTGATGCTGTGGTCTTCATCTGCAGGTGTCTGACTTCCAGCAACTG CTGGCCTGTGCCAGGGTGCAAGCTGAGCACTGGAGTGGAGTTTTCCTGTGGAGAGGAGCCATGCCTAGAG TGGGATGGGCCATTGTTCATCTTCTGGCCCCTGTTGTCTGCATGTAACTTAATACCACAACCAGGCATAG GGGAAAGATTGGAGGAAAGATGAGTGAGAGCATCAACTTCTCTCACAACCTAGGCCAGTAAGTAGTGCTT GTGCTCATCTCCTTGGCTGTGATACGTGGCCGGCCCTCGCTCCAGCAGCTGGACCCCTACCTGCCGTCTG CTGCCATCGGAGCCCAAAGCCGGGCTGTGACTGCTCAGACCAGCCGGCTGGAGGGAGGGGCTCAGCAGGT CTGGCTTTGGCCCTGGGAGAGCAGGTGGAAGATCAGGCAGGCCATCGCTGCCACAGAACCCAGTGGATTG GCCTAGGTGGGATCTCTGAGCTCAACAAGCCCTCTCTGGGTGGTAGGTGCAGAGACGGGAGGGGCAGAGC

Kitle: 2012-2013 Ders Yılı Đst307 dersini alan öğrenciler. Değişkenler: ağırlık-y (kg), boy uzunluğu- X 1(cm) kol uzunluğu- X 2 (cm) omuz çevresi- X 3 (cm) kalça çevresi- X 4 (cm) bacak uzunluğu- X 5 (cm) cinsiyet X 5 (K-0,E-1) Veri: Y X 1 X 2 X 3 X 4 X 5 X 6 97 184 77 98 120 114 1 50 163 66 72 90 97 0 75 183 73 99 113 91 1 55 160 86 70 95 102 0 60 166 74 91 105 98 0 55 165 91 78 100 100 0 65 162 84 72 110 115 0 110 191 80 105 140 117 1 54 178 76 95 97 92 0 68 195 78 110 110 100 1 78 187 82 107 107 101 1 73 185 81 106 113 94 1 88 177 75 92 124 104 1 72 174 74 90 111 104 1 65 175 75 93 111 100 1 73 181 77 93 117 105 1 88 188 81 117 105 113 1 78 180 80 97 120 107 1 55 178 74 96 103 96 1 67 178 76 96 114 101 1 49 167 71 97 99 90 0 54 168 68 90 96 100 0 68 180 78 97 109 102 1 75 180 79 99 121 109 1 71 177 74 95 111 108 1 71 186 80 101 115 99 1 53 163 68 103 98 89 0 47 155 65 84 93 90 0 65 171 75 90 110 90 1 52 155 68 84 85 98 0 54 156 70 86 95 87 0 50 167 80 100 97 95 0 58 165 72 85 100 93 0 67 168 71 85 116 105 0 82 178 75 97 128 111 1 84 186 83 103 120 109 1 75 185 79 100 103 119 1 52 160 70 95 95 94 0

Ölçme ve Veri Sıcaklık kavramını göz önüne alalım. Sıcaklık nedir? Bu sorunun cevabı bir tarafa, sıcaklığı ölçmek için termometre denen bir alet kullanıldığını biliyoruz. Đnce bir cam borunun içine civa (bir sıvı) konmuş ve sıvıların genleşme esasına dayalı olarak skalasında sıcaklığı gösteren termometreler görmüşüzdür. Elektrik akımındaki dirence dayalı olarak sıcaklığı ölçen termometreler de vardır. Eskiden arabalarda vardı. Şu anki arabalarda sıcaklık nasıl ve ne ile ölçülmektedir? Ben de bilmiyorum. Hastanelerde, hemşireler hastaların alnına bir alet tutarak (bir ışın göndererek, kızılötesi bir ışın veya lazer ışını olabilir, bilmiyorum) sıcaklık ölçümü yapmaktadır. Termometreler sıcaklığı nasıl ölçmektedir. Wikipedia Ansiklopesinde http://tr.wikipedia.org/wiki/termometre ye bakınız. Bimetal termometre Dijital termometre Galilei termometresi Zaman ölçümünde kullanılan aletleri (kum saati, güneş saati, sarkaçlı duvar saati, yaylı masa veya kol saati, kristalli kol saati, dijital kol saati,...) ve çalışma prensiplerini göz önüne getirip tarihi gelişimine bakarsak, bilimin tarihi gelişimi ile paralellik görürüz. Diğer ölçü aletleri için de benzer şey söylenebilir. Örneğin kütle ölçmek için kullanılan terazileri göz önüne getirin. Market çıkışlarındaki kasaların yanında bulunan aletler kütle ölçümünü nasıl yapmaktadır? Eğitim, ekonomi, psikoloji ve diğer bilim dallarında da ölçme çok önemli bir yer tutmaktadır. Eğitim fakültelerinde en önemli derslerden birisi ölçme ve değerlendirmedir. Derslerdeki bilginiz nasıl ölçülmektedir? Bilgi nedir? Türk Đstatistik Kurumunun yaptığı işlerden birisi enflasyonu ölçmektir. Enflasyon nedir? Nasıl ölçülmektedir? Zaman nedir ve nasıl ölçülmektedir? Kütle nedir ve nasıl ölçülmektedir? Ağırlık nedir ve nasıl ölçülmektedir? Sıcaklık nedir ve nasıl ölçülmektedir? Isı nedir ve nasıl ölçülmektedir? Cinsiyet nedir ve nasıl ölçülmektedir? Zekâ nedir ve nasıl ölçülmektedir? Tansiyon nedir ve nasıl ölçülmektedir?... Bu soruların muhatabı Đstatistikçiler değildir. Sıcaklık nedir ve nasıl ölçülür, sorusunun

cevabını fizikçiler verecektir. Ancak, belli bir olgudaki bir özellik ile ilgili arda arda yapılan ölçmeler ile elde edilen gözlemler (aşağıda satır satır yazılmış), 0.7207 1.0737 0.3658 0.4106 0.5639 0.6869 1.4974 0.7690 1.2768 0.9359 0.8753 1.3371 1.1267 1.4591 0.7774 1.0750 1.2342 0.7938 1.0189 0.8237 0.4012 0.7098 0.1270 0.9194 0.1781 0.7967 0.6916 0.3159 0.2754 0.6363 1.4314 1.5290 0.9263 1.7743 1.6069 1.0835 1.7167 1.5825 1.4593 1.4617 1.3714 1.2978 2.0561 1.2450 2.0504 1.4586 1.7536 1.9208 1.0285 0.9597 1.0414 0.6994 0.9837 0.6258 1.3832 1.5992 0.7406 1.3029 0.8812 1.1433 1.0665 1.2642 1.5537 1.4120 1.6368 2.4376 2.0071 2.2215 1.8825 1.8735 2.0548 2.7635 2.8020 2.0944 2.8654 2.5372 2.6346 2.1712 2.1099 1.8216 1.5170 1.6463 1.5072 2.1879 1.3595 1.2327 1.5912 1.9423 2.1749 1.9402 1.5812 1.8343 1.8561 1.7449 2.2521 2.6248 2.1767 2.9703 3.2707 3.1016 3.2384 2.7455 2.7356 2.8152 3.2582 3.4959 3.1127 2.9646 3.1987 3.0771 2.8639 2.7873 2.8619 2.9445 2.4052 2.6944 2.4940 2.1529 2.5213 2.2521 2.8854 ortaya çıktığında, bu veriyi analiz etmek Đstatistikçilerin işidir. Yatay eksende gözlem sırası, düşey eksende gözlenen değer olmak üzere aşağıdaki gibi bir grafik çizilebilir. 3.5 3 2.5 2 1.5 1 0.5 0 0 20 40 60 80 100 120 140 Böyle bir veri nereden gelmiş olabilir? Tıp, ekonomi, iklim, jeofizik,...veya başka bir alandan gelmiş olabilir. Đstatistikçi için fark etmez, bu bir zaman serisidir. Gerçek dünyadan kendine konu edinmiş fizik, kimya, biyoloji, jeoloji, astronomi, ekonomi, sosyoloji, psikoloji,... gibi bilim dallarının ilgilendikleri olgular ile temasları ölçme vasıtasıyla olmaktadır. Ölçme ne demektir ve nasıl yapılmaktadır? Ortaöğretimdeki Fizik derslerinden hatırladığımız kadarıyla MKS diye bir ölçü sistemi vardı. Bu sistemde uzunluk için metre, kütle için kg ve zaman için saniye diye birimler vardı. Ayrıca bu ölçümleri yapacak aletler söz konusuydu. Uzunluk için standart olarak alınan bir birim ve bunun alt birimleri kullanılarak oranlama düşüncesi ile istenilen bir hassasiyete kadar ölçümler yapılmaktadır. Çubuklar veya şeritler üzerine sıfırdan başlayarak birimin katları ve alt birimleri işaretlenerek uzunluk ölçen ve çubuk metre, şerit metre gibi isimler taşıyan aletler yapılmaktadır. Bazı dürbünler uzaklık da göstermektedir. Đçlerinde nasıl bir alet vardır? Kütle için de standart bir birim alınmakta ve oranlama düşüncesi ile ölçümler yapılmaktadır. Kütle ölçen kefeli teraziler, yerçekimi kuvveti (ağırlık) ile ilgili moment eşitlenmesi düşüncesi üzerine kuruludur. Bir parantez açalım (Ağırlık nedir ve nasıl ölçülür? Domates satın alırken ve 2 kg domates derken kütle mi, yoksa ağırlık mı kastediliyor? Ya, 2 kilo domates derken?). Gazların kütlesi nasıl ölçülmektedir? Uzunluk, hacim, kütle, ağırlık ölçümlerinde standart bir birim ve bu birime göre oranlama söz konusudur. Böyle yapılan ölçümlere Oran Ölçeği nde yapıldı denir. Zamanı ölçmede farklı bir yol izlenmektedir. Zaman için başlangıcı ve sonu belli bir aralık (zaman dilimi) alınıp ve bu aralığın kendisi veya eşit parçalara bölünmüş bir parçası birim olarak alınmaktadır. Sıcaklık ölçmede de benzer bir yol izlenmektedir. Örneğin, deniz seviyesinde suyun donma sıcaklığı 0, kaynaması 100 sayısına karşılık getirilip, (0,100) aralığının yüzde birlik bir parçası ile 1 Celsius diye isimlendirilen bir birim oluşturulmaktadır. Bu birim ve alt birimleri ile (0,100) aralığının kendisi ve dışı ölçeklendirilmektedir. Sıcaklık ölçmede negatif değerler de çıkmaktadır. Bu şekilde oluşturulan bir ölçeğe Aralık Ölçeği (Interval Scale) denir. Uzunluk, hacim, kütle, ağırlık ölçmede Oran Ölçeği (Ratio Scale), zaman ve sıcaklık ölçmede Aralık Ölçeği (Interval Scale ) kullanıldığı önceki paragraflarda söylendi. Oran Ölçeği ile yapılan ölçmelerde negatif değer olmaz, sıfır yok anlamına gelir. Aralık

Ölçeği nde böyle değildir. Her iki ölçekte; daha büyük değer ölçülen şeyin daha büyük olduğu anlamına gelmektedir. Örneğin, 2 kg domatesin kütlesi 1 kg domatesin kütlesinden büyüktür, 2 C olarak ölçülen suyun sıcaklığı 1 C olanın kinden fazladır. Her iki ölçekle yapılan ölçmelerde elde edilen değerlerdeki (sayılardaki) sıralama, ölçülen özellik için de geçerlidir. Ancak, 2 C olarak ölçülen suyun sıcaklığı 1 C olarak ölçülen suyun sıcaklığının iki katıdır denemez. Oranlama Ölçeği nde böyle değildir, örneğin 2 kg olarak ölçülen domatesin kütlesi 1 kg olarak ölçülen domatesin kütlesinin iki katıdır. Renkler için beyaz-siyah-mavi-yeşil-sarı-kırmızı-kahverengi gibi bir ölçek oluşturup baktıklarımızı bunlardan birisi ile isimlendirmekteyiz. Böyle bir ölçeğe Đsimlendirme ya da Sınıflandırma Ölçeği (Nominal Scale) denir. Böyle ölçülen renkler için sıralama ve oranlamadan bahsedilemez. Ancak, renkler dalga boylarına göre değerlendirilirse bir sıralama söz konusu olabilir. Đsimlendirme Ölçeği ile yapılan ölçümler için sıralama da söz konusu ise böyle bir ölçeğe Sıralama Ölçeği (Ordinal Scale) denir. Bizim küçüklüğümüzde oda sıcaklığı, soğuk-ılık-sıcak ya da buz gibi-soğuk-ılıksıcak-hamam gibi olarak ölçülmekteydi. Ölçümler Sıralama Ölçeğinde yapılmaktaydı. Alet olarak da genellikle çocuklar (burunlarının kızarıklığı, sırtlarının terlemesi, titremeleri,...) kullanılıyordu. Şimdi her çocuk odasında Termometre var. Sıcaklık Aralık Ölçeğinde ölçülmektedir. Üstelik nesnel. Aralık ve Oranlama Ölçeğinde yapılan ölçümler Sınıflama ve Sıralama Ölçeğinde yapılan ölçümlere göre daha hassas olmaktadır. Belki bu sebepten dolayı Sınıflama, Sıralama, Oran, Aralık Ölçek leri yerine Sınıflama, Sıralama, Oran, Aralık Düzeyleri deyimi kullanılmaktadır. Ölçme yapanlar, kendi ihtiyacını karşılayacak şekilde bir ölçme düzeyi seçmekte ve imkânlar çerçevesinde bir alet kullanmaktadırlar. Gerçek dünyadaki olguları anlama-anlatma, yani olguları modelleme çerçevesinde ölçme çok önemli bir yer tutmaktadır. Bu dersin başında, olgu ile temas ölçme den geçmektedir, demiştik. Ölçme yapmak için bir ölçeğe ve ölçülecek özelliğe karşı duyargaç (sensör) bulunduran bir alete ihtiyaç vardır. Ölçme kolay değildir. Hele sizin Đstatistik bilginizi ölçmek hiç de kolay olmamaktadır. Rasgelelik içeren olgulardan elde edilen ölçüm (gözlem) değerlerine istatistiksel veri veya kısaca veri (data) diyelim. Verilerin deneyler sonucu veya doğal şartlarda olguları gözlemekle elde edildiğini belirtelim. Veriler, niceliksel veri (quantitative data, sayısal veri) ve niteliksel veri (qualitative, categorical data) olarak ikiye ayrılabilir. Aralık veya oranlama düzeyinde yapılan ölçümlerden elde edilen veriler birer niceliktir (sayıdır). Bazen sınıflama düzeyinde yapılan ölçümlerden elde edilen veri de sayılardan oluşabilir. Örneğin para atışında, yazı gelişi 0, tura gelişi 1 olarak kodlanırsa elimizdeki veri sayısal bir veri olacaktır. Tersi de olabilir. Sayısal olarak yapılan ölçümlerden niteliksel veri elde edilebilir. Tavla zarı üzerindeki noktalar sayıldıktan sonra ölçümler tek-çift olarak nitelendirilebilir. Aklımız ile gerçek dünyadaki olguları (nesne, olay, süreç, zaman, sıcaklık,...) anlamak isteriz. Olgunun ilgilendiğimiz bir veya birden çok özelliği ile ilgili ölçümler yaparız. Örneğin bir yaşındaki çocuklarda ağırlık, boy, hareket gibi özellikler bizi ilgilendiriyor olabilir. Ağırlığı kg, boyu cm ve hareketi de emekleme-ayakta durabilme- yürüme gibi bir ölçekte ölçtüğümüzü düşünelim. Ağırlık ve boy özelliklerinin ölçümünde elde edilen veri sayısal, hareket özelliğinin ölçümünde elde edilen ise bir kategorik (niteliksel) veri olacaktır. Emekleme 1, ayakta durma 2 ve yürüme 3 ile kodlanırsa elimizde hareket özelliği için de sayısal bir veri olmuş olur. Hareket, doğrudan sayısal veri verebilecek bir ölçek ile de ölçülmüş olabilir. Olgu-özellik-ölçme sonucunda sayısal bir veri elde edilsin. Rasgelelik de söz konusu olduğunda, ölçme sonucu çıkan sayılar da rasgele (gelişigüzel) olacaktır. Bir yaşındaki bir çocuğun ağırlığı ve boy uzunluğu ayrı olarak ele alındıklarında birer rasgele değişken, beraber ele alındıklarında bir rasgele vektördür. Bir ölçme sonucunda sayısal bir değer alan bir özellik, istatistik dilinde bir rasgele değişkendir. Rasgele değişkenler, ölçülen özelliğin doğasına bağlı olarak sürekli ve kesikli olarak iki sınıfa ayrılmaktadırlar. Örneğin, boy uzunluğu sürekli bir rasgele değişken, bir mağazaya bir günde gelen müşteri sayısı kesikli rasgele değişken, bir hastanın nabzı kesikli ve tansiyonu sürekli birer rasgele değişkendir. Doğası sürekli olmasına rağmen, ölçümler tam sayılara yuvarlatıldığı zaman tansiyon kesikli bir rasgele değişken olmaktadır.

Kesikli rasgele değişkenler ile ilgili yapılan ölçmelerde elde edilen verinin kendisine de kısaca kesikli veri denir. Bir tavla zarı atılışında, zar atıldıktan sonra üst yüzeydeki noktaları sayma işlemi bir ölçmedir. Düzgün bir tavla zarının 60 kez atılışında, 5 6 6 5 3 3 2 4 2 6 5 3 5 2 3 6 5 2 6 4 1 2 4 4 3 4 3 1 1 2 1 3 5 1 1 4 4 1 1 2 4 1 3 4 5 5 1 3 3 3 1 5 5 5 3 4 1 3 5 6 sayıları ölçülmüş (gözlenmiş) olsun. Bu veri kesikli bir veridir. Rasgele değişkenin alabileceği değerler, yani ölçme sonucunda çıkabilecek değerler 1,2,3,4,5,6 dır. Bu değerlerin gözlenme sayılarına sıklık (frekans) denir. Bu veri için sıklıklar (frekanslar) aşağıdaki gibidir. Değer 1 2 3 4 5 6 Frekans 12 7 13 10 12 6 Böyle bir tabloya Frekans Tablosu denir. Yatay eksende değerler, düşey eksende frekanslar olmak üzere aşağıdaki gibi bir grafiğe Çubuk Diyagramı denir. Çubukların yükseklikleri frekanslara eşittir. frekans 10 5 1 2 3 4 5 6 değer 1,2,3,4,5,6 sayılarının gözlenme olasılıkları eşit olan zarlara düzgün zar diyelim. Bu zarın düzgün olmadığı söylenebilir mi? Gözlenen sayılar x1, x2,..., x n ile gösterilirse, ve x= s = n i= 1 n n 2 i= 1 x i ( x x) i n 1 2 dır. Bu gözlemlerin ortalaması x =3,35 ve standart sapması s=1,645 dır.

Sürekli rasgele değişkenler ile ilgili verilerin betimlenmesinde de Frekans Tablosu kullanılır. Rasgele seçilen bir yaşındaki 60 tane çocuğun kg cinsinden ağırlıkları aşağıdaki gibi gözlenmiş olsun. 11,70 11,23 9,97 10,79 11,70 9,78 8,98 11,57 8,76 10,66 13,11 10,70 11,07 11,21 10,51 9,01 10,28 10,42 10,03 12,54 9,85 9,60 9,84 10,59 11,14 9,91 9,87 10,74 10,95 9,24 10,49 12,28 9,62 8,23 10,24 10,71 9,65 9,56 10,76 9,52 9,20 9,81 9,77 9,87 7,81 10,35 12,16 9,06 11,56 10,19 10,08 9,21 10,69 9,91 10,76 10,17 11,13 9,10 8,38 9,55 n Ortalama Ortanca Standart sapma Minimum Maximum 60 10,26 10,19 1,05 7,81 13,11 Bu gözlemler içinde en büyüğü 13,11 en küçüğü 7,81 dır. Gözlemleri, sınıf genişliği 1 kğ olan 7 sınıfta aşağıdaki gibi sınıflandırabiliriz. Sınıflar Sınıf Ortası Frekans Eklemeli Frekans 7,00-8,00 8,00-9,00 9,00-10,00 10.00-11,00 11,00-12,00 12,00-13,00 13,00-14,00 7.5 8.5 9.5 10.5 11.5 12.5 13.5 1 4 22 20 9 3 1 1 5 27 47 56 59 60 Yatay eksende sınıf sınırları, düşey eksende frekanslar olmak üzere her sınıfın üstüne tabanı sınıf aralığı ve yüksekliği sınıf frekansı olan dikdörtgenler çizilmesiyle aşağıdaki gibi bir grafiğe Histogram denir. Histogram lar, verilerin hangi aralıklarda hangi sıklıklarla gözlendiğini göstermektedir ve ölçüm yapılan özelliğe karşılık gelen rasgele değişkenin alabileceği değerler ile bunların yoğunlukları hakkında bilgi vermektedir. Histogramlar rasgele değişkenlerin olasılık yoğunluk fonksiyonlarının biçimleri hakkında bilgi vermektedir. Histogram 20 Frequency 10 0 7,5 8,5 9,5 10,5 11,5 12,5 13,5 Agirlik

Nokta Diyagramı 8 9 10 11 12 13 Agirlik 7 8 8 2379 9 0012225556667788888999 10 00112234455667777779 11 011225577 12 125 13 1 Dal-Yaprak Diyagramı Kutu Çiziti 8 9 10 11 12 13 Agirlik Bir veri üzerinde yapılan işlemlere betimleme diyebiliriz (betimlemeler, bazı istatistiklerin veriye dayalı olarak aldığı değerlerdir). Görüldüğü gibi, bir yaşındaki çocukların ağırlığı ile ilgili bir veri üzerinde birçok betimleme yapılabilir. Đstatistiksel paket programlar sayesinde bunu yapmanın çok kolaylaştığını da biliyorsunuz. Bir yaşındaki çocukların ağırlıkları kimleri, niçin ve hangi yönleri ile ilgilendirmektedir? Đstatistikçileri pek ilgilendirmez. Hele çocuğu yoksa. Yine de biraz fikir yürütelim. Çocuk doktorları, hemşireler, diyetisyenler meslek gereği bir yaşındaki çocukların ağırlıkları ile ilgilenir. Ağırlığın nesi ile ilgilenir? Belki, hangi değerler arasında olması gerektiği, dağılışı, çocukların %99 unun ağırlığı hangi değerin altında, bir yaşında bir çocuğun ortalama ağırlığı nedir gibi şeylerle ilgileniyor olabilirler. Đstatistik diliyle ifade edersek, bir yaşındaki çocukların ağırlığının dağılımı, ortalaması, varyansı, yüzdelikleri, çarpıklığı, basıklığı, değişim katsayısı gibi şeyler onları ilgilendiriyor olabilir. Çocukların kümesine kitle ve çocuklara da birim dendiğini Örnekleme dersinden biliyoruz. Genellikle araştırmalardaki gözlemler, kitlelerden rasgele çekilen birimlerin oluşturduğu örnekler üzerinde yapılır. Bazen de kitledeki tüm birimler üzerinde gözlem yapılır, yani sayım yapılır. Kitle ve Birim kavramları sanıldığı kadar kolay kavramlar değildir. Bir yaşında bir çocuk demek doğduktan sonra doğum gününe ulaşmış bir çocuk olmak üzere, böyle çocukların (birimlerin) kitlesi her gün değişen bir kümedir. Kitleyi, 2013 yılı (bu dersin anlatıldığı yıl) Ankara doğumlu çocuklar olarak belirlesek ve Nüfus Đdare Sisteminden doğan çocukların listesini (çerçeve) alıp, aralarından rasgele bir örnek seçip, doğum günlerinde bu çocukların ağırlıklarını ölçmeyi düşünsek verilerin toplanması ne zaman başlar ne zaman biter? Liste Nüfus Đdare Sisteminden ne zaman alınacaktır? Örnek hacmi ne olacak? Örnek ne zaman çekilecek? Böyle bir araştırmanın maliyeti ne olacak? Kim yapar? Kimler yaptırır? Kim destekler? Neye yarar?

Anneler çocuklarını ilk aylarda daha sık olmak üzere, belli aralıklarla muayeneye götürürler. Gözlenen birçok özelliğin içinde bir tanesi de çocuğun ağırlığıdır. Belli bir yaştaki, örneğin bir yaşındaki bir çocuğun ağırlığının normal olup olmadığı, yani kilolu olup olmadığı nasıl söylenmektedir? Araştırmalar sonucunda hazırlanan ve hemşirelerin elinde bulunan çizelgelere bakarak mı? Yoksa göz kararı mı? Bir yaşındaki bir çocuğun ağırlığı, boyu, zekâsı, yürümesi, konuşması normal midir? Nasıl karar verilmektedir? Bu soruların muhatabının Đstatistikçiler olmadığı apaçık ortadadır. Đstatistik bilimi açısından ağırlık verisi ile zekâ verisi arasında bir fark yoktur. Farklı yöntemlerle elde edilen bu iki veri aynı istatistik yöntemle analiz edilebilir. Đstatistiğin kendi kavramları ve yöntemleri vardır. Dört yıl boyunca bunların büyükçe bir kısmını öğrenmiş oldunuz. Uygulama zamanı geldi. Siz de yapabilirsiniz.