IKT-213 İSTATİSTİK PROF. DR. ARGUN KARACABEY DOÇ. DR. FAZIL GÖKGÖZ ~~ GİRİ ~~ Verilerin(data) toplanması. Analizlerin yapılması



Benzer belgeler
IKT-213 İSTATİSTİK PROF. DR. ARGUN KARACABEY DOÇ. DR. FAZIL GÖKGÖZ ~~ GİRİ ~~ Verilerin(data) toplanması. Analizlerin yapılması

Prof.Dr.A.KARACABEY Doç.Dr.F.GÖKGÖZ RANDOM DEĞİŞKEN

KONU2 MERKEZİ EĞİLİM ÖLÇÜLERİ EĞİLİM ÖLÇÜLERİ ANALİTİK ORTALAMALAR ANALİTİK OLMAYAN MERKEZİ. Aritmetik ortalama **Medyan(median)

SÜREKLİ( CONTINUOUS) OLASILIK

OLASILIK (İHTİMAL) TEORİSİ. DENEY (experiment),sonuç (outcome), OLAY (event) DENEY:Bir aktivitenin gözlemlenmesi ve ölçüm yapma şekilleridir.

DAĞILMA YADA DEĞİ KENLİK ÖLÇÜLERİ (MEASURE OF DISPERSION) Prof.Dr.A.KARACABEY Doç.Dr.F.GÖKGÖZ

ÖRNEKLEME TEORİSİ. Prof.Dr.A.KARACABEY Doç.Dr.F.GÖKGÖZ

I. İSTATİSTİK VE OLASILIK

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

SÜREKLİ ŞANS DEĞİŞKENLERİ. Üstel Dağılım Normal Dağılım

SÜREKSİZ(DISCRETE) OLASILIK DAĞILIMLARI

TANIMLAYICI İSTATİSTİKLER

Kesikli ġans DeğiĢkenleri Ġçin; Olasılık Dağılımları Beklenen Değer ve Varyans Olasılık Hesaplamaları

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

İstatistik ve Olasılık

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

İÇİNDEKİLER ÖN SÖZ...

VERİ SETİNE GENEL BAKIŞ

Copyright 2004 Pearson Education, Inc. Slide 1

Mühendislikte İstatistik Yöntemler

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

Kesikli Şans Değişkenleri İçin; Olasılık Dağılımları Beklenen Değer ve Varyans Olasılık Hesaplamaları

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

HİPOTEZ TESTLERİ HİPOTEZ NEDİR?

SÜREKLİ RASSAL DEĞİŞKENLER

Bölüm 3. Tanımlayıcı İstatistikler


İÇİNDEKİLER BÖLÜM 1 KAVRAMLAR VE YÖNTEMBİLİM

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

Mühendislikte İstatistiksel Yöntemler

İstatistik 1. Bölüm 5 Olasılık Teorisi ve Kesikli Olasılık Dağılımları. Ankara Üniversitesi SBF, GYY

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik

Merkezi Eğilim ve Dağılım Ölçüleri

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Olasılık, bir deneme sonrasında ilgilenilen olayın tüm olaylar içinde ortaya çıkma ya da gözlenme oranı olarak tanımlanabilir.

MAK 210 SAYISAL ANALİZ

13. Olasılık Dağılımlar

SÜREKLĠ OLASILIK DAĞILIMLARI

Dr. Mehmet AKSARAYLI

İçindekiler. Ön Söz... xiii

İSTATİSTİK MHN3120 Malzeme Mühendisliği

ALKÜ EKONOMİ ve FİNANS BÖLÜMÜ ISL 207 İSTATİSTİK I ALIŞTIRMALAR

Uygulama 3 Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

Merkezi Yığılma ve Dağılım Ölçüleri

BİYOİSTATİSTİK Merkezi Eğilim ve Değişim Ölçüleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. Ders 2 Merkezi Eğilim Ölçüleri

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

İSTATİSTİK EXCEL UYGULAMA

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

Ankara Üniversitesi, SBF İstatistik 2 Ders Notları Prof. Dr. Onur Özsoy 1

Örnek...4 : İlk iki sınavında 75 ve 82 alan bir öğrencinin bu dersin ortalamasını 5 yapabilmek için son sınavdan kaç alması gerekmektedir?

İSTATİSTİK. Bölüm 1 Giriş. Ankara Üniversitesi SBF İstatistik 1 Ders Notları Prof. Dr. Onur Özsoy 4/4/2018

1.58 arasındaki her bir değeri alabileceği için sürekli bir

Deney Dizaynı ve Veri Analizi Ders Notları

Prof.Dr.İhsan HALİFEOĞLU

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir

Örnek Bir zar atıldığında zarın üstünde bulunan noktaların sayısı gözlensin. Çift sayı gelmesi olasılığı nedir? n(s) = 3 6 = 1 2

İstatistik ve Olasılık

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

BİYOİSTATİSTİK Olasılıkta Temel Kavramlar Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

FREKANS VERİLERİ. Prof.Dr. Levent ŞENYAY III - 1

İSTATİSTİK STATISTICS (2+0) Yrd.Doç.Dr. Nil TOPLAN SAÜ.MÜH. FAK. METALURJİ VE MALZEME MÜH. BÖLÜMÜ ÖĞRETİM ÜYESİ ÖĞRETİM YILI

Tesadüfi Değişken. w ( )

Verilerin Özetlenmesinde Kullanılan Sayısal Yöntemler

VERİ KÜMELERİNİ BETİMLEME

Ankara Üniversitesi, SBF İstatistik 2 Ders Notları Prof. Dr. Onur Özsoy 1

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Merkezi Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Olasılık Kuramı ve Bazı Olasılık Dağılımları

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

BİYOİSTATİSTİK Bazı Olasılık Dağılışları Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

KESİKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK DAĞILIMLARI. Bernoulli Dağılımı Binom Dağılımı Poisson Dağılımı

Verilerin Düzenlenmesi

BÖLÜM 1 GİRİŞ: İSTATİSTİĞİN MÜHENDİSLİKTEKİ ÖNEMİ

İstatistik ve Olasılık

SÜREKLİ OLASILIK DAĞILIŞLARI

Rastlantı Değişkenleri

İstatistik ve Olasılık

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( )

EĞĠTĠMDE ÖLÇME VE DEĞERLENDĠRME BÖLÜM IV Ölçme Sonuçları Üzerinde Ġstatistiksel ĠĢlemler VERİLERİN DÜZENLENMESİ VERİLERİN DÜZENLENMESİ

Appendix B: Olasılık ve Dağılım Teorisi

İstatistik Dersi Çalışma Soruları Arasınav(Matematik Müh. Bölümü-2014)

KANTİTATİF TEKNİKLER - Temel İstatistik -

DENİZ HARP OKULU TEMEL BİLİMLER BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

Olasılık Tanımı KALİTE KONTROL. Temel Olasılık ve İstatistik. İçindekiler Giriş

Sürekli Rastsal Değişkenler

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ DÖNEM SONU SINAV SORULARI

İstatistik ve Olasılık

İÇİNDEKİLER. Ön Söz Saymanın Temel Kuralları Permütasyon (Sıralama) Kombinasyon (Gruplama) Binom Açılımı...

LAÜ FEN EDEBĐYAT FAKÜLTESĐ PSĐKOLOJĐ BÖLÜMÜ PSK 106 ĐSTATĐSTĐK YÖNTEMLER I BAHAR DÖNEMĐ BÜTÜNLEME SINAVI SORULARI

BAYES KURAMI. Dr. Cahit Karakuş

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Rastgele Değişkenlerin Dağılımları. Mühendislikte İstatistik Yöntemler

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

Transkript:

IKT-213 İSTATİSTİK 16.07.2012 IKT-213 İSTATİSTİK PROF. DR. ARGUN KARACABEY DOÇ. DR. FAZIL GÖKGÖZ ~~ GİRİ ~~ İstatistiksel bir çalışma yaparken sırasıyla aşağıdaki adımlar izlenir: Verilerin(data) toplanması Analizlerin yapılması Analiz sonuçlarının yorumlanıp değerlendirilmesi Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 1

IKT-213 İSTATİSTİK 16.07.2012 KAVRAMLAR DATALARIN TOPLANMASI ÖRNEK:İnceleme altındaki popülasyonlardan alınan bir parçayı temsil eder. POPÜLASYON:İnceleme yapılan ve hakkında bilgi toplanmaya çalışılan birimlerin toplamıdır. İSTATİSTİK TÜRLERİ TARİFSEL(descriptive) İSTATİSTİK:Nümerik(sayısal) verileri düzenleyip özetlemek için kullanılan istatistik türüdür. Sayısal veriler üzerinden hareketle popülasyon için istatistiki sonuçlara ulaşılır. TÜMEVARIMSAL(inferential) İSTATİSTİK:Popülasyondan alınan örnekler incelenerek grubun tümü için istatistiksel sonuçlar elde edilir. Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 2

IKT-213 İSTATİSTİK 16.07.2012 KULLANILAN DEĞİŞKEN TÜRLERİ KANTİTATİF (quantitative) DEĞİŞKEN:Sayısal ölçeklerle ifade edilebilen ve miktar ile ilgili bilgileri veren değişkenlerdir. #öğrenci sayısı, hesaptaki bakiye,pilin ömrü,... 1-sürekli kantitatif değişken(boy uzunluğu,kargo ağırlığı,...) 2-süreksiz kantitatif değişken(çocuk sayısı,satılan ürün adedi,...)... KUALİTATİF (qualitative) DEĞİŞKEN:Nümerik olmayan görsel değişkenlerdir. rengi,doğum yeri,ırk,... #göz Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 3

IKT-213 İSTATİSTİK 16.07.2012 DATALARIN TOPLANMASI Datalar toplanmaya başlamadan önce; İncelenecek popülasyon iyi ve açık bir şekilde belirlenmeli Toplanacak örneklerin popülasyonun tamamını net bir şekilde temsil etmesinedikkat edilmeli (uygun örnekleme tekniği) Tüm popülasyon(sayım) yerine neden örneklem üzerinden inceleme yapıyoruz? Düşük maliyet Zaman tasarrufu Dikkatlice alınmış bir örneklem bazı durumlarda bir sayım'dan daha iyi sonuçlar verebilir. Bazı durumlarda sayım imkansız olabilir. Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 4

IKT-213 İSTATİSTİK 16.07.2012 ÖRNEKLEME PLANI ÖZELLİKLERİ: Yüksek kalite; toplanan verilerin doğruluk ve popülasyona uyumluluğu ile ilişkilidir. Savunabilirlik; örneklem planını açıklayıcı ve savunucu belgelerin mevcut olması Tekrarlanabilirlik; örnek planı kullanılarak gerekli verilere tekrar ulaşılabilmesi Temsil edici özelliği;incelenen popülasyonu tamamen yansıtması Faydalı olması;toplanan verilerin planın uygulanmasına uygun ve elverişli olması ÖRNEKLEME ŞEKİLLERİ Bir örnek; random(rastgele) sistematik karara dayalı(judgemental) Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 5

IKT-213 İSTATİSTİK 16.07.2012 ÖRNEKLEME HATASI Örneklerin daimi ortak özelliği tüm popülasyonu her yönüyle karışlayamamasıdır. Bu özellik örnekleme ile yapılan tahminlerin popülasyonun gerçek karakteri ile birebir uyuşmamasını sağlar. Buna göre örneklem hatası istatistiksel reel bir hata değil örneklerin birbirine göre doğal değişkenliklerinden kaynaklanan hataları temsil eder. DATA GRAFİKLEME TÜRLERİ Çalışmalarda kullanmak üzere toplanılan verilerin ve elde edilen sonuçların birbirleri ile daha rahat kıyaslanabilmeleri, analizlerin daha sistematik yapılabilmesi için bu bilgiler çeşitli grafikler üzerinde gösterilir. 1.Pasta diyagramlar 2.Bar grafikler 3.Kartezyen(x-y) grafikleri 4.Frekans dağılım grafikleri 5.Histogramlar Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 6

IKT-213 İSTATİSTİK 16.07.2012 1.PASTA DİYAGRAMLAR Oran veya yüzde kullanılarak kuantitatif (farklı) dataların sunulmasını sağlayan grafiklerdir. Örneğin; 2. BAR GRAFİKLERİ Faktör ya da verilerin sıralanmasıyla oluşturulan grafiklerdir.örneğin; -yatay bar grafiğiuçak cinayet trafik Sütun 1 alkol sigara 0 50 100 150 200 250 300 350 Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 7

IKT-213 İSTATİSTİK 16.07.2012... -düşey bar grafiğix ekseni:yaş grupları y ekseni:gelir dağılımı 60 50 40 30 erkek bayan 20 10 0 18-24 25-34 35-44 45-54 3. X-Y GRAFİKLERİ Eksenler veri özelliklerini göstermek üzere bu özelliklerin birbirlerinin değişiminden nasıl etkilediğini belirtirler.örneğin; x ekseni:yıllar y ekseni:ülkelerin dünya marketindeki yüzdeleri Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 8

IKT-213 İSTATİSTİK 16.07.2012 KAVRAMLAR VERİLERİN ORGANİZE EDİLİP SUNULMASI TASNİF:Özelliklere göre elde edilen grubun sınıflara ayrılması ile yapısal özelliğinin belirlenmesi işlemidir. Belirlenen özelliklere göre kümeler oluşturulur ve aynı kümeye ait özellik aynı sınıfta yer alır. Sınırlı veri sayısının olduğu durumlarda mevcut yapıyı net bir şekilde ortaya koyabilen bir işlemdir.... Örneğin; 100 kişilik bir grubu yaş dağılımlarına göre tasnif edersek: YAŞ FREKANS 18 21 19 25 20 30 21 18 22 6 TOPLAM:100 Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 9

IKT-213 İSTATİSTİK 16.07.2012 GRUPLAMA: Tasnif edilecek veri sayısının çok olduğu durumlarda başvurulan bir yöntemdir. Bu şekilde veri sayısı çok iken aynı vasfı taşıyan birbirine yakın özellikteki veriler aynı başlık altında toplanılarak gruplama yapılır. Örneğin; dünyadaki en büyük 29 şehir nüfuslarına göre bir frekans dağılımına(veya gruplamaya) tabi tutulabilir.... NÜFUS SINIFLARI ŞEHİR SAYISI (1000 KİŞİ) (FREKANS) 3000-4000'den az 6 4000-5000 3 5000-6000 4 6000-7000 4 7000-8000 4 8000-9000 4 9000 ve üzeri 4 TOPLAM:29 Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 10

IKT-213 İSTATİSTİK 16.07.2012 GRUPLAMAYA HATALI BİR ÖRNEK; Bir endüstri dalında faaliyet gösteren işletmelerde çalıştırılan işçi sayısına göre gruplamak istersek; ÇALIŞAN SAYISI FREKANS 1-2 315895 3-4 40588 5-9 9508 10-19 2348 20-49 721 50-59 44 100 ve üzeri 68 TOPLAM:369133 FREKANS DAĞILIMLARI VEYA BÖLÜNMELERİ(frequency distributions) KAVRAMLAR: SINIF ARALIĞI:Belirlenen sınıfın alt ve üst sınırları arasındaki farkı gösterir. SINIF SINIRLARI:O sınıfa ait maksimum (üst sınır) ve minimum (alt sınır) sınır değerleridir. SINIF ORTA NOKTASI veye NOKTASI:Sınıfın maksimum ve minimum sınır değerlerinin ortalamasıdır. Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 11

IKT-213 İSTATİSTİK 16.07.2012 O halde frekans bölünmeleri kavramını şöyle tanımlayabiliriz: Verilerin her bir sınıf aralığı içindeki gözlem sayısını(frekans) gösterecek şekilde gruplandırılması işlemidir. FREKANS DAĞILIMININ OLUŞTURULMASI Bir taşıtın yıl içerisindeki satış fiyatlarının düzenlenmemiş hali (HAM DATA) Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 12

IKT-213 İSTATİSTİK 16.07.2012 Sınıf Sayısının Belirlenmesi Genel olarak frekans dağılımları oluşturulurken kullanılacak sınıf sayısı 5 ile 15 arasında olmalıdır. Eldeki toplam veri sayısı kullanılarak gerekli sınıf sayısını belirlemek mümkündür. k:sınıf sayısı n:toplam veri sayısı eşitsizliği sağlanmalıdır.... Örnekte ham data olarak bize verilen tabloya göre n=80 veri bulunmaktadır. Yukarıda bize verilen eşitsizliği sağlayan minimum k değeri ise k=7 olarak tespit edilir. O halde; tavsiye edilen minimum sınıf sayısı k=7 Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 13

IKT-213 İSTATİSTİK 16.07.2012 Sınıf Aralığının Belirlenmesi Sınıf aralığı seçerken yuvarlak rakamlar kullanılmalı Birinci sınıfın alt limiti sınıf aralığının çift bir katı olmalı Sınıf aralıkları birbirleri ile örtüşmemeli Açık sınıf aralıklarından kaçınılmalı 33625-12546 = $2635 ~ $3000 8 Frekans Dağılım Tablosu ARABA SATIŞ FİYATI(bin $) FREKANS 12-15 8 15-18 23 18-21 17 21-24 18 24-27 8 27-30 4 30-33 1 33-36 1 TOPLAM:80 Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 14

IKT-213 İSTATİSTİK 16.07.2012 Frekans Dağılım Grafiği (Histogram) Frekans dağılım tablosundaki veriler yardımı ile aşağıdaki grafik oluşturulabilir. Frekans Dağılımlarının Oluşturulmasında Dikkat Edilecek Noktalar Mümkün olduğunca eşit sınıf aralıkları seçilmelidir. Çok sayıda boş sınıf oluşması vb. durumlarda eşit olmayan sınıf aralıklı frekans dağılımları oluşturulabilir. Eşit olmayan sınıf aralıkları grafik aşamasında bazı sorunlar doğurabilir. Uygun olarak seçilmemiş sınıf sayısına göre oluşturulmuş frekans dağılımları, verinin frekans dağılımı hakkında faydalı ve net bildiler sunmayabilir. Örneğin; ARAÇ SATIŞ FİYATI ARAÇ SAYISI (FREKANS) $12000-21000 48 $21000-30000 30 $30000-39000 2 TOPLAM=80 Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 15

IKT-213 İSTATİSTİK 16.07.2012... Bir önceki histogramda sınıf sayısı 8 iken bu histogramda 3 sınıf kullanılmıştır. Buna karşılık sınıf aralıkları genişlemiş ve araçlar daha yüzeysel bir gruplamaya tabi tutulmuştur. Nisbi Frekans Dağılımları(relative frequency distributions) Sınıfın nisbi frekansı:o sınıfın frekansının toplam frekansa oranı ile tanımlanabilir. Örneğin; $12000-15000 sınıfının nisbi frekansı 8/80=0.1 ya da yüzde olarak ifadesi ile %10 Genellikle sınıfın mutlak frekansından çok nisbi frekansını bilip buna göre işlem yapmak daha gerekli olmaktadır. Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 16

IKT-213 İSTATİSTİK 16.07.2012... Nisbi frekans dağılım grafiği; Kümülatif Frekans Dağılımları Farklı sınıf aralıklarında bulunan serilerin nisbi frekansları ile kıyaslanmalarını kolaylaştıran bir yöntemdir. Kümülatif frekans dağılımlarının en önemli özellikleri belirli bir düzeyin altında ve üstünde bulunan birimlerin frekansını gösterebilmeleridir. Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 17

IKT-213 İSTATİSTİK 16.07.2012 Kümülatif Frekans Dağılımlarının Oluşturulması: ÖRNEK:Bir sınıftaki öğrencilerin boy uzunluklarının frekans dağılımları aşağıda verilmiştir. BOY UZUNLUKLARI(CM) FREKANS 150-155 12 155-160 34 160-165 86 165-170 54 170-175 14 TOPLAM:200 KÜMÜLATİF FREKANS DAĞILIM TABLOSU -den az frekans -den çok frekans 155 12 150 200 160 46 155 188 165 132 160 154 170 186 165 68 175 200 170 14 Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 18

IKT-213 İSTATİSTİK 16.07.2012 -den çok ve -den az kümülatif grafiklerinin oluşturulması FREKANS POLİGONLARI Sınıf orta noktasının sınıf frekansına göre grafiklendiği yapılardır. Frekans dağılımlarının sınıf sayısı ve aralığı eşit olması koşulu ile iki veya daha fazla frekans dağılım grafiğinin kıyaslanması aşamasında oldukça avantajlıdırlar. Bu özellik frekans poligonlarına histogramlara göre avantaj kazandırır. Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 19

IKT-213 İSTATİSTİK 16.07.2012 Öğrencilerin boy uzunluklarını gösteren frekans poligonu;??? EldekiVERİ'yi BİLGİ'yedönüştürebilmek ve analizleri yapabilmek amacıyla ileri istatistik yöntemleri kullanılır. Verilerin kullanış tarzlarına göre çeşitli istatistiksel yöntemlerden bahsetmek mümkündür. Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 20

IKT-213 İSTATİSTİK 16.07.2012 İSTATİSTİKSEL YÖNTEMLER Betimleyici(descriptive) yöntemler **verili herhangi bir dağılım bir ya da daha fazla katsayılarla ifade edilebilir. #şirkette çalışan kişilerin yaş ortalaması maaşları arasındaki ilişki Açıklayıcı(explanatory) yöntemler **Bir veri setinde olması olası ilişkileri açıklar. #şirkette çalışan personelin ayakkabı numaraları ile... Bu istatistiksel yöntemler uygulanırken çeşitli hesaplamalar yapılır. Bu hesaplamalar sayesinde değişkenler ve veriler arasında kurulan ağ bize raporlama aşaması için faydalı bilgiler sunacaktır. Yöntemler sırasında (daha sonra ayrıntılı incelemek üzere) hesaplanması gereken bazı terimler şunlardır: Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 21

IKT-213 İSTATİSTİK 16.07.2012... Veriler için ortalama,medyan,mod Değişkenlere ait varyans ve standart sapmalar Değişkenlerin kovaryansı ve korelasyon Regresyon analizi veee amaç-sonuç... Eldeki dağılımı en iyi şekilde temsil eden veriler sayesinde görünenin ötesine gidip görünmeyeni de meydana çıkarmak Olası ilişkileri açıklayabilmek[y=f(x) formu için X ve Y nin birbirlerinin değişimlerinden ne kadar ve nasıl etkilendiklerini görebilmek] Eldeki hipotezleri test edebilmek Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 22

IKT-213 İSTATİSTİK 16.07.2012 KÜMELEME VE BİRLEŞTİRME ANALİZLERİ Eldeki olguların birbirleriyle bağını kullanarak yapılan birleştirme analizleri sayesinde Mevcut veri sayısı azaltılabilir Olası durum sayısı azaltılabilir Boyut sayısı azaltılabilir Birleştirme analizi ile hesap ve rapor aşamasında işlemler oldukça kolaylaşır 1-) FAKTÖR ANALİZİ=DEĞİŞKEN SAYISINI AZALTMAK Analizi yapılacak olan değişkenlerin hepsi daima birbirleriyle ilişki içerisindedirler. Birbiriyle diğerlerine göre daha kuvvetli bir ilişki içinde bulunan değişkenler birleştirilerek tek bir değişken gibi işlem görebilirler. Bu birleşim işlemi sırasında o değişkenler arasındaki korelasyon matrisleri hesaplanır. Bu matrisler sayesinde faktör ler oluşturularak değişken sayısı azaltılabilir. Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 23

IKT-213 İSTATİSTİK 16.07.2012 2-)CLUSTERING=CASE (OLAY) SAYISINI AZALTMAK Mevcut değişkenlerle yapılan analizlerdeki 'case'ler birbirlerine bir ya da daha fazla boyutta benzerlik gösterebilirler. Case'ler arasındaki benzerlikler metrik olarak tanımlanabilmelidir. Bu benzerlikleri kullanarak olaylar arasında clusters (bir araya getirme) yapılabilir. 3-) BOYUT SAYISINI AZALTMAK = MDS Analizde göz önünde tutuğumuz her değişken bir 'boyut' sayılabilir. Değişkenler arasındaki metrik uzaklıktan faydalanılarak bu boyut sayısı azaltılabilir. Fakat bu işlem sırasında iki veya üç boyuttan fazlasını visualize etmek kolay olmayacaktır. Prof.Dr. Argun KARACABEY Yrd.Doç.Dr. Fazıl GÖKGÖZ 24

KONU2 MERKEZİ EĞİLİM ÖLÇÜLERİ 1 MERKEZİ EĞİLİM ÖLÇÜLERİ ANALİTİK ORTALAMALAR Bir örneklemde mevcut olan tüm veriler hesaba katılır. ANALİTİK OLMAYAN MERKEZİ EĞİLİM ÖLÇÜLERİ Bir örneklemdeki verilerin bir kısmı dikkate alınır. Aritmetik ortalama **Medyan(median) Ağırlıklı ortalama Geometrik ortalama **Mod(mode) Harmonik ortalama 2 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 1

ANALİTİK ORTALAMALAR 3 1-)ARİTMETİK ORTALAMA(aritmetic mean) Ham datalar için aritmetik ortalama hesaplanırken tüm veri değerleri toplanır ve veri sayısına oranlanır. Elde edilen değer tüm dataların aritmetik ortalamasıdır. 4 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 2

Tekrarlanan Gözlemler için; Aynı formül ile aritmetik ortalama mümkün iken daha kısa işlem yapmak için aşağıdaki formülde kullanılabilir: 5 ÖZELLİKLER... Bir örneklimdeki datalar için aritmetik ortalama tekdir. Herbir veri değerinin aritmetik ortalamadan sapmaları(aralarındaki farklar) toplamları daima sıfırdır. 6 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 3

ÖRNEK: 5 kişilik bir gruptaki çocukların yaşları sırasıyla 5,8,3,7,4 olduğuna göre grubun yaş ortalamasını bulunuz. X = (5+8+3+7+4) / 5 =27 / 5 = 5,4 (5-5,4)+(8-5,4)+(3-5,4)+(7-5,4)+(4-5,4) = 0 20 kişilik bir sınıfta istatistik dersinden geçen öğrencilerin notu sırasıyla 5,5,5,5,5,6,6,6,7,7,8,8,8,9,9,9,10,10,10,10 ise bu sınıfın istatistik dersinin aritmetik not ortalaması nedir? X = [(5*5)+(3*6)+(2*7)+(3*8)+(3*9)+(4*10)] / 20=7,4 7 dezavantajları... Aritmetik ortalama veriler içindeki çok yüksek / çok düşük değerli verilerden oldukça kolay etkilenebilmektedir. Bu ise aritmetik ortalamanın o veri seti için merkezi eğilim ölçüsü olarak kullanılamamasını beraberinde getirmektedir. Açık sınıf aralıklı frekans dağılım tabloları için aritmetik ortalama hesabı yapılamamaktadır. 8 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 4

2-)AĞIRLIKLI ORTALAMA (weighted mean) Aritmetik ortalamaya benzer bir yaklaşımı ifade etmektedir. Fakat aritmetik ortalamada herbir verinin eşit öneme sahip olduğu düşüncesi var iken, ağırlıklı ortalamada herbir veri için kendi sahip olduğu öneme (verinin ağırlığı) göre işlem yapılır. 9 ÖRNEK: 1)Üniversitelerde ders geçme notları ve kredi karşılıkları ile ortalamaların hasaplanması 2)Sarar normal perakende satış fiyatı ($400) üzerinden 95 adet Kığılı marka gömlek satmıştır. Bahar indirimi sırasında aynı gömlekleri $200 dan 126 adet, yaz indiriminde ise $100 dan 76 adet satmıştır. Buna göre bu gömleklerin ağırlıklı ortalama fiyatını bulunuz. Sarar mağazası tanesi $200 dan bu gömlekleri aldığına göre satıştaki kazanç durumu ne olmuştur? 10 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 5

11 3-) GEOMETRİK ORTALAMA(geometric mean) Geometrik ortalama genel olarak Verilerin değişimleri yüzde, oransal, vb. şekillerde verildiği zaman değişim oranlarının hesaplanmasında Belirli bir süreçteki üretim/satış artış miktarının ortalamasını hesaplamada kullanılır. UYARI: Eğer veri değerlerinden herhangi biri sıfır veya negatif değer aldı ise geometrik ortalama yerine logaritmik geometrik ortalama hesaplanır.ayrıca veri sayısının çok fazla olduğu durumlarda da kullanılabilir. 12 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 6

... Geometrik ortalama; Logaritmik geometrik ortalama; 13... Süreç (periyot/aralık) söz konusu iken geometrik ortalama; Örneğin; belirli yıllar içerisinde nüfus değişmleri 14 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 7

!!! Geometrik ortalama veri setindeki çok büyük/küçük değerlerden artimetik ortalamaya göre daha az etkilenmekte ve bu sebeple daha tutarlı sonuçlar vermektedir. Geometrik Ortalama =< Aritmetik Ortalama 15 ÖRNEK: Bir inşaat şirketinin dört projedeki ortalama kar yüzdeleri 3,2,4,6 dır. Bu şirketin ortalama karı nedir? 16 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 8

4-)HARMONİK ORTALAMA(harmonic mean) Değişkenlerden biri sabit diğerleri değişken ise Hız, fiyat, verimlilik, vb oransal olarak belirtilebilen değişkenlerin ortalamalarının hesaplanmasında harmonik ortalama kullanılır. NOT:Sıfır değerli ya da farklı işaretli değişkenler mevcut olduğunda kullanılamaz. 17 ÖRNEK: İki kasaba arasındaki mesafe gidişte 75km/saat, dönüşte ise 50km/saat ise ortalama hız nedir? Kasabalar arasındaki mesafenin 150km olduğu varsayımı ile gidiş 150/75=2 saat, dönüş ise 150/50=3 saat sürmüştür. ( Mesafe sabit, süre ise değişken olduğundan harmonik ortalama kullanılmıştır.) 18 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 9

ANALİTİK OLMAYAN MERKEZİ EĞİLİM ÖLÇÜLERİ 19 A-)MEDYAN (ortanca) Veri setinde çok büyük/küçük değerli verilerin olduğu durumlarda aritmetik ortalamanın özelilkle raporlama aşaması için tutarlı olmayan sonuçlar verdiğini biliyoruz. Bu durumda medyan değeri bulunarak örneğin merkezi eğilimi ölçülebilir. 20 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 10

MEDYAN DEĞERİ BULUNURKEN; veri seti büyükten küçüğe (ya da küçükten büyüğe) sıralanır. Daha sonra setin tam ortasındaki değer medyan değeri olarak alınır. Eğer veri düzenlenmemiş formda ise n toplam veri sayısını göstermek üzere medyan değerinin yeri= (n+1)/2 21 ÖZELLİKLERİ... Aritmetik ortalamaya kıyasla daha tutarlı bir sonuç elde edilir. Açık sınıf aralıklı veri setlerinde merkezi eğilim ölçüsü olarak kullanılabilir. Her bir veri seti için bir tek medyan söz konusudur. 22 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 11

ÖRNEK: (1)VERİ SAYISI ÇİFT İSE:Bir klinikte pansuman için ödenen fiyatlar 65,29,30,25,32,35 ytl olarak verilmektedir. Medyan fiyatı bulunuz. 25 29 30 32 35 65 medyan=(30+32) / 2 =31ytl (2) VERİ SAYISI TEK İSE:Şenlik evlerindeki kira fiyatları 120,100,110,115,125 ytl ise ortalama kira fiyatı nedir? 100 110 115 120 125 Medyan değeri=115 ytl 23 B-) MOD Tüm veri değerlerini göz önünde bulundurmadığı için tutarlı olmayan bir merkezi eğilim ölçüsüdür. Bir veri setinde en çok olarak karşımıza çıkan değer mod değeri olarak alınır. Örneğin; 4,6,5,4,7,5.5,4,6.5,7,8,4,6,4,5,4,4 veri setinde yedi tane 4,iki tane 5,bir tane 5.5,iki tane 6,bir tane 6.5,iki tane 7 ve bir tane 8 değeri vardır. O halde MOD=4 24 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 12

GRUPLANMIŞ VERİLERDE ARİTMETİK ORTALAMA, MEDYAN, MOD Ham datanın yerini gruplanmış verilere bıraktığı durumlarda aritmetik ortalama, medyan ve mod frekans dağılım tabloları kullanılarak hesaplanabilir. Hesaplanan değerler ham veriler kullanılarak bulunan sonuçlardan faklılık gösterebilir. 25 ARİTMETİK ORTALAMANIN FREKANS DAĞILIMININ HESAPLANI I: 26 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 13

Örnek **: NET GELİR (MİLYON $) İTHALATÇI SAYISI 2-5 1 5-8 4 8-11 10 11-14 3 14-17 2 net gelirin aritmetik ortalamasını hasaplayınız. 27... 28 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 14

MEDYANIN FREKANS DAĞILIMI İLE HESAPLANMASI: L: medyan sınıfın alt sınırı N: toplam frekans değeri CF: medyan sınıfından önceki sınıfların frekans değerlerinin toplamı f: medyan sınıfının frekansı i: medyan sınıfının aralığı 29 Örnek **'daki veriler ile; 30 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 15

MODUN FREKANS DAĞILIMI KULLANILARAK HESAPLANMASI: Gruplanmış verilerde frekans sayısı en fazla olan sınıfın orta nokta değeri mod olarak alınır. BİMODAL DAĞILIM: Frekans dağılımında 2 sınıfın maximum frekansa sahip olduğu durumlardır. 31 Örnek: Bir ürünün satış fiyatına ait frekans dağılım tablosu aşağıda verilmiştir. Buna göre medyan ve mod değerlerini hesaplayınız. 40 frekans sayısı ile maksimum frekansa sahip sınıf 7-10 sınıfıdır. O halde bu sınıfın orta noktası mod= 8.5 32 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 16

Bir Frekans Dağılım Grafiğinde Aritmetik Ortalama, Medyan ve Modun Karşılaştırılması SİMETRİK FREKANS DAĞILIM GRAFİKLERİ: Simetrik dağılım gösteren frekanslarda orta noktadaki değer aritmetik ortalama, mod ve medyan değerini vermektedir. Yani bu şekildeki dağılımlarda her üç merkezi eğilim ölçüsü de kullanılabilir. 33... NEGATİF ASİMETRİLİ FREKANS DAĞILIMLARI: Bu şekildeki frekans dağılımları için arit. ort. < medyan < mod eşitsizliği söz konusudur. (grafik sağa yatık) 34 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 17

... POZİTİF ASİMETRİLİ FREKANS DAĞILIMLARI: Bu tarz eğriler için (sola yatık) mod < medyan < arit. ort. eşitsizliği söz konusudur. 35... NOT:Tek modlu ve asimetrisi çok fazla olmayan verilerde arit. ort. -mod = 3(arit. ort. -medyan) eşitliği kullanılabilir. 36 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 18

DAĞILMA YADA DEĞİ KENLİK ÖLÇÜLERİ (MEASURE OF DISPERSION) 1 AMAÇ... Mevcut veri seti için bulunan merkezi eğilim ölçüsünün yorumlamak Birden fazla veri seti için dağılımlar arası kıyaslama yapabilmek amaçlarıyla değişkenlik ölçüleri analizi yapılır. 2 1

ÇEŞİTLERİ... DEĞİŞKENLİK ÖLÇÜLERİ Değişkenlik Ortalama Varyans Standart aralığı sapma (variance) sapma (range) (mean deviation) (standart deviation) 3 a-) DEĞİŞKENLİK ARALIĞI (range) Bir veri setinde mevcut olan minimum ve maksimum değerler arasındaki fark olarak tanımlanabilir. O halde; değişkenlik aralıği(r) R=Maksimum değer Minimum değer 4 2

örneğin; GRUPLANMAMIŞ DATALAR İÇİN: Aşağıda iki veri serisi ve bunlar için hesaplanan değişkenlik aralığı verilmiştir. SERİ 1 SERİ 2 2 5 3 5 6 5 7 6 8 7 10 8 R=10-2=8 R=8-5=3 5 GRUPLANMI VERİLER İÇİN: Örnekte verilern frekans dağılım tablosunda değişkenlik aralığını belirleyelim. SAATLİK ÜCRET(ytl) FREKANS 5-10 10 10-15 21 15-20 9 20-25 5 R=25-5=20 6 3

b-) ORTALAMA ya da MUTLAK ORTALAMA SAPMA(mean deviation or mean absolute deviation) Bir popülasyon için tüm veri değerlerinin ortalamaları bulunur. Daha sonra her bir veri değeri için bu ortalamadan sapmaların mutlak değerleri toplanır ve data sayısına bölünür. Yani; her bir verinin ortalamadan sapmalarının mutlak değerinin aritmetik ortalamasıdır. N= veri sayısı 7 örneğin; GRUPLANMAMIŞ DATALAR İÇİN:15,16,18,21,25 data serisi için ortalama sapmayı hesaplayacak olursak; X=(15+16+18+21+25)/5=19 O.S=16/5=3.2 8 4

GRUPLANMI DATALAR İÇİN: Bu tip veriler için artık fx ağırlıklandırmasına göre ortalama hesaplanıp diğer işlemler yapılmalıdır. 9 c-) VARYANS (variance) Bir değişkenin aldığı değerlerin ortalamadan sapmasını (yani merkeze ne kadar yakın olduğunu) gösteren ölçü birimine varyansdenir. Yine bir aritmetik ortalama ile hesaplanır.!!! Varyans hiçbir zaman negatif olamaz. Bir örnek için varyans; 10 5

özellikleri... Herhangi bir a sabitinin varyans değeri daima sıfırdır. Bu nedenle bir serideki değerlere herhangi bir sabitin eklenmesi ya da çıkarılması serinin varyansını etkilemez. Yani a bir sabit olmak üzere; Herhangi bir c sabiti ile veri setindeki tüm değerleri çarparak elde edilen setin varyansı ilk setin varyansı ile sabitin karesi çarpımına eşittir. Yani c bir sabit olmak üzere; 11... Tek bir veri setinin varyansını yorumlayabilmek ortada bir kıyas söz konusu olmadığı için çok zordur. Bu sebeple ortalama sapma ve değişkenlik aralığı gibi varyans için de yorumlama en az 2 veri seti için yapılır. Bu setlerin değişkenlik dereceleri varyans analizi ile karşılaştırılır. 12 6

d-) STANDART SAPMA (standart deviation) Bir veri seti için varyans hesabı yapıldıktan sonra bunun karekökü alınarak o setin standart sapması bulunabilir. Varyans için geçerli özelliklerden yola çıkarak farklı standart sapma durumları incelenebilir. 13 örneğin; GRUPLANMAMIŞ DATALAR İÇİN:22,25,28,30 ve 35 veri seti için standart sapma ve varyans değerlerini hesaplayalım. 14 7

GRUPLANMI DATALAR İÇİN:Aşağıda frekans dağılım tablosu için ağırlıklandırmalardan faydalanarak varyans ve standart sapmayı belirleyelim. 15 STANDART SAPMA VE ARİTMETİK ORTALAMA İLİŞKİSİ Simetrik frekans dağılım grafikleri kullanılrak %68, %95, %99.7 olasılıklarına karşılık gelen bir analizi şu şekilde yaparız: 16 8

NİSBİ DAĞILMA (relative dispersion) DEĞİŞİM KATSAYISI(coeffient of variation): Bir veri setinde standart sapmanın veri setinin ortalamasına oranı olarak ifade edilebilir. Fakat değişim katsayısı % bir değişken olduğundan 100 ile ağırlıklandırılmalıdır. Faklı birimlere sahip veri setleri kıyaslanırken Aynı birimli fakat çok faklı ortalamalara sahip veri setleri kıyaslanırken kullanılır. 17 ÇARPIKLIK (skewness) Frekans dağılım grafikleri için söz konusu olan bir ifadedir. Veri setlerinde çarpıklık standart sapma, ortalama ve medyan kullanılarak hesaplanır. Genellikle -3 ve 3 aralığında bir değerdir. Simetrik grafikler için çarpıklık=0 bulunur. 18 9

Grafiklere Göre Çarpıklık Çeşitleri; Simetrik frekans dağılım grafiği için, Negatif asimetrili frekans dağılım grafiği için, Pozitif asimetrili frekans dağılım grafiği için, 19 10

OLASILIK (İHTİMAL) TEORİSİ 1 DENEY (experiment),sonuç (outcome), OLAY (event) DENEY:Bir aktivitenin gözlemlenmesi ve ölçüm yapma şekilleridir. SONUÇ:Deneylerin tamamlanması ile elde edilen verilerdir. OLAY:Deneyler ile elde edilen sonuçların toplamına olay denir. ÖRNEĞİN;bir zarın atılması deneyinde elde edilen sonuç1,2,3,4,5,6 ve çift sayı gelmesi ya da 4'den büyük sayı gelmesi vb. ise olay olarak gösterilebilir. 2 1

OLASILIK (probability) KAVRAMI Bir olayın gerçekleşme ihtimali veya şansının ölçülmesine olasılık denir.herhangi bir E olayı için bu olayın olması olasılığı( elverişli hal) P(E) ile, gerçekleşmeme olasılığı (elverişsiz hal) ise P(~E)=1-P(E) ile gösterilir. Olasılık daima 0 ile 1 arasında olmalıdır. Yani; 0 P(a) 1 herzaman sağlanır. 3 Olasılık Çeşitleri... Objektif olasılık Subjektif olasılık (tekrarlanabilen rasgele (tekrarı mümkün deneyler) olmayan deneyler) # zar atılması,rus ruletinin #geçmiş verilere göre döndürümesi yarın kar yağma ihtimali 1-Klasik olasılık 2-Nisbi frekans 4 2

KLASİK OLASILIK Bir E olayında mümkün olan tüm halleri n ile ve E olayı için ortaya çıkabilecek halleri de a ile gösterirsek E olayının mevcut durumda olması ihtimali 5 örneğin; Bir paranın üç kez atılması deneyinde bir kez tura gelmesi,en az iki yazı gelmesi ve hiç tura gelmemesi olasılıklarını bulalım: Deneyimiz için tüm olabilecek haller,{yyy,yyt,yty,tyy,ytt,tyt,tty,ttt} olduğundan n=8 dir. 1)Bir kez tura gelebilecek haller {YYT,YTY,TYY} olduğundan a=3dür. O halde P(E)=3/8 2)Enaz iki yazı gelebilecek haller {YYT,YTY,TYY,YYY} olduğundan a=4dür. O halde P(E)=4/8=0.5 3)Hiç tura gelmiyecek haller {YYY} olduğundan a=1dir. O halde P(E)=1/8 6 3

... Bir olay için elverişli durumlar a elverişsiz durumlar b ile gösterilirse n=a+b yazılabilir. Elverişsiz halin ortaya çıkması olasılığı ise örneğin; yukarıdaki deneymiz için üç kez yazı gelmemesi olasılığı P(~E)=1- P(E)=1-1/8=7/8 dir. 7 NİSBİ FREKANS OLARAK OLASILIK Nisbi frekanslar için bir olayın meydana gelme olasılığı geçmişte benzer olayın tekrarlanma sayısının toplam gözlem sayısına oranlanması şeklinde bulunabilir. örneğin; bir paranın ard arda 250 kez atılması deneyi için yazı gelme olaylarının nisbi frekansını bulalım: 8 4

OLASILIK HASAPLAMALARI İÇİN TEMEL KURALLAR OLASILIKLARIN TOPLANMASI: Eğer bileşik bir olayın ortaya çıkma olasılığını arıyorsak bu olayların ayrı ayrı gerçekleşme olasılığını bulup toplarız. Fakat!!!!buradaki olayların aynı anda gerçekleşmesi mümkün değildir. Yani olayın birinin olması diğerinin olmasını engellemektedir. P(AB)=0 Örneğin A veya B olayının meydana gelmesi olasılığı P(A veya B)=P(A)+P(B) 9 örneğin; İki zarın aynı anda bir kez atılması deneyinde zarların üzerindeki rakamların toplamının 7 ya da 10 olması olasılığını bulunuz? İki zar aynı anda atıldığında olabilecek tüm haller {(1-1),(1-2),...,(6-5),(6-6)} olduğundan n=36dır. Gelen sayıların toplamının 7 olması durumu {(1-6),(6-1),(2-5),(5-2),(3-4),(4-3)} olduğundan a=6 ve toplamın 10 olması durumu {(4-6),(6-4),(5-5)} olduğundan a*=3 dür. O halde P( top. 7 veya 10)=6/36+3/36=0.25 10 5

... Eğer bir deney için A,B ve C olaylarının olması birbirlerini engellemiyorlar ise bu A ve B olaylarının olasılığı P(AB)=hem A hem de B olayının aynı anda olması olasılığı olmak üzere P(A ve B)=P(A)+P(B)-P(AB) A veya B veya C olayının olması olasılığı P(A veya B veya C)=P(A)+P(B)+P(C)-P(AB)- P(AC)-P(BC)+P(ABC) 11 örneğin; 52 kartlık bir desteden rasgele bir kart çekildiğinde bu kartın ** birli ve karo olması olasılığı ** birli veya karo olması olasılığı A=birli olması olasılığı B= karo olması olasılığı *** P(AB)=1/52 *** P(A veya B)=4/52+13/52-1/52=4/13 12 6

örneğin; 200 turist ile yapılan anket sonucunda 120 kişinin Ayasofya'yı,100 kişinin Efes'i, 60 kişinin ise her iki yeri de ziyaret ettiği anlaşılmıştır. Buna göre seçilen bir turistin Ayasofya veya Efes'i ziyaret etme olasılığ nedir? P(A veya E)=P(A)+P(E)-P(AE) =120/200+100/200-60/200=0.8 13 KÜME TEORİSİ VE OLASILIK TOPLANMASI J. Venn yaptığı bir deneyin sonuçlarını daha rahat grafikleyebilmek amacıyla çeşitli geometrik şekiller kullanarak bu sonuçları diyagram haline getirdi. Bu diyagramlara venn diyagramları denmektedir. Buna göre A,B,C birbirini engelleyen olaylar ise A B C A ~A P(A)+P(B)+P(C)=1 P(A)+P(~A)=1 14 7

... A B ~(A veya B) P(A veya B)=P(A)+P(B) P(A veya B)=P(A)+P(B)-P(AB) 15 OLASILIKLARIN ÇARPILMASI: Eğer bir A olayının olması B olayının olmasına bağlı ise, yani A olayı Bolayından sonra gerçekleşiyor ise buna koşullu olasılık (conditional probabilility) denir. Bir A olayının koşullu olasılığı P(A\B) ile gösterilir. Bu ifade bize B olayı gerçekleştiği taktirde A olayının olması olasılığını verir. P(A\B)=P(AB) / P(B) Eğer A ve B olayları birbirine bağlı ise hem A hem de B olayının aynı anda olması olasılığı P(AB)=P(A)P(B\A) ya da P(AB)=P(B)P(A\B) 16 8

örneğin; Bir kutuda 3 tanesi bozuk olmak üzere toplam 10 tane film vardır. Bu kutudan sırasıyla birer tane olmak üzere toplam 2 film çekersek bu iki filminde bozuk olması olasılığı nedir? A: birinci filmin bozuk çıkması olayı B: ikinci filmin bozuk çıkması olayı P(A ve B)=P(A)P(B\A) =(3/10)(2/9)=1/15=0.0667 17 Eğer A ve B olaylarından birinin olması diğerini etkilemiyor yani bu olaylar bağımsız ise ikisinin de aynı anda ortaya çıkması olasılığı P(AB)=P(A)P(B) ÖRNEĞİN; bir paranın ard arda iki kez atılması deneyini inceliyelim. A=ilk atışta tura gelmesi olayı ve B=ikinci atışta tura gelmesi olasılığı olmak üzere A ve B olayları bağımsız olaylar mıdır? Yani P(AB)=P(A)P(B) sağlanır mı? Tüm durum {TT,TY,YT,YY} ve A={TT,TY} ve B={TT,YT} olduğundan P(AB)=1/4, P(A)=2/4, P(B)=2/4 olup buradan eşitlik sağlandığı için A ve B nin bağımsız olduklarını söyleyebiliriz. 18 9

BAYES KURALI Bir olayın oluşmasında birden fazla bağımsız neden etkili ise bu nedenlerden herhangi birinin o olayı oluşturmuş olması ihtimalini bulmaya yarayan bir tekniktir. En genel haliyle şu şekilde ifade edilebilir: 19 ÖDEV :) :) :) Birbirlerine bağlı olan A,B ve C olaylarının aynı anda olması olasılığını nasıl hesaplayacağımızı gösteriniz. 20 10

SÜREKSİZ (DISCRETE) OLASILIK DAĞILIMLARI 1 RANDOM DEĞİŞKEN Nümerik olarak ifade edilebilen bir deneyin sonuçlarına rassal (random) değişken denir. Temelde iki çeşit random değişken vardır. ##süreksiz(discrete) rassal değişken ##sürekli(continuous) rassal değişken 1-)SÜREKLİ RANDOM DEĞİŞKEN:Belirli bir aralıktaki her değer random değişken için geçerli olabilir. Örneğin; x random değişkeni(3,7.5) aralığındaki her değeri alabiliyorsa x sürekli random değişkendir. 2 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 1

2-)SÜREKSİZ RANDOM DEĞİ KEN:Değişken için belirli bir aralıkta sayılabilen belli bir kaç değer söz konusudur.örneğin; Bir parayı 5 kez attığımızda tura gelme sayısı x random değişkeni olsun. Bu durumda x in alabileceği değerler x=0,1,2,3,4,5 olabilir. Yani tura hiç gelmeyebilir (x=0),...,5 atışta da tura gelebilir (x=5) 5 dakikada petrol istasyonuna gelen araç sayısı 200 müşteriden 30 yaş üzeri olanların sayısı Bir haftada yapılan satış sayısı 3 SÜREKSİZ RANDOM DEĞİŞKENLERİN OLASILIK DAĞILIMLARI Bir deney için olabilecek tüm sonuçlar ile bunların gerçekleşme olasılıklarını bir arada gösteren 'diyagramlara' olasılık dağılımlarıdenir. Örneğin; iki parayı aynı anda attığımız deney için olabilecek tüm sonuçlar {TT,TY,YT,YY} olmak üzere X random değişkeni yazı gelme sayını göstersin. Bu durumda P(X=0)=1/4,P(X=1)=2/4,P(X=2)=1/4 olur. 4 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 2

... Buradaki deneyin sonuçları birbirlerini engellemelidir. Deneyin herbir sonucu için bulunacak olasılıkların toplamı daima 1 dir. Yani, 5 SÜREKSİZ OLASILIK DAĞILIMLARININ ORTALAMASI VE VARYANSI Bir X random değişkeni için ortalama (beklenen değer) μ=e(x) ile ve varyansı ise σ 2 =var(x) ile gösterilir. Mümkün olan herdurum X=x i olmak üzere Yukarıdaki para örneğimiz için hesap yapacak olursak, μ=e(x)=0 x ¼ + 1 x 2/4 + 2 x ¼ = 1 σ 2 =var(x)=(0-1) 2 1/4+(1-1) 2 2/4+(2-1) 2 2/4=0.5 6 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 3

SÜREKSİZ OLASILIK DAĞILIM MODELLERİ BİNOM HİPERGEOMETRİK POISSON 7 1-)BİNOM OLASILIK DAĞILIMLARI Benzer bir deneyin n kez tekrarlanması sonucu oluşan dağılımlardır. Bu n deneyde kesin olarak x kez elverişli olay meydana gelmektedir. n tane deneyin herbirinin sonucu diğerleriyle bağımsızdır. Yani sonuçlar birbirini etkilemez. Ayrıca deneyin her bir sonucu ya başarılı (elverişli-success) hal ya da başarısız(elverişsizfailure) hal olabilir. ÖRNEĞİN; bir paranın 4 kez atılması,bir bakkaldan 10 tane mum alınması, vb. 8 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 4

... p:her bir deneydeki başarı olasılığı q:her bir deneydeki başarısızlık olasılığı=1-p x:toplam deneydeki başarılı hal sayısı n:tekrarlanan deney sayısı olmak üzere n. deney sonunda başarılı olma olasılığı P(x); her x değeri için beklenen değer ve varyans; μ=e(x)=np σ 2 =E[(x-μ) 2 ]=np(1-p) 9 örneğin; 1. 5 kez tekrarlanan ve başarılı olma olasılığı 0.1 olan bir deney için; n=5 p=0.1 μ=e(x)=5 x 0.1=0.5 n=5 ve p=0.5 olan bir deney için; σ 2 =5 x 0.5 x (1-0.5)=1.244924 o halde σ=1.118 10 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 5

örneğin; Öğrencilerin konu ile bilgisinin olmadığı 4 tane doğru-yanlış sorusu için 0,1 doğru cevap bulma olasılığı nedir? 11 ÖDEV :) Bir çift zarın 4 kez atılması deneyinde x zarların üzerindeki sayıların toplamının 7 olmasını gösterdiğine göre x için beklenen değer ve standart sapmayı hesaplayınız. 12 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 6

2-)HİPERGEOMETRİK OLASILIK DAĞILIMLARI Binom dağılımları ile oldukça benzerlik gösteren hipergeometrik dağılımın farklı yanı deney sonuçlarının bağımsız olmaması ve birbirlerinin olma olasılıklarını etkilemesidir. Elverişli halin gerçekleşme olasılığı deneyden deneye fark gösterdiğinde binom yerine hipergeometrik dağılım kullanılır. Eğer bir popülasyondan örnek seçimi yerine koymadan yapılıyor ise ve örnek sayısı popülasyonun %5 ini geçmiş ise hipergeometrik dağılım kullanılır. Eğer yerine koyma yoksa ve %5 den az bir örnek var ise binom kullanılabilir. 13... N= popülasyon büyüklüğü s= popülasyondaki elverişli hal sayısı x= örnekle ilgili elverişli hal sayısı n= örnek ya da deney sayısı C= kombinasyon sembolü OLASILIK; ORTALAMA VE VARYANS; 14 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 7

örneğin; 50 adet cep telefonunun 40 tanesi kusursuz çalışır iken 10 taneden en az biri bozuktur. Çekilen örnekler geri yerine koyulmadan 5 rasgele örnek çekilirse bunlardan 4'ünün sağlam olması olasılığı nedir? N=50 s=40 x=4 n=5 olmak üzere; 15 ÖDEV :) Bir kutuda 3 kusurlu 7 kusursuz parça vardır. Yerine koymaksızın 3 parça bu kutudan çekiliyor. Buna göre 2 kusurlu parça çekme olasılığını, ortalamayı ve varyansı bulunuz. 16 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 8

3-)POISSON OLASILIK DAĞILIMLARI Farklı zaman aralıkları ve bu aralıklarda oluşan bağımsız elverişli haller söz konusudur. Bir zaman aralığı için başarılı olma olasılığı o zaman aralığı ile orantılıdır. Ölçüm aralığı içinde farklı noktalarda olaylar gerçekleşir. Yukarıdaki haller mevcut olduğunda poisson dağılımı kullanılır.bu dağılım sayesinde belli bir aralıkta bir olayın kaç kez meydana geldiğini bulabiliriz. 17...!!! Poisson dağılımı ortalaması ve varyansı eşit olan tek dağılımdır. Örneğin içinde geçebilecek ortalama kelimesi poisson dağılımı için bir ipucu oluşturur. ÖRNEĞİN; İç Anadolu Bölgesinde aylık çalınan araba sayısı,öğrenci işlerinden bir günde alınan transkript sayısı,acil servise saatte gelen hasta sayısı, vb. μ=ortalama elverişli hal sayısı e=2.7183 (sabit) x=belli aralıktaki elverişli hal sayısı(0,1,2,...) 18 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 9

... Poisson dağılımında herhangi bir μ değerinin dağılımı pozitif çarpıklığa sahiptir. Μ değeri arttıkça poisson dağılımı normal dağılıma yaklaşır. Poisson olasılık dağılımlarını grafiklersek; µ=2 µ=7 19 örneğin; Türkpetroleher 15 dakikadabirortalama3 araçgelmektedir. Gelecek15 dakikaiçinde2 aracın gelmesi olasılığını hesaplayın. X=2 μ=3 Eğer elverişli hal olasılığı np<5 ve deney sayısı n>100 ise poisson dağılımı binom dağılımı yerine uygulanabilir. 20 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 10

... Poisson olasılık dağılımları genel olarak, diyagram olarak, 21 ÖDEV :) 200 sayfalık bir kitaba 200 eksik basım rasgele dağıtılıyor. Bir sayfada en az 2 rksik basım bulunması olasılığı nedir? Saat 09:00 dan 09:05 e kadar bir operatörün aldığı telefon konuşmalarının sayısı ortalama olarak 2 dir. a)operatörün aldığı telefonların sayısının olasılığını,ortalamasını ve varyansını bulun. b)bir sonraki gün operatörün aynı zaman diliminde telefon konuşması almaması ve 2 telefon konuşması alması olasılıklarını hesaplayın. 22 Yrd. Doç. Dr. Fazıl GÖKGÖZ -İstatistik 11

SÜREKLİ( CONTINUOUS) OLASILIK DAĞILIMLARI

Sürekli bir random değişken (a,b) aralığındaki her değeri alabiliyorsa bu değişkene ait olasılık dağılım fonksiyonunun grafiğinde eğri altında kalan alan bize bu x değişkeninin olasılığını verir. Eğri altında kalan alandan bahsettiğimiz için x değişkeninin olasılığı P(x) integral yardımıyla bulunur. f(x): x değişkeni için olasılık dağılım fonksiyonu(f(x) 0) (a,b): x 'in değişkenlik aralığı olmak üzere Ayrıca olasılık daima max. 1 değeri alabileceği için ;

SÜREKLİ DEĞİŞKENLER İÇİN ORTALAMA ve VARYANS Sürekli random değişkenin ortalaması( beklenen değeri) E(x) olmak üzere Sürekli random değişken için varyans var(x) olmak üzere

...!!!Sürekli değişkenler bir aralıkta kesin olarak belli değerler alamadığı için x=a,x=b,vs. şeklinde değişimler yerine x<a, x>a, a x b, vs. şeklinde aralıklardan söz edilebilir.

Sürekli olasılık dağılımları 3'e ayrılır: 1)Uniform olasılık dağılımı 2)Üstelolasılık dağılımı 3)Normal olasılık dağılımı ***Standart normal dağılım

1) UNIFORM OLASILIK DAĞILIMLARI X Random değişkeninin değişkenlik aralığı (a,b) olsun. Yani a=x'in alabileceği min. değer ve b= X'in alabileceği max. değer olsun. Eğer (a,b) aralığı ile X'in olasılığı orantılı ise bu değişken uniform dağılıma sahiptir. a X b olmak üzere X'in olasılık fonksiyonu f(x)=1 / (b-a) X'in ortalaması E(X)= (a+b) / 2 X'in varyansı var(x)= (b-a) 2 / 12

örneğin; X sürekli rassal değişken, 1<x<4 ve f(x)=0.2 iken P(1<x<4) olasılığı P(1<x<4)=3.0,2=0,6 (taralı alan)

2) NORMAL OLASILIK DAĞILIMLARI Normal olasılık dağılımı [f(x)] çan şeklinde simetrik bir grafiğe sahip bir dağılımdır. Günlük hayatta, endüstride en çok normal dağılım ile karşı karşıya kalınır. Normal dağılım için ortalama(beklenen değer=e(x)) değeri μ ile gösterilir. Normal dağılım grafiği her zaman için μ değerine göre simetriktir. Hesaplamalar bu değer üzerinden yapılır.μ diyagramdaki en büyük değerdir.

... X sürekli random değişkeni normal dağılım altında reel eksendeki tüm değerleri alabilir. Yani; - <x<+ aralığı değişkenlik aralığıdır. f(x) eğrisi altında kalan alan daima 1'dir. Normal dağılım için μ=aritmetik ortalama=mod=medyan Standart sapmayı gösteren σ çan grafiği için genişlik(yayılma miktarı) göstergesidir.

µ=arit. ort. σ=standart sapma л=3,14159 e=2,71828 olmak üzere olasılık dağılım fonk. x~n(µ,σ 2 ) gösterimine göre x ortalaması µ ve varyansı σ 2 olan normal dağılıma sahiptir. σ

O halde; **μ-σ<x<μ+σ aralığı tüm dağılımın%68ini **μ-2σ<x<μ+2σ aralığı tüm dağılımın %95ini **μ-3σ<x<μ+3σ aralığı tüm dağılımın %99.7sini temsil etmektedir.

... Normal dağılımlarda olasılıklar eşitsizlikler yardımıyla integrale dönüştürülerek hesaplanır: yani,

STANDART NORMAL DAĞILIM Normal dağılımda olasılık hesaplamaları yapabilmek için değişkenin standartlaştırılması yani standart normal dağılımdan faydalanılması gerekmektedir. Normal dağılım için aritmetik ortalama μ=0 ve varyans σ 2 =1 alınıp diğer tüm şartlar aynı kaldığında oluşan dağılıma standart normal dağılımdenir.

... Standart normal dağılımın değişkeni olanz standart normal değişkenibüyük önem teşkil etmektedir. Normal dağılım hesaplarındaki x rastgele değişkenimuhakkak aşağıdaki şekilde z değişkenine dönüştürüldükten sonra işlemler yapılmalıdır. z=(x-μ)/σ

Standart normal dağılım grafiği μ=0 a göre simetriktir ve eğri yatay eksene asimptotik olarak gider. Eğri altındaki tüm alan 1 olduğundan o noktasının sağ ve solunda kalan alanlar 0,5 lik parçalar halindedir. Z rasgele değişkeninin olasılık yoğunluk fonksiyonu grafiği;

X rasgele değişkeni z standart normal değişkenine dönüştürüldükten sonra z tablosu kullanılarak aranılan olasılık değeri kolaylıkla bulunabilir. Standart z tablosunun kullanımını şöyle özetleyebilriz: Tablodaki yatay bölüm z değeri için (yüzdebirler basamağını~~?,?*) virgülden sonraki ikinci basamağı, dikey bölüm ise tam kısım ve birinci ondalık kısmı (ondabirler basamağı~~*,*?) gösterir. Eldeki veriye göre ilgili satır ve sütunun kesiştiği yer aranan değerdir.

!!! Z tablosu için aranan değer her zaman ilgili satır ve sütunun kesiştiği yer olmayabilir. Bu durum z değeri için geçerli olan eşitsizliğin durumuna göre belirlenir. Tablodaki bulunan değer her zaman 0 ile mevcut z değeri arasında kalan alanı verir. ** a 0 olmak üzere P(z<a)= 0,5+tablo değeri P(z a)=0,5+ tablo değeri P(z>a)=1-P(z<a) P(z a)=1-p(z a)

... **a<0 olmak üzere P(z<a)=P(z>-a)=1-P(z<-a) P(z a)=p(z -a)=1-p(z<-a) P(z>a)=P(z<-a)=0,5+(-a)ya göre tablo değeri P(z a)=p(z -a)=0,5+(-a)ya göre tablo değeri

STANDART NORMAL DAĞILIM (Z) TABLOSU

örneğin; P(z<0.83)=0.2967

ÖRNEKLER: 1)P(z<1.45)=0,5+0,4265=0,9265 2)P(z>1.45)=1-P(z<1.45)=0.0735 3)P(-1.26<z<0)=P(0<z<1.26)=0.3962 2 1 3

4) P(z<-0.98)=P(z>0.98)=1-P(z<0.98)=0.1635 5)P(-2.3<z<1.8)=P(-2.3<z<0)+P(0<z<1.8) =0.9534 6)P(-1.4<z<-0.5)=P(0<z<1.4)-P(0<z<0.5) =0.2277 5 4 6

Yukarıdaki örneklerin hepsinde z değerinden yola çıkarak olasılık hesapları yaptık. Fakat bazen bu işlemleri tersden yapmamız gerekebilir. Yani olasılık değerleri(eğri altındaki alan) bilinip z değerini hatta çoğu zaman x=zσ+μ eşitliğinden x değerini bulmamız gerekebilir. Böyle bir durumda olasılık değeri tablodan bulunup karşı gelen satır ve sütun birleştirilir ve z değerine ulaşılır.

soru: Bir dolum makinası ortalama olarak 32ml suyu 0.02ml standart sapmayla su dolum işlemini gerçekleştirmektedir. Dolum miktarı normal dağılım sergiliyor ise rasgele seçilen bir şişenin 32 ile 32.025ml arasında su içerme olasılığı nedir? μ=32ml ve σ=0.02ml olmak üzere P(32<x<32.025)=?

ÇÖZÜM: z=(x-μ)/σ eşitliğinden x=32 için z=0 ve x=32.025 için z=1.25 bulunur. O halde, P(32<x<32.025)=P(0<z<1.25) =P(z<1.25)-P(z<0) =[0.5+0.3944]-0.5=0.3944

Rasgele seçilen bir şişenin 31.97ml fazla su içerme olasılığı nedir? P(x>31.97)=? z=(x-μ)/σ eşitliğinden x=31.97 için z=-1.5 bulunur. O halde, P(x>31.97)=P(z>-1.5)=P(z<1.5)=0.5+0.4332 =0.9332

3)EXPONENT (ÜSTEL) OLASILIK DAĞILIMI Uniform dağılıma benzer özellik gösterirler. μ=aritmetik ortalama (beklenen değer) f(x)= olasılık yoğunluk fonksiyonu μ>0 ve x 0 e=2.71828 olmak üzere Ayrıca (min a=0 olabilir)

soru: Bir polis radarı akşam trafiğinde araçların hızlarını denetlemektedir. Araçlar 62km/sa aritmetik ortalamalı normal dağılım sergilemektedirler. Araçların %3ü 72km/sa üzerinde hareket ediyorsa tüm araçlar için standart sapmayı hesaplayınız. P(x>72)=0.03 ve μ=62ise σ=? P[(x-62)/σ > (72-62)/σ]=P(z>10/σ) =1-P(z<10/σ)=0.03 P(z<10/σ)=0.97 o halde tablodan bakılırsa 0.47 ye karşılık gelen z=1.88 dir. Yani 10/σ=1.88 den σ=5.32 bulunur.

ÖDEV :) X rastgele değişkeni (0,1) aralığında düzgün olarak dağılmaktadır. P(x 0,4)=0,4 ve y=x+1 olmak üzere P(y k)=0,6 ise k değerini bulunuz.

ÖDEV :) Bir populasyondaki kişilerin ağırlıklarının ortalaması 60kg. Varyansı 25kg 2 olan normal dağılıma sahip olduğu varsayılıyor. Populasyondan rasgele bir kişi seçildiğinde; a)50kg'dan hafif b)55-60kg arasında c)65kg'dan daha ağır olması olasılıkları nedir? d)rasgele 300 öğrenci alındığında ağırlıkları aşağıdaki aralıklarda olan kaç kişi vardır? i)50kg'dan az ii)50-55kg arası iii)55-65kg arası iv)65kg'dan fazla

ÖDEV :) Bir standart normal dağılımda aşağıdaki koşulları sağlayan k değerlerini bulunuz.

ÖDEV :) Radyoaktif bir cisim tarafından yayınlanan ardışık iki parçacığın yayın anları arasında geçen süre μ=100 parametreli üstel dağılımdır. Ardışık iki yayın arasında geçen sürenin; a) Bir saniyeden az b) 3 ile 4 saniye arasında c) 4 saniyeden fazla olması olasılıkları nedir? d) Ardışık iki yayın arasında geçen sürenin en fazla t kadar olması olasılığı ½ ise t=?

ÖRNEKLEME TEORİSİ 1

Bir popülasyonu istatistiksel açıdan incelemek ve işlemler yapabilmek için popülasyon içerisinden seçilen örneklemlerden yararlandığımızı söylemiştik. Peki popülasyonun istatistiksel parametrelerini örneklemlerle belirlemenin nedenleri neler olabilir? 2

cevap. Popülasyonu tümü üzerinde çoğu zaman işlem yapmanın imkansız ve/veya oldukça maliyetli olması Örneklem ile çalışmanın vakit ve maliyet açısından tasarruflu olması İyi seçilmiş bir örneklemin popülasyonu en iyi şekilde temsil edebilmesi 3

#Örnekleme Çeşitleri# ÖRNEKLEME Rasgele Karara dayalı(iradi) *basit *sistematik *cluster 4

1. RASGELE ÖRNEKLEME : *Basit Rasgele Örnekleme:popülasyondaki her bir üyenin seçilme olasılığı birbirine eşittir. *Sistematik Rasgele Örnekleme:rasgele belirlenen başlangıç noktasından itibaren her n. üye örneklem içerisine dahil edilir. *Cluster Örnekleme:gruplara ayrılan popülasyondan rasgele örneklem ayarlanır. 2. KARARA DAYALI (iradi) ÖRNEKLEME:örneklemeyi yapan kişi kendi isteğine göre üye seçimi yapar. Bu tip örneklem popülasyonu iyi yansıtmayacağı için hata payı büyüktür. 5

ÖRNEKLEME HATASI Popülasyonun gerçek parametresi ile örnekleme istatistiği arasındaki farka örnekleme hatasıdenir. Ortalamadaki standart hata olarak da bilinir. Buna göre; s:örneklemedeki gözlemlerin standart sapması n:örneklemedeki gözlem sayısı Bir örneklemede tahmin edilen ortalamadaki standart hata σ = && x & s n 6

MERKEZİ LİMİT TEOREMİ:Dağılım ne olursa olsun ve dağılımın bilinmediği durumlarda da örneklem hacmi (n) yeteri kadar büyük olduğunda örneklemi normal dağılıma çevirebilen bir teoremdir. Buna göre; Popülasyon normal dağılıma sahip ise örneklemlerin aritmetik ortalamaları da normal dağılım gösterir. Popülasyon normal dağılıma sahip değil iken örneklemlerin aritmetik ortalamaları normale yaklaşan bir dağılım sergiler. Örnek sayısı arttıkça normale daha çok yakınsanır. 7

Popülasyon parametreleri iki şekilde tahmin edilebilir: NOKTA TAHMİNİ(point estimate):tek bir değer kullanılarak parametre tahmin edilir. ARALIK TAHMİNİ(envertal tahmin~invertal estimate):popülasyon parametresi için bir aralık tespiti yapılır. Bu aralık tespiti yapılırken popülasyon için yapılan bir hesaplama ile güven aralığı bulunur. 8

GÜVEN ARALIĞI; n:gözlem sayısı s:örneklemenin standart sapması z:standart değer x z s, n x + z s n 9

n 30 için; %95 güven aralığında z=1,96 %99 güven aralığında z=2,58 alınır. 1,96 ve 2,58 değerleri gözlemlerin sırasıyla %95 ve %99 una karşılık gelen standard değerlerdir. Bu güven aralıklarına karşılık gelen değerler standart normal dağılım tablolarından hesaplanır. Örneğin yarım normal dağılıma göre 0,95/2 =0,475. Bu değere karşılık gelen standart değer normal dağılım tablosundan 1,96 olarak kolaylıkla okunabilir. 10

Bir örneklemede popülasyonun ortalaması için gerekli olan gözlem sayısı yani n; E:izin verilebilir max. hata oranı z:seçilen güven aralığı s:verilerin standart sapması zs n = E 2 11

!!! Eğer örneklemedeki veri sayısı(n) popülasyonun (N)%5inden büyük ise hem popülasyon ortalaması hem de standart hataya bir düzeltm katsayısı uygulanmalıdır. Bu katsayı (N-n) / (N-1) 12

O halde; n/n>0.05 iken popülasyon ortalamasının standart hatası: Ortalamanın güven aralığı: 13

Bu durumda (n/n>0.05 iken) düzeltme katsayısı standart hatayı azalttığı için popülasyon ortalamasının aralığı daralır. Yani örneklem sayısı arttıkça ortalamanın standart hatası azalır. 14

HİPOTEZ TESTLERİ 1 HİPOTEZ NEDİR? Örnekleme ile test edilmeye çalışılan bir popülasyonun ilgili parametresi hakkında ortaya sunulan iddiadır. Örneğin; A dersi için vize ortalaması 50 nin altındadır Firestone ve Lassa firmalarının ürettikleri lastiklerin kaliteleri aynıdır. Görüldüğü gibi bir konu hakkında öne sürülen ve doğruluğu henüz ispatlanmamış görüşler hipotezlerdir.hipotezler üzerinde çeşitli işlemler yapılarak ifadenin doğruluğu/yanlışlığı araştırılır. 2 1

HİPOTEZ TESTİ VE AŞAMALARI Popülasyonu incelemeye yönelik yapılan çalışmalar ve bunların raporlanması ile hipotezin kabul edilip edilmeyeceğinin belirlenmesi işlemine hipotez testidenir. Hipotez testi aslında bir nevi karşılaştırma ve seçim işlemi olduğu için birden fazla hipoteze ihtiyaç duyulur. Bu hipotezlere ise alternatif hipotez denir. 3 Hipotez testi 5 aşamalıdır: 1-)NULL ve ALTERNATİF HİPOTEZLERİN BELİRLENMESİ:Popülasyon parametresine genellikle belli bir değer atanır ve bu öne sürülen temel iddia null hipotezidir. Null hipotezi sıfır/başlangıç hipotezi olarak da bilinir. H 0 ile gösterilir. Mevcut veriler null hipotezinin doğruluğu hakkında şüphe uyandırdığında kıyas yapmak için ortaya sunulan ikinci hipotez alternatif hipotezdir. Yapılan işlemler eğer H 0 ı yanlış çıkarırsa bu H A nın kabulü anlamına gelir. 4 2

2-)ÖNEM veya RİSK DERECESİNİN BELİRLENMESİ:Genellikle risk derecesi olarak %5=0,05 ve %1=0,01 kullanılmakla birlikte bu tercihi bir durumdur. Risk derecesi temelde doğru olan null hipotezinin reddedilme olasılığını gösterir. Risk derecesini belirleyerek hipotez testi sırasında yapılabilecek hataları minimuma indirmek isteriz. Bir hipotez testi sırasında null hipotezinin doğruluk/yanlışlık ve kabul/reddedilme durumlarına göre 2 tip hata yapılabilir.(1.tip ve 2.tip hata) 5.. Null hipotezi doğru iken reddedilirse 1. tip hata, yanlış iken kabul edilirse 2.tip hata yapılmış olur. Alınan karar Null hipotezi kabul etme Null hipotezi reddetme Null hipotez i doğru Doğru karar 1. Tip hata Null hipotezi yanlış 2. Tip hata yorumsuz 6 3

3-)İSTATİSTİKSEL TEST METODUNUN BELİRLENMESİ: Örneğin F,t,ki kare istatistiksel testleri kullanılarak null hipotezi ile ilgili değerin bulunması işlemidir. 4-)NULL HİPOTEZİNİN KABUL/RED DURUMUNUN BELİRLENMESİ:yukarıdaki maddede (3) bulunacak değerin durumuna göre null hipotezinin kabul/red koşullarının belirlenmesidir. 5-)NULL HİPOTEZİ İÇİN KARAR VERME:Yapılan işlem sonuçlarına göre null hipotezinin kabul edilip edilmeyeceği belirlenir. 7 1-)Null Ve Alternatif Hipotezleri Belirlemek Ders geçmek için gerekli minimum notun ortalama 60 olduğu bir sınıftan seçilen 40 öğrencinin aldığı notların ortalaması 64 olsun. Bu durumda popülasyonun (sınıfın) gerçek ortalaması 60 ın üzerinde midir? H 0 :µ=60 H A :µ>60 8 4

2-)Önem Derecesini(α)Belirlemek Null hipotezini gerçekten doğru iken reddetme olasılığının yani önem derecesinin α=0,05 olduğunu kabul edelim. Bu durumda grafiksel bir açıklama yapacak olursak 9 3-)Hipotez Testinin Yönünü Belirlemek Alternatif hipotez için yazılan duruma göre hipotez testi tek yönlü ya da iki yönlü olabilir. Tek yönlü hipotez testi için αdirek alınır iken iki yönlü hipotez testinde alan belirlenirken α yerine α/2 değeri ile işlem yapılır. Aşağıda alternatif hipotezin durumuna göre grafiksel gösterimler verilmiştir.( ve durumları < ve < için de aynıdır.) 10 5

H A :µ 60 (tek yönlü) H A :µ 60 (tek yönlü) H A :µ 60 (çift yönlü) 11 4-)Kritik Değeri Veya Değerleri Belirlemek Null hipotezinin doğru olduğu varsayımı ile olasılığı 1- αolan değer aranan kritik değerdir. İlgili istatistik testi için değişmekle birlikte kritik değer standart normal dağılımlar için z * ile gösterilir. Eğer popülasyon için standart sapma değeri biliniyor ise ya da gözlem sayısı n 30 ise 0,5-αdeğerine karşılık gelen z değeri tablodan bulunur ve aranan z * değeri odur. 12 6

.. Örneğimizdeki α=0,05 için n=40 olduğundan standart dağılım tablosu kullanılırsa tabloda 0,5-0,05=0,45 değerine karşılık gelen z değeri 1,645 olduğundan aranan kritik değer z * =1,645 dir. 13 5-)Test İstatistiğini Belirlemek Ve Kritik Değer İle Karşılaştırmak µ=popülasyonun ortalaması σ=popülasyonun standart sapması s=örneklemin standart sapması X=örneklemin ortalaması z=kritik değer olmak üzere; Popülasyona ait standart sapma biliniyor ise; z = x µ σ Popülasyonun standart sapması bilinmiyor ve n 30 ise σyerine s alınarak z değeri bulunur. Daha sonra z ile z * değeri karşılaştırılarak karara varılır. n 14 7

ÖZETLE.. 1. H 0 ve H A hipotezleri belirlenir 2. αtespit edilir 3. Hipotez testinin yönü belirlenir 4. Kritik değer z * bulunur 5. Test istatistiği yapılarak z değeri bulunur ve karşılaştırma ile karar verilir. 15 ÖRNEK 1 H 0 :µ=50 ve H A :µ 50 olmak üzere örnek ortalaması 49, örneklemdeki veri sayısı ise 36 dır. Popülasyonun standart sapması 5 iken hipotez için %5 risk alındığında a) Hipotez testinin yönünü belirleyin b) Null hipotezi ile ilgili karar verin c) Verilen karar ile ilgili güven durumu yani p değeri nedir? 16 8

Çözüm: a) H 0 hipotezine göre popülasyon ortalaması 50den büyük de olabilir küçük de. Bu sebeple bir yönlendirme yapılmadığı için hipotez testi çift yönlüdür. ( den de anlaşılacağı gibi) b) α=0,05 olmak üzere çift yönlü hipotez testi olduğu için α/2=0,025 ile işlem yapılır. Buna göre 0.5-0.025=0.475 olasılığına karşılık gelen z değeri tablodan 1.96 olarak bulunur. O halde aranan z * =1.96 dır. Diğer taraftan formül yardımı ile z=(49-50) /(5/ 36)= -1.2 bulunur. Şimdi z ile z * değerlerini karşılaştırıp karar verelim: 17 şekilde de görüldüğü gibi bulunan z= -1,2 değeri taralı alanın dışında kaldığı için H 0 hipotezi kabul edilmelidir. c) Verdiğimiz karardan ne kadar emin olduğumuzu öğrenebilmek için z değerinin bulunan değerin üzerinde olabilme olasılığını (p değerini) bulmalıyız. P(z< -1.2)=0,5-0,3849=0.1151dir. Fakat testimiz çift yönlü olduğu için bunun iki katı aranan p değeri olur. Yani p=2x0.1151=0,2302 dir. p>αolduğu için null hipotezi kabul edilmelidir. Bulunan p değeri popülasyonun ortalamasının 50nin altında ya da üstünde olması (H a nın doğru olma olasılığı) olasılığının %11.51 olduğunu söyler. 18 9

ÖRNEK 2 Rasgele seçilen 25 kutu mısır gevreğinin ortalaması 372.5gr. ve üretici firmanın belirlemelerine göre standart sapma 15gr dır. Bu durumda 0.05 önem derecesi ile bir kutu mısır gevreğinin 368gr üzerinde olmasını test ediniz. ÇÖZÜM: verilere göre H 0 :µ 368 H A :µ>368 α=0.05 n=25 σ=15 X=372.5 19.. Veriler değerler formülde yerine yazılır ise; 372.5 368 z = = 1.5 bulunur. Diğer taraftan 15 25 α=0.05 için standart normal dağılım tablosundan 0.5-0.05=0.45 değerine karşılık gelen z * =1.645dir. z=1.5 değeri taralı alanın dışında olduğundan null hipotezi kabul edilir. YORUM:mısır gevreklerinin kutularının ortalama 368gr ın üzerinde olduğuna dair yeterli bir bilgi yoktur. 20 10

ÖDEV ;) H 0 :µ 10 VE H A :µ>10 olmak üzere a) Hipotez testinin yönü nedir? b) Null hipotezi hakkında ne karar verilmelidir? c) Verilen karar ile ilgili güven durumu nasıldır? (örnek ortalaması 12,örnekteki veri sayısı 36,popülasyonun standart sapması 3 ve risk derecesi %2dir.) 21 Alternatif hipotez a)h A :µ<µ 0 (tek yönlü) b)h A : µ>µ 0 (tek yönlü) c)h A : µ µ 0 (çift yönlü) Test istatistiği (H 0 hipotezinin doğru olduğu varsayılırsa) z 0 µ 0 x = σ n α ya göre test kriteri a) b) p değerine göre test kriteri a) p=p(z<z 0 ) b) p=p(z>z 0 ) z 0 veya x = s µ 0 n c) c)p=2p(z> z 0 ) 22 11