12. Hafta Ders Notları GENEL TEKRAR

Benzer belgeler
3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( )

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik

İçindekiler. Ön Söz... xiii

Tablo (2): Atıştırma Sayısı ve Günlük Sınav Sayısı Atıştırma Sınav Sayısı (X)

İstatistik 1. Bölüm 5 Olasılık Teorisi ve Kesikli Olasılık Dağılımları. Ankara Üniversitesi SBF, GYY

Appendix B: Olasılık ve Dağılım Teorisi

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Dr. Mehmet AKSARAYLI

İstatistik ve Olasılık

SÜREKLİ ŞANS DEĞİŞKENLERİ. Üstel Dağılım Normal Dağılım

13. Olasılık Dağılımlar

Olasılık, bir deneme sonrasında ilgilenilen olayın tüm olaylar içinde ortaya çıkma ya da gözlenme oranı olarak tanımlanabilir.

CEVAPLAR. n = n 1 + n 2 + n 3 + n 4 + n 5 + n 6 + n 7 = = 11 dir.

ALKÜ EKONOMİ ve FİNANS BÖLÜMÜ ISL 207 İSTATİSTİK I ALIŞTIRMALAR

EME Sistem Simülasyonu. Giriş. Olasılık Dağılımı. Rassal Degiskenler

SÜREKLİ OLASILIK DAĞILIŞLARI

ALIŞTIRMALAR. Sayısal Bilginin Özetlenmesi:

Faktöriyel: 1'den n'ye kadar olan tüm pozitif tamsayıların çarpımına, biçiminde gösterilir. Aynca; 0! = 1 ve 1!=1 1 dir. [Bunlar kabul değildir,

İÇİNDEKİLER. Ön Söz Saymanın Temel Kuralları Permütasyon (Sıralama) Kombinasyon (Gruplama) Binom Açılımı...

SÜREKLİ RASSAL DEĞİŞKENLER

1.58 arasındaki her bir değeri alabileceği için sürekli bir

BİYOİSTATİSTİK Olasılıkta Temel Kavramlar Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Tesadüfi Değişken. w ( )

GAZİ ÜNİVERSİTESİ, İ.İ.B.F, İSTATİSTİK VE OLASILIĞA GİRİŞ I, UYGULAMA SORULARI. Prof. Dr. Nezir KÖSE

ARALIK TAHMİNİ (INTERVAL ESTIMATION):

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

Z = S n E(S n ) V ar(sn ) = S n nµ. S nn. n 1/2 n σ

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

Kesikli ġans DeğiĢkenleri Ġçin; Olasılık Dağılımları Beklenen Değer ve Varyans Olasılık Hesaplamaları

Ankara Üniversitesi, SBF İstatistik 2 Ders Notları Prof. Dr. Onur Özsoy 1

SÜREKLĠ OLASILIK DAĞILIMLARI

Kesikli Şans Değişkenleri İçin; Olasılık Dağılımları Beklenen Değer ve Varyans Olasılık Hesaplamaları

Prof.Dr.A.KARACABEY Doç.Dr.F.GÖKGÖZ RANDOM DEĞİŞKEN

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

Sürekli Rastsal Değişkenler

KESİKLİ DÜZGÜN DAĞILIM

2016 YILI AKTÜERLİK SINAVLARI: İSTATİSTİK OLASILIK

OLASILIK ve KURAMSAL DAĞILIMLAR

İstatistik ve Olasılık

NORMAL DAĞILIM. 2., anakütle sayısı ile Poisson dağılımına uyan rassal bir değişkense ve 'a gidiyorsa,

3/6/2013. Ders 6: Kesikli Olasılık Dağılımları

Ders 6: Kesikli Olasılık Dağılımları

OLASILIK VE İSTATİSTİK

Copyright 2004 Pearson Education, Inc. Slide 1

Ders 5: Kesikli Olasılık Dağılımları

Ders 5: Kesikli Olasılık Dağılımları

KESİKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK DAĞILIMLARI. Bernoulli Dağılımı Binom Dağılımı Poisson Dağılımı

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

Merkezi Limit Teoremi

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Örnek Bir zar atıldığında zarın üstünde bulunan noktaların sayısı gözlensin. Çift sayı gelmesi olasılığı nedir? n(s) = 3 6 = 1 2

İÇİNDEKİLER ÖN SÖZ...

İSTATİSTİK VE OLASILIK SORULARI

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

ANADOLU ÜNİVERSİTESİ ÖRNEK: GEOMETRİK DAĞILIM

Gerçek uygulamalarda, standart normal olmayan sürekli bir rassal. değişken, sıfırdan farklı bir ortalama ve birden farklı standart sapma

PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER

İSTATİSTİK I. Giriş. Bölüm 1 Temel Terimler ve Tanımlar İSTATİSTİKLER

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

Rastgele Değişkenlerin Dağılımları. Mühendislikte İstatistik Yöntemler

WEIBULL DAĞILIMI WEIBULL DAĞILIMI ANADOLU ÜNİVERSİTESİ

İSTATİSTİK MHN3120 Malzeme Mühendisliği

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

İstatistik ve Olasılık

İSTATİSTİK. Hafta 7.2 Kesikli Olasılık Dağılımları Poisson Dağılımı. Yrd. Doç. Dr. H. İbrahim CEBECİ

Ekonometri I VARSAYIMLARI

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri Bahar Dönemi 13 Mart 2014

Matris Cebiriyle Çoklu Regresyon Modeli

Olasılık Kuramı ve Bazı Olasılık Dağılımları

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

Prof. Dr. Aydın Yüksel MAN 504T Yön. için Finansal Analiz & Araçları Ders: Risk-Getiri İlişkisi ve Portföy Yönetimi I

0,5749. Menkul Kıymet Getirisi ve Riskinin Hesaplanması Tek dönemlik basit getiri (Kesikli getiri)

Ders 4: Rastgele Değişkenler ve Dağılımları

10. Bir ana kütle oranının tahmininde α = 0,05 ise kullanılan Z değeri nedir? A) 1,64 B) 1,84 C) 1,96 D) 2,28 E) 3,08

rasgele değişkeninin olasılık yoğunluk fonksiyonu,


Mühendislikte İstatistiksel Yöntemler

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

İstatistik ve Olasılık

İstatistik ve Olasılık

H 0 : θ = θ 0 Bu sıfır hipotezi şunu ifade eder: Anakütle parametresi θ belirli bir θ 0

Başarı olasılığı olan bir Bernoulli denemesinin aynı şartlar altında (bağımsız olarak) n kez tekrarlanması ile oluşan deneye binom deneyi denir.

TEK BOYUTLU RASSAL DEĞİŞKENLER

ANADOLU ÜNİVERSİTESİ BEKLENEN DEĞER. X beklenen değeri B[X] ile gösterilir. B[X] = İST 213 OLASILIK DERSİ BEKLENEN DEĞER VE MOMENTLER

BÖLÜM 12 STUDENT T DAĞILIMI

1-2 - * Bu Ders Notları tam olarak emin olmamakla birlikte yıllarına aiitir.tekrardan Sn.Hakan Paçal'a çoook tsk ederiz...

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Uygulama 3 Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

ANADOLU ÜNİVERSİTESİ. ENM 317 Prof. Dr. Nihal ERGİNEL

BİYOİSTATİSTİK Bazı Olasılık Dağılışları Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

Çözüm: Siyah top çekilme olasılığı B olsun. Topların sayısı 12 olduğuna göre P(B)=8/12=2/3 tür.

VERİ KÜMELERİNİ BETİMLEME

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

Appendix C: İstatistiksel Çıkarsama

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Transkript:

12. Hafta Ders Notları GENEL TEKRAR A Veri Türleri Anakütle bir bütünü temsil ederken; örneklem, bir bütünün sadece bir kısmını temsil etmektedir. Anakütledeki gözlem sayısı N ile temsil edilirken; örneklemdeki gözlem sayısı n ile temsil edilir. n N Anakütlenin bir özelliğini tanımlayan sayısal bir değere parametre denirken; örneklemin bir özelliğini tanımlayan sayısal değere istatistik adı verilir. Örnek: Sakarya Üniversitesi nde okuyan 73.500 öğrenci mevcuttur. Bu öğrencilerin not ortalaması 2,01 olarak tespit edilmiştir. Sakarya Üniversitesi nde bulunan bir fakültenin içerisinde yer alan bir bölüm ele alındığında, bu bölümde 420 öğrenci okumaktadır ve bu öğrencilerin not ortalaması 2,23 olarak bulunmuştur. Anakütle: Sakarya Üniversitesi nde okuyan öğrenciler Anakütle gözlem sayısı: N = 73.500 Anakütle parametresi: Ortalama not μ = 2.01 Örneklem: Sakarya Üniversitesi nde bulunan bir fakültenin içerisinde yer alan bir bölümün öğrencileri Örneklem gözlem sayısı: n = 420 Örneklem için istatistik: Ortalama x = 2.23 1

A 1 Verilerin Ölçümü Bazı veriler sayısal değerler alırken; bazı veriler sayısal olmayan ölçümlerden oluşur: A 2 Verilerin Ölçü Düzeyleri Kullandığınız verilerin ölçü düzeyleri, istatistiksel olarak hangi ölçümleri yapabileceğinizi ve hangi işlemleri uygulayabileceğinizi belirleyecektir: Ölçüm Düzeyi Tanımı ve özellikleri Örnek Nominal (Kategorik) Düzey Ordinal (Sıralı) Düzey Sadece kategorilerden oluşur. Bu veri türündeki değişkenlerin sıralanması mümkün değildir. Kategoriler aralarında sıralanabilir. Ancak kategoriler arası farklar bulunamaz veya anlamsızdır. Bir anketteki göz renginiz nedir sorusu Türkiye deki üniversitelerin sıralaması, veya bir dersten alınan geçme notlarının harfler ile temsil edilmesi. (Niteliksel) değişkenler Kategorik Interval (Aralık) Düzeyi Ratio (Oran) Düzeyi Bu düzeydeki değişkenin değerleri arasındaki fark, anlamlıdır. Ancak doğal bir sıfır noktası yoktur ve değerlerin birbirine oranı anlamsızdır. Bu düzeydeki değişkenin doğal bir 0 noktası vardır ve değerleri arasındaki oranlar anlamlıdır. Isı ölçümleri: Isı, 0 derece olabilir. Ancak bu, ısının olmadığı anlamına gelmez. Gelir düzeyiniz nedir? sorusunun cevabı, 0 olabilir. (Niceliksel) değişkenler Sayısal 2

Korelasyon (Correlation) ve Nedensellik (Causality) İki değişken arasında doğrusal ilişkinin yönü ve şiddeti, korelasyon katsayısı ile ölçülmektedir. Ancak iki değişken arasında doğrusal bir ilişkinin varlığı, birbirleri arasında bir nedensellik ilişkisi olduğu anlamına gelmeyecektir. Örneğin elde edilen mısır miktarı ile yağan yağmur miktarı arasında pozitif yönlü bir korelasyon söz konusudur. Bu, Elde edilen mısır miktarı arttıkça yağan yağmur miktarı da artar şeklinde bir nedensellik içermemektedir. B VERİLERİN SAYISAL ÖLÇÜMLERİ B 1 Merkezi Eğilim Ölçüleri : Bir veri setinde yer alan tüm değerlerin toplanmasını ifade eder. X: Aynı özellikleri tanımlanmış gözlem değerlerinin oluşturduğu bir değişkendir. Ortalama: Bir veri setinde yer alan bütün gözlem değerlerini dikkate alır ve gözlem değerlerinin hepsine eşit ağırlık vererek, bu değerleri temsil edecek tek bir sayısal değer türetir. B 2 Değişimin Ölçülmesi Varyans ve standart sapma ile yapılmaktadır. Varyans: Bir veri setinde yer alan gözlem değerlerinin her birinin ortalamaya olan uzaklığının ortalamasını temsil eden bir sayısal değerdir. Standart Sapma: Varyansıın pozitif kareköküdür. ANAKÜTLE ÖRNEKLEM Ortalama (Mean, Average) μ = N X X = n X Varyans σ = (X μ) N s = (X X) n 1 Standart Sapma σ = (X μ) N s = (X X) n 1 3

Örnek: Bir futbol ligindeki teknik direktörlerin maaşları, aylık olarak, aşağıdaki gibidir: Aylık Maaşlar (TL) 2350 1250 1590 1280 4920 9000 5300 3600 1380 2120 a) Bu veri seti, kesikli mi yoksa sürekli mi değerler almaktadır? b) Bu veri setinin ölçüm düzeyini (nominal, ordinal, interval, ratio) tanımlayınız. c) Bu veri setinin ortalamasını bulunuz. d) Bu veri setinin varyansını ve standart sapmasını bulunuz. 4

C OLASILIK Rassal süreç: Hangisinin gerçekleşeceği konusunda bir kesinlik olmayan ve en az iki sonuç içeren durumdur. Örneğin, Hilesiz bir zarın atılması. Olay: Rassal süreç sonucunda ortaya çıkması ile ilgilenilen bir durumdur. A olayı: Atılan zarın 1 gelmesi 𝐴 = {1} B olayı: Atılan zarın çift sayı gelmesi 𝐵 = {2,4,6} Örneklem uzayı: Rassal süreç sonucunda ortaya çıkabilecek olayların tamamıdır. 𝑆 = 1,2,3,4,5,6 Olasılığın Hesaplanması A olayı için: 𝑃 𝐴 = "#$ı ç"# "#$ç "#ıı B olayı için: 𝑃 𝐵 = "#$ı ç"# "#$ç "#ıı "#$%& "#$ç "#ıı "#$%& "#$ç "#ıı = = Ayrık Bağdaşmaz (Disjoint) Olaylar İki olayın aynı anda meydana gelmemesini ifade eder: 𝐴 𝐵 = Tümleyen olaylar A olayının tümleyeni (𝐴), A olayının sonuçları dışında örneklem uzayında yer alan bütün sonuçlardır. A olayı ile tümleyeni 𝐴 olayı, bağdaşmaz iki olaydır. 𝐴 = {2,3,4,5,6} 𝑃 𝐴 +𝑃 𝐴 =1 Bütünü Kapsayıcılık (Exhaustive Events) Olaylar bağdaşmazsa ve sonuçlarının bir araya gelmesi örneklem uzayını veriyorsa, bu olaylar bütünü kapsayıcıdır. A ve B olayı, bağdaşmaz olmasına rağmen, bütünü kapsayıcı değildirler. C olayı: Atılan zarın sonucu tek sayı gelir. 𝐶 = {1,3,5} 𝐵 𝐶 =𝑆 Olasılığın kuralları 0 𝑃(𝐴) 1 𝑃 𝐵 +𝑃 𝐶 =1 5

Olasılığın toplama kuralı Şayet iki olay, aynı anda meydana gelebiliyorsa (ayrık değillerse): P A B = P A + P B P(A B) Şayet iki olay, aynı anda meydana gelemiyorsa: Koşullu Olasılık P A B = P A + P B Şayet A olayının meydana gelmesi B olayının meydana gelme olasılığını etkiliyorsa, B olayının olasılığı hesaplanırken A olayının meydana geldiği gerçeği de dikkate alınmalıdır: İstatistiksel Bağımlılık P B A = ( ) () veya P A B = ( ) () İki olay arasında bir etkileşim söz konusu ise, koşullu olasılık denkleminden hareketle, olasılıkları arasında şöyle bir ilişki tanımlanabilir: Veya İstatistiksel Bağımsızlık P A B = P B A P(A) P A B = P A B P B Şayet bir olayın olasılığı diğer bir olayın meydana gelmesinden etkilenmiyorsa, koşullu olasılığı kendi olasılığına eşit olacaktır: Veya P B A = P(B) P A B = P(A) Bu durumda bu iki olayın aynı anda meydana gelme olasılığı, koşullu olasılık denkleminden hareketle, şu şekilde tanımlanabilir: P A B = P A P(B) İki olay, ancak ve ancak, bu koşul altında istatistiksel olarak birbirlerinden bağımsızdırlar. 6

İki Değişkenli Olasılık Bir fabrikada iki makine bulunsun. Bu makinelerin kurşun kalem üretimleri toplamda 1000 adet olup, makinelere dağılımı (kusurlu ve kusursuz olarak) aşağıdaki gibidir: Kusurlu parça Kusursuz parça A makinesi 4 396 B makinesi 12 588 Bileşik Olay: Aynı anda iki farklı olayın meydana gelmesidir: A olayı: A makinesi üretimi parçalar B olayı: B makinesi üretimi parçalar C olayı: Kusurlu parçalar C olayı: Kusursuz parçalar Hem kusurlu hem de A makinesinde üretilmiş kaç ürün vardır? A C = 4 Hem kusurlu hem de B makinesinde üretilmiş kaç ürün vardır? Marjinal olasılık (Kenar olasılığı) Sadece tek bir olayın olasılığıdır. C olayı: Kusurlu parçalar B C = 12 Kusurlu parça sayısı = (A makinesinden) + (B makinesinden) = 4 + 12 = 16 Bu fabrikada üretilen kalemler arasından rassal olarak çekilen bir kalemin kusurlu olma olasılığı nedir? Koşullu Olasılık P C = toplam kusurlu parça sayısı toplam kalem sayısı = 16 1000 Rassal olarak seçilen bir ürün kusurlu ise, bu kalemin A makinesinde üretilmiş olma olasılığı nedir? Koşul: Ürün kusurlu (C olayı) Aranan olasılık: A makinesinde üretilmiş olma olasılığı (A olayı) P A C = P(A C) P(C) = Hem kusurlu hem A makinesinde kalem sayısı Kusurlu kalem sayısı = 4 16 = 0,25 7

D RASSAL DEĞİŞKENLER D 1 Kesikli Rassal Değişkenler Örneğin, gün içerisinde bir doktora gelen hasta sayısı, bir kutudaki arızalı parça sayısı gibi. Rassal değişken, tanım kümesi bir sürecin örneklem uzayı, değer kümesi reel sayılar kümesi olan bir sayılar kümesidir. Hilesiz iki zar aynı anda atılsın. Bu rassal süreç sonucunda oluşacak sonuçlar (örneklem uzayı), aşağıdaki gibidir: 1,1, 1,2, 1,3, 1,4, 1,5, 1,6, 2,1, 2,2, 2,3, 2,4, 2,5, 2,6, 3,1, 3,2, 3,3, 3,4, 3,5, 3,6, 4,1, 4,2, 4,3, 4,4, 4,5, 4,6, 5,1, 5,2, 5,3, 5,4, 5,5, 5,6, 6,1, 6,2, 6,3, 6,4, 6,5, 6,6 Şimdi bu tanım kümesinden hareketle elde edilecek olan rassal değişkeni ve değer kümesini tanımlayalım. X: Aynı anda atılan iki zarın toplamı 𝑋 = 2,3,4,5,6,7,8,9,10,11,12 Kesikli rassal değişkenin olasılık dağılımı Kesikli rassal değişkenin bir değeri alma olasılığını ifade eder. 𝑃(𝑋 = 𝑥) Örneğimizdeki X rassal değişkeninin alabileceği 11 farklı değer vardır. Her bir değerin gerçekleşme olasılığı ise, tanım kümesinde bu toplamlara denk elen ikililerin sayısı ile ilgilidir: X 2 3 4 5 6 7 P(X = x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 8 8 9 10 11 12

Kesikli Rassal Değişkenin Ortalaması (Beklenen Değeri) E X = E X = XP(X = x) = 2 XP(X = x) 1 36 + 3 2 36 + + 12 1 36 = 7 Kesikli Rassal Değişkenin Varyansı σ = E[X ] E(X) E[X ] = X P X = x = (2) 1 36 + 3 2 36 + + 12 1 36 = 54.83 σ = E[X ] E X = 54.83 7 = 5.83 Alternatif Varyans hesaplama yöntemi σ = [X E X ] P(X = x) Kesikli Rassal Değişkenin Standart Sapması σ = σ = 5.83 = 2.414 9

Kesikli Rassal Değişkenler ve Kovaryans Kovaryans katsayısı, iki rassal değişken arasındaki doğrusal ilişkinin varlığını ve yönünü tespit edebilir. Ancak iki rassal değişken arasında doğrusal olmayan ilişki formalarını tespit edemez. Ayrıca doğrusal ilişkinin varlığını ve yönünü tespit etse bile, doğrusal ilişkinin şiddetini de ölçemez. 𝐶𝑂𝑉 𝑋, 𝑌 = 𝐸 𝑋𝑌 𝐸 𝑋 𝐸(𝑌) 𝐸 𝑋𝑌 = 𝑥𝑦𝑃(𝑋 = 𝑥 𝑌 = 𝑦) Kovaryansın sayısal değer sınırları [𝑉𝑎𝑟 𝑋 𝑉𝑎𝑟 𝑌 ] 𝐶𝑂𝑉 𝑋, 𝑌 𝑉𝑎𝑟 𝑋 𝑉𝑎𝑟(𝑌) Y Değişkeni X değişkeni 𝐸 𝑋 = 𝐸 𝑌 = 𝐸 𝑋𝑌 = 1 2 3 1 0.25 0.25 0 2 0 0.25 0.25 𝑥𝑃 𝑋 = 𝑥 = 1 0.50 + 2 0.50 = 1.50 𝑦𝑃 𝑌 = 𝑦 = 1 0.25 + 2 0.50 + (3)(0.25) = 2.00 𝑥𝑦𝑃 𝑋 = 𝑥 𝑌 = 𝑦 = 1 1 0.25 + 1 2 0.25 + 1 3 0 + 2 1 0 + 2 2 0.25 + 2 3 0.25 = 3.25 𝐶𝑂𝑉 𝑋, 𝑌 = 𝐸 𝑋𝑌 𝐸 𝑋 𝐸 𝑌 = 3.25 1.5 2.0 = 0.25 Kovaryans katsayısı 0 olmadığı için iki değişken arasında doğrusal bir ilişki olduğu anlaşılır. Kovaryans katsayısı pozitif olduğu için iki rassal değişken arasında pozitif yönlü doğrusal bir ilişki olduğu anlaşılır. Ancak ilişkinin güçlü mü yoksa zayıf mı olduğuna, kovaryans katsayısına bakılarak karar verilemez. Ayrıca kovaryans katsayısı, nedensellik (hangi değişken diğerini etkiler) ile ilgilide bir bilgi vermemektedir. 10

Bernoulli (İki terimli) olasılık dağılımı Temel varsayımları (a) Bir olayın sonucunda başarı ve başarısızlık olmak üzere iki temel sonuç vardır. (b) Başarı olasılıkları p ve başarısızlık olasılıkları (1 𝑝) her bir deneme için sabittir. (c) Toplam n tane deneme içerisinde ilgilenilen x tane başarı vardır. (d) Her bir denemede oluşan sonuçlar, birbirinden bağımsızdır. 𝑃 𝑋=𝑥 = 𝑛 𝑝 (1 𝑝) 𝑥 𝑛 𝑥 Örnek: Bir yumurta firması yumurtalarını 30 lu kolilerde satışa sunmaktadır. Firmanın verilerine göre yumurtaların % 95 i kırılmadan müşterilere ulaştırılmaktadır. Bu firmadan 4 koli yumurta alan bir müşteri, her bir koliden rassal olarak bir yumurta aldığında, 3 kırık yumurta ile karşılaşma olasılığı nedir? Sorunun iki terimli dağılıma uyduğunu şuradan anlıyoruz: Rassal olarak seçilen yumurtalar kırık mı değil mi? Diğer bir ifadeyle iki sonuçlu bir durum söz konusudur. X değişkeni: Seçilen 4yumurtanın kırık olması 𝑋 = {0,1,2,3,4} 4 𝑦𝑢𝑚𝑢𝑟𝑡𝑎 𝑜𝑙𝑑𝑢ğ𝑢𝑛𝑑𝑎𝑛 𝑛=4 𝑝: 𝑦𝑢𝑚𝑢𝑟𝑡𝑎𝑙𝑎𝑟ı𝑛 𝑘ı𝑟ı𝑙𝑚𝑎 𝑜𝑙𝑎𝑠ı𝑙ığı 1 𝑝 : 𝑦𝑢𝑚𝑢𝑟𝑡𝑎𝑙𝑎𝑟ı𝑛 𝑘ı𝑟ı𝑙𝑚𝑎𝑚𝑎 𝑜𝑙𝑎𝑠ı𝑙ığı 𝑝 = 0.05 1 𝑝 = 0.95 𝑃 𝑋=𝑥 = 𝑛 𝑝 (1 𝑝) 𝑥 𝑛 𝑥 𝑃 𝑋=0 = 4 (0.05) (1 0.05) = 0.814 0 4 0 𝑃 𝑋=1 = 4 (0.05) (1 0.05) = 0.171 1 4 1 𝑃 𝑋=2 = 4 (0.05) (1 0.05) = 0.020 2 4 2 11

𝑃 𝑋=3 = 𝑃 𝑋=4 = 4 0.05 3 4 3 1 0.05 = 0.00047 4 (0.05) (1 0.05) = 0.0000062 4 (4 4) Seçilen 4 yumurtanın hiç kırık olmama ihtimali % 81,4 olurken; seçilen 4 yumurtanın sadece 1 inin kırık olma olasılığı da %17,1 dir. Poisson Olasılık Dağılımı Mesafe ve zaman ölçümü içeren sorunlarda kullanılmaktadır. Örneğin, otobanın belirli mesafeleri arasında araçların arıza yapma olasılığı veya bir saat içerisinde bir dükkâna belirli sayıda müşteri gelme olasılıklarının hesaplanmasında kullanılır. Temel Varsayımlar (a) Belirli zaman veya mesafe aralığında meydana gelen olayların birbirinden bağımsız olduğu kabul edilir. (b) Belirli aralıkta meydana gelen olayların ortalama dağılımı, aralıklar için hep eşittir. 𝑒 𝜆 𝑃 𝑋=𝑥 = 𝑥 𝑒 = 2.718 λ: Belirli aralıkta meydana gelen ortalama olay sayısı Örnek: Serdivan kavşağında yılın ilk altı ayında ortalama 5 kaza meydana geldiyse, önümüzdeki altı ayda 2 kaza olma olasılığı nedir? X: Serdivan kavşağında meydana gelen kaza sayısı 𝜆=5 𝑃 𝑋 = 2 =? 𝑃 𝑋=2 = 𝑒 (5) = 0.084 2 Sonraki üç ay içerisinde 3 kaza meydana gelme olasılığı nedir? Bu durumda ortalama kaza sayısı 2,5 olacaktır: 𝜆 = 2,5 𝑃 𝑋 = 3 =? 𝑃 𝑋=3 = 𝑒. (2.5) = 0.213 3 Sonraki üç ayda 3 kaza meydana gelme olasılığı % 21.3 tür. 12

D 2 - SÜREKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Belirli bir sayı aralığında olası bütün değerleri alabilen değişkenlerdir. Örneğin, ücretler, maliyetler, ağırlıklar gibi. Sürekli rassal değişkenlerin dağılım formunun normal olduğunu kabul ediyoruz. Çan eğrisi şeklindeki olasılık yoğunluk fonksiyonunun altında kalan alanın sayısal değeri 1 dir. Bunun bir diğer anlamı, X rassal değişkinine ait bütün gözlem değerleri, bu çan eğrisinin altında yer almaktadır. Her hangi bir rassal değişkenin belirli aralıktaki olasılığının bulunabilmesi için standart normal dağılıma dönüştürmesi yapılır. Dönüştürme işlemi, aşağıdaki formül aracılığı ile yapılır: Z = X μ σ Elde edilen standart normal dağılım değeri (Z değeri) ile standart normal dağılım tablosundaki olasılık değeri bulunur. Örnek: Bir tarantula türü olan Mollicoma örümceklerinin yetişkin erkeklerinin boyu 18.14 mm ortalama ve 1.76 mm standart sapma ile normal dağılım göstermektedir. a) Rassal olarak seçilen yetişkin erkek Mollicoma örümceğinin uzunluğunun 16.34 mm den kısa olma olasılığı nedir? b) Bu örümceklerin yüzde kaçının uzunluğu 17.00 mm ile 19.00 mm aralığındadır. c) Örümceklerin en uzun olan % 10 u, kaç mm den daha uzundur? Çözüm a: Örümceklerin uzunluklarının normal dağılım gösterdiği bilgisi verilmiştir. Belirli uzunluk değerleri için olasılık (veya sıklık) değerlerini bulabilmek için, 13

standart normal dağılıma dönüştürme yapılmalıdır. Bu dönüştürme işleminde kullanılacak veriler, aşağıdaki gibidir: X rassal değişkeni: Örümceklerin uzunlukları mm Z = μ = 18.14 mm σ = 1.76 mm P X 16.34 mm =? X μ σ = 16.34 18.14 1.76 Z = 1.02 Negatif standart normal dağılım tablosunda bu Z değerine denk gelen alan sayısı 0.1539 dur. Bunun anlamı, standart normal dağılıma sahip rassal değişkenin değeri eksi sonsuzdan 1.02 değerine kadar geldiğinde taradığı alanın sayısal değeri 0.1539 dur. P Z 1.02 = 0.1539 Normal dağılıma sahip rassal değişkenin sayısal değerleri ile bu dönüştürmeyi yaptığımız için, X rassal değişkeninin 16.34 mm den daha düşük olma olasılığı da aynı değere eşit olacaktır: P X 16.34 mm = P Z 1.02 14

𝑃 𝑋 16.34 𝑚𝑚 = 0.1539 Mollicoma türü örümceklerin yetişkin erkeklerinin % 15.39 unun uzunluğu, 16.34 mm ve daha kısadır. Diğer bir ifadeyle, Mollicoma türü örümceklerden rassal olarak seçilen yetişkin bir erkeğin boy uzunluğunun 16.34 mm den daha kısa olma olasılığı % 15.39 dur. b) 𝑃 17.00 𝑚𝑚 𝑋 19.00 𝑚𝑚 =? 𝑋 = 17.00 𝑋 = 19.00 İlk önce 𝑋 değeri için dönüştürme yapalım: 𝑍 = 𝑋 𝜇 19.00 18.14 = 𝜎 1.76 𝑍 = 0,48 Pozitif standart normal dağılım tablosunda 0,48 için alanın sayısal değeri 0.6844 tür. Bunun anlamı Z değişkeni eksi sonsuzdan gelip 0.48 sayısal değerine kadar taradığı alanın sayısal değeri 0.6844 tür. 𝑃(𝑍 0,48) = 0.6844 Şimdi 𝑋 için dönüştürme yapalım: 𝑍 = 𝑋 𝜇 17.00 18.14 = 𝜎 1.76 𝑍 = 0.64 Negatif tabloda 0.64 e denk gelen alanın sayısal değerine baktığımızda 0.2611 değerini görürüz. Bunun anlamı, Z değişkeni eksi sonsuzdan gelip 0.64 değerine kadar taradığı alanın sayısal değeri 0.2611 dir. 𝑃(𝑍 0.64) = 0.2611 Aradığımız olasılık, 𝑍 ve 𝑍 arasında kalan alanın sayısal değeridir: 𝑃 𝑍 𝑍 𝑍 =? 𝑃 0.64 𝑍 0.48 = 𝑃(𝑍 0,48) 𝑃(𝑍 0.64) 𝑃 0.64 𝑍 0.48 = 0.6844 0.2611 𝑃 0.64 𝑍 0.48 = 0.4233 15

P 17.00 mm X 19.00 mm = P 0.64 Z 0.48 P 17.00 mm X 19.00 mm = 0.4233 Rassal olarak seçilen bir örümceğin uzunluğunun 17 ile 19 mm arasında olma olasılığı % 42.33 tür. c) P X? = 0.10 İstenilen X değerini bulabilmek için önce standart normal dağılım tablosunda kendisinden sonra kalan alanın sayısal değeri 0.1000 olan Z değerini bulmalıyız. Pozitif Z tablosunda 1.28 sayısal değerinin karşılığı 0.8997 dir. Bunun anlamı, eksi sonsuzdan gelip 1.28 sayısına kadar standart normal dağılıma sahip rassal değişkenin gözlem değerlerinin % 89.97 si geçilmiştir. Bu noktadan sonra kalan kısımda (yaklaşık olarak) gözlem değerlerinin % 10 u bulunmaktadır: P Z 1.28 = 0.10 Şimdi Z değerini X değerine dönüştürelim: Z = X μ σ 16

1.28 = X 18.14 1.76 1.28 1.76 = X 18.14 X = 20.39 mm Bu tür örümceklerin % 10 u, 20.39 mm den daha uzundur. E - ÖRNEKLEM ORTALAMALARININ DAĞILIMI Anakütlenin gözlemlenebildiği bir durumda hesaplanacak olan parametrelerin, örneğin ortalama ve standart sapma, sadece tek bir değeri olacaktır. Örneğin bir ampul üreticisi bir firma, bir üretim süreci sonucunda 1 milyon ampul üretiyor ve bunların tamamının saat olarak ömrünü ölçebiliyorsa, ampulleri için ortalama bir ömür (saat) belirleyecektir ve bu değer, tek bir sayısal değer (parametre) olacaktır. Ancak gerçek hayatta anakütlenin tamamının gözlemlenmesi çoğu zaman mümkün değildir. Bunun için anakütleden örneklem çekilecektir. 1 milyon ampul üreten bir firmanın ampullerin ömrünü kontrol etmek için 100 veya 1000 ampulü alıp ölçüm yaptığını düşünelim. Alınan örneklemin kendine özgü bir ortalama değeri (istatistik) olacaktır. Ancak dikkat edilmesi gereken nokta, çekilen tek bir örneklemden elde edilen ortalama değeri, 1 milyon gözlem sayısına sahip anakütleden 100 veya 1000 elemanlı çekilebilecek örneklemlerden 17

sadece biridir. Dolayısıyla 1 milyonun 100 lü kombinasyonu sonucunda kaç tane farklı örneklem elde edilebilecekse, o kadar farklı örneklem ortalamaları elde edilecektir. Merkezi Limit Teoremi (1) Ortalaması μ ve standart sapması σ olan (dağılımı normal olsun veya olmasın) bir anakütleden çekilen örneklemin gözlem sayısı 30 dan büyükse (n 30), elde edilebilecek örneklemlerin ortalamalarının dağılımı, beklenen değeri (ortalaması) μ ve standart sapması σ n ile normal dağılım gösterecektir. (2) Ortalaması μ ve standart sapması σ olan ve normal dağılım gösteren bir anakütleden çekilen örneklemin gözlem sayısı 30 dan küçükse (n < 30), elde edilebilecek örneklemlerin ortalamalarının dağılımı, beklenen değeri (ortalaması) μ ve standart sapması σ n ile normal dağılım gösterecektir. Dikkat edilirse bu iki koşul altında örneklem ortalamalarının ortalaması (μ X ) ile anakütle ortalaması (μ) birbirine eşit olmaktadır. Mümkün olan bütün örneklemlerin ortalamaları hesaplandığı için örneklem ortalamalarının dağılımı da ayrı bir anakütle olacaktır. Bu anakütlenin ortalaması ve standart sapması, şu şekilde sembolize edilecektir: μ : Örneklem ortalamalarının ortalaması σ : Örneklem ortalamalarının standart sapması Bu bilgiler ışığında, örneklem ortalamalarının dağılımına dair olasılıkları bulabilmek için standart normal dağılım dönüştürmesi, şu şekilde yapılacaktır: Z = X μ = X μ σ σ n Örnek: Bir emlak dergisinin yapmış olduğu araştırmada Bodrum daki evlerin ortalama metrekare fiyatı 18000 TL bulunmuştur. Anakütle, standart sapması 4000 TL ile normal dağılım göstermektedir. a) Anakütleden çekilen bir evin metrekare fiyatının 23750 TL den büyük olma olasılığı nedir? Soruda verilenler: μ = 18.000 TL σ = 4.000 TL P X 23.750 TL =? 18

dönüştürelim: Normal dağılama sahip bu rassal değişkenin değerlerini, standart normal dağılıma Z = X μ σ = 23.750 18.000 4.000 Z = 1.43 Pozitif Z tablosunda bu değerin karşısında 0.9236 yazmaktadır. Bunun anlamı, Z rassal değişkeni eksi sonsuzdan gelip 1.43 sayısına kadar taradığı alanın sayısal değeri 0.9236 dır. P Z 1.43 = 0.9236 Ancak biz, bu değerden daha büyük olma olasılığını arıyoruz: P Z 1.43 = 1 P Z 1.43 P Z 1.43 = 1 0.9236 P Z 1.43 = 0.0764 Standart normal dağılıma sahip rassal değişkenin 1.43 değerini aşma olasılığı ile normal dağılıma sahip rassal değişkenin 23.750 TL değerini aşma olasılığı eşittir: P X 23.750 TL = P Z 1.43 P X 23.750 TL = 0.0764 Bodrum da rassal olarak seçilen bir evin metrekare fiyatının 23.750 TL den daha fazla olma olasılığı % 7,64 tür. 19

b)anakütleden çekilen 32 gözlemli bir örneklemin ortalamasının 23750 TL den yüksek olma olasılığı kaçtır? Örneklem olduğu için dönüştürme işlemi ve dağılımın parametreleri değişecektir: n = 32 μ = μ = 18.000 TL σ = σ n = 4.000 32 = 707,96 P X 23.750 TL =? Bu sorunun cevabını bulabilmek için verilenleri Z değişkenine dönüştürelim: Z = X μ = X μ 23.750 18000 = σ σ n 707,96 Z = 8,12 Pozitif Z tablosunda en büyük Z değeri 3,50 dir. Standart normal dağılıma sahip rassal değişkenin bu değeri aşma olasılığı oldukça düşüktür. P X 23.750 TL = P Z 8,12 = 0,0001 Dikkat edilirse bir anakütleden tek bir gözlem çekmek ile belirli bir büyüklükte örneklem çekip ortalamasının olasılığını bulmak, oldukça farklı olasılık değerleri vermektedir. 20