Deney Dizaynı ve Veri Analizi Ders Notları

Benzer belgeler
Ders 6: Sürekli Olasılık Dağılımları

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik

OLASILIK ve KURAMSAL DAĞILIMLAR

Rastgele Değişkenlerin Dağılımları. Mühendislikte İstatistik Yöntemler

Kesikli Şans Değişkenleri İçin; Olasılık Dağılımları Beklenen Değer ve Varyans Olasılık Hesaplamaları

1.58 arasındaki her bir değeri alabileceği için sürekli bir

İÇİNDEKİLER. Ön Söz Saymanın Temel Kuralları Permütasyon (Sıralama) Kombinasyon (Gruplama) Binom Açılımı...

Prof.Dr.A.KARACABEY Doç.Dr.F.GÖKGÖZ RANDOM DEĞİŞKEN


Ders 4: Rastgele Değişkenler ve Dağılımları

Tablo (2): Atıştırma Sayısı ve Günlük Sınav Sayısı Atıştırma Sınav Sayısı (X)

SÜREKLİ OLASILIK DAĞILIŞLARI

MAT 208 İSTATİSTİK ve OLASILIK II ALIŞTIRMALAR-1

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

13. Olasılık Dağılımlar

Z = S n E(S n ) V ar(sn ) = S n nµ. S nn. n 1/2 n σ

ALKÜ EKONOMİ ve FİNANS BÖLÜMÜ ISL 207 İSTATİSTİK I ALIŞTIRMALAR

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

Kesikli ġans DeğiĢkenleri Ġçin; Olasılık Dağılımları Beklenen Değer ve Varyans Olasılık Hesaplamaları

EME Sistem Simülasyonu. Giriş. Olasılık Dağılımı. Rassal Degiskenler

Dr. Mehmet AKSARAYLI

BİYOİSTATİSTİK Bazı Olasılık Dağılışları Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK Olasılıkta Temel Kavramlar Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

3/6/2013. Ders 6: Kesikli Olasılık Dağılımları

Ders 6: Kesikli Olasılık Dağılımları

SÜREKSİZ(DISCRETE) OLASILIK DAĞILIMLARI

Ders 5: Kesikli Olasılık Dağılımları

Ders 5: Kesikli Olasılık Dağılımları

SÜREKLİ RASSAL DEĞİŞKENLER

GAZİ ÜNİVERSİTESİ, İ.İ.B.F, İSTATİSTİK VE OLASILIĞA GİRİŞ I, UYGULAMA SORULARI. Prof. Dr. Nezir KÖSE

KESİKLİ ŞANS DEĞİŞKENLERİNİN OLASILIK DAĞILIMLARI. Bernoulli Dağılımı Binom Dağılımı Poisson Dağılımı

Faktöriyel: 1'den n'ye kadar olan tüm pozitif tamsayıların çarpımına, biçiminde gösterilir. Aynca; 0! = 1 ve 1!=1 1 dir. [Bunlar kabul değildir,

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

Tesadüfi Değişken. w ( )

Başarı olasılığı olan bir Bernoulli denemesinin aynı şartlar altında (bağımsız olarak) n kez tekrarlanması ile oluşan deneye binom deneyi denir.

Aktüerlik Sınavları I. Seviye / Olasılık-İstatistik Örnek Sorular I

BÖLÜM 9 NORMAL DAĞILIM

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Yrd. Doç. Dr. Neşet Demirci, Balıkesir Üniversitesi NEF Fizik Eğitimi. Parametrik Olmayan Testler. Ki-kare (Chi-Square) Testi

BAZI ÖNEMLİ SÜREKLİ DEĞİŞKEN DAĞILIMLARI

SÜREKLĠ OLASILIK DAĞILIMLARI

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( )

SÜREKLİ ŞANS DEĞİŞKENLERİ. Üstel Dağılım Normal Dağılım

altında ilerde ele alınacaktır.

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

Sürekli Rastsal Değişkenler

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5

İstatistiksel Yorumlama

Merkezi Limit Teoremi

ENM 316 BENZETİM ÖDEV SETİ

PARAMETRİK OLMAYAN TESTLER

İçindekiler. Ön Söz... xiii

İSTATİSTİK DERS NOTLARI

IE 303T Sistem Benzetimi DERS 4 : O L A S I L I K T E K R A R

1-2 - * Bu Ders Notları tam olarak emin olmamakla birlikte yıllarına aiitir.tekrardan Sn.Hakan Paçal'a çoook tsk ederiz...

ANADOLU ÜNİVERSİTESİ. ENM 317 MÜHENDİSLİK İSTATİSTİĞİ PARAMETRİK OLMAYAN TESTLER Prof. Dr. Nihal ERGİNEL

İstatistik ve Olasılık

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Programlama Dilleri 1. Ders 3: Rastgele sayı üretimi ve uygulamaları

MAK 210 SAYISAL ANALİZ

Matematik Ders Notları. Doç. Dr. Murat Donduran

İstatistik ve Olasılık

ALIŞTIRMALAR. Sayısal Bilginin Özetlenmesi:

Uygulama 3 Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

OLASILIK ve İSTATİSTİK Hipotez Testleri

Parametrik Olmayan İstatistik. Prof. Dr. Cenk ÖZLER

ANADOLU ÜNİVERSİTESİ ÖRNEK: GEOMETRİK DAĞILIM

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

CEVAPLAR. n = n 1 + n 2 + n 3 + n 4 + n 5 + n 6 + n 7 = = 11 dir.

ĐŞLE 544 ĐSTATĐSTĐK ARA SINAV 11 Mayıs 2006

RİSK ANALİZİ VE AKTÜERYAL MODELLEME

DENEY 2. A) Bilgi Dağılım Fonksiyonunun Bulunması 1. ÖN BİLGİ

Ankara Üniversitesi, SBF İstatistik 2 Ders Notları Prof. Dr. Onur Özsoy 1

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

Appendix C: İstatistiksel Çıkarsama

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

İstatistik ve Olasılık

İstatistik 1. Bölüm 5 Olasılık Teorisi ve Kesikli Olasılık Dağılımları. Ankara Üniversitesi SBF, GYY

İstatistik ve Olasılık

KİMYASAL ANALİZ KALİTATİF ANALİZ (NİTEL) (NİCEL) KANTİTATİF ANALİZ

Stokastik Süreçler. Bir stokastik süreç ya da rastgele süreç şöyle tanımlanabilir.

KESİKLİ DÜZGÜN DAĞILIM

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

ARALIK TAHMİNİ (INTERVAL ESTIMATION):

İSTATİSTİK VE OLASILIK SORULARI

4) Seyrek rastlanılan bir hastalık için belli bir zaman araalığında bu hastalığa yakalananların sayısının gözlenmesi,

İSTATİSTİK EXCEL UYGULAMA

Appendix B: Olasılık ve Dağılım Teorisi

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

2. Aşağıdaki pseudocode ile verilen satırlar işletilirse, cnt isimli değişkenin son değeri ne olur?

İSTATİSTİK II. Hipotez Testleri 1

Transkript:

Deney Dizaynı ve Veri Analizi Ders Notları Binom dağılım fonksiyonu: Süreksiz olaylarda, sonuçların az sayıda seçenekten oluştuğu durumlarda kullanılır. Bir para atıldığında yazı veya tura gelme olasılığı nedir? % 5. Aslında bu ne demek? Bir para çok sayıda atıldığında yazı ve tura gelme sayıları birbirine eşit gibidir. Dolayısıyla yazı veya tura gelme olasılığı asimptotik olarak % 5 ye yaklaşır. İki parayı aynı anda attığımızdaki olasılıklar nedir? 4 tane farklı diziliş vardır. İkisi tura, ikisi yazı, biri yazı biri tura ve biri yazı diğeri tura. Her birini olma olasılığı % 5tir. Birinin yazı birinin tura olma olasılığı için olasılıkları toplamamız gerekir. (Birincinin Y, ikincinin T ve birincinin T, ikincinin Y gelme olasılığı). Cevap % 5 dir. Bu olayı genelleştirirsek: n tane para aynı anda havaya atıldığında tanesinin yazı olma olasılığı nedir? P(;n) =? n tane para atıldığında n olasılık bulunmaktadır. Her birinin olma olasılığı eşit olduğundan herhangi bir tanesinin gerçekleşme olasılığı / n dir. Bunlardan kaçı tanesinin yazı gelme olasılığına katkıda bulunur? Bu olayı anlatan dağılıma binom dağılımı denir. Genel ifadesi aşağıdaki gibidir: n n! P; n; p! n! p: olayın başarı olasılığı, q=-p n p q p p n Bir örnekle açıklayalım: Bir para ard arda 3 kez atılıyor. Bu atışlarda kez tura gelme olasılığı nedir? p=/, n=3, = 3 P ;3; 3!!! 3 8 Bu dağılımın standart sapması ve ortalaması nedir? Tanımları kullanarak: (İstatistik kitaplarında genellikle ortalama için kullanılan harfi kullanalım. Karışıklık olmaması adına ortalamayı μ harfi ile gösterelim.) n i n! p! n! p n np Bu sonucun anlamı nedir? Bir deneyi n kez tekrar ettiğinizde ve kez başarı olduğunda, ortalama başarı olma sayısı n.p ye eşit olacaktır. Varyans değerine göz atarsak:

Binom Dağılım n n! p i! n! n p np p Dağılımın grafiği ise aşağıdaki gibidir. Binom Dağılım, μ=5,p=.5,3,5,,5,,5 3 4 5 6 7 8 9 Bu tip bir dağılımı nerelerde kullanabiliriz? Örneğin, geliştirilen yeni bir ürünün başarılı olup olmadığı hakkında bir fikir sahibi olmak istediğimizde: Diyelim ki ; benzin tüketimini azaltan bir katkı geliştirdik. Bir depoda km. daha fazla yol alabileceğiz. Bunu nasıl test edebiliriz? Burada istatistiksel bir hipotez geliştireceğiz. Bunun en basit örneği sıfır hipotezi. Birbirinin aynı iki araç aynı miktar benzinle ne kadar yol alacak. Eğer geliştirilen katkı yaralı ise, bir tanesi km. daha fazla yapacaktır. Ama bu her seferinde olacak mı, ya da seferden kaçında bu durum olduğunda ürün başarılı sayılabilir? 9,8,6? Eğer bu katkının hiçbir faydası yoksa, her iki aracın katedeceği yol birbirine eşit olur, dolayısıyla aynı yolu katetme olasılıkları.5 tir. tekrar için bu olasılık:! Pv;; v v!( v)! tekrarın sonunda katkılı aracın her defasında km. fazla gitme olasılığı (/) = %. tekrarın sonunda aracın 8 veya daha fazla defa km. fazla gitme olasılığı =P(8)+P(9)+P() = %5 olacaktır. Yine de bu olasılığın düşük olduğunu görebiliriz. (her seferinde km. fazla gitme olasılığına göre daha fazla tabii ki) Bu tip testlerde bir % kabul edilip, (mesela % 5), testin başarılı olup olmadığına karar verilir. Bu durumda sıfır hipotezi kabul/red edilir. Bu tip testlere parametresiz test (nonparametric test) denir. Daha farklı parametreler eklenmeden (örneğin, değişik yol koşulları, sıcaklık, hız vb) basit sonuçlar üretirler.

Poisson dağılım fonksiyonu: Poisson dağılımı, daha çok rastgele olan ama yine de belli bir ortalaması olan olayların sayma işlemlerinde kullanılır. Örneğin, radyoaktif bir maddenin yarılanma sürecinin sayılması, bir hastanede belli bir süre içinde yapılan doğumların sayımı vb. gibi. Bu dağılım aslında Binom dağılımın özel bir durumudur: Başarılı olma sayısının çok küçük olduğu durumlar. Yani μ<<n çünkü p<<. Şu halde uygulama zorlaşır. Genellikle bu tip deneylerde ne n ne de p tam olarak bilinir. Bunun yerine beklenen ortalama olay sayısı ya da yaklaşık değeri bilinir. İşte bu gibi durumlarda Poisson dağılım fonksiyonu kullanılır. Olay, ve ortalamaya bağlı olmak üzere analitik olarak anlatılır. p<< durumu için binom dağılım fonksiyonunu incelersek: (n çok büyük) n.p nin sabit bir değer olduğunu kabul ediyoruz. P n ; n; p p p p n n! nn n n n n! tane çarpandan oluştuğunu kabul edebiliriz. <<n olduğuna göre çarpım asimptotik olarak n e yaklaşır. İkinci ve üçüncü terimlerin çarpımı (np) olur. Tüm bunları birleştirdiğimizde lim P ; n; p P, e p o! Poisson dağılımının ortalaması μ ve standart sapması ise μ dur: Örnek olarak, radyoaktif Thorium un yarılanma olayını inceleyelim: Bu maddenin alfa parçacığı yayma hızı.5 parçaçık/dak. dır. Eğer, iki dak. boyunca sayım yaparsak, kaç tane parçacık sayarız? Tam olarak bu sayıyı elde etme olasılığımız nedir? v tane parçaçık sayma olasılığımız nedir(v=,,, 3, 4, ve v 5)? dakika için beklenen ortalama değer (μ) = 3 Elbette her denemede dakika sonunda bu sayıya ulaşılmaz. Bu olasılığın Poisson dağılımı ile ifade edilebileceğini varsayabiliriz. Buna göre; v 3 3 P3 ( v) e 3! örneğin(v=3), tam olarak 3 parçaçık sayma olasılığı: 3 3 3 P 3(3) e. % 3!

olasılık Buradan görüleceği gibi her ne kadar beklenen ortalama değer 3 ise de bunun sağlanması yaklaşık 5 seferde olabilmektedir. Bu hesaplamaları yaparsak: v 3 4 olasılık.5.5...7 v=9 a kadar ki hesaplamalar yapıldığında aşağıdaki grafik elde edilir. Örneğin başında merak ettiğimiz olasılık ise (5 ya da daha fazla parçacık sayma olasılığı), v=,,...4 değerlerinin bulununup, den çıkartılması ile bulunur. ( % 9) Poisson dağılımı,5,,5,,5, 3 4 5 6 7 8 9 v Gauss (normal) dağılım Binom dağılımının bir diğer özel hali gözlem sayısı n çok büyük ve her bir başarı olasılığı n.p>> olması halidir. Bu dağılım aynı zamanda Poisson dağılımının da ortalama yüksek değer aldığı özel bir hali olmaktadır. Bu dağılım fonksiyonuna da Gauss ya da normal dağılım denir. Çok sıklıkla kullanılır. Aşağıdaki şekilde ifade edilir. Görüldüğü üzere diğer iki dağılımın aksine devamlı bir yapıdadır. P G ; ; e veya p () Burada standart sapmayı, ( ) ep, ise ortalama değeri göstermektedir. Normal dağılımın özelliklerini gözden geçirelim: Standart sapma normal dağılımda karakteristik genişlik olarak da adlandırılır. Devamlı bir fonksiyondur. Eğrinin altındaki alan e eşittir.

İki farklı standart sapma için normal dağılım fonksiyonları aşağıdaki şekilde görülmektedir. Grafiği incelediğimizde, standart sapmanın daha küçük değerde olması bize ne anlatır? Normal bir dağılımda en yüksek olasılık değeri ortalama değere karşılık gelen olasılıktır. P () Normal bir dağılımda ölçüm sonuçlarının yüzde dağılımı aşağıdaki gibi olacaktır. % 67 si ortalamanın aralığında % 95 i ortalamanın aralığında % 99.7 si ortalamanın 3 aralığında Normal bir dağılımda bir değerinin - aralığında olma olasılığı ( ) P( ) p()d ep Bu ifadede ve P( d d yerine konursa Bu ifade aşağıdaki gibi düzenlenebilir ) ep d d

I I ) P( Burada d ep ) I( I integral değerleri Tablo den bulunabilir.

Tablo. Değişik değerlerine karşılık I() değerleri, tüm değerlerin önünde. vardır. -------------------------------------------------------------------------------------------------------...3.4.5.6.7.8.9 -------------------------------------------------------------------------------------------------------. 399 798 97 595 994 39 79 388 3586. 3983 438 4776 57 5567 596 6356 6749 74 7355. 796 837 876 995 9483 987 57 64 6 49.3 79 7 55 93 337 3683 458 443 483 573.4 5554 59 676 664 73 7364 774 88 8439 8793.5 946 9497 9847 94 45 884 6 566 94 4.6 575 97 337 3565 389 45 4537 4857 575 549.7 584 65 644 673 735 7337 7637 7935 83 854.8 884 93 9389 9673 9955 334 35 3785 357 337.9 3594 3859 3 338 3639 3894 3347 33398 33646 3389. 3434 34375 3464 3485 3583 3533 35543 35769 35993 364. 36433 3665 36864 3776 3786 37493 37698 379 38 3898. 38493 38686 38877 3965 395 39435 3967 39796 39973 447.3 43 449 4658 484 4988 498 438 4466 46 4774.4 494 473 4 4364 457 4647 4786 49 4356 4389.5 4339 43448 43574 43699 438 43943 446 4479 4495 4448.6 445 4463 44738 44845 4495 4553 4554 4554 4535 45449.7 45543 45637 4578 4588 4597 45994 468 4664 4646 4637.8 4647 46485 4656 46638 467 46784 46856 4696 46995 476.9 478 4793 4757 473 4738 4744 475 47558 4765 4767. 4775 47778 4783 4788 4793 4796 483 4877 484 4869. 484 4857 483 4834 4838 484 4846 485 48537 48574. 486 48645 48679 4873 48745 48778 4889 4884 4887 48899.3 4898 48956 48983 49 4936 496 4986 49 4934 4958.4 498 49 494 4945 4966 4986 4935 4934 49343 4936.5 49379 4996 4943 4943 49446 4946 49477 4949 4956 495.6 49534 49547 4956 49573 49585 49598 4969 496 4963 49643.7 49653 49664 49674 49683 49693 497 497 497 4978 49736.8 49744 4975 4976 49767 49774 4978 49788 49795 498 4987.9 4983 4989 4985 4983 49836 4984 49846 4985 49856 4986 3. 9865 3.5 4997674 4. 4999683 4.5 4999966 5. 499999733 -------------------------------------------------------------------------------------------------------

Bu tabloyu nasıl kullanacağımızı gösteren bir örnek yapalım: Bir jet motorundaki yakıt akış miktarını belirlemek üzere kullanılan cihaz aşağıdaki sonuçları vermektedir. Okuma No Okunan Değer Okuma No Okunan Değer 3 4 5 6 7 8 9.5.477.794.67.73.588.6.734.77.486.559 3 4 5 6 7 8 9.64.687.7.67.7.573.7.8.553.65 a) Okunan değerlerin ortalamasını ve standart sapmasını bulun. n N i n i (.5.477.794.67.73...). 644 n i ( i ) (.5.644) (.477.644) (.794.644).... 98 b) Okunan değerlerin dağılımını normal kabul ederek okunan bir değerin.5 ile.7 arasında olma olasılığını hesaplayın. P( ) I I.7.644.5.644 P(.5.7) I I.98.98 P(.5.7) I(.57) I(.47).566 (.49).64 c).8 üzeri değer okuma olasılığı nedir? P(.8.8.644 I( ) I.5.444.56.98 d) Ortalama değer ile standart sapma değerleri arasında değer okuma olasılığı nedir? P( ) I() I( ).95