Deney Dizaynı ve Veri Analizi Ders Notları Binom dağılım fonksiyonu: Süreksiz olaylarda, sonuçların az sayıda seçenekten oluştuğu durumlarda kullanılır. Bir para atıldığında yazı veya tura gelme olasılığı nedir? % 5. Aslında bu ne demek? Bir para çok sayıda atıldığında yazı ve tura gelme sayıları birbirine eşit gibidir. Dolayısıyla yazı veya tura gelme olasılığı asimptotik olarak % 5 ye yaklaşır. İki parayı aynı anda attığımızdaki olasılıklar nedir? 4 tane farklı diziliş vardır. İkisi tura, ikisi yazı, biri yazı biri tura ve biri yazı diğeri tura. Her birini olma olasılığı % 5tir. Birinin yazı birinin tura olma olasılığı için olasılıkları toplamamız gerekir. (Birincinin Y, ikincinin T ve birincinin T, ikincinin Y gelme olasılığı). Cevap % 5 dir. Bu olayı genelleştirirsek: n tane para aynı anda havaya atıldığında tanesinin yazı olma olasılığı nedir? P(;n) =? n tane para atıldığında n olasılık bulunmaktadır. Her birinin olma olasılığı eşit olduğundan herhangi bir tanesinin gerçekleşme olasılığı / n dir. Bunlardan kaçı tanesinin yazı gelme olasılığına katkıda bulunur? Bu olayı anlatan dağılıma binom dağılımı denir. Genel ifadesi aşağıdaki gibidir: n n! P; n; p! n! p: olayın başarı olasılığı, q=-p n p q p p n Bir örnekle açıklayalım: Bir para ard arda 3 kez atılıyor. Bu atışlarda kez tura gelme olasılığı nedir? p=/, n=3, = 3 P ;3; 3!!! 3 8 Bu dağılımın standart sapması ve ortalaması nedir? Tanımları kullanarak: (İstatistik kitaplarında genellikle ortalama için kullanılan harfi kullanalım. Karışıklık olmaması adına ortalamayı μ harfi ile gösterelim.) n i n! p! n! p n np Bu sonucun anlamı nedir? Bir deneyi n kez tekrar ettiğinizde ve kez başarı olduğunda, ortalama başarı olma sayısı n.p ye eşit olacaktır. Varyans değerine göz atarsak:
Binom Dağılım n n! p i! n! n p np p Dağılımın grafiği ise aşağıdaki gibidir. Binom Dağılım, μ=5,p=.5,3,5,,5,,5 3 4 5 6 7 8 9 Bu tip bir dağılımı nerelerde kullanabiliriz? Örneğin, geliştirilen yeni bir ürünün başarılı olup olmadığı hakkında bir fikir sahibi olmak istediğimizde: Diyelim ki ; benzin tüketimini azaltan bir katkı geliştirdik. Bir depoda km. daha fazla yol alabileceğiz. Bunu nasıl test edebiliriz? Burada istatistiksel bir hipotez geliştireceğiz. Bunun en basit örneği sıfır hipotezi. Birbirinin aynı iki araç aynı miktar benzinle ne kadar yol alacak. Eğer geliştirilen katkı yaralı ise, bir tanesi km. daha fazla yapacaktır. Ama bu her seferinde olacak mı, ya da seferden kaçında bu durum olduğunda ürün başarılı sayılabilir? 9,8,6? Eğer bu katkının hiçbir faydası yoksa, her iki aracın katedeceği yol birbirine eşit olur, dolayısıyla aynı yolu katetme olasılıkları.5 tir. tekrar için bu olasılık:! Pv;; v v!( v)! tekrarın sonunda katkılı aracın her defasında km. fazla gitme olasılığı (/) = %. tekrarın sonunda aracın 8 veya daha fazla defa km. fazla gitme olasılığı =P(8)+P(9)+P() = %5 olacaktır. Yine de bu olasılığın düşük olduğunu görebiliriz. (her seferinde km. fazla gitme olasılığına göre daha fazla tabii ki) Bu tip testlerde bir % kabul edilip, (mesela % 5), testin başarılı olup olmadığına karar verilir. Bu durumda sıfır hipotezi kabul/red edilir. Bu tip testlere parametresiz test (nonparametric test) denir. Daha farklı parametreler eklenmeden (örneğin, değişik yol koşulları, sıcaklık, hız vb) basit sonuçlar üretirler.
Poisson dağılım fonksiyonu: Poisson dağılımı, daha çok rastgele olan ama yine de belli bir ortalaması olan olayların sayma işlemlerinde kullanılır. Örneğin, radyoaktif bir maddenin yarılanma sürecinin sayılması, bir hastanede belli bir süre içinde yapılan doğumların sayımı vb. gibi. Bu dağılım aslında Binom dağılımın özel bir durumudur: Başarılı olma sayısının çok küçük olduğu durumlar. Yani μ<<n çünkü p<<. Şu halde uygulama zorlaşır. Genellikle bu tip deneylerde ne n ne de p tam olarak bilinir. Bunun yerine beklenen ortalama olay sayısı ya da yaklaşık değeri bilinir. İşte bu gibi durumlarda Poisson dağılım fonksiyonu kullanılır. Olay, ve ortalamaya bağlı olmak üzere analitik olarak anlatılır. p<< durumu için binom dağılım fonksiyonunu incelersek: (n çok büyük) n.p nin sabit bir değer olduğunu kabul ediyoruz. P n ; n; p p p p n n! nn n n n n! tane çarpandan oluştuğunu kabul edebiliriz. <<n olduğuna göre çarpım asimptotik olarak n e yaklaşır. İkinci ve üçüncü terimlerin çarpımı (np) olur. Tüm bunları birleştirdiğimizde lim P ; n; p P, e p o! Poisson dağılımının ortalaması μ ve standart sapması ise μ dur: Örnek olarak, radyoaktif Thorium un yarılanma olayını inceleyelim: Bu maddenin alfa parçacığı yayma hızı.5 parçaçık/dak. dır. Eğer, iki dak. boyunca sayım yaparsak, kaç tane parçacık sayarız? Tam olarak bu sayıyı elde etme olasılığımız nedir? v tane parçaçık sayma olasılığımız nedir(v=,,, 3, 4, ve v 5)? dakika için beklenen ortalama değer (μ) = 3 Elbette her denemede dakika sonunda bu sayıya ulaşılmaz. Bu olasılığın Poisson dağılımı ile ifade edilebileceğini varsayabiliriz. Buna göre; v 3 3 P3 ( v) e 3! örneğin(v=3), tam olarak 3 parçaçık sayma olasılığı: 3 3 3 P 3(3) e. % 3!
olasılık Buradan görüleceği gibi her ne kadar beklenen ortalama değer 3 ise de bunun sağlanması yaklaşık 5 seferde olabilmektedir. Bu hesaplamaları yaparsak: v 3 4 olasılık.5.5...7 v=9 a kadar ki hesaplamalar yapıldığında aşağıdaki grafik elde edilir. Örneğin başında merak ettiğimiz olasılık ise (5 ya da daha fazla parçacık sayma olasılığı), v=,,...4 değerlerinin bulununup, den çıkartılması ile bulunur. ( % 9) Poisson dağılımı,5,,5,,5, 3 4 5 6 7 8 9 v Gauss (normal) dağılım Binom dağılımının bir diğer özel hali gözlem sayısı n çok büyük ve her bir başarı olasılığı n.p>> olması halidir. Bu dağılım aynı zamanda Poisson dağılımının da ortalama yüksek değer aldığı özel bir hali olmaktadır. Bu dağılım fonksiyonuna da Gauss ya da normal dağılım denir. Çok sıklıkla kullanılır. Aşağıdaki şekilde ifade edilir. Görüldüğü üzere diğer iki dağılımın aksine devamlı bir yapıdadır. P G ; ; e veya p () Burada standart sapmayı, ( ) ep, ise ortalama değeri göstermektedir. Normal dağılımın özelliklerini gözden geçirelim: Standart sapma normal dağılımda karakteristik genişlik olarak da adlandırılır. Devamlı bir fonksiyondur. Eğrinin altındaki alan e eşittir.
İki farklı standart sapma için normal dağılım fonksiyonları aşağıdaki şekilde görülmektedir. Grafiği incelediğimizde, standart sapmanın daha küçük değerde olması bize ne anlatır? Normal bir dağılımda en yüksek olasılık değeri ortalama değere karşılık gelen olasılıktır. P () Normal bir dağılımda ölçüm sonuçlarının yüzde dağılımı aşağıdaki gibi olacaktır. % 67 si ortalamanın aralığında % 95 i ortalamanın aralığında % 99.7 si ortalamanın 3 aralığında Normal bir dağılımda bir değerinin - aralığında olma olasılığı ( ) P( ) p()d ep Bu ifadede ve P( d d yerine konursa Bu ifade aşağıdaki gibi düzenlenebilir ) ep d d
I I ) P( Burada d ep ) I( I integral değerleri Tablo den bulunabilir.
Tablo. Değişik değerlerine karşılık I() değerleri, tüm değerlerin önünde. vardır. -------------------------------------------------------------------------------------------------------...3.4.5.6.7.8.9 -------------------------------------------------------------------------------------------------------. 399 798 97 595 994 39 79 388 3586. 3983 438 4776 57 5567 596 6356 6749 74 7355. 796 837 876 995 9483 987 57 64 6 49.3 79 7 55 93 337 3683 458 443 483 573.4 5554 59 676 664 73 7364 774 88 8439 8793.5 946 9497 9847 94 45 884 6 566 94 4.6 575 97 337 3565 389 45 4537 4857 575 549.7 584 65 644 673 735 7337 7637 7935 83 854.8 884 93 9389 9673 9955 334 35 3785 357 337.9 3594 3859 3 338 3639 3894 3347 33398 33646 3389. 3434 34375 3464 3485 3583 3533 35543 35769 35993 364. 36433 3665 36864 3776 3786 37493 37698 379 38 3898. 38493 38686 38877 3965 395 39435 3967 39796 39973 447.3 43 449 4658 484 4988 498 438 4466 46 4774.4 494 473 4 4364 457 4647 4786 49 4356 4389.5 4339 43448 43574 43699 438 43943 446 4479 4495 4448.6 445 4463 44738 44845 4495 4553 4554 4554 4535 45449.7 45543 45637 4578 4588 4597 45994 468 4664 4646 4637.8 4647 46485 4656 46638 467 46784 46856 4696 46995 476.9 478 4793 4757 473 4738 4744 475 47558 4765 4767. 4775 47778 4783 4788 4793 4796 483 4877 484 4869. 484 4857 483 4834 4838 484 4846 485 48537 48574. 486 48645 48679 4873 48745 48778 4889 4884 4887 48899.3 4898 48956 48983 49 4936 496 4986 49 4934 4958.4 498 49 494 4945 4966 4986 4935 4934 49343 4936.5 49379 4996 4943 4943 49446 4946 49477 4949 4956 495.6 49534 49547 4956 49573 49585 49598 4969 496 4963 49643.7 49653 49664 49674 49683 49693 497 497 497 4978 49736.8 49744 4975 4976 49767 49774 4978 49788 49795 498 4987.9 4983 4989 4985 4983 49836 4984 49846 4985 49856 4986 3. 9865 3.5 4997674 4. 4999683 4.5 4999966 5. 499999733 -------------------------------------------------------------------------------------------------------
Bu tabloyu nasıl kullanacağımızı gösteren bir örnek yapalım: Bir jet motorundaki yakıt akış miktarını belirlemek üzere kullanılan cihaz aşağıdaki sonuçları vermektedir. Okuma No Okunan Değer Okuma No Okunan Değer 3 4 5 6 7 8 9.5.477.794.67.73.588.6.734.77.486.559 3 4 5 6 7 8 9.64.687.7.67.7.573.7.8.553.65 a) Okunan değerlerin ortalamasını ve standart sapmasını bulun. n N i n i (.5.477.794.67.73...). 644 n i ( i ) (.5.644) (.477.644) (.794.644).... 98 b) Okunan değerlerin dağılımını normal kabul ederek okunan bir değerin.5 ile.7 arasında olma olasılığını hesaplayın. P( ) I I.7.644.5.644 P(.5.7) I I.98.98 P(.5.7) I(.57) I(.47).566 (.49).64 c).8 üzeri değer okuma olasılığı nedir? P(.8.8.644 I( ) I.5.444.56.98 d) Ortalama değer ile standart sapma değerleri arasında değer okuma olasılığı nedir? P( ) I() I( ).95