Rastgele Değişkenlerin Dağılımları Mühendislikte İstatistik Yöntemler
Ayrık Rastgele Değişkenler ve Olasılık Dağılımları Yapılan çalışmalarda elde edilen verilerin dağılışı ve dağılış fonksiyonu her seferinde ampirik olarak belirlenemez. Bu nedenle olayın yapısı ve verilerin özelliği dikkate alınarak uygunluk gösterecekleri teorik populasyon dağılışı tahminlenir. Değerleri sayımla elde edilen değişkene kesikli değişken denir. Başka bir deyişle bir kesikli değişkenin birbirini izleyen değerleri arasında belirli boşluklar vardır. Değerleri ölçüm ya da tartımla elde edilen, bir başka anlatımla sayımla elde edilemeyen bir değişkene sürekli rassal değişken denir. Sürekli bir rassal değişkenin değerleri aralıklar halinde tanımlanır. Önemli bazı kesikli ve sürekli dağılışlarşunlardır:
Kesikli Dağı ğılış ışlar Binom Dağılşı Hipergeometrik Dağılış Poisson Dağılışı Negatif Biinom Dağılışı Multinom Dağılış... Sürekli Dağı ğılış ışlar Normal Dağılış Standart Normal Dağılış Üslü Dağılış Lognormal Dağılış Gamma Dağılış...
KESİKLİ (AYRIK, SÜREKSİZ) REASTGELE DEĞİKENLERİN DAĞILIMLARI Böyle bir rastgele değişkene ait çeşitli olayların olasılıkları; P( i ) P(X i ) şeklinde i değerlerinin hizasında birer düşey çizgi ile gösterilirse bu değişkenin olasılık kütle fonksiyonu (o.k.f) elde edilmiş olur. Düşey çizgilerin toplamı daima e eşittir. p( ) i i F( i ) P( X i ) Pratikte önem taşıyan bu fonksiyona eklenik dağılım fonksiyonu (e.d.f) denilir. F() fonksiyonu 0 dan e doğru gittikçe artan basamaklı bir fonksiyondur.
Örnek Bir trafik ışığında belirli bir anda durmakta olan araç sayısı X ile gösterilirse ve yapılan gözlemler sonucu aşağıdaki olasılıkların belirlenmiş olduğu kabul edilirse, bu değişkene ait olasılık kütle fonksiyonu ve eklenik dağılım fonksiyonunu çiziniz. p (0) 0.0 p () 0.20 p (2) 0.30 p (3) 0.20 p (4) 0.0 p (5) 0.0 p (6) 0.00 p (7) 0.00
Çözüm Olasılık Kütle Fonksiyonu (O.K.F.) p (0) 0.0 p () 0.20 p (2) 0.30 p (3) 0.20 p (4) 0.0 p (5) 0.0 p (6) 0.00 p (7) 0.00 F().20.00 0.80 0.60 0.40 0.20 0.00 p() 0,40 0,30 0,20 0,0 0,00 0 2 3 4 5 6 7 Eklenik Frekans Dağılımı (E.D.F) 0 2 3 4 5 6 7
Sürekli Rastgele Değişkenlerin Dağı ğılımları Sürekli rastgele değişkenin alabileceği değerlerin sayısı sonsuzdur. Sürekli rastgele değişkenin alabileceği değerlerin sayısı sonsuz, bu değerleri alma olasılıkları toplamı ise e eşit olacağından X şeklindeki basit olayların olasılıkları sıfıra gidecektir. Bu nedenle sürekli rastgele değişkenlerde basit olayların olasılıkları yerine değişkenin ile +d arasındaki bir aralıkta kalmasışeklindeki bileşik olayın olasılığını tanımlamak yoluna gidilir. Bu durumda Olasılık Yoğunluk Fonksiyonu (O.Y.F.): f (). d P ( < X + d)
Sürekli Rastgele Değişkenlerin Dağı ğılımları f() f(). d P( < X +d) o.y.f µ +d Olasılık Yoğunluk Fonksiyonu P( < X 2) 2 f ( ). d
Sürekli Rastgele Değişkenlerin Dağı ğılımları Değişkenin (-, + ) aralığında bir değer alması kesin (olasılığı olan) bir olay olduğuna göre f() daima f (). d koşuluna uyar. Sürekli değişken halinde eklenik dağılım fonksiyonunun tanımı değişmez: F() P(X ) Eklenik dağılım fonksiyonu daima şu koşulları sağlar: 0 F() F(- ) 0 F( ) ε>0 için F(+ε) F() F(2) - F() P( < X 2)
Dağılımların Parametreleri PARAMETRE Ortalama (Beklenen Değer) Varyans Standart Sapma Değişim Katsayısı Sürekli µ.p(). d Var E ( µ ).p(). d 2 Var C v µ Süreksiz Sınıflara Ayrılmamış Sınıflara Ayrılmış µ N m E i µ E i.f ( i ) N i i m 2 Var Var ( ).f ( ) N 2 ( i ) N i i i i
Dağılımların Parametreleri PARAMETRE Çarpıklık Katsayısı Basıklık Katsayısı Sürekli C k s ( µ ( µ ) ) 4 4 3 3.p().d.p().d Süreksiz Sınıflara Ayrılmamış Sınıflara Ayrılmış C s k N N N i N i ( ( i 3 i 4 ) ) 3 4 C k s m ( i m ( i i i ) 3 ) 4 4 3.f (.f ( i i ) )
Örnek Aşağıdaki frekans tablosuna göre, Ortalama, Varyans, Standart Sapma, Çarpıklık Katsayısı ve Basıklık Katsayısını bulunuz. Sınıf % f 0-20 9 20-30 8 30-40 8 40-50 27 50-60 8 60-70 9 Tarih Qma 2.3.98 2 4.2.982 22 0.3.983 45 7.2.984 37 22.3.985 48 20.4.986 67 2.4.987 5 0.3.988 45.5.989 34 2.3.990 59 2.4.99
Sınıf Sınıf Orta Noktaları (X) % f Ortalama Varyans Çarpıklık Basıklık [] [2] [3] [4][2]*[3] [5][2]-(40.05) 2 *[3] [6][2]-(40.05) 3 *[3] [7][2]-(40.05) 4 *[3] 0-20 5 0.09.35 56.48-44.70 35438.34 20-30 25 0.8 4.50 40.77-63.60 9234.6 30-40 35 0.8 6.30 4.59-23.8 7.07 40-50 45 0.27 2.5 6.62 32.75 62.0 50-60 55 0.8 9.90 40.23 60.45 899.6 60-70 65 0.09 5.85 56.03 397.83 34875.84 40.05 204.7-9.46 8889.57 Ortalama 40.05 Varyans 204.7 s Varyans 204.7 4.3 9.46 8889.57 Cs 0.0 k 2, 2 3 4 4.3 4.3
ÖNEMLİ OLASILIK DAĞILIM FONKSİYONLARI Binom Dağılımı Bir kesikli rastgele değişken için sadece 2 olay mevcutsa (olmak veya olmamak, ya da gerçekleşmek veya gerçekleşmemek gibi), ve bunların olasılıkları p ve q - p ile gösterilirse; n elemanlı bir örnek için olasılığı p olan olayın defa görülmesi olasılığı: P() n p q n n n(n )...(n + ).2...( )!(n n! )!
Rastgele değişkene ait birbirinden bağımsız n deneme yapılması durumunda olasılığı p olan olayın defa görülmesi olasılığı binom dağılımına uyar ve bu denemelere de istatistikte Bağımsız Bernoulli Denemeleri adı verilir.
Geometrik Dağılım Bağımsız Bernoulli denemelerinde ilk başarının inci denemede görülmesi olasılığı: P() q.p Bu dağılımın olasılık dağılım fonksiyonu ise: F() q şeklindedir. Parametreleri ise; E ( ) / p, Var( ) q / p 2
Dönüş aralığı T/p yıl olan bir olayın T yıllık bir süre içinde hiç görülmemesi olasılığı: ( p ) T Tp + T(T ) 2 p 2... şeklinde yazılabilir. T nin büyük değerleri için eşitliğin sağ tarafı e -Tp ye yaklaşır. Buna göre: P( 0) e -Tp e - p p e - 0.368 T50 yıl içinde hesaplanan değerin bu yaklaşık değere çok yakın olduğu görülmektedir.
Poisson Dağılımı Bir kesikli rastgele değişken için sadece 2 olay mevcut olsun(olmak veya olmamak, ya da gerçekleşmek veya gerçekleşmemek gibi), bunların olasılıkları p ve q - p ile gösterilsin. Ancak bu olaslıklardan biri çok küçükse ( p 0 ), buna karşılık n deneme sayısı çok büyükse ( n ) ve np çarpımı sonlu ise: n denemede olasılığı p olan olayın defa görülmesi olasılığı: P( ) µ. e! λ, µ n. p P( ) µ µ e.!
Sürekli Rastgele Değişkenlerin Dağı ğılımları Normal Dağılım (Gauss Dağılımı) f f ( ) e 2π 2 2 ( µ ) /(2 ) < < Dağılımın iki parametresi vardır: µ (- < µ < ) (rastgele değişkenin ortalaması) ( > 0) (rastgele değişkenin standart sapması)
Normal Dağı ğılım m (Gauss Dağı ğılımı) Normal dağılım simetrik bir dağılımdır. C s 0 (Çarpıklık Katsayısı) k 3 (kurtosis (basıklık) katsayısı) f() f() 2π e ( µ ) 2 /(2 2 ) O.Y.F - µ + X
Normal Dağı ğılım m (Gauss Dağı ğılımı) Bir rastgele değişkenin a ve b arasında bir değer alma olasılığı: b a 2 2 ( µ ) /(2 ) e 2π d Bu denklemin normal integrasyon teknikleri ile çözümü oldukça güçtür f() b a 2 2 ( µ ) /(2 ) e 2π d z µ standart normal değişken - a b + µ X Bu durumda normal dağılım, ortalaması µ 0, standart sapması olan standart normal dağılım adını alır. f ( z) e 2π 2 z / 2 < z <
Normal Dağılım Tablosu Standart Normal dağılım Eğrisi Altında Kalan Alan F() P (Z z) 0 z p z0.23 0.590 z 0.23 0.23 z µ 0,03 z 0.00 0.0 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0. 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0.5000 0.5040 0.5080 0.520 0.560 0.599 0.5239 0.5279 0.539 0.5359 0.5398 0.5438 0.5478 0.557 0.5557 0.5596 0.5636 0.5675 0.574 0.5753 0.5793 0.5832 0.587 0.590 0.5948 0.5987 0.6026 0.6064 0.603 0.64 0.679 0.627 0.6255 0.6293 0.633 0.6368 0.6406 0.6443 0.6480 0.657 0.6554 0.659 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.695 0.6950 0.6985 0.709 0.7054 0.7088 0.723 0.757 0.790 0.7224 0.7257 0.729 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.757 0.7549 0.7580 0.76 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.788 0.790 0.7939 0.7967 0.7995 0.8023 0.805 0.8078 0.806 0.833 0.859 0.886 0.822 0.8238 0.8264 0.8289 0.835 0.8340 0.8365 0.8389 p z0.8 0.790 p z0.65 0.7422
Normal Dağılım z 0 z z 0 z z z 0 z 2 P(X < ) P (Z < z) P(X > ) P (Z > z) P( <X < 2 ) P (z <Z < z 2 )
Normal Dağılım z nin (-) negatif değerleri Normal Dağılım tablosundan okunurken, dağılımın simetrikliğinden dolayı z nin (+) değerinin karşılığı tablodan okunur ve den çıkarılır. Alanları eşit z 0,25 p 0,25 0,590 z - 0,25 p -0,25 - z(+0,25) -z z 0 -(+z) P -0,25-0,5900,409
Sürekli Rastgele De rekli Rastgele Değişkenlerin Da kenlerin Dağı ğılımlar mları Log-normal Dağılım Rastgele değişkene y ln () şeklinde logaritmik dönüşüm uygulandığında dönüştürülmüş Y değişkeninin dağılımı normal ise X değişkeninin dağılımı lognormaldir - 0 - Cs > 0 - Normal dağılım tablosu kullanılır 0 + X 0 2 ) ( ) /(2 ] ) [ln( 2 2 e y f y y y µ π + 2 / 2 2 ln y µ µ µ 2 / 2 2 ln + y µ
Ekstrem Değer er Dağı ğılımları Dönüş Aralığı (Tekerrür Periyodu) p + q.0 p - q p /Tr q (/Tr) p aşılma olasılığı q aşılmama olasılığı Tr tekerrür periyodu
Ekstrem Değer er Dağı ğılımları Proje Periyodu ve Risk Proje hesaplarında gözönüne alınan Tr yıllık taşkın debisinin proje periyodu olan n yıllık bir süre içinde p n ile gösterilen bir aşılma olasılığı vardır ki bu olasılık kabul edilebilecek risk i ifade etmekte olup ekonomik düşüncelerle belirlenecek olan bir proje kriteridir. Dönüş Aralığı Tr yıl olan bir debinin n yıl boyunca hiç aşılmaması olasılığı; n qn Tr aşılması olasılığı ise; p n Tr n
Ekstrem Değer er Dağı ğılımları Sıralanmış Örnek Rank Frekans Dönüş Aralığı Risk California Weibull Hazen California Weibull Hazen California Weibull Hazen m/n m/(n+) (2m-)/2n n/m (n+)/m 2n/(2m-) -(-/Tr) N -(-/Tr) N -(-/Tr) N 435 0.083 0.077 0.042 2.0 3.0 24.0 0.648 0.67 0.400 345 2 0.67 0.54 0.25 6.0 6.5 8.0 0.888 0.865 0.799 256 3 0.250 0.23 0.208 4.0 4.3 4.8 0.968 0.957 0.939 234 4 0.333 0.308 0.292 3.0 3.3 3.4 0.992 0.988 0.984 67 5 0.47 0.385 0.375 2.4 2.6 2.7 0.998 0.997 0.996 54 6 0.500 0.462 0.458 2.0 2.2 2.2.000 0.999 0.999 27 7 0.583 0.538 0.542.7.9.8.000.000.000 20 8 0.667 0.65 0.625.5.6.6.000.000.000 90 9 0.750 0.692 0.708.3.4.4.000.000.000 87 0 0.833 0.769 0.792.2.3.3.000.000.000 56 0.97 0.846 0.875..2..000.000.000 45 2.000 0.923 0.958.0..0.000.000.000
Ekstrem Değer er Dağı ğılımları Log-Normal Dağılım Gumbel Dağılımı Pearson Tip III Dağılımı Log-Pearson Tip III Dağılımı
Ekstrem Değer er Dağı ğılımları GUMBEL DAĞILIMI Dağılımın genel OYF u: f ( ) e β µ β e e µ β Dağılımın yer parametresi µ 0 ölçek parametresi β alınırsa STANDART GUMBEL DAĞILIMI nın OYF si: f ( ) e -4-2 0 2 4 6 8 e e
Ekstrem Değer er Dağı ğılımları GUMBEL DAĞILIMI Kümülatif Dağılım Fonksiyonu (Minimum) : F ( ) e e -4-3 -2-0 2 3 4 Kümülatif Dağılım Fonksiyonu (Maksimum) : F ( ) e e (-) işaretine dikkat et -2-0 2 3 4
Ekstrem Değer er Dağı ğılımları Gumbel Dağılımı (Fisher Tippett I) Dağılımın OYF u ve Tekerrür periyodu p q e y y e e p q e e y Tr p e y a (X - X o ) Büyük örnekler için (N > 30) a.28255 X o µ 0. 45 Küçük örnekler için (N 30) a n X o µ Y n n
Gumbel Dağılımı (Fisher Tippett I) N Ÿn n N Ÿn n N Ÿn n N Ÿn n 0 0,495 0,950 33 0,539,22 56 0,55,70 79 0,557,93 0,500 0,968 34 0,540,26 57 0,55,7 80 0,557,94 2 0,504 0,983 35 0,540,28 58 0,55,72 8 0,557,95 3 0,507 0,997 36 0,54,3 59 0,552,73 82 0,557,95 4 0,50,009 37 0,542,34 60 0,552,75 83 0,557,96 5 0,53,02 38 0,542,37 6 0,552,76 84 0,558,97 6 0,55,03 39 0,543,39 62 0,553,77 85 0,558,97 7 0,58,040 40 0,544,4 63 0,553,78 86 0,558,98 8 0,520,048 4 0,544,44 64 0,553,79 87 0,558,99 9 0,522,056 42 0,545,46 65 0,554,80 88 0,558,99 20 0,524,063 43 0,545,48 66 0,554,8 89 0,558,200 2 0,525,069 44 0,546,50 67 0,554,82 90 0,559,20 22 0,527,075 45 0,546,52 68 0,554,83 9 0,559,20 23 0,528,08 46 0,547,54 69 0,555,84 92 0,559,202 24 0,530,086 47 0,547,56 70 0,555,85 93 0,559,203 25 0,53,09 48 0,548,57 7 0,555,86 94 0,559,203 26 0,532,096 49 0,548,59 72 0,555,87 95 0,559,204 27 0,533,0 50 0,549,6 73 0,555,88 96 0,559,204 28 0,534,05 5 0,549,62 74 0,556,89 97 0,560,205 29 0,535,09 52 0,549,64 75 0,556,90 98 0,560,205 30 0,536,2 53 0,550,65 76 0,556,9 99 0,560,206 3 0,537,6 54 0,550,67 77 0,556,9 00 0,560,206 32 0,538,9 55 0,550,68 78 0,557,92
Ekstrem Değer er Dağı ğılımları /p Pearson Tip III Dağılımı X µ + K. Frekans faktörü /T T Dönüş Aralığı (yıl):,00,052 6,,25 2 5 0 20 25 40 50 00 200 000 Aşılma Olasılığı (p) (%): 99 95 90 80 50 20 0 5 4 2,5 2 0,5 0, Cs 3,0-0,667-0,665-0,660-0,636-0,396 0,420,80 2,003 2,278 2,867 3,52 4,05 4,970 7,52 2,9-0,690-0,688-0,68-0,65-0,390 0,440,95 2,007 2,277 2,855 3,34 4,03 4,909 7,034 2,8-0,74-0,7-0,702-0,666-0,384 0,460,20 2,00 2,275 2,84 3,4 3,973 4,847 6,95 2,7-0,740-0,736-0,724-0,68-0,376 0,479,224 2,02 2,272 2,827 3,093 3,932 4,783 6,794
Ekstrem Değer er Dağı ğılımları
Ekstrem Değer Dağılımları Örnek : Bir istasyonda kaydedimiş 0 yıllık maksimum akımlar aşağıda verilmiştir. Normal, Log-Normal, Gumbel, Pearson Tip III ve Log-Pearson Tip III dağılımlarını kullanarak; a) 50 ve 00 yıl tekerrürlü gelmesi muhtemel akımı b) 80 m³/s değerinde bir akımın gelebileceği tekerrür periyodunu belirleyiniz Tarih 2/3/98 6 Qp (m³/s) 3/4/987 5/2/988 5/4/98 9 27//99 0 6/3/99 /4/992 6/2/99 3 7/4/99 4 2/3/99 5 95 25 0 80 30 45 00 90 5 84
Ekstrem Değer er Dağı ğılımları Weibull Q Rank p m m/(n+) 45 0.09 30 2 0.8 25 3 0.27 5 4 0.36 0 5 0.45 00 6 0.55 95 7 0.64 90 8 0.73 84 9 0.82 80 0 0.9
Ekstrem Değer er Dağı ğılımları T 240 0 00 000 220 200 80 Q 60 40 20 00 80 60,000 0,00 0,00 0,00 p
ÖRNEK Bir istasyonda kaydedimiş 0 yıllık maksimum akımlar aşağıda verilmiştir. Normal, Log-Normal, Gumbel, Pearson Tip III ve Log- Pearson Tip III dağılımlarını kullanarak; 50 ve 00 yıl tekerrürlü gelmesi muhtemel akımı 80 m³/s değerinde bir akımın gelebileceği tekerrür periyodunu belirleyiniz Yıl 986 987 988 989 990 99 992 993 994 995 Qp (m³/s) 95 25 0 80 30 45 00 90 5 84
Farklı yöntemlerle bulunan 50 ve 00 yıl tekerrürlü muhtemel debiler (m³/s) YÖNTEM Tr 50 yıl Tr 00 yıl Normal 5.3 57.2 Log - Normal 58.2 67.0 Gumbel 84. 200.0 Pearson Tip III 56.0 64.0 Log - Pearson Tip III 65.0 7.0
Log - Normal Dağılım z Y µ y y log(80) 2.023 0.086 2.70 µ y 2.023, y 0.086 z 2.70 için q 0.9965 p q 0.9965 0.0035 Tr / 0.0035 286 yıl
Gumbel Dağılımı q e e 0.044(X 96.26) e e 0.044(80 96.26) e e 3.685 e 0.025 0.975 Tr q 0.975 40 yıl Pearson Tip III Dağılımı µ 07.4, X 2..366 Cs 0.422 K X µ X 80 07.4 2.366 3.40 K 3.40 için T 333 yıl Tr / 0.003 333 yıl
Log - Pearson Tip III Dağılım µ y 2.023, y 0.086 Cs y 0.49 K Y µ y y log(80) 2.023 0.086 2.70 K 2.70 için Tr 200 yıl YÖNTEM Normal Log - Normal Gumbel Pearson Tip III Log - Pearson Tip III Q 80 m³/s 3333 yıl 286 yıl 40 yıl 333 yıl 200 yıl