YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme İSTATİSTİK I KAVRAMLARININ GÖZDEN GEÇİRİLMESİ Hüseyin Taştan Yıldız Teknik Üniversitesi, İktisat Bölümü, email: tastan@yildiz.edu.tr YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 2 İSTATİSTİK BİLİMİNİN UĞRAŞI ALANLARI Veriden anlam çıkarılması, özetlenmesi Belirsizlik: neyin olduğu değil, neyin olası olduğu Örnekleme (sampling): anakütlenin (population) tümüne ait bilgi toplamak çoğu zaman imkansızdır. Bunun yerine anakütleye ilişkin analiz bu anakütleyi en iyi temsil eden bir örnekleme dayandırılabilir. İktisadi ilişkilerin analizi: Ekonometrinin alanı Kestirim (Prediction) Belirsizlik altında karar alma
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 3 İSTATİSTİK İSTATİSTİK I Olasılık Teorisi Rassal Değişkenler Kesikli ve Sürekli R.D. Olasılık Fonksiyonu Beklenen Değer, Moment Normal Dağılım Merkezi Limit Teoremi İSTATİSTİK II Örnekleme ve Örneklem Dağılımları Nokta ve Aralık Tahmini Hipotez Testi Regresyon ve Korelasyon Parametrik Olmayan Testler Varyans Analizi YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 4 RASSAL DEĞİŞKENLER ve OLASILIK DAĞILIMLARI Rassal (Stokastik) Değişken (r.d.) : Alacağı değer belli bir rassal denemenin sonucuna bağlı olan, bu değere ilişkin kesinlik bulunmayan değişken. Büyük harflerle göstereceğiz. x: rassal değişken X in aldığı belli bir değer. Kesikli r.d. : Alacağı değerler sayılabilir (sonlu ya da sonsuz) olan rassal değişkenler. Örneğin, iki zar atımında üste gelen sayıların toplamı, belli bir üretim bandında bir çalışanın yaptığı hata sayısı, bir bankaya 5 dk içinde gelen müşteri sayısı, vb. Sürekli r.d.: Belli bir aralıkta her hangi bir değeri alabilen rassal değişken. Bir çok iktisadi değişken bu gruba girer, örneğin, bir şehirdeki ortalama harcanabilir gelir, belli bir dönemdeki enflasyon oranı, İMKB endeksinin kapanış değeri, bir yılda yapılan toplam ihracat tutarı, vb.
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 5 OLASILIK DAĞILIMLARI - KESİKLİ f(x) ile göstereceğiz, f(x), f(x) = P(X = x), x f(x) =, Bu toplam x in alabileceği tüm değerler üzerinedir, Birikimli dağılım fonksiyonu: P(X x ) = F(x ) = x x f(x) YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 6 KESİKLİ OLASILIK DAĞILIMLARI Örnek: 3 para atılıyor ve tura (T) gelme sayısı X ile gösteriliyor. Bu deneyde ortaya çıkabilecek sonuçlar şunlardır: (TTT), (TTY), (TYT), (YTT), (TYY), (YTY), (YYT), ve (YYY). Bu 8 sonuç karşılıklı olarak bağdaşmazdır ve herbirinin gelme olasılığı aynıdır. Olasılık: /8. X in alabileceği değerler:,, 2, and 3. X rassal değişkeninin dağılımını bulalım.
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 7 Sonuçlar x f(x) YYY /8 YYT YTY 3/8 TYY YTT 2 TYT 2 3/8 TTY 2 TTT 3 /8 YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 8 X in olasılık dağılımı: x f(x) = x 2 3 f(x) = P(X = x) 8 3 8 3 8 8 P(X ) =? P( X 3) =?
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 9 X in birikimli olasılık dağılımı F(x) = P(X x) =, x < ; 8, x < ; 2, x < 2; 7 8, 2 x < 3;, x 3. YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme.4 OLASILIK FONKSIYONU.35.3.25 f(x).2.5..5.5.5.5 2 2.5 3 3.5 4 x BIRIKIMLI OLASILIK FONKSIYONU.8.6 F(x).4.2.5.5.5 2 2.5 3 3.5 4 x
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme Kesikli r.d. lerin BEKLENEN DEĞERLERİ Kesikli r. d. X in beklenen değeri E(X) = x xf(x) g(x), X in bir fonksiyonu olsun, g(x) in beklenen değeri E(g(X)) = x g(x)f(x) YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 2 ÖRNEK Önceki örnekte X in beklenen değerini bulun. E(X) = 8 + 3 8 + 23 8 + 3 8 = 3 2 (i) g(x) = x 2 nin beklenen değerini bulun. E(X 2 ) = 8 + 3 8 + 43 8 + 9 8 = 3
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 3 Kesikli r.d. lerin VARYANSları Tanım: V ar(x) = E [(X E(X)) 2] = E [ (X 2 2XE(X) + (E(X)) 2 ) ] = E ( X 2) 2E (XE(X)) + E ( (E(X)) 2 ) ) = E ( X 2) 2E(X) 2 + (E(X)) 2 = E ( X 2) E(X) 2 µ x = E(X) dersek varyans olarak yazılabilir. V ar(x) = E ( X 2) µ 2 x YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 4 Kesikli r.d. lerin MOMENTLERİ Tanım: Kesikli r.d. X in knci momenti µ k = E(X k ) = x x k f(x) k =,,2,.... moment µ = E(X) = populasyon ortalaması 2. moment µ 2 = E(X 2 ) = V ar(x) + µ 2 3. moment µ 3 = E(X 3 ) 4. moment µ 4 = E(X 4 )
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 5 Kesikli r.d. lerin MERKEZİ MOMENTLERİ Tanım: Kesikli r.d. X in knci merkezi momenti m k = E((X µ ) k ) = x (x µ ) k f(x) k =,,2,.... merkezi moment m = 2. merkezi moment m 2 = E((X µ ) 2 ) = V ar(x) 3. merkezi moment m 3 = E((X µ ) 3 ) 4. merkezi moment m 4 = E((X µ ) 4 ) YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 6 Kesikli r.d. lerin STANDART MOMENTLERİ Tanım: Kesikli r.d. X in knci standart momenti γ k = m k σ k k =,,2,... Burada σ populasyon standart sapmasıdır: σ = V ar(x) = E [(X µ ) 2]. standart moment γ = 2. standart moment γ 2 = neden? 3. standart moment γ 3 = m 3 σ 3 4. standart moment γ 4 = m 4 σ 4 çarpıklık (skewness) basıklık (kurtosis)
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 7 Bazı Kesikli Dağılımlar Bernoulli Binom Hipergeometrik Poisson YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 8 Bernoulli(p) Dağılımı: p, if X = f(x) = p, if X = Beklenen Değer: E(X) = x xf(x) = p + ( p) = p İkinci Moment: E(X 2 ) = x x 2 f(x) = p + ( p) = p Varyans (ikinci merkezi moment): V ar(x) = E(X 2 ) (E(X)) 2 = p p 2 = p( p)
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 9 BİNOM DAĞILIMI X, n bağımsız Bernoulli denemesinde değerini alma (başarı) sayısı olsun. Yani eğer Y Bernoulli(p) ise X = (Y ), Binom(n,p) dağılımına uyar. X toplam başarı sayısı. f(x) = n p x ( p) n x n! = x x!(n x)! px ( p) n x, x =,,2,...,n E(X) = np V ar(x) = np( p) YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 2 HİPERGEOMETRİK DAĞILIM Eğer Bernoulli denemeleri birbirinden bağımsız değilse, toplam başarı sayısı Binom dağılımına uymaz. İçinde B tane başarı bulunan N nesneli rassal bir örneklemde, toplam başarı sayısı X in olasılık dağılımı f(x) = B x N B n x N n Burada x max(,n (N B)) ve min(n,b) arasında tamsayı değerler alabilir E(X) = np, V ar(x) = N n np( p), N p = B N
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 2 POISSON DAĞILIMI Bir olayın belli bir zaman diliminde gerçekleşme sayısı Notasyon: X P oisson(λ), pmf: f(x,λ) = λx e λ, x =,,2,... x! E(X) = λ V ar(x) = λ skewness = λ excess kurtosis = λ YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 22 Kesikli r.d. için ORTAK DAĞILIMLAR ORTAK OLASILIK FONKSİYONU: Birden fazla r.d. in ortak davranışını betimlemek istiyoruz. Önce iki değişkenli durumu inceleyelim. X ve Y iki r.d. olsun. Bunların ortak olasılık fonksiyonu f(x,y) = P(X = x Y = y) Daha genel olarak X,X 2,...,X k k tane kesikli r.d. ise bunların ortak olasılık fonksiyonu şöyle olur: f(x,x 2,...,x k ) = P(X = x X 2 = x 2,,..., X k = x k )
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 23 X: Bir bankada nolu gişede sırada bekleyen müşteri sayısı, Y : Bir bankada 2 nolu gişede sırada bekleyen müşteri sayısı. Bu iki r.d. için ortak olasılık fonksiyonu aşağıdaki tabloda verilmiştir. y \ x 2 3 Toplam.5.2.26.2.26.8.54 2.6.7.2.5 3.3.2.5 Toplam.25.53.8.4. YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 24 MARJİNAL OLASILIK FONKSİYONU Ortak olasılık fonksiyonu biliniyorsa, bundan hareketle marjinal ya da tekil olasılık fonksiyonları elde edilebilir. X in marjinal olasılık fonksiyonu: f(x) = y f(x,y) Y nin marjinal olasılık fonksiyonu: f(y) = x f(x,y)
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 25 KOŞULLU OLASILIK FONKSİYONU Ortak olasılık fonksiyonu biliniyorsa, bundan hareketle koşullu olasılık fonksiyonları elde edilebilir. Y = y verilmişken X in koşullu olasılık fonksiyonu: f(x y) = f(x,y) f(y) X = x verilmişken Y nin koşullu olasılık fonksiyonu: f(y x) = f(x,y) f(x) YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 26 BAĞIMSIZLIK X ve Y r.d. lerinin istatistik bakımından bağımsız olduğunu söyleyebilmemiz için aşağıdaki koşulun sağlanması gerekir: Başka bir deyişle f(x,y) = f(x)f(y) f(x y) = f(x), vef(y x) = f(y)
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 27 KOVARYANS g(x,y ), X ve Y r.d. lerinin herhangi bir fonksiyonunu ifade etsin. Bu fonksiyonun beklenen değeri: E [g(x,y )] = g(x,y)f(x,y) x y g(x,y ) = (X µ x )(Y µ y ) olsun. Bu fonksiyonun beklenen değerine KOVARYANS denir: Cov (X,Y ) = (x µ x )(y µ y )f(x,y) x y YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 28 SÜREKLİ RASSAL DEĞİŞKENLER ve OLASILIK DAĞILIMLARI X sürekli bir r.d. ise verilmiş bir aralıkta herhangi bir değeri alabilir. Bir sürekli rassal değişkenin belli bir değere eşit olma olasılığından (kesikli r.d. gibi) bahsedemeyiz. Ancak verilmiş bir aralık içine düşme olasılıklarını bulabiliriz. f(x): olasılık yoğunluk fonksiyonu. Özellikleri: f(x) f(x)dx = Pr(a < X < b) = b a f(x)dx
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 29 f(x) P(a<X<b) = b a f(x)dx a b x YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 3 BİRİKİMLİ OLASILIK FONKSİYONU X sürekli r.d. için birikimli olasılık fonksiyonu, ya da dağılım fonksiyonu, X in belli bir x değerini aşmama olasılığı olarak tanımlanır ve F(x) ile gösterilir. F(x) = P(X x) = oyf ile dağılım fonksiyonu arasındaki ilişki: x f(x) = df(x) dx f(t)dt
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 3 BİRİKİMLİ OLASILIK FONKSİYONU F(x) in özellikleri: F( ) =, F(+ ) = Buna göre F(x), x in azalmayan bir fonksiyonudur. x x 2 olmak üzere F(x ) F(x 2 ). P(a < X < b) = F(b) F(a) = b a f(x)dx P( < X < + ) = P( < X < a)+p(a < X < b)+p(b < X < + ) f(x)dx = a f(x)dx + b a f(x)dx + + b f(x)dx F(+ ) F( ) = [F(a) F( )] + P(a < X < b) + [F(+ ) F(b)] = F(a) + P(a < X < b) + F(b) P(a < X < b) = F(b) F(a) YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 32 f(x) F(+ ) F(b) = F(b) F(a) F( ) = F(a) b a f(x)dx = F(b) F(a) a b x
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 33 SÜREKLİ r.d. lerin BEKLENEN DEĞERLERİ E(X) µ x = g(x), X in bir fonksiyonu ise, E(g(X)) = V ar(x) = xf(x)dx g(x)f(x)dx (x µ x ) 2 f(x)dx YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 34 İntegral özellikleri kullanılarak V ar(x) aşağıdaki gibi yazılabilir: V ar(x) = E [ (X E(X)) 2] = = = E(X 2 ) µ 2 x x 2 f(x)dx + µ 2 x ( x 2 f(x)dx xf(x)dx (x µ x ) 2 f(x)dx f(x)dx 2µ x xf(x)dx Burada f(x)dx = ve xf(x)dx = E(X) µ x özelliklerini kullandık. Bunu kesikli r.d.ler için de göstermiştik. ) 2
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 35 Sürekli r.d. lerin MOMENTLERİ Tanım: Sürekli r.d. X in knci momenti µ k = E(X k ) = x k f(x)dx k =,,2,... x X. moment µ = E(X) = populasyon ortalaması 2. moment µ 2 = E(X 2 ) = V ar(x) + µ 2 3. moment µ 3 = E(X 3 ) 4. moment µ 4 = E(X 4 ) YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 36 Sürekli r.d. lerin MERKEZİ MOMENTLERİ Tanım: Sürekli r.d. X in knci merkezi momenti m k = E((X µ ) k ) = (x µ ) k f(x)dx k =,,2,... x X. merkezi moment m = 2. merkezi moment m 2 = E((X µ ) 2 ) = V ar(x) 3. merkezi moment m 3 = E((X µ ) 3 ) 4. merkezi moment m 4 = E((X µ ) 4 )
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 37 BEKLENTİ İŞLEMCİSİNİN ÖZELLİKLERİ Doğrusallık: X rassal değişkeninin doğrusal bir fonksiyonu Y = a + bx olsun. Y nin beklenen değeri: E[Y ] = E[a + bx] = a + be(x) X,X 2,...,X n rassal değişkenlerinin aşağıdaki gibi bir fonksiyonu tanımlanıyor: Y nin beklenen değeri: ya da kısaca Y = b X + b n X 2 +... + b n X n E[Y ] = b E[X ] + b 2 E[X 2 ] +... + b n E[X n ] ( n ) E(Y ) = E b i X i = i= n b i E(X i ) i= YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 38 BEKLENTİ İŞLEMCİSİNİN ÖZELLİKLERİ X in doğrusal olmayan bir fonksiyonu için genellikle E[h(X)] h(e(x)) Örneğin, E(X2 ) (E(X)) 2, E(ln(X)) ln(e(x)) X ve Y gibi iki r.d. için E ( ) X E(X) Y E(Y )
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 39 VARYANSIN ÖZELLİKLERİ Herhangi bir c sabit sayısı için V ar(c) = Y = bx in varyansı, b sabit V ar(y ) = V ar(bx) = b 2 V ar(x) Y = a + bx in varyansı V ar(y ) = V ar(a + bx) = b 2 V ar(x) X ve Y iki bağımsız r.d. ise V ar(x + Y ) = V ar(x) + V ar(y ) V ar(x Y ) = V ar(x) + V ar(y ) Bu kural n r.d. için genelleştirilebilir. YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 4 Sürekli Standart Uniform (Tekdüze) Dağılım: Notation: X U(, ), oyf:, if < x <, f(x) = (), otherwise. E(X) = 2 V ar(x) = 2
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 4 (Genel) Uniform (Tekdüze) Dağılım: Notation: X U(a, b), oyf: b a if a < x < b, f(x;a,b) =, otherwise. E(X) = b a 2 Median = b a 2 (b a)2 V ar(x) = 2 Skewness = Excess kurtosis = 6 5 YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 42 X U(a,b) için beklenen değer ve varyans: E(X) = = b x a b a dx [ b 2 a 2 ] b a 2 (b a)(b + a) = 2(b a) = a + b 2
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 43 X U(a,b) için g(x) = x 2 fonksiyonunun beklenen değerini bulalım. E[g(x)] = b a x 2 b a = b3 a 3 3(b a) = (b a)(b2 + ab + a 2 ) 3(b a) = a2 + ab + b 2 3 = E[X 2 ]. YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 44 X U(a,b) için varyans: V ar(x) = E[(X E(X)) 2 ] = E(X 2 ) [E(X)] 2 = (a2 + ab + b 2 ) 3 (b a)2 = 2 (a + b)2 4
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 45 U (a,b) için dağılım fonksiyonu: F(x) = P(X x) = = x a b a dt x t b a = x a b a, a a x b aralığı için yazılabilir. Öyleyse X U(a, b) nin bof nu şöyle olur:, x < a için; F(x) = x a b a, a x b için;, x > b için. YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 46 f(x) F(x) b a a b x a b x
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 47 ÖRNEK: Aşağıda verilen fonksiyonu düşünelim. e x, < x < ise; f(x) =, değilse.. Bunun bir oyf olduğunu gösterin. 2. Bu fonksiyunun grafiğini çizin ve X > olasılığı ile ilgili alanı işaretleyin. 3. P(X > ) olasılığını hesaplayın. 4. Birikimli olasılık fonksiyonunu bulun. YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 48 CEVAP:. Olasılık yoğunluk fonksiyonları özelliklerini sağlayıp sağlamadığına bakalım: (a) (i) İlk olarak, f(x) koşulunun < x < aralığındaki her x değeri için sağlandığı açıktır. (b) (ii) Ayrıca, x in değerler aralığında oyf nin integralinin olması gerekir. e x dx = e x = e ( e ) = + = e = lim x e x = olarak düşünülmelidir. Bu koşul da sağlandığına göre fonksiyon bir oyf dir.
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 49. P(X > ) olasılığı grafikte gösterilmiştir. 2. P(X > ) = e x dx 3. F(x) = = e x = e.36787 x e t dt = e t x = e x + e = e x YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 5 Buradan birikimli olasılık fonksiyonu, x < ; F(x) = e x, < x <. olarak bulunur.
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 5 f ( x ) oyf: f( x) =e x F ( x ) bof: f( x) = e x.9.9.8.8.7.7.6.5 P( X > ) = e x dx.6.5.4.4.3.3.2.2.. 2 3 4 5 x 2 3 4 5 x YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 52 ORTAK OLASILIK YOĞUNLUK FONKSİYONU X ve Y, sırasıyla, < X < + ve < Y < + aralıklarında tanımlı iki sürekli r.d. olsun. Bu iki r.d. için ortak olasılık yoğunluk fonksiyonu, f(x,y) ile gösterilir ve aşağıdaki gibi tanımlanır. f(x,y), Pr(a < X < b,c < Y < d) = f(x,y)dxdy =, d b c a f(x, y)dxdy.
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 53 f(x,y) = xye (x2 +y 2), x >, y >, için ortak olasılık yoğunluk fonksiyonu f(x,y).2.8.6.4.2..8.6.4.2 3 2.5 2.5 y.5.5 x.5 2 2.5 3 YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 54 Örnek: Aşağıda verilen iki değişkenli fonksiyonun bir ortak olasılık yoğunluk fonksiyonu olmasını sağlayacak k sabit sayısını bulun. Elde ettiğiniz ooyf nu kullanarak P ( < X < 2, < Y < 2) olasılığını bulun. k(x + y), < x <, < y < 2 ise; f(x,y) =, değilse.
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 55 Öncelikle f(x,y) > koşulunun sağlanabilmesi için k > olmalı. İkinci koşuldan hareketle 2 k(x + y)dxdy = 2 ( ) ( ) = k 2 + y dy = k 2 y + y2 2 2 = 3k = k = 3 bulunur. Öyleyse ooyf 3 (x + y), < x <, < y < 2 ise; f(x,y) =, değilse. YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 56 İstenen olasılık ooyf nun altındaki hacim olarak bulunur: P ( < X < 2 ) 2, < Y < 2 2 = (x + y) dxdy 3 ) = 3 2 ( 8 + 2 y dy = 3 ( ) 8 y + y2 2 4 = 7 24
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 57 MARJİNAL YOĞUNLUK FONKSİYONU X in myf: f(x) = İntegralin sınırları y nin tanım aralığıdır. f(x,y)dy Y nin myf: f(y) = İntegralin sınırları x in tanım aralığıdır. f(x,y)dx YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 58 Önceki örnekteki ooyf nu kullanarak X ve Y rassal değişkenlerinin marjinal olasılık yoğunluk fonksiyonlarını bulalım. 2 f(x) = (x + y)dy 3 = ) (xy + y2 2 3 2 = 2 (x + ) 3
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 59 Böylelikle X için moyf nu şöyle yazılır: 2 3 (x + ), < x < ise; f(x) =, degilse. Benzer şekilde Y nin moyf nu 3 g(y) = (y + 2 ), < y < 2 ise;, degilse. olur. YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 6 KOŞULLU OLASILIK YOĞUNLUK FONKSİYONU Y = y değeri verilmişken X in koşullu yoğunluk fonksiyonu: f(x y) = f(x,y) f(y) Benzer şekilde X = x verilmişken Y nin koşullu yoğunluk fonksiyonu f(y x) = f(x,y) f(x)
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 6 BAĞIMSIZLIK Hatırlarsak aşağıdaki koşul sağlanıyorsa A ve B bağımsız olaylardır denir: P(A B) = P(A)P(B) Benzer şekilde X ve Y iki bağımsız sürekli r.d. ise koşulu sağlanmalıdır. f(x,y) = f(x)f(y) i.e., ortak yoğunluk fonksiyonu, marjinal yoğunlukların çarpımı olarak yazılabiliyorsa bu iki r.d. birbirinden bağımsızdır. YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 62 BAĞIMSIZLIK: önceki koşul genelleştirilebilir. X,X 2,...,X n rassal değişkenlerinin ortak olasılık yoğunluk fonksiyonu marjinal yoğunluk fonksiyonlarının çarpımı olarak yazılabiliyorsa f(x,x 2,...,x n ) = f (x ) f 2 (x 2 ),..., f n (x n ) n = f j (x j ) bu rassal değişkenler birbirinden bağımsızdır denir. Bu özellik kullanılarak Maksimum Olabilirlik (Maximum Likelihood) tahmin edicileri türetilebilmektedir. Bu konuya Tahmin Yöntemleri başlığı altında değineceğiz. j=
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 63 BAĞIMSIZLIK ÖRNEK: Önceki örnekteki ortak oyf ve marjinal oyf nı kullanarak X ve Y nin bağımsız olup olmadığını bulalım. f(x)g(x) = 2 3 (x + ) 3 (y + 2 ) f(x,y) olduğundan X ve Y rassal değişkenleri bağımsız değildir. YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 64 BAĞIMSIZLIK ÖRNEK: Aşağıda verilen ooyf nu kullanarak moyf nı bularak bağımsız olup olmadıklarına karar verelim. 9, < x < 4, < y < 4 ise; f(x,y) =, degilse. Marjinal olasılık yoğunluk fonksiyonları Buradan f(x) = g(y) = 4 4 9 dy = 3 9 dx = 3 f(x,y) = 9 = f(x)g(y) = ( 3 ) ( ) 3 koşulu sağlandığı için X ve Y rassal değişkenleri bağımsızdır.
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 65 NORMAL DAĞILIM: Notasyon: X N(µ,σ 2 ) f(x;µ,σ 2 ) = σ 2π exp ( ) (x µ)2, < x < 2σ2 E(X) = µ V ar(x) = σ 2 skewness = kurtosis = 3 YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 66 Normal Dağılım oyf, σ 2 =, farklı lokasyon parametreleri (µ).4 Normal Dagilim, σ 2 =.35 µ = 2 µ = µ = 2 µ = 5.3.25 µ = 5 φ(x).2.5..5 8 6 4 2 2 4 6 8 x
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 67 Normal Dağılım oyf, µ =, farklı varyans (scale) parametreleri.4 Normal Dagilim, µ=.35.3 σ 2 =, µ =.25 φ(x).2 σ 2 = 2, µ =.5. σ 2 = 3, µ =.5 8 6 4 2 2 4 6 8 x YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 68 STANDART NORMAL DAĞILIM: Z = X µ σ, φ(z) = exp ( 2 ) 2π z2, < z < Birikimli dağılım fonksiyonu: Φ(z) = P(Z z) = E(Z) = V ar(z) = z exp ( 2 ) 2π t2 dt
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 69.4 STANDART NORMAL DAGILIM φ(z) STANDART NORMAL DAGILIM Φ(z).35.9.8.3.7.25.6.2.5.5.4.3..2.5. 4 3 2 2 3 4 4 3 2 2 3 4 YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 7 NORMAL DAĞILIM OLASILIKLARININ HESAPLANMASI X N(µ,σ 2 ) olsun. Aşağıdaki olasılığı hesaplamak istiyoruz: b ( P(a < X < b) = σ 2π exp ) (x µ)2 dx 2σ2 a Bu integralin açık bir çözümü yoktur. Ancak nümerik yöntemlerle istenen kesinlik düzeyinde hesaplanabilir. Bunun için her seferinde bilgisayarda hesap yapmak yerine, standart normal dağılım tablolarını kullanabiliriz. İstenen olasılığı aşağıdaki gibi yazalım: ( a µ P < X µ < b µ ) ( a µ = P σ σ σ σ < Z < b µ ) σ
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 7 NORMAL DAĞILIM OLASILIKLARININ HESAPLANMASI ( a µ P σ < Z < b µ ) ( b µ = Φ σ σ ) ( ) a µ Φ σ Burada Φ(z) = P(Z z) standart normal dağılımın z deki değeridir. Kitaptaki notasyonda Φ(z) yerine F(z) kullanıldığına dikkat edin. Standart Normal olasılık tablosu: Ek Çizelge 3 YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 72 NORMAL DAĞILIM OLASILIKLARININ HESAPLANMASI Bu tabloda sadece pozitif değerler için dağılım fonksiyonu değerleri verilmiştir. Negatif değerler için Φ(z) = P(Z z) nin simetri özelliği kullanılabilir: e.g.: Φ( z) = P(Z z) = P(Z z) = P(Z z) = Φ(z) P(Z.25) = Φ(.25) = Φ(.25) =.8944 =.56
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 73.4.35.3.25.2.5..5 4 3 2 2 3 4 YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 74.4.35.3 P(.25<Z<.25) = Φ(.25) Φ(.25) = Φ(.25) ( Φ(.25)) =.8944.56 =.7888.25.2.5. Φ(.25) =.56 Φ(.25) =.56.5 4 3 2 2 3 4
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 75 MERKEZİ LİMİT TEOREMİ (CENTRAL LIMIT THEOREM) X,X 2,...,X n herbirinin ortalaması µ ve varyansı σ 2 olan ve aynı dağılıma uyan n tane bağımsız r.d. olsun. Başka bir şekilde ifade etmek istersek: X i i.i.d (µ,σ 2 ), i =,2,...,n iid: türdeş (identical), ve bağımsız (independent) dağılımlı Burada dağılımın ne olduğunu belirtmediğimize dikkat edin. Bu r.d. lerin toplamlarının beklenen değeri ve varyansı: E[X + X 2 +... + X n ] = E[X ] + E[X 2 ] +... + E[X n ] = nµ V ar[x + X 2 +... + X n ] = V ar[x ] + V ar[x 2 ] +... + V ar[x n ] = nσ 2 YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 76 MERKEZİ LİMİT TEOREMİ (CENTRAL LIMIT THEOREM) Bu r.d. lerin toplamına X diyelim. Yani, X = X + X 2 +... + X n Z = X E(X) V ar(x) = X nµ nσ 2 = X n µ n /2 n σ = X µ σ/ n N(,) MLT ye göre gözlem sayısı arttıkça, yani, n, yukarıdaki ifade standart normal dağılıma yakınsar, yani, Z N(,)
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 77 2 n= 4 n= 2 4 n= 3 5 3 3 2 2 5.2.4.6.8.2.4.6.8.2.4.6.8 6 n= 5 n= 3 6 n= 5 4 4 3 4 2 2 2.2.4.6.8.2.3.4.5.6.7.35.4.45.5.55.6.65 6 n= 75 6 n= 6 n= 4 4 4 2 2 2.35.4.45.5.55.6.65.35.4.45.5.55.6.65.44.46.48.5.52.54.56 YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 78 BÜYÜK SAYILAR KANUNU (LAW of LARGE NUMBERS) Merkezi Limit Teoremi, Büyük Sayılar Kanunu ile yakından ilişkilidir. Büyük Sayılar Kanununa göre, türdeş dağılımlı (aynı anakütle beklenen değeri µ ve varyansına σ 2 sahip), birbirinden bağımsız ve sonlu varyanslı n r.d. in aritmetik ortalaması (örneklem ortalaması) n büyüdükçe anakütle ortalamasına yakınsar. X n = n (X + X 2 +... + X n ) örneklem ortalaması olsun. Büyük sayılar yasasına göre n, X n µ Başka bir deyişle, istediğimiz kadar küçük seçebileceğimiz ǫ gibi pozitif herhangi bir sayı için: lim P [ X n µ < ǫ ] = n
YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 79 MERKEZİ LİMİT TEOREMİ ÖRNEK: X,X 2,...,X 2 birbirinden bağımsız ve herbiri U (,b), b > dağılımına sahip rassal değişkenler olsun. Merkezi Limit Teoremini kullanarak P( b 4 < X < 3b 4 ) olasılığının yaklaşık.9973 olduğunu gösterelim. CEVAP: Bu 2 bağımsız r.d. uniform anakütleden geldiğine göre önce anakütledeki ortalama ve varyansı bulmamız gerekir. Uniform(a,b) dağılım için beklenen değer ve varyans olduğuna göre, örneğimizde µ x = b + a 2, σ2 x = (b a)2 2 olur. µ x = b 2, σ2 x = b2 2 YTÜ-İktisat İstatistik II İstatistik I Gözden Geçirme 8 MERKEZİ LİMİT TEOREMİ V ar(x) = σ2 x n = b2 44 CEVAP (devam): MLT yi kullanarak: P ( b 4 < X < 3b ) 4 = P ( b 4 b 2 b 2 < X µ 3b x σ 2 x /n < 4 ) b 2 b 2 = P( 3 < Z < 3) = Φ(3) ( Φ(3)) =.99865 (.99865) =.9973