YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları BASİT RASSAL ÖRNEKLEME N tae ese arasıda taelik bir öreklem seçilmesii istediğii düşüelim. eseli olaaklı her öreklemi seçilme şasıı eşit kıla seçim sürecie rassal örekleme (radom samplig) deir. Amaç: Öreklem bilgisie dayaarak aakütleye ilişki çıkarsamalar yapmak Bu çıkarsamalar aakütlede çekile öreklem bilgisii belli bir foksiyou ola bir istatistiğe dayaır. Bu istatistiği örekleme dağılımı, bu aakütlede çekilebilecek ayı büyüklükteki bütü öreklemlerde sözkousu istatistiği alabileceği değerleri olasılık dağılımıdır. YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 2 BASİT RASSAL ÖRNEKLEME boyutlu Rassal Öreklem: X,X 2,...,X, Bu r.d. leri aldığı belirli değerler: x,x 2,...,x Rassal Öreklem: her biri diğeride bağımsız ve ayı dağılıma sahip, f(x i ), i,2,..., Kısaca X i i.i.d f(x i ), i,2,..., Bağımsızlık özelliğide hareketle Ortak olasılık foksiyou (sürekli ise yoğuluğu): f(x,x 2,...,x ) f (x ) f 2 (x 2 ),..., f (x ) f j (x j ) j
YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 3 BETİMLEYİCİ ÖRNEK Populasyo: {6,9,2,5,8}, N 5 f(x) /5 farzedelim. Olasılık foksiyou şöyle yazılabilir: x 6 9 2 5 8 f(x) P(X x) 5 Populasyo ortalaması, varyası ve medyaıı bulalım. E(X) µ 6 5 + 9 5 + 2 5 + 5 5 + 8 5 2 E(X 2 ) 36 5 + 8 5 + 44 5 + 225 5 + 324 5 62 V ar(x) σ 2 E(X 2 ) µ 2 62 44 8 Med(X) 2, Şimde bu 5 eseli aakütlede 3 eseli öreklemler çekmek istediğimizi düşüelim. 5 5 5 5 Olaaklı tüm öreklemleri toplam sayısı: 5 3 5 C 3 0 Öreklem ortalaması (X) ve medyaı (m) ve öreklem varyasıı s 2 örekleme dağılımlarıı bulalım. YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 4 BETİMLEYİCİ ÖRNEK (devam) Öreğimizdeki populasyoda sadece 5 ese buluduğuda olaaklı tüm öreklemleri (0 tae) listeleyip, herbiri içi öreklem istatistiklerii hesaplayabiliriz: x x i s 2 (x i x) 2 m medya(x)
YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 5 BETİMLEYİCİ ÖRNEK (devam) Olaaklı tüm öreklemler içi öreklem istatistikleri Öreklem o Öreklem değerleri x m s 2 6, 9, 2 9 9 9 2 6, 9, 5 0 9 2 3 6, 9, 8 9 39 4 6, 2, 5 2 2 5 6, 2, 8 2 2 36 6 6, 5, 8 3 5 39 7 9, 2, 5 2 2 9 8 9, 2, 8 3 2 2 9 9, 5, 8 4 5 2 0 2, 5, 8 5 5 9 YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 6 BETİMLEYİCİ ÖRNEK (devam) Öreklem ortalamasıı örekleme dağılımı x 9 0 2 3 4 5 f(x) P(X x) 0. 0. 0.2 0.2 0.2 0. 0. Öreklem ortalamasıı beklee değeri: E ( X ) µ X xf(x) 9(0.) +... + 5(0.) 2 ( E X 2) x 2 f(x) 8(0.) +... + 225(0.) 47 V ar ( X ) ( E X 2) µ 2 47 44 3 X
YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 7 BETİMLEYİCİ ÖRNEK (devam) Öreklem medyaıı örekleme dağılımı m 9 2 5 f(m) P(M m) 0.3 0.4 0.3 E(m) µ m 2 V ar(m) σ 2 m 5.4 YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 8 BETİMLEYİCİ ÖRNEK (devam) Öreklem varyasıı örekleme dağılımı s 2 9 2 36 39 f(s 2 ) P(S 2 s 2 ) 0.3 0.4 0. 0.2 E(S 2 ) s 2 f(s 2 ) 9(0.3) + 2(0.4) + 36(0.) + 39(0.2) 22.5 Solu aakütle düzeltmesi yaparsak: E(S 2 ) N N 5 4 σ2 22.5
YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 9 ÖRNEKLEM ORTALAMASININ ÖRNEKLEME DAĞILIMI Ortalaması µ, varyası σ 2 ola bir aakütlede çekilmiş boyutlu bir rassal öreklem: X,X 2,...,X Amaç: (Bilimeye) populasyo ortalaması µ içi çıkarasama yapmak. Bu amaçla öreklem ortalaması kullaılabilir: X Beklee değer: E ( X ) ( ) E X i X i E(X i ) (µ + µ +... + µ), X ler türdeş dağıldığı içi µ µ YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 0 Gözlem sayısı arttıkça, öreklem ortalaması aakütle ortalamasıa yakısar:, X µ
YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları ÖRNEKLEM ORTALAMASININ ÖRNEKLEME DAĞILIMI Öreklem ortalamasıı varyası: V ar ( X ) ( ) 2 V ar X i 2 V ar(x i ) 2 (σ2 + σ 2 +... + σ 2 ), X ler türdeş ve bağımsız dağıldığı içi 2 σ2 σ2 Rassal öreklem olma özelliklerii (türdeş ve bağımsız dağılma, i.i.d) kulladık. Gözlem sayısı arttıkça, öreklem ortalamasıı varyası 0 a yakısar:, V ar(x ) 0 Öreklem Ortalamasıı stadart hatası: sh(x) σ X σ YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 2 ÖRNEKLEM ORTALAMASININ ÖRNEKLEME DAĞILIMI Eğer öreklemdeki gözlem sayısı aakütledeki ese sayısı N i küçük bir oraı değilse, öreklemdeki tekil gözlemler birbiride bağımsız dağılmaz. Bu durumda, öreklem ortalamasıı varyasıı aşağıdaki gibi düzeltilmesi gerekir: V ar(x ) σ2 N N N geellikle bilimez ya da öreklem gözlem sayısıı toplam aakütle sayısıı çok küçük bir oraı olduğu kabul edilir. N sosuza giderke yukarıdaki düzeltme terimi e yaklaşır. Yukarıdaki düzeltme N i bilidiği her durum içi kullaılabilir. Aakütle ormal dağılıyorsa öreklem ortalamasıı örekleme dağılımı da ormal dağılır. Hatırlarsak, ormal dağılmış r.d. leri doğrusal foksiyoları da ormal dağılıma uymaktaydı: X N(µ,σ 2 ) ise a + bx N(a + bµ, b 2 σ 2 ) ( X i N(µ,σ 2 σ 2 ) ), i,2,..., ise X N µ,
YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 3 ÖRNEKLEM ORTALAMASININ ÖRNEKLEME DAĞILIMI Eğer X leri çekildiği aakütle ormal dağılıma uyuyorsa: Z X µ σ/ N(0,) Daha geel olarak, eğer X leri çekildiği aakütle ormal dağılıma uymuyorsa, gözlem sayısı arttıkça, yukarıdaki ifade asimptotik olarak doğrudur. Merkezi Limit Teoremide hareketle: Örekler: kitap s.252 örek 6.2 Z X µ σ/ N(0,) YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 4 ÖRNEKLEM ORANININ ÖRNEKLEME DAĞILIMI Rassal değişke X, başarı olasılığıı p ve toplam deeme sayısıı olduğu biom dağılımıda toplam başarı sayısıı ifade etsi: X Biom(,p), E(X) p, V ar(x) p( p) Öreklem başarı oraı ˆp, toplam başarı sayısıı gözlem sayısıa oraıdır: ˆp X Beklee değeri ve varyası: ( ) X E(ˆp) E E(X) p p ( ) X V ar(ˆp) V ar 2 V ar(x) p( p) p( p) 2 p( p) sh(ˆp) σˆp
YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 5 ÖRNEKLEM ORANININ ÖRNEKLEME DAĞILIMI Solu aakütle düzeltmesi (N biliiyorsa) V ar(ˆp) p( p) N N sh(ˆp) σˆp p( p) N N Öreklem yeterice büyükse ( 50 ya da p( p) > 9) Z ˆp p Örekler: kitap s.257 örek 6.4, 6.5 σˆp N(0,) YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 6 ÖRNEKLEM VARYANSININ ÖRNEKLEME DAĞILIMI Ortalaması µ, varyası σ 2 ola bir aakütlede çekilmiş boyutlu bir rassal öreklem: X,X 2,...,X Amaç: Populasyo varyası σ 2 içi çıkarasama yapmak. Bu amaçla öreklem varyası kullaılabilir: Beklee değer: s 2 (X i X) 2 E(s 2 ) σ 2 İspat: s 2 formülüde paratezi içie µ yu ekleyip çıkarır ve yeide
YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 7 düzelersek: ( Xi X ) 2 [ (Xi µ) (X µ) ] 2 [ (Xi µ) 2 2(X i µ)(x µ) + (X µ) 2] (X i µ) 2 2(X µ) (X i µ) + (X µ) 2 (X i µ) 2 2(X µ) 2 + (X µ) 2 (X i µ) 2 (X µ) 2 Burada X i X ve (X i µ) (X µ) bilgisii kulladık. YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 8 ÖRNEKLEM VARYANSININ ÖRNEKLEME DAĞILIMI s 2 Beklee değerii alırsak: E(s 2 ) (X i X) 2 E (X i µ) 2 (X µ) 2 ( ) (X i µ) 2 (X µ) 2 E ( (X i µ) 2) ( E (X µ) 2 ) }{{}}{{} σ 2 σ 2 (σ2 σ2 ) ( )σ2 σ 2
YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 9 ÖRNEKLEM VARYANSININ ÖRNEKLEME DAĞILIMI Aakütlei ormal dağıldığı varsayımı altıda gözlem değerlerii ortalamada sapmalarıı karelerii toplamıı aakütle varyasıa oraı ki-kare dağılımıa uyar: ( )s 2 σ 2 (X i X) 2 σ 2 χ 2 YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 20 Ki-kare dağılımıı özellikleri: Bağımsız stadart ormal dağıla rassal değişkeleri karelerii toplamı serbestlik derecesi toplam değişke sayısıa eşit ola ki-kare dağılımıa uyar: Eğer Z N(0,) ise Z 2 χ 2 Eğer Z i i.i.d. N(0,) i,2,..., ise Zi 2 χ 2 Tek parametreli bir dağılımdır. Geel durum içi serbestlik derecesii ν (u) ile göstereceğiz. χ 2 ν içi olasılık yoğuluk foksiyou f(x) Burada Γ gamma foksiyoudur: 2 ν/2 Γ(ν/2) xν/2 e x/2, x > 0, ν > 0 Γ(α) 0 x α e x dx, α > 0
YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 2 Ki-kare dağılımıı özellikleri (devam): χ 2 ν, ν serbestlik derecesiyle ki-kare dağılımıa uya bir r.d. ise beklee değer ve varyas: E(χ 2 ν) ν ve V ar(χ 2 ν) 2ν Bu özelliği kullaarak ( ) ( ) ( )s 2 ( )s 2 E, V ar 2( ) s 2 i varyası σ 2 ( ) 2 σ 4 σ 2 V ar(s 2 ) 2( ) V ar(s 2 ) 2σ4 Serbestlik derecesii alamı: tae (X i X) büyüklüğü ( ) tae bağımsız bilgiye eşdeğerdir. X ı tahmi edilmesi matematiksel alamda birbiride bağımsız terim sayısıı bir azaltır. YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 22 Ki-kare dağılımıı özellikleri (devam): Sağa çarpık bir dağılımdır. (3. stadart momet pozitif) Serbestlik derecesi (ν) arttıkça dağılım simetrik hale gelir, limitte ormal dağılıma yakısar. Ki-kare dağılımıı olasılıklarıı hesaplamak içi serbestlik derecesie göre kuyruk olasılıklarıı vere tablo (Ek Çizelge 5) kullaılabilir.
YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 23 0.5 ν serbestlik dereceli ki kare dagilimi 0.45 0.4 0.35 ν 2 0.3 0.25 0.2 ν 4 0.5 ν 6 0. ν 2 0.05 0 0 5 0 5 20 25 30 YTÜ-İktisat İstatistik II Örekleme ve Öreklem Dağılımları 24 0. ν0 serbestlik dereceli ki kare dagilimii olasilik yog.foks. 0.09 0.08 0.07 0.06 2 f(χ ) 0 0.05 0.04 0.03 2 P(χ >5.99) 0.0 0 0.02 0.0 0 0 5 0 5 20 25 30 χ 2 (0)