CHAPTER 7: DISTRIBUTION OF SAMPLE STATISTICS Sampling from a Population Örnek: 2, 4, 6, 6, 7, 8 say lar ndan oluşan bir populasyonumuz olsun Bu say lardan 3 elemanl bir örneklem (sample) seçebiliriz. Bu elemanlar da 2, 6, 7 olsun. Bu 3 say n n ortalamas 5 tir. Ama populasyonumuzun ortalamas 5.5 tir. 1
Örneklemler seçmeye devam edersek Örneklem Ortalama 2, 6, 7 5 2, 7, 8 5.7 4, 7, 8 6.33 2, 4, 7 4.33 Burada 3 elemanl örneklemlerin ortalamalar n n ne kadar de¼gişebilece¼gi (4.33, 5,..., 5.66) hakk nda kir sahibi olduk (distribution of sample means) 2
Örneklem kullanman n (sampling) ve örneklem da¼g l m n (sampling distribution) bulman n en önemli yararlar ndan biri, örneklemin seçildi¼gi populasyonun da¼g l m normal olsun ya da olmas n, örneklemin da¼g l m n n normal da¼g l ma yaklaşt ¼g d r (Central Limit Theorem). Dolay s yla ileriki bölümlerde bir çok testi örneklem da¼g l m n n üzerinde uygulayabilece¼giz 3
Sampling Distribution of Sample Means We denote population mean with, and population variance with 2. Let s denote a random sample from this population by X, and the unknown elements of X by X 1 ; X 2 ; :::; X n : 4
The expectation of sample mean is de ned as follows: X = 1 np X n i where E( X) = Proof: i=1 E( X) = E( 1 n (X 1 + X 2 + ::: + X n )) = n n = This proof follows the fact that each unknown observation has an expected mean of 5
The variance of sample mean is de ned as: Proof: V ar( X) = 2 X = 2 n 2 X = V ar( X) = var( 1 n (X 1 + X 2 + ::: + X n )) = ( 1 n )2 n P i=1 2 i = 1 n 2n2 = 2 n This proof follows the fact that the randomly selected observations have zero covariance 6
Central Limit Theorem: As n becomes large, the distribution of X Z = X = X = p n approaches the standard normal distribution regardless of the underlying probability distribution. That is X N(; 2 n ) 7
Not: Genel olarak örneklem da¼g l m n n normal da¼g l ma yaklaşmas için en az 25 elemanl olmalar gerekti¼gi gibi bir kabul vard r 8
Örnek: Bir işyerindeki çal şanlar n y ll k maaş art şlar ortalamas %12.2, standart sapmas %3.6 olan normal bir da¼g l m göstermektedir. Bu işyeri çal şanlar ndan 9 kişilik bir örneklem al nd ¼g nda, örneklem ortalamas n n %14.4 ten fazla olma ihtimali nedir? 9
Verilenler: = 12:2 = 3:6 n = 9 ) X = p n = 3:6 p 9 = 1:2 14:4 12:2 P (14:4 < X) = P ( < Z) 1:2 = P (1:83 < Z) = 1 F (1:83) = 0:0336 Not: F (1:83) de¼gerine standart normal tablosundan bakt k 10
The standard deviation of the distribution of X decreases when sample size, n; increases 11
Law of large numbers: Central limit theorem states that X N(; 2 =n). Hence, as n become large, the mean of the samples, X, converges to the population mean, : Örnek: Bir populasyonun da¼g l m n n (normal olsun ya da olmas n) ortalamas 5, standart sapmas da 2 olsun. Bu populasyondan seçilen çeşitli bütüklükteki örneklemlerin (n=10, n=25, n=50) da¼g l ma bakal m 12
Burada bize verilen; = 5 ve = 2. Şimdi farkl elemanl örneklemlerin da¼g l mlar na bakal m If n = 10; X N(; 2 =n) ) X N(5; 2 2 =10) ) X N(5; 0:4) If n = 25; X N(; 2 =n) ) X N(5; 2 2 =25) ) X N(5; 0:16) If n = 100; X N(; 2 =n) ) X N(5; 2 2 =100) ) X N(5; 0:04) 13
Örneklemin eleman say s artt kça örneklem ortalamas n n varyasyonunun düştü¼günü görmenin başka bir yolu ise bu örneklem da¼g l mlar için data n n %95 ini içeren güven aral ¼g na bakmak olabilir 14
Standart normal tablosundan datan n 0.975 ini içeren Z de¼gerini bulabiliriz; bu da 1.96 d r. E¼ger n = 10 ise, datan n %95 ini içeren aral k Üst limit Alt limit 1:96 = X 5 2= p 10 1:96 = X 5 2= p 10 ) X = 6:3 ) X = 3:7 15
E¼ger n = 25 ise, [5 1:96 2= p 25 < X < 5 + 1:96 2= p 25] ) [4:2 < X < 5:8] E¼ger n = 100 ise, [5 1:96 2= p 100 < X < 5 + 1:96 2= p 100] ) [4:6 < X < 5:4] Örneklemlerin eleman say s artt kça, örneklem ortalamas giderek populasyon ortalamas etraf nda daha s k bir şekilde da¼g lmaktad r 16
Sampling Distribution of Sample Proportions Let X be the number of successes in a binomial sample of n observations. Then the proportion of successes ^p x = X n in the sample is called the sample proportion 17
Remember from the binomial distribution that the distribution of number of successes with n trail, where the probability of success in the population is p;is given as E(X) = np V ar(x) = np (1 P ) 18
Hence, the distribution of sample proportion can be found as E(^p x ) = E( X n ) = 1 n E(X) = 1 n np = P V ar(^p x ) = V ar( X n ) = 1 P (1 P ) n2v ar(x) = n ^p = r P (1 P ) n 19
If the sample size is large, then the following statistics is distributed approximately as standard normal Z = ^p x E(^p x ) = ^p x P ^p ^p 20
Örnek: Bir bölgedeki evlerin %20 sinin eski bir tesisat sistemine sahip oldu¼gunu düşünelim. Buradan seçilecek 270 tane evin %16 ila %24 aras nda olan oran n n eski tesisata sahip olma olas l ¼g kaçt r? Burada bize verilenler P = 0:2 ve n = 270: Dolay s yla r r P (1 P ) 0:2 0:8 ^p = = = 0:024 n 270 21
Arad ¼g m z ihtimal ise P (:16 < ^p x < :24) :16 0:2 = P ( 0:024 < Z < :24 0:2 0:024 ) = P ( 1:67 < Z < 1:67) = F (1:67) F ( 1:67) = F (1:67) [1 F (1:67)] = :9525 (1 :9525) = :9050 22
Ö¼grenciler aras nda yap lan bir araşt rmaya göre ahlak dersinin ö¼grencilerin davran şlar üzerinde olumlu etki yat ¼g na inananlar n oran %43 tür. Bu ö¼grenciler içinden rastgele seçilen 80 kişilik bir gruptakilerin yar s ndan fazlas n n bu görüşte olma olas l ¼g nedir? 23
r p(1 p) ^p = = n Arad ¼g m z ihtimal P (:5 < ^p x ) = P ( :5 :5 :43 = P ( :055 r 0:43 0:57 80 = 0:055 P < ^p x P ) ^p ^p < Z) = P (1:27 < Z) = 1 F Z (1:27) = 1 :8980 = :1020 24
Sampling Distribution of Sample Variances Let the population variance is given as 2 = E[(X ) 2 ] And the sample variance np (x i x) 2 s 2 = i=1 n 1 25
To analyze whether the sample variance is a good approximation to the population variance, we will need both expected value of the sample variance, and also its variance 26
Let s denote the random sample by X, and its unknown elements by X 1 ; X 2 ; :::; X n : The sample variance is de ned as follows s 2 = 1 n 1 We already know that np (X i X) 2 i=1 E(s 2 ) = 2 27
If we rearrange the last two equations, we obtain the following random variable np (n 1)s 2 (X i X) 2 i=1 2 = 2 which, under the assumption of normally distributes population, has a 2 (chi-square) distribution with n 1 degrees of freedom 28
We denote the 2 distribution with degrees of freedom by 2. And the mean and variance of this distribution are E( 2 ) = and V ar( 2 ) = 2 29
As our random variable (n 1)s 2 = 2 has a distributed with 2, its mean and the variance (n 1) can be written as (n 1)s2 E[ 2 ] = (n 1) (n 1)s2 V ar[ 2 ] = 2(n 1) 30
The mean (n 1)s2 E[ 2 ] = (n 1) implies that (n 1) 2 E(s 2 ) = (n 1) hence we obtain E(s 2 ) = 2 31
The variance (n 1)s2 V ar[ 2 ] = 2(n 1) implies that (n 1) 2 4 V ar(s 2 ) = 2(n 1) hence we obtain V ar(s 2 ) = 24 (n 1) 32
Örnek: Üretilen bir mal n dayan m süresi normal bir da¼g l ma sahip olup, 3.6 oran nda da standart sapmaya sahiptir. Bu mallardan 4 elemanl rastgele bir örneklem seçilirse, bu örneklemin dayan m süresinin varyasyonunun 30 dan büyük olma ihtimali kaçt r? Cevap P (s 2 > 30) = P ( (n 1)s2 2 > 30(n 1) 2 ) = P ( 2 3 > 30 3 3:6 2 ) = P (2 3 > 6:94) 33
Chi-square tablosunda 3 serbestlik dereceli bir da¼g l m için 6.94 ü kapsayacak iki de¼ger 6.25 ve 7.81 dir. Bunlar n karş l ¼g ise P ( 2 3 > 6:25) = :1 P (2 3 > 7:81) = :05 dolay s yla tekrar arad ¼g m z ihtimal 0:05 < P (s 2 > 30) < :10 34
35
Örnek: Bir cips üreticisi, sat lan cipslerin paket a¼g rl ¼g n n reklamlarda belirtilen a¼g rl klar ndan fazla sapmas n istemiyor. Bu paketlerin a¼g rl ¼g n n normal da¼g l ma sahip oldu¼gu varsay l rsa, 20 tane rastgele seçilen paket için aşa¼g daki ihtimalleri sa¼glayan K y bulal m P ( s2 < K) = :05 2 *Burada örneklemdeki varyasyonun popülasyondaki varyasyondan küçük olmas ihtimali %5 olarak tan mlan yor. 36
Arad ¼g m z ihtimal aşa¼g daki şekilde yaz labilir :05 = P ( s2 1)s2 < K) = P ((n 2 2 < (n 1)K) Dolay s yla = P ( 2 (n 1) < (n 1)K) :05 = P ( 2 19 < 19K) 37
Chi-square tablosundan 19 serbestlik dereceli bir chi-square da¼g l m için 19K = 10:12 ) K = :533 Örneklem varyasyonunun popülasyon varyasyonunun %53 ünden küçük olma ihtimali %5 dir 38