Normal Dağılım Çan eğrisi biçimindeki simetrik dağılımdır. Ortalama ve varyans (standart sapma) dağılımın şeklini belirler Ortalama ve varyans normal dağılımın parametreleridir. Ezberlemenize gerek olmayan aşağıdaki formüle bakacak olursanız formula, μ ve σ dağılımın şeklini belirlediğini görebilirsiniz. 1 u = σ 2π [( X μ) / σ ] 2 1 e 2 Bu formülde u verilen herhangi bir X değeri için dağılımın yüksekliği π pi sabiti ve değeri π=3.14159 e is doğal logaritma tabanı, e=2.71828 1 μ x değişkeninin ortalama ve σ standard sapması. Normal Dağılım (Normal Curve)ve Standard Sapma (Deviation) Cholesterol Verisi 89.99 155.03 220.07 285.11 350.15 415.19 480.23 μ ± 1σ μ ± 2σ μ ± 3σ Bu aralık gözlemlerin yaklaşık 68% kapsar Bu aralık gözlemlerin yaklaşık 95.5% kapsar Bu aralık gözlemlerin yaklaşık 99.7% kapsar. 2 1
(Örnek kolesterol verisi) μˆ = X = 285.11, σˆ = s = 65.04 Not: μˆ mu-şapka olarak okunur ve μ nun kestirimini gösterir. σˆ sigma- şapka olarak okunur ve σ nun kestirimini gösterir. μˆ ± 1σˆ = 285.11 ± 65.04 = [220.07, 350.15] (veya X ±1s ) μˆ ± 2σˆ = 285.11 ± 130.08 = [155.03, 415.19] (veya X ± 2s ) μˆ ± 3σˆ = 285.11 ± 195.12 = [89.99, 480.23] (veya X ± 3s ) 3 (örnek cholesterol verisi) 520 367 341 317 294 275 266 253 235 203 474 365 337 315 292 274 266 252 235 195 453 365 337 314 290 274 264 252 230 193 428 363 336 314 290 274 264 252 229 192 420 360 336 312 286 273 264 251 227 190 420 358 336 312 286 273 264 250 225 187 416 357 334 311 285 273 261 248 224 187 403 355 333 311 285 273 261 248 222 185 403 353 333 310 284 271 260 246 222 178 394 353 332 307 283 271 260 246 219 178 391 352 330 305 283 270 259 245 218 178 390 352 328 304 282 269 259 244 218 176 386 348 327 302 282 269 259 244 216 173 386 348 322 302 281 269 258 243 214 173 384 346 322 302 280 269 257 243 214 172 383 344 320 302 279 268 256 243 210 172 378 343 320 298 279 268 254 240 208 166 370 341 320 298 278 267 254 239 208 156 370 341 319 296 277 267 253 239 206 156 369 341 317 295 277 266 253 238 206 135 X = 285.11 s = 65.04 4 2
520 367 341 317 294 275 266 253 235 203 474 365 337 315 292 274 266 252 235 195 453 365 337 314 290 274 264 252 230 193 428 363 336 314 290 274 264 252 229 192 420 360 336 312 286 273 264 251 227 190 420 358 336 312 286 273 264 250 225 187 416 357 334 311 285 273 261 248 224 187 403 355 333 311 285 273 261 248 222 185 403 353 333 310 284 271 260 246 222 178 394 353 332 307 283 271 260 246 219 178 391 352 330 305 283 270 259 245 218 178 390 352 328 304 282 269 259 244 218 176 386 348 327 302 282 269 259 244 216 173 386 348 322 302 281 269 258 243 214 173 384 346 322 302 280 269 257 243 214 172 383 344 320 302 279 268 256 243 210 172 378 343 320 298 279 268 254 240 208 166 370 341 320 298 278 267 254 239 208 156 370 341 319 296 277 267 253 239 206 156 369 341 317 295 277 266 253 238 206 135 X ±1.0s = (220.07, 350.15) Bu aralık 200 gözlemden 137sini kapsar. 137/200 =0.685 Æ 68.5% 5 520 367 341 317 294 275 266 253 235 203 474 365 337 315 292 274 266 252 235 195 453 365 337 314 290 274 264 252 230 193 428 363 336 314 290 274 264 252 229 192 420 360 336 312 286 273 264 251 227 190 420 358 336 312 286 273 264 250 225 187 416 357 334 311 285 273 261 248 224 187 403 355 333 311 285 273 261 248 222 185 403 353 333 310 284 271 260 246 222 178 394 353 332 307 283 271 260 246 219 178 391 352 330 305 283 270 259 245 218 178 390 352 328 304 282 269 259 244 218 176 386 348 327 302 282 269 259 244 216 173 386 348 322 302 281 269 258 243 214 173 384 346 322 302 280 269 257 243 214 172 383 344 320 302 279 268 256 243 210 172 378 343 320 298 279 268 254 240 208 166 370 341 320 298 278 267 254 239 208 156 370 341 319 296 277 267 253 239 206 156 369 341 317 295 277 266 253 238 206 135 X ± 2.0s = (155.03, 415.19) Bu aralık 200 gözlemden 1192 sini kapsar. 192/200 =0.96 Æ 96.0% 6 3
520 367 341 317 294 275 266 253 235 203 474 365 337 315 292 274 266 252 235 195 453 365 337 314 290 274 264 252 230 193 428 363 336 314 290 274 264 252 229 192 420 360 336 312 286 273 264 251 227 190 420 358 336 312 286 273 264 250 225 187 416 357 334 311 285 273 261 248 224 187 403 355 333 311 285 273 261 248 222 185 403 353 333 310 284 271 260 246 222 178 394 353 332 307 283 271 260 246 219 178 391 352 330 305 283 270 259 245 218 178 390 352 328 304 282 269 259 244 218 176 386 348 327 302 282 269 259 244 216 173 386 348 322 302 281 269 258 243 214 173 384 346 322 302 280 269 257 243 214 172 383 344 320 302 279 268 256 243 210 172 378 343 320 298 279 268 254 240 208 166 370 341 320 298 278 267 254 239 208 156 370 341 319 296 277 267 253 239 206 156 369 341 317 295 277 266 253 238 206 135 X ± 3.0s = (89.99, 480.23) Bu aralık 200 gözlemden 199 unu kapsar. 199/200 =0.995 Æ 99.5% Örneklem verisi standart sapmayla ilişkisi bakımından normal dağılıma oldukça yakındır. 7 Normal Dağılımın Uygulaması Verilen ortalama ve standart sapma için verinin dağılımını normale yaklaştırabiliriz.. Bunun için, verinin dağılımının normal dağıldığını farzetmeliyiz (örnek) Değişken: Yükseklik Ortalama = 48 inç SD = 6 inç 68% 42 ve 54 inç arasında. 96% 36 ve 60 inç arasında. 99.7% (çoğunluğu) 30 ve 66 inç. 8 4
Kutu Grafiği ile ilişkisi 25% 25%.38%.38% +2.67σ -2σ -.67σ 1.34σ +.67σ +2σ +2.67σ This is how far the lower whisker can be extended. (1.34σ x 1.5) Q 1 Q 3 (1.34σ x 1.5) This is how far the upper whisker can be extended. Less than 1% (.76%) of data will be observed beyond the tips of whiskers. This is the idea of outlier in a Box-Whisker Plot. 9 Puanların Lineer Dönüşümü-Standart puanlar Lineer dönüşümler her bir puana bir sabitin eklenmesi, çıkarılması, çarpılması ve/veya bölünmesini kapsar. (örnek) Eğer her bir çocuğun boyunun uzunluğunu 10 a bölersek Ortalama = 48 cm Ortalama = 4.8 dm SD = 6 cm SD = 0.5 dm 68% are 42-54 cm 96% are 36-60 cm Most of all 30-66 cm 4.2-5.4 dm 3.6-6.0 dm 3.0-6.6 dm Lineer dönüşümler ölçeği değiştirirler ancak yorumu değiştirmezler. 10 5
Lineer dönüşümler için örnekler cm den metreye 1 m = 100 cm Kilometre den mile 1 mil = 1.6 kilometre Fahrenheit dan Celsius Celsius = (Fahrenheit 32)/1.8 Lineer dönüşümlerin özellikleri: Bir puan bir ölçekte ortalamada ise diğerinde de ortalamadadır. Bir puan bir ölçekte ortalamadan belli standart sapma uzaklıktaysa diğerinde de aynı miktar standart sapma uzaklıkltadır. 11 Lineer dönüşümlerin Ortalama ve Standart sapmanın büyüklüklerine etkisi Bir sabiti eklediğimizde veya çıkardığımızda Ortalama o sabit kadar değişir. SD değişmez. Bir sabitle çarptığımızda veya böldüğümüzde ise, Ortalama o sabitle çarpılır veya bölünür. SD de aynı biçimde o sabitle çarpılır veya bölünür. (Peki varyansa ne olur?) 12 6
Lineer dönüşümlerin Etkileri Z-puanları Ortalama SD (s) Orijinal 1 3 4 5 7 4.0 2.24 Her puana 100 ekle 101 103 104 105 107 104.0 2.24 Her puanı iki ile çarp 2 6 8 10 14 8.0 4.48 Ortalamayı her bir orijinal veriden çıkart Ayrıca her bir puanı SD ya böl. 3 1 0 1 3 0.0 2.24 1.34 0.45 0.00 0.45 1.34 0.0 1.00 z-puanı bu iki adımdan oluşur Bunlar z-puanla z puanlarının her zaman ortaması=0 ve SD=1 dir Z-puanı Formulü (standart puan) z = X i μ i σ X z = X i X i s X (örnek veri için) X i X i X z = X X i i s X X 1 1 3 1.34 X 2 3 1 0.45 X 3 4 0 0.00 X 4 5 1 0.45 X 5 7 3 1.34 Ortalama ( X ) 4.00 0.00 0.00 Varyans (s 2 ) 5.00 5.00 1.00 SD (s) 2.24 2.24 1.00 14 7
Alıştırma- boşlukları doldurun. X i X i X z = X X i i s X X 1 9 2.9 1.432 X 2 8 1.9.938 X 3 7 0.9.444 X 4 7 0.9.444 X 5 7 0.9.444 X 6 6-0.1-0.049 X 7 6-0.1-0.049 X 8 5-1.1-0.543 X 9 4-2.1-1.037 X 10 2-4.1-2.025 Ortalama ( X ) 6.1 0.00 0.00 Varyans (s 2 ) 4.1 4.10 1.00 SD (s) 2.02 2.025 1.00 15 SPSS te Z-puanları (1) Transformation of Variable Adım 1 Fark puanlarını hesapla Transform menüsünde Compute komutunu seç. Target Variable ın adını yaz. Bu yeni değişkenin adı olacaktır. (örnek) chol_dev Dönüşüm formülünü sayısal ifade olarak. Bu değişken eksi ortalma değeri olmalıdır. (örnek) Choles 285.11 16 8
Adım 2 Bunu standart sapmaya böl. Transform menüsünde Compute komutunu seç. Target Variable ın adını yaz. Bu yeni değişkenin adı olacaktır. (örnek) chol_z Dönüşüm formülünü sayısal ifade olarak. Bu değişken bölü standart sapma değeri olmalıdır.(örnek) chol_dev / 65.04 17 SPSS te Z-puanları (2) Descriptive işlemler aracılığıyla Analysis menüsünden Descriptives komutunu seç. Değişkeni seç Alt köşede Save standardized values as variables. Yanına tik koy 18 9
z-puanlarının Yorumlanması Z-puanları direk olarak o puanın ortalamadan kaç standart sapma uzağında olduğunu gösterir. Bu yorum şunlara uygulanabilir: orijinal puan ölçeğine herhangi diğer lineer dönüşümlere. (örnek) z = 0.0 z = 1.0 z = 1.0 bu puan ortalamayla aynıdır. ortalamadır Bu puan ortalamanın 1SD sapma üstüdür. Bu puan ortalamanın 1SD sapma altıdır. 19 (örnek) X i z i Yorum Orijinal ölçeğin sağlaması Ortalama + (z SD) X 1 9 1.432 ort.nın 1.432 SD üzerinde 6.1 + 1.432(2.025) = 6.1 + 2.9 = 9 X 2 8.938 ort.nın 0.938 SD üzerinde 6.1 + 0.938(2.025) = 6.1 + 1.9 = 8 X 3 7.444 X 4 7.444 X 5 7.444 X 6 6-0.049 ort.nın 0.049 SD altında 6.1 0.049(2.025) = 6.1 0.1 = 6 X 7 6-0.049 X 8 5-0.543 X 9 4-1.037 X 10 2-2.025 ort.nın 2.025 SD altında the 6.1 2.025(2.025) = 6.1 4.1 = 2 Ortalama 6.1 SD 2.025 20 10
Normal Dağılımla İlişkisi 21 Normal Dağılımda Gözlemlerin Oranı z-puanlar - 4-3 - 2-1 0 + 1 + 2 + 3 + 4 Gözlemlerin oranını nasıl belirleyebiliriz, örneğin; z nin üstünde = 1.5 z nin altında= -1.5 z = -1.5 ve z = 1.5 arasında? 22 11
1. Normal Dağılım Tablosunu Kullanırız Z nin üzerindeki gözlemlerin oranı Z nin altındaki gözlemlerin oranı z-puanı (örnekler) (altında) z = 0.40, 65.54% gözlemlenen verinin. (üstünde)z = 0.40, 34.46% gözlemlenen verinin. (altında) z = 0.40, 34.46% gözlemlenen verinin. 23 (z = 1.5 ) z Z-altında Z üstünde u Ordinatı M M M M 1.50.9332.0668.1295 M M M M Üstünde z = 1.5 6.68 % Altında z = 1.5 93.32 % Altında z = -1.5 Æ 6.68% z = -1.5 ve z = 1.5 arasında 93.32 % 6.68 % = 86.64 % 24 12
IQ puanı örneği IQ puanları ortalaması 100 ve standart sapması 15 olan normal bir dağılım sergiler. Farz edelim 2000 öğrenciye IQ testi uygulandı, Grupta yaklaşık olarak kaç öğrenci 70 ve 130 arasında IQ ya sahip olacaktır? Öğrencilerin %90 ından daha yüksek olan e IQ puanını bulunuz? 25 IQ puanı örneği- Çözüm μ = 100, σ = 15 (1) Alan(70 X 130) = Alan( 70 100 Z = X μ 130 100 ) 15 σ 15 = Alan( 2 Z 2) = 95% 2000 95% = 1900 (2) Üzerindeki alan(z ) = 10% Z tablosunda bul : Z = 1.282 Z = X 100 = 1.282 15 X 100 = 19.23 X 119 26 13
Maaş artışı örneği Bir CEO artışın ortalamasının 2000, ve standart sapmasının 400 e eşit olacağına ve normal bir dağılım sergilemesine karar verdi. Çalışanların en üstteki % 10 u.ya eşit veya daha fazla artış alacaklardır. Geçen yıl pek iş yapmayan çalışanların % 5 artış veya daha az alacaklardır. 27 Maaş artışı örneği -Çözüm μ = 2000 σ = 400 (1) üstteki Alan ( X ) = 10%, Z = 1.282 Z = X μ = X 2000 = 1.282, X = 2000 + 400 1.282 = 2512.8 σ 400 (2)alttaki alan ( X ) = 5%, Z = 1.645 Z = X μ = X 2000 = 1.645, X = 2000 400 1.645 = 1342 σ 400 28 14
2. SPSS Compute işlemini kullanarak Boş bir veri sayfası aç. Birinci hücreye herhangi bir sayı yaz. Transform Compute u seç Target Variable adını belirle. Numeric Expression kutusuna fonksiyonu yaz. CDF.NORMAL(1.5, 0, 1) Bu.93319 değerini verecektir. 29 (Fonksiyonun diğer bir kullanımı) ( üstünde) z = 1.5; 1 - CDF.NORMAL(1.5, 0, 1) Bu.06680 değerini verecektir z = 1.5 ve z = 1.5 arasında ; CDF.NORMAL(1.5, 0, 1) CDF.NORMAL(-1.5, 0, 1) Bu.86638 değerini verecektir (Diğer kullanışlı bir fonksiyon) IDF.NORMAL(p, 0, 1) Gözlemlerin oranını gösteren p için 0 ve +1 arasında bir değer girmeniz gerekir. Bu fonksiyon z puanını, o punların altındaki gözlemlerin % p 100 verir 30 15
Çarpıklık Simetriklik derecesi. Çarpıklık için birkaç formül vardır. Herhangi bir çarpıklık indeksi için, 0 mükemmel simetriyi; Pozitif değer, pozitif çarpıklığı; Negatif değer, negatif çarpıklığı gösterir 31 (1) Hangi merkezi eğilim ölçüsünün kullanılacağına karar vermek için sk = 3( X medyan). s Bu ortalama ve medyan arasındaki yaklaşık uzaklığı standart ölçekte verir. Pozitif sk = pozitif çarpıklık Negatif sk = negatif çarpıklık Eğer çarpıklık 0.7 sk 0.7 ise, ortalamanın merkezi eğilim ölçüsü olarak kullanımı önerilir Aksi halde, medyan merkezi eğilimin daha iyi bir ölçüsü olarak önerilir. 32 16
(Örnek 1) (Örnek 2) sk = Xi X1 9 X2 8 X3 7 X4 7 X5 7 X6 6 X7 6 X8 5 X9 4 X10 2 ortalama 6.1 median 6.5 sd 2.02 3( X median) s = 3(6.1 6.5) = 0.59 2.02 Çarpıklığın değeri negatif, fakat ortalama merkezi eğilim ölçüsü olarak kullanılabilir Xi X1 50 X2 8 X3 7 X4 7 X5 7 X6 6 X7 6 X8 5 X9 4 X10 2 ortalam 10.2 median 6.5 sd 14.09 s 3( X median) sk = = 3(10.2 6.5) = 0.79 14.09 Çarpıklığın değeri pozitif, fakat medyanın merkezi eğilim ölçüsü olarak kullanımı daha iyi olur (Örnek 3) Cholesterol verisi Ortalama = 285.11 Medyan = 276.00 SD = 65.04 O zaman, sk = 3( X medyan) = 3(285.11 276.00) = 0.42 s 65.04 Çarpıklığın değeri pozitif, fakat ortalama merkezi eğilim ölçüsü olarak kullanılabilir. 34 17
(2) For the purpose of testing whether the data have enough evidence of skewness of the population data. γ 1 = z 3. n i This quantity can be computed by SPSS descriptive or frequency procedure. SPSS output will give us the value of γ 1 and its standard error. Roughly, the absolute value of γ 1 larger than twice as its standard error (larger than 2 ) indicates evidence for a departure from symmetry for the population data. 35 (Examples 1 & 2) Statistics N Ortalama Median Std. Deviation Skewness Std. Error of Skewness Valid Missing EX1 10 0 6.1000 6.5000 2.02485 -.771.687 EX2 10 0 10.2000 6.5000 14.09334 3.069.687 For Example 1, 0.771/.687 = 1.12 The absolute value is smaller than 2.0. So, we don t have enough evidence for skewness of the population data. For example 2, 3.069/.687 = 4.47 The absolute value is larger than 2.0. So, we should suspect that the population data are skewed. 36 18
(Example 3) Statistics CHOLESTEROL LEVEL (MG/DL) N Valid 200 Missing 0 Ortalama 285.11 Median 276.00 Std. Deviation 65.041 Skewness.407 Std. Error of Skewness.172 0.407/0.172 = 2.36 (The absolute value is larger than 2.0.) So, we should suspect that the population data are skewned. What about for other variables in chapman.sav? 37 6 Standard error for skewness is computed by: se =. n So, the magnitude of γ 1 to avoid suspected skewness in population depends on the sample size. γ 1 value that provides evidence for population data skewness 1.5 Skewness Index Vlaue 1.0 0.5 0.0 100 300 500 700 900 Sample Size 38 19