MATE211 BİYOİSTATİSTİK ÇALIŞMA SORULARININ ÇÖZÜM VE CEVAPLARI Yapılan bir araştırmada, 136 erişkin kişinin kanlarındaki kolesterol düzeyleri gr/dl cinsinden aşağıda verilmiştir: 180 230 190 186 220 191 219 200 256 179 157 188 250 153 168 245 178 218 201 176 183 231 192 217 202 222 193 189 239 184 221 181 233 223 194 216 203 209 173 238 195 215 204 185 236 196 214 259 167 248 177 224 213 205 225 171 154 243 165 170 175 226 189 212 237 183 197 210 206 211 207 161 241 170 198 219 208 209 199 166 238 240 172 188 227 190 191 218 209 200 182 228 217 180 229 200 209 200 203 206 186 239 220 192 216 201 221 193 215 184 222 231 194 224 195 215 208 228 196 214 206 207 209 197 213 207 200 198 212 207 205 199 211 203 200 206 Bu örneklem için aşağıda istenilenleri yapınız. 1) Sınıflandırma yapmadan; a) Aritmetik ortalama, b) Standart sapma, Değerlerini hesaplayınız. Hesaplamaları nasıl yaptığınızı gösteriniz. Aritmetik Ortalama, verinin toplamı 180 230 190 203 200 208 27819 136 136 204.55 Standart Sapma, 1 5756409 27819 136 136 1 22.11 2) Sınıflandırma yaparak (sınıf aralığını 10 alınız ve 11 sınıf oluşturunuz); Dağılımın en büyük dğeri: 256 Dağılımın en küçük değeri: 153 Dağılım Aralığı: 256 153 103 En geniş sınıf aralığı: 103 8 12.875 En dar sınıf aralığı: 103 15 6.87 olur.
Soruda sınıf aralıklarının 10, sınıf sayısının 11 olması isteniyor. Buna göre sınıflar şöyle oluşur: a) Aritmetik ortalama hesaplanması, SINIFLAR FREKANS 153 162 4 163 172 8 173 182 10 183 192 17 193 202 23 203 212 26 213 222 21 223 232 12 233 242 9 243 252 4 253 262 2 TOPLAM 136 sütunu, frekansı en yüksek sınıfa sıfır değeri verilmek üzere, üste doğru negatif olarak, aşağıya doğru pozitif olarak birer artırılarak oluşturulur. sütunu ile sütunlarındaki değerleri çarpmak suretiyle oluşturulur ve bu sütunun toplamı bulunur Sınıf Değeri (SD) sütunu sınıfın alt ve üst sınırlarının ortalaması bulunarak oluşturulur., sınıf aralığıdır, ve ardışık iki sınıfın alt sınırları arasındaki fark olarak hesaplanır. Burada 163 153 10 dur., frekansı en yüksek olan ve 0 seçilen sınıfın SD değeridir. SINIFLAR FREKANS SD 153 162 4 5 20 157.5 163 172 8 4 32 167.5 173 182 10 3 30 177.5 183 192 17 2 34 187.5 193 202 23 1 23 197.5 203 212 26 0 0 207.5 213 222 21 1 21 217.5 223 232 12 2 24 227.5 233 242 9 3 27 237.5 243 252 4 4 16 247.5 253 262 2 5 10 257.5 TOPLAM Σ 136 41 Formüldeki değerleri yerine koyarak, aritmetik ortalama hesaplanır. 207.5 41 136 10 204.49
b) Standart sapma hesaplanması, 1 sütunu ve sütunu oluşturulur. SINIFLAR FREKANS SD 153 162 4 5 20 157.5 25 100 163 172 8 4 32 167.5 16 128 173 182 10 3 30 177.5 9 90 183 192 17 2 34 187.5 4 68 193 202 23 1 23 197.5 1 23 203 212 26 0 0 207.5 0 0 213 222 21 1 21 217.5 1 21 223 232 12 2 24 227.5 4 48 233 242 9 3 27 237.5 9 81 243 252 4 4 16 247.5 16 64 253 262 2 5 10 257.5 25 50 TOPLAM Σ 136 41 673 Formüldeki değerleri yerine koyarak, standart sapma hesaplanır. 41 1681 673 10 136 673 10 136 136 1 136 1 10 673 12.36 136 1 10 660.64 135 10 4.894 102.2121 22.12 c) Varyasyon katsayısı hesaplanması 22.12 100 100 %10.82 204.49 d) Standart hata hesaplanması, 22.12 136 22.12 11.66 1.90 e) %95 doğruluk düzeyinde, evren ortalaması güven sınırlarının hesaplanması Evren ortalaması güven sınırları olarak bulunur ve çift yönlü testtir.
Yanılma düzeyi %5 olduğundan, 0.05 Serbestlik derecesi: 1 136 1 135 tablosundan 1.98 olarak elde edilir. Değerleri formülde yerine koyarak; 1.90 1.98 3.762 bulunur. 204.49 3.762 204.49 3.762 200.728 208.252 elde edilir. Böylece %95 olasılıkla evren ortalamasının 200.73 ile 208.25 değerleri arasında olacağını söyleyebiliriz. f) %1 yanılma düzeyinde, evren ortalaması güven sınırlarının hesaplanması Yanılma düzeyi %1 olduğundan, 0.01 Serbestlik derecesi: 1 136 1 135 tablosundan 2.62 olarak elde edilir. Değerleri formülde yerine koyarak; 1.90 2.62 4.978 bulunur. 204.49 4.978 204.49 4.978 199.51 209.47 elde edilir. Böylece %99 olasılıkla evren ortalamasının 199.51 ile 209.47 değerleri arasında olacağını söyleyebiliriz. g) Ortanca ve tepe değerlerinin hesaplanması Tepe Değeri, frekansı en çok olan 203 212 sınıfının SD değeri olan 207.5 olur. SINIFLAR FREKANS SD 153 162 4 157.5 163 172 8 167.5 173 182 10 177.5 183 192 17 187.5 193 202 23 197.5 203 212 26 207.5 213 222 21 217.5 223 232 12 227.5 233 242 9 237.5 243 252 4 247.5 253 262 2 257.5 TOPLAM Σ 136
Ortanca nın hesaplanması: Ortanca 2 Formülü ile hesaplanır. ortancanın içinde bulunduğu sınıfın Sınıf Ara Değeri(SAD) dir. sınıf aralığı, ortancanın içinde bulunduğu sınıfın frekansı, veri sayısı, ise ortancanın bulunduğu sınıfın bir üstündeki sınıfın yığılımlı frekansı olarak tanımlanmıştır. Buna göre, ortanca değer 2 136 2 68 inci veri olur. Bu ise 203 212 sınıfının içinde bulunur. Buradan, SINIFLAR FREKANS SAD Yf i 153 162 4 152.5 4 163 172 8 162.5 12 173 182 10 172.5 22 183 192 17 182.5 39 193 202 23 192.5 62 203 212 26 202.5 88 Ortanca nın bulunduğu sınıf 213 222 21 212.5 109 223 232 12 222.5 121 233 242 9 232.5 130 243 252 4 242.5 134 253 262 2 252.5 136 TOPLAM Σ 136 202.5, 10, 62, ve 26 olur. Ortanca 2 68 62 202.5 10 204.81 26 h) %25, %50, %75, %40 ve %90 değerlerinin hesaplanması Yüzdelikler için kullanılan formül X X XX SAD X X X SAD X SAD : soruda verilen yüzdelik değer : SAD den Az sütununda in bulunduğu sınıfın üzerinde ki sınıfın SAD den az yüzdelik değeri : SAD den Az sütununda in bulunduğu sınıfın SAD den az yüzdelik değeri : hesaplanacak değer : SAD değeri SINIFLAR FREKANS SAD SAD den Az sayı % 153 162 4 152.5 0 0.00 163 172 8 162.5 4 2.94 173 182 10 172.5 12 08.82 183 192 17 182.5 22 16.18 193 202 23 192.5 39 28.68 203 212 26 202.5 62 45.59 213 222 21 212.5 88 64.71 223 232 12 222.5 109 80.15 233 242 9 232.5 121 88.97 243 252 4 242.5 130 95.59 253 262 2 252.5 134 98.53 TOPLAM Σ 136 : SAD değeri
%25 DEĞERİ 25, 16.18, 28.68, 182.5, ve 192.5 25 16.18 182.5 28.68 16.18 192.5 182.5 8.82 182.5 12.5 10 182.5 88.2 12.5 189.56 %50 DEĞERİ 50, 45.59, 64.71, 202.5, ve 212.5 50 45.59 202.5 64.71 45.59 212.5 202.5 4.41 202.5 19.12 10 202.5 44.1 19.12 204.81 %75 DEĞERİ 75, 64.71, 80.15, 212.5, ve 222.5 75 64.71 212.5 80.15 64.71 222.5 212.5 10.29 212.5 15.44 10 212.5 102.9 15.44 219.16 %40 DEĞERİ 40, 28.68, 45.59, 192.5, ve 202.5 40 28.68 192.5 45.59 28.68 202.5 192.5 11.32 192.5 16.91 10 192.5 113.2 16.91 199.19 %90 DEĞERİ 90, 88.97, 95.59, 232.5, ve 242.5 90 88.97 232.5 95.59 88.97 242.5 232.5 1.03 232.5 6.62 10 232.5 10.3 6.62 234.06 3) Yalnızca ilk satırdaki değerleri kullanarak sınıflandırma yapmadan, birinci satır için ortancayı hesaplayınız 180 230 190 186 220 191 219 200 256 179 bu satırda 10 tane veri var. Bunların küçükten büyüğe doğru sıralanması gerekir. 179 180 186 190 191 200 219 220 230 256 Veri sayısı çift olduğundan 2 nci veri ile 2 2 nci veri değeerlerinin ortalaması ortanca olur. Böylece, 10 olduğundan; 5 inci veri ile 6 ncı veriler kullanılarak 191 200 2 391 2 195.5 ortanca değeri olarak bulunur.
BİNOMYAL DAĞILIM İLE İLGİLİ PROBLEMLER 4) Bir bölgede doğum kontrol yöntemlerini kullanma oranı %70 olsun. Bu bölgeden rastgele seçilen 8 kadından; a) dördünün b) en az ikisinin doğum kontrol yöntemi kullanma olasılığı nedir? Binomyal dağılımda olasılık hesaplamak için aşağıdaki formül kullanılır:!!! 8, tekrarlanan olay sayısını gösterir. Her olayda istenen: kontrol yöntemi kullanılması, bunun olasılığı 0.7, istenmeyen: kontrol yöntemi kullanılmaması. Bunun olasılığı 110.70.3 (a) bölümünde: Toplam 8 kadından, 4 kadının doğum kontrol yöntemi kullanması olasılığı soruluyor. 4 84! 4! 0.7 0.3 4! 4! 0.7 0.3 0.1361 %13.61 (b) bölümünde: Toplam 8 kadından, 2 kadının doğum kontrol yöntemi kullanması olasılığı soruluyor. 2 2 3 4 5 6 7 8 şeklinde yukarıdaki formülü 7 kez kullanarak istenen olasılık hesaplanabilir. VEYA 2 1 2 1 0 1 formülü ile de hesaplanabilir. 0 80! 0! 0.7 0.3 0! 0.7 0.3 0.000066 %0.0066 1 81! 1! 0.7 0.3 7! 1! 0.7 0.3 0.0012%0.12 Böylece, en az iki kadının doğum kontrol yöntemi kullanma olasılığı 2 1 2 1 0 1 10.000066 0.0012 0.9987 %99.87 Olarak elde edilir. 5) Bir bölgedeki çocukların %45 oranında DBT aşısıyla bağışıklandığı bilinmektedir. Bu bölgeden rastgele seçilen 8 çocuktan; a) Üçünün b) Tümünün c) Hiçbirinin aşılı olma olasılığı nedir? Bu soruda; 8, 0.45, 0.55 olur. (a) için 3 hesaplanır. 3 (b) için 8 hesaplanır. 8 83! 3! 0.45 0.55 5! 3! 0.45 0.55 0.2568 %25.68 8 0.45 0.55 0! 0.45 0.55 0.0017 %0.17
(c) için 0 hesaplanır. 0 80! 0! 0.45 0.55 0! 0.45 0.55 0.0084 %0.84 6) Bir hastalıktan sağ kurtulma olasılığı %75 olsun. Bu hastalığa yakalanan 6 kişiden a) Hiçbirinin b) Tümünün c) Dördünün d) En çok dördünün kurtulma olasılığı nedir? Bu soruda; 6, 0.75 ve 0.25 olur. (a) için 0 hesaplanır. 0 (b) için 6 hesaplanır. 6 (c) için 4 hesaplanır. 4 (d) için 4 hesaplanır. 6! 60! 0! 0.75 0.25 6! 6! 0! 0.75 0.25 0.00024 %0.024 6! 66! 6! 0.75 0.25 6! 0! 6! 0.75 0.25 0.1779 %17.79 6! 64! 4! 0.75 0.25 6! 2! 4! 0.75 0.25 0.2966 %29.66 4 0 1 2 3 4 VEYA 4 1 4 1 5 6 hesaplanır. 6 0.1779 %17.79 (b) şıkkında hesaplanmıştı. 5 6! 65! 5! 0.75 0.25 6! 1! 5! 0.75 0.25 0.3559 %35.59 4 1 4 1 5 6 10.1779 0.3559 0.4662 %46.62 7) Bir hastanede sezaryenle doğum yapma oranı %20 olsun. Bu hastanede doğum yapan 10 kadından; a) Tümünün b) Yarısından çoğunun c) İkisinin sezaryenle doğum yapmış olma olasılığı nedir? Bu soruda; 10, 0.2, ve 0.8 olur.
(a) için 10 hesaplanır. 10 (b) için 5 hesaplanır. 10! 10 10! 10! 0.2 0.8 10! 0! 10! 0.2 0.8 0.0000001 %0.00001 5 6 7 8 9 10 hesaplanarak cevap bulunur. (c) için 2 hesaplanır. 2 10! 10 2! 2! 0.2 0.8 10! 2! 0.2 0.8 0.3019 %30.19 POISSON DAĞILIMI İLE İLGİLİ PROBLEMLER 8) Sağlık ocaklarından günlük olarak hastaneye sevk edilen hasta sayısı bir yıl boyunca kaydedilmiş ve bu sayının Poisson dağılımına uyduğu ve günlük olarak hastaneye sevk edilen ortalama hasta sayısının 6 olduğu görülmüştür. Herhangi bir gün hastaneye; a) Hiç hasta gönderilmeme b) 1 hasta gönderilme c) 2 hasta gönderilme d) 7 hasta gönderilme e) 3 ten az hasta gönderilme olasılığı nedir? Poisson dağılımı ile olasılık hesapları aşağıdaki formüle göre yapılır.! 6 olduğuna dikkat ediniz. (a) için 0 hesaplanır. 0 6 0! 0.0025 %0.25 (b) için 1 hesaplanır. 1 6 1! 0.0149 %1.49 (c) için 2 hesaplanır. 2 6 2! 0.0446 %4.46 (d) için 7 hesaplanır. 7 6 7! 0.1377 %13.77
(e) için 3 0 1 2 hesaplanır. 3 0 1 2 0.0025 0.0149 0.0446 0.062 %6.2 9) Bir işyerinde, günlük iş kazası sayısının Poisson dağılımına uyduğu ve günde ortalama iş kazası sayısının 1.5 olduğu bulunmuştur. Bu işyerinde, herhangi bir gün; a) Hiç kaza olmama b) 1 kaza olma c) 4 ten az kaza olma olasılığı nedir? 1.5 olduğuna dikkat ediniz. (a) için 0 hesaplanır. 0 1.5. 0.2231 %22.31 0! (b) için 1 hesaplanır. 1 1.5. 0.3347 %33.47 1! (c) için 4 0 1 2 3 hesaplanır. 2 1.5. 0.2510 %25.10 2! 3 1.5. 0.1255 %12.55 3! 4 0 1 2 3 0.2231 0.3347 0.2510 0.1255 0.9343 %93.43 10) Lefkoşa ilçesinde bir günde oluşan kaza sayısı, beş yıl süre ile gözlenmiş ve bu sayının ortalama olarak 5 olduğu ve Poisson dağılımına uydugü belirlenmiştir. Bu ilçemizde günde; a) 4 ten az kaza olma b) 2 kaza olma c) Hiç kaza olmama olasılığı nedir? 5 olduğuna dikkat ediniz. (a) için 4 0 1 2 3 hesaplanır. 0 5 0.0067 %0.67 0! bu aynı zamanda (c) nin cevabıdır
1 5 0.0337 %3.37 1! 2 5 0.0842 %8.42 bu aynı zamanda bnin cevabıdır 2! 3 5 0.1404 %14.04 3! 4 0 1 2 3 0.0067 0.0337 0.0842 0.1404 0.265 %26.50 NORMAL DAĞILIM İLE İLGİLİ PROBLEMLER (Bu konu dönem içi sınava dahil değildir. Çözümler daha sonra verilecektir.) 11) Hamileler ile ilgili bir araştırmada, bu grubun hemoglobin değerlerinin normal dağılım gösterdiği ve ortalamasının 12.5 gr/dl, standart sapmasının ise 1.0 gr/dl olduğu gözlenmiştir. Buna göre, hamile kadınların; a) Hemoglobin değerlerinin 11.5 13.0 gr/dl arasında bulunma olasılığı yüzde kaçtır? b) %80 inin hemoglobin değerleri, ortalamaya göre hangi simetrik sınırlar arasındadır? c) üstten %30 unun hemoglobin değerleri kaçtan fazladır? d) Alttan %22 sinin hemoglobin değerleri kaçtan daha azdır? e) yüzde kaçının hemoglobin değeri 12.2 gr/dl den azdır?