Olasılığa Giriş Koşullu Olasılık Bayes Kuralı Doç. Dr. Ertuğrul ÇOLAK Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı
Olasılığa Giriş Bundan önceki bölümlerde veri setini özetleyen, tanımlayan yöntemler ele alındı. Ancak belirtici istatistikler ve grafiksel yöntemler bir veri seti üzerinde yorum yapmak hatta bazı çıkarsamalarda bulunmak için yeterli olmayabilir.
Olasılığa Giriş Örneğin ilk çocuğunu geç yaşta dünyaya getiren bir kadının (30 yaş üstü) ileri bir zaman diliminde meme kanseri olma riski ilk çocuğunu 30 yaş altında dünyaya getiren bir kadına göre daha yüksektir şeklinde tanımlanan bir hipotezi test etmek için neler yapılabilir?
Olasılığa Giriş Bu hipotezi test etmek için 30 yaş altında ilk çocuğunu dünyaya getiren 1000 kadın (Grup A) ile 30 yaş üzerinde ilk çocuğunu dünyaya getiren 1000 kadın (Grup B) çalışmaya dahil edilmiş ve 5 yıl bu kadınlar takip edilmiş olsun.
Olasılığa Giriş İzlem sonucunda grup A da 4 olgu, grup B de ise 5 olgu gözlenmiş olsun. Acaba bu sonuçlar, hipotezi desteklemek için yeterli midir? Yoksa daha fazla birim üzerinde mi çalışma yapılmalıdır? Belki tesadüfen 4 e 5 değerleri elde edilmiştir.
Olasılığa Giriş Çalışmanın daha büyük bir örnek üzerinde yapıldığını ve her bir grup için 10.000 kadınının takip edildiğini düşünelim. İzlem sonrasında grup A da 40, grup B de ise 50 olgu gözlemlenmiş olsun. Peki bu sonuçlar hipotezi desteklemek için yeterli midir?
Olasılığa Giriş Örnek büyüklüğü artınca iki grup arasında gözlenen olgular bakımından fark artmıştır ancak bu sonucun şansa bağlı olabileceği unutulmamalıdır. Sonuçta ileri sürülen hipotezin test edilerek değerlendirilmesi gerekir. Elde edilen sonuçlara direk bakarak yorum yapmak bizi yanıltabilir.
Olasılığa Giriş Bu tür hipotezlerin test edilmesinde kullanılan kuramsal yaklaşıma hipotez testleri denir ve bu testlerin altında yatan temel kavram ise olasılık kavramıdır. İlerideki derslerde kullanılacak olan p değeri kavramının anlaşılması ve yorumlanması olasılıkla ilgili temel bilgilere dayanmaktadır.
Olasılığa Giriş Ayrıca tarama testlerine ait değerlendirmelerde kullanılan duyarlılık, özgüllük (seçicilik) pozitif ve negatif kestirim değeri ve doğruluk oranı gibi kriterlerin elde edilmesinde de olasılıktan yararlanılmaktadır.
Olasılığa Giriş Olasılığın tanımından önce bazı tanımlar üzerinde durmak gereklidir. Rassal Deneme: İki ya da daha fazla olası sonuçlara sahip ve hangi sonucun gözlenebileceği konusunda belirsizlik içeren denemelere (aktivitelere) rassal deneme denir.
Olasılığa Giriş Örnek Uzayı ve Temel Çıktılar: Bir rassal denemenin birbirinden farklı olası sonuçlarına temel çıktılar ve bu olası tüm sonuçları içeren kümeye ise örnek uzayı denir.
Olasılığa Giriş Örneğin bir kadının doğum yapması rassal bir denemedir. Çünkü iki sonucu olan (erkek ya da kız) cinsiyete sahip çocuk sahibi olacaktır. Eğer rassal deneme bir kadının iki kez doğum yapması olduğunda olası çocuklarının cinsiyeti E-E, E-K, K-K, K-E olacaktır. Bu durumda örnek uzayı S={EE,EK,KK,KE} olacaktır.
Olasılığa Giriş Olay: Örnek uzayın herhangi bir alt kümesine olay (E) denir. Eğer bu alt kümede yer alan herhangi bir temel çıktı, rassal deneme sonucunda gözlemlenirse tanımlanan olayın gerçekleştiği anlamına gelir.
Olasılığa Giriş Tamamlayan Olay: Tanımlanan bir olay içinde yer almayan tüm temel çıktıları içeren kümeye tanımlanan olayın tamamlayanı denir (E * ).
Olasılığa Giriş Birleşik Olay: Tanımlanan iki olay E1 ve E2 ise ve E1 E2 Ø ise bu olaylara birleşik olaylar denir ve rassal deneme sonucunda ortak temel çıktı gözlemlenirse olayların aynı anda gerçekleştiği anlamına gelir.
Olasılığa Giriş İki olaydan herhangi birinin E1 ya da E2 olayının gerçekleşmesi de bir olaydır ve E1UE2 şeklinde gösterilir. Birleşim kümesinde yer alan herhangi bir temel çıktının gözlenmesi sonucunda E1 ya da E2 olayının gözlendiği anlamına gelir.
Olasılığa Giriş Birbirini Dışlayan Olaylar: Tanımlanan iki olay E1 ve E2 ise ve E1 E2=Ø ise bu olaylara birbirini dışlayan olaylar denir.
Olasılığa Giriş Olasılık, incelenen herhangi bir olayın mümkün gözlenme sayısının tüm mümkün durumların sayısına oranlaması ile ölçülür.
Olasılığa Giriş Rassal bir denemeye ait örnek uzayı S={o1,o2,,on) olsun. Burada oi i=1,2, n olmak üzere temel çıktısının gözlenme olasılığı P(oi)=1/n olarak hesaplanır. Bazı durumlarda temel çıktıların hepsi birbirinde farklı değildir ve bu durumda olasılık değeri 1/n den daha yüksek olabilir.
Olasılığa Giriş Örnek uzayında tanımlı E olayının olasılığı ise E olayında yer alan temel çıktıların olasılıklarının toplamına eşittir.
Olasılığa Giriş Olasılık Dağılımı: Örnek uzayında yer alan temel çıktıların her biri için olasılık atanmasına olasılık dağılımı denir. Örneğin bir tavla zarının atılması olayı rassal bir denemedir.
Olasılığa Giriş Bu denemede örnek uzayı S={1,2,3,4,5,6} olarak elde edilir. Bu rassal deneme için oluşturulan olasılık dağılım ise aşağıdaki gibi oluşturulur.
Olasılığa Giriş Bir diğer örnekte rassal deneme iki tavla zarının atılması ve zarlar üzerindeki sayıların toplamı olsun. Sonuçta örnek uzay S={2,3,4,5,6,7,8,9,10,11,12} şeklinde oluşur.
Olasılığa Giriş Bu durumda olasılık dağılımı aşağıdaki gibi oluşturulur.
Olasılığa Giriş Olasılığın Bazı Özellikleri: P(S)=1, P(Ø)=0, P(E)=1-P(E*) 0 P(E) 1 P(E1UE2)=P(E1)+P(E2)-P(E1 E2) P(E1UE2UE3)=P(E1)+P(E2)+P(E3)-P(E1 E2)- P(E1 E3)-P(E2 E3)+ P(E1 E2 E3) Eğer E1 E2 ise P(E1) P(E2)
Koşullu Olasılık Bir olayın gerçekleştiği bilindiğinde bir başka olayın gerçekleşme olasılığına koşullu olasılık denir. E2 olayı gerçekleştiğinde E1 olayının gerçekleşme olasılığı aşağıdaki eşitlik ile hesaplanır.
Örnek 12 yaş çocuklarda sigara içme alışkanlığı ile ebeveynlerinin sigara içme alışkanlığı arasındaki ilişkiyi göstermek amacıyla 2847 çocukta ve ebeveynleri üzerinde bir araştırma yapılıyor. Elde edilen veriler aşağıdaki tabloda verilmiştir.
Örnek Ebeveynler Çocuk İkiside içmiyor Biri içiyor İkiside içiyor Toplam Hiç içmiyor 480 432 391 1303 Günde bir adet 256 393 327 976 Günde beş adet 90 147 159 396 Günde beşten fazla 22 59 91 172 Toplam 848 1031 968 2847 Örneğin A olayı, çocuğun günde bir adet sigara içmesi olsun. B olayı da ebeveynlerden birinin sigara içmesi olsun.
Örnek Ebeveynler Çocuk İkiside içmiyor Biri içiyor İkiside içiyor Toplam Hiç içmiyor 480 432 391 1303 Günde bir adet 256 393 327 976 Günde beş adet 90 147 159 396 Günde beşten fazla 22 59 91 172 Toplam 848 1031 968 2847 Bu durumda P(A B)= 393/2847=0.1380 olarak hesaplanır.
Örnek Ebeveynler Çocuk İkiside içmiyor Biri içiyor İkiside içiyor Toplam Hiç içmiyor 480 432 391 1303 Günde bir adet 256 393 327 976 Günde beş adet 90 147 159 396 Günde beşten fazla 22 59 91 172 Toplam 848 1031 968 2847 P(A U B)=P(A)+P(B)-P(A B) P(A U B)=(976/2847)+(1031/2847)-(393/2847) P(A U B)=0.5669 olarak hesaplanır.
Örnek Ebeveynler Çocuk İkiside içmiyor Biri içiyor İkiside içiyor Toplam Hiç içmiyor 480 432 391 1303 Günde bir adet 256 393 327 976 Günde beş adet 90 147 159 396 Günde beşten fazla 22 59 91 172 Toplam 848 1031 968 2847 Örneğin A olayı çocuğun günde 5 adet sigara içmesi olsun. B olayı da ebeveynlerin her ikisi de sigara içiyor olması olsun.
Örnek Ebeveynler Çocuk İkiside içmiyor Biri içiyor İkiside içiyor Toplam Hiç içmiyor 480 432 391 1303 Günde bir adet 256 393 327 976 Günde beş adet 90 147 159 396 Günde beşten fazla 22 59 91 172 Toplam 848 1031 968 2847 Bu durumda ebeveynlerin her ikisi de sigara içiyor ise, bunların çocuklarının günde 5 adet sigara içme olasılığı nedir? P(A B)=?
Örnek Ebeveynler Çocuk İkiside içmiyor Biri içiyor İkiside içiyor Toplam Hiç içmiyor 480 432 391 1303 Günde bir adet 256 393 327 976 Günde beş adet 90 147 159 396 Günde beşten fazla 22 59 91 172 Toplam 848 1031 968 2847 P(A B)=P(A B) / P(B) P(A B)=159/2847, P(B)=968/2847 P(A B)=(159/2847) / (968/2847)=159/968=0.1642
Bayes Kuralı Bayes kuralı, koşullu olasılıkların hesaplanmasında kullanılan bir yöntemdir. Bayes kuralının tıp alanındaki kullanımı: Bir bireye ait tarama ya da tanı testi sonucu pozitif iken bu bireyin hasta olma olasılığını hesaplamakta kullanılır.
Bayes Kuralı Örneğin yapılan çalışmalar sonucunda toplumda Down sendromu görülme olasılığı 10,000 canlı doğumda 9.2 (0.00092) olarak görülmüş olsun.
Bayes Kuralı Üçlü tarama testi, down sendromu (trizomi 21), nöral tüp defekti ve trizomi 18 adı verilen genetik hastalığın anne karnındaki bebekte olma olasılığını saptayan bir kan incelemesidir. Anne adayından alınan kan örneğinde 3 değişik maddenin incelemesi yapılır. Ancak kesin sonucu veren altın standart değildir.
Bayes Kuralı Yapılan kan incelemesinde β-hcg Alfa-feto protein (AFP) ve Estriol (E3) değerlerine bakılır.
Bayes Kuralı Human chorionic gonadotropin (hcg) gebeliğin temel hormonudur. Hamileliğin erken dönemlerinde artmaya başlar ve 14. ile 16. haftalar arasında en yüksek değerine ulaştıktan sonra yavaş yavaş azalır.
Bayes Kuralı Alfa feto-protein bebeğin karaciğerinden salgılanan bir proteindir. Bebekten amniyon sıvısına oradan da anne adayının kanına geçer. Gebeliğin seyri sırasında anne adayının kanındaki düzeyi yavaş ama düzenli bir artış gösterir.
Bayes Kuralı Estriol ise yine bebeğe ait bir doku olan plasentadan salgılanan bir çeşit östrojen hormonudur. Normal olmayan gebeliklerde, bu maddelerin değerlerinde sapmalar görünür. Down sendromu varlığında β-hcg değerleri normalden yüksek olarak bulunurken E3 ve AFP düzeyi daha düşüktür.
Bayes Kuralı Örnek Bir Üçlü Tarama Testi Sonuçları
Bayes Kuralı Down sendromu için kabul edilen normal risk sınırı 1/280'dir. Riskin daha yüksek çıktığı durumlarda (örneğin 1/100 ya da 1/40) ileri tetkik olan amniyosentez önerilir. Riskin kabul edilen sınırdan daha yüksek olması durumunda test pozitif sonuç vermiş olarak değerlendirilir.
Bayes Kuralı Yapılan çalışmalarda üçlü teste ait diğer olasılıklar aşağıdaki şekilde belirlenmiş olsun. Fetüs gerçekte Down sendromlu iken üçlü testin pozitif sonuç verme olasılığı 0.7373. Fetüs gerçekte Down sendromlu değil iken üçlü testin pozitif sonuç verme olasılığı 0.0499.
Bayes Kuralı Fetüs gerçekte Down sendromlu iken üçlü testin negatif sonuç verme olasılığı 0.2627. Fetüs gerçekte Down sendromlu değil iken üçlü testin negatif sonuç verme olasılığı 0.9501.
Bayes Kuralı Down sendromu ve üçlü test ile ilgili verilen olasılıkları aşağıdaki şekilde özetleyelim. P(D+)=0.00092 P(T+ D+)=0.7373 P(T- D+)=0.2627 P(D-)=0.99908 P(T+ D-)=0.0499 P(T- D-)=0.9501
Bayes Kuralı Bu sonuçları kullanarak şu örnek üzerinde düşünelim. Örneğin ilk kez kliniğe başvuran bir gebeye üçlü test yapılıyor ve sonuç pozitif çıkıyor. Bu gebelikte fetüsün gerçekten Down sendromlu olma olasılığı nedir? Bu olasılık neyi belirler? P(D+ T+)=?
Bayes Kuralı Bu sonuçları kullanarak şu örnek üzerinde düşünelim. P(D+ T+)=P(D+ T+) / P(T+) ) ( ) ( ) ( ) ( ) ( ) ( ) ( D P D P T D P D P T D P D P T T D P Yukarıda belirtilen Bayes kuralı ile elde edilen ön olasılıklar kullanılarak son olasılıklar hesaplanır.
Bayes Kuralı P( D T ) P( T P( T D) P( D) D) P( D) P( T D) P( D) P(D+)=0.00092 P(T+/D+)=0.7373 P(D-)=0.99908 P(T+/D-)=0.0499 (0.7373)(0.00092) P( D T ) (0.7373)(0.00092) (0.0499)(0.99908) 0.0134
Bayes Kuralı Örneğini şu şekilde düşünelim. İlk kez kliniğe başvuran bir gebeye üçlü test yapılıyor ve sonuç negatif çıkıyor. Bu gebelikte fetüsün gerçekten Down sendromlu olmama olasılığı nedir? Bu olasılık neyi belirler? P(D-/T-)=?
Bayes Kuralı P(D- T-)=P(D- T-) / P(T-) ) ( ) ( ) ( ) ( ) ( ) ( ) ( D P D P T D P D T P D P D P T T D P Yukarıda belirtilen Bayes kuralı ile elde edilen ön olasılıklar kullanılarak son olasılıklar hesaplanır.
Bayes Kuralı ( P( T D ) P( D ) P D T ) P( T D ) P( D ) P( T D ) P( D ) P(D+)=0.00092 P(T-/D-)=0.9501 P(D-)=0.99908 P(T-/D+)=0.2627 (0.9501)(0.99908) P( D T ) (0.9501)(0.99908) (0.2627)(0.00092) 0.99975
Bayes Kuralı Bu örneklerde şu sonuca varabiliriz. Üçlü test sonucu pozitif çıkarsa fetüsün gerçekten Down sendromlu olma olasılığı %1.34 ki bu oran çok düşüktür. Ancak üçlü tarama testi sonucu negatif çıkarsa fetüsün gerçekten Down sendromlu olmama olasılığı %99.9 gibi yüksek bir orandır.
Bayes Kuralı Sonuç: Üçlü tarama testi tanı koymaz, eğer test pozitif çıkarsa fetüs Down sendromludur gebelik sonlanmalıdır gibi bir sonuca varamayız. Çünkü bunu sadece %1.34 gibi düşük bir yüzdeyle söyleriz. Bu durumu netleştirmek için diğer tanı testleri kullanılmalıdır.
Bayes Kuralı Ancak test sonucu negatif çıkarsa fetüsün Down sendromlu olmadığını rahatlıkla söyleyebilir ve ekstra tanı testlerini yapmak zorunda kalmayız.