T.C. SELÇUK ÜNĠVERSĠTESĠ FEN BĠLĠMLERĠ ENSTĠTÜSÜ

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "T.C. SELÇUK ÜNĠVERSĠTESĠ FEN BĠLĠMLERĠ ENSTĠTÜSÜ"

Transkript

1 T.C. SELÇUK ÜNĠVERSĠTESĠ FEN BĠLĠMLERĠ ENSTĠTÜSÜ TANI TEST ÖLÇÜTLERĠNDE ROC EĞRĠSĠ VE SINIFLAMA ANALĠZLERĠNĠN KARġILAġTIRILMASINDA KULLANIMI Mehmet Sinan ĠYĠSOY YÜKSEK LĠSANS TEZĠ Ġstatistik Anabilim Dalı Ocak-2014 KONYA Her Hakkı Saklıdır

2

3 TEZ BĠLDĠRĠMĠ Bu tezdeki bütün bilgilerin etik davranıģ ve akademik kurallar çerçevesinde elde edildiğini ve tez yazım kurallarına uygun olarak hazırlanan bu çalıģmada bana ait olmayan her türlü ifade ve bilginin kaynağına eksiksiz atıf yapıldığını bildiririm. DECLARATION PAGE I hereby declare that all information in this document has been obtained and presented in accordance with academic rules and ethical conduct. I also declare that, as required by these rules and conduct, I have fully cited and referenced all material and results that are not original to this work. Mehmet Sinan ĠYĠSOY

4 ÖZET YÜKSEK LĠSANS TEZĠ Tanı Test Ölçütlerinde ROC Eğrisi ve Sınıflama Analizlerinin KarĢılaĢtırılmasında Kullanımı Mehmet Sinan ĠYĠSOY Selçuk Üniversitesi Fen Bilimleri Enstitüsü Ġstatistik Anabilim Dalı DanıĢman: Doç.Dr. Mustafa SEMĠZ Yıl, Sayfa Jüri Doç.Dr.Mustafa SEMĠZ Yrd. Doç. Dr. Ġsmail KINACI Yrd. Doç. Dr. Murat ERĠġOĞLU Tanı testleri sağlık alanında hastalıkların teģhisinde kullanılır. Tanı testlerinin performansı ve daha kolay, daha uygun tanı testinin bulunması önemli bir sorundur. Tanı testlerinin performanslarının değerlendirilmesinde kullanılan duyarlılık ve seçicilik kavramları kullanılarak ROC eğrileri çizilir. Diskriminant (ayırma) analizi ve lojistik regresyon ikili sonuç değiģkeni ile yapılacak olan sınıflamanın performanslarının değerlendirilmesi de yine ROC eğrileri ile yapılabilir. Bu çalıģmada ayırma analizi ve lojistik regresyon analizinin performansları simülasyon çalıģmasıyla karģılaģtırılmıģtır. Anahtar Kelimeler: tanı testi, duyarlılık, seçicilik, ayırma analizi, ROC eğrisi, lojistik regresyon iv

5 ABSTRACT MS THESIS ROC Curves in Diagnostic Tests and a Comparison of Discriminant Analysis and Logistic Regression Mehmet Sinan ĠYĠSOY THE GRADUATE SCHOOL OF NATURAL AND APPLIED SCIENCE OF SELÇUK UNIVERSITY THE DEGREE OF MASTER OF SCIENCE IN STATISTICS Advisor: Assoc. Prof. Dr. Mustafa SEMĠZ Year, Pages Jury Assoc. Prof. Dr. Mustafa SEMĠZ Asst. Prof. Dr. Ġsmail KINACI Asst. Prof. Dr. Murat ERĠġOĞLU Diagnostic tests are of special importance. It is an important issue to find the better, easy and performant diagnostic test. Sensitivity and specificity are two concepts which are used in ROC curves when interpreting the performances of diagnostic tests. Interpreting the performances of discriminant analysis and logistic regression when outcome variable is dichotomous is also possible with ROC curves. We will concentrate on interpreting performances of these analyses with simulations. Keywords: diagnostic tests,sensitivity,specificity,roc curves, discriminant analysis, logistic regression v

6 ÖNSÖZ Bu çalıģma aileme ithaf edilmiģtir. ÇalıĢmada yardımlarını esirgemeyen danıģman hocam Doç.Dr. Mustafa Semiz e teģekkürlerimi sunarım. Mehmet Sinan ĠYĠSOY KONYA-2014 vi

7 ĠÇĠNDEKĠLER ÖZET... iv ABSTRACT... v ÖNSÖZ... vi ĠÇĠNDEKĠLER... vii SĠMGELER VE KISALTMALAR... ix 1. GĠRĠġ TANISAL KESĠNLĠK ÖLÇÜTLERĠ VE ROC EĞRĠLERĠ Duyarlılık ve Seçicilik YanlıĢ Pozitif Oranı ve YanlıĢ Negatif Oranı Kesinlik Odds Oranı Youden Ġndeksi Pozitif Tahmini Değer Negatif Tahmini Değer Pozitif Olabilirlik Oranı Negatif Olabilirlik Oranı ROC Eğrileri ROC eğrisinin çizilmesi ROC eğrisi altında kalan alan ROC eğrisinin değerlendirilmesi Optimum kesim noktasını bulma Belli bir seçicilik değerindeki duyarlılık ve ROC eğrisi altında kalan kısmi alan ROC eğrisinin avantajları SINIFLAMA ANALĠZLERĠ Ayırma (Diskriminant) Analizi Ayırma analizinin varsayımları Ayırma analizindeki temel eģitlikler Örnek uygulama Lojistik Regresyon Lojistik regresyon modelini uydurma Olabilirlik oranı testi Wald testi Çoklu lojistik regresyon modeli Örnek uygulama MATERYAL VE YÖNTEM vii

8 5. ARAġTIRMA SONUÇLARI VE TARTIġMA AraĢtırma Sonuçları TartıĢma SONUÇ VE ÖNERĠLER KAYNAKLAR ÖZGEÇMĠġ viii

9 Simgeler SĠMGELER VE KISALTMALAR LR+ LR- S e S p Positive Likelihood Ratio (Pozitif Olabilirlik Oranı) Negative Likelihood Ratio (Negatif Olabilirlik Oranı) Sensitivity (Duyarlılık) Specifity (Seçicilik) Kısaltmalar AUC Area under the curve (Eğri Altında Kalan Alan) FPF False Positive Fraction (YanlıĢ Pozitif Oranı) FPR False Positive Rate (YanlıĢ Pozitif Oranı) OR Odds Ratio (Odds Oranı) PPV Positive Predictive Value (Pozitif Tahmini Değer) NPV Negative Predictive Value (Negatif Tahmini Değer) ROC Receiver Operating Characteristic (ĠĢlemci Uygulama Özelliği) TPF True Positive Fraction (Doğru Pozitif Oranı) TPR True Positive Rate (Doğru Pozitif Oranı) ix

10 1 1. GĠRĠġ Tanı testleri tıpta önemli bir rol oynar ve sağlık harcamalarında önemli bir paya sahiptirler. Tanı testleri bir hastalığa tanı koymada ya da koyulmuģ olan bir tanıyı doğrulamada kullanılırlar. Tanı testi sonucunun yorumlanması hasta ile hasta olmayan kiģiyi ayırmasına ve testin kullanıldığı duruma bağlıdır. Bir tanı testi sonucuna göre sürekli, dikotom (ikili) veya ordinal (sıralı) olarak adlandırılır. Mesela kan basıncını veren bir test sürekli, hastanın HIV virüsü taģıyıp taģımadığını veren bir test dikotom ve hastanın bir hastalığa sahip olmasını kesinlikle, daha az kesin, muhtemelen değil, kesin değil Ģeklinde veren bir tanı testi ise ordinal olarak adlandırılır. En çok karģılaģılan tanı testleri sürekli olanlardır. Sürekli sonuç veren laboratuar çalıģmaları oldukça çoktur ve bu yüzden sürekli tanı testleri ile ilgili yeni istatistiksel metodlar geliģtirilmektedir. Dikotom sonuç veren laboratuar çalıģmalarına da sıkça karģılaģılmakta ve bunların istatistiksel analizinde binomial oranlar ve 2x2 tabloları sıklıkla kullanılmaktadır. Sürekli tanı testleri için önerilmiģ metodların çoğu özellikle radyolojik görüntüleme alanında sıklıkla kullanılan ordinal tanı testlerinden uyarlanmıģtır (Shapiro,1999). Tanı testlerinin iki amacı vardır: a) Hastanın durumu hakkında doğru bilgi sağlamak b) Hastanın yönetimi için doktorun planına yön vermek. Doktor tanı testinin nasıl yorumlanması gerektiğini biliyorsa bu amaçlar gerçekleģebilir. Tanı testinin (ayırt edici) kesinliği (discriminatory accuracy) testin doğru sonuç verip vermemesi ile yani gerçek hasta ile hasta olmayanı ayırma gücündedir. Eğer test sonuçları hep aynıysa testin kesinliği önemsizdir ve eğer test sonuçları iki durum için kesiģmiyorsa testin tanısal kesinliği mükemmeldir. Genelde bir testin kesinliği bu iki durumun arasındadır. Kaçınılması gereken en önemli hata, bir tanı testi sonucunun hastanın durumunu doğru olarak gösterdiğinin kabul edilmesidir. Çoğu tanı testi bilgisi mükemmel değildir, doktora bir fikir verir ama sonuçta bir belirsizlik olabileceği hiçbir zaman hatırdan çıkarılmamalıdır. Test sonucu negatifse hastanın hasta olmadığı anlamına mı gelmektedir? Doktor hastayı hasta olmadığından dolayı evine mi göndermelidir? Yoksa test sonucu pozitif olduğu için hemen tedaviye baģlamalı ve hastaneye mi yatırmalıdır? Bu sorulara cevap verebilmek için doktorun testin mutlak ve göreceli kapasitesi hakkında bilgi sahibi olması gerekir. Doktorun, bu testin gerçek hastaları nasıl tahmin ettiğini (duyarlılık) ve gerçek hasta olmayanı nasıl ayırt ettiğini (seçicilik)

11 2 değerlendirmesi gereklidir. Bu test daha önceki baģka bir testin yerine mi konmuģtur? Yoksa yanında baģka testler de yapılmalı mıdır? Eğer bir tanı testi tüm gerçek hastaları hasta olarak sınıflamıģ, ve tüm hasta olmayanları hasta değil olarak belirlemiģ ise o tanı testine altın standart denir. Altın standart tanı testleri kimi zaman diğerlerine göre pahalı, ya da zor ve daha çok kaynak, zaman gerektiren, ya da hastaya diğer testlere göre daha çok zarar veren testler veya yöntemler olabilir. Tanı testinin sonucunun doğruluğu altın standart sonucu ile belirlenir (Zhou ve ark.,2002). Bu çalıģmada tanı testlerinin kesinlik ölçütlerinden bahsedilecek ve tanı testlerinin karģılaģtırılmasında kullanımları anlatılacaktır. ROC eğrileri ilk olarak 2. Dünya SavaĢında elektrik ve radar mühendisleri tarafından düģman nesneleri ayırt etmede (cismin bir uçak mı? yoksa sadece bir kuģ mu olduğunu bulmada) kullanılmıģtır. Daha sonra psikoloji, tıp, biyometri ve sonraları ise makine öğrenmesi ve veri madenciliği alanlarında kullanılmaya baģlamıģtır. ROC eğrileri tanı testlerinin performanslarını değerlendirmede ve uygun kesim noktasını bulmakta kullanılır. Bu çalıģmada ROC eğrilerinin bu amaçla kullanımından bahsedilecektir. ROC eğrilerinin baģka bir uygulaması ise sınıflama analizlerine ait performansların karģılaģtırılmasında kullanımlarıdır. Dikotom bir sonuç değiģkeni olduğunda sınıflama analizi bir tanı testi gibi düģünülebilir. Çünkü sınıflama analizi sonucunda ikili bir sonuç çıkmaktadır (hasta ya da hasta değil, 1. gruba ait ya da 2. gruba ait gibi). ROC eğrileri aynı tanı testlerinde olduğu gibi, bu durumda da sınıflama analizinin performansını değerlendirmede kullanılacaktır. Ancak sadece ayırma analizi ve lojistik regresyon analizleri incelemeye alınmıģtır. Diğer sınıflama analizleri çalıģmanın kapsamı dıģındadır. ÇalıĢmanın ilk bölümünde tanı testlerini değerlendirmekte kullanılan kesinlik ölçütlerinden ve ROC eğrilerinden bahsedilmiģtir. Ġkinci bölümde sınıflama analizlerinden ayırma analizi ve lojistik regresyondan bahsedilmiģtir. Üçüncü bölümde ayırma analizi ve lojistik regresyonun performanslarını karģılaģtırmada kullanılacak yöntem anlatılmaktadır. Dördüncü bölümde uygulanan yöntem sonucunda çıkan sonuçlar tartıģılmıģtır.

12 3 2. TANISAL KESĠNLĠK ÖLÇÜTLERĠ VE ROC EĞRĠLERĠ Bir testin tanı testi olarak kullanılabileceği anlaģıldığında, o testin klinik durumlardaki rolü tanımlanmalı ve değerlendirilmelidir. Bu durumda sadece tanı testinin kendi iç kesinliğini değil aynı zamanda hastalığın prevalansı, hastanın durumu ve testin yanlıģ tanılarının sonuçlarını değerlendirmek gerekir (Zhou ve ark.,2002) Duyarlılık ve Seçicilik Tanısal kesinliğin iki ölçütü duyarlılık (sensitivity) ve seçicilik (özgüllük, specificity) tir. Bunların tanımları en iyi 2x2 lik bir tablo (karar matrisi) yolu ile verilebilir. Bu tabloda sütunlar hastalığın, altın standart bir test sonucunda çıkan gerçekte varlığını ve yokluğunu, satırlar ise kullanılan tanı testi sonuçlarının pozitif ya da negatif olmasını gösterir. Hastanın gerçekte hasta olmasını (D+) ve gerçekte hasta olmamasını (D-), tanı testi sonucunun pozitif olmasını (T+) ve negatif olmasını (T-) ile gösterirsek, tüm test sonuçları Tablo 2.1 de olduğu gibi bir tablo (karar matrisi) ile özetlenir. Tablo 2.1. Karar Matrisi Test Sonucu Pozitif (T+) Negatif (T-) Hastalık Durumu Var (D+) Yok (D-) TP (Doğru pozitif) FP (YanlıĢ pozitif) FN (YanlıĢ negatif) TN (Doğru negatif) ölçülür. Tanısal kesinlik gerçek hastaları doğru bir Ģekilde sınıflayan Ģartlı olasılıklar ile Bir testin duyarlılığı S e P( T D ) (2.1) Ģeklinde tanımlanmıģ bir Ģartlı olasılıktır. Daha açık bir ifadeyle, kiģinin hasta olduğu bilindiğinde testin de hasta sonucu (pozitif) vermiģ olması olasılığıdır. Dolayısıyla S TP e TP FN (2.2) oranına eģittir. TP + FN adet hasta içerisinde test sonucu pozitif olan TP adet hasta

13 4 vardır. Bu yüzden duyarlılık, doğru pozitif oranı (True Positive Rate, TPR,TPF) olarak da adlandırılır. Bir testin seçiciliği S p P( T D ) (2.3) olarak tanımlanmıģ bir Ģartlı olasılıktır. Diğer bir ifadeyle, kiģinin hasta olmadığı bilindiğinde testin de hasta olmadığı sonucunu vermiģ olması olasılığıdır. Dolayısıyla S TN p TN FP (2.4) oranına eģittir. TN + FP adet hasta olmayan kiģi içerisinde test sonucu negatif olan TN adet hasta vardır. Bu yüzden seçicilik, doğru negatif oranı (True Negative Rate, TNR, TNF) olarak da adlandırılır. Duyarlılık ve seçicilik tanı testlerinin değerlendirilmesinde kullanılan en önemli ölçütlerdendir (Shapiro,1999) YanlıĢ Pozitif Oranı ve YanlıĢ Negatif Oranı Yukarıda tanımlanan duyarlılık ve seçicilik değerlerinin tamamlayıcıları olarak yanlıģ pozitif oranı ve yanlıģ negatif oranı da tanımlanacaktır. değerlere göre YanlıĢ negatif oranı (False Negative Rate, FNR, FNF) karar matrisindeki FN FNR P( T D ) (2.5) TP FN Ģeklinde tanımlanır. Test sonucu negatif çıkan fakat hasta olduğu bilinen FN adet hastanın tüm hasta sayısına bölümüdür. S e FNR 1 (2.6) olduğu kolayca görülebilir. YanlıĢ pozitif oranı (False Positive Rate, FPR, FPF) karar matrisindeki değerlere göre FP FPR P( T D ) (2.7) TN FP Ģeklinde tanımlanır. Test sonucu pozitif çıkan fakat hasta olmadığı bilinen FP adet hastanın tüm hasta olmayan sayısına bölümüdür. S p FPR 1 (2.8) olduğu kolayca görülebilir (Shapiro,1999).

14 Kesinlik Kesinlik (accuracy) tanı testinin doğru sonuç verdiği popülasyon oranıdır. Kesinlik=Doğru Karar Sayısı/ Tüm Durumlar Ģeklinde tanımlanır.tablo 2.1 kullanılarak ve toplam kiģi sayısı N TP TF FP FN olduğunda kesinlik Kesinlik TP TN N (2.9) Ģeklinde gösterilebilir. Duyarlılık ve seçicilik kullanılarak, kesinlik aģağıdaki gibi formüle edilebilir: Kesinlik=Duyarlılık* Hasta oranı + Seçicilik * Hasta olmayan oranı Hasta popülasyon oranına hastalığın prevalansı denir ve P(D+) ile gösterilebilir. P(D-) ise hasta olmayan nüfus oranıdır. Basit aritmetik iģlemler kullanarak Kesinlik TP N TN N TP TP x TP FN FN N TN FP TN x FP TN N Se. P( D ) S p. P( D ) (2.10) Ģeklinde bulunur. Hastalığın prevalansı, tanı testinin duyarlılık ve seçiciliği bilindiğinde kesinlik yukarıdaki formüle göre hesaplanabilir. Kesinlik bir tanısal kesinlik ölçütü olarak kullanılamaz, çünkü hastalığın prevalansından etkilenir. Bu durumu göstermek ve tanımlanan kavramları açıklamak için aģağıda bir örnek verilecektir. Varsayılsın ki 1200 kiģiye bir A tanı testi uygulanmıģ ve bu test sonucunda toplam 200 gerçek hasta içerisinde, A testi 140 hastaya pozitif sonuç vermiģ ve kalan 60 hastaya negatif sonuç vermiģ olsun kiģilik hasta olmayan grup içerisinde ise A testi 100 hastaya pozitif sonuç, 900 hastaya ise negatif sonuç vermiģ olsun. A testine ait karar matrisi Tablo 2.2 de gösterilmiģtir.

15 6 Tablo 2.2. A testi için karar matrisi A Testi Sonucu Pozitif (T+) Negatif (T-) Hastalık Durumu Var (D+) Yok (D-) Toplam Toplam S e = 140/200 = 0.7, S p = 900/1000=0.9, P(D+)= 200/1200 = 0.17 ve Kesinlik 1 = S e.p(d+) + S p. P(D-) = 0.7* *0.83 = 0.87 bulunur. Bu hesaplamalardan, testin hasta olmayanları bulmakta daha baģarılı (S p = 0.9) olduğunu, fakat hastaları bulmakta baģarısının daha düģük olduğu (S e = 0.7) anlaģılır. Eğer bu oranlar sabit tutulur ve hastalığın prevalansı 0.17 den 0.6 ya çıkartılırsa, yeni durumda testin kesinliği Kesinlik 2 = 0.7 * * 0.4 = 0.78 olur. Görüldüğü gibi hastalığın prevalansı değiģtiğinde Kesinlik de değiģmektedir. Genellikle iki tanı testi karģılaģtırılmak istenir. Mesela yukarıdaki örnekteki aynı popülasyona baģka bir B testi ile de tanı konduğu varsayılsın. B testine ait sonuçlar Tablo 2.3 te verilmiģtir. Bu iki tablo karģılaģtırıldığında testlerin farklı sonuçlar vermesine rağmen kesinliklerinin aynı olduğu görülür. B testi gerçek hastaları bulmada A testinden kötü olmasına rağmen, hasta olmayanları bulmakta A testinden daha iyidir. Bu yüzden bu iki teste ait kesinlik değerleri eģit çıkmaktadır. (Metz,1978) Tablo 2.3. B testi için karar matrisi B Testi Sonucu Pozitif (T+) Negatif (T-) Hastalık Durumu Var (D+) Yok (D-) Toplam Toplam S e = 80/200 = 0.4, S p = 960/1000=0.96, P(D+)= 200/1200 = 0.17 ve

16 7 Kesinlik = S e * P(D+) + S p * P(D-) = 0.4* *0.83 = Odds Oranı Epidemiyolojide yaygın olarak kullanılan odds oranı (odds ratio) bir tanısal kesinlik ölçütü olarak da kullanılabilir. Tanısal kesinlik için odds oranı aģağıdaki gibi tanımlanır. OR Se (1 S e (1 S / ) S p p ) (2.11) Odds oranının 1 olması hasta olanlar ve olmayanlar için test sonucunun pozitif çıkma ihtimalinin eģit olduğunu gösterir. Odds oranının 1 den büyük olması, gerçek hastalarda test sonucu pozitif çıkmasının negatif çıkmasına göre daha yüksek ihtimalle olduğunu, 1 den küçük olması ise hasta olmayanlar arasında test sonucu pozitif çıkmasının negatif çıkmasına göre daha yüksek olduğu anlamına gelir. Odds oranı hastalığın prevalansından etkilenmez (Zhou ve ark.,2002) Youden Ġndeksi Bir tanı testi için Youden indeksi (Youden index) Youden=S e + S p - 1 (2.12) Ģeklinde tanımlanır. Bölüm 2.3.de tanımlanan kesinlikten farklı olarak, Odds oranı ve Youden indeksi hastalığın prevalansından etkilenmez. Dolayısıyla kesinlik ten daha iyi birer tanısal ölçüttürler. Fakat her ikisinin de doğru test sonucunu göstermede iki kısıtlılığı vardır. Ġlk olarak her ikisi de sadece bir karar kesim noktasına (decision threshold) dayanır ve ikinci olarak her ikisi de yanlıģ pozitif ve yanlıģ negatif sonuçları eģit derecede istenilmez olarak değerlendirir. Mesela bir A testinin duyarlılığı 0.9 ve seçiciliği 0.4 ve bir baģka B testinin duyarlılığı 0.4 ve seçiciliği 0.9 olsun. Odds Oranı A = (0.9 / (1-0.9)) / ((1-0.4) / 0.4 ) = 6 Odds Oranı B = (0.4 / (1-0.4)) / ((1-0.9) / 0.9 ) = 6 ve Youden A = = 0.3 Youden B = = 0.3 olur. Odds oranı ve Youden indeksi her iki test için de aynı olmasına rağmen testler birbirlerinden farklı özelliklere sahiptir (Zhou ve ark.,2002).

17 Pozitif Tahmini Değer Doğru pozitif sonuçlarının tüm pozitif test sonuçlarına oranına Pozitif Tahmini Değer (Positive Predictive Value) denir. Karar matrisine göre PPV TP TP FP (2.13) Ģeklinde formüle edilir. Ya da koģullu olasılık ile PPV P( D T ) (2.14) Ģeklinde gösterilebilir. Test sonucunun hangi oranda doğru olduğunu göstermesi açısından tanı testlerinin performansını değerlendirmede önemli bir ölçüttür. Hastalığın prevalansından etkilenir. Bayes Teoremi kullanılarak PPV P( D T ) P( T D ) P( D P( T ) ) = P( T D P( T D ) P( D ) ) P( D ) P( T D ) P( D ) = S e P( D ) SeP( D ) (1 S )(1 p P( D )) (2.15) Ģeklinde bulunur. Eğer duyarlılık, seçicilik ve hastalığın prevalansı biliniyorsa pozitif tahmini değer yukarıdaki eģitlik kullanılarak bulunabilir. PPVnin düģük olması pozitif test sonuçlarının çoğunun yanlıģ pozitif olduğu anlamına gelir. Dolayısıyla böyle bir durumda baģka bir test daha yaparak gerçekten hastalığın olup olmadığını anlamak gerekir Negatif Tahmini Değer YanlıĢ negatif test sonuçlarının tüm negatif test sonuçlarına oranına Negatif Tahmini Değer (Negative Predictive Value) denir. Karar matrisine göre NPV TN TN FN (2.16) Ģeklinde formüle edilir. Ya da koģullu olasılık ile NPV P( D T ) (2.17) Ģeklinde gösterilebilir. NPV nin yüksek olması test sonucu negatif çıkan bir kiģinin gerçekte hasta olma olasılığının düģük olduğunu gösterir. Hastalığın prevalansından etkilenir. Bayes Teoremi kullanılarak

18 9 NPV P( D T ) = P( T D ) P( D P( T ) ) = P( T D P( T D ) P( D ) ) P( D ) P( T D ) P( D ) = S p P( D S P( D p ) (1 ) S ) P( D e ) (2.18) Ģeklinde bulunur. Eğer duyarlılık, seçicilik ve hastalığın prevalansı biliniyorsa negatif tahmini değer yukarıdaki eģitlik kullanarak bulunabilir. Örnek: Bir C tanı testi sonuçlarının aģağıdaki gibi olduğu kabul edilsin. Tablo 2.4. C testi için karar matrisi C Testi Sonucu Pozitif (T+) Negatif (T-) Hastalık Durumu Var (D+) Yok (D-) PPV=20/200= NPV=1820/1830 ~.995 PPV nin çok küçük %10 olması test sonucu pozitif çıkan bir kiģinin büyük olasılıkla hasta olmadığı anlamına gelir. Bu durumda hasta teģhisi konabilmesi için baģka bir test kullanılmalıdır. Fakat, bu test yapılması çok kaynak gerektirmeyen ve kolay uygulanan bir test ise, yine de kullanılabilir. Çünkü NPV si çok yüksektir (%99.5). Dolayısıyla test sonucu negatif çıkan bir kiģi çok yüksek olasılıkla hasta değildir. PPV ve NPV nin hastalığın prevalansından etkilenmesi, testin kesinliğini ölçmek için bir problemdir. Ġncelenen popülasyonda hastalığın prevalansının, hastalığın gerçekteki prevalansından yüksek olması PPV değerini arttırır ve NPV değerini azaltır. Ġncelenen popülasyonda hastalığın prevalansının, hastalığın gerçekteki prevalansından az olması ise PPV değerini azaltır ve NPV değerini yükseltir. Bu durumdan kurtulmak için PPV ve NPV yi, sadece test edilen gruptaki hasta ve sağlam oranının hastalığın gerçekteki prevalansına eģit olduğu durumlarda kullanmak gerekmektedir. Örnek: Duyarlılığı %80 ve seçiciliği %90 olan bir tanı testi ile prevalansı %60 olan bir hastalığın tanısını koymak istenildiği varsayılsın. Bu durumda

19 10 PPV S P( D e ) SeP( D ) (1 S )(1 p P( D )) formülü kullanılarak 0.80*0.60 PPV *0.60 (1 0.90)(1 0.60) bulunur. Bu durumda eğer kiģinin test sonucu pozitif ise %92 olasılıkla gerçekten hastadır. Test sonucu negatif gelmiģ ise, bu durumda NPV hesaplanarak NPV S P( D p S P( D p ) (1 ) S ) P( D e 0.90*(1 0.60) 0.75 ) 0.90*(1 0.60) (1 0.80)*0.60 olduğundan dolayı kiģinin %75 ihtimalle gerçek hasta olmadığı hükmüne varılır. Eğer bu testin duyarlılığı daha yüksek (%90), seçiciliği daha düģük (%80) olsaydı, o zaman 0.90*0.60 PPV *0.60 (1 0.80)(1 0.60) ve 0.80*(1 0.60) NPV *(1 0.60) (1 0.90)*0.60 olacağından test sonucu pozitif çıkan bir kiģinin %87 olasılıkla gerçek hasta, test sonucu negatif çıkan bir kiģinin %84 olasılıkla sağlam olduğu anlaģılacaktı Pozitif Olabilirlik Oranı Pozitif Olabilirlik Oranı (Positive Likelihood Ratio) bir tanı testinin hasta kiģide pozitif çıkma olasılığının, sağlam kiģide pozitif çıkma olasılığına oranıdır. Duyarlılık ve seçicilik kullanılarak Se Pozitif LR = LR+ = 1 S Ģeklinde ifade edilebilir. KoĢullu olasılıklar ile P( T D ) P( T D ) LR+ = 1 P( T D ) P( T D ) Ģeklinde yazılabilir. p (2.19) (2.20) Sadece duyarlılık ve seçiciliğe bağlı olduğu için hastalığın prevalansından etkilenmeyen bir ölçüttür.

20 Negatif Olabilirlik Oranı Negatif Olabilirlik Oranı (Negative Likelihood Ratio) bir tanı testinin hasta kiģide negatif çıkma olasılığının, sağlam kiģide negatif çıkma olasılığına oranıdır. Duyarlılık ve seçicilik kullanılarak 1 S Negatif LR = LR- = S Ģeklinde ifade edilebilir. KoĢullu olasılıklar ile 1 P( T D ) P( T D ) LR- = P( T D ) P( T D ) Ģeklinde yazılabilir. p e (2.21) (2.22) Sadece duyarlılık ve seçiciliğe bağlı olduğu için hastalığın prevalansından etkilenmeyen bir ölçüttür. Örnek: Duyarlılığı %80 ve seçiciliği %90 olan bir tanı testi için 0.80 LR + = olduğu için bu tanı testi her 8 doğru pozitif sonuç için 1 yanlıģ pozitif sonuç vermektedir LR - = olduğu için bu tanı testi her 2 yanlıģ negatif sonuca karģın 9 doğru negatif sonuç vermektedir. LR + nın olabildiğince büyük olması ve LR nin olabildiğince küçük olması istenen bir durumdur. Örnek: web sitesinden alınan bilgilere göre Apandisit teģhisinde kullanılan 3 adet tanı testinin (CT, Ultrason, ve CRP değeri) duyarlılık, seçicilik, LR + ve LR değerleri Tablo 2.5 teki gibidir.

21 12 Tablo 2.5. Bazı tanı testleri için tanısal kesinlik ölçütleri YetiĢkinler Çocuklar Test Duyarlılık Seçicilik LR + LR - CT Ultrason CRP CT Ultrason Ultrasondan Sonra CT CRP ROC Eğrileri Bir tanı testinin duyarlılığı ile yanlıģ pozitif oranlarının (1-seçicilik) oluģturduğu grafiğe ROC eğrisi denir. Grafikteki her nokta farklı bir kesim noktası alınarak hesaplanan duyarlılık (TPR) ve 1-seçicilik (FPR) değerlerinden oluģur. Daha sonra bu noktalar doğru parçaları ile birleģtirilir ve uygun bir eğri kullanılarak kestirilir. ROC eğrilerinin avantajı, sadece bir duyarlılık ve seçicilik değerine bağlı kalmadan, değiģik duyarlılık ve seçicilik değerlerini bir arada değerlendirmeye imkan vermesindedir. Bu sayede maliyet, doğru ve yanlıģ kararların getirileri her seviye için hesaplanabilir. Bu da doğru kesim noktasının bulunmasına yardım eder ROC eğrisinin çizilmesi Bu bölümde gerçek hayattan bir örnek vererek ROC eğrisi çizilecektir. Demir eksikliği anemisi sık görülen bir kansızlık türüdür. Bu hastalığın teģhisinde serum ferritin değerleri kullanılabilir. Belli bir grup kiģide serum ferritin değerleri araģtırılmıģ, bu kiģilerin demir eksikliği anemisine sahip olup olmadıkları belirlenmiģ ve Tablo 2.6 oluģturulmuģtur 1. 1 Veriler %20ROC%20curves.html sitesinden alınmıģtır.ziyaret tarihi:

22 13 Tablo 2.6. Serum ferritin değerleri ve demir eksikliği anemisi olma durumu Serum Ferritin Demir Eksikliği Demir Eksikliği (mmol/l) Anemisi + Anemisi - < > Bu tabloda ilk sütun serum ferritin miktarını, ikinci sütun demir eksikliği anemisi olan kiģi sayısını, üçüncü sütun ise demir eksikliği anemisi olmayan kiģi sayısını göstermektedir. ROC eğrisini çizerken duyarlılık ve seçicilik değerlerine ihtiyaç olduğundan, yukarıdaki tabloyu iki farklı gruba bölmek gerekmektedir. Bir kesim noktası belirlenip, serum ferritin değeri o değerin altında olanları hasta, üstünde olanları sağlam kabul edilsin. Mesela 34 mmol/l değeri kesim noktası olarak alındığında aģağıdaki gibi yeni bir tablo elde edilir. Tablo 2.7. Bir kesim noktası (34) için değerler Serum ferritin (mmol/l) Demir Eksikliği Anemisi + Demir Eksikliği Anemisi = =99 > = =1671 Bu kesim noktası için 649 S e ve S p olarak bulunur ROC eğrisini çizebilmek için baģka duyarlılık ve seçicilik değerlerine de ihtiyaç vardır. Onlar da baģka kesim noktaları seçilerek bulunur. Örnekte 15, 34, 64 ve 94

23 14 değerleri kesim noktaları olarak seçilerek, aģağıdaki duyarlılık ve seçicilik tablosu elde edilir. Tablo 2.8. Tüm kesim noktaları için duyarlılık ve seçicilik değerleri Kesim Noktası Duyarlılık (S e ) Seçicilik (S p ) 1-Seçicilik (1-S p ) < Tablodan görüleceği gibi Duyarlılık ve Seçicilik arasında bir yarıģ vardır. Birisi arttıkça, diğeri azalır. Bu tablodaki Duyarlılık ve 1-Seçicilik değerleri kullanılarak aģağıdaki ROC eğrisi çizilir. ġekil 2.1. Serum Ferritin için ROC eğrisi ġekil 2.1. deki eğri, ilgili tanı testine ait ROC eğrisini, köģegenleri birleģtiren doğru ise ayırt edici özelliği olmayan bir tanı testine ait ROC eğrisini göstermektedir. ROC eğrisinin bu doğrudan yukarıya, eksenlere doğru uzaklaģması tanı testinin ayırt edici özelliğinin artması anlamına gelmektedir. Eğer ROC eğrisinin tamamı bu doğrunun altında kalıyorsa bu durumda tanı testi değerlerini ters çevirerek eğriyi yukarı bölgeye çıkarmak gerekir.

24 15 Mükemmel bir tanı testi için ROC eğrisi, koordinat sisteminde (0,0) noktası ile sol üst köģe noktasını birleģtiren doğru ve sol üst köģe noktası ile sağ üst köģe noktasını birleģtiren doğruların oluģturduğu Ģekildir. Böyle bir eğriyi elde etmek gerçek hayatta oldukça zordur (Kumar ve Indrayan,2011) ROC eğrisi altında kalan alan Bir tanı testinin kesinliğini ölçmek için kullanılan ölçütlerden bir tanesi de teste ait ROC eğrisi altında kalan alandır. Bu alan 0 ile 1 arasında bir değer alır. Yukarıda bahsedilen ve ayırt edici özelliği olmayan teste ait ROC eğrisini gösteren doğru altında kalan alan 0.5 tir. Ve yine yukarıda bahsedilen mükemmel bir teste ait ROC eğrisi, tüm alanı içerdiğinden dolayı alanı 1.0 dır. Dolayısıyla aslında herhangi bir tanı testine ait ROC eğrisinin altında kalan alanın arasında olması beklenir. ROC eğrisi altında kalan alan büyüdükçe tanı testinin kesinliği artar. ROC eğrisinin, sol üst köģe noktasına ((1,0) noktası) yaklaģması da testin tanısal kesinliğinin daha iyi olduğu anlamına gelir. AĢağıdaki tabloda bazı hastalıklara ait tanı testleri ve bunların ROC eğrilerinin altında kalan alanlar verilmiģtir (Zhou ve ark.,2002). Tablo 2.9. Bazı tanı testlerine ait altın standart ve ROC eğrisi altında kalan alanlar Hastalık Tanı Testi Altın Standart ROC Eğrisi Altında Kalan Alan Göğüs Kanseri Mamografi Biyopsi ve yıllık takip Ortalama:0.85 MS (Multiple MRI, CT Expert Panel MRI:0.82 Skleroz) CT:0.52 Bel Fıtığı MRI,CT,CT miyelografi Expert Panel MRI:0.81 CT:0.86 Fetal pulmoner Lesitin/Sfingomyelin Bebeğin L/S: maturite oranı,doymuģ fosfatidilkolin değerlendirilmesi DF:

25 ROC eğrisinin değerlendirilmesi ROC eğrisi altında kalan alan tanı testinin performansını gösteren önemli bir ölçüttür. Alanın büyümesi tanı testinin hasta olanla olmayanı daha iyi ayırdığını gösterir. EĢit alana sahip iki eğri tanı testlerinin toplamda benzer performans gösterdiğini gösterir, ama bu durumda eğriler aynı olmak zorunda değildir. Eğriler birbirlerini kesebilir. ġekil 2.2. de üç farklı ROC eğrisi gösterilmiģtir. A eğrisi B ve C den üstündür ve mükemmele yakın bir performans göstermektedir. C ise en düģük derecede performans gösteren tanı testine aittir (Kumar ve Indrayan,2011). ġekil 2.2. Üç tanı testi için ROC eğrileri ġekil 2.3. de iki tanı testine ait kesiģen ROC eğrileri görülmektedir. Alanlar birbirlerine yakın olmasına rağmen eğrilerin davranıģları farklıdır. Yüksek duyarlılık isteniyorsa 1 numaralı ROC eğrisi, yüksek seçicilik isteniyorsa 2 numaralı ROC eğrisi tercih edilir. ġekil 2.3. KesiĢen ROC eğrileri

26 Optimum kesim noktasını bulma ROC eğrisi üzerinde bulunacak optimum kesim noktası, tanı testinin en doğru sınıflamayı yapmasını sağlayan noktadır. Bu noktayı bulmak için 3 farklı kriter kullanılır. Bunlar eğri üzerindeki (0,1) noktasına en yakın nokta, Youden indeksi ve maliyeti minimize etme kriteridir. Bu kriterlerden ilk ikisi duyarlılık ve seçiciliğe eģit derecede önem verir ve etik, maliyet ve prevalans açısından her hangi bir sınırlamada bulunmayan kriterlerdir. Üçüncü kriter ise maliyetle ilgilenir. Maliyet sadece finansal maliyeti değil, aynı zamanda hastaya yapılacak müdahalenin getireceği zararları ve ileri tetkiklerin maliyetini de içeren bir kriterdir. Uygulaması zor olduğu için bu kriter sağlıkta pek kullanılmaz. ROC eğrisi üzerinde olan her hangi bir nokta ile (0,1) noktası arasındaki uzaklık kolayca d=(1-s e ) 2 +(1-S p ) 2 (2.23) formülüyle bulunur. Optimum kesim noktasını bulmak için bu uzaklık eğri üzerindeki gözlenen tüm kesim noktaları için hesaplanır ve minimum olduğu nokta aranılan noktadır. Gözlenen duyarlılık ve seçicilik değerleri bilindiği için kolaylıkla hesaplanabilir. Ġkinci kriter Youden indeksidir.youden indeksi eğri üzerindeki bir noktanın (0,0) ve (1,1) doğrularını birleģtiren ana köģegene uzaklığı ile ilgilidir. Bu uzaklığın maksimum değeri Youden indeksini verir. Youden indeksinin amacı TPR ile FPR arasındaki farkı en büyük yapmaktır. DeğiĢik duyarlılık ve seçicilik değerleri denenerek Youden indeksi bulunabilir. Youden indeksi doğru sınıflandırma oranını maksimum olma eğilimini gösterdiği için tercih edilen bir kriterdir (Kumar ve Indrayan,2011) Belli bir seçicilik değerindeki duyarlılık ve ROC eğrisi altında kalan kısmi alan Belirli bir seçicilik değeri ya da aralığı, klinik ihtiyaçlara göre belirlenir. Mesela yüksek risk taģıyan bir grupta kanser gibi ciddi bir hastalığı teģhis etmek için, yanlıģ pozitif oranı yüksek bile olsa, yüksek duyarlılığa sahip bir test tercih edilir. Çünkü yüksek yanlıģ negatif sonuçlar veren bir test daha tehlikelidir. Öte yandan düģük risk taģıyan bir grup incelendiğinde, yüksek seçicilik tercih edilir, çünkü sonraki doğrulayıcı test daha pahalı ve hastaya zarar veren bir test olabilir.

27 18 Dolayısıyla yanlıģ pozitif oranı düģük olmalıdır ve hasta gereksizce zarara uğratılmamalıdır. Belirli bir seçicilik değerindeki duyarlılık değeri ve eğri altındaki kısmi alan bu Ģekildeki bir klinik durum için önemlidir. Eğri altında kalan kısmi alan bir FPR aralığı ile eğri arasında kalan alan olarak tanımlanır. FPR aralığı alınabileceği gibi iki tane duyarlılık değeri ile bir TPR aralığı alınarak da kısmi alan bulunabilir. Kısmi alanın mümkün en büyük alana bölünmesi ile standartlaģtırılması tavsiye edilmiģtir. Bu durumda standartlaģtırılmıģ eğri altında kalan alan belirli bir FPR (ya da TPR) aralığındaki ortalama duyarlılık olarak yorumlanabilir. StandartlaĢtırılmıĢ eğri altında kalan alanı yorumlamak daha kolaydır (Kumar ve Indrayan,2011) ROC eğrisinin avantajları Farklı kesim noktalarına göre ROC eğrisi oluģturmanın avantajları aģağıda listelenmiģtir. 1. ROC eğrisi tüm muhtemel kesim noktalarını gösterdiği için optimum kesim noktası eğriye bakarak anlaģılabilir. 2. ROC eğrisi hastalığın prevalansından etkilenmez. 3. Ġki veya daha fazla tanı testi ROC eğrilerine göre tek bir grafik üzerinde kıyaslanabilir. 4. Bazen duyarlılık seçiciliğe, bazen de seçicilik duyarlılığa tercih edilir. Her iki durumda da ROC eğrisi uygun kesim noktasının bulunmasına yardımcıdır. 5. Eğri altında kalan emprik alan doğrusal, log ya da karekök transformasyonu ile değiģmez (Kumar ve Indrayan,2011).

28 19 3. SINIFLAMA ANALĠZLERĠ Bu bölümde sınıflama analizlerinden ayırma analizi ve lojistik regresyon analizlerinden bahsedilecektir Ayırma (Diskriminant) Analizi Ayırma analizinin amacı tahmin edici değiģkenlere bakarak grup üyeliğini bulmaktır. Mesela kanser tanısı koymak için en kesin yöntem biyopsidir. Fakat biyopsi yapmak hem diğer yöntemlere göre pahalı hem de hastaya daha çok zarar veren bir yöntem olduğu için, biyopsi yapmaya gerek kalmadan hastaların bazı değerlerine bakarak kanser olup olmadıklarını tahmin etmek, kanser tanısı koymaya yardımcı olabilir. ĠĢte böyle bir durumda hastaya ait diğer verilere ayırma analizi uygulanarak hastanın kanser olup olmadığı tahmin edilebilir. Ayırma analizi MANOVA nın tersi olarak düģünülebilir. MANOVA da grup üyeliğinin bağımsız değiģkenlerin ortalama farklılıklarıyla istatistiksel anlamlı bir iliģkisi olup olmadığı araģtırılır. Eğer anlamlı bir iliģki varsa, ayırma analizi kullanarak ve tersten düģünerek, bağımsız değiģkenleri kullanarak grup üyeliği tahmin edilir. MANOVA da bağımsız değiģkenler gruplar ve bağımlı değiģkenler tahmin edici değiģkenler iken, ayırma analizinde ters olarak bağımlı değiģken grupları gösteren değiģken ve bağımsız değiģkenler tahmin edici değiģkenlerdir. Ayırma analizi ile lojistik regresyon arasında da bazı farklılıklar vardır. Lojistik regresyonda bağımsız değiģkenler için veri tipi, varyans-kovaryans matrislerinin homojenliği ve çok değiģkenli normallik varsayımları yok iken ayırma analizinde bu varsayımlar vardır. Ayırma analizinde bağımsız değiģkenler sürekli (ya da kesikli), varyans-kovaryans matrisleri homojen ve çok değiģkenli normallik olmalıdır. Bazı yazarlar ayırma analizinde dikotom değiģkenlerin de kullanılabileceğini söylemektedir. Ayırma analizinde grup değiģkeni bir dikotom ise bu ayırma analizine iki gruplu ayırma analizi denirken, grup değiģkenindeki grup sayısı 2 den fazla olduğu durumlarda çoklu ayırma analizi denir. Ayırma analizi matematiksel olarak MANOVA ile aynıdır. Ayırma analizi yapılırken ilk aģamada, tüm değiģkenler dikkate alınarak gruplar arasında önemli farklılık olmadığı ya da bağımsız değiģkenlerin doğrusal kombinasyonu ile grupların ayırt edilip edilmeyeceği belirlenir. Toplam varyans-kovaryans matrisi ve grup içi varyans-kovaryans matrisleri yardımıyla yapılacak çok değiģkenli F testlerinden yararlanılır.

29 20 Çok değiģkenli test sonucunda anlamlı fark bulunduğunda, hangi bağımsız değiģkenlerin modele katkısının daha önemli olduğu belirlenebilir. Ayırma analizinde elde edilecek fonksiyonlar yardımıyla sınıflama iģlemi, yani grup üyeliklerinin belirlenmesi yapılır Ayırma analizinin varsayımları Ayırma analizinin iki temel varsayımı çok değiģkenli normallik ve varyanskovaryans matrislerinin homojenliğidir. Bazı kısıtlayıcıları da vardır ve bunlara da dikkat edilmesi gerekir Çok değiģkenli normallik Ayırma analizindeki çok değiģkenli normallik varsayımı, bağımsız değiģkenlerin çok değiģkenli normal dağılıma sahip bir kitleden çekildiğini ve bağımsız değiģkenlerin herhangi bir doğrusal kombinasyonunun örneklem dağılımının da normal olmasıdır. Ayırma analizi bir dereceye kadar çok değiģkenli normallik varsayımını tolere edebilir. Özellikle dağılımda biraz çarpıklığın olması durumunda ayırma analizi doğru sonuçlar verebilir. Fakat dağılımda aģırı değerlerin olması durumunda ayırma analizi sonuçları daha yanıltıcı olabilir. Özellikle örneklem büyüklüğünün küçük olduğu ve gruplardaki veri sayılarının aynı olmadığı durumda çok değiģkenli normalliğin sağlanması için bazı dönüģümler yapmak gerekebilir Varyans-kovaryans matrislerinin homojenliği Özellikle grupların örneklem büyüklüğünün yetersiz ve dengesiz olduğu durumlarda sınıflama iģlemi yanlıģ sonuçlar verir. Varyans-kovaryans matrislerinin homojenliğini test etmek için Box s M testinden faydalanılır. Fakat bu testin de çok duyarlı bir test olduğu unutulmamalıdır. Box s M testinin anlamlı çıktığı durumlarda yeterli örneklem büyüklüğü varsa, varyanskovaryans matrislerinin log determinantları incelenebilir. Eğer log determinantlar benzer ise Box s M testi göz ardı edilerek iģlemlere devam edilebilir. Varyans-kovaryans matrislerinin homojenliğini sağlamak için dönüģümlerden yararlanılabilir. Böyle bir durumda karesel ayırma fonksiyonundan ya da nonparametrik sınıflama yönteminden de faydalanılabilir. Dolayısıyla istatistiksel çıkarımın temel amaç olduğu bir durumda, varyanskovaryans matrisleri homojen değilse ve örneklem büyüklükleri eģit ve yeterli değilse, değiģken dönüģümlerinden faydalanmak gereklidir. Eğer temel amaç sınıflama ve yaygınlıklar farklı ise ya farklı varyans-kovaryans matrislerini kullanmak veya

30 21 örneklem büyüklüğü yeterli ve normal dağılım olduğunda karesel ayırma fonksiyonunu kullanmak ya da örneklem büyüklüğü yetersiz ve normal dağılım olmadığında nonparametrik sınıflama yönteminden faydalanmak gereklidir Çoklu bağlantı sorununun olmaması Bağımsız değiģkenlerden biri diğerleri ile yüksek derecede iliģkili ya da diğerlerinin bir fonksiyonu ise çoklu bağlantı sorunu ortaya çıkar. Bu durumda ayırma fonksiyonu katsayıları bağımsız değiģkenin göreli önemini güvenilir bir Ģekilde belirleyemez. Çoklu bağlantı giderme yöntemleri kullanılarak bu sorunlar giderilmelidir Bağımsız değiģkenler arası iliģkilerin doğrusal olması Ayırma analizi her grup içinde bütün bağımsız değiģken çiftleri arasında doğrusal iliģki olmasını varsayar. Bu varsayımın bozulması analizin gücünü azaltır. Bu sorun bazı değiģkenlere dönüģüm uygulayarak giderilebileceği gibi bu değiģkenleri analizden çıkartmak bazen daha iyi bir yaklaģım olarak kabul edilmektedir Aykırı değerler Ayırma analizi aykırı değerlere çok duyarlıdır. Aykırı değerler olması durumunda sınıflama çok etkilenir. O yüzden ayırma analizi öncesinde tek değiģkenli ve çok değiģkenli aykırı değerler bulunmalı bunlar ya dönüģüm yoluyla yok edilmeli ya da analizden çıkarılmalıdır Ayırma analizindeki temel eģitlikler Ayırma fonksiyonları elde edilmeden önce, bağımsız değiģkenlerin oluģturacağı kombinasyonların grupları belirlemede ne kadar baģarılı olduğu araģtırılmalıdır. Bu amaçla MANOVA daki gibi çeģitli kareler toplamlarından yararlanılarak Wilk s Lambda istatistiğine ulaģılır. Test iģlemi ya Wilk s Lambda istatistiğini F dağılımına dönüģtürerek ya da Ki kare dağılımı yaklaģımı ile yapılır. Eğer değiģkenlerin grupları belirlemede kullanılamayacağı anlaģılırsa çalıģma sonlandırılır. Bağımsız değiģkenlerdeki varyans, gruplar arası farklılığa iliģkin varyans ve grup içi farklılığa iliģkin varyans olacak Ģekilde ikiye bölünür T B W (3.1) Burada T: genel kareler toplamı matrisi B: gruplar arası kareler toplamı matrisi W: grup içi kareler toplamı matrisidir. B ve W matrisleri

31 22 B ve k i 1 ni ( xi x)( xi x) (3.2) k W ( n i 1) S i 1 i Ģeklindedir.Bu bilgiler yardımıyla Wilk s Lambda λ istatistiği W W B (3.3) (3.4) bulunur. Wilk s Lambda nın sıfıra yaklaģması gruplar arasında bir fark olduğunun göstergesidir. Anlamlılığı F ya da ki kare dağılımı ile test edilir ve sonuçta bağımsız değiģkenlerin grupları belirleyip belirleyemeyeceği bulunur. Ayırma analizi tüm değiģkenlerin hepsini birden analize katarak yapılabileceği gibi, değiģken sayısını her adımda farklı alarak da yapılabilir. Bu Ģekilde hangi değiģkenin modele anlamlı katkıda bulunduğu anlaģılmıģ olur. Ġstatistiksel yazılımlarda Wilk s lambda istatistikleri yer almaktadır. Hangi değiģkenin modele dahil edileceğini bulmak için farklı yaklaģımlar da vardır. Bunlar açıklanmamıģ varyans, Mahalanobis uzaklığı, en küçük F değeri ve Rho nun V değeri yaklaģımıdır. Adımsal yöntemler kullanıldığında Mahalanobis uzaklığı ve Rho nun V değeri yaklaģımının en iyi yaklaģım olduğu bazı yazarlar tarafından belirtilmektedir (Alpar,2011). Ayırma analizi kanonik korelasyon analizinin özel bir durumu gibi düģünülebilir. Ayırma analizinde kanonik korelasyon, ayırma skorları yardımıyla gruplar arasındaki iliģkinin büyüklüğünü ölçer. Bu nedenle her bir ayırma fonksiyonu için bir kanonik korelasyon hesaplanır. Bağımsız değiģkenlerin sınıflandırmadaki göreli önemini veren standartlaģtırılmıģ kanonik ayırma fonksiyon katsayıları, standartlaģtırılmamıģ kanonik ayırma fonksiyon katsayıları ile elde edilir. Bu katsayılar doğrusal regresyondaki beta katsayıları gibi yorumlanır. StandartlaĢtırılmamıĢ kanonik ayırma fonsiyonları D c... i Ģeklindedir. i0 ui 1x1 ui2x2 uip xp (3.5)

32 23 Kanonik ayırma fonksiyon sayısı eğer bağımsız değiģken sayısı bağımlı değiģkendeki grup sayısından fazla ise değiģken sayısı kadar, eğer fazla değilse bağımlı değiģkendeki grup sayısından bir eksiktir. Kanonik fonksiyonlardan birincisi uygun değiģkenler seçilerek, gruplar arasında en iyi ayrımı yapacak Ģekilde oluģturulur. Daha sonraki kanonik fonksiyon ise ilk kanonik fonksiyona göre daha düģük seviyede ayırım yapacak Ģekilde oluģturulur. Ve diğer fonksiyonlar bu Ģekilde gider. Ayırma fonksiyonları birbirinden bağımsız ya da birbirine diktir. Böylece fonksiyonların ayırma katkıları çakıģmaz. Ġlk fonksiyon değiģkenliğin en büyük miktarını açıklarken, diğer fonksiyonlar sırasıyla bir önceki fonksiyon tarafından açıklanmayan değiģimin en büyük miktarını açıklar. StandartlaĢtırılmamıĢ ayırma fonksiyonu sınıflandırma yapmak amacı ile kullanılır. Fisher ayırma fonksiyonu olarak da adlandırılan fonksiyon C c... j j0 c j1x1 c jp x p (3.6) Ģeklindedir. Fisher ayırma fonksiyonları grup ortalamaları arasındaki farkın en büyüklenmesi temeline dayanır. Bağımlı değiģkendeki grup sayısı kadar ayırma fonksiyonu üretilir. Ayırma analizinde en küçük kareler yöntemi kullanılarak grup içi kareler toplamını en küçük yapan katsayıların kestiricileri elde edilir. Elde edilen parametre kestirimleri yardımıyla hesaplanan ayırma fonksiyonu skorları bağımlı, ayırma değiģkenleri de bağımsız değiģken olarak alınıp doğrusal regresyon analizi uygulandığında elde edilen regresyon katsayıları, standartlaģtırılmamıģ ayırma fonksiyonu katsayılarına eģit çıkar (Alpar,2011) Örnek uygulama Ayırma analizi uygulaması için R versiyon programı ile gelen Hindistanlı Pima Kadınlarında yapılmıģ bir araģtırmaya ait veriler kullanılmıģtır. Pima.te adlı veri seti MASS kütüphanesi içindedir. Bu veri setinde 8 adet değiģken vardır. Bağımlı değiģken hastanın WHO kriterine göre Ģeker hastası olup olmadığını gösteren type adlı değiģkendir.

33 24 Tablo 3.1. Ayırma analizinde kullanılacak değiģkenler ve açıklamaları DeğiĢken Ġsmi npreg glu bp skin bmi ped age type Açıklaması Doğum sayısı Glukoz konsantrasyonu Diyastolik kan basıncı Trisep kalınlığı Beden kitle endeksi Diyabet pedigree fonksiyonu YaĢ Diyabet olup olmaması type değiģkeni hariç tüm değiģkenler süreklidir. type değiģkeni kategoriktir. Veri setinde 332 kadına ait veriler vardır ve eksik veri bulunmamaktadır. type değiģkeni veri setinde Yes, No olarak kodlandığı için yeni bir dikotom diyabet değiģkeni 0, 1 olarak üretilmiģ ve bağımlı değiģken olarak bu yeni değiģken kullanılmıģtır. Diğer tüm değiģkenler bağımsız değiģkenler olarak modele alınmıģtır. SPSS programının 21. versiyonunda ayırma analizi Analyze menüsü altındaki Classify->Discriminant seçeneğindedir. Grouping variable kısmına dikotom diyabet değiģkeni atılmıģ, Define Range kısmında Minimum:0 ve Maximum:1 olarak girilmiģtir. Independents kısmına diğer tüm bağımlı değiģkenler atanmıģtır. Statistics kısmında Fisher s ve Unstandardized iģaretlenmiģ, Classify kısmında Summary Table seçilmiģtir. Ayırma analizi varsayımlarından çok değiģkenli normallik varsayımı, R programı ile test edilmiģtir. R programında mvnormtest paketindeki mshapiro.test komutu ile tüm değiģkenlerin çok değiģkenli normalliği test edilmiģ ve çok değiģkenli normal olmadığı bulunmuģtur (p<0.001). Aynı değiģkenler energy paketi içerisindeki etest fonksiyonu ile de test edilmiģ ve yine çok değiģkenli normallik Ģartının sağlanmadığı görülmüģtür. Çok değiģkenli normallik Ģartı sağlanmamasına rağmen analize devam edilmiģtir. Varyans-kovaryans matrislerinin homojenliği Box s M testi ile SPSS programında test edilmiģ ve çok anlamlı bir p<0.001 bulunduğu için homojenliğin sağlanmadığı görülmüģtür. Classify kısmında Use Covariance Matrix seçeneğinde Separate-groups iģaretlenerek yeniden analiz yapılmıģtır. SPSS programında karesel diskriminant analizi yapılamamaktadır. Fakat SPSS programına ait teknik destek

34 25 sayfalarında 2 varyansların homojen olmadığı durumlarda Seperate-groups seçeneğinin iģaretlenerek analize devam edilmesi tavsiye edilmektedir. Bağımsız değiģkenler arasındaki çoklu bağlantı sorunu incelendiğinde bmi ve skin değiģkenleri arasında anlamlı ve yüksek seviyeli r=0.659 Pearson korelasyonu ve yine age ve npreg değiģkenleri arasında anlamlı ve yüksek seviyeli r=0.676 Pearson korelasyonu bulunduğu için skin ve npreg değiģkenleri analizden çıkarılarak analize devam edilmiģtir. Bağımlı değiģken iki seviyeli olduğu için bir adet ayırma fonksiyonu elde edilmiģtir. Çıkan sonuçlara göre grup kovaryans matrislerinin log determinantları sırasıyla, diyabet olmayan grup için ve diyabet grup için bulunmuģtur. Wilk s lambda istatistiği λ=0.657 bulunmuģ ve p<0.001 olduğu için değiģkenlerin grupları istatistiksel anlamlı olarak ayırabileceği anlaģılmıģtır. λ 1 =0.521 olarak bir adet özdeğer bulunmuģ ve varyansın tamamını açıklamaktadır. Kanonik korelasyon katsayısı olarak bulunmuģtur. D StandartlaĢtırılmamıĢ kanonik ayırma fonksiyonu aģağıdaki gibidir: * glu * bp * bmi 0.613* ped StandartlaĢtırılmıĢ kanonik ayırma fonksiyonu ise: D 0.735* glu 0.070* bp 0.385* bmi 0.216* ped 0.349* age s * age Ģeklindedir. Bu fonksiyondan anlaģılacağı gibi ayırma skoruna en büyük katkıyı glu değiģkeni yapmaktadır. Bağımlı değiģken iki seviyeli olduğu için iki adet Fisher ayırma fonksiyonu elde edilmiģtir. Bu fonksiyonlar sırasıyla C 1 C Ģeklindedir * glu 0.158* glu 0.303* bp * bp 0.438* bmi 0.523* bmi 1.983* ped 2.923* ped * age * age Yapılan ayırma analizi ile 223 tane diyabeti olmayan kadından 184 tanesinin diyabeti yok, 39 tanesi ise diyabeti var olarak model tarafından tahmin edilmiģtir.109 tane diyabetli hastanın ise 26 tanesi diyabeti yok ve 83 tanesi diyabeti var Ģeklinde tahmin edilmiģtir. Bu durumda ayırma analizi ile %80.4 oranında doğru sınıflandırma yapılmıģtır. 2 Ziyaret tarihi:

35 Lojistik Regresyon Lojistik regresyonun amacı bağımlı değiģken ve bağımsız değiģkenler arasında en az değiģken kullanan, en çok uyan ve teoriyle uyumlu modeli bulmaktır. Bağımlı değiģkenin ikili (dikotom) veya daha fazla kategorili kategorik bir değiģken olduğu durumda, bu değiģkeni baģka değiģkenleri kullanarak tahmin etmeye çalıģtığımızda lojistik regresyon kullanabiliriz. Lineer regresyondan farkı, bağımlı değiģkenin lineer regresyonda sürekli, lojistik regresyonda ise kategorik olmasıdır. Sonuç değiģkeni istenmeyen bir durumun (hastalık,ölüm gibi) ortaya çıkıp çıkmayacağını belirleyen bir değiģken ise, lojistik regresyon kullanarak bağımsız değiģkenlerin risk faktörü olup olmadığı anlaģılır. Lojistik regresyon sonuçlarında her bir faktörün (bağımsız değiģkenin) risk faktörü olarak istatistiksel anlamlılığı yanında, odds oranını da hesaplamayı sağlar. Her hangi bir regresyon probleminde en önemli büyüklük, bağımsız değiģkenin değeri verildiğinde bağımlı değiģkenin aldığı ortalama değerdir. Bu büyüklüğe Ģartlı ortalama denir ve E ( Y x) olarak gösterilir. Burada Y bağımlı değiģkeni, x ise bağımsız değiģkeni gösterir. Doğrusal regresyonda bu değerin x in bir doğrusal ifadesi olduğu ( ) E( Y x) x (3.7) x 0 1 kabul edilir. Buradan x in ve arasında değerleri için E ( Y x) değerinin her hangi bir değeri alabileceği anlaģılır. Dikotom bir sonuç değiģkeninin analizi için değiģik dağılım fonksiyonları tavsiye edilmiģtir. Lojistik regresyonun seçilmesinde iki temel sebep vardır 1- Matematiksel bir bakıģ açısından oldukça kullanıģlı ve kolay kullanılabilir olması 2- Biyolojik olarak anlamlı yorumlanabilmesi. Lojistik regresyon modeli exp( 0 1x) 1 ( x ) (3.8) 1 exp( x) 1 exp( x) Ģeklinde gösterilebilir. Lojit dönüģümü ise ( x) ( x) ln( ) 0 x (3.9) 1 ( x) g 1 Ģeklindedir.

36 27 Bu dönüģümün önemi ise g(x) in doğrusal regresyonda istenen bir çok özelliğe sahip olmasıdır. Lojit fonksiyonu g(x) doğrusaldır ve sürekli olabilir ve x in değerlerine bağlı olarak ve arasında değerler alabilir. Lojistik regresyonun doğrusal regresyondan ikinci önemli farkı ise sonuç değiģkeninin Ģartlı dağılımındadır. Doğrusal regresyon modelinde sonuç değiģkeni y E( Y x) Ģeklinde gösterilebilir. Buradaki ε gözlemin Ģartlı ortalamadan sapmasını gösteren hatadır. Doğrusal regresyondaki en yaygın varsayım ε nun ortalaması 0, varyansı bir sayı olan normal dağılıma sahip olduğudur. Buradan sonuç değiģkeninin Ģartlı dağılımının ortalaması E ( Y x) ve varyansı sabit olan bir normal dağılım olduğu çıkar. Sonuç değiģkeni dikotom olduğunda durum bu Ģekilde değildir. Lojistik regresyonda x değiģkeni verildiğinde y değiģkeni y (x) Ģeklinde belirtilir. Bu durumda ε iki farklı değer alabilir. y=1 olduğunda (x) olasılıkla 1 ( x ) ve y=0 olduğunda 1 ( x) olasılıkla (x) değerlerini alır. Böylece ε nun ortalaması 0 ve varyansı ( x )1 ( x) olan bir dağılımı olduğu anlaģılır. Yani sonuç değiģkeninin Ģartlı dağılımı bir (x) olasılıklı bir binomial dağılımdır Lojistik regresyon modelini uydurma Uygun lojistik regresyon modelini bulmak için yukarıda bahsedilen β katsayılarını kestirmek gereklidir. Doğrusal regresyonda katsayıları kestirmek için kullanılan yöntem en küçük kareler yöntemidir. Bu metodda gözlenen ve tahmin edilen Y değerleri arasındaki karesel farkların toplamını minimize eden β katsayıları seçilir. Dikotom bir sonuç değiģkeni olduğunda bu yöntemle yapılacak katsayı kestirimleri istatistiksel olarak uygun özelliklere sahip olmayan katsayıların üretilmesine yol açacaktır. O yüzden lojistik regresyonda farklı bir yöntem olan en çok olabilirlik yöntemi ile katsayılar kestirilir. Genel bir ifadeyle, en çok olabilirlik yöntemi β katsayılarını gözlenen değerleri en büyük ihtimalle elde edecek Ģekilde hesaplar. Bu metodu uygulamak için önce olabilirlik fonksiyonu oluģturulur. Bu fonksiyon gözlenen değerlerin olasılıklarını bilinmeyen katsayıların bir fonksiyonu olarak verir. En çok olabilirlik yöntemi ile kestirilen katsayı değerleri ise bu fonksiyonu maksimize eden değerlerdir. Katsayıların kestirimi yapıldıktan sonra, değiģkenlerin anlamlılıklarına bakmak gerekir. Bu da modeldeki bağımsız değiģkenlerin bağımlı değiģkenle anlamlı iliģkileri olup olmadığına bakmak için kurulacak bir hipotez testi ile mümkündür. Buradaki hipotez testi yaklaģımlarından bir tanesi Ģu Ģekildedir: Bu değiģkeni içeren model

TANI TESTLERINE GIRIŞ & ROC ANALİZİ

TANI TESTLERINE GIRIŞ & ROC ANALİZİ TANI TESTLERINE GIRIŞ & ROC ANALİZİ Yrd.Doç.Dr. Selçuk Korkmaz Trakya Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Turcosa Analitik Çözümlemeler selcukorkmaz@gmail.com ÇOCUK NEFROLOJİ DERNEĞİ

Detaylı

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız. .4. Merkezi Eğilim ve Dağılım Ölçüleri Merkezi eğilim ölçüleri kitleye ilişkin bir değişkenin bütün farklı değerlerinin çevresinde toplandığı merkezi bir değeri gösterirler. Dağılım ölçüleri ise değişkenin

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık KORELASYON ve REGRESYON ANALİZİ Doç. Dr. İrfan KAYMAZ Tanım Bir değişkenin değerinin diğer değişkendeki veya değişkenlerdeki değişimlere bağlı olarak nasıl etkilendiğinin istatistiksel

Detaylı

ÖLÇME VE DEĞERLENDĠRME (3)

ÖLÇME VE DEĞERLENDĠRME (3) ÖLÇME VE DEĞERLENDĠRME (3) ÖLÇME SONUÇLARI ÜZERĠNDE ĠSTATĠSTĠKSEL ĠġLEMLER VERĠLERĠN DÜZENLENMESĠ -Herhangi bir test uygulamasından önce verilerin düzenlenmesi için önce bütün puanların büyüklüklerine

Detaylı

Hastalıklarda Risk Faktörleri ve Tarama Tanı ve Tedavi Etkinliği İstatistikleri. A.Ayça ÖZDEMİR

Hastalıklarda Risk Faktörleri ve Tarama Tanı ve Tedavi Etkinliği İstatistikleri. A.Ayça ÖZDEMİR Hastalıklarda Risk Faktörleri ve Tarama Tanı ve Tedavi Etkinliği İstatistikleri A.Ayça ÖZDEMİR İçerik Hastalıklarda Risk Faktörleri Geriye Dönük Case Control Odds Ratio İleriye Dönük Kohort Çalışmalarda

Detaylı

MAK 210 SAYISAL ANALİZ

MAK 210 SAYISAL ANALİZ MAK 210 SAYISAL ANALİZ BÖLÜM 6- İSTATİSTİK VE REGRESYON ANALİZİ Doç. Dr. Ali Rıza YILDIZ 1 İSTATİSTİK VE REGRESYON ANALİZİ Bütün noktalardan geçen bir denklem bulmak yerine noktaları temsil eden, yani

Detaylı

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı REGRESYON ANALİZİ VE UYGULAMA Yrd. Doç. Dr. Hidayet Takcı htakci@cumhuriyet.edu.tr Sunum içeriği Bu sunumda; Lojistik regresyon konu anlatımı Basit doğrusal regresyon problem çözümleme Excel yardımıyla

Detaylı

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 ) 4. SUNUM 1 Gözlem ya da deneme sonucu elde edilmiş sonuçların, rastlantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel yöntemlere HİPOTEZ TESTLERİ denir. Sonuçların rastlantıya bağlı

Detaylı

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir. ÇIKARSAMALI İSTATİSTİKLER Çıkarsamalı istatistikler, örneklemden elde edilen değerler üzerinde kitleyi tanımlamak için uygulanan istatistiksel yöntemlerdir. Çıkarsamalı istatistikler; Tahmin Hipotez Testleri

Detaylı

TANI TESTLERİNİN İSTATİSTİKSEL DEĞERLENDİRİLMESİ

TANI TESTLERİNİN İSTATİSTİKSEL DEĞERLENDİRİLMESİ TANI TESTLERİNİN İSTATİSTİKSEL DEĞERLENDİRİLMESİ İÇERİK Tanı testi Altın Standart Test Tanı Testi ile Altın Standart Testin Karşılaştırması İstatistiksel Değerlendirme Duyarlık, Seçicilik,Yanlış Negatif

Detaylı

Tanı Testlerinin Değerlendirilmesi. ROC Analizi. Prof.Dr. Rian DİŞÇİ

Tanı Testlerinin Değerlendirilmesi. ROC Analizi. Prof.Dr. Rian DİŞÇİ Tanı Testlerinin Değerlendirilmesi ROC Analizi Prof.Dr. Rian DİŞÇİ İstanbul Üniversitesi, Onkoloji Enstitüsü Kanser Epidemiyolojisi Ve Biyoistatistik Bilim Dalı Tanı Testleri Klinik çalışmalarda, özellikle

Detaylı

GÜVEN ARALIKLARI ve İSTATİSTİKSEL ANLAMLILIK. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

GÜVEN ARALIKLARI ve İSTATİSTİKSEL ANLAMLILIK. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı GÜVEN ARALIKLARI ve İSTATİSTİKSEL ANLAMLILIK Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Kestirim Pratikte kitle parametrelerinin doğrudan hesaplamak olanaklı değildir. Bunun yerine

Detaylı

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN KORELASYON VE REGRESYON ANALİZİ Doç. Dr. Bahar TAŞDELEN Günlük hayattan birkaç örnek Gelişim dönemindeki bir çocuğun boyu ile kilosu arasındaki ilişki Bir ailenin tükettiği günlük ekmek sayısı ile ailenin

Detaylı

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ 1 BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel

Detaylı

TANIMLAYICI İSTATİSTİKLER

TANIMLAYICI İSTATİSTİKLER TANIMLAYICI İSTATİSTİKLER Tanımlayıcı İstatistikler ve Grafikle Gösterim Grafik ve bir ölçüde tablolar değişkenlerin görsel bir özetini verirler. İdeal olarak burada değişkenlerin merkezi (ortalama) değerlerinin

Detaylı

2. BASİT DOĞRUSAL REGRESYON 12

2. BASİT DOĞRUSAL REGRESYON 12 1. GİRİŞ 1 1.1 Regresyon ve Model Kurma / 1 1.2 Veri Toplama / 5 1.3 Regresyonun Kullanım Alanları / 9 1.4 Bilgisayarın Rolü / 10 2. BASİT DOĞRUSAL REGRESYON 12 2.1 Basit Doğrusal Regresyon Modeli / 12

Detaylı

Değişken Türleri, Tanımlayıcı İstatistikler ve Normal Dağılım. Dr. Deniz Özel Erkan

Değişken Türleri, Tanımlayıcı İstatistikler ve Normal Dağılım. Dr. Deniz Özel Erkan Değişken Türleri, Tanımlayıcı İstatistikler ve Normal Dağılım Dr. Deniz Özel Erkan Evren Parametre Örneklem Çıkarım Veri İstatistik İstatistik Tanımlayıcı (Descriptive) Çıkarımsal (Inferential) Özetleme

Detaylı

doğrudur? Veya test, sağlıklı dediği zaman hangi olasılıkla doğrudur? Bu soruların yanıtları

doğrudur? Veya test, sağlıklı dediği zaman hangi olasılıkla doğrudur? Bu soruların yanıtları DÖNEM III HALK SAĞLIĞI-ADLİ TIP-BİYOİSTATİSTİK-TIP TARİHİ VE ETİK Ders Kurulu Başkanı : Prof. Dr. Günay SAKA TANI TESTLERİ (30.04.2014 Çrş. Y. ÇELİK) Duyarlılık (Sensitivity) ve Belirleyicilik (Specificity)

Detaylı

Bir Normal Dağılım Ortalaması İçin Testler

Bir Normal Dağılım Ortalaması İçin Testler Bir Normal Dağılım Ortalaması İçin Testler İÇERİK o Giriş ovaryansı Bilinen Bir Normal Dağılım Ortalaması İçin Hipotez Testler P-değerleri: II. Çeşit hata ve Örnekleme Büyüklüğü Seçimi Örnekleme Büyüklüğü

Detaylı

YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI. Sibel SELİM 1 Efe SARIBAY 2

YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI. Sibel SELİM 1 Efe SARIBAY 2 Dokuz Eylül Üniversitesi Sosyal Bilimler Enstitüsü Dergisi Cilt 5, Sayı:2, 2003 YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI Sibel SELİM 1 Efe SARIBAY

Detaylı

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI ÖNSÖZ İÇİNDEKİLER III Bölüm 1 İSTATİSTİK ve SAYISAL BİLGİ 11 1.1 İstatistik ve Önemi 12 1.2 İstatistikte Temel Kavramlar 14 1.3 İstatistiğin Amacı 15 1.4 Veri Türleri 15 1.5 Veri Ölçüm Düzeyleri 16 1.6

Detaylı

ROC (RECEIVER OPERATING CHARACTERISTIC) EĞRĠSĠ YÖNTEMĠ ĠLE TANI TESTLERĠNĠN PERFORMANSLARININ DEĞERLENDĠRĠLMESĠ

ROC (RECEIVER OPERATING CHARACTERISTIC) EĞRĠSĠ YÖNTEMĠ ĠLE TANI TESTLERĠNĠN PERFORMANSLARININ DEĞERLENDĠRĠLMESĠ ROC (RECEIVER OPERATING CHARACTERISTIC EĞRĠSĠ YÖNTEMĠ ĠLE TANI TESTLERĠNĠN PERFORMANSLARININ DEĞERLENDĠRĠLMESĠ Ayça Deniz Ertorsun, Burak Bağ, Güldeniz Uzar, Mehmet Ali Turanoğlu Danışman: Dr. A. Canan

Detaylı

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

rasgele değişkeninin olasılık yoğunluk fonksiyonu, 3.6. Bazı Sürekli Dağılımlar 3.6.1 Normal Dağılım Normal dağılım hem uygulamalı hem de teorik istatistikte kullanılan oldukça önemli bir dağılımdır. Normal dağılımın istatistikte önemli bir yerinin olmasının

Detaylı

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü Mühendislikte İstatistiksel Yöntemler Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü 1 Araştırma sonuçlarının açıklanmasında frekans tablosu

Detaylı

KANITA DAYALI LABORATUVAR TIBBI İLE İLİŞKİLİ HESAPLAMALAR. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

KANITA DAYALI LABORATUVAR TIBBI İLE İLİŞKİLİ HESAPLAMALAR. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005 KANITA DAYALI LABORATUVAR TIBBI İLE İLİŞKİLİ HESAPLAMALAR Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005 1 Kanıta dayalı tıp Kanıta dayalı tıp, hekimlerin günlük kararlarını, mevcut en iyi kanıtın ışığında,

Detaylı

BİYOİSTATİSTİK Sağlık Alanına Özel İstatistiksel Yöntemler Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK Sağlık Alanına Özel İstatistiksel Yöntemler Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK Sağlık Alanına Özel İstatistiksel Yöntemler Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr

Detaylı

(AYIRIM) DENLİ. Emre KUZUGÜDENL. Doç.Dr.Serdar CARUS

(AYIRIM) DENLİ. Emre KUZUGÜDENL. Doç.Dr.Serdar CARUS DİSKRİMİNANT ANALİZİ (AYIRIM) Emre KUZUGÜDENL DENLİ Doç.Dr.Serdar CARUS Bu analiz ile; Bir bireyin hangi gruptan geldiği (p değişkeni kullanarak, bireyi uygun bir gruba atar ) Her bir değişkenin atama

Detaylı

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN Tanımlayıcı İstatistikler Yrd. Doç. Dr. Emre ATILGAN 1 Tanımlayıcı İstatistikler Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri 2 3 Aritmetik Ortalama Aritmetik ortalama,

Detaylı

Korelasyon, Korelasyon Türleri ve Regresyon

Korelasyon, Korelasyon Türleri ve Regresyon Korelasyon, Korelasyon Türleri ve Regresyon İçerik Korelasyon Korelasyon Türleri Korelasyon Katsayısı Regresyon KORELASYON Korelasyon iki ya da daha fazla değişken arasındaki doğrusal ilişkiyi gösterir.

Detaylı

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ 1 İstatistik İstatistik, belirsizliğin veya eksik bilginin söz konusu olduğu durumlarda çıkarımlar yapmak ve karar vermek için sayısal verilerin

Detaylı

HANGİ TÜR ARAŞTIRMALARDA PATH ANALİZİ KULLANILMALIDIR? IX Ulusal Biyoistatistik Kongresi 5-9 Eylül 2006 Zonguldak

HANGİ TÜR ARAŞTIRMALARDA PATH ANALİZİ KULLANILMALIDIR? IX Ulusal Biyoistatistik Kongresi 5-9 Eylül 2006 Zonguldak HANGİ TÜR ARAŞTIRMALARDA PATH ANALİZİ KULLANILMALIDIR? * M.Mutlu DAŞDAĞ * M.Yusuf ÇELİK *Ömer SATICI *Zeki AKKUŞ *H. Coşkun ÇELİK IX Ulusal Biyoistatistik Kongresi 5-9 Eylül 2006 Zonguldak Zonguldak Karaelmas

Detaylı

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ DÖNEM I-I. DERS KURULU Konu: Bilimsel yöntem ve istatistik Amaç: Biyoistatistiğin tıptaki önemini kavrar ve sonraki dersler için gerekli terminolojiye hakim olur.

Detaylı

İÇİNDEKİLER ÖN SÖZ...

İÇİNDEKİLER ÖN SÖZ... İÇİNDEKİLER ÖN SÖZ... v GİRİŞ... 1 1. İSTATİSTİK İN TARİHÇESİ... 1 2. İSTATİSTİK NEDİR?... 3 3. SAYISAL BİLGİDEN ANLAM ÇIKARILMASI... 4 4. BELİRSİZLİĞİN ELE ALINMASI... 4 5. ÖRNEKLEME... 5 6. İLİŞKİLERİN

Detaylı

Matris Cebiriyle Çoklu Regresyon Modeli

Matris Cebiriyle Çoklu Regresyon Modeli Matris Cebiriyle Çoklu Regresyon Modeli Hüseyin Taştan Mart 00 Klasik Regresyon Modeli k açıklayıcı değişkenden oluşan regresyon modelini her gözlem i için aşağıdaki gibi yazabiliriz: y i β + β x i + β

Detaylı

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım 2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI 2.1. Tanım Regresyon analizi, bir değişkenin başka bir veya daha fazla değişkene olan bağımlılığını inceler. Amaç, bağımlı değişkenin kitle ortalamasını, açıklayıcı

Detaylı

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri Temel İstatistik Tanımlayıcı İstatistik Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri Y.Doç.Dr. İbrahim Turan Mart 2011 DAĞILIM / YAYGINLIK ÖLÇÜLERİ Verilerin değişkenlik durumu ve dağılışın şeklini

Detaylı

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır. AED 310 İSTATİSTİK YANLILIK Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır. YANLILIK Yanlı bir araştırma tasarımı uygulandığında,

Detaylı

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1 3. TAHMİN 3.1. En Küçük Kareler (EKK) Yöntemi 1 En Küçük Kareler (EKK) yöntemi, regresyon çözümlemesinde en yaygın olarak kullanılan, daha sonra ele alınacak bazı varsayımlar altında çok aranan istatistiki

Detaylı

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1 İÇİNDEKİLER ÖNSÖZ... v 1. BÖLÜM Örneklem Genişliğinin Elde edilmesi... 1 1.1. Kitle ve Parametre... 1 1.2. Örneklem ve Tahmin Edici... 2 1.3. Basit Rastgele Örnekleme... 3 1.4. Tabakalı Rastgele Örnekleme...

Detaylı

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı ARAŞTIRMA MODELLİLERİNDE KULLANILACAK İSTATİSTİKLERİ BELİRLEME ÖLÇÜTLERİ Parametrik mi Parametrik Olmayan mı? Kullanılacak İstatistikleri Belirleme Ölçütleri Değişken Sayısı Tek değişkenli (X) İki değişkenli

Detaylı

K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır.

K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır. İstatistiksel güven aralıkları uygulamalarında normallik (normal dağılıma uygunluk) oldukça önemlidir. Kullanılan parametrik istatistiksel tekniklerin geçerli olabilmesi için populasyon şans değişkeninin

Detaylı

Mühendislikte İstatistik Yöntemler

Mühendislikte İstatistik Yöntemler .0.0 Mühendislikte İstatistik Yöntemler İstatistik Parametreler Tarih Qma.3.98 4..98 0.3.983 45 7..984 37.3.985 48 0.4.986 67.4.987 5 0.3.988 45.5.989 34.3.990 59.4.99 3 4 34 5 37 6 45 7 45 8 48 9 5 0

Detaylı

altında ilerde ele alınacaktır.

altında ilerde ele alınacaktır. YTÜ-İktisat İstatistik II Nokta Tahmin Yöntemleri 1 NOKTA TAHMİN YÖNTEMLERİ Şimdiye kadar verilmiş tahmin edicilerin sonlu örneklem ve asimptotik özelliklerini inceledik. Acaba bilinmeyen anakütle parametrelerini

Detaylı

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma... İçindekiler İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii BÖLÜM 1 Ölçme, İstatistik ve Araştırma...1 Ölçme Nedir?... 3 Ölçme Süreci... 3 Değişkenler

Detaylı

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ 1 BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel sayma

Detaylı

BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr 1 Bir değişkenin değerinin,

Detaylı

Student t Testi. Doç. Dr. Ertuğrul ÇOLAK. Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Student t Testi. Doç. Dr. Ertuğrul ÇOLAK. Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Student t Testi Doç. Dr. Ertuğrul ÇOLAK Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Konu Başlıkları Tek örnek t testi SPSS de tek örnek t testi uygulaması Bağımsız iki örnek

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Sınıflandırıcıların Değerlendirilmesi Skorlar Karışıklık matrisi Accuracy Precision Recall

Detaylı

BĠLGĠ KURAMI YAKLAġIMI ĠLE BĠLGĠSAYARLI TOMOGRAFĠK KORONER ANJĠYOGRAFĠNĠN TANISAL DEĞERĠNĠN DEĞERLENDĠRĠLMESĠ

BĠLGĠ KURAMI YAKLAġIMI ĠLE BĠLGĠSAYARLI TOMOGRAFĠK KORONER ANJĠYOGRAFĠNĠN TANISAL DEĞERĠNĠN DEĞERLENDĠRĠLMESĠ T.C. HACETTEPE ÜNĠVERSĠTESĠ SAĞLIK BĠLĠMLERĠ ENSTĠTÜSÜ BĠLGĠ KURAMI YAKLAġIMI ĠLE BĠLGĠSAYARLI TOMOGRAFĠK KORONER ANJĠYOGRAFĠNĠN TANISAL DEĞERĠNĠN DEĞERLENDĠRĠLMESĠ Mustafa KILIÇKAP Biyoistatistik Programı

Detaylı

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37 İÇİNDEKİLER BÖLÜM 1 Değişkenler ve Grafikler 1 İstatistik 1 Yığın ve Örnek; Tümevarımcı ve Betimleyici İstatistik 1 Değişkenler: Kesikli ve Sürekli 1 Verilerin Yuvarlanması Bilimsel Gösterim Anlamlı Rakamlar

Detaylı

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Yrd. Doç. Dr. Emre ATILGAN 1 RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Olasılığa ilişkin olayların çoğunluğunda, deneme sonuçlarının bir veya birkaç yönden incelenmesi

Detaylı

LOJİSTİK REGRESYON ANALİZİ

LOJİSTİK REGRESYON ANALİZİ LOJİSTİK REGRESYON ANALİZİ Lojistik Regresyon Analizini daha kolay izleyebilmek için bazı terimleri tanımlayalım: 1. Değişken (incelenen özellik): Bireyden bireye farklı değerler alabilen özellik, fenomen

Detaylı

A t a b e y M e s l e k Y ü k s e k O k u l u İstatistik Sunum 4 Öğr.Gör. Şükrü L/O/G/O KAYA www.sukrukaya.org www.themegallery.com 1 Yer Ölçüleri Yer ölçüleri, verilerin merkezini veya yığılma noktasını

Detaylı

KısıtlandırılmamıĢ Kısmi Oransal Odds Modelinin Doğru Sınıflandırma Performansı Üzerine Bir ÇalıĢma

KısıtlandırılmamıĢ Kısmi Oransal Odds Modelinin Doğru Sınıflandırma Performansı Üzerine Bir ÇalıĢma Gazi Mühendislik Bilimleri Dergisi 2017, 3(3): 14-26 gmbd.gazipublishing.com KısıtlandırılmamıĢ Kısmi Oransal Odds Modelinin Doğru Sınıflandırma Performansı Üzerine Bir ÇalıĢma Hatice DAĞLIOĞLU *,a, Semra

Detaylı

Doç. Dr. Mustafa ÖZDEN Arş. Gör. Gülden AKDAĞ Arş. Gör. Esra AÇIKGÜL

Doç. Dr. Mustafa ÖZDEN Arş. Gör. Gülden AKDAĞ Arş. Gör. Esra AÇIKGÜL Doç. Dr. Mustafa ÖZDEN Arş. Gör. Gülden AKDAĞ Arş. Gör. Esra AÇIKGÜL 11.07.2011 Adıyaman Üniversitesi Eğitim Fakültesi İlköğretim Bölümü Fen Bilgisi Öğretmenliği A.B.D GĠRĠġ Fen bilimleri derslerinde anlamlı

Detaylı

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005 KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005 1 Karşılaştırma istatistiği Temel kavramlar: Örneklem ve evren:

Detaylı

Regresyon. Regresyon korelasyon ile yakından ilişkilidir

Regresyon. Regresyon korelasyon ile yakından ilişkilidir Regresyon Regresyona Giriş Regresyon korelasyon ile yakından ilişkilidir Regresyon bir bağımlı değişken ile (DV) bir veya daha fazla bağımsız değişken arasındaki doğrusal ilişkiyi inceler. DV için başka

Detaylı

LABORATUVARDA TANISAL YETERLİLİK

LABORATUVARDA TANISAL YETERLİLİK LABORATUVARDA TANISAL YETERLİLİK Dr. MEHMET H. KÖSEOĞLU İZMİR ATATÜRK EĞİTİM VE ARAŞTIRMA HASTANESİ Laboratuvar tanı testlerinin hastalık tanısı koymada önemli bir yeri vardır. Laboratuvar testleri tıbbi

Detaylı

ĠKĠ ÖRNEKLEM TESTLERĠ

ĠKĠ ÖRNEKLEM TESTLERĠ ĠKĠ ÖRNEKLEM TESTLERĠ BAĞIMSIZ GRUPLARDA İKİ ÖRNEKLEM TESTLERİ 1. ĠKĠ ORTALAMA ARASINDAKĠ FARKIN ÖNEMLĠLĠK TESTĠ. MANN-WHITNEY U TESTĠ 3. ĠKĠ YÜZDE ARASINDAKĠ FARKIN ÖNEMLĠLĠK TESTĠ 4. x KĠ-KARE TESTLERĠ

Detaylı

BÖLÜM 13 HİPOTEZ TESTİ

BÖLÜM 13 HİPOTEZ TESTİ 1 BÖLÜM 13 HİPOTEZ TESTİ Bilimsel yöntem aşamalarıyla tanımlanmış sistematik bir bilgi üretme biçimidir. Bilimsel yöntemin aşamaları aşağıdaki gibi sıralanabilmektedir (Karasar, 2012): 1. Bir problemin

Detaylı

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş Hipotez Testlerine Giriş Hipotez Testlerine Giriş Hipotez Testlerine Giriş Gözlem ya da deneme sonucu elde edilmiş sonuçların, raslantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel

Detaylı

İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t Test) Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı İki Ortalama Arasındaki Farkın Önemlilik Testi (Student s t test) Ölçümle

Detaylı

Verilerin Özetlenmesinde Kullanılan Sayısal Yöntemler

Verilerin Özetlenmesinde Kullanılan Sayısal Yöntemler Verilerin Özetlenmesinde Kullanılan Sayısal Yöntemler Merkezi Eğilim Ölçüleri Merkezi eğilim ölçüsü, bir veri setindeki merkezi, yada tipik, tek bir değeri ifade eder. Nicel veriler için, reel sayı çizgisindeki

Detaylı

TEZSİZ YÜKSEK LİSANS PROJE ONAY FORMU. Eğitim Bilimleri Anabilim Dalı Eğitim Yönetimi, Denetimi, Planlaması ve Ekonomisi

TEZSİZ YÜKSEK LİSANS PROJE ONAY FORMU. Eğitim Bilimleri Anabilim Dalı Eğitim Yönetimi, Denetimi, Planlaması ve Ekonomisi TEZSİZ YÜKSEK LİSANS PROJE ONAY FORMU Eğitim Bilimleri Anabilim Dalı Eğitim Yönetimi, Denetimi, Planlaması ve Ekonomisi Bilim Dalı öğrencisi Ahmet ÖZKAN tarafından hazırlanan Ġlkokul ve Ortaokul Yöneticilerinin

Detaylı

Kategorik Veri Analizi

Kategorik Veri Analizi Kategorik Veri Analizi 6.Sunum Yrd. Doç. Dr. Sedat ŞEN 1 ANALİZ TÜRLERİ Bağımlı Değ. Bağımsız Değ. Analiz Sürekli İki kategorili t-testi, Wilcoxon testi Sürekli Kategorik ANOVA, linear regresyon Sürekli

Detaylı

İÇİNDEKİLER 1. GİRİŞ...

İÇİNDEKİLER 1. GİRİŞ... İÇİNDEKİLER 1. GİRİŞ... 1 1.1. Regresyon Analizi... 1 1.2. Uygulama Alanları ve Veri Setleri... 2 1.3. Regresyon Analizinde Adımlar... 3 1.3.1. Problemin İfadesi... 3 1.3.2. Konu ile İlgili Potansiyel

Detaylı

SPSS UYGULAMALARI-II Dr. Seher Yalçın 1

SPSS UYGULAMALARI-II Dr. Seher Yalçın 1 SPSS UYGULAMALARI-II 27.12.2016 Dr. Seher Yalçın 1 Normal Dağılım Varsayımının İncelenmesi Çarpıklık ve Basıklık Katsayısının İncelenmesi Analyze Descriptive Statistics Descriptives tıklanır. Açılan pencerede,

Detaylı

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı KORELASYON VE REGRESYON ANALİZİ Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı İki ya da daha çok değişken arasında ilişki olup olmadığını, ilişki varsa yönünü ve gücünü inceleyen korelasyon

Detaylı

Korelasyon ve Regresyon

Korelasyon ve Regresyon Korelasyon ve Regresyon Korelasyon- (lineer korelasyon) Açıklayıcı (Bağımsız) Değişken x çalışma zamanı ayakkabı numarası İki değişken arasındaki ilişkidir. Günlük sigara sayısı SAT puanı boy Yanıt (Bağımlı)

Detaylı

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir sınıflandırma: temel kavramlar, karar ağaçları ve model değerlendirme Sınıflandırma : Tanım Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir Eğitim setindeki her kayıt

Detaylı

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir. BÖLÜM 1: FREKANS DAĞILIMLARI 1.1. Giriş İstatistik, rasgelelik içeren olaylar, süreçler, sistemler hakkında modeller kurmada, gözlemlere dayanarak bu modellerin geçerliliğini sınamada ve bu modellerden

Detaylı

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir. 4.SUNUM Genel olarak test istatistikleri Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri olmak üzere 2 grupta incelenebilir. 2 Ranj Çeyrek Kayma Çeyrekler Arası Açıklık Standart Sapma Varyans

Detaylı

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir Bilimsel Araştırma Yöntemleri Prof. Dr. Şener Büyüköztürk Doç. Dr. Ebru Kılıç Çakmak Yrd. Doç. Dr. Özcan Erkan Akgün Doç. Dr. Şirin Karadeniz Dr. Funda Demirel Örnekleme Yöntemleri Evren Evren, araştırma

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık Ders 8: Prof. Dr. İrfan KAYMAZ Tanım Tahmin (kestirim veya öngörü): Mevcut bilgi ve deneylere dayanarak olayın bütünü hakkında bir yargıya varmaktır. Bu anlamda, anakütleden çekilen

Detaylı

MADDE VE TEST ANALİZİ. instagram: sevimasiroglu

MADDE VE TEST ANALİZİ.  instagram: sevimasiroglu MADDE VE TEST ANALİZİ Sunu Sırası Madde Analizi Madde Güçlüğü Madde Ayırıcılık Gücü Test Analizi Dizi Genişliği Ortanca Ortalama Standart Sapma Testin Ortalama Güçlüğü Testin Çarpıklık Düzeyi Test Güvenirliği

Detaylı

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan

Konum ve Dağılım Ölçüleri. BBY606 Araştırma Yöntemleri Güleda Doğan Konum ve Dağılım Ölçüleri BBY606 Araştırma Yöntemleri Güleda Doğan Konum ölçüleri Merkezi eğilim ölçüleri Verilerin ortalamaya göre olan gruplanması nasıl? Yakın, uzak? Sıklık dağılımlarının karşılaştırılması

Detaylı

Portföy Yönetimi. Yatırım Kumar Adil Oyun

Portföy Yönetimi. Yatırım Kumar Adil Oyun Portföy Yönetimi 1 Yatırım Kumar Adil Oyun 2 1 Risk ve Getiri Kavramı Genel Kural: Getiriyi Sev, Riskten Kaç Faydayı Maksimize Et! 3 Getiri Kavramı Hisse Senedinde getiri iki kaynaktan oluşur. : Sermaye

Detaylı

Yatırım Kumar Adil Oyun

Yatırım Kumar Adil Oyun Portföy Yönetimi Yatırım Kumar Adil Oyun 1 2 Getiri Kavramı Risk ve Getiri Kavramı Genel Kural: Getiriyi Sev, Riskten Kaç Faydayı Maksimize Et! Hisse Senedinde getiri iki kaynaktan oluşur. : Sermaye Kazancı

Detaylı

Yatırım Kumar Adil Oyun

Yatırım Kumar Adil Oyun Portföy Yönetimi 1 Yatırım Kumar Adil Oyun 2 Risk ve Getiri Kavramı Genel Kural: Getiriyi Sev, Riskten Kaç Faydayı Maksimize Et! 3 Getiri Kavramı Hisse Senedinde getiri iki kaynaktan oluşur. : Sermaye

Detaylı

Korelasyon ve Regresyon

Korelasyon ve Regresyon Korelasyon ve Regresyon Kazanımlar 1 2 3 4 5 6 Değişkenlerin ilişkisini açıklamak ve hesaplamak için Pearson korelasyon katsayısı Örneklem r ile evren korelasyonu hakkında hipotez testi yapmak Spearman

Detaylı

SÜREKLİ RASSAL DEĞİŞKENLER

SÜREKLİ RASSAL DEĞİŞKENLER SÜREKLİ RASSAL DEĞİŞKENLER Sürekli Rassal Değişkenler Sürekli Rassal Değişken: Değerleriölçümyadatartımla elde edilen, bir başka anlatımla sayımla elde edilemeyen, değişkene sürekli rassal değişken denir.

Detaylı

ZAMAN SERİLERİNDE REGRESYON ANALİZİ

ZAMAN SERİLERİNDE REGRESYON ANALİZİ ZAMAN SERİLERİNDE REGRESYON ANALİZİ 1 1. GİRİŞ Trent, serinin genelinde yukarıya ya da aşağıya doğru olan hareketlere denmektedir. Bu hareket bazen düz bir doğru şeklinde olmaktadır. Bu tür harekete sahip

Detaylı

BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr

Detaylı

13. Olasılık Dağılımlar

13. Olasılık Dağılımlar 13. Olasılık Dağılımlar Mühendislik alanında karşılaşılan fiziksel yada fiziksel olmayan rasgele değişken büyüklüklerin olasılık dağılımları için model alınabilecek çok sayıda sürekli ve kesikli fonksiyon

Detaylı

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA

JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ. Prof. Dr. Mualla YALÇINKAYA JEODEZİK VERİLERİN İSTATİSTİK ANALİZİ Prof. Dr. Mualla YALÇINKAYA Karadeniz Teknik Üniversitesi, Harita Mühendisliği Bölümü Trabzon, 2018 VERİLERİN İRDELENMESİ Örnek: İki nokta arasındaki uzunluk 80 kere

Detaylı

MEH535 Örüntü Tanıma. Karar Teorisi

MEH535 Örüntü Tanıma. Karar Teorisi MEH535 Örüntü Tanıma 2. Karar Teorisi Doç.Dr. M. Kemal GÜLLÜ Elektronik ve Haberleşme Mühendisliği Bölümü web: http://akademikpersonel.kocaeli.edu.tr/kemalg/ E-posta: kemalg@kocaeli.edu.tr Karar Teorisi

Detaylı

Appendix C: İstatistiksel Çıkarsama

Appendix C: İstatistiksel Çıkarsama Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Notları Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix C: İstatistiksel Çıkarsama

Detaylı

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( )

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( ) İKİ DEĞİŞKENLİ OLASILIK Rassal bir deneme yapılmakta ve farklı iki olay ile ilgilenilmektedir. A 1, A 2,,A i olayları bağdaşmaz ve bütünü kapsayıcıdır. B 1, B 2,,B j olayları bağdaşmaz ve bütünü kapsayıcıdır.

Detaylı

1. Yatırımın Faiz Esnekliği

1. Yatırımın Faiz Esnekliği DERS NOTU 08 YATIRIMIN FAİZ ESNEKLİĞİ, PARA VE MALİYE POLİTİKALARININ ETKİNLİKLERİ, TOPLAM TALEP (AD) EĞRİSİNİN ELDE EDİLİŞİ Bugünki dersin içeriği: 1. YATIRIMIN FAİZ ESNEKLİĞİ... 1 2. PARA VE MALİYE POLİTİKALARININ

Detaylı

İçindekiler. Ön Söz... xiii

İçindekiler. Ön Söz... xiii İçindekiler Ön Söz.................................................... xiii Bölüm 1 İstatistiğe Giriş....................................... 1 1.1 Giriş......................................................1

Detaylı

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix C: İstatistiksel Çıkarsama Doç.

Detaylı

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri 2013-2014 Bahar Dönemi 13 Mart 2014

Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri. BBY606 Araştırma Yöntemleri 2013-2014 Bahar Dönemi 13 Mart 2014 Nicel / Nitel Verilerde Konum ve Değişim Ölçüleri BBY606 Araştırma Yöntemleri 2013-2014 Bahar Dönemi 13 Mart 2014 1 Konum ölçüleri Merkezi eğilim ölçüleri Verilerin ortalamaya göre olan gruplanması nasıl?

Detaylı

İLERİ ARAŞTIRMA SORU HAVUZU

İLERİ ARAŞTIRMA SORU HAVUZU 1 ) Bir ölçümde bağımlı değişkenlerdeki farklılıkların bağımsız değişkenlerdeki farklılıkları nasıl etkilediğini aşağıdakilerden hangisi ölçer? A) Bağımlı Değişken B) Bağımsız Değişken C) Boş Değişken

Detaylı

EME 3117 SİSTEM SIMÜLASYONU. Girdi Analizi. Özet İstatistikler ve Histogram (Minitab)(1) Örnek: Eczane İçin Servis Süreleri

EME 3117 SİSTEM SIMÜLASYONU. Girdi Analizi. Özet İstatistikler ve Histogram (Minitab)(1) Örnek: Eczane İçin Servis Süreleri EME 3117 1 2 Girdi Analizi SİSTEM SIMÜLASYONU Modellenecek sistemi (prosesi) dokümante et. Veri toplamak için bir plan geliştir. Veri topla. Verilerin grafiksel ve istatistiksel analizini yap. Girdi Analizi-I

Detaylı

ÖRNEKLEME HATALARI EK C. A. Sinan Türkyılmaz

ÖRNEKLEME HATALARI EK C. A. Sinan Türkyılmaz ÖNEKLEME HATALAI EK C A. Sinan Türkyılmaz Örneklem araştırmalarından elde edilen kestirimler (estimates) iki tip dan etkilenirler: (1) örneklem dışı lar ve (2) örneklem ları. Örneklem dışı lar, veri toplama

Detaylı

Korelasyon ve Regresyon

Korelasyon ve Regresyon Korelasyon ve Regresyon Kazanımlar 1 2 3 4 5 6 Değişkenlerin ilişkisini açıklamak ve hesaplamak için Pearson korelasyon katsayısı Örneklem r ile evren korelasyonu hakkında hipotez testi yapmak Spearman

Detaylı

26.12.2013. Farklı iki ilaç(a,b) kullanan iki grupta kan pıhtılaşma zamanları farklı mıdır?

26.12.2013. Farklı iki ilaç(a,b) kullanan iki grupta kan pıhtılaşma zamanları farklı mıdır? 26.2.23 Gözlem ya da deneme sonucu elde edilmiş sonuçların, raslantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel yöntemlere HĐPOTEZ TESTLERĐ denir. Sonuçların raslantıya bağlı olup

Detaylı

PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz.

PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz. PARAMETRİK TESTLER Tek Örneklem t-testi 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz. H0 (boş hipotez): 200 öğrencinin matematik dersinden aldıkları

Detaylı