BĠLGĠSAYARDA ĠSTATĠSTĠK ÇÖZÜMLEMELER DÖNEM III Yrd.Doç.Dr. Ġsmail YILDIZ Biyoistatistik ve Tıbbi BiliĢim AD Öğretim üyesi 1
FRĠEDMAN ĠKĠ YÖNLÜ VARYANS ANALĠZĠ TESTĠ: Friedman testi, iki yönlü varyans analizinin non parametrik alternatifi olan bir testtir. n birimlik bir gruptan k iģlem için sıralı, skor ya da aralıklı ölçekle elde edilmiģ veriler elde edilmiģ ise k iģlem etkisinin farklılığını test etmek amacıyla Friedman testi uygulanır.
NonParametric Analyze Friedman (Bağımlı 2 den fazla grup ortalaması) Nonparametric Test K Related samples Wilcoxon ile ikili KarĢılaĢtırmalar yapılır P <0.05 Ġstenilen verinin tekrarlı ölçümleri Test Variable kutusuna atılır est Statistics tablosunda Asymp Sig Değeri alınır Okey
1- Analyze butonuna basılır, 2- Nonparametric Tests butonuna basılır, 3- K Related Samples butonuna basılır. 1 2 3
1-KarĢılaĢtırılmak istenen bağımlı değiģken çiftleri iģaretlenerek Test variable kutusuna atılır, 2- OK butonuna basılır. ĠĢlemin sonunda Output sayfası açılır 1 2
1- Test Statistic tablosuna bakılır bu tablodaki Asymp Sig satırı bizim için anlamlı P değerini verir, 2- Hb1 - Hb2-Hb3 ün P:0.120 yani P>0.05 yani Hb1, Hb2 ve Hb3 değerleri arasında anlamlı fark yok, 3- Eger P <0.05 olsa idi ikiģerli olarak karģılaģtırılması gerekirdi (Wilcoxon testi ile) 1 2
ÖRNEK: 4 birim üzerinde 3 farklı yönteme göre elde edilen test sonuçları skor değerler olarak aģağıdaki Ģekildeki gibi bulunmuģtur. Bireylerin puanları iģlemlere göre farklı mıdır?. Yöntem/ birim 1 2 3 4 A 5 4 1 7 B 6 5 2 8 C 9 1 2 6
ÇÖZÜM: 1- a,b,c,adlı üç değiģken oluģturulur ve altına değerleri girilir.
2-Analiz> Nonparametric Tests>K-Related Samples seçeneği tıklanır.
3-Gelen pencerede Test Variables alanına a,b,c değiģkenleri taģınır 4-Test Type seçeneklerinden Friedman iģaretlenir ve OK tıklanır.
Bu çıktıya göre test sonucunda P=0,247>0,05 elde edilir. Birimlerin puanları iģlemlere göre farklı değildir.
Lojistik Regresyon Analizi Lojistik regresyon analizi doğrusal regresyondan farklı olarak bağımlı değiģkeni ikil (dikotom) olması gerekir. Bağımsız değiģkenler sayısal veya kategorik olabilir
Analyze Lojistik Regresyon Analizi Regression Binary lojistik Dependent kutusuna bağımlı degiģken Independent kutusuna tüm bağımsız değiģkenler atılır OKEY Regresyon denklemi: (Coefficients tablosunda B sütunundaki değerler ) Constant + her bagımsız degiģkenin katsayısı Anova tablosunda regression satırının Sig değeri bağımsız değiģkenlerin total etkisini verir Coefficients tablosunda her bağımsız değiģken için Sig değerine bakılır
1.Analyze, Regression, Binary Logistic butonuna basılır 1 2 3
1-Dikotom (ikili) kodlanmıģ bagımlı değiģken dependent kutusuna atılır, 2-Bağımsız değiģkenler covariates kutusuna atılır, 3-Categorical butonu tıklanır 1 2 3
1-Katogorik değiģkenler categorical covariates kutusuna atılır, 2-Continue tıklanır, 3-OK butonu tıklanır 3 1 2
1- Variables in the Equation tablosuna dikkate alınır, 2-Significant sütununda her paremetre için p değerine bakılarak paremetrenin bağımlı değiģken için bağımsız prediktör olup olmadığına karar verilir. 1 2
1-Regresyon denklemi çıkarılırken variables in the Equation tablosundaki B sütunundaki degerler alınır, (GRUP: Constat+ fol2 + durum + yaģ + cinsiyet + hb1), GRUP: - 2.95 0.279fol2 + 5.1durum 0.007yaĢ 1.65cinsiyet + 0.179 hb1 1
ODDS RATĠO (OR)(Odds oranı): Vakaların etkene maruz kalma oddsu; Bir vakanın etkene maruz kalma ihtimalinin, bir vakanın etkene maruz kalmama ihtimaline bölünmesi ile elde edilir. Kontrol grubu arasında etkene maruz kalma oddsu; Bir kontrolün etkene maruz kalma ihtimalinin, bir kontrolün etkene maruz kalmama ihtimaline bölünmesi ile elde edilir. Odds Oranı: Etkene maruz kalan vakanın oddsu / Etkene maruz kalan kontrolün oddsu
SPSS de bir etkene maruz kalma OR hesaplamak için; Etken kodlanır Sütuna (Column) yazılır Etkene maruz kalma 1 Etkene maruz kalmama 2 olarak Gruplar Satıra (Row) yazılır Hasta grup 1 Kontrol grup 2 olarak kodlanır
1- Analyze butonuna basılır, 2- Descriptives Statstics butonuna basılır, 3- Crossabs butonuna basılır 1 2 3 3
Statistic butonuna basılır
1-Chi square kutusu iģaretlenir, 2-Risk iģaretlenir, 3-Continue butonuna basılır 1 2 2
Cells butonuna basılır
1- Row ve Column kutuları iģaretlenir,2- Continue butonuna basılır 2 1
1.ÇalıĢılan gruplar row a atılır, 2. AraĢtırılan etken column a atılır, 3. OK 1 3 2
hasta Total hasta kontrol hasta * sigara Crosstabulation sigara sigara iciy or sigara icmiy or Total Count 23 32 55 % within hasta 41.8% 58.2% 100.0% % wit hin sigara 48.9% 29.6% 35.5% Count 24 76 100 % within hasta 24.0% 76.0% 100.0% % wit hin sigara 51.1% 70.4% 64.5% Count 47 108 155 % within hasta 30.3% 69.7% 100.0% % wit hin sigara 100.0% 100.0% 100.0% Hasta olan kiģinin sigara içme oddsu 23/32 : 0.718 Kontrol grubundaki kiģinin sigara içme oddsu 24/ 76: 0.315 Risk Esti mate Odds Ratio f or hasta (hasta / kontrol) For cohort sigara = sigara iciy or For cohort sigara = sigara icmiy or N of Valid Cases 2.276 1.124 4.608 1.742 1.091 2.782.766.596.983 155 95% Confidence Interv al Value Lower Upper Odds Oranı:0.718/ 0.315: 2.27
ODDS RATĠO (OR)(Odds oranı): http://faculty.vassar.edu/lowry/vassarstats.html
RELATĠVE RĠSK (RR) RĠSK ORANI Bir etkene maruz kalma ile bir olayın gerçekleģmesi arasındaki iliģkiyi ortaya koymada kullanılır. R (Etkene maruz kalan): Etkene maruz kalanlardan hasta olanlar Etkene Maruz kalanların tamamı R (Etkene maruz kalmayan): Etkene maruz kalmayanlardan hasta olanlar Etkene Maruz kalmayanların tamamı RR: R / R
hasta * sigara Crosstabulation hasta Total hasta kontrol Count % within hasta % wit hin sigara Count % within hasta % wit hin sigara Count % within hasta % wit hin sigara sigara sigara iciy or sigara icmiy or Total 23 32 55 41.8% 58.2% 100.0% 48.9% 29.6% 35.5% 24 76 100 24.0% 76.0% 100.0% 51.1% 70.4% 64.5% 47 108 155 30.3% 69.7% 100.0% 100.0% 100.0% 100.0% Sigara içenlerin hasta olma riski 23/47: 0.489 Sigara içmeyenlerin hasta olma riski 32/108: 0.296 Sigara içenlerin sigara içmeyenlere göre hasta olma relatif riski RR: 0.489/ 0.296: 1.65
RELATĠVE RĠSK (RR) RĠSK ORANI http://www.medcalc.be/calc/relative_risk.php
Receiver Operating Characteric - ROC Her sınflandırma iģleminde yapıldığı gibi, metodlar kesinlik (yanlıģ pozitifleri eleme kabiliyeti, spesifite) ve hassasiyet (doğru pozitifleri tespit etme kabiliyeti, sensitivite) arasındaki dengeyi kurmakla uğraģmaktadır. Cut-off değeri belirlenmesini sağlar ROC adı verilen eğri, kesinlik ve hasiyet arasındaki dengeyi değerlendirmek için kullanılmıģtır. ROC eğrisi altında kalan alan (AUC) ROC puanı olarak tanımlanabilir. ROC puanı 1 (bir) olduğunda anlamı, pozitifler mükemmel bir Ģekilde negatiflerden ayrılmıģtır, olmaktadır. ROC puanı 0 (sıfır) olduğunda ise herhangi bir pozitif bulunamadı anlamına gelir.
1.Analysis veya Graphs (hangisinin altında yer alıyorsa) 2. ROC curve 1 2
1. Test eilecek değiģken Test variable kutusuna atılır 2. Gold standart olarak kabul edilen değiģken State Variable kutusuna atılır 3. Gol standartın test edilen durumunun kodu Value of state variable kutusuna yazılır, 4. Kutucuklar iģaretlenir 1 2 3 4
1. OK tuģuna basılır
ROC eğrisi AUC Area Under the Curve (AUC) Test Result Variable(s): mcv Area Std. Error Asy mptotic 95% Conf idence Sig. b Lower Bound Upper Bound a Asy mptotic Interv al.737.047.000.645.830 The test result variable(s): mcv has at least one tie between the positiv e actual state group and the negativ e actual state group. Statistics may be biased. a. Under the nonparametric assumption b. Null hy pothesis: true area = 0.5
Elde edilen en uygun cut-off seçilir Bu cut-off a göre veriler kategorize edilir Daha önceki bilgiler kullanılarak; Sensitivite Spesifite PPD NPD Hesaplanır Birden fazla cut-off kullanılarak elde edilen verilerde makalede seçenek olarak sunulabilir Cut-off u aranan degiģkenin sensitivitesi değeri azaldıkça artıyorsa coordinates of the curve tablosundaki Sensitivite değeri Spesifiteyi 1-Spesifite değeri Sensitiviteyi gösterir
MCV değeri düģtükçe anemi tanısının sensitivitesi artıyor bu nedenle coordinates of the curve tablosundaki değerler yer degiģtiriyor MCV cut-off 77.10 hb1.1 * mcv2 Crosstabul ation hb1.1 Total anemi var anemi yok Count % within hb1.1 % within mcv2 Count % within hb1.1 % within mcv2 Count % within hb1.1 % within mcv2 mcv2 mcv düþük mcv y üksek Total 66 60 126 52.4% 47.6% 100.0% 93.0% 71.4% 81.3% 5 24 29 17.2% 82.8% 100.0% 7.0% 28.6% 18.7% 71 84 155 45.8% 54.2% 100.0% 100.0% 100.0% 100.0% Spesifite: 24 / 24+5 : 82.8 Sensitivite: 66 / 66+60 : 52.4
SÜRVĠ ANALĠZĠ SAĞKALIM EĞRĠLERĠ Sürvi analiz yapabilmek için izleme süresi ve hastanın durumunu belirten verilere ihtiyaç vardır. Amaç beklenen yaģam süresidir. Genel sağkalım ve hastalıksız sağkalım olarak bakılabilir Ġzlem süresi araģtırmacının belirteceği baģlangıç noktası (biopsi tarihi, ameliyat tarihi, baģvuru tarihi vb.) ve bitiģ noktası (ölüm, hastalığın nüksü, metastaz, çalıģmanın sonlandırılması vb.) arasında geçen süredir.
Genel Sağkalım D.Ü.TIP FAKÜLTESĠ BĠYOĠSTATĠSTĠK VE TIBBĠ BĠLĠġĠM AD 1,0 0,8 0,6 0,4 0,2 0,0 0,00 12,00 24,00 36,00 48,00 60,00 72,00 84,00 Sağkalım eğrisi Süre (ay) 96,00 108,00 120,00
KAPLAN-MEĠER SAĞKALIM ANALĠZĠ Farklı denek gruplarının yaģam sürelerini karģılaģtırarak prognoza etki eden faktörlerin incelenmesini sağlar Bir ilacın veya tedavi metodunun uzun dönemdeki baģarısının değerlendirilmesini sağlar. Logrank testi iki sağkalım egrisinin karģılaģtırılmasını sağlar
1-Analyze, 2-Survival, 3-Kaplan-meier 1 2 3
1-Time kutucuğuna izlem süresi atılır,2-status kutusuna beklene durumun kodu girilir, 3-KarĢılaĢtırılacak gruplar ise factor kutusuna atılır, 4-Compare factor butonuna basılır 1 2 3 4
1.Log rank kutusu iģaretlenir, 2.Pairwise over strate kutusu iģaretlenir, 3.Continue butonuna basılır, 4.Options butonuna asılır 1 3 2 4
1. Kutucuklar iģaretlenir 2. Ok tuģuna basılır 1
1. YaĢam tablosunun hangi gruba ait olduğunu gösterir 2. Sütunun sonunda ölen hasta sayısının toplamı görülür 1 2
1.Olay gerçekleģmeyen (örn. Sağkalan) 2. GerçekleĢen olay sayısı 3.Grubun ortalama yaģam zamanı: 64±3 ay (CI: 58-70) 1 2 3
1-Toplu halde gruplara göre olayın gerçekleģmediği hasta yüzdeleri 2-Log Rank satırı Gruplar arasındaki farkın anlamlı olup olmadığını Gösterir, 3-Anlamlı farklılık varsa alttaki subgrup analizine bakılır 1 2
1. Subgrup analizleri Grup1-2 p: 0.042, Grup 1-3 p:0.000, Grup 2-3 p:0.015
1. Grupların yaģam egrileri
KAYNAKLAR: [1] ÖZDAMAR, K., Paket Programlar ile Ġstatistiksel Veri Analizi I- II, Kaan Kitabevi, ESKĠġEHĠR, 1999. [2] ÖZDAMAR, K., SPSS ile Biyoistatistik, Kaan Kitabevi, ESKĠġEHĠR, 1999. [3] HAYRAN, M., ÖZDEMĠR, O., Bilgisayar Ġstatistik ve Tıp, HYB, MEDAR, ANKARA, 1996. [4] SPSS Base 7.5 Applications Guide http://www.spss.com.tr/ [5] CHARLES R.H., Deney Düzenlemede Ġstatistiksel Yöntemler. [6] SÜMBÜLOĞLU, K., SÜMBÜLOĞLU, V., Biyoistatistik [7] KAN, Ġ., Biyoistatistik [8] ÖZDAMAR, K., Biyoistatistik. [9] SPSS, SPSS Base 7.5 Applications Guide [10] SPSS, SPSS Interactive Graphics 10.0 [11] BÜYÜKÖZTÜRK, ġ., Veri Analizi El Kitabı, Pegema Yayıncılık, ANKARA, 2002. [12] Tonta, Y., Regresyon Analizi Ders Notları, H.Ü. BBY
BİYOİSTATİSTİK 54