ONKOLOJİDE SIK KULLANILAN İSTATİSTİKSEL YÖNTEMLER VE SAĞKALIM EĞRİLERİ HESAPLAMA VE DEĞERLENDİRME YÖNTEMLERİ Prof. Dr. M. Özşahin Radyasyon Onkolojisi Bölümü, Lozan Üniversitesi Hastanesi, İsviçre
mahmut.ozsahin@chuv.ch +4 2 34 463
A tedavisi mi, B tedavisi mi? A standart tedavi B araştırılan/denenen tedavi (daha mı iyi?)
İdeal yöntem: randomize çalışma Elmalar vs. Elmalar Kötü alternatif: randomize olmayan çalışma Elmalar vs. Armutlar İyice alternatif: randomize olmayan ama iyi dengelenmiş çalışma Elmalar vs. Elmaya çok benzer meyvalar
İdeal yöntem: randomize çalışma Örnek: T ve T2 N larinks kanserinde RT vs. organ koruyucu cerrahi (kordektomi) Stratifikasyon kriterleri: T ( veya 2) evresi ve ön komissür tutulumu (her iki grupta da aynı sayıda kötü prognostik faktör dağılımı sağlamak amacıyla) Prospektif çalışma olduğu için, her iki çalışma kolunda (A vs. B) dengeli dağılım mevcut
Randomize olmayan retrospektif çalışma Denek ve yöntem (I) Olguların tanımlayıcı (deskriptif) analizi (yaş, cins, TNM, histolojik tip, ön komissür tutulumu, vs.) Çeşitli parametrelerin tedavi gruplarında dağılımı (yukarıda sayılan parametreler) İki tedavi grubu arasında bu parametrelerin dağılımı açısından anlamlı bir fark olup olmadığının saptanması Nasıl?
Kullanılacak istatiksel yöntemin seçimi? Amaç Sayısal sürekli veri (n > 25) (ör: yaş) Sayısal sürekli veri (n < 25) (ör: yaş) Evet/Hayır (ör: cins) Sansür edilmiş veri (ör: sağkalım) Deskriptif analiz Eşleşmemiş 2 grubun karşılaştırılması Ortalama, SH, SS Eşleşmemiş T-testi Ortanca, çeyrek Mann-Whitney testi Orantı Ki kare (n > 5) veya Fisher testi Kaplan-Meier Logrank veya Gehan testleri Eşleşmiş 2 grubun karşılaştırılması Eşleşmiş T-testi Wilcoxon testi McNemar testi 3 ve daha fazla grubun karşılaştırılması ANOVA testi Kruskal-Wallis testi Ki kare testi Logrank testi Aranan parametrenin bilinen bir değer kullanılarak tahmini Düzgün doğrusal ilişki yoklaması (lineer regresyon) Non-parametrik regresyon analiz yöntemleri Basit lojistik regresyon analizi Cox modeli Aranan parametrenin bilinen birden fazla değerler kullanılarak tahmini Multipl lineer regresyon analizi Multipl lojistik regresyon analizi Cox modeli
Eşleşmiş T-testi Onkolojide çok ender kullanılır, zira: İki veya daha fazla tedavinin aynı deneklerde denenmesini gerektirir. Örneğin: diabetli olguda önce A tedavisinin sonra da B tedavisinin denenerek etkinliğinin karşılaştırılması (aynı olgular üzerinde). Eşleşmiş T-tesi, Wilcoxon signed rank testi ve McNemar testi A ve B grubu arasındaki farkı araştırmak için kullanılır.
Her tür çalışmada (randomize veya retrospektif) Denek ve yöntem (II) Takip süresinin tanımı (follow-up) Kullanılan istatiksel yöntemlerin ve hedef/hedeflerin tanımı (end-point) Olayların (event) tanımı (ör: sağkalım için ölüm; hastalıksız sağkalım için nüks veya hastalıksız ölüm) Nasıl?
Takip (Follow-up) Analize edilen olay a (event) göre (ör: sağkalım, nüks, geç komplikasyon olasılığı, vs.). Olayın gerçekleştiği olgular dışarıda bırakılır (ör: ölen olguların dışlanması) 2. Olayın gerçekleşmediği olgular kullanılırak (patients at risk) Minimum, maksimum, ortalama, ortanca, vs. takip süresi değerleri tanımlanır.
Kullanılan istatiksel yöntemler En sık kullanılan testlere örnekler: Her hücrenin değeri 5 veya daha fazla ise, orantılar ki kare testi ile; 5 ten az ise çift taraflı Fisher testi ile karşılaştırılır Ortalamalar T-testi (Student s T-test) ile karşılaştırılır Sağkalım eğrileri, Kaplan-Meier yöntemi ile hesaplanır Eğrilerin karşılaştırılması logrank testi ile gerçekleştirilir Çok değişkenli analizler için Cox modeli kullanılır
Olayların ve sürelerin tanımı Analiz Olay (val = ) Sağkalım Ölüm (her türü) Sansür edilme (val = ) Sağ Süre (ay) ddn** tanı Özgül sağkalım Hastalığa özgü ölüm Sağ veya hastalık dışı ölüm ddn tanı DFS* Lokal kontrol Komplikasyon olasılığı Nüks veya ölüm (her türü) Lokal nüks Komplikasyon var Hastalıksız ve sağ Lokal nüks yapmadan sağ veya ölü Komplikasyon yok Nüks tarihi tanı veya ddn tanı date rech loc tanı veya ddn tanı Komp. tarihi tanı veya ddn tanı *DFS: disease-free survival (hastalıksız sağkalım) **ddn: en son haber alma veya ölüm tarihi; tanı: tanı tarihi
Bilgisayar programları için açıklama Çeşitli süreleri hesaplarken (ör: sağkalım), aşağıdaki işlem yapılmalı (saniye > ay dönüşümü) : (en son haber alma/ölüm tarihi tanı tarihi) 2 635 2 (6 x 6 x 24 x 3.5) Genellikle (örneğin JMP program paketi), araştırılan olay değeri sansür edilmiş veri için, olayın gerçekleştiği veri için kullanılır (ör: sağkalım için, sağ = et ölü = )
In the long run, we are all dead John Keynes
Sağkalım eğrileri Sağkalım eğrileri, sağkalım değerinin Y-ekseninde % olarak X-ekseninde süreye göre temsil edildiği basit grafiklerdir Genel sağkalım için, «sıfırıncı ayda» tüm olgular sağdır (%) «Sıfırıncı ay» sabit bir tarih değildir. Çoğunlukla tanı tarihi, ilk tedavi tarihi veya randomize çalışmalar için randomizasyon tarihidir (istatistiksel yöntemlerde açıkça belirtilmelidir!) Sağkalım eğrileri Kaplan-Meier (onkolojide) veya lifetable yöntemi ile hesaplanır
TN ve T2N larinks kanseri: Lokal kontrol olasılığı. Lokal kontrol olasılığı.8.6.4.2. 24 48 72 96 2 Ay Nasıl hesaplayalım?
Kaplan-Meier (lokal kontrol olasılığı) Süre*.. 3. 4. 6. 8. 8.3 2. 2.39 3. 4. 22. 23.8 26. 27. 27.34... Nüks... Sansür 2 2 2 2... At risk 72 72 7 7 69 68 67 66 65 64 6 59 57 56 55 53... Hesap /72 /72 /7 /7 ( /69) x.98 ( /68) x.97 ( /67) x.97 ( /66) x.96 ( /65) x.96 ( /64) x.94 ( /6) x.93 ( /59) x.93 ( /57) x.93 ( /56) x.9 ( /55) x.9 ( /53) x.9... *(nüks tarihi tanı tarihi) veya (son haber alma tarihi tanı tarihi) Olasılık....98.97.97.96.96.94.93.93.93.9.9.9.89...
Aktuaryel yöntemler Kaplan-Meier yöntemini kullanarak, sansür edilmiş olgular içeren ve zaman içinde değişen her türlü olasılığı tahmin edebiliriz. Örnek: Cerrahi uygulanan olgunun 5 inde ciddi geç komplikasyon (ör: fistül) gelişiyor. Bu olgularda, fistül olasılığı %5 (5/) midir? Yanıt: muhtemelen hayır. Neden?
Kaplan-Meier (fistül olasılığı) Süre.. 3. 4. 6. 8. 2. 5. 6. 8. 2. 22. 24. 26. 35. 48.... Fistül 4 3... Sansür 2 2 3 2 4 4 5 5... At risk 99 98 96 95 94 93 89 88 85 8 77 73 65 59... Hesap / / /99 x. /95 x. /94 x.6 /93 x.3 /89 x.22 /88 x.37 4/77 x.56 3/73 x 8. /65 x 33.29... Olasılık......6.3.22.37.56.56.56 8. 33.29 5.2 5.2...
In the long run, we are all dead John Keynes
Aktuaryal yöntemler Kaplan-Meier yönteminde analiz edilen olguların tümünde olayın gerçekleşeceği farz edilir (ör: sağkalım için, herkes birgün ölecektir) Bu nedenle, bir önceki örnekte fistül olasılığı kaba olasılıkla %5 bulunurken, aynı olasılık aktuaryel yöntemle (Kaplan-Meier) %5 olarak hesaplanmıştır (acaba herkes birgün fistül oluşturacak mıdır!) Ne yapalım? Kümülatif insidans hesabı yapmalıyız
Ortanca (medyan) sağkalım. Sağkalım olasılığı.8.6.4.2? 72 ay. 24 48 72 96 2 Ay Not: ortalama sağkalım diye bir şey yok!
A ve B tedavisini hangi testleri kullanarak karşılaştıralım? Sansür olmayan veri durumu Koşul: her iki gruptaki tüm olgularda olay gerçekleşmeli (ör: sağkalım için herkes öldüyse) Tek değişkenli analizler T-testi (A ve B gruplarında sağkalım sürelerinin ortalamalarının karşılaştırılması) veya ki kare testi (her iki gruptaki sağkalım orantılarının karşılaştırılmasi) Çok değişkenli analizler Multipl lojistik regresyon analizi yöntemi
Sansür edilmiş veri olunca ne yapalım? Tek değişkenli analizler (logrank veya Wilcoxon [Gehan]) 2 veya daha fazla sağkalım eğrilerinin karşılaştırılması (hangi olay olursa olsun) (ör: A ve B tedavileri) Çok değişkenli analizler (Cox modeli) Olayı etkileyen birçok faktörün aynı anda değerlendirilerek, bunlardan anlamlı olarak bağımsız faktörlerin belirlenmesi (ör: aynı anda yaş, TNM, tedavi tipi, vs. gibi) ve bunların arasında olayı etkileyen bağımsız faktörün saptanması
Logrank vs. Wilcoxon (Gehan)?..8 Sağkalım olasılığı.6.4.2 vs. vs. Logrank P <.5 P <.5 Gehan P <.5 P = NS. 24 48 72 96 2 Ay vs. P = NS P <.5
Neden çok değişkenli analiz (I)? TN larinks kanserinde RT ve organ koruyucu cerrahiyi karşılaştıran prospektif randomize bir çalışma olduğunu farz edelim Gene farz edelim ki ön komissür tutulumunun lokal kontrol üzerindeki etkisini bugüne kadar bilmiyorsunuz ve bu nedenle tabakalama (stratifikasyon) faktörü olarak kullanmıyorsunuz Her iki grupta olgu mevcut (toplam 2). RT grubunda tesadüfen 2 olguda ön komissür tutulumu varken cerrahi grubunda sadece 4 olguda var
Neden çok değişkenli analiz (II)? Ön komissür tutulumu kötü bir prognostik faktör olduğu için, tek değişkenli analiz olan logrank testi RT grubunda nüks olasılığının cerrahi grubuna göre anlamlı olarak yüksek olduğunu saptayacak ve, çok değişkenli analiz yapılmadığı takdirde, yorum cerrahi RT den üstündür olacaktı Buna karşın, Cox modeliyle tüm parametreleri değerlendiren (tedavi yöntemi, cins, yaş, ön kommissür tutulumu, vs.) çok değişkenli analiz yapılsaydı, lokal kontrolü bağımsız olarak etkileyen tek faktörün ön komissür tutulumu olduğunu saptayacaktık
Suçlu mu suçsuz mu veya anlamlı mı anlamsız mı? Basamak Hakim. Sanık suçlu değil Araştırmacı Fark yok 2. 3. 4. 5. Kanıtları iyi incele (basının yazdıklarından, vs. etkilenme) Tanıklar doğruyu söylüyorlar mı? Değerlendir! Sanığın suçlu olduğunu gösteren bir kanıt var mı? Kanıt varsa sanığın suçlu olduğunu, yoksa suçsuz olduğunu ilan et! Yorumu sadece kendine ait verilerden çıkar (başkalarının çalışmalarından etkilenme) Çalışma düzgün ve usulüne uygun yapıldı mı? Verilerini kontrol et! Uygun istatistiksel yöntemi ile «P»değerini hesapla P <.5 ise iki tedavi grubu arasında fark olduğunu, değilse arada fark olmadığını ilan et! (her iki durumda da belki ya da bekle de gör demek mümkün değil!)
Cox modeli (I) Mümkün olan tüm parametreler ile tek değişkenli analizle (logrank testi) iki tedavi grubu karşılaştırılır (ör: A ve B tedavisi, yaş <5 ve >5, erkek/kadın, TT2 ve T3T4, N ve N+, cerrahi sınır +/, ekstra nodal yayılım +/, vs.) Sonra, örnek büyüklüğüne bağlı olarak sadece belli bir anlamlılık gösteren (ör: p <. veya p <.5; denek ve yöntemde hangi değerin alındığı mutlaka belirtilmeli) faktörler kullanılarak çok değişkenli analiz yapılır
Cox modeli (II) Genel olarak, Cox modelinde sayısal sürekli veri kullanımından kaçınılmalı. Bunun için, bu tür veriler Evet/Hayır verisi şekline dönüştürülmeli. Örneğin, yaş değişkenini sürekli veri olarak kullanmaktansa ortanca (veya çeyrek) değerin üstü/altı (yaş < 4 ve > 4) olarak kullanmalı Hangi tür çok değişkenli analiz yapılırsa yapılsın, veri tabanımızda eksik veri olmamalı. Bazı olgularda veri eksikse, çok değişkenli analizde sadece verileri tam olan olgular hesaba katılmalı. Burada unutulmaması gereken bir nokta, analize alınan ve alınmayan olguların akibetlerinin karşılaştırılması: iki grup arasında fark olmamalı.