alphanumeric journal The Journal of Operations Research, Statistics, Econometrics and Management Information Systems

Benzer belgeler
YAŞAM ÇÖZÜMLEMESİNDE AYKIRI DEĞERLER OUTLIERS IN SURVIVAL ANALYSIS

ÇOKLU REGRESYON MODELİ, ANOVA TABLOSU, MATRİSLERLE REGRESYON ÇÖZÜMLEMESİ,REGRES-YON KATSAYILARININ YORUMU

Kİ-KARE TESTLERİ. şeklinde karesi alındığında, Z i. değerlerinin dağılımı ki-kare dağılımına dönüşür.

PARÇALI DOĞRUSAL REGRESYON

HAFTA 13. kadın profesörlerin ortalama maaşı E( Y D 1) erkek profesörlerin ortalama maaşı. Kestirim denklemi D : t :

Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ

Kİ KARE ANALİZİ. Doç. Dr. Mehmet AKSARAYLI Ki-Kare Analizleri

Sıklık Tabloları ve Tek Değişkenli Grafikler

Korelasyon ve Regresyon

NİTEL TERCİH MODELLERİ

Koşullu Varyans Modelleri: İmkb Serileri Üzerine Bir Uygulama

Farklı Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = σ i2. Eşit Varyans. Hata. Zaman

BÖLÜM 5 İKİ VEYA DAHA YÜKSEK BOYUTLU RASGELE DEĞİŞKENLER İki Boyutlu Rasgele Değişkenler

İMKB BİLEŞİK 100 ENDEKSİ GETİRİ VOLATİLİTESİNİN ANALİZİ ANALYSIS OF ISTANBUL STOCK EXCHANGE 100 INDEX S RETURN VOLATILITY ABSTRACT

Lineer Olmayan Yapı Sistemlerinin Analizi İçin Yay-Boyu Metodu

kadar ( i. kaynağın gölge fiyatı kadar) olmalıdır.

Farklı Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = s 2 Eşit Varyans

BÖLÜM 9 İKİ BOYUTLU PANEL YÖNTEMLERİ

Sabit Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = s 2

Ayhan Topçu Accepted: January ISSN : ayhan_topcu@hotmail.com Ankara-Turkey

Doğrusal Korelasyon ve Regresyon

Merkezi Eğilim (Yer) Ölçüleri

DENEY TASARIMI VE ANALİZİ

DENEY TASARIMI VE ANALİZİ

DENEY 4: SERİ VE PARALEL DEVRELER,VOLTAJ VE AKIM BÖLÜCÜ KURALLARI, KIRCHOFF KANUNLARI

SEK Yönteminin Güvenilirliği Sayısal Bir Örnek. Ekonometri 1 Konu 11 Sürüm 2,0 (Ekim 2011)

Veride etiket bilgisi yok Denetimsiz öğrenme (unsupervised learning) Neden gereklidir?

Summary. Orijinal araştırma (Original article)

UYUM ĐYĐLĐĞĐ TESTĐ. 2 -n olup. nin dağılımı χ dir ve sd = (k-1-p) dir. Burada k = sınıf sayısı, p = tahmin edilen parametre sayısıdır.

İstatistikçiler Dergisi

YAŞAM ÇÖZÜMLEMESİNDE ZAYIFLIK MODELLERİ FRAILTY MODELS IN SURVIVAL ANALYSIS

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ÇOKLU İÇ İLİŞKİ VE EKOLOJİK REGRESYON İSTATİSTİK ANABİLİM DALI

Avrupa Birliği ve Türkiye de Mali Saydamlığın Panel Veri Yöntemi ile Analizi

TEKNOLOJĐK ARAŞTIRMALAR

Rasgele Değişken Üretme Teknikleri

dir. Bir başka deyişle bir olayın olasılığı, uygun sonuçların sayısının örnek uzaydaki tüm sonuçların sayısına oranıdır.

BÖLÜM 1 1.GİRİŞ: İSTATİSTİKSEL DOĞRUSAL MODELLER

Sürekli Olasılık Dağılım (Birikimli- Kümülatif)Fonksiyonu. Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK

Enflasyon Hedeflemesi Sürecinde Para Talebi İstikrarının ARDL Modeli Yaklaşımı İle Analizi: Türkiye ve Endonezya Örneği

YARIPARAMETRİK KISMİ DOĞRUSAL PANEL VERİ MODELLERİYLE ULUSLAR ARASI GÖÇ

FARKLI VERİ YAPILARINDA KULLANILABİLECEK REGRESYON YÖNTEMLERİ

EKONOMETRİYE GİRİŞ II ÖDEV 4 ÇÖZÜM

NOT: Deney kılavuzunun Dönme Dinamiği Aygıtının Kullanımı İle İlgili Bilgiler Başlıklı Bölümü okuyunuz.

GÜMRÜK BİRLİĞİ SONRASI TÜRKİYE NİN İHRACAT FONKSİYONUNUN TAHMİNİ

Saklı Markov modelleri kullanılarak Türkiye de dolar kurundaki değişimin tahmin edilmesi

ÇEV 314 Yağmursuyu ve Kanalizasyon. Nüfus Projeksiyonları

BİR BOYUTLU HAREKET FİZİK I. Bir Boyutlu Hareket? Hız ve Sürat. 1 boyut (doğru) 2 boyut (düzlem) 3 boyut (hacim) 0 boyut (nokta)

A İSTATİSTİK. 4. X kesikli rasgele (random) değişkenin moment çıkaran. C) 4 9 Buna göre, X in beklenen değeri kaçtır?

Regresyon ve Korelasyon Analizi. Regresyon Analizi

İSTATİSTİK DERS NOTLARI

UYGULAMA 2. Bağımlı Kukla Değişkenli Modeller

Programı : Elektronik Müh.

ZKÜ Mühendislik Fakültesi - Makine Mühendisliği Bölümü ISI VE TERMODİNAMİK LABORATUVARI Sudan Suya Türbülanslı Akış Isı Değiştirgeci Deney Föyü

Yaşam çözümlemesinde cox orantılı tehlikeler ve orantılı odds modelleri

MIT Açık Ders Malzemeleri Bu materyallerden alıntı yapmak veya Kullanım Koşulları hakkında bilgi almak için

GM-220 MÜH. ÇALIŞ. İSTATİSTİKSEL. Frekans Dağılımı Oluşturma Adımları VERİLERİN SUNUMU. Verilerin Özetlenmesi ve Grafikle Gösterilmesi

BÖLÜM 1: YAşAM ÇÖzÜMLEMEsİNE GİRİş... 1

Direct Decomposition of A Finitely-Generated Module Over a Principal Ideal Domain *

TRAFİK SİMÜLASYON TEKNİKLERİ

Örnek A. Benzer tipteki 40 güç kaynağının dayanma süreleri aşağıdaki gibidir. Genişletilmiş frekans tablosu oluşturunuz;

SUÇ VERİ TABANININ LOJİSTİK REGRESYON ANALİZİ İLE TAHMİNİ: BURSA ÖRNEĞİ Estimating of Crime Database with Logistic Regression Analysis: Bursa Case

Anlık ve Ortalama Güç

PÜRÜZLÜ AÇIK KANAL AKIMLARINDA DEBİ HESABI İÇİN ENTROPY YÖNTEMİNİN KULLANILMASI

ÖZET Yüksek Lsans Tez TAM VE SANSÜRLÜ ÖRNEKLEM DURUMLARINDA WEIBULL DAĞILIMI İÇİN BAZI İSTATİSTİKİ SONUÇ ÇIKARIMLARI Dlşen TAMAM Ankara Ünverstes Fen

Bulanık Mantık ile Hesaplanan Geoid Yüksekliğine Nokta Yüksekliklerinin Etkisi

X, R, p, np, c, u ve diğer kontrol diyagramları istatistiksel kalite kontrol diyagramlarının

ALGILANAN HİZMET KALİTESİ VE LOJİSTİK REGRESYON ANALİZİ İLE HİZMET TERCİHİNE ETKİSİNİN BELİRLENMESİ. Özet

LOJ ST K REGRESYON ANAL Z : Ö RENC LER N S GARA ÇME ALI KANLI I ÜZER NE B R UYGULAMA

SEK Tahmincilerinin Arzulanan Özellikleri. SEK Tahmincilerinin Arzulanan Özellikleri. Ekonometri 1 Konu 9 Sürüm 2,0 (Ekim 2011)

Örneklemeli K-ortalama Algoritması Kmeans with Sampling

Tek Yönlü Varyans Analizi (ANOVA)

Genel Doğrusal Karışık Modellerde Farklı Kovaryans Yapıları ve Tahmin Yöntemlerinin Performanslarının Karşılaştırılması 1

DENEY 5: FREKANS MODÜLASYONU

PARAMETRİK OLMAYAN HİPOTEZ TESTLERİ. χ 2 Kİ- KARE TESTLERİ. Doç.Dr. Ali Kemal ŞEHİRLİOĞLU Araş.Gör. Efe SARIBAY

Sistemde kullanılan baralar, klasik anlamda üç ana grupta toplanabilir :

ALTERNATİF AKIM DEVRE YÖNTEM VE TEOREMLER İLE ÇÖZÜMÜ

PARAMETRİK OLMAYAN HİPOTEZ TESTLERİ Kİ-KARE TESTLERİ

Lojistik Regresyonlarda Değişken Seçimi

PROJE PLANLAMASINDA BULANIK HEDEF PROGRAMLAMA YAKLAŞIMI. Müh. Ramadan VATANSEVER

Tanımlayıcı İstatistikler

Türk İmalat Sanayinde İstihdam, İhracat ve Kapasite Kullanım Oranı İlişkisi: Panel Koentegrasyon

Korelasyon analizi. Korelasyon analizinin niteliği. Sınava hazırlanma süresi ile sınavdan alınan başarı arasında ilişki var mıdır?

bir yol oluşturmaktadır. Yine i 2 , de bir yol oluşturmaktadır. Şekil.DT.1. Temel terimlerin incelenmesi için örnek devre

REGRESYON ANALİZİ BÖLÜM 5-6

REGRESYONDA ETKİLİ GÖZLEMLERİ BELİRLEME YÖNTEMLERİ VE KARŞILAŞTIRMALARI. Can DARICA YÜKSEK LİSANS TEZİ İSTATİSTİK

Orantısız hazardlar için parametrik ve yarı parametrik yaşam modelleri

Kar Payı Politikası ve Yaşam Döngüsü Teorisi: İMKB İmalat Sektöründe Ampirik Bir Uygulama

Mide Kanseri Hastalarına İlişkin Verilerle Bir Uygulama

Hasar sıklıkları için sıfır yığılmalı kesikli modeller

Üç Boyutlu Yapı-Zemin Etkileşimi Problemlerinin Kuadratik Sonlu Elemanlar ve Sonsuz Elemanlar Kullanılarak Çözümü

PETROL FİYATLARI İLE BORSA İSTANBUL UN KAPANIŞ FİYATLARI ARASINDAKİ SAKLI İLİŞKİNİN ANALİZİ

KAPASİTANS VE ENDÜKTANS EBE-215, Ö.F.BAY 1

Yapay Sinir Ağı ve Bulanık-Yapay Sinir Ağı Yöntemleri Kullanılarak Tava Buharlaşma Tahmini

Düşük Hacimli Üretimde İstatistiksel Proses Kontrolü: Kontrol Grafikleri

Transkript:

Avalable onlne a www.alphanumerournal.om alphanumer ournal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems Volume 3, Issue 2, 2015 2015.03.02.STAT.08 Absra OUTLIERS IN SURVIVAL ANALYSIS Durdu KARASOY * Nuray TUNCER Deparmen of Sas, Haeepe Unversy, Ankara Mnsry Of Fnane, The Presdeny of Tax Inspeon Board, Ankara Reeved: 02 November2015 Aeped: 27 Deember 2015 Survval analyss s a olleon of sasal mehods for analyzng daa where he ouome varable s he me unl he ourrene of an even of neres. Oulers n survval analyss alulaed dfferenly from lassal regresson analyss. Ouler deeon mehods n survval analyss are ommonly arred ou based on resduals and resdual analyss. In survval analyss, here are dfferen ypes of resduals ha are Cox-Snell, Marngale, Shoenfeld, Devane, Log-odds and Normal devane resduals. There are mehods whh are DFBETA, LMAX and Lkelhood Dsplaemen values for deeng nfluenal observaons. The resduals are analyzed durng he sudy whh s appled on a somah aner daa se and he oulers are deeed. Afer omng hese oulers, model s se up agan and resuls were found beer.. Keywords: Survval analyss, survval models, oulers, nfluenal observaons, resduals. Jel Code: C10, C14, C19, C24 Öze YAŞAM ÇÖZÜMLEMESİNDE AYKIRI DEĞERLER Yaşam çözümlemes, anımlanan herhang br olayın oraya çıkmasına kadar geçen sürenn nelenmesnde kullanılan sasksel yönemler büünüdür. Yaşam çözümlemesnde aykırı değerler klask regresyonda kullanılan yönemlerden farklı yönemler kullanılarak hesaplanmakadır. Yaşam çözümlemesnde aykırı değer belrleme yönemler arıklara ve arıkların analzne dayanmakadır. Yaşam çözümlemesnde kullanılan başlıa arık ürler Cox-Snell, Marngale, Shoenfeld, Sapma, Log-odds ve Normal sapma arıklarıdır. Ekl gözlemler belrlemek çn kullanılan yönemler se DFBETA, LMAX ve Olablrlk Değşm değerlerdr. İnelenen arık ürler mde kanser le lgl verlere uygulanmış ve aykırı değerler belrlenmşr. Belrlenen aykırı değerler çıkarılarak model yenden kurulmuş ve aykırı değerler çıkarıldığında sonuçların daha y olduğu görülmüşür. Anahar Kelmeler : Yaşam çözümlemes, yaşam modeller, aykırı değerler, ekl gözlemler, arıklar Jel Kodu : C10, C14, C19, C24. 1. GİRİŞ Eldek ver kümesne br model uyarlandıkan sonra, uygulanan modeln varsayımlarının sağlanıp sağlanmadığının konrol edlmes gerekldr. Modeln konrolü çn anı yönemler, modelleme sürenn öneml br kısmıdır (Colle, 1994). Bu süreçlern çoğu arıkların analzne dayanmakadır. Yaşam çözümlemesnde özellkle Cox oranılı ehlkeler modelnde değşk amaçlarla kullanılableek değşk arık ürler vardır (Frano & Jn, 2013). Yaşam çözümlemesnde en yaygın kullanılan arık ürü Cox ve Snell (1968) arafından önerlen Cox-Snell arıklarıdır (Cox & Snell, 1968). Bu arık ürü modeln uygunluğunun konrolü çn kullanılır. Dğer br arık ürü olan Marngale arıkları Barlow ve Prene (1988) arafından önerlmşr ve Cox-Snell arıklarının doğrusal * durdu@haeepe.edu.r (Correspondng auhor) nuray.uner@vdk.gov.r

140 Durdu KARASOY, Nuray TUNCER / Alphanumer Journal, 3(2) (2015) 139 152 dönüşümüdür. Marngale arıkları açıklayıı değşkenlern modele uyumunu belrlemede kullanılır (Barlow & Prene, 1988). Benzer şeklde sapma arıkları da Marngale arıklarının dönüşümüdür. Aykırı değerler genellkle Therneau, Grambsh ve Flemng (1990) arafından önerlen sapma arıkları le görünülenr (Therneau, Grambsh & Flemng, 1990). Flemmng ve Harrngon (1991) sapma arıklarının referans örnekleme dağılımına sahp olmadığına ve ver kümesnde durdurulmuş gözlemler olmadığında ble sandar normal dağılım yaklaşımının amn ed olmadığına dkka çekmşr (Flemmng & Harrngon, 1991). Nard ve Shemper (1999) bu problemn üsesnden gelmek çn yen arık ürler önermşr. Bu yen arık ürlernn, aykırı değerler belrlemede daha doğru br sonuç verdğ dda edlmekedr. Bu yen arıklar log-odds ve normal sapma arıklarıdır (Nard & Shemper, 1999). Dğer br arık ürü se Cox oranılı ehlkeler (Cox proporonal hazards) modelnde oranılılık varsayımının esnde yaygın olarak kullanılan ve Shoenfeld (1982) arafından önerlen Shoenfeld arıklarıdır (Shoenfeld, 1982). Bu çalışmanın amaı, yaşam çözümlemesnde karşılaşılan aykırı değerler anımlama yönemlern ve uygulama alanlarını nelemekr. Bu amaçla arık ürler nelenmş ve gerçek br ver kümes üzernde uygulanmışır. 2. YAŞAM ÇÖZÜMLEMESI Yaşam çözümlemes, lglenlen herhang br olayın oraya çıkmasına kadar geçen sürenn nelenmesnde kullanılan çözümleme yönemler opluluğudur. Geçen süre; araşırmanın başından lglenlen olay gerçekleşneye kadar geçen yılları, ayları, hafaları, günler ya da olay gerçekleşğ anda brmn yaşını fade eder. Olay se ölüm, hasalığa yakalanma, hasalığın köüye gmes, yleşme, şe dönme ya da brmn başına gelebleek lglenlen herhang br olayı fade eder (Klenbaum & Klen, 2005). Yaşayan br organzmanın ya da ansız br nesnenn belrl br başlangıç zamanı le başarısızlığı arasında geçen zamana yaşam süres ya da başarısızlık süres adı verlmekedr. Her br brme a yaşam süres, anımı gereğ sürekl ve pozf br değere sahpr (Eland- Johnson & Johnson, 1980). Yaşam çözümlemesnde kullanılan modellern dğer sasksel modellerden emel farkı zaman değşkennn yapısından dolayı durdurulmuş (ensored) gözlem çeren ver kümes çn asarlanmış sasksel yönemler büünü olmasıdır. Durdurma genel olarak, çalışmanın bş nokasına kadar olayın gözlenememes (admnsrave ensorng), çalışma bmeden brmle lgl blg alınamaması (los o follow- up), başka br olayla (başka nedenden ölüm, laç reaksyonu gb) karşılaşma (whdrawng) nedenler le meydana gelr. Bu gb nedenlerle brmler daha fazla gözlemlenemez ve bu brmler "durdurulmuş gözlem" olarak fade edlr (Kul, 2010). 2.1. Cox Oranılı Tehlkeler Model Yaşam çözümlemesnde en çok kullanılan model Cox oranılı ehlkeler modeldr. 1972 yılında Cox arafından gelşrlen regresyon model le yaşam çözümlemesnde öneml adımlar aılmış, Cox (1972) un önerler, Kalbflesh ve Prene (1980) n kakıları le bugünkü önemn kazanmışır. Cox oranılı ehlkeler model; br brmn yaşam süres le brden fazla açıklayıı değşken arasındak lşky oraya çıkaran sasksel br yönemdr (Cox & Oakes, 1984). Cox oranılı ehlkeler model, Cox model veya Cox regresyon model (Cox regresson model) olmak üzere farklı şekllerde adlandırılablen, dağılım blgs gerekrmeyen br modeldr. Bu modelde, yaşam süres ve bu süre üzernde ekl olarak görülen açıklayıı değşkenler yer alır. Açıklayıı değşkenler, model oplamsal değl, çarpımsal olarak ekler (Hosmer & Lemeshow, 1999). Cox oranılı ehlkeler model, X h, h exp( β' X ) 0 bçmndedr. Burada, β regresyon kasayıları vekörü, X açıklayıı değşkenler vekörü ve h 0 se açıklayıı değşkene sahp olmayan (X=0 olan) br brmn emel ehlke fonksyonu olarak anımlanmakadır (Aa, Serkaya & Sözer, 2007). Cox oranılı ehlkeler modelnn emel varsayımı oranılı ehlkelerdr. Oranılı ehlkeler varsayımı, ehlkelern oranının zamana karşı sab olması anlamına gelmekedr. Oranılı ehlkeler varsayımını nelemek çn grafksel ya da sayısal yönemler kullanılmakadır. Oranılı ehlkeler varsayımının nelenmesnde en çok kullanılan yönemler, log(-log) yaşam eğrler, gözlenen ve beklenen yaşam eğrler, Aras grafkler, modele zamana bağlı açıklayıı değşkenlern eklenmes, Shoenfeld arıkları le yaşam süresnn rankı arasındak korelasyon es bçmnde sıralanablmekedr (Aa vd., 2007; Therneau & Grambsh, 2000). 2.2. Aykırı Değerler Eldek ver kümesne br model uyarlandıkan sonra, uygulanan modeln varsayımlarının sağlanıp sağlanmadığının konrol edlmes gerekldr (Colle, 1994). Arıklar en yaygın kullanılan anı yönemlerdr. Eğer uygulanılan model uygunsa arıklar çn çzlen grafklerde beklenlmeyen örünüler oluşmaz. Doğrusal Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/

141 Oulers In Survval Analyss / Alphanumer Journal, 3(2) (2015) 139 152 regresyondak arık değerler en bas halyle ahmn edlen değer le gerçek değer arasındak farkan hesaplanır. Bu durumda grafklern sıfır erafında rasgele saçılımlı olması beklenr (Sepanova & Thomas, 2002). Regresyon verlernde aykırı değerler leraürde arışılan br problemdr. Aykırı değerler değşk nedenlerle oraya çıkablr. Örneğn, kaba (gross) haalardan kaynaklanablr. Bu haalar kopyalama ya da ver grş haaları, haalı ondalık nokalama, çalışmadan elde edlen ölçümler haalı ölçeklendrme, farklı anlamdak k very karışırma, farklı kleden haalı alınan br gözlem, geç ekler ya da donanım yeerszlğ gb haalar olablr. Bu ür haalar, y koşullar alında özel lgyle gözlendklernden yüksek nelkl verlerde nadren raslanır. Hampel v.d. (1986) verlern pk olarak %1-10 oranında bu ür haaya sahp olduklarını belrmşlerdr (Noh, 2010). 2.3. Yaşam Çözümlemesnde Aykırı Değerler Yaşam çözümlemesnde vernn kendne has özellklernden dolayı brçok yazar aykırı değere özel br anlam vermey denemşr. Colle (1994) yaşam çözümlemesnde aykırı değerlern, son deree uzun yaşam süresne sahp brmler olduğunu belrmşr (Colle, 1994). Therneau, Grambsh ve Flemng (1990) ve Nard ve Shemper (1999) aykırı değerler çok erken ölen ya da çok uzun yaşayan brmlerle lşklendrmşlerdr (Therneau vd., 1990; Nard & Shemper, 1999). Nard ve Shemper (1999) daha sonradan yaşam çözümlemesnde aykırı değerler "çok uzun yaşayan" ya da "çok erken ölen" brmler olarak belrmşlerdr (Nard & Shemper, 1999). Yaşam çözümlemes çalışmalarında oplanmış verler aykırı değerler çereblr. Aykırı değerler genellkle modele y uyum sağlamayan değerler olarak anımlanır. Bu aykırı değerler, model ahmnne göre "çok geç" ya da "çok erken" başarısız olan brmler olmasına göre büyük pozf ya da negaf arık değerler alablr. Brmler uzun yaşam süresne sahp olablr ama açıklayıı değşkenlern değerler brmn daha erken ölmes gerekğn gösereblr. Yaşam çözümlemesnde aykırı değerler, modeldek paramere ahmnlern ekleyeblr, ehlke oranını, seçlen model değşreblr ve modele dayanan ahmnler ekleyeblr. Bu aykırı değerler ekl gözlemler olarak anımlanır. Ekl gözlemlere genelde uzun yaşam sürelernde raslanılmakadır. Yaşam çözümlemesnde ver kümesndek ekl gözlemlern ve aykırı değerlern oraya çıkışının araşırılması oldukça önemldr (Noh, 2010). Yaşam çözümlemesnde, başlıa arık ürler; Cox- Snell arıkları, Marngale arıkları, Sapma arıkları, Shoenfeld arıkları, Log-odds arıkları ve Normal sapma arıkları olarak fade edleblr. Aşağıda arık ürlernde kullanılan bazı eşlkler verlmşr: başarısızlık sürelern ve, zamanındak başarısızlık sayılarını gösersn. Brkml emel ehlke oranı ahmn eds; H 0 1 2... D () d exp( Z (s)) R( ) bçmndedr. Burada, ahmn regresyon kasayılarını, Z ler de açıklayıı değşkenler gösermekedr. H ( ) h ( u) d u 0 0 0 d (1) olarak verlr ve bu gözlemlenen başarısızlık sürelernde sıçramalar le br adım fonksyonudur. Burada emel ehlke fonksyonunu gösermekedr. h ( u) 0 2.3.1. Cox-Snell Arıkları Cox-Snell arıkları, yaşam verlernn çözümlenmesnde en yaygın kullanılan arık ürüdür ve Cox ve Snell arafından önerlmşr (Cox & Snell, 1968). Bu arıklar, modeln uygunluğunu değerlendrmek çn kullanılablr.. gözlem çn Cox-Snell arığı, r H ( )exp( ' ) 0 Z bçmndedr. Burada gbdr. H () 0 (2), Eşlk (1) de verldğ Eğer seçlen model verye uygunsa ve β değerler β değerlerne yakınsa ler üsel dağılımlıdır r (Gharbvand & Lao, 2008). Cox-Snell arıkları modele uyumu araşırmak çn çok kullanışlıdır (Tableman & Km, 2004). Cox-Snell arıkları, doğrusal regresyon analznde kullanılan arıklardan braz farklı özellklere sahpr. Sıfır erafında smerk dağılmaz, sıfır le sonsuz arasında değer alır yan negaf olamaz, uygun model uydurulduğunda Cox-Snell arıklarının üsel dağılımlı olduğu varsayıldığından oldukça çarpık br dağılımı vardır ve. arığın oralaması ve vayansı br olur. Dğer br noka se eğer en büyük yaşam süres durdurulmamış se bu gözlem çn anımsızdır (Colle, 1994). 2.3.2. Marngale Arıkları Marngale arıkları, Barlow ve Prene arafından önerlmşr (Barlow & Prene, 1988). r Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/

142 Durdu KARASOY, Nuray TUNCER / Alphanumer Journal, 3(2) (2015) 139 152 Zamana bağlı olmayan açıklayıı değşkenlerle Cox model çn,. gözlemn zamanındak değer ve δ ken durdurma süres ve δ 1 ken olay süres) se Marngale arığı, olay durumu ( δ 0 rm δ H ( )exp( 'Z ) δ r 0 bçmndedr. Eşlk (3) e görüldüğü gb Marngale arıkları Cox- Snell arıklarının doğrusal dönüşümüdür. Marngale arıkları ve dönüşümler model belrlemede kullanılablr. Açıklayıı değşkenlere karşı çzlen Marngale arıkları grafğ modele dahl edlen açıklayıı değşkenlern fonksyonel formunu belrlemede kullanılır. Modeln uygunluğu çn değşkenlern herhang br dönüşüme hyaı olup olmadığını göserr. En uygun bçm belrlemek çn model kuruldukan sonra Marngale arıklarına karşı değşkenlern senlen dönüşümlernn grafğ çzdrlr. Eğer dönüşüm uygun se grafkek eğr yaklaşık olarak doğrusal olur. Ayrıa aykırı değerler belrlemede de kullanılır (Ln & Yng, 1993). Marngale arıkları n rm 0 1 sahpr (Gharbvand & Lao, 2008). Büyük n çn, (3) özellğne rm ler sıfır oralamalı kleden lşksz örneklerdr. Marngale arıkları sıfır erafında smerk dağılmaz, çarpıkır (Colle, 1994; Tableman & Km, 2004). Marngale arıkları ve 1 arasında değer alır ve durdurulmuş gözlemler ( δ 0 ) çn negaf değerldr. Marngale arıkları br değernn yakınlarında değer alıyorsa beklenenden daha kısa yaşam süres, büyük negaf br değer alıyorsa beklenenden daha uzun yaşam süres olduğu anlamına gelr (Colle, 1994). 2.3.3. Sapma Arıkları Sapma arıkları Therneau, Grambh ve Flemng (1990) arafından önerlmşr (Therneau vd., 1990). Sapma arıkları olan ler Marngale arıklarından dönüşürülmüşür ve r d r sgn(r ) 2[ r δ log(δ r )] d m m m (4) bçmndedr. Eşlk (4) e görüldüğü gb, smerk br dağılım elde emek çn Marngale arıklarının dönüşümüyle elde edlr. Sonuç olarak sapma arıkları sıfır erafında smerk dağılır ve yaklaşık olarak 1 sandar sapmaya sahpr (Gharbvand & Lao, 2008; Gharbvand & Fernandez, 2008). ( ) sgn r m Marngale arıklarının şaren gösermekedr. Bu nedenle sapma arıkları Marngale arıkları le aynı şaree sahpr (Noh, 2010). Grafklerde, poansyel aykırı değerler büyük mulak değer sapma arıklarına karşılık gelr. Durdurma yüzde yrm beşen az oranda ya da yakın br değerde se, bu arıklar sıfır erafında smerkr ya da normal dağılıma oldukça yakındır. Yüzde kırkan daha fazla orandak durdurma çn se sıfır erafındak arıklarla genş nokalar kümes normallk yaklaşımını bozar (Therneau vd., 1990; Tableman & Km, 2004). Marngale arıkları model uygun olsa ble çarpıkır ve bu çarpıklık arık grafklernn yorumlanmasını zorlaşırır. Sapma arık grafklernn yorumlanması se daha kolaydır. Böylee bu arıklar dğer arıklardan aşırı dereede farklı olan yaşam sürelerne sahp brmlern belrlenmesnde grafksel br araç olarak kullanılablr. Brçok araşırmaı aykırı değerler belrlemede sapma arık grafklern kullanmışlardır (Noh, 2010). Sapma arıkları beklenenden daha uzun yaşam süres olan gözlemler çn negaf ken beklenenden daha kısa yaşam süres olan gözlemler çn pozfr. Çok büyük ya da çok küçük değerler olması bu değerlern aykırı değer olduklarının göserges olablr. Bu nedenle bu değerler dkkale nelenmeldr (Gharbvand & Fernandez, 2008). Başarısız olan gözlemlerde uyum yeerl se sapma arıkları ak gürülüye benzer bçmde dağılır. Durdurulmuş gözlemler çn se sapma arıkları sıfır yakınlarında küme olarak yer alır (Klen & Moeshberger, 2003). 2.3.4. 2.3.4. Shoenfeld Arıkları Cox oranılı ehlkeler modelnde kullanılan Cox-Snell, Marngale ve sapma arıklarının k dezavanaı söz konusudur. Bu dezavanalar, arıkların ağırlıklı olarak gözlenen yaşam süresne bağlı olmaları ve brkml ehlke fonksyonunun ahmnn gerekrmesdr. Shoenfeld arafından önerlen, skor arıkları olarak da adlandırılan Shoenfeld arıklarında bu sorunlar gderlmşr (Shoenfeld, 1982). Bu yönüyle Shoenfeld arıkları, dğer arıklardan öneml br farklılık gösermekedr. Bu arıklarda, her brmn arığı çn ek br değer yerne, ahmn edlmş olan Cox oranılı ehlkeler modelnde yer alan her br açıklayıı değşken çn brer ane olmak üzere değerler kümes yer almakadır (Colle, 1994; Yay, Çoker & Uysal, 2007). Shoenfeld arıkları, değşkenn gerçek değer le ağırlıklı rsk skorlarının oralaması arasındak farkır.. brm çn Shoenfeld arığı, Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/

143 Oulers In Survval Analyss / Alphanumer Journal, 3(2) (2015) 139 152 S X R ( ) X R ( ) exp( ' X ) exp( ' X ) bçmnde anımlanır. Burada S, p açıklayıı değşken sayısı olmak üzere, px1 boyulu br vekördür ve S ( S,..., S )' 1 p değşken çn Shoenfeld arıkları, S k X k R ( ) X R ( ) bçmndedr. Burada değşken vekörüdür. şeklndedr.. brm ve k. açıklayıı k exp( ' X ) exp( ' X ) X. brm çn p sab açıklayıı X k se. brmn k. açıklayıı değşkenn değerdr. Bu nedenle, bu arık, gözlenen değer le X k nın zamanında rsk alındak brmler üzernden açıklayıı değşken değerlernn ağırlıklı oralaması arasındak farkır. zamanındak rsk kümesnde k. açıklayıı değşkenl. brm çn kullanılan ağırlık, exp( ' X ) R ( ) exp( ' X ) bçmndedr. Bu fade, kısm olablrlğ en büyüklemeye bu brmn kakısıdır. Shoenfeld arıkları durdurulmamış gözlemler çn anımlıdır ve ayrıa her br açıklayıı değşkenn Sohenfeld arıkları oplamı sıfır olmalıdır (Gharbvand & Lao, 2008). Shoenfeld arıkları sıfırda oplanır. İk düzeyl (0,1) değşkenler çn bu arıklar -1 le 1 arasında değer alır. Bu nedenle, arık grafğnde k kuşak olur; br anes x=1 çn sıfırın üsünde ve dğer x=0 çn sıfırın alında yer alır. Oranılı ehlkeler varsayımını nelemek çn Shoenfeld arıklarına dayanan br es gelşrlmşr. Belrl br değşken çn Shoenfeld arıkları le brmlern yaşam sürelernn rankı arasındak korelasyon kullanılarak oranılı ehlkeler varsayımı neleneblr. Bu ese göre, oranılı ehlkeler varsayımının sağlanması çn korelasyonun sıfıra yakın olması beklenmekedr (Aa vd., 2007). Oranılı ehlkeler varsayımının geçerllğ zamana bağlı çzlen Shoenfeld arıkları grafğ le de konrol edleblr. Çzlen Shoenfeld arıkları grafğ, yaay br doğru erafında seyredyorsa, oranılı ehlkeler varsayımının sağlandığı söylenlr (Shoenfeld, 1982). Hosmer ve Lemeshow regresyon kasayılarının kovaryans marsne dayalı ölçeklendrlmş Shoenfeld (saled Shoenfeld) arıkları grafğnn oranılı ehlkeler varsayımı çn kullanılmasını önermşr (Hosmer & Lemeshow, 1999). Ölçeklendrlmş Shoenfeld arıkları; r m V S * k p 1 k k bçmndedr. Burada m oplam başarısız brm sayısını, V se regresyon kasayılarından ahmn edlmş kovaryans marsn gösermekedr. Ölçeklendrlmş Shoenfeld arıkları grafğ zamana karşı her br açıklayıı değşken çn çzlr. Ölçeklendrlmş Shoenfeld arıkları ekl gözlemler bulmak çn kullanılır. Açıklayıı değşkenler sürekl olduğunda ölçeklenmş Shoenfeld arıklarının kullanılması önerlmşr (Terz & Bek, 2005; Wnne & Msellanea, 2001). 2.3.5. Log-Odds Arıkları Log-odds arıkları, Nard ve Shemper (1999) arafından verlmş ve le göserlmşr (Nard & Shemper, 1999). Log-odds arıklarının dağılımı oralama ve varyans le losk dağılımdır ve EL ( ) 0 L V L L log S ( T )/ 1- S( T ) 2 ( ) ( / 3) bçmndedr. Blnmeyen yaşam fonksyonu yerne ahmn eds alındığında, ye yakınsar. Gözlenen yaşam süreler (1 n) olduğunda, nn gözlenen değer, L l log ( )/ 1- ( ) S S olur. Durdurulmuş süre çn L S L yaşam olasılığı blnmemekedr. Dolayısıyla durdurulmuş yaşam süres arıklarını uyarlamak çn, değer durumda S( ) 2 m l S ( ) le koşullu orana nn yer değşrmes önerlmşr. Bu log-odds arık değerler, Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/

144 Durdu KARASOY, Nuray TUNCER / Alphanumer Journal, 3(2) (2015) 139 152 l log S / 2- S bçmnde elde edlr. L nn koşullu dağılımından beklenen oralama değerlern sapması kullanıldığında se daha karmaşık olmaka ve m l l l 1 exp( l ) log 1 exp( ) l exp( ) bçmnde elde edlmekedr. Son deree kısa yaşam süreler çn ) sıfıra yakın olur ve beklenen varsayılır. S m l 0.5 ( ya da l olduğu Log-odds arıkları losk dağılımlı olduklarından aykırı değerler bu dağılımlara dayanan kesm nokası le belrleneblr. Kesm nokaları çok erken ölen =ÇEÖ ve çok uzun yaşayan =ÇUY le göserlrse log-odds arıkları çn kesm nokaları, RÇEÖ,L l :l w1 RÇUY,L l :l w bçmndedr. Burada w losk dağılımda güven düzeyne karşılık gelen nokadır. Eğer brmlern arık değerler kesm nokalarını aşarsa bu gözlemler aykırı değerler olur (Nard & Shemper, 1999; Nard & Shemper, 2003). 2.3.5. Normal Sapma Arıkları Normal sapma arıkları Nard ve Shemper (1999) arafından verlmş ve N le fade edlmşr (Nard & Shemper, 1999). Arıkların dağılımı sandar normal dağılımdır. Blnmeyen yaşam fonksyonu yerne ahmn eds alındığında nn olasılıka yakınsaması dr., N normal brkml dağılım fonksyonudur. Böylee, N 1 S ( T ) ve arık değerler 1 ( ) n S N bçmndedr. Burada durdurulmuş süreler çn yaşam olasılığı blnmemekedr. Durdurulmuş yaşam sürelernn arıklarının uyarlanması (aommodang) çn çeşl yollar vardır. Gerçek yaşam süres, gözlenen durdurulmuş yaşam süresnden daha uzundur ve blnmeyen doğru arıkların dağılımı S ( T) nn [ le lşkldr. Böylee, S çn n 2 N, 0, S S S ] de unform dağılımı, koşullu orana değer le yer değşrr. Sonuç olarak durdurulmuş süre S 1 2 bçmndedr ve burada oralamasıdır ya da n m n 2 exp(0.5( n ) ) 2 S( ) le değşrlmş olablr. Burada N, durdurulmuş süre m n N nn,durdurulmuş süre nn oranasıdır (Nard & Shemper, 1999; Nard & Shemper, 2003). Durdurulmuş gözlemler çn normal sapma arıkları koşullu oralama ya da orana değeryle yer değşrr. Anak bu durum arıkların anormal br yığılma gösermesne neden olur. Böylee y uyum sağlayan model ble normal dağılımdan farklı br dağılım göserr (Nard & Shemper, 2003). Log-odds arıklarında olduğu gb normal sapma m arıklarında da son deree kısa yaşam süreler çn n (ya da n ) sıfıra yakın olur ve beklenen olduğu varsayılır (Nard & Shemper, 1999). 0.5 S Normal sapma arıkları normal dağılımlı olduklarından aykırı değerler bu dağılımlara dayanan kesm nokası le belrleneblr. Normal sapma arıklarının kesm nokaları, RÇEÖ, N n : n z1 RÇUY, N n : n z Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/

145 Oulers In Survval Analyss / Alphanumer Journal, 3(2) (2015) 139 152 z bçmndedr. Burada sandar normal dağılımda güven düzeyne karşılık gelen nokadır. Aynı referans dağılıma sahp olduklarından benzer kesm nokaları sapma arıkları çn de kullanılablr (Nard & Shemper, 1999; Nard & Shemper, 2003). 2.4. Ekl Gözlemlern Belrlenmes Cox oranılı ehlkeler modelnde aykırı değerler üç madde alında neleneblr: Örneklem oralamasından büyük oranda farklı br açıklayıı değşken değerne sahp olanlar, Paramere ahmnlernde güçlü ekye sahp olanlar, Kısm olablrlk fonksyon değernde ve böylee model yeerlğnde güçlü ekye sahp olanlar. İlk madde skor arıkları kullanılarak belrleneblr. Model kesrmnden sonra, her gözlem çn skor arıkları lgl açıklayıı değşken bakımından hesaplanır ve analz edlen orak değşkene karşı arıkların değerlern göseren br grafk çzlr. Aykırı değerler bu p analzlerle kolaylıkla belrleneblr. Aykırı değerlern belrlenmesnden sonrak aşama şüphel gözlemlern paramere ahmnlerndek eklernn şddenn ahmn edlmesdr. Şüphel gözlem örneklem dışında bırakılarak model yenden ahmn edlr. Paramere ahmnndek değşm, k k k ( ) bçmnde hesaplanır. Burada k, k. açıklayıı değşkenn modeln üm örneklemdek paramere kesrmdr ve k ( ) se. gözlem çıkarıldıkan sonra hesaplanan örneklemdek benzer br değerdr. k. elemanının vekörü le y yaklaşırılmış olduğu kanılanmışır ve V( ) L bçmndedr. Burada V( ) L. gözlem çn skor arıkları vekörü ve paramere ahmnlernn br varyanskovaryans marsdr. Bu anım ölçeklendrlmş skor arıkları yada DFBETA arıkları olarak adlandırılır. Analz edlen açıklayıı değşkene karşı bu p arıkların grafğ ekl gözlemlern sapanmasında yararlıdır. Eğer bu fark sıfıra yakın se. gözlemn ahmndek eks çok küçükür. Asıl modeldek üm değşkenler çn bu süreç ekrarlanır. N gözleml büyük ver seler çn bu farkları hesaplamak yan bu şlem N kez ekrarlamak prak br yönem değldr. Bu gözlemlern kısm olablrlk fonksyonu değerndek eklern ahmn emek çn skor arıkları, ld V LV V V L LV L 1 ' 1 ' ' ( ) ( ) ( ) ( ) ( ) bçmndedr. Bu saskler, olablrlk değşm (lkelhood dsplaemen) olarak adlandırılır ve örneklemdek. gözlemn örneklem dışında bırakılmasından sonra kısm olablrlk fonksyonunun logarmasındak değşklk le lglenr. Olablrlk değşm değerler. gözlemn eksn bu gözlem çıkarıldığında log olablrlk modelndek değşm yaklaşımıyla hesaplar.. değşken çn olablrlk değşm değer, 2 log L ( ) log L ( ) bçmndedr. Burada üm model çn hesaplanan ahmn ve β. gözlem çıkarıldıkan sonra hesaplanan ahmn değern göserr. L(.) üm verden ahmn edlen kısmı olablrlk değerdr. L(.) hesaplanırken üm ver kullanılır ama β paramere ahmnler. gözlem β çıkarılarak elde edlr. uygun br çözüm verr ve olablrlk değşm hçbr zaman negaf değldr. Ayrıa LV ( ) L ' mars çn özdeğerler bulunur. Yüksek özdeğerler le lşkl özdeğerler LMAX saskler olarak adlandırılır. Olablrlk değşm de LMAX da öze sasklere (örneğn Marngale arıkları) karşı çzlr. Yüksek dereede ekl gözlemler bu arz grafklerle kolaya belrleneblr. Ekl gözlemlern belrlenmesnde kullanılan k alernaf yönem LMAX ve olablrlk değşm değerler, DFBETA değerlernn aksne gözlemlern eksn büün olarak kasayılar veköründen ölçer. Böylee çok değşkene karşı sadee ek br değer elde edlr. Arıkların kullanımı verye ve araşırmaıya bağlı olsa da geleneksel ve avsye edlen kullanım şekller vardır. Bunlar; Cox-Snell arıkları modele uyumu araşırmak çn kullanılır. Marngale arıkları modele dahl edlen açıklayıı değşkenlern fonksyonel formunu belrlemede ve bazen de aykırı değerler belrlemede kullanılır. Sapma arıkları modeln doğruluğunu es emede ve aykırı değerler belrlemede kullanılır. Shoenfeld ve ölçeklendrlmş Shoenfeld arıkları oranılı ehlkeler varsayımının konrolünde kullanılır. Normal sapma ve log-odds arıkları aykırı değerler belrlemede kullanılır. Olablrlk değşm ve Lmax değerler ekl gözlemler belrlemede kullanılır. DFBETA değerler Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/

146 Durdu KARASOY, Nuray TUNCER / Alphanumer Journal, 3(2) (2015) 139 152 de ekl gözlemler belrlemede kullanılır anak şlemler değşkenler bazında eker eker yapar. 3. UYGULAMA Ankara Onkolo Hasanes nde Oak 1990 ve Kasım 1995 arhler arasında mde kanser anısı konulan ve errah edav geçren, yaşları 29 le 84 arasında değşen 118 hasaya a verler Eroğlu v.d. arafından nelenmş ve Kaplan-Meer yönemyle yaşam olasılıkları bulunmuş, Cox oranılı ehlkeler model elde edlmşr (Eroğlu, Alınok, Özgen & Serkaya, 1997). Bu çalışmada se bu verler, yaşam çözümlemesnde aykırı değerler belrlemede kullanılan arık ürlernn uygulama alanlarını gösermek ve elde edlen sonuçları karşılaşırablmek amaıyla kullanılmışır. Analzler çn STATA 12 programı deneme sürümü kullanılmışır. Açıklayıı değşkenler olarak yaş, nsye, klo kaybı, anem, ümörün mdedek lokalzasyonu, lenf nodu dseksyonunun genşlğ, hasalığın evres ve aduvan kemoerap alınmışır. Bu hasaların yaş oralaması 56.70 dr ve %58.5 erkekr. Hasaların %55.1 hasalığın 3. evresnde ve %19.5 4. evresndedr. Hasaların %71.2 s kemoerap almışır. Hasaların 52 anesnde başarısızlık gözlenmşr. Başarısızlık, ölüm olarak alınmışır. Açıklayıı değşkenlern düzeyler ve sıklıkları Çzelge 1 de verlmşr. Değşkenler Cnsye Çzelge 1. Açıklayıı değşkenler ve düzeyler Düzeyler Sıklıklar (%) 1. Erkek 69 (58.5) 2. Kadın 49 (41.5) Klo Kaybı 1. Yok 90 (76.3) 2. Var 28 (23.7) Anem 1. Yok 31 (26.3) 2. Var 87 (73.7) Lenf nodu dseksyonunun genşlğ (Dseksyon) Tümörün mdedek lokalzasyonu (Lokal) Hasalığın evres (Evre) 1. D0-1 62 (52.5) 2. D2-3 56 (47.5) 1. Üs üçlük 21 (17.8) 2. Ora üçlük 25 (21.2) 3. Al üçlük 62 (52.5) 4. Tüm mde 10 (8.5) 1. Evre1+Evre2 30 (25.4) 2. Evre3 65 (55.1) 3. Evre4 23 (19.5) Aduvan kemoerap (Kemoerap) 1.Yok 34 (28.8) 2. Var 84 (71.2) Yaş 56,403 ±1,044 Yaşam süresne değşkenlern eks araşırılmak senldğnde Cox oranılı ehlkeler modelnn kullanılablmes çn değşkenlern oranılı ehlkeler varsayımını sağlaması gerekmekedr. Oranılı ehlkeler varsayımın sağlanıp sağlanmadığı araşırılmışır. Oranılı ehlkeler varsayımını nelemek çn Shoenfeld arıkları kullanılablr. Shoenfeld arıkları, açıklayıı değşkenn gerçek değer le ağırlıklı rsk skorlarının oralaması arasındak farkır. Süreye karşı çzdrlen grafke eğr sıfır erafında yaklaşık olarak doğrusal se varsayımın sağlandığı sonuuna ulaşılır. Şekl 1. Açıklayıı değşkenler çn ölçeklendrlmş Shoenfeld arığı grafkler Şekl 1 nelendğnde grafklerde eğrnn yaklaşık olarak doğrusal olduğu yan değşkenlern oranılı ehlkeler varsayımını sağladığı görülmekedr. Oranılı ehlkeler varsayımını nelenmek çn kullanılan dğer br yönem olan, yaşam süres rankının Shoenfeld arıkları le lşks de nelenmşr. Çzelge 2 nelendğnde üm değşken düzeylernde p-değer>0.05 olduğu çn oranılı ehlkeler varsayımının sağlandığı görülmüşür. Çzelge 2. Yaşam süres rankının Shoenfeld arıkları le lşks Değşken p-değer Yaş 0,21 Cnsye- Erkek 0,6 Klo kaybı- Yok 0,21 Anem- Yok 0,55 Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/

147 Oulers In Survval Analyss / Alphanumer Journal, 3(2) (2015) 139 152 Brkml Tehlke Brkml Tehlke Brkml Tehlke Değşken p-değer Dseksyon- D0-1 0,09 Lokalzasyon-Ora Üçlük 0,37 Lokalzasyon-Al Üçlük 0,79 Lokalzasyon-Tüm mde 0,81 Evre- Evre3 0,08 Evre- Evre4 0,19 Kemoerap- Yok 0,28 Cox-Snell arıkları modele uyumu araşırmak çn kullanılıır. Verlern dağılımı Easyf programı le nelendğnde blnen br dağılıma uygunluk gösermese de paramerk br dağılım göserdğ görülmüşür. Bu nedenle, paramerk yaşam çözümlemes dağılımlarının uygunluğu da Cox oranılı ehlkeler model le brlke Cox-Snell arıkları grafkler le nelenmşr. a. ÜSTEL DAĞILIM 0.5 1 1.5 2 H b. WEİBULL DAĞILIMI H. LOG-LOJİSTİK DAĞILIM Brkml Tehlke Brkml Tehlke Brkml Tehlke d. LOG-NORMAL DAĞILIM H e. GAMMA DAĞILIMI H H Şekl 2. a-e. Paramerk modeller çn ve Cox oranılı ehlkeler model çn Cox-Snell arığı grafkler Model uygun se brkml ehlkeye karşı Cox-Snell arığı grafğ yaklaşık olarak br eğml br doğru olaakır. Şekl 2 nelendğnde log-losk modeln ve log-normal modeln daha y sonuç verdğ söyleneblr. Bu durumda Akake blg krerne (AIC) göre karar verlmeldr. Modellere a AIC değerler Çzelge 3 e verlmşr. H Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/

148 Durdu KARASOY, Nuray TUNCER / Alphanumer Journal, 3(2) (2015) 139 152 Çzelge 3. Modellern karşılaşırılması Model -2log(L) AIC Cox Oranılı Tehlkeler 385.364 418.36 Üsel 190.56 214.56 Webull 174.20 200.20 Log-normal 170.98 196.98 Log-losk 172.26 198.26 Genelleşrlmş Gamma 170.84 198.84 Çzelge 3 nelendğnde AIC krerne göre log-normal modeln verye en uygun olduğu sonuuna ulaşılmışır. Bu nedenle verye log-normal regresyon model uygulanmış ve elde edlen sonuçlar Çzelge 4 de verlmşr. Çzelge 4. Log-normal regresyon modelnn sonuçları Değşken Tahmn Sandar Haa p-değer Yaş 0,0139 0,0084 0,096 Cnsye- Erkek -0,106 0,2105 0,616 Klo kaybı- Yok -0,212 0,2253 0,347 Anem- Yok -0,028 0,2368 0,907 Dseksyon- D0-1 -0,723 0,2099 0,001* Lokalzasyon- Ora Üçlük -0,853 0,3169 0,007* Lokalzasyon- Al Üçlük -0,482 0,2859 0,092 Lokalzasyon- Tüm mde -0,705 0,3791 0,063 Evre- Evre3-1,262 0,2951 0,000* Evre- Evre4-1,835 0,3457 0,000* Kemoerap- Yok -0,835 0,212 0,000* Sab 5,0182 0,6803 0,000* Lnsgma -0,23 0,1021 0,024* Sgma 0,7947 0,0811-2log(L) 170,995 (p=11) *p-değer<0.05 olduğundan anlamlıdır. Log-normal model çn Marngale, sapma, log-odds ve normal sapma arık değerler hesaplanarak aykırı değerler esp emek amaçlanmışır. Marngale arıkları modele dahl edlen açıklayıı değşkenlern fonksyonel formunu belrlemede kullanışlıdır. Eğer değşken modele uygun se grafkek eğr yaklaşık olarak doğrusal olur. Log-normal regresyon modelnde yaş değşken çn Marngale arığı grafğ Şekl 3 e verlmşr. Marngale Arığı Marngale Arığı -3-2 -1 0 1 30 40 50 60 70 80 Yaş Şekl 3. Log-normal regresyon modelnde yaş değşken çn Marngale arığı grafğ Şekl 3 nelendğnde eğrnn yaklaşık olarak doğru olduğu yan yaş değşkenn modele uygun olduğu, br dönüşüme hyaç olmadığı görülür. Marngale arıklarına karşı doğrusal ahmn grafğ aykırı değerler belrlemede kullanılablr. Log-normal regresyon modelnde doğrusal ahmne karşı Marngale arığı grafğ Şekl 4 e verlmşr. -3-2 -1 0 1 47 59 29 11 82 886 87 118 15 819 71 63 6657 112 52 80 79 89 69 610 42 67 9 50 51 39 85 115 74 22 73 18 41 75 60 37 20 33 114 31 30 4 24 53 107 106 110 99 2 35 81 90 98 3 1 5 14 78 84 86 95 103 109 83 93 105 9192104 43 100 108 56 68 76 96 49 58 54 70 7 45 111 2534 27 97 64 23 1013294 7712 13 11340 55 48 44 46 72 116 26 117 16 28 Şekl 4. Log-normal regresyon modelnde doğrusal ahne karşı Marngale arığı grafğ Şekl 4 nelendğnde 16., 21., 29. ve 28. gözlemlern aykırı değerler olableekler görülür. Smerk br dağılım gösermesnden dolayı sapma arıklarının doğrusal ahmne karşı grafkler aykırı gözlemlern belrlenmesnde ve modele uyumun sağlanmasında kullanımı daha yaygındır. Log-normal modelde doğrusal ahmne karşı sapma arığı grafğ Şekl 5 e verlmşr. 21 62 17 102 38 36 65 1 2 3 4 5 6 Doğrusal Tahmn Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/

149 Oulers In Survval Analyss / Alphanumer Journal, 3(2) (2015) 139 152 Sapma Arığı -2 0 2 47 59 29 87 15 118 8 6 19 11 82 88 112 71 63 6657 52 80 89 10 9 79 69 6142 67 85 50 39 51 74 22 115 73 18 41 75 60 37 20 33 24 53 31 30 104 114 110 54 99103 109 105 111 107 106 4 98 2 35919281 78 13 40 90 9593 83 3 1 1476 43 56 100108 84 86 96 568 49 46 70 58 7 45 26 97 64 2534 27 101 23 117 3294 113 7712 55 48 44 72 116 16 28 21 62 17 102 36 65 38 1 2 3 4 5 6 Doğrusal Tahmn Şekl 5 nelendğnde 6., 8., 15., 16., 19., 21., 28., 29., 87.,118. ve 128. gözlemlern aykırı değerler olableeğ görülür. Sapma arıklarının referans dağılımı olan normal dağılımın kesm nokalarına göre karşılaşırılma yapıldığında da aynı sonua ulaşılır. Tüm değşkenler çn log-odds ve normal sapma arıkları hesaplanmış ve hesaplanan değerler kesm nokalarıyla karşılaşırıldığında bu değerlern dışında kalan gözlemler aykırı değer olarak belrlenmşr. Buna göre bulunan aykırı değerler Çzelge 5 de verlmşr. Şekl 5. Log-normal regresyon modelnde doğrusal ahmne karşı sapma arığı grafğ Gözlem Süre Durum Çzelge 5. Log-normal regresyon modelnde log-odds ve normal sapma arık değerler S 11 3 Ölmüş 0,983 1,763 1,763 2,121 2,121 S 16 39 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 17 51 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 23 69 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 25 57 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 27 63 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 28 58 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 29 2 Ölmüş 0,991-2,068 2,068 2,387 2,387 34 65 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 38 37 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 45 44 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 48 44 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 49 44 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 55 39 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 56 37 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 58 36 Yaşıyor - 0,2123-0,569-1,108-0,798-2,584 62 34 Yaşıyor - 0,2256-0,536-1,078-0,753-2,349 64 33 Yaşıyor - 0,2256-0,536-1,078-0,753-2,349 65 33 Yaşıyor - 0,2256-0,536-1,078-0,753-2,349 68 29 Yaşıyor - 0,2256-0,536-1,078-0,753-2,349 70 29 Yaşıyor - 0,2256-0,536-1,078-0,753-2,349 116 73 Yaşıyor - 0,1982-0,607-1,143-0,848-2,884 l m l n m n Çzelge 5 nelendğnde log-odds arık değerlerne göre aykırı değer bulunamadığını ve normal sapma arık değerlerne göre se 11., 16., 17., 23., 25., 27., 28., 29., 34., 38., 45., 48., 49., 55., 56., 58., 62., 64., 65., 68., 70. ve 80. gözlemlern aykırı değer olableeğ görülür. Yönemlere orak çıkan değerler aykırı değerler olarak belrsek 16., 28. ve 29. gözlemler aykırı değerdr. Bu değerler çalışmadan çıkarılıp log-normal regresyon model yenden elde edlmş ve sonuçlar Çzelge 6 da verlmşr. Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/

150 Durdu KARASOY, Nuray TUNCER / Alphanumer Journal, 3(2) (2015) 139 152 Çzelge 6. Aykırı değerler çıkarıldıkan sonra log-normal regresyon model sonuçları Değşken Tahmn Sandar Haa p-değer Yaş 0,0113 0,0075 0,130 Cnsye- Erkek 0,0250 0,1948 0,898 Klo kaybı- Yok -0,2218 0,2038 0,285 Anem- Yok 0,1483 0,2217 0,503 Dseksyon- D0-1 -0,7043 0,1913 0,000* Lokalzasyon- Ora Üçlük -0,6854 0,2871 0,017* Lokalzasyon- Al Üçlük -0,2456 0,2618 0,348 Lokalzasyon- Tüm mde -0,4317 0,3453 0,211 Evre- Evre3-1,2598 0,2704 0,000* Evre- Evre4-1,7469 0,3136 0,000* Kemoerap- Yok -0,7758 0,1965 0,000* Sab 4,7470 0,6141 0,000* Lnsgma -0,3389 0,1024 0,001* Sgma 0,7126 0,0730-2log(L) 153,102 (p=11) *p-değer< 0.05 olduğundan anlamlıdır. Çzelge 4 ve Çzelge 6 nelendğnde, aykırı değerler çıkarıldıkan sonra kurulan log-normal regresyon model le bu değerler çıkarılmadan önek log-normal regresyon model karşılaşırıldığında sandar haaların genel olarak azaldığı görülmüşür. İk model eş paramere sayısına sahp olduğu çn -2log(L) değerler kullanılarak karşılaşırma yapılablr. Aykırı değer çıkarılmadan önek modeln -2log(L) değer 170,995 ken çıkarıldıkan sonrak modeln -2log(L) değer Çzelge 6 dan görüldüğü gb 153,102 dr. Buna göre aykırı değerlern çıkarılması sonuunda elde edlen modeln daha uygun br model olduğu söyleneblr. Log-normal model çn adımsal seçm yönem uygulanırsa Çzelge 7 dek sonuçlar elde edlr. Çzelge7. Log-normal regresyon model çn adımsal seçm yönem sonuçları Değşken Tahmn Sandar Haa p-değer Dssek1 (D0-1) -0,718 0,211 0,001 Evre3-1,251 0,276 0,000 Evre4-1,632 0,327 0,000 Kemoerap Yok -0,779 0,214 0,000 sab 4,994 0,318 0,000 Lnsgma -0,170 0,102 0,096 Sgma 0,843 0,863-2log(L) 183,184 Çzelge 7 nelendğnde dseksyon, evre ve kemoerap değşkenler yaşam süresn ekleyen fakörler olarak bulunmuşur. Lenf nodu dseksyonunun değer D0-1 olanların yaşam süres D2-3 olanlara göre 2 (1/exp(- 0,718)) ka daha kısa, evre 3 olanların evre 1+evre 2 olanlara göre yaşam süres 3,5 (1/exp(-1,251)) ka, evre 4 olanların evre 1+evre 2 olanlara göre yaşam süres 5 (1/exp(-1,632)) ka daha kısadır. Kemoerap almayanların yaşam süres se alanlara göre 2 (1/exp(- 0,779)) ka daha kısadır. 4. SONUÇLAR Bu çalışmada, yaşam çözümlemes ve aykırı değerler hakkında genel blgler, kavramlar, fonksyonlar ve modeller verlmş, yaşam çözümlemesnde aykırı değerler belrlemede kullanılableek yönemler nelenmşr. Aykırı değerlern belrlenmes modele uyum çn oldukça önemldr ve yaşam çözümlemesnde aykırı değerler belrleme yönemler arıklara dolayısıyla arıkların analzne dayanmakadır. Bu amaçla leraürde karşılaşılan arık ürler nelenmşr. Bu yönemlern uygulaması 118 gözleml ve 8 açıklayıı değşkenl mde kanser vers üzernde yapılmışır. Uygulamada lk olarak yaşam çözümlemesnde en çok kullanılan model olan Cox oranılı ehlkeler model uygulanmış ve modele uyumlu olduğu görülmüşür. Cox oranılı ehlkeler modelnn emel varsayımı olan oranılı ehlkeler varsayımı da Shoenfeld arıkları le nelenmş ve bu varsayımın sağlandığı görülmüşür. Verlern dağılımı blnen br dağılıma uygunluk gösermese de paramerk br dağılım göserdğ görüldüğünden paramerk yaşam çözümlemes modeller nelendğnde log-normal dağılımın verye uygun br model olduğu sonuuna ulaşılmışır. Verye uygun olduğu bulunan log-normal regresyon model elde edlmşr. Log-normal regresyon model çn de aykırı değerler belrlenmeye çalışılmışır. Aykırı değerler belrlemek çn Marngale, sapma, log-odds ve normal sapma arıkları hesaplanmış ve grafkler çzdrlmşr. Aykırı değer olableek gözlemler esp edlmşr. Marngale arıkları smerk dağılmadığından grafklernn yorumlanması zordur. Ama sapma arıkları smerkr ve referans dağılımı normal dağılım olduğundan anlamlılık düzeyne göre kesm nokası yaklaşık olarak 2 belrlenp sapma arık grafğnde +2 ve - 2 değerlernn dışındak gözlemlern aykırı değerler olableekler sonuuna ulaşılmışır. Aynı referans dağılımına sahp normal sapma arıkları çn de kesm nokası aynı alınmış ve benzer yorumlara ulaşılmışır. Log-odds arıkları nelendğnde se aykırı değerler olableek gözlemler bulunamamışır. Aykırı değer olableeğ düşünülen üç gözlem çalışmadan çıkarılıp model yenden kurulmuş ve aykırı değerler çıkarıldıkan sonra elde edlen modeln daha y olduğu görülmüşür. Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/

151 Oulers In Survval Analyss / Alphanumer Journal, 3(2) (2015) 139 152 Referenes Aa, N., Serkaya, D., Sözer, M.T., (2007). Oranılı Tehlke Varsayımının İnelenmesnde Kullanılan Yönemler ve Br Uygulama, Eskşehr Osmangaz Ünverses Mühendslk Mmarlık Faküles Dergs, XX, S.1. Barlow,W. E., Prene, R. L., (1988). Resduals for relave rsk regresson, Bomerka, 75, 65 74. Colle, D., (1994). Modellng Survval Daa n Medal Researh, Chapman &Hall/CRC. Cox, D. R., Snell, E. J., (1968). A General Defnon of Resduals, Journal of he Royal Sasal Soey, 30, 2, 248-275. Cox, D.R., Oakes, D., (1984). Analyss of Survval Daa, Chapman and Hall, London. Eland-Johnson, R. C., Johnson, N. L., (1980). Survval Models and Daa Analyss, John Wley& Sons, In, New York. Eroğlu, A., Alınok, M., Özgen, K., Serkaya, D., (1997). A Mulvarae Analyss of Clnal and Pahologal Varables n Survval Afer Reseon of Gasr Caner, Türkye Klnkler Medal Researh, 15, 1, 15-20. Frano, A., Jn, R. L. T., (2013). Several Types of Resduals n Cox Regresson Model: An Empral Sudy, Inernaonal Journal of Mahemaal Analyss, 7,73, 2645-2654. Flemmng, T. R., Harrngon, D. P., (1991). Coung Proesses and Survval Analyss, Wley, New York. Gharbvand, L. and Fernandez, G., (2008). Advaned Sasal and Graphal Feaures of SAS PHREG, SAS GLOBAL Forum 2008 Conferene proeedngs San Anono TX. Gharbvand, L., Jeske, D.R., Lao, S., (2008). Evaluaon of a Hospe Care Referral Program Usng Cox Proporonal Hazards Model, Wesern Users of SAS Sofware Conferene, Unversal Cy, CA. Hosmer, D. W., Lemeshow, S., (1999). Appled Survval Analyss: Regresson Modelng of Tme o Even Daa, Wley&Sons, New York. Klen, J. P., Moeshberger, M. L., (2003). Survval Analyss: Tehnques for Censored and Trunaed Daa., Sprnger, New York. Klenbaum,D.G., Klen,M., (2005). Survval analyss: A Self-Learnng Tex, Seond Edon, Sprnger. Kul, S., (2010) The Use of Survval Analyss for Clnal Pahways, Inernaonal Journal of Care Pahways,14, 23 26. Ln, D. Y., We, L. J., Yng, Z., (1993). Chekng he Cox Model wh Cumulave Sums of Marngale-Based Resduals, Bomerka, 80, 3, 557-572. Nard, A., Shemper, M., (1999). New Resduals for Cox Regresson and Ther Applaon o Ouler Sreenng, Bomers, 55, 2, 523-529. Nard, A., Shemper, M., (2003). Comparng Cox and Paramer Models n Clnal Sudes, Sass n Medne, 22, 3597-3610. Noh, N. A., (2010). Deeng Oulers and Influenal Observaons n Survval Model, Maser Thess, Unversy of Malaya, Insue of Mahemaal Senes, Kuala Lumpur. Shoenfeld, D., (1982). Paral Resduals for he Proporonal Hazards Regresson Model, Bomerka, 69, 239-241. Sepanova, M., Thomas, L., (2002). Survval Analyss Mehods for Personal Loan Daa, Operaons Researh, 50, 2, 277-289. Tableman, M., Km, J.S., (2004). Survval Analyss Usng S: Analyss of Tme-o-Even Daa, Chapman & Hall/CRC. Terz, Y., Cengz, M.A., Bek, Y., (2005). Cox Regresyon Modelnde Oransal Hazard Varsayımının Arıklarla İnelenmes ve Akğer Kanser Hasaları Üzernde Uygulanması, Türkye Klnkler Tıp Blmler Dergs, 25, 770-775. Therneau, T. M., Grambsh, P. M., Flemng, T. R., (1990). Marngalebased Resduals for Survval Models, Bomerka, 77, 1, 147-160. Therneau, T. M., Grambsh, P. M., (2000). Modelng Survval Daa: Exendng Cox Model, Sprnger, New York. Wnne, A, Sasen, P., Msellanea: (2001). A Noe on Saled Shoenfeld Resduals for he Proporonal Hazards Model, Bomerka, 88, 565-71. Yay, M., Çoker, E., Uysal, Ö., (2007). Yaşam Analznde Cox Regresyon Model ve Arıkların İnelenmes, Cerrahpaşa Tıp Dergs, 38, 139 145. Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/

152 Durdu KARASOY, Nuray TUNCER / Alphanumer Journal, 3(2) (2015) 139 152 Alphanumer Journal The Journal of Operaons Researh, Sass, Eonomers and Managemen Informaon Sysems h://www.alphanumerournal.om/