YAŞAM ÇÖZÜMLEMESİNDE AYKIRI DEĞERLER OUTLIERS IN SURVIVAL ANALYSIS



Benzer belgeler
ÇOKLU REGRESYON MODELİ, ANOVA TABLOSU, MATRİSLERLE REGRESYON ÇÖZÜMLEMESİ,REGRES-YON KATSAYILARININ YORUMU

alphanumeric journal The Journal of Operations Research, Statistics, Econometrics and Management Information Systems

PARÇALI DOĞRUSAL REGRESYON

Korelasyon ve Regresyon

BÖLÜM 5 İKİ VEYA DAHA YÜKSEK BOYUTLU RASGELE DEĞİŞKENLER İki Boyutlu Rasgele Değişkenler

Sıklık Tabloları ve Tek Değişkenli Grafikler

HAFTA 13. kadın profesörlerin ortalama maaşı E( Y D 1) erkek profesörlerin ortalama maaşı. Kestirim denklemi D : t :

Kİ-KARE TESTLERİ. şeklinde karesi alındığında, Z i. değerlerinin dağılımı ki-kare dağılımına dönüşür.

Kİ KARE ANALİZİ. Doç. Dr. Mehmet AKSARAYLI Ki-Kare Analizleri

Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ

Doğrusal Korelasyon ve Regresyon

UYUM ĐYĐLĐĞĐ TESTĐ. 2 -n olup. nin dağılımı χ dir ve sd = (k-1-p) dir. Burada k = sınıf sayısı, p = tahmin edilen parametre sayısıdır.

Sürekli Olasılık Dağılım (Birikimli- Kümülatif)Fonksiyonu. Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK

YAŞAM ÇÖZÜMLEMESİNDE ZAYIFLIK MODELLERİ FRAILTY MODELS IN SURVIVAL ANALYSIS

NİTEL TERCİH MODELLERİ

kadar ( i. kaynağın gölge fiyatı kadar) olmalıdır.

dir. Bir başka deyişle bir olayın olasılığı, uygun sonuçların sayısının örnek uzaydaki tüm sonuçların sayısına oranıdır.

DENEY 4: SERİ VE PARALEL DEVRELER,VOLTAJ VE AKIM BÖLÜCÜ KURALLARI, KIRCHOFF KANUNLARI

EKONOMETRİYE GİRİŞ II ÖDEV 4 ÇÖZÜM

Merkezi Eğilim (Yer) Ölçüleri

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ÇOKLU İÇ İLİŞKİ VE EKOLOJİK REGRESYON İSTATİSTİK ANABİLİM DALI

TEKNOLOJĐK ARAŞTIRMALAR

Farklı Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = s 2 Eşit Varyans

PARAMETRİK OLMAYAN HİPOTEZ TESTLERİ. χ 2 Kİ- KARE TESTLERİ. Doç.Dr. Ali Kemal ŞEHİRLİOĞLU Araş.Gör. Efe SARIBAY

İki veri setinin yapısının karşılaştırılması

BÖLÜM 1 1.GİRİŞ: İSTATİSTİKSEL DOĞRUSAL MODELLER

SEK Yönteminin Güvenilirliği Sayısal Bir Örnek. Ekonometri 1 Konu 11 Sürüm 2,0 (Ekim 2011)

X, R, p, np, c, u ve diğer kontrol diyagramları istatistiksel kalite kontrol diyagramlarının

PARAMETRİK OLMAYAN HİPOTEZ TESTLERİ Kİ-KARE TESTLERİ

A İSTATİSTİK. 4. X kesikli rasgele (random) değişkenin moment çıkaran. C) 4 9 Buna göre, X in beklenen değeri kaçtır?

FARKLI VERİ YAPILARINDA KULLANILABİLECEK REGRESYON YÖNTEMLERİ

Sabit Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = s 2

UYGULAMA 2. Bağımlı Kukla Değişkenli Modeller

Farklı Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = σ i2. Eşit Varyans. Hata. Zaman

FARKLI REGRESYON YÖNTEMLERİ İLE BETA KATSAYISI ANALİZİ

Parametrik Olmayan İstatistik Çözümlü Sorular - 2

5.3. Tekne Yüzeylerinin Matematiksel Temsili

REGRESYONDA ETKİLİ GÖZLEMLERİ BELİRLEME YÖNTEMLERİ VE KARŞILAŞTIRMALARI. Can DARICA YÜKSEK LİSANS TEZİ İSTATİSTİK

ALGILANAN HİZMET KALİTESİ VE LOJİSTİK REGRESYON ANALİZİ İLE HİZMET TERCİHİNE ETKİSİNİN BELİRLENMESİ. Özet

Rasgele Değişken Üretme Teknikleri

Bulanık Mantık ile Hesaplanan Geoid Yüksekliğine Nokta Yüksekliklerinin Etkisi

PROJE PLANLAMASINDA BULANIK HEDEF PROGRAMLAMA YAKLAŞIMI. Müh. Ramadan VATANSEVER

ÖZET Yüksek Lsans Tez TAM VE SANSÜRLÜ ÖRNEKLEM DURUMLARINDA WEIBULL DAĞILIMI İÇİN BAZI İSTATİSTİKİ SONUÇ ÇIKARIMLARI Dlşen TAMAM Ankara Ünverstes Fen

Deney No: 2. Sıvı Seviye Kontrol Deneyi. SAKARYA ÜNİVERSİTESİ Dijital Kontrol Laboratuvar Deney Föyü Deneyin Amacı

Regresyon ve Korelasyon Analizi. Regresyon Analizi

YARIPARAMETRİK KISMİ DOĞRUSAL PANEL VERİ MODELLERİYLE ULUSLAR ARASI GÖÇ

bir yol oluşturmaktadır. Yine i 2 , de bir yol oluşturmaktadır. Şekil.DT.1. Temel terimlerin incelenmesi için örnek devre

Bölüm 3. Tanımlayıcı İstatistikler

Bitkisel Ürün Sigortası Yaptırma İsteğinin Belirlenmesi: Tokat İli Örneği

Tek Yönlü Varyans Analizi (ANOVA)

Sorunun varlığı durumunda hata terimi varyans-kovaryans matrisi Var, Cov(u) = E(uu') = σ 2 I n şeklinde yazılamıyor fakat

a IIR süzgeç katsayıları ve N ( M) de = s 1 (3) 3. GÜRÜLTÜ GİDERİMİ UYGULAMASI

BÖLÜM 1: YAşAM ÇÖzÜMLEMEsİNE GİRİş... 1

T.C. SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

KIRMIZI, TAVUK VE BEYAZ ET TALEBİNİN TAM TALEP SİSTEMİ YAKLAŞIMIYLA ANALİZİ

ADIYAMAN ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MATEMATİK ANABİLİM DALI YÜKSEK LİSANS TEZİ SOFT KÜMELER VE BAZI SOFT CEBİRSEL YAPILAR.

Korelasyon analizi. Korelasyon analizinin niteliği. Sınava hazırlanma süresi ile sınavdan alınan başarı arasında ilişki var mıdır?

PÜRÜZLÜ AÇIK KANAL AKIMLARINDA DEBİ HESABI İÇİN ENTROPY YÖNTEMİNİN KULLANILMASI

1. KEYNESÇİ PARA TALEBİ TEORİSİ

YER ÖLÇÜLERİ. Yer ölçüleri, verilerin merkezini veya yığılma noktasını belirleyen istatistiklerdir.

Bölüm 3. Tanımlayıcı İstatistikler

SEK Tahmincilerinin Arzulanan Özellikleri. SEK Tahmincilerinin Arzulanan Özellikleri. Ekonometri 1 Konu 9 Sürüm 2,0 (Ekim 2011)

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

TÜKETİCİ TATMİNİ VERİLERİNİN ANALİZİ: YAPAY SİNİR AĞLARI ve REGRESYON ANALİZİ KARŞILAŞTIRMASI

ENDÜSTRİNİN DEĞİŞİK İŞ KOLLARINDA İHTİYAÇ DUYULAN ELEMANLARIN YÜKSEK TEKNİK EĞİTİM MEZUNLARINDAN SAĞLANMASINDAKİ BEKLENTİLERİN SINANMASI

Deprem Tepkisinin Sayısal Metotlar ile Değerlendirilmesi (Newmark-Beta Metodu) Deprem Mühendisliğine Giriş Dersi Doç. Dr.

Hasar sıklıkları için sıfır yığılmalı kesikli modeller

Asimetri ve Basıklık Ölçüleri Ortalamalara dayanan (Pearson) Kartillere dayanan (Bowley) Momentlere dayanan asimetri ve basıklık ölçüleri

İSTATİSTİK DERS NOTLARI

Sistemde kullanılan baralar, klasik anlamda üç ana grupta toplanabilir :

Üç Boyutlu Yapı-Zemin Etkileşimi Problemlerinin Kuadratik Sonlu Elemanlar ve Sonsuz Elemanlar Kullanılarak Çözümü

MIT Açık Ders Malzemeleri Bu materyallerden alıntı yapmak veya Kullanım Koşulları hakkında bilgi almak için

GIDA SEKTÖRÜNDE İSTATİSTİKSEL KALİTE KONTROL GRAFİKLERİNİN BİR UYGULAMASI

İyi Tarım Uygulamaları Ve Tüketici Davranışları (Logit Regresyon Analizi)(*)

Genel Doğrusal Karışık Modellerde Farklı Kovaryans Yapıları ve Tahmin Yöntemlerinin Performanslarının Karşılaştırılması 1

Muhasebe ve Finansman Dergisi

REGRESYON ANALİZİ BÖLÜM 5-6

Sıfır Ağırlıklı Sayma ile Elde Edilen Veriler İçin Çok Seviyeli ZIP Regresyon * Multilevel ZIP Regression for Zero-Inflated Count Data

Tanımlayıcı İstatistikler

META ANALİZ VE TARIMSAL UYGULAMALAR

4.5. SOĞUTMA KULELERİNİN BOYUTLANDIRILMASI İÇİN BİR ANALIZ

KENTSEL ALANDA ET TALEP ANALİZİ: BATI AKDENİZ BÖLGESİ ÖRNEĞİ. Dr. Ali Rıza AKTAŞ 1 Dr. Selim Adem HATIRLI 2

Kİ-KARE VE KOLMOGOROV SMİRNOV UYGUNLUK TESTLERİNİN SİMULASYON İLE ELDE EDİLEN VERİLER ÜZERİNDE KARŞILAŞTIRILMASI

DEFORMASYONLARIN MODELLENMESİ. Levent TAŞÇI 1 ltasci@firat.edu.tr

ÇOK BOYUTLU EŞLEŞMİŞ ÇİFTLER ARASINDAKİ FARKIN SINAMASINDA PERMÜTASYON YÖNTEMİNİN BİR DEĞERLENDİRMESİ. Burak ŞİMŞEK YÜKSEK LİSANS TEZİ İSTATİSTİK

TEMEL DEVRE KAVRAMLARI VE KANUNLARI

ALTERNATİF AKIM DEVRE YÖNTEM VE TEOREMLER İLE ÇÖZÜMÜ

HİSSE SENETLERİNİN BEKLENEN GETİRİ VE RİSKLERİNİN TAHMİNİNDE ALTERNATİF MODELLER

DOĞRUSAL HEDEF PROGRAMLAMA İLE BÜTÇELEME. Hazırlayan: Ozan Kocadağlı Danışman: Prof. Dr. Nalan Cinemre

Makine Öğrenmesi 10. hafta

Tek Yönlü Varyans Analizi

İÇME SUYU ŞEBEKELERİNİN GÜVENİLİRLİĞİ

Sansürlenmiş ve Kesikli Regresyon Modelleri

JFM316 Elektrik Yöntemler ( Doğru Akım Özdirenç Yöntemi)

TÜKETĠCĠLERĠN FĠYAT BĠLĠNCĠ ÜZERĠNDE ETKĠLĠ OLAN FAKTÖRLERE ĠLĠġKĠN BĠR ĠNCELEME

ATATÜRK ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ İŞLETME ANA BİLİM DALI. Serhat BURMAOĞLU

YÖNETİM VE EKONOMİ Yıl:2006 Cilt:13 Sayı:1 Celal Bayar Üniversitesi İ.İ.B.F. MANİSA

FAKTÖRİYEL TASARIMA ADAPTİF AĞ TABANLI BULANIK MANTIK ÇIKARIM SİSTEMİ İLE FARKLI BİR YAKLAŞIM. Sevil ŞENTÜRK

Transkript:

YAŞAM ÇÖZÜMLEMESİNDE AYKIRI DEĞERLER OUTLIERS IN SURVIVAL ANALYSIS NURAY TUNCER PROF. DR. DURDU KARASOY Tez Danışmanı Hacettepe Ünverstes Lsansüstü Eğtm-Öğretm Yönetmelğnn İstatstk Anablm Dalı İçn Öngördüğü YÜKSEK LİSANS TEZİ olarak hazırlanmıştır. 2014

NURAY TUNCER n hazırladığı Yaşam Çözümlemesnde Aykırı Değerler adlı çalışma aşağıdak jür üyeler tarafından İSTATİSTİK ANABİLİM DALI nda YÜKSEK LİSANS TEZİ olarak kabul edlmştr. Doç. Dr. Mehtap AKÇİL OK Başkan... Prof. Dr. Durdu KARASOY Danışman Yard. Doç. Dr. Nhal ATA TUTKUN Üye... Bu tez Hacettepe Ünverstes Fen Blmler Ensttüsü tarafından YÜKSEK LİSANS TEZİ olarak onaylanmıştır. PROF.DR. FATMA SEVİN DÜZ Fen Blmler Ensttüsü Müdürü

ETİK Hacettepe Ünverstes Fen Blmler Ensttüsü, tez yazım kurallarına uygun olarak hazırladığım bu tez çalışmasında, tez çndek bütün blg ve belgeler akademk kurallar çerçevesnde elde ettğm, görsel, ştsel ve yazılı tüm blg ve sonuçları blmsel ahlak kurallarına uygun olarak sunduğumu, başkalarının eserlernden yararlanılması durumunda lgl eserlere blmsel normlara uygun olarak atıfta bulunduğumu, atıfta bulunduğum eserlern tümünü kaynak olarak gösterdğm, kullanılan verlerde herhang br tahrfat yapmadığımı, ve bu tezn herhang br bölümünü bu ünverstede veya başka br ünverstede başka br tez çalışması olarak sunmadığımı beyan ederm. 04/06/2014 Nuray TUNCER

ÖZET YAŞAM ÇÖZÜMLEMESİNDE AYKIRI DEĞERLER Nuray TUNCER Yüksek Lsans, İstatstk Bölümü Tez Danışmanı: Prof. Dr. Durdu KARASOY Mayıs 2014, 84 sayfa Yaşam çözümlemes, tanımlanan herhang br olayın ortaya çıkmasına kadar geçen sürenn ncelenmesnde kullanılan statstksel yöntemler bütünüdür. Aykırı değerler, modele y uyum sağlamayan değerlerdr. Yaşam çözümlemesnde aykırı değerler klask regresyonda kullanılan yöntemlerden farklı yöntemler kullanılarak hesaplanmaktadır. Çünkü yaşam çözümlemesnde verler durdurulmuş gözlemler çerr ve durdurulmuş gözlemlern varlığı "beklenen eks gözlenen" değern hesaplamayı zorlaştırır. Yaşam çözümlemesnde aykırı değer belrleme yöntemler artıklara ve artıkların analzne dayanmaktadır. Yaşam çözümlemesnde kullanılan başlıca artık türler Cox-Snell, Martngale, Schoenfeld, Sapma, Log-odds ve Normal sapma artıklarıdır. Etkl gözlemler belrlemek çn kullanılan yöntemler se DFBETA, LMAX ve Olablrlk Değşm değerlerdr. Çalışma boyunca ncelenen artık türler mde kanser le lgl verlere uygulanmış ve aykırı değerler belrlenmştr. Belrlenen aykırı değerler çıkarılarak model yenden kurulmuştur. Aykırı değerler çıkarıldığında sonuçların daha y olduğu görülmüştür. Anahtar Kelmeler: Yaşam çözümlemes, yaşam modeller, aykırı değerler, etkl gözlemler, artıklar

ABSTRACT OUTLIERS IN SURVIVAL ANALYSIS Nuray TUNCER Master of Scence, Department of Statstcs Supervsor: Prof. Dr. Durdu KARASOY May 2014, 84 pages Survval analyss s a collecton of statstcal methods for analyzng data where the outcome varable s the tme untl the occurrence of an event of nterest. Outlers are the ndvduals whose survval tme s not well ftted by the model. Outlers n survval anayss calculated dfferently from classcal regresson analyss. Because n survval analyss are data contan censored observatons and ths makes dffcult to calculate the dfference "observed mnus predcted" values. In survval analyss outler detecton methods are commonly carred out based on resduals and resdual analyss. In survval analyss there are dfferent types of resduals that are Cox-Snell, Martngale, Schoenfeld, Devance, Log-odds and Normal devance resduals. There are methods whch are DFBETA, LMAX and Lkelhood Dsplacement values for detectng nfluental observatons. The resduals are analyzed durng the study whch s appled on a stomach cancer data set and the outlers are detected. After omttng these outlers, model s set up agan and results were found better. Key Words: Survval analyss, survval models, outlers, nfluental observatons, resduals

TEŞEKKÜR Bu tezn oluşmasında en büyük desteğ sağlayan, tez çalışmamın her aşamasında bana yol gösteren ve yakın lgsyle ben teşvk eden danışmanım Sayın Prof. Dr. Durdu KARASOY a, sabırları ve destekler çn çalışma arkadaşlarıma ve aleme çtenlkle teşekkür ederm.

İÇİNDEKİLER Sayfa ÖZET... ABSTRACT... TEŞEKKÜR... İÇİNDEKİLER... v ÇİZELGELER... v ŞEKİLLER... v SİMGELER VE KISALTMALAR... x 1. GİRİŞ... 1 2. GENEL BİLGİLER... 3 2.1. Yaşam Çözümlemes... 3 2.1.1. Durdurma... 5 2.1.2. Yaşam Çözümlemesnde Kullanılan Fonksyonlar... 6 2.2. Cox Orantılı Tehlkeler Model... 8 2.3. Orantılı Tehlkeler Varsayımının İncelenmes... 9 2.4. Parametrk Dağılımlar... 12 2.4.1. Üstel Dağılım... 13 2.4.2. Webull Dağılımı... 14 2.4.3. Log-Normal Dağılım... 15 2.4.4. Log-Lojstk Dağılım... 16 2.4.5. Gamma ve Genelleştrlmş Gamma Dağılımı... 17 2.5. Aykırı Değerler... 18 3. YAŞAM ÇÖZÜMLEMESİNDE AYKIRI DEĞERLER... 20 3.1. Cox-Snell Artıkları... 22 3.2. Martngale Artıkları... 23 3.3. Sapma Artıkları... 25 3.4. Schoenfeld Artıkları... 26 3.5. Log-Odds Artıkları... 29 3.6. Normal Sapma Artıkları... 30 3.7. Etkl Gözlemlern Belrlenmes... 32 4. UYGULAMA... 35 5. SONUÇLAR... 64

KAYNAKLAR... 66 EKLER... 69 ÖZGEÇMİŞ... 84

ÇİZELGELER Sayfa Çzelge 4.1. Açıklayıcı değşkenler ve düzeyler... 36 Çzelge 4.2. Zamana bağlı değşkenlern anlamlılığı çn model sonuçları... 37 Çzelge 4.3. Yaşam süres rankının Schoenfeld artıkları le lşks... 39 Çzelge 4.4. Cox orantılı tehlkeler modelnn sonuçları... 39 Çzelge 4.5. Modellern karşılaştırılması... 43 Çzelge 4.6. Log-odds ve normal sapma artık değerler... 46 Çzelge 4.7. Aykırı değerler çıkarıldıktan sonra Cox orantılı tehlkeler model sonuçları... 56 Çzelge 4.8. Log-normal regresyon modelnn sonuçları... 57 Çzelge 4.9. Log-normal regresyon modelnde log-odds ve normal sapma artık değerler... 61 Çzelge 4.10. Aykırı değerler çıkarıldıktan sonra log-normal regresyon model sonuçları... 62 Çzelge 4.11. Log-normal regresyon model çn adımsal seçm yöntem sonuçları... 63 v

ŞEKİLLER Sayfa Şekl 4.1. Yaş değşken çn ölçeklendrlmş Schoenfeld artığı grafğ... 37 Şekl 4.2. Dğer açıklayıcı değşkenler çn ölçeklendrlmş Schoenfeld artığı grafkler... 38 Şekl 4.3. Kaplan-Meer yaşam eğrs... 40 Şekl 4.4. Brkml tehlke eğrs... 40 Şekl 4.5. Cox orantılı tehlkeler model çn Cox-Snell artığı grafğ... 41 Şekl 4.6. a-e. Parametrk modeller çn Cox-Snell artığı grafkler... 42 Şekl 4.7. Yaş değşken çn Martngale artığı grafğ... 43 Şekl 4.8. Doğrusal tahmne karşı Martngale artığı grafğ... 44 Şekl 4.9. Yaş değşken çn sapma artığı grafğ... 45 Şekl 4.10. Doğrusal tahmne karşı sapma artığı grafğ... 45 Şekl 4.11. Yaş değşken çn DFBETA grafğ... 47 Şekl 4.12. Cnsyet değşken çn DFBETA grafğ... 48 Şekl 4.13. Klo Kaybı (Semptom) değşken çn DFBETA grafğ... 48 Şekl 4.14. Anem (Hb) değşken çn DFBETA grafğ... 49 Şekl 4.15. Dseksyon değşken çn DFBETA grafğ... 49 Şekl 4.16. Tümörün mdedek lokalzasyonu değşkennn orta üçlük düzey çn DFBETA grafğ... 50 Şekl 4.17. Tümörün mdedek lokalzasyonu değşkennn alt üçlük düzey çn DFBETA grafğ... 51 Şekl 4.18. Tümörün mdedek lokalzasyonu değşkennn tüm mde düzey çn DFBETA grafğ... 51 Şekl 4.19. Evre değşkennn evre 3 düzey çn DFBETA grafğ... 52 Şekl 4.20. Evre değşkennn evre 4 düzey çn DFBETA grafğ... 53 Şekl 4.21. Kemoterap değşken çn DFBETA grafğ... 53 Şekl 4.22. Log-olablrlk değşm grafğ... 54 Şekl 4.23. Lmax statstğ grafğ... 55 Şekl 4.24. Log-normal regresyon modelnde yaş değşken çn Martngale artığı grafğ... 58 Şekl 4.25. Log-normal regresyon modelnde doğrusal tahne karşı Martngale artığı grafğ... 58 v

Şekl 4.26. Log-normal regresyon modelnde yaş değşken çn sapma artığı grafğ... 59 Şekl 4.27. Log-normal regresyon modelnde doğrusal tahmne karşı sapma artığı grafğ... 60 v

SİMGELER VE KISALTMALAR AIC ÇEÖ ÇUY Akake Blg Krter Çok Erken Ölen Çok Uzun Yaşayan x

1. GİRİŞ Eldek ver kümesne br model uyarlandıktan sonra, uygulanan modeln varsayımlarının sağlanıp sağlanmadığının kontrol edlmes gerekldr. Modeln kontrolü çn tanı yöntemler, modelleme sürecnn öneml br kısmıdır [1]. Bu süreçlern çoğu artıkların analzne dayanmaktadır. Yaşam çözümlemesnde özellkle Cox orantılı tehlkeler modelnde değşk amaçlarla kullanılablecek değşk artık türler vardır [2]. Yaşam çözümlemesnde en yaygın kullanılan artık türü Cox ve Snell (1968) tarafından önerlen Cox-Snell artıklarıdır [3]. Bu artık türü modeln uygunluğunun kontrolü çn kullanılır. Dğer br artık türü olan Martngale artıkları Barlow ve Prentce (1988) tarafından önerlmştr ve Cox-Snell artıklarının doğrusal dönüşümüdür. Martngale artıkları açıklayıcı değşkenlern modele uyumunu belrlemede kullanılır [4]. Benzer şeklde sapma artıkları da Martngale artıklarının dönüşümüdür. Aykırı değerler genellkle Therneau v.d. (1990) tarafından önerlen sapma artıkları le görüntülenr [5]. Flemmng ve Harrngton (1991) sapma artıklarının referans örnekleme dağılımına sahp olmadığına ve ver kümesnde durdurulmuş gözlemler olmadığında ble standart normal dağılım yaklaşımının tatmn edc olmadığına dkkat çekmştr [6]. Nard ve Schemper (1999) bu problemn üstesnden gelmek çn yen artık türler önermştr. Bu yen artık türlernn, aykırı değerler belrlemede daha doğru br sonuç verdğ dda edlmektedr. Bu yen artıklar log-odds ve normal sapma artıklarıdır [7]. Dğer br artık türü se Cox orantılı tehlkeler modelnde orantılılık varsayımının testnde yaygın olarak kullanılan ve Schoenfeld (1982) tarafından önerlen Schoenfeld artıklarıdır [8]. Çalışmanın knc bölümünde yaşam çözümlemes hakkında genel blgler verlmş, yaşam çözümlemesnde durdurma kavramından bahsedlmştr. Yaşam çözümlemesnde kullanılan fonksyonlara ve brbryle lşklerne, yaşam çözümlemesnde en çok kullanılan model olan Cox orantılı tehlkeler modelne ve temel varsayımı olan orantılılık kavramı hakkında blglere yer verlmştr. Ayrıca bu bölümde yaşam çözümlemesnde kullanılan parametrk dağılımlar ve aykırı değer kavramı le lgl genel blgler de yer almaktadır. 1

Üçüncü bölümde se yaşam çözümlemesnde aykırı değerler hakkında ve aykırı değerler belrlerken kullanılan yöntemler hakkında blgler yer almaktadır. Yaşam çözümlemesnde aykırı değerler belrlerken kullanılan başlıca artık türlernden ve etkl gözlemler belrme yöntemlernden bahsedlmştr. Dördüncü bölümde se çalışma boyunca değnlen yöntemler mde kanseryle lgl gerçek verlere uygulanmış, aykırı değerler belrlenmş ve gerekl analzler yapılarak sonuçlar yorumlanmıştır. Bu çalışmanın amacı, yaşam çözümlemesnde karşılaşılan aykırı değerler tanımlama yöntemlern ve uygulama alanlarını ncelemektr. Bu amaçla lteratürde yer alan bu artık türler ncelenmş ve gerçek br ver kümes üzernde uygulanmıştır. 2

2. GENEL BİLGİLER 2.1. Yaşam Çözümlemes Yaşam çözümlemes, lglenlen herhang br olayın ortaya çıkmasına kadar geçen sürenn ncelenmesnde kullanılan çözümleme yöntemler topluluğudur. Yaşam çözümlemesnn kendne özgü br termnolojs vardır. Geçen süre; araştırmanın başından lglenlen olay gerçekleşnceye kadar geçen yılları, ayları, haftaları, günler ya da olay gerçekleştğ anda brmn yaşını fade eder. Olay se ölüm, hastalığa yakalanma, hastalığın kötüye gtmes, yleşme, şe dönme ya da brmn başına geleblecek lglenlen herhang br olayı fade eder. Olumlu (yleşme, hastaneden taburcu olma gb), olumsuz (ölüm, hastalığın kötüye gtmes gb) ya da brmn başına gelen lglenlen herhang br durum olayın konusunu oluşturablr [9]. Yaşayan br organzmanın ya da cansız br nesnenn belrl br başlangıç zamanı le başarısızlığı arasında geçen zamana yaşam süres ya da başarısızlık süres adı verlmektedr. Her br brme at yaşam süres, tanımı gereğ sürekl ve poztf br değere sahptr [10]. Herhang br brm çn başarısızlık ancak br kez oluşablr. Başarısızlık süresne örnek olarak, makne bleşenlernn yaşam süreler, şçlern grev süreler ya da ekonomde şszlk dönemler, pskolojk br deneyde deneğn belrlenen görev tamamlama süres ve klnk br deneyde hastaların yaşam süreler gösterleblr. Yaşam çözümlemesnde temel olan, gözlenen başarısızlık sürelernn ncelenmes olduğundan, bu değşkenn y tanımlanması gerekmektedr. İlglenlen olaya göre farklı şekllerde ortaya çıkablen bu değşkenn duyarlı olarak ölçülmes çn, Başlangıç zamanı her br brm çn şüpheye yer vermeyecek şeklde tanımlanmalıdır. Geçen sürey ölçmek çn br zaman ölçeğ kabul edlmeldr. Her br brm çn başarısızlığın meydana geldğ an tamamen net olmalıdır [11]. Yaşam çözümlemes verlernn kaynağı genel olarak sağlık blmler olmakla beraber nüfus blm, mühendslk, ekonom ve sosyal blmler gb dğer alanlar da olablr. 3

Sosyolojde olay geçmş çözümlemes (event hstory analyss), mühendslkte başarısızlık zamanı çözümlemes (falure tme analyss), ekonomde süre çözümlemes (duraton analyss) ya da geçş çözümlemes (transton analyss) ve sağlık alanında yaşam çözülmes (survval analyss) olarak adlandırılır [12]. Yaşam sürelernn çözümlenmesnde kullanılan bazı yöntemler oldukça eskdr ama 1970 lerde başlayan bu alan, yöntem, teor ve uygulama açısından hızlıca lerlemştr. Yaşam çözümlemesnn amaçları, farklı zamanlarda yaşam olasılığı tahmnlernn elde edlmes, yaşam süresnn dağılımının tahmn edlmes, farklı hasta gruplarının yaşam süres dağılımlarının karşılaştırılması, yaşam süresn etkleyen faktörlern belrlenmes olarak sıralanablr. Yaşam çözümlemesnde lglenlen problemn çözümüne lşkn farklı yaklaşımlar; o başarısızlık sürelernn bağımlı değşken olarak kabul edldğ ve bu değşken açıkladığı düşünülen dğer değşkenlern de çözümlemede yer aldığı modellern kullanıldığı yaklaşım, Bu yaklaşım çn k model düşünüleblr: Bağımsız değşkenler olarak da ntelendrlen açıklayıcı değşkenlern tehlke fonksyonu üzernde çarpımsal br etkye sahp olduğu orantılı tehlkeler modeller, Açıklayıcı değşkenlern yaşam süresnn logartması üzernde toplamsal ya da yaşam süres üzernde çarpımsal br etkye sahp olduğu logdoğrusal modeller. o çeştl parametrk yaşam dağılımlarını kullanarak tahmnlerde bulunmak ve hpotez testlern hazırlamak, o herhang br dağılım varsayımına dayanmayan parametrk olmayan süreçler kullanarak tahmnlerde bulunmak olarak özetleneblr [1]. 4

Yaşam çözümlemesnn k öneml avantajı; yaşam süresnn dağılımı hakkında blg gerektrmemes ve durdurma zamanına kadar tüm blgler kullanması ve hçbr blgy göz ardı etmemesdr [13]. 2.1.1. Durdurma Yaşam çözümlemesnde kullanılan modellern dğer statstksel modellerden temel farkı zaman değşkennn yapısından dolayı durdurulmuş (censored) gözlem çeren ver kümes çn tasarlanmış statstksel yöntemler bütünü olmasıdır. Durdurma genel olarak; 1. Çalışmanın btş noktasına kadar olayın gözlenememes (admnstratve censorng) 2. Çalışma btmeden brmle lgl blg alınamaması (lost to follow- up) 3. Başka br olayla (başka nedenden ölüm, laç reaksyonu gb) karşılaşma (wthdrawng) nedenler le meydana gelr. Bu gb nedenlerle brmler daha fazla gözlemlenemez ve bu brmler "durdurulmuş gözlem" olarak fade edlr [13]. Durdurulmuş brmler çn başarısızlık gerçekleşmedğnden bu brmler çn başarısızlık süres yerne durdurma süreler söz konusu olur [14]. Bu gb durumlarda hçbr araştırmacı bu brmlern tamamını kayıp ver (mssng data) olarak çalışmanın dışında bırakmak stemez, çünkü bunların çoğu araştırma sonucunu etkleyeblr. Brmn yaşam süres le lgl blg, en son görüldüğü anda elde edlen blg olur ve durdurulmuş gözlem olarak araştırmaya katılır [1]. Durdurma soldan, sağdan ve aralıklı olmak üzere üç çeşttr. Ancak, en yaygın kullanılanı sağdan durdurmadır (rght censorng). Örneğn, hastaların yrm hafta boyunca gözlemlendğ br çalışmada, br hasta çalışma süres boyunca lglenlen olayı yaşamamışsa bu sağdan durdurmadır. Bu kşnn yaşam süres en az çalışma süres kadar olmalıdır. Bu kşnn yaşam süres durdurulmuş olarak tanımlanır [15]. Yaşam süres her brm çn farklı olablr. Brmler farklı zamanlarda araştırmaya katılablr. Tanımlanan olay farklı zamanlarda ortaya çıkablr. 5

2.1.2. Yaşam Çözümlemesnde Kullanılan Fonksyonlar Yaşam süres verler başarısızlık, ölüm, tepk, yleşme, verlen hastalığın gelşm, tahlye ya da boşanma gb belrl olayların zamanı le lgldr. Bu zamanlar rasgeledr ve br dağılım oluşturur. Yaşam sürelernn dağılımları genel olarak üç fonksyonla gösterlr. Bunlar; yaşam fonksyonu, olasılık yoğunluk fonksyonu ve tehlke fonksyonudur. Bu fonksyonlar matematksel olarak brbrnden elde edleblr [16]. Olasılık Yoğunluk Fonksyonu Brmn geçek yaşam süres t, T değşkennn br değer olarak gösterleblr ve bu değer negatf olamaz. T rastlantı değşken f(t) olasılık dağılımına sahptr. f(t) olasılık yoğunluk fonksyonu f (t) P t T t t lm t 0 t şeklndedr. T nn dağılım fonksyonu, t F( t) P( T t) f ( u) du 0 bçmndedr ve yaşam süresnn t değernden küçük olması olasılığını gösterr [1]. Yaşam Fonksyonu Yaşam fonksyonu S(t), yaşam süresnn t den daha büyük olması olasılığını verr ve S ( t) P( T t) 1 F ( t) bçmndedr [1]. Yaşam fonksyonu monoton azalan soldan sürekl br fonksyondur ve t 0 ken; S ( t) S (0) 1 t ken; S ( t) S ( ) 0 olur [15]. 6

Tehlke Fonksyonu Tehlke fonksyonu, t zamanında yaşadığı blnen br brmn t le t+ δ t zaman aralığında başarısız olma rsknn br tanımıdır. Anlık ölüm hızı olarak da tanımlanır. Tehlke fonksyonu, P( t T t t / T t) h( t) lm t0 t bçmndedr. h(t), 0 le arasında değer alır. Bu tanımdan yaşam ve tehlke fonksyonları arasında bazı lşkler görüleblr. F(t), T nn dağılım fonksyonu olmak üzere, F( t t) F( t) 1 h( t) lm t0 t S( t) olur ve buradan h( t) f ( t) S( t) elde edlr. Tehlke fonksyonu, d h( t) log S( t) dt bçmnde de yazılablr. H t h u d u ken t 0 S( t) exp H( t) bçmnde olur. H t, brkml tehlke fonksyonu olarak adlandırılır. Yaşam fonksyonundan, log S( t) H t 7

le elde edleblr [1]. Brkml tehlke fonksyonu, artan, sağdan sürekl ve lm H( t) olan br fonksyondur [11]. 2.2. Cox Orantılı Tehlkeler Model t Yaşam çözümlemesnde en çok kullanılan model Cox orantılı tehlkeler (Cox proportonal hazards) modeldr. 1972 yılında Cox tarafından gelştrlen regresyon model le yaşam çözümlemesnde öneml adımlar atılmış, Cox (1972) un önerler, Kalbflesch ve Prentce (1980) n katkıları le bugünkü önemn kazanmıştır [17]. Cox orantılı tehlkeler model; br brmn yaşam süres le brden fazla açıklayıcı değşken arasındak lşky ortaya çıkaran statstksel br yöntemdr. Cox orantılı tehlkeler modelnn amacı, yaşam verlernn genel durumunu yansıtacak br model oluşturmaktır. Bu yolla, yaşam süres üzernde etkl olduğu düşünülen değşkenlern etkler eşanlı olarak açıklanablmektedr [18]. Cox orantılı tehlkeler model, Cox model veya Cox regresyon model (Cox regresson model) olmak üzere farklı şekllerde adlandırılablen, dağılım blgs gerektrmeyen br modeldr. Bu modelde, yaşam süres ve bu süre üzernde etkl olarak görülen açıklayıcı değşkenler yer alır. Açıklayıcı değşkenler, model toplamsal değl, çarpımsal olarak etkler [19]. Cox orantılı tehlkeler model, X h t, h t exp( β' X ) 0 bçmndedr. Burada, regresyon katsayıları vektörü ve h 0 t se açıklayıcı değşkene sahp olmayan (x=0 olan) br brmn temel tehlke fonksyonu olarak tanımlanmaktadır [20]. Cox regresyon modelndek katsayılar, kısm olablrlk fonksyonu le tahmn edlr. Brbrnden farklı başarısızlık süreler sayısı k olmak üzere, kısm olablrlk fonksyonu L aşağıdak gb hesaplanır: L k ' ' exp x / exp x j 1 j R j 8

Burada x,. sıralı başarısızlık zamanı t de başarısız olan brmler çn açıklayıcı değşkenler vektörüdür. Paydadak toplam, üzernden exp ' x değerlernn toplamıdır. t zamanda rskte olan brmler Regresyon katsayılarının en çok olablrlk tahmnler, logartmk olablrlk fonksyonunu en büyükleyerek ln L le hesaplanır. Newton-Raphson algortması kullanılarak teratf çözümlemeler yapılır ve bu yöntemle katsayıları tahmn edlr. Cox regresyon modelnde kullanılan tehlke oranı, farklılığın, durumlar arasında kaç kat olduğunu belrtmektedr. Tehlke oranı exp şeklnde fade edlr. Tehlke oranı 1 se durumlar arasında br farklılık olmadığı anlamına gelr. 1 den büyük olan tehlke oranı rskn arttığına, 1 den küçük olan tehlke oranı se rskn azaldığına şaret eder [21]. Parametrk modellern gerektrdğ varsayımların sağlanmadığı durumlarda Cox orantılı tehlke model, parametrk analzlerden daha etkldr. Cox orantılı tehlkeler modelnde; açıklayıcı değşkenlern tehlke fonksyonu üzerndek etkler logdoğrusaldır. açıklayıcı değşkenlern log-doğrusal fonksyonu le tehlke fonksyonu arasındak lşk çarpımsaldır. Bu model çn varsayım, tehlke oranının zamana göre değşmemes, yan sabt olmasıdır. Tehlke oranı le lgl bu varsayım orantılı tehlkeler varsayımı olarak blnr [18]. 2.3. Orantılı Tehlkeler Varsayımının İncelenmes Cox orantılı tehlkeler modelnn temel varsayımı orantılı tehlkelerdr. Orantılı tehlke varsayımı, tehlke oranının zamana karşı sabt olması ya da br brmn tehlkesnn dğer brmn tehlkesne orantılı olması anlamına gelmektedr [22]. * * * * x x1, x2,..., xp ve x x1, x2,..., xp olmak üzere tehlke oranı, k brme at açıklayıcı değşkenler vektörü 9

* * exp( jxj ) h0 t h t, x j1 H O p h t, x exp( x ) h t p j1 j j 0 p exp * j ( xj - x j j1 bçmndedr. Üsttek eştlkte görüldüğü gb tehlke oranı t y çermez. Br başka deyşle, model uydurulduğunda x* ve x çn değerler belrlendğnde, tehlke oranı tahmn çn üstel fadenn değer sabttr, zamana bağlı değldr. Bu sabt le gösterlrse, tehlke oranı * h t, x h t, x bçmnde yazılablr. Bu orantılı tehlke varsayımını gösteren matematksel br fadedr. Orantılı tehlke varsayımı, * ht, x h t, x bçmnde de fade edleblr. Burada, orantılılık sabt (proportonalty constant) olarak adlandırılır ve zamandan bağımsızdır [1, 20]. Orantılı tehlkeler varsayımını ncelemek çn grafksel ya da sayısal yöntemler kullanılmaktadır. Orantılı tehlke varsayımının ncelenmesnde en çok kullanılan yöntemler, log(-log) yaşam eğrler, gözlenen ve beklenen yaşam eğrler, Arjas grafkler, modele zamana bağlı değşkenlern eklenmes, Schoenfeld artıkları le yaşam süresnn rankı arasındak korelasyon test bçmnde sıralanablmektedr [20]. En yaygın kullanılan grafksel yöntem olan log(-log) yaşam eğrler, açıklayıcı değşkenlern farklı düzeyler üzernden -ln(-ln) yaşam eğrlernn tahmnnn karşılaştırılmasını çermektedr. Elde edlen paralel eğrler orantılı tehlkeler varsayımının sağlandığını göstermektedr. Orantılı tehlkeler varsayımını değerlendrmek çn gözlenen yaşam olasılıkları le beklenen yaşam olasılıklarının çzmlernn kullanımı uyum ylğ test yaklaşımının grafksel karşılığıdır. Beklenen yaşam eğrlern elde etmek çn, değerlendrlen tahmn edcy çeren Cox orantılı tehlkeler model uydurulur. Yaşam eğrsnn tahmn, tahmn edcnn her br sınıfı çn değerler formülde yerne yerleştrlerek 10

elde edlr. Tahmn edcnn her br sınıfı çn gözlenen ve beklenen yaşam eğrler brbrne yakınsa, orantılı tehlkeler varsayımının sağlandığına karar verlr. Br ya da daha çok sınıf çn bu eğrler farklılık gösterrse, orantılı tehlkeler varsayımının bozulduğuna karar verlr. Arjas grafkler se orantılı tehlkeler modelnde uyum ylğnn test edlmes çn kullanılan grafksel br yöntemdr. Alternatf modellern tahmnne gereksnm duymadığından ve sadece parametre tahmnnde kullanılan kısm olablrlk fadesndek ncelklere benzer ncelkler çerdğnden kullanılması kolay br yöntemdr. Grafksel yöntemler çnde en uygun sonucu veren yöntemdr [23]. Zamandan bağımsız değşkenn orantılı tehlke varsayımını sağlayıp sağlamadığını ncelemek çn zamana bağlı değşkenler de kullanılır. Bu durumda model, zamandan bağımsız değşkenler ve zamanın fonksyonlarını kapsayan çarpım termlern çeren Cox orantılı tehlkeler model olmaktadır. Bu genşletlmş Cox orantılı tehlkeler model x açıklayıcı değşken çn h( t, x) h ( t)exp x ( xg( t )) 0 bçmndedr. g(t) fonksyonu çn farklı seçenekler vardır. Bunlar; g( t) t g ( t) log t 1 g( t) 0 t t 0 t t bçmnde olablr [15]. 0 (Adım fonksyonu) Genşletlmş Cox orantılı tehlkeler modelnde, çarpım termlernn önemllğ çn test yapılarak orantılı tehlkeler varsayımı değerlendrlr. Yokluk hpotez, H : 0 0 bçmndedr. Yokluk hpotez doğru se, model tek br değşken çeren orantılı tehlkeler modelne ndrgenr [23]. Orantılı tehlkeler varsayımı Schoenfeld artıkları le de kontrol edleblr. Schoenfeld artıkları açıklayıcı değşkenn gerçek değer le ağırlıklı rsk skorlarının ortalaması arasındak farktır. Schoenfeld artıkları zamana karşı çzlr ve orantılı tehlkeler varsayımının geçerllğn kontrol amacıyla kullanılır. Eğer artıklar yatay br doğru 11

etrafında (sıfır merkezl) tesadüf olarak yer alıyorsa, orantılı tehlkeler varsayımı sağlanır. Orantılı tehlkeler varsayımı sağlanmazsa grafk br trent gösterr [24]. Bu test statstğ, orantılı tehlkeler varsayımının ncelenmes çn kullanılan grafksel yöntemlere göre daha nesnel br krter sağlamaktadır. Grafksel yöntemler se daha özneldr [23]. Bağımlı değşken olan yaşam süres üzernde açıklayıcı değşkenlern etklernn araştırıldığı regresyon modeller yaşam çözümlemesnde öneml br yere sahptr. Cox orantılı tehlkeler modelnde orantılı tehlke varsayımı sağlanmıyorsa yaşam versnn modelleneblmes çn brçok yaklaşım önerlmektedr. Bu yaklaşımlar aşağıda verlmştr: Orantısızlığa neden olan değşkenlerle tabakalandırma yapmak (Tabakalandırılmış Cox regresyon model) Orantısızlığı zamana bağlı açıklayıcı değşkenlerle modellemek (Genşletlmş Cox regresyon model) Farklı modeller kullanmak (Ağırlıklandırılmış Cox regresyon model, hızlandırılmış başarısızlık zamanı model ya da toplamsal tehlke model) [22]. 2.4. Parametrk Dağılımlar Yaşam çözümlemesnde, elde edlen verye hang dağılımın uygulanacağı çok önemldr. Bu nedenle model seçm yapılırken lk olarak modeln verye uygunluğu çn gerekl test yapılmaktadır. Model verye uygunsa parametrk test varsayımlarının sağlanıp sağlanmadığına bakılarak modeln geçerllğ le lgl gerekl analzler yapılmaktadır. Yaşam çözümlemes verlernde yaygın olarak kullanılan parametrk dağılımlar; Üstel dağılım Webull dağılımı Log-normal dağılım Log-lojstk dağılım Gamma dağılımı olarak fade edleblr. 12

2.4.1. Üstel Dağılım Üstel dağılım çn Tamamen Rastgele Başarısızlık Model fades de kullanılmaktadır. Brçok yaşam çözümlemes vers üstel dağılım tarafından yeterl derecede tanımlanmasa da, bazı genel durumlarda anlamayı kolay hale getrmektedr [25]. Sabt tehlke fonksyonuna sahp üstel dağılım, yaşam çözümlemes ve güvenlrlk teorsnde oldukça yaygın uygulama alanı bulmuştur. Böylece üstel dağılımın tehlke fonksyonu, 1 h t;, t 0 bçmndedr. Buradan yaşam fonksyonu, t S t; exp h( u) du exp( t / ) 0 bçmnde yazılablr. Dağılım fonksyonu se, F t; 1 exp t, t 0 bçmndedr. Böylece ortalamalı br üstel dağılımın olasılık yoğunluk fonksyonu, 1 f t; exp t, t 0 bçmndedr. Bu fonksyondak parametres ölçek parametresdr ve 0 dır. T, ölçek parametrel br üstel dağılımlı rasgele değşken se T E rasgele değşkenn ortalaması, E T ortancası, Med T log 2 İntegrallenmş tehlke fonksyonu se, 1 1 ; H t d t eştlğ le verlr [1]. t 0 u ve standart sapması se dır. le gösterlr. Böyle br 13

2.4.2. Webull Dağılımı Webull dağılımı 1960 ve 1970 l yıllarda çok yaygın olarak kullanılmaya başlanmıştır. Bu model daha esnek br dağılım sınıfı vermekte ve özel br durum olarak üstel dağılımı çne almaktadır. Webull dağılımı üstel dağılımın genelleştrlmş haldr. Sabt tehlke oranına sahp olmaması Üstel dağılımdan tek farkıdır. Sabt tehlke oranına sahp olmadığından genelleyc uygulamaları Üstel dağılımdan daha fazladır. Bu dağılım daha çok güvenlrlk çalışmalarında ve hastalık ölümlernde kullanılmaktadır [25]. Webull dağılımı yaşam çözümlemes modellernde en yaygın kullanılan dağılımdır. Rsk ve sgortacılık gb alanlarda sıkça kullanılmaktadır. Başarısızlığın oluşmasına kadar geçen sürey ya da başarısızlıktan sonra knc br başarısızlığın oluşmasına kadar geçen sürey modellemede kullanılan br dağılımdır [26]. Webull dağılımı k parametreldr ve W, le gösterlr. Bu dağılım Johnson v.d. (1970) ve Barnett (1982) gb brçok araştırmacı tarafından da çalışılmıştır [25]. Tehlke fonksyonu, 1 1 ;, h t 1 t le verlr. Webull dağılımı çn yaşam fonksyonu, 1 ;, exp S t t ve dağılım fonksyonu, F t;, 1exp t, t 0 bçmnde verlr. Burada ölçek ve se bçm parametresdr. 1 olduğu zaman Webull dağılımı üstel dağılım olur. Buradan Webull dağılımının olasılık yoğunluk fonksyonu, 1 1 f t;, t exp t, t 0 le fade edlr. Webull dağılımının beklenen değer, 14

1 E T le verlr. Ortancası, 1 Med T k k 1 dır. Varyansı, 2 2 2 1 V T log 2 le verlr. İntegrallenmş tehlke fonksyonu se, 1 ;, H t le verlr [27]. t 2.4.3. Log-Normal Dağılım dır. Burada k gamma fonksyonudur ve Yaşam çözümlemesnde, elde edlen verye hang dağılım şeklnn uygulanacağı konusu ayrı br önem taşımaktadır. Bazı durumlarda bell br dağılımı seçmek çn br neden olmaktadır. Örneğn, geçmş deneymler modeln, daha önce ncelenen benzer yığınları oldukça y br şeklde tanımladığını göstermektedr ya da geçerllğn sağlayan başarısızlık sürecne at br blg elde edleblmektedr. Bazen model, var olan verye y uyum sağlasa ble tehlke fonksyonunun formundan dolayı uygun olmayablr. Log-normal dağılım böyle br dağılımdır ve azalan tehlke fonksyonunun sahp olduğu forma göre uygun olmaktan uzaklaşablmektedr. Benzer olasılık yoğunluk fonksyonlarına sahp k dağılım çok farklı tehlke fonksyonlarına sahp olablmektedr. Bu durumda tehlke fonksyonunun yapısına lşkn özel br blg ya da varsayım, dağılımlarından br lehne olmak üzere karar verlmes sağlanablmektedr [25]. Eğer logt, ortalamalı ve 2 varyansı le normal dağılıma sahp se, T rasgele değşkennn ve parametrel log-normal dağılıma sahp olduğu söylenr. Log-normal dağılımın tehlke fonksyonu, 1 h t;, f ( t) S ( t) le verlr. Log-normal dağılım çn yaşam fonksyonu, lnt S t;, 1 15

le verlr. Burada, normal brkml dağılım fonksyonudur. Eğer T rasgele değşken log-normal dağılıma sahp se T ~ LN (, ) le gösterlr. Böylece T ~ LN (, ) nn dağılım fonksyonu, lnt F t;,, t 0 le verlr. Buradan olasılık yoğunluk fonksyonu se, 1 1 2 2 f t;, t exp (logt ) 2, t 0 2 le verlr [27]. 2.4.4. Log-Lojstk Dağılım Log-lojstk dağılım, Webull dağılımının alternatf olmaktadır. Eğer log(t) lojstk dağılıma sahpse T yaşam süres Log-lojstk dağılmaktadır. Bu dağılım k parametreye sahptr. Bunlar ve dır. Bu dağılım başta artan daha sonra azalan br şekle sahp olmaktadır. Log-normal dağılım le karşılaştırıldığında benzer yaşam fonksyonuna ve tehlke oranına sahp olmaktadır [25]. Webull tehlke fonksyonunun kısıtlı olduğu durumlarda Log-lojstk dağılım yararlı olablr. Bu dağılımın tehlke fonksyonu, 1 1 h t;, t (1 t ), t 0 le verlr. Eğer α 1 se tehlke fonksyonu monoton olarak azalır. Fakat 1 se tehlke fonksyonu monoton olarak artar ve yaşam fonksyonu, 1 S t;, 1 t, t 0 le verlr. Log-lojstk dağılımın dağılım fonksyonu, 1 F t;, t 1 t, t 0 bçmndedr. Buradan olasılık yoğunluk fonksyonu, f t 1 2 ;, t 1 t, t 0 16

denklem le verlr. Böyle br olasılık yoğunluk fonksyonuna sahp T rasgele değşkenne ve parametrel Log-lojstk dağılıma sahptr denr. Bu dağılımın ortalaması ve varyansı sırası le 1 1 1 E( T ) 1 1 1 1 2 2 V( T ) 1 1 E( T ) 2, 2 2 le verlr [27]. 2.4.5. Gamma ve Genelleştrlmş Gamma Dağılımı Gamma dağılımı K-kare ve Üstel dağılımı çermektedr. Brown ve Flood (1947) tarafından br kafeteryadak bardak kullanım zamanı çn tanımlanmıştır. Brnbaum ve Saunders (1958) se materyallern yaşam uzunluğu çn br statstksel model olarak tanımlamışlardır. İzleyen dönemlerde de yaşam çözümlemes problemlernde sık br şeklde kullanılmaya başlanmıştır [25]. Gamma dağılımı ve olmak üzere k parametreye sahptr. 0 < < 1 ken, grafk azalış yönündedr, yan zaman 0 dan sonsuza artarken tehlke oranı monoton br şeklde sonsuzdan ya doğru azalmaktadır. 1 se br artma söz konusu olmaktadır, yan tehlke oranı zaman artarken ya göre artmaktadır. 1 se tehlke oranı ya eşt olmaktadır. Gamma dağılımının olasılık yoğunluk fonksyonu, ( ) 1 (t) ( t f t) e t 0, 0, 0 bçmndedr. Burada şekl, ölçüm parametresdr. Yan dak değşm grafğn şekln değştrrken, dak değşm ölçümünü değştrmektedr. 1 ken grafk tek br tepe noktasına sahpken, bu tepe noktası t ( 1) bçmndedr. Gamma dağılımı çn yaşam fonksyonu, S( t) 1 n k t e k0 ( t), k! 17

Tehlke fonksyonu se, n1 ( t) h( t) n1 (n1)! (1 k!)( t) bçmndedr. k0 k Genelleştrlmş Gamma dağılımının, ve olmak üzere üç parametres vardır. Genelleştrlmş Gamma dağılımının olasılık yoğunluk fonksyonu, 1 f (t) t exp[ ( t) ] t 0, 0, 0, 0 ( ) bçmndedr. Üstel, Webull, log-normal ve Gamma dağılımları Genelleştrlmş Gamma dağılımının özel hallerdrler. Buna göre; 1 se Üstel dağılım, 1 se Webull dağılımı, se Log-normal dağılım, 1 se Gamma dağılımı elde edlr [16]. 2.5. Aykırı Değerler Eldek ver kümesne br model uyarlandıktan sonra, uygulanan modeln varsayımlarının sağlanıp sağlanmadığının kontrol edlmes gerekldr. Modeln kontrolü çn tanı yöntemler, modelleme sürecnn öneml br kısmıdır [1]. Aykırı değerler, ver kümesndek dğer verlerle karşılaştırıldıklarında çok büyük ya da çok küçük oldukları gözlemlenen değerlerdr. Analz sonuçları üzernde hçbr etkye sahp olmayablecekler gb çok büyük br etk de yaratablrler. Br ver kümesnde aykırı değerlern belrlenmes statstksel analzler açısından önemldr. Aykırı değerler hatalı verler olmamaları durumunda bze br sürec nasıl yleştrebleceğmz konusunda puçları verr [28]. Artıklar en yaygın kullanılan tanı yöntemlerdr. Eğer uygulanılan model uygunsa artıklar çn çzlen grafklerde beklenlmeyen örüntüler oluşmaz. Doğrusal regresyondak artık değerler en bast halyle tahmn edlen değer le gerçek değer 18

arasındak farktan hesaplanır. Bu durumda grafklern sıfır etrafında rasgele saçılımlı olması beklenr [29]. Regresyon verlernde aykırı değerler lteratürde tartışılan br problemdr. Beckman ve Cook (1983) aykırı değer, hedef dağılımı gerçekleştrmeyen gözlemler olarak tanımlarken, Barnett ve Lews (1984) se ver kümesndek dğer gözlemlerden tutarsız br gözlem olarak tanımlamışlardır. Hawkns (1980) e göre se, br aykırı değer, dğer gözlemlerden çok fazla sapan, dolayısıyla kuşku uyandıracak şeklde farklı br mekanzmadan türetlmş br gözlemdr. Aykırı değerlern varlığı çalışmanın her alanındak uygun model parametre tahmnlern değştrr. Belsley v.d. (1980), Barnett ve Lews (1984) ve Montogomery ve Pack (1992) de doğrusal regresyon problemlernde aykırı değer bulmayı tartışmışlardır [30]. Aykırı değerler değşk nedenlerle ortaya çıkablr. Örneğn, kaba (gross) hatalardan kaynaklanablr. Bu hatalar kopyalama ya da ver grş hataları, hatalı ondalık noktalama, çalışmadan elde edlen ölçümler hatalı ölçeklendrme, farklı anlamdak k very karıştırma, farklı ktleden hatalı alınan br gözlem, geçc etkler ya da donanım yeterszlğ gb hatalar olablr. Bu tür hatalar, y koşullar altında özel lgyle gözlendklernden yüksek ntelkl verlerde nadren rastlanır. Hampel v.d. (1986) verlern tpk olarak %1-10 oranında bu tür hataya sahp olduklarını belrtmşlerdr [30]. Aykırı değerler genellkle üç sebeple ortaya çıkmaktadırlar: Ver kümesnn yapısındak doğal farklılıklardan: Ver kümesndek gözlemlern doğal farklılıklarından kaynaklanır ve bu tür durumlar kontrol edlemez. Ölçüm yanlışlıkları: Ölçme aracının yeterszlğnden ya da yanlış okuma veya kaydetmeden kaynaklı durumlardır. Bu tür durumların kontrolü mümkündür. Uygulama hatası: Vernn yanlış kopyalanmasından kaynaklı durumlardır. Ver kümesnn ktley y temsl etmeyen yanlı örneklemlernden seçlmes durumudur [31]. 19

3. YAŞAM ÇÖZÜMLEMESİNDE AYKIRI DEĞERLER Yaşam çözümlemesnde vernn kendne has özellklernden dolayı brçok yazar aykırı değere özel br anlam vermey denemştr. Collet (1994) yaşam çözümlemesnde aykırı değerlern, son derece uzun yaşam süresne sahp brmler olduğunu belrtmş ama açıklayıcı değşkenlern erken başarısız olmuş ya da tam ters brmler olmasını tavsye etmştr [1]. Therneau v.d. (1990) ve Nard ve Schemper (1999) aykırı değerler çok erken ölen ya da çok uzun yaşayan brmlerle lşklendrmşlerdr [5, 7]. Nard ve Schemper (1999) daha sonradan yaşam çözümlemesnde aykırı değerler "çok uzun yaşayan" ya da "çok erken ölen" brmler olarak belrtmşlerdr [7]. Yaşam çözümlemes çalışmalarında toplanmış verler aykırı değerler çereblr. Aykırı değerler genellkle modele y uyum sağlamayan değerler olarak tanımlanır. Bu aykırı değerler, model tahmnne göre "çok geç" ya da "çok erken" başarısız olan brmler olmasına göre büyük poztf ya da negatf artık değerler alablr. Brmler uzun yaşam süresne sahp olablr ama açıklayıcı değşkenlern değerler brmn daha erken ölmes gerektğn göstereblr [30]. Bazı durumlarda, ver kümesnde yapılan dkkatl kontrol belrgn özellkler saptamaya yardımcı olur. Örneğn, bazen uzun ya da kısa yaşam sürelerne sahp brmler dkkat çeker. Bu durum durdurma le daha karmaşıklaşır k durdurulmuş yaşam sürelernn ortaya çıkışı modeln yeterllğn test etmey en bast durumda olsa ble zorlaştırır. Bu yüzden vernn görsel test modeln yeterllğnn test çn daha bçmsel uygulamalarla desteklenmeldr. Yaşam çözümlemesndek bağımlı değşkenler çalışmadak brmlern yaşam süres ve durumu hakkında blg çerdğnden, aykırı değern çözümlemeler doğrusal regresyondaknden braz farklıdır ve modellern yeterllğnn ncelenmesnde kullanılan yöntemler doğrusal regresyon modellemesnde kullanılan uyum yöntemlernden daha karmaşıktır [1]. Yaşam çözümlemesnde aykırı değerler, modeldek parametre tahmnlern etkleyeblr, tehlke oranını, seçlen model değştreblr ve modele dayanan tahmnler etkleyeblr. Bu aykırı değerler etkl gözlemler olarak tanımlanır. Etkl gözlemlere genelde uzun yaşam sürelernde rastlanılmaktadır. Cox orantılı tehlkeler modelnde, etkl gözlemler parametre tahmnlern etkleyeblrler ve 20

sonuçta tehlke oranını değştreblrler. Kısacası, yaşam çözümlemesnde ver kümesndek etkl gözlemlern ve aykırı değerlern ortaya çıkışının araştırılması oldukça önemldr [30]. Aykırı değerler belrlemenn yanı sıra etkl gözlemlern belrlenmes çn de br prosedürün gelştrlmesne gerek vardır. Regresyon problemlernde, Belsley ve arkadaşları (1980), Had (1992) ve Imon (2005) doğrusal regresyon modelnde leave-one-metodunu kullanarak gözlemlern etklern başarılı br şeklde tanımlamıştır. Dğer yandan, benzer yöntemler yaşam çözümlemes problemlerndek etkl gözlemler belrlemek çn de önerlmektedr. Standart tam delta-beta prosedürünün yanı sıra, Storer ve Crowley (1985) genelleştrlmş yaklaşımı (augmented approach (AUG)) önerrken, Can ve Lange (1984) ve Red ve Crépeau (1985) etk fonksyonunu (nfluence functon (IF)) bu problem ncelemek çn kullanmışlardır. Wang v.d. (2006) tüm yaklaşımları karşılaştırmış ve AUG yaklaşımının daha üstün performansa sahp olduğunu göstermştr [30]. Regresyon modellerndek etkl gözlemler belrlemek çn Atknson and Ran (2000) lerye doğru araştırma yöntem (forward search method) olarak adlandırılan alternatf br yöntem önermştr. Bu yaklaşım aykırı değer çermeyen lk altküme le başlar. Etkl gözlemler, bu alt kümeye değşkenler eklendkçe lglenlen parametrede oluşan değşklklere bakılarak belrlenr. Bu yaklaşım yaşam çözümlemesnde etkl gözlemler belrlemek çn de kullanılmıştır. Burada lk altkümenn hangs olacağı ve değşkenlern bu altkümeye grş sırası her gözlemn artık karelernn sıralanması le belrlenmştr. Gözlemlern, altkümeye grşte hesaplanan statstkler üzerndek etkler devamlılık eğrler le gözlemleneblr. İlglenlen statstkte büyük etkye sahp olan gözlemler belrlemek çn br bast statstk önerlmştr [30]. Brçok model kontrol yöntemler artıklara ve artıkların analzne dayanmaktadır. Uygulanan model yeterl olduğunda, her değşken çn çalışmada hesaplanablecek değerler ve en azından yaklaşık olarak blnen davranış özellkler vardır [1]. 21

Yaşam çözümlemesnde, başlıca artık türler; a) Cox-Snell artıkları b) Martngale artıkları c) Sapma artıkları d) Schoenfeld artıkları e) Log-odds artıkları f) Normal sapma artıkları olarak fade edleblr. Aşağıda artık türlernn anlatılmasında kullanılacak bazı eştlkler verlmştr: t1 t2... td başarısızlık sürelern ve d, t zamanındak başarısızlık sayılarını göstersn. Brkml temel tehlke oranı tahmn edcs; d H 0 (t) (3.1) exp( Z (s)) t t j jr ( t ) bçmndedr. Burada, tahmn regresyon katsayılarını, Z j ler de açıklayıcı değşkenler göstermektedr. t H ( t) h ( u) d u 0 0 0 olarak verlr ve bu gözlemlenen başarısızlık sürelernde sıçramalar le br adım fonksyonudur. Burada h ( ) 0 u temel tehlke fonksyonunu göstermektedr. 3.1. Cox-Snell Artıkları Cox-Snell artıkları, yaşam verlernn çözümlenmesnde en yaygın kullanılan artık türüdür ve Cox ve Snell tarafından önerlmştr [3]. Bu artıklar, modeln uygunluğunu değerlendrmek çn kullanılablr.. gözlem çn Cox-Snell artığı, r ( ) exp( c H ' ) 0 t Z (3.2) bçmndedr. Burada H ( ) 0 t, Eştlk (3.1) de verldğ gbdr. 22

Eğer seçlen model verye uygunsa ve β değerler değerlerne yakınsa o zaman r c ler brm üstel dağılımlı durdurulmuş br örneklem gb dağılır [32]. Bu artıklar negatf değldr ve grafklernn yorumlanması zordur. Cox-Snell artıkları modele uyumu araştırmak çn çok kullanışlıdır. Ancak, tahmn edlen brkml tehlke grafğ doğrusal olmadığında bulunan modelden sapma türlern belrleyememektedr [33]. Cox-Snell artıkları, doğrusal regresyon analznde kullanılan artıklardan braz farklı özellklere sahptr. Bu özellkler; sıfır etrafında smetrk dağılmaz, sıfır le sonsuz arasında değer alır yan negatf olamaz, uygun model uydurulduğunda Cox-Snell artıklarının üstel dağılımlı olduğu varsayıldığından oldukça çarpık br dağılımı vardır ve. artığın ortalaması ve vayansı 1 olur, bçmnde verleblr. Dğer br nokta se eğer en büyük yaşam süres durdurulmamış se çn tanımsızdır [1]. r c bu gözlem H r ( r ) nn c c belrleneblr. Ama r c ye karşı grafğ br güven bandı çermeldr. Böylece önem r c ler tam olarak br dağılımın durdurulmuş br örneklem değldr. Yan bu grafk genellkle sadece kaba br tanı olarak kullanılır [33]. 3.2. Martngale Artıkları Martngale artıkları, Barlow ve Prentce tarafından önerlmştr [29]. Zamana bağlı olmayan açıklayıcı değşkenlerle Cox model çn,. gözlemn t zamanındak değer ve δ olay durumu ( δ 0 süres) se Martngale artığı, r m δ H 0 (t ) exp( ' Z ) δ rc (3.3) bçmndedr. ken t durdurma süres ve δ 1 ken t olay 23

Eştlk (3.3) te görüldüğü gb Martngale artıkları Cox-Snell artıklarının doğrusal dönüşümüdür. Martngale artıkları ve dönüşümler model belrlemede kullanılablr. Açıklayıcı değşkenlere karşı çzlen Martngale artıkları grafğ modele dahl edlen açıklayıcı değşkenlern fonksyonel formunu belrlemede kullanılır. Modeln uygunluğu çn değşkenlern herhang br dönüşüme htyacı olup olmadığını gösterr [34]. En uygun bçm belrlemek çn model kurulduktan sonra Martngale artıklarına karşı değşkenlern stenlen dönüşümlernn grafğ çzdrlr. Eğer dönüşüm uygun se grafktek eğr yaklaşık olarak doğrusal olur. Ayrıca aykırı değerler belrlemede de kullanılır [35]. Martngale artıkları, her brm çn gözlenen ve beklenen başarısızlık sayıları arasındak farkla lglenr. Çünkü hç br olayda br başarısızlıktan fazla başarısızlık olamaz varsayılır. Eştlk (3.3) ün knc faktörü (0, t ) aralığının üstündek brm çn başarısızlıkların brkml tehlkelernn tahmndr [33]. Martngale artıkları n rm 0 özellğne sahptr [32]. 1 Büyük n çn, rm ler sıfır ortalamalı ktleden lşksz örneklerdr. Ama sıfır etrafında smetrk değllerdr [33]. Martngale artıkları ve 1 arasında değer alır ve durdurulmuş gözlemler ( δ 0 ) çn artıklar negatf değer alır [1]. Martngale artıkları br değernn yakınlarında değer alıyorsa beklenenden daha kısa yaşam süres, büyük negatf br değer alıyorsa beklenenden daha uzun yaşam süres olduğu anlamına gelr. Doğrusal regresyon analzndek artıklarla benzer özellkler vardır. Fakat Martngale artıkları sıfır etrafında smetrk dağılmaz, çarpıktır [1]. Martngale artıkları genellkle konuya özeldr, çalışmanın sonunda hesaplanır ve tehlkenn logartmasında açıklayıcı değşkenlern doğrusal etkler varsayımının test edlmesnde yararlıdır [36]. Doğrusal olmama Cox orantılı tehlkeler modellernde karşılaşılablecek olası br problemdr. Martngale artıkları eğrsellğ saptamak çn açıklayıcı değşkenlere 24

karşı çzleblr. Ayrıca doğrusal modellerde bleşen-artı-artık (ya da kısm artık) grafkler oluşturmak çn de kullanılablr [37]. 3.3. Sapma Artıkları Sapma artıkları Therneau v.d. tarafından önerlmştr [5]. Sapma artıkları olan r d ler Martngale artıklarından dönüştürülmüştür ve r d sgn(r m ) 2[ r δ log(δ r )] m m (3.4) bçmndedr. Eştlk (3.4) te görüldüğü gb, smetrk br dağılım elde etmek çn Martngale artıklarının dönüşümüyle elde edlr. Sonuç olarak sapma artıkları sıfır etrafında smetrk dağılır ve yaklaşık olarak 1 standart sapmaya sahptr [32, 38]. sgn ( r m ) Martngale artıklarının şaretn göstermektedr. Bu nedenle sapma artıkları Martngale artıkları le aynı şarete sahptr [30]. Karekök alma şlem büyük negatf Martngale artıklarıyla lşklendrrken logartma fonksyonu Martngale artıklarını bre yaklaştırır. Bütün grafklerde, potansyel aykırı değerler büyük mutlak değer sapma artıklarına karşılık gelr. Durdurulmuş gözlemler çn sapma artıkları sıfır yakınlarında küme olarak yer alır [35]. Durdurma çok küçük oluğunda yan yüzde yrm beşten az oranda ya da yakın br değerde se, bu artıklar sıfır etrafında smetrktr ya da normal dağılıma oldukça yakındır. Yüzde kırktan daha fazla orandak durdurma çn se sıfır etrafındak artıklarla genş noktalar kümes normallk yaklaşımını bozar. Ama bu dönüşüm artıkların setlern smetrkleştrmede yardımcıdır [33, 5]. Martngale artıkları model uygun olsa ble çarpıktır ve bu çarpıklık artık grafklernn yorumlanmasını zorlaştırır. Sapma artık grafklernn yorumlanması se daha kolaydır. Böylece bu artıklar dğer artıklardan aşırı derecede farklı olan yaşam sürelerne sahp brmlern belrlenmesnde grafksel br araç olarak kullanılablr. Brçok araştırmacı aykırı değerler belrlemede sapma artık grafklern kullanmışlardır. Aykırı değerler tanımlamak çn herhang br hpotez test olmadan öznel akıl yürütme kullanılmıştır [30]. 25

Sapma artıkları beklenenden daha uzun yaşam süres olan gözlemler çn negatf ken beklenenden daha kısa yaşam süres olan gözlemler çn poztftr. Çok büyük ya da çok küçük değerler olması bu değerlern aykırı değer olduklarının gösterges olablr. Bu nedenle bu değerler dkkatle ncelenmeldr [38]. Başarısız olan gözlemlerde uyum yeterl se sapma artıkları ak gürültüye benzer bçmde dağılır. Durdurulmuş gözlemler çn se sapma artıkları sıfır yakınlarında küme olarak yer alır [39]. Açıklayıcı değşkenlere karşı artık grafğ çzleblr ve olağanüstü örüntüler modeln verlere y br uyumu olmadığını göstereblr. Ancak dkkat edlmeldr k durdurulmuş gözlemlern olması çarpıcı br örüntü oluşturablr ve bu modelle lgl br problem olduğu anlamı taşımaz [38]. 3.4. Schoenfeld Artıkları Cox orantılı tehlkeler modelnde kullanılan Cox-Snell, Martngale ve sapma artıklarının k dezavantajı söz konusudur. Bu dezavantajlar, artıkların ağırlıklı olarak gözlenen yaşam süresne bağlı olmaları ve brkml tehlke fonksyonunun tahmnn gerektrmesdr. Schoenfeld tarafından önerlen, skor artıkları olarak da adlandırılan Schoenfeld artıklarında bu sorunlar gderlmştr [8]. Bu yönüyle Schoenfeld artıkları, dğer artıklardan öneml br farklılık göstermektedr. Bu artıklarda, her brmn artığı çn tek br değer yerne, tahmn edlmş olan Cox orantılı tehlkeler modelnde yer alan her br açıklayıcı değşken çn brer tane olmak üzere değerler kümes yer almaktadır [1, 18]. Schoenfeld artıkları, değşkenn gerçek değer le ağırlıklı rsk skorlarının ortalaması arasındak farktır.. brm çn Schoenfeld artığı, S X jr ( t ) X jr ( t ) j exp( ' X ) exp( ' X ) j j olarak tanımlanır. Burada S, p açıklayıcı değşken sayısı olmak üzere, px1 boyutlu br vektördür ve S ( S,..., S ) ' şeklndedr.. brm ve k. açıklayıcı değşken çn Schoenfeld artıkları, 1 p 26

S k X k jr( t ) X jr( t ) jk exp( ' X ) exp( ' X ) j j bçmndedr. Burada X j. brm çn p sabt açıklayıcı değşken vektörüdür. j X jk se j. brmn k. açıklayıcı değşkenn değerdr. Bu nedenle, bu artık, X jk nın gözlenen değer le t zamanında rsk altındak brmler üzernden açıklayıcı değşken değerlernn ağırlıklı ortalaması arasındak farktır. t zamanındak rsk kümesnde k. açıklayıcı değşkenl j. brm çn kullanılan ağırlık, exp( ' X ) j exp( ' X ) jr ( t ) j bçmndedr. Bu fade, kısm olablrlğ en büyüklemeye bu brmn katkısıdır. Schoenfeld artıkları durdurulmamış gözlemler çn tanımlıdır ve ayrıca her br açıklayıcı değşkenn Scohenfeld artıkları toplamı sıfır olmalıdır [32]. Schoenfeld artıkları sıfırda toplanır. İk düzeyl (0,1) değşkenler çn bu artıklar -1 le 1 arasında değer alır. Bu nedenle, artık grafğnde k kuşak olur; br tanes x=1 çn sıfırın üstünde ve dğer x=0 çn sıfırın altında yer alır. Orantılı tehlkeler varsayımını ncelemek çn Schoenfeld artıklarına dayanan br test gelştrlmştr. Belrl br değşken çn Schoenfeld artıkları le brmlern yaşam sürelernn rankı arasındak korelasyon kullanılarak orantılı tehlkeler varsayımı nceleneblr. Bu teste göre, orantılı tehlkeler varsayımının sağlanması çn korelasyonun sıfıra yakın olması beklenmektedr [20]. Orantılı tehlkeler varsayımının geçerllğ zamana bağlı çzlen Schoenfeld artıkları grafğ le kontrol edleblr. Çzlen Schoenfeld artıkları grafğ, yatay br doğru etrafında seyredyorsa, orantılı tehlkeler varsayımının sağlandığı söylenlr [8]. Hosmer ve Lemeshow regresyon katsayılarının kovaryans matrsne dayalı ölçeklendrlmş Schoenfeld (scaled Schoenfeld) artıkları grafğnn orantılı tehlkeler varsayımı çn kullanılmasını önermştr [19]. 27

Ölçeklendrlmş Schoenfeld artıkları; * r kt m Vk S p 1 k bçmndedr. Burada m toplam başarısız brm sayısını, V se regresyon katsayılarından tahmn edlmş kovaryans matrsn göstermektedr. Ölçeklendrlmş Schoenfeld artıkları grafğ zamana karşı her br açıklayıcı değşken çn çzlr. Ölçeklendrlmş Schoenfeld artıkları etkl gözlemler bulmak çn kullanılır. Wnnett ve Sasen açıklayıcı değşkenler sürekl olduğunda ölçeklenmş Schoenfeld artıklarının kullanılmasını önermştr [24, 40]. İlglenlen olayla erken br zamanda karşılaşan brmler çn artıklar poztf olma eğlm gösterrse ve olayla geç br zamanda karşılaşan brmler çn artıklar negatf olma eğlm gösterrse, tehlke oranı zaman eksen boyunca sabt olmaz, bu durumda orantılı tehlkeler varsayımı sağlanmaz [20]. Schoenfeld artıklarının toplamı sıfır olmalıdır. Bu artıklar çn, büyük örneklerde S nn beklenen değernn sıfıra eşt olduğu ve artıkların bağımsız olduğu söyleneblr [1]. Bu artıkları kullanırken, t zamanında başarısızlık olasılıkları düşük olan brmler, t zamanında başarısızlık rsk altında olan brmlere göre, daha düşük değerl artıklara sahp olacaklardır. Dolayısıyla, başarısızlık rsk altında olan brmlere lşkn artıklar, başarısızlık rsk az olan brmlere lşkn artıklara oranla daha büyük olacaklardır [18]. Erken başarısızlığa uğrayan büyük ortak değşken değerlerne sahp brmler büyük poztf Schoenfeld artık değerlerne sahptr. Benzer şeklde erken başarısızlığa uğrayan küçük açıklayıcı değşken değerlerne sahp brmler büyük negatf Schoenfeld artıklarına sahptr. Bu nedenle, erken başarısızlık sürelernde mutlak değer olarak büyük artıklar özel br lgye neden olmayablr. Böylece, bu artıklar erken başarısızlık sürelernde aykırı ortak değşken değerlern tespt etmeye yardımcı olur. Ancak orantılı tehlkeler varsayımı sağlanıyorsa değer olarak büyük Schoenfeld artıklarının geç başarısızlık sürelernde görünmeler 28

beklenmez. Bu nedenle, geç başarısızlık sürelernde artıklar kontrol edlmeldr [33]. 3.5. Log-Odds Artıkları Log-odds artıkları, Nard ve Schemper tarafından verlmş ve L le gösterlmştr [7]. Log-odds artıklarının dağılımı E( L ) 0 ortalama ve lojstk dağılımdır ve L log S ( T )/ 1- S ( T ) V L 2 ( ) ( / 3) varyans le bçmndedr. Blnmeyen yaşam fonksyonu yerne tahmn edcs alındığında L, L ye yakınsar. Gözlenen yaşam süreler t (1 n) olduğunda, L nn gözlenen değer, l log ( )/ 1- ( ) S t S t olur. c Durdurulmuş süre çn S t yaşam olasılığı blnmemektedr. Dolayısıyla durdurulmuş yaşam süres artıklarını uyarlamak çn, c S ( t ) le koşullu ortanca ( c S t ) değer 2 değerler, nn yer değştrmesn önerlmştr. Bu durumda m l log-odds artık l c log / 2- S c c t S t bçmnde elde edlr. L nn koşullu dağılımından beklenen ortalama değerlern sapması kullanıldığında se daha karmaşık olmakta ve c m c c l l l 1 exp( l ) log 1 exp( ) c l exp( ) bçmnde elde edlmektedr. Durdurulmuş yaşam sürelernde beklenen ortalama ve ortanca değerlernn artıkları elde edlrken kısa durdurulmuş yaşam sürelernden gelen blgler, onları 29