T.C. İSTANBUL ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ ( YÜKSEK LİSANS TEZİ ) YAŞAM VERİLERİNİN ÇÖZÜMLENMESİNDE UYGUN REGRESYON MODELİ SEÇME YÖNTEMLERİ

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "T.C. İSTANBUL ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ ( YÜKSEK LİSANS TEZİ ) YAŞAM VERİLERİNİN ÇÖZÜMLENMESİNDE UYGUN REGRESYON MODELİ SEÇME YÖNTEMLERİ"

Transkript

1

2 KEMAL OLÇA İSTANBUL ÜNİVERSİTESİ SAĞ. BİL. ENST. YÜKSEK LİSANS TEZİ İSTANBUL-2014 T.C. İSTANBUL ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ ( YÜKSEK LİSANS TEZİ ) YAŞAM VERİLERİNİN ÇÖZÜMLENMESİNDE UYGUN REGRESYON MODELİ SEÇME YÖNTEMLERİ KEMAL OLÇA DANIŞMAN PROF. DR. AHMET DİRİCAN BİYOİSTATİSTİK ANABİLİM DALI BİYOİSTATİSTİK VE TIP BİLİŞİMİ PROGRAMI İSTANBUL-2014

3 ii TEZ ONAYI İstanbul Üniversitesi Sağlık Bilimleri Enstitüsü İstanbul Tıp Fakültesi Biyoistatistik ve Tıp Bilişimi Anabilim Dalı Biyoistatistik ve Tıp Bilişimi Programında Kemal OLÇA tarafından hazırlanan Yaşam Verilerinin Çözümlenmesinde Uygun Regresyon Modeli Seçme Yöntemleri başlıklı Yüksek Lisans tezi, yapılan tez sınavında Jürimiz tarafından başarılı bulunarak kabul edilmiştir.. / / /. Tez Sınav Jürisi Ünvanı Adı Soyadı (Üniversitesi, Fakültesi, Anabilim Dalı) İmzası

4 iii BEYAN Bu tez çalışmasının kendi çalışmam olduğunu, tezin planlanmasından yazımına kadar bütün safhalarda etik dışı davranışımın olmadığını, bu tezdeki bütün bilgileri akademik ve etik kurallar içinde elde ettiğimi, bu tez çalışmayla elde edilmeyen bütün bilgi ve yorumlara kaynak gösterdiğimi ve bu kaynakları da kaynaklar listesine aldığımı, yine bu tezin çalışılması ve yazımı sırasında patent ve telif haklarını ihlal edici bir davranışımın olmadığı beyan ederim. KEMAL OLÇA (İmza)

5 iv İTHAF Tuna Çakır a ithaf ediyorum

6 v TEŞEKKÜR Yüksek lisans öğrenimim boyunca değerli yardım ve katkılarıyla beni yönlendiren danışmanım Prof. Dr. Ahmet DİRİCAN a, bu olanağı sağlayan saygıdeğer hocam İstanbul Tıp Fakültesi Biyoistatistik ve Tıp Bilişimi Anabilim Dalı Başkanı Prof. Dr. Rian DİŞÇİ ye ve uygulama verilerinin kullanımı için Çerrahpaşa Tıp Fakültesi, Patoloji Anabilim Dalı Öğretim Üyesi Prof. Dr. Sibel ERDEMAR ÇETİN e teşekkür ederim.ayrıca çalışmada desteklerini esirgemeyen Anabilim Dalı çalışanlarına ve aileme teşekkür ederim.

7 vi İÇİNDEKİLER TEZ ONAYI... İİ BEYAN... İİİ İTHAF... İV TEŞEKKÜR... V İÇİNDEKİLER... Vİ TABLOLAR LİSTESİ... X ŞEKİLLER LİSTESİ... Xİİ SEMBOLLER / KISALTMALAR LİSTESİ... Xİİİ ÖZET... XİV ABSTRACT... XV 1 GİRİŞ VE AMAÇ GENEL BİLGİLER Sağkalım Analizi Veri Yapısı ve Veri Türleri Sansürleme Çeşitleri Sağdan Sansürleme Soldan Sansürleme Aralık Sansürlemesi İkili Sansürleme Yaşam Verilerinin Önemli Fonksiyonları Sağkalım Fonksiyonu Olasılık Yoğunluk Fonksiyonu Hazard Fonksiyonu Parametrik Bazı Önemli Dağılım Modelleri Üstel Dağılım Weibull Dağılımı Lognormal Dağılım Loglojistik Dağılım Gamma Dağılımı Fonksiyon Tahmininde Parametrik Olmayan Yöntemler... 16

8 vii Yaşam Tablosu Yöntemi Kaplan-Meier Yöntemi Açıklayıcı Değişkenler Bulunmayan Yaşam Verileri için Parametrik Çözümler Sağ Sansürleme ve Olabilirlik Üstel ve Weibull Dağılımların Parametreleri Tahminleri Üstel Dağılımda Parametre Tahmini Weibull Dağılımda Parametre Tahmini Uyum İyiliği ve Dağılım Seçme Logaritmik Olabilirlik Oranı İstatistiği ile Hipotez Testleri BIC veya AIC Prosedürleri ile Dağılım Seçimi Sağkalım Dağılımlarının Karşılaştırılması Logrank Testi Kruskal-Wallis Testi Peto ve Peto nun Geliştirilmiş Gehan-Wilcoxon Testi Yarı Parametrik Regresyon Modelleri Cox Oransal Hazard Regresyon Modelli Cox Modeli için Olabilirlik Tahmini Oransal Hazard Varsayımı Doğrulanması Modelin Katsayılarının Anlamlılık Testleri Oransal Olmayan Hazard için Regresyon Modelleri Tabakalandırılmış Cox Regresyon Modeli Zamana Bağlı Açıklayıcı Değişkenli Cox Regresyon Modeli Parametrik Regresyon Modelleri Parametrik Oransal Hazard Modelli Üstel ve Weibull Oransal Hazard modeli İvmelendirilmiş Başarısızlık Zaman Modeli İvmelendirilmiş Başarısızlık Zaman Modeli için Olabilirlik Tahmini Weibull İvmelendirilmiş Başarısızlık Zaman Modeli Üstel İvmelendirilmiş Başarısızlık Zaman Modeli Loglojistik İvmelendirilmiş Başarısızlık Zaman Modeli Lognormal İvmelendirilmiş Başarısızlık Zaman Modeli Zayıflık Modelleri Paylaşılmamış Zayıflık Modeli... 45

9 viii Paylaşılmamış Zayıflık Modeli Olabilirlik fonksiyonu Paylaşılmış Zayıflık Modeli Paylaşılmış Zayıflık Modeli Olabilirlik fonksiyonu Yarışan Riskler Modeli Farklı Olay Tipleri için Ayrık Modeller Tekrarlayan Olaylar Modeli Sayma Süreci Yaklaşımı Tabakalı Cox Modeli Yaklaşımı Parametrik Modellerde Uygun Değişkenler ve Modeli Belirleme Bilinen Regresyon Modelinde Açıklayıcı Değişkenleri Seçme Yöntemleri İleri Doğru Seçme Yöntemi Geriye Doğru Seçme Yöntemi Adımsal Seçme Yöntemi AIC ve BIC Ölçütleri Açıklayıcı Değişkenleri Belirlenmiş Modellerden Uygun Modelli Seçme Yöntemleri AIC ve BIC Ölçütleri ile Model Seçimi Parametrik Modeller için Artık Analizi Cox-Snell Artıkları Martingale Artıkları Sapma Artıkları Schoenfeld Artıkları GEREÇ VE YÖNTEM Açıklayıcı Değişkenlerin Düzenlenmesi R İstatistiksel Programlama Dili İki Yaş Grubunun Sağkalım Fonksiyonlarının Karşılaştırılması Regresyon Modelleri için Kullanılan R Fonksiyonları Model Değişkenlerinin Belirlenmesinde Adımsal Seçme Yöntemi Regresyon Modellerinin Araştırılması ve Seçilen Uygun Değişkenler Cox Oransal Hazard Modeli Oransal Hazard Varsayımı Denetimi Uygun Değişkenlerin Belirlenmesi Parametrik Oransal Hazard Modelleri... 69

10 ix Oransal Hazard Varsayımı Denetimi Uygun Parametrik Oransal Hazard Modelinin Belirlenmesi Parametrik İvmelendirilmiş Başarısızlık Zaman Modelleri Belirlenen Regresyon Modellerinin Karşılaştırılması BULGULAR İki Yaş Grubunun Sağkalım Fonksiyonlarının Karşılaştırılması Testi Regresyon Modelleri TARTIŞMA KAYNAKLAR ÖZGEÇMİŞ... 87

11 x TABLOLAR LİSTESİ Tablo 2-1: Kullanılan bazı parametrik dağılımların hazard, sağkalım ve olasılık yoğunluk fonksiyonları Klein ve Moeschberger (2003) den Tablo 2-2: Gözlenen verilere uygun model ailelerinin uyum iyiliği testlerin özetleri - Lee ve Wang (2003) tan Tablo 2-3: Sayma süreci yaklaşımı veri düzenlenmesi - Kleinbaum ve Klein, (1996) den Tablo 3-1:Kukla Değişkenlerin Oluşturulması Tablo 3-2: Değerlendirilcek açıklayıcı değişkenler Tablo 3-3: Logrank ve Peto & Peto nun geliştirilmiş Gehan-Wilcoxon testleri R uygulama kodları Tablo 3-4: Parametrik ve Cox oransal hazard regresyon modelleri için seçilen uygun değişkenler Tablo 3-5: Parametrik ivemelendirilmiş başarısızlık zaman regresyon modelleri için seçilen uygun değişkenler Tablo 3-6: Cox oransal hazard regresyon modeli için oransal hazard varsayımı denetlemesi Tablo 3-7: Zamana bağlı genişletilmiş Cox oransal hazard regresyon modeli için oransal hazard varsayımı denetlemesi Tablo 3-8: Model katsayılarının Schoenfeld (Skor) artıklarının toplamları Tablo 3-9: Parametrik oransal hazard regresyon modelleri için seçilen değişken kümeleri Tablo 3-10: AIC, BIC ve Wald istatistiği ile seçilen Parametrik oransal hazard modelleri Tablo 3-11: Parametrik ivmelendirilmiş başarısızlık zaman modellerinin AIC, BIC ve Wald istatistiği değerleri Tablo 3-12: Parametrik ivmelendirilmiş başarısızlık zaman modellerinden AIC, BIC ve Wald istatistiği değerleri ile seçilen en uygun modeller Tablo 3-13: Parametrik ivmelendirilmiş başarısızlık zaman modellerinin AIC, BIC ve Wald istatistiği değerleri Tablo 4-1: Logrank Testi Sonuç Tablosu... 79

12 xi Tablo 4-2: Peto & Peto nun geliştirilmiş Gehan-Wilcoxon Testi Sonuç Tablosu Tablo 4-3: Cox oh ile Lognormal oh ve aft regresyon modelleri sağkalım fonksiyonu denklemleri... 80

13 xii ŞEKİLLER LİSTESİ Şekil 2-1: Bir sağkalım çalışmasında 8 hastanın çalışma süresi- Collett (2004) den...4 Şekil 2-2: İki sağkalım eğrisi örneği- Lee ve Wang (2003) dan...7 Şekil 2-3: İki yoğunluk eğrisi örneği- Lee ve Wang (2003) dan...9 Şekil 2-4: Hazard fonksiyonu örnekleri- Lee ve Wang (2003) dan Şekil 2-5: için olasılık yoğunluk eğrileri-lawless (2002) ten Şekil 2-6: için hazard fonksiyonu eğrileri- Lawless (2002) ten Şekil 3-1: Adımsal (Stepwise) seçme yöntemi algoritmik akış şeması Şekil 3-2: İki modelin tabakalandırılmış ctxflr değişkeni ile S(t) eğrileri Şekil 3-3: Cox-Snell, Martingale ve Sapma artıkları grafikleri Şekil 3-4: Parametrik kümülatif bazal ve Kaplan-Meier hazard fonksiyonları karşılaştırılması Şekil 3-5: Ctxflr değişkenince lognormal ve Weibull modelleri logaritmik kümülatif hazard eğrileri Şekil 3-6: Parametrik oransal hazard modellerinin logaritmik kümülatif hazard eğrileri Şekil 3-7: fit_1, fit_2 ve fit_3 modellerinin kümülatif hazard ve sağkalım eğrileri Şekil 3-8: fit_1, fit_2 ve fit_3 modelleri Sapma artıkları için eğriler Şekil 3-9: fit_1, fit_2 ve fit_3 modelleri Cox-Snell Artıkları eğrileri Şekil 3-10: fit_1, fit_2 ve Kaplan-Meier kümülatif hazard eğrileri karşılaştırılması Şekil 3-11: Regresyon modelleri kümülatif hazard fonksiyonları karşılaştırılması Şekil 3-12: Regresyon modelleri Sağkalım fonksiyonları karşılaştırılması Şekil 4-1: İki yaş grubunun Kaplan-Meier Sağkalım Fonksiyonları... 79

14 xiii SEMBOLLER / KISALTMALAR LİSTESİ log : e Tabanında Doğal Logaritma Fonksiyonu ln AFT: İvmelendilmiş Başarısızlık Zaman OH: Oransal Hazardlar MLE: En Çok Olabilirlik Tahmini CIF: Kümülatif Oran Fonksiyonu AIC: Akaike Information Criterion BIC: Bayesian Information Criterion CEA: Carcino Embryionic Antigen CA19.9: Carbohydrate Antigen 19-9 (Sialylated Lewis (a) Antigen)

15 xiv ÖZET OLÇA, K. (2014). Yaşam Verilerinin Çözümlenmesinde Uygun Regresyon Modeli Seçme Yöntemleri. İstanbul Üniversitesi Sağlık Bilimleri Enstitüsü, Biyoistatistik A.D. Yüksek Lisans Tezi. İstanbul. Sağkalım analizi, olguların ortak bir başlangıç noktasından sonra araştırmanın konusu olan özel bir sonuca ulaşmasının izleme zamanına bağlı olarak değerlendirilmesidir. Bir hastalığa maruz kalmış bireylerin yaşam sürelerinin modellenmesi, hastalığın seyri ve hastalığı etkileyen faktörlerin saptanmasında önemli bir yaklaşımdır. Parametrik ivmelendirilmiş başarısızlık zaman modelleri, oransal hazard modelleri ve Cox yarıparametrik oransal hazard modeli yaşam verilerinin modellenmesinde sıklıkla kullanılan regresyon modelleridir. Çalışmanın amacı, zamana bağlı izleme çalışmalarında kullanılan ve verileri en iyi açıklayan regresyon modelinin saptanması, model seçme yöntemlerinin incelenmesi ve uygulanan modellerin performanslarının değerlendirilmesidir. Sıklıkla kullanılan AIC ve BIC ölçütleri ile Wald test istatistiği değeri çalışmada kullanılan karar yöntemleridir. Her seçim yöntemleri aracılığı ile, adımsal (stepwise) seçme algoritması kullanılarak modeller için anlamlı açıklayıcı değişkenler belirlenmiştir. Çalışmamızda, Parametrik model tipleri için, her seçim ölçütü ile bir model belirlenmiş, bu modeller artık analizi ile karşılaştırılıp en uygun model tespit edilmiştir. BIC ölçütünün en iyi performansa sahip olduğu görülmüştür. Paramerik Weibull oransal hazard ve lognormal ivmelendirilmiş başarısızlık zaman regresyon modelleri uygulamadaki yaşam sürelerine dair en iyi regresyon modellerini oluşturmaktadır. Sonuç olarak, parametrik regresyon modelleri yaşam sürelerini çözümlemede anlamlı sonuçlar vermektedir. Geniş örneklemlerde BIC ölçütü açıklayıcı değişkenlerin belirlenmesi ve model seçimlerinde diğer ölçütlere göre daha başarılı bir yöntem olarak gözükmektedir. Anahtar Kelimeler : Parametrik İvemelendirilmiş Başarısızlık Zaman Modelleri, Parametrik Oransal Hazard Modelleri, Cox Oransal Hazard Modeli, AIC, BIC.

16 xv ABSTRACT OLÇA, K. (2014). In Analysis of Survival Data Appropriate Regression Models Selection Methods. İstanbul University, Institute of Health Science, Department of Biostatistics M.Sc. Thesis. İstanbul. Survival analysis is a method of statistics which deals with analysis of time to events, such as death and failure in biological organisms. Modeling to life time of individuals who have caught a disease, is important way to explain duration of disease and factors that have effect on disease.cox proportional hazards, parametric accelerated failure time and parametric proportional hazards models are regression models that are commonly used in modelling life time data. The aim of this study, investigate to selection methods of appropriate regression models for life time data. AIC, BIC measures and Wald test statistics are selection measures that used in application of study. Those decision values are used with stepwise selection algorithm for determination significant explanatory variables of each models. Moreover, one model is determined by each selection measures from parametric models for each type of parametric models. By residuals analysis, most significant parametric models are determined for each type of models. With this analysis the models that are selected by BIC, are determined most significant models. Parametric Weibull proportional hazards and Lognormal accelerated failure time regression models are most significant models for our data. In conclude, parametric regression models can provide significant approaches for life time data and if there is large sample, BIC measure can be successful for determination explanatory variables and selection of most significant models than other measures. Key Words: Parametric Accelerated Failure Time Models, Parametric Proportional Hazards Models, Cox Proportional Hazards Model, AIC, BIC.

17 1 GİRİŞ VE AMAÇ Sağkalım analizi, tanımlanmış ortak bir başlangıç noktasından özel bir sonucun (ölüm gibi) gerçekleşmesine kadar geçen süreye ait verilerin analizi olarak tanımlanmaktadır [1]. Başlangıç noktası, söz konusu hastalığın tanısı veya tedavinin başlangıcı başlangıcı olabilir. Araştırma esnasında bazı deneklerle iletişim kesilebilir veya çalışma beklenen olayın gerçekleşmesinden önce son bulabilir. Bu nedenle bazı deneklere ait veriler sansürlü (kayıp) olabilmektedir. Yaşam sürelerinin modellenmesi, araştırılan belirli bir hastalığın izleme sürecinin çözümlenmesinde ve etki eden faktörlerin araştırılmasında önemli bir yere sahiptir. Analiz edilen süreler farklı tipte teorik bir dağılımlara sahip olabilir. Yaşam sürelerinin dağılımı genellikle üç fonksiyonla tanımlanır: sağkalım fonksiyonu, olasılık yoğunluk fonksiyonu ve hazard fonksiyonudur. Bu üç fonksiyon verileri farklı yönleriyle tanımlamada kullanılabilir. Bununla birlikte örneklenen verilerin bu üç fonksiyon türünden ve popülasyondaki dağılım modelinden sağlanan çıkarımlardan tahminler yürütülebilmektedir [2]. Yaşam sürelerinin modellenmesi ile birlikte sürelere etki eden faktörlerin de belirlenmesi regresyon modelleri ile mümkündür. Regresyon modelleri ile uygulanan tedaviler, hastaların yaş, cinsiyet vb. özelliklerinin yaşam sürelerine ne ölçüde etkiledikleri ve etkilerinin anlamlı olup olmadıkları araştırılabilmektedir. Sağkalım analizinde sıklıkla kullanılan regresyon modelleri tipleri Cox oransal hazard, parametrik ivmelendirilmiş başarısızlık zaman ve parametrik oransal hazard modelleridir. Parametrik regresyon modellerinden veriyi en iyi şekilde ifade edebilen modelin seçimi bazı ölçütler baz alınarak yapılabilmektedir. Benzer şekilde dağılım modelinin anlamlılığını arttıracak açıklayıcı değişkenlerin belirlenmesi aynı ölçütler ile sağlanabilmektedir. Böylece zaman verilerini en iyi açıklayabilen modeller kurulabilmektedir. Yapılan bu çalışmada, uygulamadaki zaman verilerini en iyi açıklayan modeller belirlenecek ve modellerinin anlamlılığını arttıracak açıklayıcı değişkenler tespit edilecektir. Aynı zamanda modellerin seçilmesinde kullanılan ölçütler incelenecektir. Ölçütlerin belirlediği modellerde karşılaştırmalar yapıldıktan sonra, artık analizi

18 2 uygulanacaktır. Böylece çözümlemedeki çalışmadaki yaşam verilerini en iyi ifade eden modelin ortaya konmasındaki en başarılı seçme yöntemi belirlecenecektir.

19 3 2 GENEL BİLGİLER 2.1.Sağkalım Analizi Belirli bir hastalığa yakalanan bireylerin, hastalığın teşhisi ile uygulanmaya başlanan tedavi yöntemleriyle yaşayabileceği süreyi tahmin etmek için veya çeşitli tedavi yöntemlerinin hayatta kalma süresine etkisini araştırmak için geliştirilmiş olan yöntemler bütünü Sağkalım Analizi olarak adlandırılır. Hastalık olgularında, hastaların herhangi bir tıbbi ya da cerrahi girişimden (ilaç ile tedavi, ameliyat, ilaç+ameliyat v.b.) sonraki yaşamlarının süreleri, gün, ay, yıl gibi sürelerdir. Sağkalım analizi yöntemleri, yaşam sürelerini, diğer faktör değişkenlere sahip veri setlerinde yaşam olasılıkları, ölüm olasılıkları, ortalama yasam süresi, ortanca yasam süresi tahminleri yapmayı amaçlayan yöntemlerdir [3]. Sağkalım analizi yalnız insanlar üzerinde olmamakla hayvanların kullanıldığı laboratuar deneylerinde de uygulanabilir. Ayrıca mekanik parçaların ve elektronik eşyaların farklı şartlar altında dayanma süreleri de sağkalım analizi ile tahmin edilebilir. Sağkalım analizinde belirli bir sürede belirli sayıda incelenen bireylerin sağkalım sürelerinin dağılımı incelenip uygun modeller kurulur ve bu modellere göre parametre tahminleri yapılır. Sağkalım analizinde kullanılan başarısızlık terimi, incelenen konunun denekte görülmesi durumudur. Canlılar için genelde ölüm veya hastalık, mekanik aletler için ise bozulma anlamına gelir [4] Veri Yapısı ve Veri Türleri Yaşam verilerinin en önemli özelliği sansürlü (kayıp) oluşudur. Bu durum bireyin yaşam süresi hakkında tam bir bilgi elde edilemeyeceği anlamına gelir. Birçok istatistiksel çalışmada, ele alınan örneğin ilgili kitleden çekildiği kabul edilir. Farklı kitleden çekilen bir örnek yanlış bilgi verir. Aynı zamanda kitleden seçilecek örnekler tesadüfi olarak belirlenmelidir. Tipik bir çalışmada, hastalar aynı zamanda tamamen iyileşmemekte ancak artan aylar veya hatta yıllar süren dönem sonunda sonuca ulaşabilmektedir. İyileşme sonrasında, hastalar ölüme kadar veya bir takvimde belirlenen çalışma sonuna kadar takip edilir ve veriler analiz edilir.

20 4 Gerçek yaşam süreleri için belli sayıda hasta gözlemlenebilmesine rağmen, iyileşme sonrasında diğerleri çalışma sonuna kadar hayatta olurken bazı hastalar ile iletişim kopmasıyla denekler kaybolmaktadır. Bir klinik denemede 8 birey için çalışma süresi, çalışmaya giriş zamanı noktalar ile temsil edilmiş Şekil 2.1 de şematik olarak gösterilmiştir. Bireylerden 1, 4, 5 ve 8 çalışma süresince ölmüş (D), bireylerden 2 ve 7 kayıp (L) ve çalışma bitene kadar bireylerden 3 ve 6 hayatta(a) kalmışlardır [1]. Şekil 2-1: Bir sağkalım çalışmasında 8 hastanın çalışma süresi- Collett (2004) den Bir hastanın çalışmada harcadığı zaman periyodu hastanın çalışmaya giriş zaman noktasıyla hesaplanır ve hasta süresi olarak anılır. Bir hastanın başlangıçtan ölüme (D) kadar olan zaman periyodu o zamanki yaşam süresidir ve birey 1 ve 4 için herhangi bir sansür bulunmamaktadır. Veriler sansürlü veya sansürsüz olabilir. Çalışmaya başladıktan sonra çalışma sonlanıncaya kadar geçen zamanda gözlenen birey ölüyorsa veya incelenen alet ise bozuluyor ise bu sansürsüz gözlemdir. Ayrıca bireyin ölüm süresi tam olarak bilinmiyor ise bu sansürlü gözlem olarak adlandırılır. Burada gözlem bireyi işlemden vazgeçmiş de olabilir [1].

21 Sansürleme Çeşitleri Sansürleme sağdan ve soldan sansürleme olarak iki ana gruba ayrılır. Sağdan ve soldan sansürlemeler kullanılarak elde edilen aralık sansürlemesi ve ikili sansürleme çeşitleri bulunmaktadır Sağdan Sansürleme Başarısızlık olayı çalışmanın belirli durma zamanına kadar gerçekleşmeyip bu zamanın sağ tarafına geçer. Bu durumda yaşam süresi kesin bilinememektedir. Bu tip sansürlemeye sağdan sansürleme denir. Sağdan sansürleme 1. tür sansürleme (Type 1 Censoring), 2. tür sansürleme (Type 2 Censoring), bağımsız rastgele sansürleme (Independent Random Censoring) ve ilerletilmiş 2. tür sansürleme (Progressive Type 2 Censoring) olarak gruplara ayrılmaktadır [5]. 1. tür sansürlemede bireyler sürece herhangi bir zamanda dahil olur ve belirli durma zamanına kadar takip edilirler. bireyin gözlenebildiği süre ve sansürleme zamanı olsun. çalışmanın başlangıcı ile bitiş zamanı arasında sabit bir sayıdır. 1. tür sansürleme için genel gösterim ise ve şeklindedir. 2. tür sansürlemede, başlangıçta belirlenmiş bir başarısızlık sayısı vardır. n tane gözlem aynı anda gözlemlenir ve çalışma başında belirlenmiş sabit r tane başarısızlık halinde çalışmaya son verilir. Çalışma süresi r inci başarısızlık zamanına ye eşittir. Bağımsız rastgele sansür modelinde sansürleme süreci başarısızlık zamanı ile ilişkilidir. Sonlandırma zamanı rastgele olmakta ve çalışma öncesinde belirli değildir daha sonradan seçilmiş bir süredir. Bu seçim çalışmanın sonuçlarından etkilenerek belirlenir. Yaşam süresi T ve L sansürleme zamanı ise T ile L rastgele değişkenleri bağımsız sürekli rastgele değişkenleridir. İlerletilmiş 2. tür sansürleme 2. tür sansürlemenin genelleştirilmiş halidir. Bu tür sansürlemede, gözlemlenen n tane bireyden, başarısız olan tane birey izlenir. Kalan tane bireyden tanesi çalışmadan uzaklaştırılır. ise çalışmada kalan birey sayısıdır. Kalan bireylerden tanesi çalışmadan alınıp kalan bireyler ile çalışmaya devam edilir. İşleyiş bu şekilde devam ettirilir [5].

22 Soldan Sansürleme sansürleme zamanı ve bireyin yaşam süresi olma üzere, oluyor ise bu bireyin yaşam süresi soldan sansürlenmiştir denir. Soldan sansürlemenin genel gösterimi ise şeklindedir [5] Aralık Sansürlemesi Aralıklı sansürlemesi genellikle takip gerektiren olaylarda kullanılır. Başarısızlığın meydana gelme süresi bir aralık içinde ifade edilir. Yaşam süresi T aralığında yer almaktadır. Aralık sansürlemesi sol sınır noktası 0 ve sağ sınırı ise sağdan sansürlemenin genelleştirilmiş biçimi ifade edilir. Sol sınır noktası, sağ sınırı ise ( ) olarak alınıyor ise soldan sansürlemenin genelleştirilmiş şekli elde edilir [4] İkili Sansürleme Bazı çalışmalarda soldan sansürleme ve sağdan sansürleme aynı zamanda ortaya çıkabilir. Böyle durumlarda yaşam süresi T ikili sansürlenmiş olur. başarısızlığın gerçekleşmesinden önce, ise bireyin başarısızlık zamanından sonraki zaman olsun. Eğer yaşam süresi, yada ise yaşam süresi kesin olarak bilinmiyor demektir [4] Yaşam Verilerinin Önemli Fonksiyonları Yaşam süresi verileri belirli bir olay, başarısızlık, ölüm, tepki, nüksetme, belirli bir hastalık gelişimi veya ayrılma sürelerinin ölçümlerinden oluşur. Bu süreler rastgele varyasyonlar, ve bazı rastgele değişkenler gibi bir dağılım şekline sahiptir. Yaşam sürelerinin dağılımı genellikle üç fonksiyonla tanımlanır veya karakterize edilir: sağkalım fonksiyonu, olasılık yoğunluk fonksiyonu ve hazard fonksiyonudur. Bu üç fonksiyon matematiksel olarak eşdeğerdir. Bir tanesi verilmişse diğerleri türetilebilir. Uygulamada, bu üç fonksiyon verileri farklı yönleriyle tanımlamada kullanılabilir. Bununla birlikte örneklenen verilerin bu üç fonksiyon türünden ve popülasyondaki dağılım modelinden sağlanan çıkarımlardan tahmin yürütülür. Bir bireyin veya sistemin yaşam süresi (ömrü) T ratsgele değişkeni ile ifade edilsin. T nin dağılımı üç eşdeğer fonksiyonla karakterize edilir [2].

23 Sağkalım Fonksiyonu Bir bireyin belli bir t zamanından daha fazla yaşaması olasığı sağkalım fonksiyonu ile ifade edilir. Bu fonksiyon, ile gösterilir ve olmasının olasılığı olması koşulu ile Denklem 2.1 ile ifade edilir. nin Birikimli dağılım fonksiyonu ise, olmasının olasılığıdır. fonksiyonu azalan fonksiyondur, Çünkü zaman sıfır ise sağkalım olasılığı 1 ve zaman ilerler sonsuz değer alırsa sağkalım olasılığı 0 a doğru gider. S(t) fonksiyonu aynı zamanda sağkalım oranı olarak da bilinir. S(t) nin grafiği sağkalım eğrisi olarak adlandırılır. Dik bir sağkalım eğrisi, şekil 2.2 a'daki gibi, düşük sağkalım oranını veya kısa sağkalım süresini temsil etmektedir. Şekil 2.2 b'deki gibi kademeli veya düz sağkalım eğrisi ise yüksek sağkalım oranını veya uzun yaşamı temsil etmektedir [2]. Şekil 2-2: İki sağkalım eğrisi örneği- Lee ve Wang (2003) dan Sağkalım fonksiyonu veya sağkalım eğrisi, yaşam süresinin 50'inci çeyreği (medyan) ve diğer çeyrekleri (25 ve 75'inci) ve iki veya daha çok grubun dağılımları karşılaştırılarak bulunur. Medyan şekil 2.2a ve b de yaklaşık olarak sırasıyla zamanın 5'inci ve 36'ıncı birimlerindedir. Ortalama ise genellikle bir dağılımın merkezi eğilimini tanımlamak için kullanılır, ama yaşam verileri dağılımlarında medyan sıklıkla daha

24 8 sağlıklıdır. Çünkü az sayıda bireyler uzun veya kısa yaşam süreleriyle yaşam süresinin ortalamasının orantısızca büyük ve küçük olmasına neden olur. Pratikte, eğer herhangi bir sansürlü gözlem yoksa, sağkalım fonksiyonu hastaların yaşam süreleri t'den daha uzun olarak Denklem 2.2 ile tahmin edilir. Sansürlü gözlemler mevcut olduğu zaman Denklem 2.2 nin payı her zaman tespit edilemez. Örneğin takip eden sağkalım verileri kümesini düşünün: 4, 6, 6+, 10+, 15, 20. Denklem 2.2 kullanılırken olarak hesaplanır. Ayrıca, 11 den daha uzun sağ olan hasta sayısı tam bilinmediğinden i hesaplayamayız. Her iki durumda da üçüncü ve dördüncü hasta (6 ve 10) 11 den daha fazla veya az hayatta kalabilir. Bu sebeple sansürlü gözlemler var ise Denklem 2.2 yi tahmin etmek için pek uygun değildir [2] Olasılık Yoğunluk Fonksiyonu Diğer sürekli rastgele değişkenler gibi yaşam süresi T, t den birim genişliğinde kısa aralıklardaki bireysel başarısızlıkların olasılık sınırları veya birim zamandaki kısa aralıkların başarısızlık olasılığı olarak tanımlanan olasılık yoğunluk fonksiyonuna sahiptir. Aynı zamanda Denklem 2.3 deki gibi de ifade edilebilir. nin grafiği yoğunluk eğrisi olarak adlandırılır. Şekil 2.3 a ve b yoğunluk eğrisine dair iki örnektir. Yoğunluk iki özelliğe sahiptir [2]. negatif olmayan fonksiyon olmak üzere; bütün için için Yoğunluk eğrisi ile t ekseni arasında kalan alan 1 e eşittir.

25 9 Pratikte, sansürlü gözlemler mevcut değilse, olasılık yoğunluk fonksiyonu birim başına bir aralıktaki hastaların ölüm oranından tahmin edilir. Şekil 2-3: İki yoğunluk eğrisi örneği- Lee ve Wang (2003) dan tahminine benzer şekilde, sansürlü gözlemler mevcut olduğunda Denklem 2.4 geçerli değildir. Herhangi bir zaman aralığında bireylerin başarısızlığı ve başarısızlığın frekans tepeleri yoğunluk fonksiyonundan bulunabilir. Şekil 2.3 a daki yoğunluk eğrisi, çalışmanın başlangıcındaki yüksek başarısızlık oranını ve zamanla azalan başarısızlık oranını verir. Şekil 2.2 b de, yüksek başarısızlık sıklığı tepesi yaklaşık 1.7 zaman biriminde oluşmuştur. 1 ve 2. zaman birimleri arası bireysel başarısızlık oranı eksenle eğri arasında kalan taralı alana eşittir. Yoğunluk fonksiyonu aynı zamanda koşulsuz başarısızlık oranı olarak da bilinir [2] Hazard Fonksiyonu Yaşam süresi nin hazard fonksiyonu koşullu başarısızlık oranını verir. Buradaki koşul başlangıçta sağ olmadır. Başlangıçta sağ olan bireylerin zaman aralığında başarısızlık (ölmesi) olasılığına, hazard (tehlike oranı) fonksiyonu denir. Bu fonksiyon Denklem 2.5 ile tanımlanır.

26 10 Bu fonksiyon bir olasılık fonksiyonu değildir ve zamana göre artabilir, azalabilir veya sabit kalabilir. Hazard fonksiyonu aynı zamanda anlık başarısızlık oranı, ölüm gücü, koşullu ölüm oranı ve yaşa göre başarısızlık oranı olarak da bilinir. Hazard fonksiyonu yaşlanma süreci boyunca birim zaman başına başarısızlık riskini verir. Yaşam verileri analizinde önemli bir rol oynar. Uygulamada, herhangi sansürlü gözlem yok ise hazard fonksiyonu birim zaman aralığında hastaların ölüm oranı olarak tahmin edilir ve aralığın başında hastalar sağ ise hazard fonksiyonunun tahmini Denklem 2.6 ile tahmin edilir. Aktüerler genellikle, aralıkta birim zaman başına ölen hasta sayısını, aralığın orta noktasında ortalama hayatta kalanların sayısına bölünerek çıkan aralık ortalama hazard oranını kullanır. Denklem 2.7'deki aktüeryal tahmin Denklem 2.6 dan daha yüksek hazard oranını ve böylece daha muhafazakar bir tahmin verir [2]. Şekil 2-4: Hazard fonksiyonu örnekleri- Lee ve Wang (2003) dan

27 11 Hazard fonksiyonu artabilir, azalabilir, sabit kalabilir, veya daha karmaşık bir süreci gösterebilir. Şekil 2.4 birkaç tür hazard fonksiyonun çizimidir. Örneğin, tedaviye cevap vermeyen akut lösemili hastalar hazard oranı artışına sahip, ameliyat geçirmiş kurşunla yaralanan askerlerin riskinin gösterimi gibi azalan hazard fonksiyonu gösterir. En önemli tehlike operasyonun kendisi ve eğer cerrahi başarılı ise bu tehlike azalır. Sabit bir hazard fonksiyonuna örnek olarak, esas ölüm riski kazalar olan 18 ile 40 yaş arasındaki sağlıklı kişilerin ölüm riskidir. Küvet eğrisi,, insan hayatının sürecini anlatmaktadır. ilk dönem risk yüksektir (yüksek bebek ölümü). Daha sonra, belirli bir zamana kadar yaklaşık olarak sabit kalır, sonra yıpranma nedeniyle artar. Son olarak, başlangıçta riski artan tüberküloz, tedavi sonrası risk azalır. Böyle bir artıp, sonra azalan hazard fonksiyonu ile tarif edilmektedir. Belirli bir zaman aralığında ölüm olasılıklarının birikimli fonksiyonuna birikimli hazard fonksiyonu denir ve Denklem 2.8 ile belirtildiği gibi tanımlanır. Böylece,, ve, dur. Verilen örnekle bu fonksiyonların sansürlü gözlemler olmadan gruplandırılmış sağkalım sürelerine tam bir örnekten nasıl tahmin edilebileceği gösterilmiştir [2]. 2.2.Parametrik Bazı Önemli Dağılım Modelleri Çeşitli parametrik model aileleri yaşam süreleri verileri analizinde ve yaş veya başarısızlık süreçlerinde kullanılmaktadır. Tek değişkenli modeller arasında birkaç dağılım çoğunlukla yer almaktadır. Bunun nedeni geniş aralıkta gösterdiği kullanışlığıdır. Önde gelenler modeller üstel, Weibull, Lognormal, Loglojistik, ve gamma dağılımlarıdır [5] Üstel Dağılım Üstel dağılım, sıklıkla saf rastgele başarısızlık modeli olarak kullanılmaktadır. Hayvan veya bireyin yaşının sonraki sağkalımına etkisiz olması varsayımıyla ünlüdür.

28 12 Üstel dağılım bir sabit hazard fonksiyonu (oranı) λ ile karakterize edilir. Yüksek λ değeri yüksek risk ve kısa yaşam süresini, düşük λ değeri az risk, uzun yaşam süresini gösterir. λ =1 ise birim üstel dağılım olarak adlandırılır. Yaşam süresi T, λ parametresi ile üstel dağılımı izliyorsa olasılık yoğunluk fonksiyonu Denklem 2.9, kümülatif dağılım fonksiyonu Denklem 2.10 daki gibidir. gösterilmiştir. Sağkalım fonksiyonu Denklem 2.11, hazard fonksiyonu ise Denklem 2.12 de Üstel dağılımda kişilerin yaşı, yıpranma ve başarısızlık veya ölüm rastgele bağımsız olaylar olarak tanımlanmakta, yaşam süresini etkilememektedir [2] Weibull Dağılımı Weibull dağılımı üstel dağılımın bir genelleştirilmiş halidir. Üstel dağılımın aksine sabit hazard oranı varsayımı yoktur ve daha geniş uygulamalara sahiptir [2]. Weibull dağılımının hazard fonksiyonu, olasılık yoğunluk ve sağkalım fonksiyonları sırasıyla Denklem 2.13, Denklem 2.14 ve 2.15 deki gibidir [1]. Weibull dağılımı olması durumunda hazard oranı sabit ve üstel durumda olur. ise hazard oranı monoton artan, ise monoton azalandır. Bu nedenle

29 13 Weibull dağılımı artan, azalan veya sabit riskli sağkalım dağılım modeline sahip popülasyonlarda kullanılabilir. Artan ve azalan hazard oranına örnek olarak akciğer kanseri hastaları ve başarılı büyük ameliyat geçiren hastalar verilebilir [2]. notasyonu bazen rastgele değişken nin Denklem 2.14 deki dağılıma olacak şekilde sahip olduğunu göstermek için kullanılır. Weibull olasılık yoğunluk fonksiyonu ve hazard fonksiyonunun şekli, bazen dağılımın şekil parametresi olarak adlandırılan ya bağlıdır. Şekil 2.5 için nın bazı değerleri için olasılık yoğunluk eğrilerini, Şekil 2.6 ise ilgili hazard fonksiyonu eğrilerini vermektedir [5]. Şekil 2-5: için olasılık yoğunluk eğrileri-lawless (2002) ten Şekil 2-6: için hazard fonksiyonu eğrileri- Lawless (2002) ten

30 Lognormal Dağılım Yaşam süresi nin lognormal dağılıma sahip olması nin normal dağılımlı olması demektir. Ortalaması µ varyansı olan nin olasılık yoğunluk fonksiyonu Denklem 2.16 daki gibidir. Lognormal sağkalım ve hazard fonksiyonları standart normal dağılım içerir. Sağkalım fonksiyonu Denklem 2.17, hazard fonksiyonu eşitliği ile hesaplanır [5] Loglojistik Dağılım Yaşam süresi T Loglojistik dağılımına sahip ise lojistik dağılıma sahiptir demektir. t 0 ve parametreleriyle Denklem 2.19 deki olasılık yoğunluk fonksiyonuna sahiptir. Loglojistik dağılımın sağkalım ve hazard fonksiyonları Denklem 2.19 ve Denklem 2.20 deki gibidir.

31 15 Loglojistik dağılım ve parametreleri ile karakterize edilir. Dağılımın medyanı dır [2] Gamma Dağılımı Gamma dağılımının olasılık yoğunluk fonksiyonu Denklem 2.21 deki gibidir. parametresi ölçü, k ise indeks veya şekil parametresi olarak bilinmektedir. Bu dağılım Weibull dağılımına benzemekte, k=1 iken üstel dağılımı içermektedir. Sağkalım fonksiyonu Denklem 2.22 deki gibidir. Hazard fonksiyonu ise eşitliğinden bulunabilir. Gamma dağılımı diğer yaşam süresi modelleri gibi kullanılamayabilir. Üstel dağılım gibi bazı bilindik dağılım rastgele değişkenleri aynı zamanda gamma dağılımına sahiptir. Bir yaşam verileri rastgele değişkeni için uygun bir dağılım modelidir [5]. Ayrıca kullanılabilir olan Gompertz, ters Gauss genelleştirilmiş Gamma dağılımı ile birlikte dağılım modellerinin hazard, sağkalım ve olasılık yoğunluk fonksiyonları Tablo 2.1 ile gösterilir [6][1]. Tablo 2-1: Kullanılan bazı parametrik dağılımların hazard, sağkalım ve olasılık yoğunluk fonksiyonları Klein ve Moeschberger (2003) den Dağılım Hazard Fonksiyonu h(t) Sağkalım Fonksiyonu S(t) Olasılık Yoğunluk Fonksiyonu f(t) Üstel λ λ λ λ Weibull Gamma λ λ λ λ

32 16 Lognormal Loglojistik Gompertz Genelleştirilmiş Gamma λ λ λ 2.3.Fonksiyon Tahmininde Parametrik Olmayan Yöntemler Yaşam verilerin sahip olduğu dağılım bilinmiyor ise parametrik olmayan yöntemler bu durumlarda kolay anlaşılır ve uygulanabilirdir. Bu yöntemler veriler teorik bir dağılımı izliyor ise etkisiz, izlemiyor ise parametrik modellere göre daha etkilidir. Bu nedenle öncelikle yaşam verilerinin teorik bir dağılıma uygunluğu araştırılmalıdır. Model seçimi yapılırken parametrik olmayan yöntemler ve grafiklerden yararlanılabilir. Sağkalım fonksiyonun tahmini için product-limit yöntemi Kaplan ve Meier geliştirmiştir (1958). Artan bilgisayarla kolay hesaplamalarla bu yöntem küçük, orta ve büyük örneklemler için uygulanabilir hale gelmiştir. Eğer veriler aralıklarla gruplara ayrılmışsa veya geniş bir popülasyon ile ilgileniliyor ise klinik yaşam tablosu yöntemini kullanmak daha uygundur. Bu iki yöntemin sağkalım fonksiyonu tahmini esasen aynıdır. Aralarındaki fark, Kaplan-Meier yöntemi bireysel yaşam süresine dayalı olmakta, yaşam tablosu yöntemi ise aralıklarla gruplandırılmış yaşam sürelerine dayalıdır [2] Yaşam Tablosu Yöntemi Yaşam tablosu yöntemi, yaşam süresi verilerini eşit zaman aralıklarına göre frekans tablosuna dönüştürerek analiz eden ve her bir zaman aralığında yaşam fonksiyonlarını hesaplamayı amaçlayan bir yöntemdir. Yaşam tablosu yöntemi, yaşam sürelerinin k (k>6) sayıda eşit aralıklı sınıfa ayrıldığı, eşit (tekrarlanan) zaman sürelerinin fazla olduğu, birim sayısının 100 ün üzerinde olduğu veri setlerinde belirli bir x etkenine maruz kalan birimlerin yaşam ve ölüm olasılıklarının, ortalama yaşam süresinin hesaplanmasını sağlayan yöntemdir.

33 17 Yöntemde her sınıftaki birimlerin eşit ölüm riskine sahip olduğu varsayılır. i. aralıkta ölen hastalar dışındaki hastalar diğer i+1. sınıfa eşit ölüm riski, yaşam olasılığı ile geçerler. i. aralıktaki hasta sayısı, Denklem 2.23 deki gibidir. i. aralığa sağ olarak giren hasta sayısını, ise i. aralıkta yaşayan hasta sayısı (takipten çıkan, kayıp hastalar dahil) belirtir. Her aralıktaki hastaların bulundukları aralığa eşit olarak dağıldığı varsayılır. Bu varsayıma göre, yaşayan kişilerin sınıf değerinde (sınıf orta noktasında) riske maruz kaldıkları varsayılır. i. aralıkta kişilerin taşıdıkları ölüm riski, yaşam olasılığı ve aralıktaki yığılımlı yaşam olasılığı (sağkalım fonksiyonu) Denklem 2.24 deki gibidir. Buradaki, i. aralıkta ölen kişilerin sayısıdır. i. aralıkta yaşayanların i+1. aralığa canlı olarak geçeceği varsayılır ve izlem periyodunda araştırmaya dahil olacakları varsayılır. = 1 olarak alınır. nin standart hatasının hesaplanışı Denklem 2.25 de olduğu gibidir. Yaşam tablosu yönteminde aralıklar için hazard fonksiyonu Denklem 2.26 da belirtilmiştir. Burada sınıf aralığı, ölüm olasılığı ve yaşam olasılığıdır. Aralıkların orta noktaları ise ile gösterilir. Ölüm yoğunluk fonksiyonu ise Denklem 2.27 deki şekilde hesaplanır.

34 18 İzlem sürelerini içeren veri setlerinde değişim genişliği büyük olabilir ve uç değerler bulunabilir. Bu nedenle ortalama yaşam süresi yerine ortanca yaşam süresi hesaplanır. Ortanca yaşam süresinin hesaplanışı Denklem 2.28 deki gibidir. Burada, i. aralığın yığımlı yaşama olasılığıdır ve 0.5 ten küçük olan önceki sınıfın başlangıç değeridir. ise ile belirlenmiş aralıktan önceki yığılımlı yaşam olasılığıdır ve 0.5 ten büyüktür [3] Kaplan-Meier Yöntemi Kaplan-Meier yöntemi yaşam sürelerine ilişkin, verileri zaman aralıklarına bölmeden yaşam ve ölüm fonksiyonlarının hesaplanmasını sağlayan bir yöntemdir [7]. Yaşam tablosu ile Kaplan-Meier yöntemleri yaşam ve ölüm fonksiyonları hesaplamada benzerlikler ve farklılıklar içermektedir. Bu farklılıklar aşağıdaki gibi özetlenebilir. 1. Kaplan-Meier yönteminde az sayıda bireyle çalışılabilir. Yaşam tablosu yönteminde aralıklara düşen birim sayısının azalması tahminleri etkilemektedir. 2. Kaplan-Meier yönteminde tekrarlı çözüm zamanlarına ilişkin olasılıklar hesaplanmaz. İzlem zamanlarının küçükten büyüğe doğru dizildiği serilerde ( ) tekrarlı ölçüm az ise Kaplan-Meier, yaşam tablosuna tercih edilir. 3. Kaplan-Meier yönteminde kayıplar, eksik veriler dikkate alınmaz, sadece ölümler üzerinden yaşam olasılığı hesaplanır. Yaşam olasılığı ise ölüm olayının gerçekleştiği ana ilişkin olarak hesaplanır. 4. Kaplan-Meier yönteminde kesin ölüm tarihi kullanıldığı için, nokta yaşam olasılığı bulunur. Yaşam tablosu yöntemi ise yaklaşık bir olasılık verir. Çünkü izleme aralığı gruplara ayrılmaktadır.

35 19 N birimin gözlenen yaşam süreleri biçiminde sıralanmış olsun. N bireyin sağkalım fonksiyonu Denklem 2.29 ile hesaplanır [5]. j. anda işlemedeki birey sayısı (N-j sayıda), ise j. anda ölen birey sayısıdır. nin standart hatasının ise Denklem 2.30 ile hesaplanır. Hazard fonksiyonu en çok olabilirlik tahmin edicisi ile ile tahmin edilebilir. Birikimli hazard fonksiyonu ise Denklem 2.31 dir [5]. İzlenen hastalardan ölenlerin sayısı D tane ve bunların ölüm zamanları da tahmini µ Denklem 2.32 ile hesaplanır. olarak sıraya dizilmiş olsun. Bu dizide ortalama yaşam süresini Product-limit yöntemine göre yapılan hesaplamalarda, t(q) q. çeyrek değerlerin tahminini belirtir. q=0.5 medyan değeri, q= çeyrek değeri q=0.75 ise 3. çeyrek değeri ifade eder. zamanındaki yaşam fonksiyonu tahmini P( ) olarak alındığında çeyrek değerler Denklem 2.33 ile hesaplanır.

36 20 Eğer u(q+0.05)= t(q-0.05) eşitliği sağlanıyor ise, olasılık yoğunluk fonksiyonu hesaplanabilir ve Denklem 2.34 deki gibidir [3]. 2.4.Açıklayıcı Değişkenler Bulunmayan Yaşam Verileri için Parametrik Çözümler Dağılım parametrelerinin tahminlerini, olabilirlik tahmin edicisi ile tahmin edeceğiz. Sağkalım verilerinde yaşam süreleri ile sansürlü sürelerin bağımsız olması kritik bir varsayımdır. Sansürlü verilerde en çok olabilirlik fonksiyonu için her gözlemin nasıl bilgiler içerdiğini dikkatlice düşünmemiz gerekir. Gözlem sansürsüz ise, olasılık fonksiyonunun değeri olay zamanı olur. Lakin veri sağ sansürlü ise olayın gerçekleşme zamanı belirtilen zamandan daha sonradır. Daha spesifik olarak sansür şekillerinin çeşitli tipleri için olabilirlik verilen bileşenler tarafından yazılabilir. Sansürsüz yaşam süresi Sağ sansürlü gözlemler Sol sansürlü gözlemler Aralık sansürlü gözlemler Olabilirlik fonksiyonu Denklem 2.35 ile belirtilen bileşenler ile inşa edilebilir. Buradaki D ölüm, R sağ sansürlü gözlemlerin ve I aralık sansürlü gözlemlerin sürelerinin kümesidir. Sansürlü gözlemlerden önemli sık karşılaşılanlar Sağ sansürleme 1. tip, 2. tip ve bağımsız rastgele sansürleme türleridir [6].

37 Sağ Sansürleme ve Olabilirlik İşlemlerde basitlik için öncelikle açıklayıcı değişkenler görmezden gelinecek ve yaşam süresi ler aynı bağımsız ve aynı dağılıma sahip varsayılacaktır. Bu sayede uzantılar değişkenleri basitleştirecektir. n tane bireyin yaşam süreleri rastgele değişkenler ile gösterilsin. şeklinde olduğunda 1, olduğunda 0 değerini alan bir değişken tanımlayalım. Sansürlü gözlem için olabilirlik fonksiyonu Denklem 2.36 ile gösterilir. Çözüm kolaylığı için doğal logaritmasını alırsak logaritmik olabilirlik fonksiyonu Denklem 2.37 deki gibi olmaktadır. 1 tipi sansürleme sıklıkla belirli zaman periyodunda yürütülen çalışmalarda görülür. Her birey bir sabit potansiyel sansür zamanına sahip ve şeklinde gözlenme süresi mevcut olmalıdır. çalışmaya giriş tarihi ile başlar, çalışma sonunda biter. giriş tarihinden hastanın çalışmadan ayrılması ile biter. Genel gösterim ise Denklem 2.38 ile gösterilir. süreleri 2. tip sansürlemede r inci yaşam süresi en küçük olmak üzere n bireyin yaşam olsun. Olabilirlik fonksiyonu Denklem 2.39 ile gösterilir. Bağımsız rastgele sansürlemede yaşam süresi T ve sansür zamanı C bağımsız ve sağkalım fonksiyonlu birer sürekli rastgele değişkenlerdir. ve

38 22 olasılık yoğunluk fonksiyonu olmak üzere Denklem 2.40 ile hesaplanır. çiftinin olabilirlik tahmin edicisi Eğer ve herhangi den parametre içermiyor ise Denklem 2.38 kullanılabilir [5] Üstel ve Weibull Dağılımların Parametreleri Tahminleri Üstel Dağılımda Parametre Tahmini n gözlemli bir çalışmada yaşam sürelerinin dağılımı üstel dağılımlı olduğunu varsayarak parametre λ yı tahmin edelim. yaşam süreleri olsun. Sansürlü gözlem olmağını varsayarsak olabilirlik fonksiyonu ve λ nın en çok olabilirlik tahmin edicisi Denklem 2.41 deki gibidir. Üstel dağılımın beklenen değeri (ortalaması) µ nün tahmini şeklindedir. Sansürlü gözlemler mevcut ise n bireyin T anında kadar r tanesi ölmüş olsun ve tanesi de hayatta veya kayıp olsun. şeklinde yaşam süreleri dizilmiş olsun. Olabilirlik fonksiyonu ve λ nın tahmin edicisi Denklem 2.43 ile gösterilir [5].

39 Weibull Dağılımda Parametre Tahmini Weibull dağılımlı olduğunu kabul ettiğimiz yaşam sürelerinden λ ve parametrelerini tahmin edelim. Weibull dağılım modeli için logaritmik olabilirlik fonksiyonu Denklem 2.43 deki gibidir., sağ sansürlü gözlemlerin sayısı olmak üzere Denklem 2.43 tekrar düzenlenirse olabilirlik fonksiyonu Denklem 2.44 deki şekli ile kullanılabilir. ve parametrelerinin en çok olabilirlik (MLE) yaklaşımları Denklem 2.43 teki fonksiyonun, ve ile ilgili türevlerinin sıfıra eşitlenerek farklılaştırılması ile bulunmaktadır. Bu türevlerin sonucu olarak Denklem 2.45 ve Denklem 2.46 denklemleri ortaya çıkmaktadır. Sıfıra eşitlenen bu denklemlerden ve tahminleri Denklem 2.47 ve 2.48 de görüldüğü gibidir.

40 24 Denklem 2.48 ile tahmini için düzenlenen eşitlik Newton-Raphson yöntemi gibi iteratif (tekrarlamalı) sayısal yöntemler ile çözülebilmektedir. Ayrıca önce tahminin hesaplanması çözümü kolaylaştırabilir [1] Uyum İyiliği ve Dağılım Seçme Parametrik dağılımlar aileler olarak gruplandırılabilir. Standart gama dağılımında ise üstel dağılıma ve ve ise ki-kare dağılımına indirgeme yapılır. Weibull dağılımı ise üstel dağılım gösterir. ise lognormal dağılıma indirgenir [2]. Uygun dağılımı belirlemede logaritmik olabilirlik oranı istatistiği kullanacağız. İstatistiğin asimptotik ki-kare dağılımlı olması ile hipotez testleri test edilecektir Logaritmik Olabilirlik Oranı İstatistiği ile Hipotez Testleri Bir parametrik dağılımın parametreleri kümesi şeklinde olsun. Parametrelerden birinin tahmin edilen bir sayıya eşitliğini test etmek istersek sıfır hipotezimiz şeklinde olur. test ettiğimiz belirlenmiş tahmindir. Kullanılacak olan test istatistiği logaritmik olabilirlik oranı istatistiği Denklem 2.49 ile hesaplanır. Bu istatistik parametre sayısı kadar serbestlik dereceli asimptotik ki-kare dağılımına sahiptir. Örnek olarak gözlenen verilerin üstel dağılımlı olmasını istiyoruz. Test için Weibull dağılımını ve şekil parametresi yı kullanabiliriz. Üstel dağılım için olmalıdır ve hipotezler (dağılım bir üstel dağılımdır) ve (dağılım bir Weibull dağılımıdır). ve ile Weibull ve üstel dağılımların logaritmik olabilirlik oranlarıdır. Weibull dağılımının iken nın olabilirlik tahmin edicisi olmak üzere dir. Bu durumda logaritmik olabilirlik oranı Denklem 2.50 ile hesaplanır.

41 25 Anlamlılık düzeyi ya göre hesaplanır ve ise reddedilir. Hipotezin kabulü veya reddi ile dağılımın üstel veya Weibull dağılımlı olduğu söylenemez. Aynı şekilde gamma dağılımı ve diğer dağılımlar ile karşılaştırılması gerekir. Weibull ile genişletilmiş genelleştirilmiş gamma dağılımları karşılaştırılırken koşulu test edilir. Logaritmik olabilirlik oranı ise şeklinde hesaplanır ( ). Bazı testlerin test istatistikleri Tablo 2.2 gibi özetlenmiştir [2] Tablo 2-2: Gözlenen verilere uygun model ailelerinin uyum iyiliği testlerin özetleri - Lee ve Wang (2003) tan. Hipotez Modeli LL S. D. Genelleştirilmiş Gamma Log-normal 2( ) 1 Gamma 2( ) 1 Weibull 2( ) 1 Üstel 2( ) 2 Üstel 2( ) 1 Üstel 2( ) 1 LL, logaritmik olabilirlik fonksiyonu; olabilirlik oranı ki-kare istatistiği; S. D., serbestlik derecesi BIC veya AIC Prosedürleri ile Dağılım Seçimi Uyum iyiliği yöntemiyle dağılım seçme, ait olunan dağılım ailesinin bilinmesini gerektirir. Bu durumda daha kolay prosedür olan bayesçi bilgi ölçütü kullanılır. Bu ölçüt 1978 yılında Gideon Scwarz tarafından önerildiğinden Scwarz ölçütü olarak da bilinir. Bu kriter logaritmik olabilirlik ( ), dağılımdaki parametre sayısı (p), toplam gözlem sayısına (n) bağlıdır. Her aday dağılım için Denklem 2.51 deki r değeri hesaplanır.

42 26 dağılımdaki parametrelerin en çok olabilirlik tahminlerini içermektedir. Aday dağılımların her biri için r değeri hesaplanır ve en küçük r değerine sahip olan dağılım verilere en iyi uyumu sağlar [8]. Ayrıca diğer bir geniş kullanımlı ölçüt ise Akaike bilgi ölçütü AIC dir. Akaike ölçütünü 1974 yılında Hirotugu Akaike geliştirmiştir. Denklem 2.52 ile hesaplanır. AIC değerleri her bir dağılım için hesaplanır ve r değeri en küçük dağılım en çok uyumu sağlar. Geniş örneklemde BIC yöntemi AIC e göre daha iyi sonuçlar vermektedir [6]. 2.5.Sağkalım Dağılımlarının Karşılaştırılması Sağkalım dağılımlarını karşılaştırma problemi, biomedikal araştırmalarda sıklıkla ortaya çıkmaktadır. Bir laborotuar araştırmacısı farelerde ortaya çıkan kansorojeni iki veya daha fazla gruba ayırarak tümörsüzlüğü karşılaştırmak ister. Bir diyabetolog iki grup diyabet hastalarındaki retinopatisizliği karşılaştırmak ister. Bir klinik onkolog ömrü uzatmak veya sağlığı korumak için iki veya daha çok tedavinin etkinliğini karşılaştırmak isteyebilir. Genellikle hastalıksızlık veya yaşam sürelerinin farklı grupları değişmektedir. Bu farklar tahmini sağkalım fonksiyonlarının grafiklerinin çizilmesi ile tanımlanabilir ama bu farklar için sadece kaba bir fikir vermektedir [2] Logrank Testi Mantel in (1966) geliştirilmiş Savage (1956) testi olan ve logrank olarak adlandırılan bu test küme skorlarının ( ) gözlemlere atanmasına dayalıdır. Bu skorlar sağkalım fonksiyonunun logaritmik fonksiyonlarıdır. Sağa çarpık ve bilgi içeren sansürlü olmayan datalarda kullanılmaya uygun parametrik olmayan bir testtir. Klinik denemelerde yeni bir tedavinin etkisini saptamak amaçlı tedavi kontrollerinin karşılaştırılmasında sıklıkla kullanılmaktadır. Altshuler (1970) zamanındaki logaritmik sağkalım fonksiyonunu ile tahmin etmiştir. Bu ifadedeki, zamanındaki başarısızlık miktarı ve de başarısız veya sansürlü gözlemlerin miktarını belirtmektedir.

43 27 Skorlar Peto ve Peto tarafından zamanında sansürsüz başarısızlık gösteren gözlemler için olarak, T zamanındaki sansürlü gözlemler için ise olarak hesaplanmıştır. Pratik olarak bir sansürlü gözlem için, burada en uzun sansürsüz gözlem olan dir. Böylece en büyük sansürsüz gözlemler en küçük skora sahip olmaktadır. Sansürlü gözlemler negatif skorlara sahiptir. Logrank testi iki grubun w skorlarının toplamları S ye eşittir. S in permutasyonal varyansı Denklem 2.53 ile ifade edilmektedir. Test istatistiği sıfır hipotezi altında asimtotik olarak standart normal dağılım göstermektedir. Eğer S, grup 1 de bulunuyor ise kritik bölge, grup 2 de bulunuyor ise kritik bölge dir. anlamlılık değeri olmak üzere sıfır hipotezi ve karşit hipotez olarak kurulur. Bu hipotezler aynı zamanda iki grup bireyleri arasındaki sağkalım deneyimleri arasında fark yoktur şeklinde kurulur. Aynı zamanda logrank testi ki-kare test istatistiği ile de uygulanabilir. Her bir grup için ve gözlem sayıları olmak üzere ve beklenen ölüm değerleri olsun. Test istatistiği olarak hesaplanır. 1 serbestlik dereceli istatistiği ise hipotezi red edilir. Ifadedeki beklenen değerler ve ve olarak hesaplanır. Ifadedeki, t zamanındaki ölüm miktarını, ve iki grup için t süresince ölüm riskinde olan hasta sayısını belirmektedir [2] Kruskal-Wallis Testi Kruskal-Wallis H testi varyans analizinde sık kullanılan F testine benzer şekilde orijinal gözlemler yerine sıra sayıları kullanmaktadır. Bu nedenle aynı zamanda sıra sayıları ile Kruskal-Wallis tek yön varyans analizi olarak da adlandırılmaktadır. Test, verilerin esasen sürekli bir dağılıma sahip olduğunu varsaymaktadır [2].

BÖLÜM 1: YAşAM ÇÖzÜMLEMEsİNE GİRİş... 1

BÖLÜM 1: YAşAM ÇÖzÜMLEMEsİNE GİRİş... 1 ÖN SÖZ...iii BÖLÜM 1: Yaşam Çözümlemesine Giriş... 1 1.1. Giriş... 1 1.2. Yaşam Süresi... 2 1.2.1. Yaşam süresi verilerinin çözümlenmesinde kullanılan fonksiyonlar... 3 1.2.1.1. Olasılık yoğunluk fonksiyonu...

Detaylı

SA Ğ KALIM ANAL Ġ ZLER Ġ

SA Ğ KALIM ANAL Ġ ZLER Ġ SAĞKALIM ANALĠZLERĠ Sağkalım Analizleri Sağkalım verilerini analiz etmek üzere kullanılan istatistiksel yöntemlerdir. Sağkalım verileri, yanıt değişkeni bir olay meydana gelene kadar geçen süre olan verilerdir.

Detaylı

İÇİNDEKİLER ÖN SÖZ...

İÇİNDEKİLER ÖN SÖZ... İÇİNDEKİLER ÖN SÖZ... v GİRİŞ... 1 1. İSTATİSTİK İN TARİHÇESİ... 1 2. İSTATİSTİK NEDİR?... 3 3. SAYISAL BİLGİDEN ANLAM ÇIKARILMASI... 4 4. BELİRSİZLİĞİN ELE ALINMASI... 4 5. ÖRNEKLEME... 5 6. İLİŞKİLERİN

Detaylı

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37 İÇİNDEKİLER BÖLÜM 1 Değişkenler ve Grafikler 1 İstatistik 1 Yığın ve Örnek; Tümevarımcı ve Betimleyici İstatistik 1 Değişkenler: Kesikli ve Sürekli 1 Verilerin Yuvarlanması Bilimsel Gösterim Anlamlı Rakamlar

Detaylı

İçindekiler. Ön Söz... xiii

İçindekiler. Ön Söz... xiii İçindekiler Ön Söz.................................................... xiii Bölüm 1 İstatistiğe Giriş....................................... 1 1.1 Giriş......................................................1

Detaylı

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 ) 4. SUNUM 1 Gözlem ya da deneme sonucu elde edilmiş sonuçların, rastlantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel yöntemlere HİPOTEZ TESTLERİ denir. Sonuçların rastlantıya bağlı

Detaylı

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI ÖNSÖZ İÇİNDEKİLER III Bölüm 1 İSTATİSTİK ve SAYISAL BİLGİ 11 1.1 İstatistik ve Önemi 12 1.2 İstatistikte Temel Kavramlar 14 1.3 İstatistiğin Amacı 15 1.4 Veri Türleri 15 1.5 Veri Ölçüm Düzeyleri 16 1.6

Detaylı

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir. ÇIKARSAMALI İSTATİSTİKLER Çıkarsamalı istatistikler, örneklemden elde edilen değerler üzerinde kitleyi tanımlamak için uygulanan istatistiksel yöntemlerdir. Çıkarsamalı istatistikler; Tahmin Hipotez Testleri

Detaylı

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ DÖNEM I-I. DERS KURULU Konu: Bilimsel yöntem ve istatistik Amaç: Biyoistatistiğin tıptaki önemini kavrar ve sonraki dersler için gerekli terminolojiye hakim olur.

Detaylı

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız. .4. Merkezi Eğilim ve Dağılım Ölçüleri Merkezi eğilim ölçüleri kitleye ilişkin bir değişkenin bütün farklı değerlerinin çevresinde toplandığı merkezi bir değeri gösterirler. Dağılım ölçüleri ise değişkenin

Detaylı

BÖLÜM 12 STUDENT T DAĞILIMI

BÖLÜM 12 STUDENT T DAĞILIMI 1 BÖLÜM 12 STUDENT T DAĞILIMI 'Student t dağılımı' ya da kısaca 't dağılımı'; normal dağılım ve Z dağılımının da içerisinde bulunduğu 'sürekli olasılık dağılımları' ailesinde yer alan dağılımlardan bir

Detaylı

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş Hipotez Testlerine Giriş Hipotez Testlerine Giriş Hipotez Testlerine Giriş Gözlem ya da deneme sonucu elde edilmiş sonuçların, raslantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel

Detaylı

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma... İçindekiler İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii BÖLÜM 1 Ölçme, İstatistik ve Araştırma...1 Ölçme Nedir?... 3 Ölçme Süreci... 3 Değişkenler

Detaylı

13. Olasılık Dağılımlar

13. Olasılık Dağılımlar 13. Olasılık Dağılımlar Mühendislik alanında karşılaşılan fiziksel yada fiziksel olmayan rasgele değişken büyüklüklerin olasılık dağılımları için model alınabilecek çok sayıda sürekli ve kesikli fonksiyon

Detaylı

Rastgele Değişkenlerin Dağılımları. Mühendislikte İstatistik Yöntemler

Rastgele Değişkenlerin Dağılımları. Mühendislikte İstatistik Yöntemler Rastgele Değişkenlerin Dağılımları Mühendislikte İstatistik Yöntemler Ayrık Rastgele Değişkenler ve Olasılık Dağılımları Yapılan çalışmalarda elde edilen verilerin dağılışı ve dağılış fonksiyonu her seferinde

Detaylı

BÖLÜM 10 ÖRNEKLEME YÖNTEMLERİ

BÖLÜM 10 ÖRNEKLEME YÖNTEMLERİ İÇİNDEKİLER BÖLÜM 10 ÖRNEKLEME YÖNTEMLERİ I. ÖRNEKLEME... 1 II. ÖRNEKLEMENİN SAFHALARI... 2 III. ÖRNEK ALMA YÖNTEMLERİ 5 A. RASYONEL ÖRNEK ALMA... 5 B. TESADÜFİ ÖRNEK ALMA... 6 C. KADEMELİ ÖRNEK ALMA...

Detaylı

BİYOİSTATİSTİK Bazı Olasılık Dağılışları Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK Bazı Olasılık Dağılışları Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK Bazı Olasılık Dağılışları Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr 1 Uygulamalı bilim

Detaylı

OLASILIK ve KURAMSAL DAĞILIMLAR

OLASILIK ve KURAMSAL DAĞILIMLAR OLASILIK ve KURAMSAL DAĞILIMLAR Kuramsal Dağılımlar İstatistiksel çözümlemelerde; değişkenlerimizin dağılma özellikleri, çözümleme yönteminin seçimi ve sonuçlarının yorumlanmasında önemlidir. Dağılma özelliklerine

Detaylı

26.12.2013. Farklı iki ilaç(a,b) kullanan iki grupta kan pıhtılaşma zamanları farklı mıdır?

26.12.2013. Farklı iki ilaç(a,b) kullanan iki grupta kan pıhtılaşma zamanları farklı mıdır? 26.2.23 Gözlem ya da deneme sonucu elde edilmiş sonuçların, raslantıya bağlı olup olmadığının incelenmesinde kullanılan istatistiksel yöntemlere HĐPOTEZ TESTLERĐ denir. Sonuçların raslantıya bağlı olup

Detaylı

altında ilerde ele alınacaktır.

altında ilerde ele alınacaktır. YTÜ-İktisat İstatistik II Nokta Tahmin Yöntemleri 1 NOKTA TAHMİN YÖNTEMLERİ Şimdiye kadar verilmiş tahmin edicilerin sonlu örneklem ve asimptotik özelliklerini inceledik. Acaba bilinmeyen anakütle parametrelerini

Detaylı

İstatistikçiler Dergisi

İstatistikçiler Dergisi www.istatistikciler.org İstatistikçiler Dergisi (28) 6-22 İstatistikçiler Dergisi COX REGRESYON MODELİ VE AKCİĞER KANSERİ VERİLERİ İLE BİR UYGULAMA Durdu KARASOY Hacettepe Üniversitesi Fen Fakültesi İstatistik

Detaylı

Prof.Dr. Rian Dişçi İ.Ü.Onkoloji Enstitüsü Kanser Epidemiyolojisi ve Biyoistatistik Bilim Dalı

Prof.Dr. Rian Dişçi İ.Ü.Onkoloji Enstitüsü Kanser Epidemiyolojisi ve Biyoistatistik Bilim Dalı SAĞKALIM (SÜRVİ) ANALİZİ Prof.Dr. Rian Dişçi İ.Ü.Onkoloji Enstitüsü Kanser Epidemiyolojisi ve Biyoistatistik Bilim Dalı Amaç Tedaviden sonra hastaların beklenen yaşam sürelerinin tahmin edilmesi, genel

Detaylı

İkiden Çok Grup Karşılaştırmaları

İkiden Çok Grup Karşılaştırmaları İkiden Çok Grup Karşılaştırmaları Bir onkoloji kliniğinde göğüs kanseri tanısı almış kadınlar arasından histolojik evrelerine göre 17 şer kadın seçilerek sağkalım süreleri (ay) alınmıştır. HİSTLOJİK EVRE

Detaylı

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1 3. TAHMİN 3.1. En Küçük Kareler (EKK) Yöntemi 1 En Küçük Kareler (EKK) yöntemi, regresyon çözümlemesinde en yaygın olarak kullanılan, daha sonra ele alınacak bazı varsayımlar altında çok aranan istatistiki

Detaylı

Olasılık ve Normal Dağılım

Olasılık ve Normal Dağılım Olasılık ve Normal Dağılım P = 0 İmkansız P =.5 Yarı yarıya P = 1 Kesin Yazı-Tura 1.5 2 1.5 2.5.5.25 Para atışı 10 kere tekrarlandığında Yazı Sayısı f % 0 3 30 1 6 60 2 1 10 Toplam 10 100 Atış 1000 kere

Detaylı

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım 2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI 2.1. Tanım Regresyon analizi, bir değişkenin başka bir veya daha fazla değişkene olan bağımlılığını inceler. Amaç, bağımlı değişkenin kitle ortalamasını, açıklayıcı

Detaylı

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 MIT OpenCourseWare http://ocw.mit.edu 14.30 Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 Bu materyale atıfta bulunmak ve kullanım koşulları için http://ocw.mit.edu/terms sayfasını ziyaret ediniz.

Detaylı

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin Ders 9: Kitle Ortalaması ve Varyansı için Tahmin Kitle ve Örneklem Örneklem Dağılımı Nokta Tahmini Tahmin Edicilerin Özellikleri Kitle ortalaması için Aralık Tahmini Kitle Standart Sapması için Aralık

Detaylı

Bir Normal Dağılım Ortalaması İçin Testler

Bir Normal Dağılım Ortalaması İçin Testler Bir Normal Dağılım Ortalaması İçin Testler İÇERİK o Giriş ovaryansı Bilinen Bir Normal Dağılım Ortalaması İçin Hipotez Testler P-değerleri: II. Çeşit hata ve Örnekleme Büyüklüğü Seçimi Örnekleme Büyüklüğü

Detaylı

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik 6.SUNUM İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik özellikleri (ortalama, varyans v.b. gibi) hakkında

Detaylı

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ

BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ 1 BÖLÜM 5 MERKEZİ EĞİLİM ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel sayma

Detaylı

2018 YILI BİRİNCİ SEVİYE AKTÜERLİK SINAVLARI İSTATİSTİK VE OLASILIK 29 NİSAN 2018

2018 YILI BİRİNCİ SEVİYE AKTÜERLİK SINAVLARI İSTATİSTİK VE OLASILIK 29 NİSAN 2018 2018 YILI BİRİNCİ SEVİYE AKTÜERLİK SINAVLARI İSTATİSTİK VE OLASILIK 29 NİSAN 2018 Sigortacılık Eğitim Merkezi (SEGEM) tarafından hazırlanmış olan bu sınav sorularının her hakkı saklıdır. Hangi amaçla olursa

Detaylı

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü Mühendislikte İstatistiksel Yöntemler Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü 1 Araştırma sonuçlarının açıklanmasında frekans tablosu

Detaylı

BÖLÜM 13 HİPOTEZ TESTİ

BÖLÜM 13 HİPOTEZ TESTİ 1 BÖLÜM 13 HİPOTEZ TESTİ Bilimsel yöntem aşamalarıyla tanımlanmış sistematik bir bilgi üretme biçimidir. Bilimsel yöntemin aşamaları aşağıdaki gibi sıralanabilmektedir (Karasar, 2012): 1. Bir problemin

Detaylı

SÜREKLĠ OLASILIK DAĞILIMLARI

SÜREKLĠ OLASILIK DAĞILIMLARI SÜREKLĠ OLASILIK DAĞILIMLARI Sayı ekseni üzerindeki tüm noktalarda değer alabilen değişkenler, sürekli değişkenler olarak tanımlanmaktadır. Bu bölümde, sürekli değişkenlere uygun olasılık dağılımları üzerinde

Detaylı

SAĞKALIM (YAġAM) ÇÖZÜMLEMESĠ

SAĞKALIM (YAġAM) ÇÖZÜMLEMESĠ SAĞKALIM (YAġAM) ÇÖZÜMLEMESĠ SAĞKALIM (YAġAM) ÇÖZÜMLEMESĠ Sağkalım çözümlemesi, araģtırıcı tarafından tanımlanan herhangi bir olgunun ortaya çıkmasına kadar geçen sürenin incelenmesinde kullanılan çözümleme

Detaylı

MIT OpenCourseWare http://ocw.mit.edu. 14.30 Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

MIT OpenCourseWare http://ocw.mit.edu. 14.30 Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 MIT OpenCourseWare http://ocw.mit.edu 14.30 Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 Bu materyale atıfta bulunmak ve kullanım koşulları için http://ocw.mit.edu/terms sayfasını ziyaret ediniz.

Detaylı

SÜREKLİ OLASILIK DAĞILIŞLARI

SÜREKLİ OLASILIK DAĞILIŞLARI SÜREKLİ OLASILIK DAĞILIŞLARI Sürekli verilerin göstermiş olduğu dağılışa sürekli olasılık dağılışı denir. Sürekli olasılık dağılışlarının fonksiyonlarına yoğunluk fonksiyonu denilmekte ve bu dağılışlarla

Detaylı

BİYOİSTATİSTİK Olasılıkta Temel Kavramlar Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK Olasılıkta Temel Kavramlar Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH BİYOİSTTİSTİK Olasılıkta Temel Kavramlar Yrd. Doç. Dr. slı SUNER KRKÜLH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim D. Web: www.biyoistatistik.med.ege.edu.tr 1 OLSILIK Olasılık; Tablo

Detaylı

QUANTILE REGRESYON * Quantile Regression

QUANTILE REGRESYON * Quantile Regression QUANTILE REGRESYON * Quantile Regression Fikriye KURTOĞLU İstatistik Anabilim Dalı Olcay ARSLAN İstatistik Anabilim Dalı ÖZET Bu çalışmada, Lineer Regresyon analizinde kullanılan en küçük kareler yöntemine

Detaylı

PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER 8

PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER 8 PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER 8 Prof. Dr. Ali ŞEN İki Populasyonun Karşılaştırılması: Eşleştirilmiş Örnekler için Wilcoxon İşaretli Mertebe Testi -BÜYÜK ÖRNEK Bağımsız populasyonlara uygulanan

Detaylı

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Yrd. Doç. Dr. Emre ATILGAN 1 RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI Olasılığa ilişkin olayların çoğunluğunda, deneme sonuçlarının bir veya birkaç yönden incelenmesi

Detaylı

İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications*

İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications* Ç.Ü. Fen Bilimleri Enstitüsü Yıl:010 Cilt:-1 İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications* Işıl FİDANOĞLU İstatistik Anabilim Dalı Fikri

Detaylı

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

rasgele değişkeninin olasılık yoğunluk fonksiyonu, 3.6. Bazı Sürekli Dağılımlar 3.6.1 Normal Dağılım Normal dağılım hem uygulamalı hem de teorik istatistikte kullanılan oldukça önemli bir dağılımdır. Normal dağılımın istatistikte önemli bir yerinin olmasının

Detaylı

Temel ve Uygulamalı Araştırmalar için Araştırma Süreci

Temel ve Uygulamalı Araştırmalar için Araştırma Süreci BÖLÜM 8 ÖRNEKLEME Temel ve Uygulamalı Araştırmalar için Araştırma Süreci 1.Gözlem Genel araştırma alanı 3.Sorunun Belirlenmesi Sorun taslağının hazırlanması 4.Kuramsal Çatı Değişkenlerin açıkça saptanması

Detaylı

ISTATISTIK VE OLASILIK SINAVI EKİM 2016 WEB SORULARI

ISTATISTIK VE OLASILIK SINAVI EKİM 2016 WEB SORULARI SORU- 1 : ISTATISTIK VE OLASILIK SINAVI EKİM 2016 WEB SORULARI X ve Y birbirinden bağımsız iki rasgele değişken olmak üzere, sırasıyla aşağıdaki moment çıkaran fonksiyonlarına sahiptir: 2 2 M () t = e,

Detaylı

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ 1 BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ Gözlenen belli bir özelliği, bu özelliğe ilişkin ölçme sonuçlarını yani verileri kullanarak betimleme, istatistiksel işlemlerin bir boyutunu oluşturmaktadır. Temel

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık KORELASYON ve REGRESYON ANALİZİ Doç. Dr. İrfan KAYMAZ Tanım Bir değişkenin değerinin diğer değişkendeki veya değişkenlerdeki değişimlere bağlı olarak nasıl etkilendiğinin istatistiksel

Detaylı

MAK 210 SAYISAL ANALİZ

MAK 210 SAYISAL ANALİZ MAK 210 SAYISAL ANALİZ BÖLÜM 5- SONLU FARKLAR VE İNTERPOLASYON TEKNİKLERİ Doç. Dr. Ali Rıza YILDIZ MAK 210 - Sayısal Analiz 1 İNTERPOLASYON Tablo halinde verilen hassas sayısal değerler veya ayrık noktalardan

Detaylı

GÜVEN ARALIKLARI ve İSTATİSTİKSEL ANLAMLILIK. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

GÜVEN ARALIKLARI ve İSTATİSTİKSEL ANLAMLILIK. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı GÜVEN ARALIKLARI ve İSTATİSTİKSEL ANLAMLILIK Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Kestirim Pratikte kitle parametrelerinin doğrudan hesaplamak olanaklı değildir. Bunun yerine

Detaylı

İÇİNDEKİLER 1. GİRİŞ...

İÇİNDEKİLER 1. GİRİŞ... İÇİNDEKİLER 1. GİRİŞ... 1 1.1. Regresyon Analizi... 1 1.2. Uygulama Alanları ve Veri Setleri... 2 1.3. Regresyon Analizinde Adımlar... 3 1.3.1. Problemin İfadesi... 3 1.3.2. Konu ile İlgili Potansiyel

Detaylı

Mühendislikte İstatistik Yöntemler

Mühendislikte İstatistik Yöntemler .0.0 Mühendislikte İstatistik Yöntemler İstatistik Parametreler Tarih Qma.3.98 4..98 0.3.983 45 7..984 37.3.985 48 0.4.986 67.4.987 5 0.3.988 45.5.989 34.3.990 59.4.99 3 4 34 5 37 6 45 7 45 8 48 9 5 0

Detaylı

BİYOİSTATİSTİK Tek Örneklem ve İki Örneklem Hipotez Testleri Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK Tek Örneklem ve İki Örneklem Hipotez Testleri Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK Tek Örneklem ve İki Örneklem Hipotez Testleri Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr

Detaylı

Toplum ve Örnek. Temel Araştırma Düzenleri. Doç. Dr. Ertuğrul ÇOLAK. Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Toplum ve Örnek. Temel Araştırma Düzenleri. Doç. Dr. Ertuğrul ÇOLAK. Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Toplum ve Örnek Temel Araştırma Düzenleri Doç. Dr. Ertuğrul ÇOLAK Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı Toplum ve Örnek İstatistik, toplumdan kurallara uygun olarak,

Detaylı

BİYOİSTATİSTİK. Uygulama 4. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK. Uygulama 4. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK Uygulama 4 Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr 1 Güven Aralıkları 2 Güven Aralıkları

Detaylı

TANIMLAYICI İSTATİSTİKLER

TANIMLAYICI İSTATİSTİKLER TANIMLAYICI İSTATİSTİKLER Tanımlayıcı İstatistikler ve Grafikle Gösterim Grafik ve bir ölçüde tablolar değişkenlerin görsel bir özetini verirler. İdeal olarak burada değişkenlerin merkezi (ortalama) değerlerinin

Detaylı

K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır.

K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır. İstatistiksel güven aralıkları uygulamalarında normallik (normal dağılıma uygunluk) oldukça önemlidir. Kullanılan parametrik istatistiksel tekniklerin geçerli olabilmesi için populasyon şans değişkeninin

Detaylı

Sürekli Rastsal Değişkenler

Sürekli Rastsal Değişkenler Sürekli Rastsal Değişkenler Normal Dağılım: Giriş Normal Dağılım: Tamamen ortalaması ve standart sapması ile tanımlanan bir rastsal değişken, X, için oluşturulan sürekli olasılık dağılımına normal dağılım

Detaylı

İSTATİSTİK II. Hipotez Testleri 1

İSTATİSTİK II. Hipotez Testleri 1 İSTATİSTİK II Hipotez Testleri 1 1 Hipotez Testleri 1 1. Hipotez Testlerinin Esasları 2. Ortalama ile ilgili bir iddianın testi: Büyük örnekler 3. Ortalama ile ilgili bir iddianın testi: Küçük örnekler

Detaylı

LOJİSTİK REGRESYON ANALİZİ

LOJİSTİK REGRESYON ANALİZİ LOJİSTİK REGRESYON ANALİZİ Lojistik Regresyon Analizini daha kolay izleyebilmek için bazı terimleri tanımlayalım: 1. Değişken (incelenen özellik): Bireyden bireye farklı değerler alabilen özellik, fenomen

Detaylı

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN Tanımlayıcı İstatistikler Yrd. Doç. Dr. Emre ATILGAN 1 Tanımlayıcı İstatistikler Yer Gösteren Ölçüler Yaygınlık Ölçüleri Merkezi Eğilim Ölçüleri Konum Ölçüleri 2 3 Aritmetik Ortalama Aritmetik ortalama,

Detaylı

Matematik Ders Notları. Doç. Dr. Murat Donduran

Matematik Ders Notları. Doç. Dr. Murat Donduran Matematik Ders Notları Doç. Dr. Murat Donduran Mart 18, 28 2 İçindekiler 1 Tanımlı Integral Uygulamaları 5 1.1 Olasılık.............................. 5 3 4 İÇINDEKILER Bölüm 1 Tanımlı Integral Uygulamaları

Detaylı

1203608-SIMÜLASYON DERS SORUMLUSU: DOÇ. DR. SAADETTIN ERHAN KESEN. Ders No:5 Rassal Değişken Üretimi

1203608-SIMÜLASYON DERS SORUMLUSU: DOÇ. DR. SAADETTIN ERHAN KESEN. Ders No:5 Rassal Değişken Üretimi 1203608-SIMÜLASYON DERS SORUMLUSU: DOÇ. DR. SAADETTIN ERHAN KESEN Ders No:5 RASSAL DEĞIŞKEN ÜRETIMI Bu bölümde oldukça yaygın bir biçimde kullanılan sürekli ve kesikli dağılımlardan örneklem alma prosedürleri

Detaylı

Tesadüfi Değişken. w ( )

Tesadüfi Değişken. w ( ) 1 Tesadüfi Değişken Tesadüfi değişkenler gibi büyük harflerle veya gibi yunan harfleri ile bunların aldığı değerler de gibi küçük harflerle gösterilir. Tesadüfi değişkenler kesikli veya sürekli olmak üzere

Detaylı

Örneklem Dağılımları & Hipotez Testleri Örneklem Dağılımı

Örneklem Dağılımları & Hipotez Testleri Örneklem Dağılımı Örneklem Dağılımları & Hipotez Testleri Örneklem Dağılımı Ortalama veya korelasyon gibi istatistiklerin dağılımıdır Çıkarımsal istatistikte örneklem dağılımı temel fikirlerden biridir. Çıkarımsal istatistik

Detaylı

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ I Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ II Yayın No : 2845 Teknik Dizisi : 158 1. Baskı Şubat 2013 İSTANBUL ISBN 978-605 - 377 868-4 Copyright Bu kitabın bu basısı için Türkiye deki yayın hakları BETA

Detaylı

DENİZ HARP OKULU TEMEL BİLİMLER BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

DENİZ HARP OKULU TEMEL BİLİMLER BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ DENİZ HARP OKULU TEMEL BİLİMLER BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ Dersin Adı Kodu Sınıf/Y.Y. Ders Saati (T+U+L) Kredi AKTS OLASILIK VE İSTATİSTİK FEB-222 2/ 2.YY 3+0+0 3 3 Dersin Dili Dersin Seviyesi

Detaylı

İÇİNDEKİLER ÖNSÖZ Bölüm 1 KÜMELER Bölüm 2 SAYILAR

İÇİNDEKİLER ÖNSÖZ Bölüm 1 KÜMELER Bölüm 2 SAYILAR İÇİNDEKİLER ÖNSÖZ III Bölüm 1 KÜMELER 11 1.1. Küme 12 1.2. Kümelerin Gösterimi 13 1.3. Boş Küme 13 1.4. Denk Küme 13 1.5. Eşit Kümeler 13 1.6. Alt Küme 13 1.7. Alt Küme Sayısı 14 1.8. Öz Alt Küme 16 1.9.

Detaylı

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5 Ders Kodu: 0010070021 Kredi: 3 / ECTS: 5 Yrd. Doç. Dr. Serkan DOĞANALP Necmettin Erbakan Üniversitesi Harita Mühendisliği Bölümü Konya 07.01.2015 1 Giriş 2 Giriş Matematiksel istatistiğin konusu yığın

Detaylı

BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK İstatistiksel Tahminleme ve Hipotez Testi-III Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr

Detaylı

OLASILIK ve İSTATİSTİK Hipotez Testleri

OLASILIK ve İSTATİSTİK Hipotez Testleri OLASILIK ve İSTATİSTİK Hipotez Testleri Yrd.Doç.Dr. Pınar YILDIRIM Okan Üniversitesi Mühendislik ve Mimarlık Fakültesi Bilgisayar Mühendisliği Bölümü Hipotezler ve Testler Hipotez, kitleye(yığına) ait

Detaylı

Appendix C: İstatistiksel Çıkarsama

Appendix C: İstatistiksel Çıkarsama Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Notları Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix C: İstatistiksel Çıkarsama

Detaylı

BÖLÜM 3 KURAMSAL ÇATI VE HİPOTEZ GELİŞ

BÖLÜM 3 KURAMSAL ÇATI VE HİPOTEZ GELİŞ BÖLÜM 3 KURAMSAL ÇATI VE HİPOTEZ GELİŞ İŞTİRME Araştırma rma SüreciS 1.Gözlem Genel araştırma alanı 3.Sorunun Belirlenmesi Sorun taslağının hazırlanması 4.Kuramsal Çatı Değişkenlerin açıkça saptanması

Detaylı

Parametrik Olmayan İstatistiksel Yöntemler

Parametrik Olmayan İstatistiksel Yöntemler Parametrik Olmayan İstatistiksel Yöntemler IST-4035 1. Ders DEÜ İstatistik Bölümü 2018 Güz 1 Dersin Amacı Yaygın olarak kullanılan parametrik olmayan istatistiksel yöntemleri tanıtmaktır. Temel kavramların

Detaylı

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları Yıldız Teknik Üniversitesi İktisat Bölümü Ekonometri I Ders Kitabı: J.M. Wooldridge, Introductory Econometrics A Modern Approach, 2nd. edition, Thomson Learning Appendix C: İstatistiksel Çıkarsama Doç.

Detaylı

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1 İÇİNDEKİLER ÖNSÖZ... v 1. BÖLÜM Örneklem Genişliğinin Elde edilmesi... 1 1.1. Kitle ve Parametre... 1 1.2. Örneklem ve Tahmin Edici... 2 1.3. Basit Rastgele Örnekleme... 3 1.4. Tabakalı Rastgele Örnekleme...

Detaylı

009 BS 400- İstatistik sonılannın cevaplanmasında gerekli olabilecek tablolar ve formüller bu kitapçığın sonunda verilmiştir. 1. şağıdakilerden hangisi doğal birimdir? l TV alıcısı Bl Trafik kazası CL

Detaylı

BİYOİSTATİSTİK. Ödev Çözümleri. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK. Ödev Çözümleri. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK Ödev Çözümleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr Ödev 1 Çözümleri 2 1. Bir sonucun

Detaylı

İÇİNDEKİLER BÖLÜM 1 KAVRAMLAR VE YÖNTEMBİLİM

İÇİNDEKİLER BÖLÜM 1 KAVRAMLAR VE YÖNTEMBİLİM İÇİNDEKİLER BÖLÜM 1 KAVRAMLAR VE YÖNTEMBİLİM I. İSTATİSTİK KAVRAMI ve TANIMI... 1 A. İSTATİSTİK KAVRAMI... 1 B. İSTATİSTİĞİN TANIMI... 2 C. İSTATİSTİĞİN TARİHÇESİ... 2 D. GÜNÜMÜZDE İSTATİSTİK VE ÖNEMİ...

Detaylı

BİYOİSTATİSTİK Merkezi Eğilim ve Değişim Ölçüleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BİYOİSTATİSTİK Merkezi Eğilim ve Değişim Ölçüleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH BİYOİSTATİSTİK Merkezi Eğilim ve Değişim Ölçüleri Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH Ege Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıbbi Bilişim AD. Web: www.biyoistatistik.med.ege.edu.tr 1 İstatistik

Detaylı

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ 1 İstatistik İstatistik, belirsizliğin veya eksik bilginin söz konusu olduğu durumlarda çıkarımlar yapmak ve karar vermek için sayısal verilerin

Detaylı

Prof.Dr.İhsan HALİFEOĞLU

Prof.Dr.İhsan HALİFEOĞLU Prof.Dr.İhsan HALİFEOĞLU FREKANS DAĞILIMLARINI TANIMLAYICI ÖLÇÜLER Düzenlenmiş verilerin yorumlanması ve daha ileri düzeydeki işlemler için verilerin bütününe ait tanımlayıcı ve özetleyici ölçülere ihtiyaç

Detaylı

SAĞKALIM ANALİZİNDE KANTİL REGRESYON VE PARAMETRİK REGRESYON MODELLERİNİN PERFORMANSLARININ KARŞILAŞTIRILMASI

SAĞKALIM ANALİZİNDE KANTİL REGRESYON VE PARAMETRİK REGRESYON MODELLERİNİN PERFORMANSLARININ KARŞILAŞTIRILMASI T.C. ADNAN MENDERES ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ BİYOİSTATİSTİK ANABİLİM DALI BİS-YL-2015-0002 SAĞKALIM ANALİZİNDE KANTİL REGRESYON VE PARAMETRİK REGRESYON MODELLERİNİN PERFORMANSLARININ KARŞILAŞTIRILMASI

Detaylı

Ekonometri I VARSAYIMLARI

Ekonometri I VARSAYIMLARI Ekonometri I ÇOK DEĞİŞKENLİ REGRESYON MODELİNİN VARSAYIMLARI Hüseyin Taştan Temmuz 23, 2006 İçindekiler 1 Varsayım MLR.1: Parametrelerde Doğrusallık 1 2 Varsayım MLR.2: Rassal Örnekleme 1 3 Varsayım MLR.3:

Detaylı

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı KORELASYON VE REGRESYON ANALİZİ Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı İki ya da daha çok değişken arasında ilişki olup olmadığını, ilişki varsa yönünü ve gücünü inceleyen korelasyon

Detaylı

GRUP ARDIŞIK TEST YÖNTEMLERİ İLE SAĞKALIM ANALİZİNDE ÖRNEKLEM HACMİNİN BELİRLENMESİ. Afyonkarahisar. Samsun

GRUP ARDIŞIK TEST YÖNTEMLERİ İLE SAĞKALIM ANALİZİNDE ÖRNEKLEM HACMİNİN BELİRLENMESİ. Afyonkarahisar. Samsun Afyon Kocatepe Üniversitesi 8(1) Afyon Kocatepe University FEN BİLİMLERİ DERGİSİ JOURNAL OF SCIENCE GRUP ARDIŞIK TEST YÖNTEMLERİ İLE SAĞKALIM ANALİZİNDE ÖRNEKLEM HACMİNİN BELİRLENMESİ Yüksel Terzi 1, Naci

Detaylı

2. BASİT DOĞRUSAL REGRESYON 12

2. BASİT DOĞRUSAL REGRESYON 12 1. GİRİŞ 1 1.1 Regresyon ve Model Kurma / 1 1.2 Veri Toplama / 5 1.3 Regresyonun Kullanım Alanları / 9 1.4 Bilgisayarın Rolü / 10 2. BASİT DOĞRUSAL REGRESYON 12 2.1 Basit Doğrusal Regresyon Modeli / 12

Detaylı

İstatistiksel Yorumlama

İstatistiksel Yorumlama İstatistiksel Yorumlama Amaç, popülasyon hakkında yorumlamalar yapmaktadır. Populasyon Parametre Karar Vermek Örnek İstatistik Tahmin 1 Tahmin Olaylar hakkında tahminlerde bulunmak ve karar vermek zorundayız

Detaylı

Deney Dizaynı ve Veri Analizi Ders Notları

Deney Dizaynı ve Veri Analizi Ders Notları Deney Dizaynı ve Veri Analizi Ders Notları Binom dağılım fonksiyonu: Süreksiz olaylarda, sonuçların az sayıda seçenekten oluştuğu durumlarda kullanılır. Bir para atıldığında yazı veya tura gelme olasılığı

Detaylı

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 MIT OpenCourseWare http://ocw.mit.edu 14.30 Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009 Bu materyale atıfta bulunmak ve kullanım koşulları için http://ocw.mit.edu/terms sayfasını ziyaret ediniz.

Detaylı

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ TEMEL KAVRAMLAR PARAMETRE: Populasyonun sayısal açıklayıcı bir ölçüsüdür ve anakütledeki tüm elemanlar dikkate alınarak hesaplanabilir. Ana kütledeki

Detaylı

ARALIK TAHMİNİ (INTERVAL ESTIMATION):

ARALIK TAHMİNİ (INTERVAL ESTIMATION): YTÜ-İktisat İstatistik II Aralık Tahmini I 1 ARALIK TAHMİNİ INTERVAL ESTIMATION): Nokta tahmininde ilgilenilen anakütle parametresine ilişkin örneklem bilgisinden hareketle tek bir sayı üretilir. Bir nokta

Detaylı

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir. Koşullu Öngörümleme Ex - ante (tasarlanan - umulan) öngörümleme söz konusu iken açıklayıcı değişkenlerin hatasız bir şekilde bilindiği varsayımı gerçekçi olmayan bir varsayımdır. Çünkü bazı açıklayıcı

Detaylı

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( )

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( ) İKİ DEĞİŞKENLİ OLASILIK Rassal bir deneme yapılmakta ve farklı iki olay ile ilgilenilmektedir. A 1, A 2,,A i olayları bağdaşmaz ve bütünü kapsayıcıdır. B 1, B 2,,B j olayları bağdaşmaz ve bütünü kapsayıcıdır.

Detaylı

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek,

8.Hafta. Değişkenlik Ölçüleri. Öğr.Gör.Muhsin ÇELİK. Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek, İSTATİSTİK 8.Hafta Değişkenlik Ölçüleri Hedefler Bu üniteyi çalıştıktan sonra; Uygun değişkenlik ölçüsünü hesaplayıp yorumlayabilecek, Serilerin birbirlerine değişkenliklerini yorumlayabileceksiniz. 2

Detaylı

İstatistik ve Olasılık

İstatistik ve Olasılık İstatistik ve Olasılık Ders 10: Prof. Dr. İrfan KAYMAZ Tanım Varyans analizi niçin yapılır? İkiden fazla veri grubunun ortalamalarının karşılaştırılması t veya Z testi ile yapılabilir. Ancak karşılaştırılacak

Detaylı

UYGUN HİPOTEZ TESTİNİN SEÇİMİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

UYGUN HİPOTEZ TESTİNİN SEÇİMİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı UYGUN HİPOTEZ TESTİNİN SEÇİMİ Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı ÖNEMLİLİK (Hipotez) TESTLERİ ü Önemlilik testleri, araştırma sonucunda elde edilen değerlerin ya da varılan

Detaylı

Matris Cebiriyle Çoklu Regresyon Modeli

Matris Cebiriyle Çoklu Regresyon Modeli Matris Cebiriyle Çoklu Regresyon Modeli Hüseyin Taştan Mart 00 Klasik Regresyon Modeli k açıklayıcı değişkenden oluşan regresyon modelini her gözlem i için aşağıdaki gibi yazabiliriz: y i β + β x i + β

Detaylı

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH ORTALAMA ÖLÇÜLERİ Ünite 6 Öğr. Gör. Ali Onur CERRAH Araştırma sonucunda elde edilen nitelik değişkenler hakkında tablo ve grafikle bilgi sahibi olunurken, sayısal değişkenler hakkında bilgi sahibi olmanın

Detaylı