KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Benzer belgeler
KORELASYON VE REGRESYON ANALİZİ

1

Korelasyon, Korelasyon Türleri ve Regresyon

UYGUN HİPOTEZ TESTİNİN SEÇİMİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

LOJİSTİK REGRESYON ANALİZİ

İstatistik ve Olasılık

Deneysel Araştırmalarda Biyoistatistik. Prof. Dr. İsmet DOĞAN AFYON KOCATEPE ÜNİVERSİTESİ. Biyoistatistik ve Tıbbi Bilişim Anabilim Dalı

REGRESYON ANALĐZĐ. 1

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

Sağlık Alanında Kullanılan İlişki Katsayıları

Korelasyon testleri. Pearson korelasyon testi Spearman korelasyon testi. Regresyon analizi. Basit doğrusal regresyon Çoklu doğrusal regresyon

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

İÇİNDEKİLER. Birinci Bölüm UYGULAMA VERİLERİ

Basit ve Çoklu Doğrusal Regresyon

BİYOİSTATİSTİK Uygulama 7 Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

SA Ğ KALIM ANAL Ġ ZLER Ġ

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

Öğr. Elemanı: Dr. Mustafa Cumhur AKBULUT

1 PAZARLAMA ARAŞTIRMASI

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ

İLERİ BİYOİSTATİSTİK KURSU

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

GİRİŞ. Bilimsel Araştırma: Bilimsel bilgi elde etme süreci olarak tanımlanabilir.

Korelasyon ve Regresyon

MATE 211 BİYOİSTATİSTİK DÖNEM SONU SINAVI

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Sık kullanılan istatistiksel yöntemler ve yorumlama. Doç. Dr. Seval KUL Gaziantep Üniversitesi Tıp Fakültesi

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları II (19 Nisan 2012)

OLASILIK ve KURAMSAL DAĞILIMLAR

Korelasyon ve Regresyon

PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz.

Korelasyon ve Regresyon

Yatırım Analizi ve Portföy Yönetimi 6. Hafta

2. BASİT DOĞRUSAL REGRESYON 12

ARAŞTIRMA TÜRLERİ R. ALPAR

(saat/hafta) (saat/hafta) Biyoistatistik SBF Bahar Önkoşullar

Çapraz Tablo ve Diğer Tabloları Oluşturabilmek Bu Tablolara Uygun Çok Yönlü Grafikleri Çizebilmek

Modeli - Tarama Modelleri

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1

Projede istatistik analiz planı

Korelasyon. Korelasyon. Merkezi eğilim ve değişim ölçüleri bir defada sadece bir değişkenin özelliklerini incelememize imkan tanır.

SPSS Uygulamalı Çok Değişkenli İstatistik Teknikleri

Olasılık ve Normal Dağılım

YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI. Sibel SELİM 1 Efe SARIBAY 2

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

KESİTSEL ARAŞTIRMALAR

Tablo ve Grafikler. Dr.Önder Ergönül Koç Üniversitesi Tıp Fakültesi Enfeksiyon Hastalıkları ve Klinik Mikrobiyoloji Bölümü

İLERİ ARAŞTIRMA SORU HAVUZU

İSTATİSTİKSEL VERİ ANALİZİ

10. Bir ana kütle oranının tahmininde α = 0,05 ise kullanılan Z değeri nedir? A) 1,64 B) 1,84 C) 1,96 D) 2,28 E) 3,08

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

1. İLİŞKİLERİN İNCELENMESİNE YÖNELİK ANALİZLER Sosyal Bilimlerde Nedensel Açıklamalar

BİYOİSTATİSTİK. Uygulama 6. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

ELEKTRONİK MÜHENDİSLİĞİ NDE KİMYA EĞİTİMİNİN GEREKLİLİĞİNİN İKİ DEĞİŞKENLİ KORELASYON YÖNTEMİ İLE İSTATİSTİKSEL OLARAK İNCELENMESİ

İÇİNDEKİLER 1. GİRİŞ...

A İSTATİSTİK. 1. nc r, n tane nesneden her defasında r tanesinin alındığı (sıralama önemsiz) kombinasyonların sayısını göstermektedir.

PERİTON DİYALİZİ HASTALARINDA AKIM ARACILI DİLATASYON VE ASİMETRİK DİMETİLARGİNİN MORTALİTEYİ BELİRLEMEZ

Hastane Yönetimi-Ders 8 Hastanelerde İstatistiksel Karar Verme

Kitle: Belirli bir özelliğe sahip bireylerin veya birimlerin tümünün oluşturduğu topluluğa kitle denir.

6.6. Korelasyon Analizi. : Kitle korelasyon katsayısı

7.Sunum. Yrd. Doç. Dr. Sedat ŞEN 1

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

BİYOİSTATİSTİK Bazı Olasılık Dağılışları Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

TIP FAKÜLTESİ ÖĞRENCİLERİNDE GÜNDÜZ AŞIRI UYKULULUK HALİ VE DEPRESYON ŞÜPHESİ İLİŞKİSİ

İçindekiler. Ön Söz... xiii

Olgu-kontrol araştırmalarının analizi ve değerlendirilmesi. Raika Durusoy

EŞANLI DENKLEM MODELLERİ

BÖLÜM 1: YAşAM ÇÖzÜMLEMEsİNE GİRİş... 1

İÇİNDEKİLER ÖN SÖZ...

İstatistik ve Olasılık

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

MATH Ýþletme Ýstatistiði II

Nokta ve Aralık Tahmini Merkezi Limit Teoremi Örneklem Dağılımı Hipotez Testlerine Giriş

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Prof.Dr. Oktay Ergene. Kardiyoloji Kliniği

DENKLEM SİSTEMLERİ. ifadesinde a sayısı bilinmeyenin katsayısı ve b ise sabit sayıdır.

ÖĞRENCİNİN ADI SOYADI:. NO:

Araştırma Yöntemleri. Araştırma Tasarımı ve İstatistik Test Seçimi

ISTATISTIK VE OLASILIK SINAVI EKİM 2016 WEB SORULARI

MAK 210 SAYISAL ANALİZ

Parametrik Olmayan İstatistiksel Yöntemler

Frekans. Hemoglobin Düzeyi

DÖNEM II ÜROGENİTAL SİSTEM VE HASTALIKLARIN BİYOLOJİK TEMELLERİ DERS KURULU. Yrd.Doç.Dr.İsmail YILDIZ BİYOİSTATİSTİK AD DERS NOTLARI

Bir Üniversite Kliniğinde Yatan Hastalarda MetabolikSendrom Sıklığı GŞ CAN, B BAĞCI, A TOPUZOĞLU, S ÖZTEKİN, BB AKDEDE

ARAŞTIRMA YÖNTEMLERİ

CHAPTER 6 SIMPLE LINEAR REGRESSION

3.YIL/ 1.yarıyıl Güz

Regresyon. Regresyon korelasyon ile yakından ilişkilidir

Çok Kesitli Bilgisayarlı Tomografik Koroner Anjiyografi Sonrası Uzun Dönem Kalıcı Böbrek Hasarı Sıklığı ve Sağkalım ile İlişkisi

ÇOKLU REGRESYON MODELİ. Bir bağımlı değişkene etki eden çok sayıda bağımsız değişkeni analize dahil ederek çoklu regresyon modeli uygulanabilir.

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

Transkript:

KORELASYON VE REGRESYON ANALİZİ Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

İki ya da daha çok değişken arasında ilişki olup olmadığını, ilişki varsa yönünü ve gücünü inceleyen korelasyon analizi ile değişkenlerden birisi belirli bir birim değiştiğinde diğerinin nasıl bir değişim gösterdiğini inceleyen regresyon analizi sağlık bilimlerinde çok kullanılan istatistiksel yöntemlerdir. 2 A.Ü.T.F Biyoistatistik A.D.

Korelasyon ve regresyon analizinin sağlık bilimlerinde kullanımına ilişkin bazı örnekler: Hastalığın başlangıcıyla doktora başvurma arasında geçen süre ile iyileşme süresi arasındaki, yine ilacın dozu ile iyileşme süresi arasındaki ilişkilerden yararlanılarak tedaviye başlama, dozunu ayarlama ve tedaviyi bitirmeye karar verilir. 3 A.Ü.T.F Biyoistatistik A.D.

* Sigara içme sıklığı ile koroner kalp hastalığına yakalanma arasında nedensel bir ilişki saptanırsa sigara içme önlenerek koroner kalp hastalığına yakalanma ortadan kaldırılabilir. 4 A.Ü.T.F Biyoistatistik A.D.

Değişkenler arasındaki ilişkilerden yararlanılarak geliştirilecek matematiksel modeller yardımıyla tahminler yapılabilir. Örneğin; Yaş ile boy arasında bir model geliştirilebilirse bir çocuğun belirli yaşlarda boyunun kaç cm. olacağı, Doğum sayısı ile hemoglobin düzeyi arasında bir model geliştirilebilirse belirli sayıda doğum yapacak bir kadının hemoglobin değerinin ne olacağı, Belirli bir hastalıkta kullanılan bir ilacın dozu ile iyileşme süresi arasında bir model geliştirilebilirse verilen doza göre hastanın ne kadar sürede iyileşebileceği tahmin edilebilir. 5 A.Ü.T.F Biyoistatistik A.D.

r= -1 r= 0 r= +1 Mükemmel İlişki yok Mükemmel negatif ilişki pozitif ilişki Saçılım grafikleri iki değişken arasındaki ilişki hakkında genel bir bilgi edinmemizi sağlar. Ancak, ilişkinin miktarı konusunda yorum yapabilmek için korelasyon katsayısı hesaplamamız gerekmektedir. 6 A.Ü.T.F Biyoistatistik A.D.

Korelasyon katsayısı (r), iki değişken arasındaki ilişkinin ölçüsüdür. Korelasyon katsayısı -1 ve +1 arasında değişim gösterir. r=0; iki değişken arasında ilişki olmadığı, r=1; mükemmel pozitif doğrusal ilişki olduğu, r=-1; mükemmel negatif doğrusal ilişki olduğu anlamına gelir. KORELASYON KATSAYISI 7 A.Ü.T.F Biyoistatistik A.D.

Korelasyonun katsayısının gücü ile ilgili olarak aşağıdaki tanımlamalar yapılmıştır: 0.00-0.25 Çok zayıf ilişki 0.26-0.49 Zayıf ilişki 0.50-0.69 Orta ilişki 0.70-0.89 Yüksek ilişki 0.90-1.00 Çok yüksek ilişki 8 A.Ü.T.F Biyoistatistik A.D.

Korelasyon katsayıları, aralarında ilişki araştırılan değişkenlerin türlerine göre farklılık gösterir. 9 A.Ü.T.F Biyoistatistik A.D.

Sınıflanabilir nitel değişkenler arasındaki ilişkinin belirlenmesinde kullanılan korelasyon katsayıları Phi Katsayısı (Değişkenlerin her ikisi de 2 kategorili ise) Cramer V Katsayısı Olağanlık Katsayısı Lambda Katsayısı 10 A.Ü.T.F Biyoistatistik A.D.

Sıralanabilir nitel değişkenler arasındaki ilişkinin belirlenmesinde kullanılan korelasyon katsayıları Spearman Korelasyon Katsayısı Gamma Katsayısı Kendall ın tau-b Katsayısı Kendall ın tau-c Katsayısı Somer in d Katsayısı 11 A.Ü.T.F Biyoistatistik A.D.

Kesikli/Sürekli Nicel değişkenler arasındaki ilişkinin belirlenmesinde kullanılan korelasyon katsayıları Pearson Korelasyon Katsayısı (Değişkenlerin her ikisi de normal dağılım gösteriyorsa) Spearman Korelasyon Katsayısı (Değişkenlerden en az birisi normal dağılım göstermiyorsa) 12 A.Ü.T.F Biyoistatistik A.D.

Sınıflanabilir Nitel bir değişken ve Kesikli/Sürekli bir Nicel değişken arasındaki ilişkinin belirlenmesinde kullanılan korelasyon katsayıları Çift Serili Korelasyon Katsayısı Nokta Çift Serili Korelasyon Katsayısı Sıralanabilir Nitel bir değişken ve Kesikli/Sürekli bir Nicel değişken arasındaki ilişkinin belirlenmesinde kullanılan korelasyon katsayısı Çoklu Serili Korelasyon Katsayısı 13 A.Ü.T.F Biyoistatistik A.D.

DOĞRUSAL REGRESYON Regresyon analizi, bilinen bulgulardan, bilinmeyen gelecekteki olaylarla ilgili tahminler yapılmasına izin verir. Regresyon, bağımlı ve bağımsız değişken(ler) arasındaki ilişkiyi ve doğrusal eğri kavramını kullanarak, bir tahmin eşitliği geliştirir. Değişkenler arasındaki ilişki belirlendikten sonra, bağımsız değişken(ler)in değeri bilindiğinde bağımlı değişkenin değeri tahmin edilebilir. 14 A.Ü.T.F Biyoistatistik A.D.

Bağımlı Değişken (y) Bağımlı değişken, regresyon modelinde açıklanan ya da tahmin edilen değişkendir. Bu değişkenin bağımsız değişken ile ilişkili olduğu varsayılır. Bağımsız Değişken (x) Bağımsız değişken, regresyon modelinde açıklayıcı değişken olup; bağımlı değişkenin değerini tahmin etmek için kullanılır. 15 A.Ü.T.F Biyoistatistik A.D.

Değişkenler arasında doğrusal ilişki olabileceği gibi, doğrusal olmayan bir ilişki de olabilir. Bu nedenle, saçılım grafiği yapılmadan (ilişki yok/doğrusal ilişki var/doğrusal olmayan ilişki var) regresyon analizine karar verilmemesi gerekir. Bu bilgiler doğrultusunda, tek/çok değişkenli doğrusal regresyon analizlerinin yanı sıra, tek/çok değişkenli doğrusal olmayan regresyon analizleri de mevcuttur. 16 A.Ü.T.F Biyoistatistik A.D.

Y Y (a) (+) yönlü Doğrusal İlişki X (b) (-) yönlü Doğrusal İlişki X 17 A.Ü.T.F Biyoistatistik A.D.

Y Y (c) Doğrusal Olmayan İlişki X (d) İlişki Yok X 18 A.Ü.T.F Biyoistatistik A.D.

Bağımlı değişken ile bağımsız değişken arasındaki doğrusal ilişkiyi açıklayan tek değişkenli regresyon modeli aşağıdaki gibidir: y = a + bx y = Bağımlı değişkenin değeri a = Regresyon doğrusunun kesim değeri (Sabit değer) b = Regresyon doğrusunun eğimi x = Bağımsız değişkenin değeri 19 A.Ü.T.F Biyoistatistik A.D.

Örnek: Kardiyoloji kliniğine başvuran 20 yaş üzerindeki erkek hastalar üzerinde yapılan bir araştırmada, yaş ve kolesterol değişkeni arasındaki ilişkiden yola çıkılarak kurulan regresyon modeli aşağıdaki gibi elde edilmiştir: Y = 151.44 + 1.428X Kolesterol = 151.44 + 1.428xYaş Bu modele göre, yaştaki bir birimlik artışın, kolesterol değerinde 1.428 birimlik bir artışa neden olacağı, 20 yaşındaki bir erkeğin (X=20) kolesterol değerinin ise 180 olacağı söylenebilir. 20 A.Ü.T.F Biyoistatistik A.D.

Kurulan bu modele göre, 50 yaşında bir erkeğin kolesterol değerinin ne kadar olacağını tahmin edebiliriz X=50 için : Y = 151.44 + 1.428X = 151.44 + 1.428*50 = 222.84 50 yaşında bir erkeğin kolesterol değerinin 222.84 olacağı söylenebilir. 21 A.Ü.T.F Biyoistatistik A.D.

BELİRTME KATSAYISI (R 2 ) Belirtme katsayısı, doğrusal modelin uyum iyiliğinin en iyi ölçüsüdür. Söz konusu katsayı, bağımlı değişkendeki değişimin ne kadarının bağımsız değişken(ler) tarafından açıklandığını ifade eder. Bu durum, regresyon modelinin açıklayıcılık gücünün iyi bir göstergesidir. Yukarıdaki örneğe göre, belirtme katsayısı %74.3 olarak bulunmuştur. Bunun anlamı, yaş değişkeni kolesterol değişkenindeki değişimin %74.3 ünü açıklamaktadır. Geriye kalan %25.7 lik değişim, modele katılacak başka değişkenler tarafından açıklanabilir. 22 A.Ü.T.F Biyoistatistik A.D.

Doğrusal ve doğrusal olmayan regresyon modellerinin dışında değişik regresyon analizleri de bulunmaktadır. 23 A.Ü.T.F Biyoistatistik A.D.

Kanonik Korelasyon Birden fazla sayıda bağımlı değişken ile bir ya da daha fazla bağımsız değişken arasındaki ilişkinin incelenmesi için kullanılan bir yöntemdir. Örneğin, HDL, LDL, Trigliserid değerlerini etkileyen değişkenlerin araştırılmasında kanonik korelasyon yönteminden yararlanılır. 24 A.Ü.T.F Biyoistatistik A.D.

Lojistik Regresyon Bağımlı değişken iki sonuçlu bir değişken (Var/Yok, Hasta/Sağlıklı vb.) olduğunda, bu sonucun birinin (Var veya Yok) ortaya çıkma olasılığı üzerinde etkili olduğu düşünülen faktör(ler)in araştırılması yöntemidir. Örneğin; meme kanseri riski (Kanser/Kanser değil) üzerinde etkili olan risk faktörlerinin araştırılmasında lojistik regresyon yönteminden yararlanılır. 25 A.Ü.T.F Biyoistatistik A.D.

Cox Regresyon Zaman içinde izlenmiş ve belli tip bir sonuca erişmiş/erişmemiş olguların (iki sonuçlu değişken) değerlendirildiği ve bu sonucu oluşturmada çeşitli değişkenlerin etkilerinin araştırıldığı çözümleme yöntemidir. Örneğin, operasyon sonrası sağ kalım üzerinde etkili olan değişkenlerin araştırılmasında Cox regresyon yönteminden yararlanılır. 26 A.Ü.T.F Biyoistatistik A.D.