REGRESYON ANALĐZĐ. www.fikretgultekin.com 1



Benzer belgeler
KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Korelasyon, Korelasyon Türleri ve Regresyon

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

Öğr. Elemanı: Dr. Mustafa Cumhur AKBULUT

İstatistik ve Olasılık

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

Basit ve Çoklu Doğrusal Regresyon

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

1

Regresyon. Regresyon korelasyon ile yakından ilişkilidir

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları II (19 Nisan 2012)

ZAMAN SERİLERİNDE REGRESYON ANALİZİ

LOJİSTİK REGRESYON ANALİZİ

ANADOLU ÜNİVERSİTESİ REGRESYON KATSAYILARININ GÜVEN ARALIĞI = + REGRESYON KATSAYILARININ GÜVEN ARALIĞI

MAK 210 SAYISAL ANALİZ

İstatistik ve Olasılık

İÇİNDEKİLER 1. GİRİŞ...

Korelasyon ve Regresyon

2. BASİT DOĞRUSAL REGRESYON 12

Matris Cebiriyle Çoklu Regresyon Modeli

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

İSTATİSTİK-II. Korelasyon ve Regresyon

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

EME 3117 SİSTEM SIMÜLASYONU. Girdi Analizi. Özet İstatistikler ve Histogram (Minitab)(1) Örnek: Eczane İçin Servis Süreleri

Olasılık ve Normal Dağılım

KORELASYON VE TEKLİ REGRESYON ANALİZİ-EN KÜÇÜK KARELER YÖNTEMİ

BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

Ekonometri I VARSAYIMLARI

ÜSTEL DÜZLEŞTİRME YÖNTEMİ

İSTATİSTİKSEL VERİ ANALİZİ

BÖLÜM 12 STUDENT T DAĞILIMI

QUANTILE REGRESYON * Quantile Regression

17 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

Dik koordinat sisteminde yatay eksen x ekseni (apsis ekseni), düşey eksen ise y ekseni (ordinat ekseni) dir.

Mühendislikte İstatistik Yöntemler

PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER

Mühendislikte İstatistiksel Yöntemler

Tekrarlı Ölçümler ANOVA

İÇİNDEKİLER ÖN SÖZ...

Yatırım Analizi ve Portföy Yönetimi 6. Hafta

13. Olasılık Dağılımlar

Parametrik Olmayan Testler. İşaret Testi-The Sign Test Mann-Whiney U Testi Wilcoxon Testi Kruskal-Wallis Testi

KORELASYON VE REGRESYON ANALİZİ

ÖRNEK BULGULAR. Tablo 1: Tanımlayıcı özelliklerin dağılımı

Nedensel Modeller Y X X X

SPSS E GİRİŞ SPSS TE TEMEL İŞLEMLER. Abdullah Can

Nitel Tepki Bağlanım Modelleri

ÇOKLU REGRESYON MODELİ. Bir bağımlı değişkene etki eden çok sayıda bağımsız değişkeni analize dahil ederek çoklu regresyon modeli uygulanabilir.

Farklı iki ilaç(a,b) kullanan iki grupta kan pıhtılaşma zamanları farklı mıdır?

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ

Bir Normal Dağılım Ortalaması İçin Testler

UYGUN HİPOTEZ TESTİNİN SEÇİMİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Korelasyon testleri. Pearson korelasyon testi Spearman korelasyon testi. Regresyon analizi. Basit doğrusal regresyon Çoklu doğrusal regresyon

İÇİNDEKİLER. Birinci Bölüm UYGULAMA VERİLERİ

İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications*

SPSS UYGULAMALARI-II Dr. Seher Yalçın 1

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

BİYOİSTATİSTİK. Uygulama 6. Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

MAK 210 SAYISAL ANALİZ

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

CHAPTER 6 SIMPLE LINEAR REGRESSION

İçindekiler. Ön Söz... xiii

SIRADAN EN KÜÇÜK KARELER (OLS)

İLERİ BİYOİSTATİSTİK KURSU

YARI LOGARİTMİK MODELLERDE KUKLA DECİşKENLERİN KA TSA YıLARıNIN YORUMU

MATE 211 BİYOİSTATİSTİK DÖNEM SONU SINAVI

KONULAR. 14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

İstatistik ve Olasılık

Hipotez Testlerine Giriş. Hipotez Testlerine Giriş

YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI. Sibel SELİM 1 Efe SARIBAY 2

PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz.

3. BÖLÜM: EN KÜÇÜK KARELER

Tanımlayıcı İstatistikler. Yrd. Doç. Dr. Emre ATILGAN

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

Akdeniz Üniversitesi

Eşanlı Denklem Modelleri

TOBB Ekonomi ve Teknoloji Üniversitesi İKT352 Ekonometri II, Dönem Sonu Sınavı

BİYOİSTATİSTİK Uygulama 7 Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

ĐSTATĐSTĐK. Okan ERYĐĞĐT

Temel İstatistik. Y.Doç.Dr. İbrahim Turan Mart Tanımlayıcı İstatistik. Dağılımları Tanımlayıcı Ölçüler Dağılış Ölçüleri

SÜREKLĠ OLASILIK DAĞILIMLARI

7.Ders Bazı Ekonometrik Modeller. Đktisat (ekonomi) biliminin bir kavramı: gayrisafi milli hasıla.

OLS Yönteminin Asimptotik (Büyük Örneklem) Özellikleri SIRADAN EN KÜÇÜK KARELER (OLS) Asimptotik Özellikler: Tutarlılık. Asimptotik Özellikler

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

FAKTÖR ANALİZİ VAHİDE NİLAY KIRTAK

GRAFİK ÇİZİMİNDE ÖNEMLİ NOKTALAR

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

DİNAMİK PANEL VERİ MODELLERİ. FYT Panel Veri Ekonometrisi 1

MATEMATiKSEL iktisat

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

Transkript:

REGRESYON ANALĐZĐ Regresyon analizi, aralarında sebep-sonuç ilişkisi bulunan iki veya daha fazla değişken arasındaki ilişkiyi belirlemek ve bu ilişkiyi kullanarak o konu ile ilgili tahminler (estimation) ya da kestirimler (prediction) yapabilmek amacıyla yapılır. Doğada birçok olayda sebep sonuç ilişkisine rastlamak mümkündür. Örnek: Sebep Sonuç Gelir Harcama Yaş Boy Gübre Verim Yem miktarı Süt miktarı Çalışma süresi Alınan not Bu analiz tekniğinde iki (basit regresyon) veya daha fazla değişken (çoklu regresyon) arasındaki ilişki açıklamak için matematiksel bir model kullanılır ve bu model regresyon modeli olarak adlandırılır.aşağıda basit regresyon analizi anlatılmıştır. Basit regresyon modeli Y=α+βX+ε şeklinde bir bağımlı ve bir de bağımsız değişken içeren bir modeldir. Burada Y; bağımlı (sonuç) değişken olup belli bir hataya sahip olduğu varsayılır. X; bağımsız (sebep) değişkeni olup hatasız ölçüldüğü varsayılır. α; sabit olup X=0 olduğunda Y nin aldığı değerdir. β ise regresyon katsayısı olup, X in kendi birimi cinsinden 1 birim değişmesine karşılık Y de kendi birimi cinsinden meydana gelecek değişme miktarını ifade eder. ε; tesadüfi hata terimi olup ortalaması sıfır varyansı σ2 olan normal dağılış gösterdiği varsayılır. Bu varsayım parametre tahminleri için değil katsayıların önem kontrolleri için gereklidir. Parametrelerin (Katsayıların) Tahmini Bir regresyon modeli oluşturulurken genelde en-küçük kareler ve en büyükolabilirlik ( maximum likelihood) teknikleri olarak bilinen iki yaklaşımdan birisi kullanılır. Eğer hata teriminin normal dağılım göstermesi şeklinde bir varsayım varsa en büyük olabilirlik, hata www.fikretgultekin.com 1

teriminin dağılışı ile ilgili herhangi bir varsayım söz konusu değilse en-küçük kareler tekniği kullanılarak parametreler tahmin edilir. 1 En-küçük kareler tekniği kullanılarak parametrelerin nasıl tahmin edildiğini örnek bir veri grubu üzerinde kısaca özetleyelim. Boy(cm) (X) Çevre(cm) (Y) 9 5 15 6 6 4 24 12 32 19 Tabloda verilen X ve Y değişkenlerine ait beş gözlem çifti, koordinat eksenlerine yerleştirildiğinde elde edilen serpme diyagramının Şekil (a) daki grafik elde edilir. (a) (b) Şekil (a) da verilen noktaları temsil eden regresyon doğrusu oluşturulursa Şekil (b) elde edilir. Uydurulan regresyon doğrusu ile gözlem noktaları arasındaki fark hata (ε) olarak isimlendirilir. Regresyon doğrusuna ait parametreler öyle tahmin edilmelidir ki; doğru ile gözlem noktaları arasındaki fark (hata) en az olsun. Bunu sağlayacak teknik ise en-küçük kareler tekniğidir. Regresyon Analizi Đki değişken arasındaki korelasyonun matematiksel ifadesini tespit etmek için yapılan analiz. Bu matematiksel ifadeye de regresyon denklemi diyoruz. 1 http://www.mku.edu.tr/genel/fakulte/ziraat/zootekni/personel_veri/suat/bolum_9.pdf www.fikretgultekin.com 2

Regresyon denklemi genel ifadesi: Y` = a + bx X: seçilen bağımsız değişkenin değeri y Y`: seçilmiş X değerine için tahmin edilen Y değeri a: dogrunun Y ekseni kestiği noktanın değeri b: doğrunun eğimi a a ve b: regresyon katsayıları x Regresyon analizi Bir kriter değişkeni ile bir veya daha fazla sayıda tahmin değişkenleri arasındaki ilgiyi sayısal hale dönüştürmede kullanılan istatistiksel analizdir. Regresyon analizi esas olarak değişkenler arasında ilişkinin niteliğini saptamayı amaçlar. Tahmin değişkeni olarak bir değişken kullanılırsa basit regresyon, tahmin değişkenleri olarak iki veya daha fazla değişken kullanılırsa çoklu regresyon analizinde söz etmek mümkündür. Amaç her tahmin değişkenininin kriter değişkenindeki toplam değişmeye olan katkısının saptanması ve dolayısıyla tahmin değişkenlerinin doğrusal kombinasyonunun değerinden hareketle kriter değerinin tahmin edilmesidir. 2 Örnek: Tüketicilerin gelir düzeyleri ile A malının satışları arasındaki ilişkinin doğrusal olduğu varsayılarak iki değişken arasındaki ilişki matematiksel olarak gösterilebilir. Đki ya da daha çok değişken arasında ilişki olup olmadığını, ilişki varsa yönünü ve gücünü inceleyen korelasyon analizi ile değişkenlerden birisi belirli bir birim değiştiğinde diğerinin nasıl bir değişim gösterdiğini inceleyen regresyon analizi sağlık bilimlerinde çok kullanılan istatistiksel yöntemlerdir. 3 Regresyon analizi, bilinen bulgulardan, bilinmeyen gelecekteki olaylarla ilgili tahminler yapılmasına izin verir.regresyon, bağımlı ve bağımsız değişken(ler) arasındaki ilişkiyi ve doğrusal eğri kavramını kullanarak, bir tahmin eşitliği geliştirir.değişkenler arasındaki ilişki belirlendikten sonra, bağımsız değişken(ler)in skoru bilindiğinde bağımlı değişkenin skoru tahmin edilebilir. Bağımlı Değişken (y) Bağımlı değişken, regresyon modelinde açıklanan ya da tahmin edilen değişkendir. Bu değişkenin bağımsız değişken ile ilişkili olduğu varsayılır. Bağımsız Değişken (x) Bağımsız değişken, regresyon modelinde açıklayıcı değişken olup; bağımlı değişkenin değerini tahmin etmek için kullanılır. 2 http://www.frekans.com.tr/tr_analizler.html 3 http://www.toraks.org.tr/mse-ppt-pdf/kenan_kose3.pdf www.fikretgultekin.com 3

Değişkenler arasında doğrusal ilişki olabileceği gibi, doğrusal olmayan bir ilişki de olabilir. Bu nedenle, saçılım grafiği yapılmadan (ilişki yok/doğrusal ilişki var/doğrusal olmayan ilişki var) ve değişkenler arasında korelasyon varlığına rastlanmadan regresyon analizine karar verilmemesi gerekir. Bu bilgiler doğrultusunda, tek/çok değişkenli doğrusal regresyon analizlerinin yanı sıra, tek/çok değişkenli doğrusal olmayan regresyon analizleri de mevcuttur. (a) (+) yönlü Doğrusal ilişki (b) (-) yönlü Doğrusal ilişki (c) Doğrusal Olmayan ilişki (d) ilişki Yok Bağımlı değişken ile bağımsız değişken arasındaki doğrusal ilişkiyi açıklayan tek değişkenli regresyon modeli aşağıdaki gibidir: Y = a + bx Burada; y = Bağımlı değişkenin değeri a = Regresyon doğrusunun kesişim değeri (Sabit değer) b = Regresyon doğrusunun eğimi x = Bağımsız değişkenin değerini göstermektedir. www.fikretgultekin.com 4

Örnek :Kardiyoloji kliniğine başvuran erkek hastalar üzerinde yapılan bir araştırmada, yas(x) ve kolesterol(y) değişkeni arasındaki korelasyondan yola çıkılarak kurulan regresyon modeli aşağıdaki gibi elde edilmiştir: Y=3,42+0,326x Bu modele göre, yastaki bir birimlik artısın, kolesterol değerinde 0.326 birimlik bir artışa neden olacağı, yeni doğan bir erkeğin (X=0) kolesterol değerinin ise 3.42 olacağı söylenebilir.kurulan bu modele göre, 50 yasında bir erkeğin kolesterol değerinin ne kadar olacağını tahmin edebiliriz. X=50 için : Y=3,42+0,326*(50)=19,52 50 yasında bir erkeğin kolesterol değerinin 19.52 olacağı söylenebilir. Tek Değişkenli Ve Çok Değişkenli Regresyon Analizi Regresyon analizi bağımlı değişken ile bir veya daha çok bağımsız değişken arasındaki ilişkiyi incelemek amacıyla kullanılan bir analiz yöntemidir. Bir tek bağımsız değişkenin kullanıldığı regresyon tek değişkenli regresyon analizi, birden fazla bağımsız değişkenin kullanıldığı regresyon analizi de çok değişkenli regresyon analizi olarak adlandırılır. Regresyon analizi ile ; bağımlı ve bağımsız değişkenler arasında bir ilişki var mıdır? Eğer bir ilişki varsa bu ilişkinin gücü nedir? Değişkenler arasında ne tür bir ilişki vardır? Bağımlı değişkene ait ileriye dönük değerleri tahmin etmek mümkün müdür ve nasıl tahmin edilmelidir? Belirli koşulların kontrol edilmesi durumunda özel bir değişken veya değişkenler grubunun diğer değişken veya değişkenler üzerindeki etkisi nedir ve nasıl değişir? gibi sorulara cevap aranmaya çalışılır. 4 Tek Değişkenli Regresyon Analizi Tek değişkenli regresyon analizi bir bağımlı değişken ve bir bağımsız değişken arasındaki ilişkiyi inceler. Tek değişkenli regresyon analizi ile bağımlı ve bağımsız değişkenler arasındaki doğrusal ilişkiyi temsil eden bir doğrunun denklemi formüle edilir. Çok Değişkenli Regresyon Analizi Đçinde bir adet bağımlı değişken ve birden fazla bağımsız değişkenin bulunduğu regresyon modelleri çok değişkenli regresyon analizi olarak bilinir. Regresyon analizi,birçok alanda veri analizi için başvurulan önemli bir istatistiksel teknik olup değişkenler arasındaki ilişkiyi açıklamak için kullanılır.kısaca regresyon analizi 4 http://istatistikanaliz.com/regresyon_analizi.asp www.fikretgultekin.com 5

,bağımlı bir değişken ile bağımlı değişken üzerinde etkisi olduğu varsayılan bağımsız değişken(ler) arasındaki ilişkinin matematiksel bir model ile açıklanmasıdır. Basit doğrusal regresyon analizinde bir bağımlı ve bir bağımsız değişken söz konusu iken,çoklu doğrusal regresyon analizinde ise bir bağımlı değişken varken iki ya da daha fazla bağımsız değişken vardır ve her iki analizde de değişkenler arsında doğrusal bir ilişki vardır.ayrıca bağımlı ve bağımsız iki değişken arasında eğrisel bir ilişki var ise değişkenler arasındaki ilişki eğrisel regresyon modeli ile açıklanır. Korelasyon analizinde,değişkenlerin bağımlı ve bağımsız değişken olarak belirlenmesi hesaplamaların sonucu açısından önemli değilken,regresyon analizinde ise değişkenlerin hangisinin bağımlı hangisinin bağımsız değişken olduğunu tespit etmek çok önemlidir. Örneğin,ithalat ve ihracat yapan bir işletmenin karlılık düzeyini işletmenin bulunduğu ülkedeki döviz kurları etkileyebilir.o halde,işletmenin karlılık düzeyi bağımlı(y),ülkedeki döviz kurları ise bağımsız(x) değişken olarak ele alınmalıdır. 5 Tek Değişkenli Regresyon Analizi Tek değişkenli regresyon analizi bir bağımlı değişken ve bir bağımsız değişken arasındaki ilişkiyi inceleyen analiz tekniğidir.bu analizle bağımlı ve bağımsız değişkenler arsındaki doğrusal (lineer) ilişkiyi temsil eden bir doğru denklemi formüle edilmektedir.korelasyon analizinde olduğu gibi,regresyon analizinde üzerinde durulan ilişki,değişkenler arasındaki doğrusal ilişkidir.bu doğrunun hesaplanması ise en küçük kareler metodu yardımıyla yapılmaktadır. Regresyon analizi sonuçlarının yorumlanmasında birçok araştırmacı ve öğrenci tarafından ciddi hatalar yapılmaktadır.en yaygın hata,regresyon analizi sonuçlarının yorumlanmasında,x bağımsız değişkeninin y bağımlı değişkenine sebep olduğu şeklindeki yorumdur.bağımsız değişkenlerin bağımlı değişkendeki değişimi açıklıyor olması sebepselliği gerekli kılmaz.başka bir ifade ile,bağımlı ve bağımsız değişkenler arasında (pozitif ve negatif) bir ilişkinin olması her zaman bağımsız değişken(lerin) bağımlı değişkenin sebebi olduğu sonucunu doğurmayacaktır. Đki değişken arasında bir ilişkinin olabilmesi için sebepsellik şart değildir.đlişkinin sebebi belki de iki değişkenin üçüncü bir değişkenle olan ilişkilerinden kaynaklanıyor olabileceği gibi,söz konusu ilişki tamamen tesadüfi olarak da ortaya çıkmış 5 Bilimsel Araştırma Süreci ve SPSS ile Veri Analizi, SPSS 12.0 for Windows, Ayhan URAL,2005 www.fikretgultekin.com 6

olabilir.sebepsellik ile ilişkiselliğin aynı şeyler olmadığı unutulmamalıdır.regresyon analizi değişkenler arasındaki ilişkinin yapısı ve derecesi ile ilgilenmektedir. Çok Değişkenli Regresyon Analizi Bir bağımlı değişken ve birden fazla bağımsız değişkenin yer aldığı regresyon modellerine çok değişkenli regresyon analizi denir.çok değişkenli regresyon analizinde bağımsız değişkenler eş zamanlı olarak (aynı anda) bağımlı değişkendeki değişimi açıklamaya çalışmaktadır.hesaplama ve yorum bakımından tek değişkenli regresyon analizine benzemektedir.çok değişkenli regresyon analizinin yorumu tek değişkenli regresyon analizine benzemektedir.ancak bazı farklılıklar vardır.örneğin,tek değişkenli regresyon analizindeki karşılığı çoklu regresyon katsayısı R (multiple R) olarak ifade edilmektedir.çoklu regresyon katsayısı R,bir bağımlı değişkendeki değişim ile eşzamanlı(aynı anda) ele alınan birden fazla bağımsız değişkendeki değişim arasındaki ilişkinin derecesini göstermektedir.daha basit bir ifade ile, bağımlı değişken ile birlikte ele alınan bir grup bağımsız değişkendeki değişimin ilişkisinin (korelasyonunun) bir göstergesidir. Çok değişkenli regresyon analizi sosyal bilimlerin birçok dalında kullanım alanı bulmaktadır.pazarlama,sosyoloji ve psikoloji gibi bilim dallarında davranışsal hareketlerin belirlenmesinde,ekonomide zaman serisi türü ekonomik değişkenleri etkileyen faktörlerin tespiti ve geleceğe yönelik projeksiyonlarında(tahmininde) kullanım alanı bulmaktadır. Çoklu Regresyon Analizi Modelleri Basit regresyon analizinde bağımlı ve bağımsız değişken arasındaki ilişkiler analiz ediliyordu.bazı durumlarda ise;incelenen bir bağımlı değişkeni birçok bağımsız değişken etkileyebilir.bir bağımlı değişkeni birçok bağımsız değişkenin etkileme durumlarına kısa örnekler verelim.okuldaki bir öğrencinin başarısını,zekası,çalışma üresi,çalışma ortamı,aile ortamı vs.gibi birçok faktörler etkiler.bir hastanın iyileşme süresini aldığı ilaçların dozu,yaşı,cinsiyeti,hastalığın ağırlık derecesi gibi birçok faktörler etkiler. Çoklu regresyon analizinden olumlu sonuç alınabilmesi için,bağımlı ve bağımsız değişkenlerin sayısal olarak ve aynı ölçüm birimiyle ölçülmesi iyi sonuçlar verebilir.sınıflandırma ve aralıklı ölçümlerle,ve hele ölçüm birimleri de değişik olursa,iyi yorumlanabilir sonuçlar alınamaz.çünkü niteliksel özellikler sayısal olarak gösterilse bile,mesela zengine 1 yoksula 0 kodu verildiğinde,1 ile 0 arasındaki farkın gerçekte zengin ile yoksul arasındaki farkı gösterip göstermediği tartışılabilir.zenginle yoksul arasındaki fark 0 www.fikretgultekin.com 7

ile 1 arasındaki fark gibi değil,0 ile 20,30,50 arasındaki fark gibidir.öte yandan meslek gruplarını,mezun olunan okulları,cinsiyeti kodlamanın hiçbir anlamı yoktur. Bağımsız değişkeni seçerken de,kendi aralarında yüksek korelasyona sahip bağımsız değişkenlerden sadece birisinin alınması yoluna gidilmelidir.mesela,kişinin yaşı,meslekteki kıdemi,aldığı ücret ayrı değişkenlermiş gibi görünmelerine rağmen,aslında her üçü de birbiriyle sıkı sıkıya bağlantılıdır.çoklu regresyon analizinde böyle değişkenlerden sadece biri seçilmelidir.bunun için de analize başlamadan bütün değişkenlerin korelasyon matrisine bakıp,aralarında yüksek korelasyon alanlardan biri seçilmelidir. Çoklu regresyonda bazen hangi bağımsız değişkenin daha önemli olduğunu ve bağımlı değişkeni daha çok etkilediğini bilmek gerekir.bunun için önce korelasyonlara bakarız.yüksek korelasyon,daha güçlü doğrusal ilişkiyi gösterir.đkinci yol,bağımsız değişkenin bağımlı değişkeni,bir kez ikili değişken formülünde bir kez de ikili,bir kez de çoklu regresyon içinde nasıl etkilediğine bakmaktır. Çoklu Regresyon Metodları Enter metodu :Bağımsız değişkenleri bir blok olarak tek adımda girilip değerlendirildiği metod. Đleri Doğru Seçim Metodu (Forward selection) :Bağımlı değişken ile en yüksek pozitif veya negatif korelasyonu olan bağımsız değişken ilkönce seçilir.daha sonra girilen değişkenin katsayısının 0 olduğu hipotezi F testi ile yoklanır.burada elde edilen F değeri,spss in öngörülen F değerleri ile karşılaştırılır.spss in iki F ölçütü vardır. 1. F değeri sizin belirleyeceğiniz minumum bir F değeri ile karşılaştırılır.( F-toenter,FIN ).Normal ayar 3,84 tür.(bunu ayar yeri Linear regression penceresinden options anahtarı ile geçilen pencerede Use F Value kısmındadır. 2. F istatistiği ile bağlantılı ihtimalin ayarlanması (Porbability of F-toenter,PIN).Bunun normal ayarı da 0,05 tir. Eğer elde edilen F değeri bu ölçütlere eşit veya küçükse,o bağımsız değişken regresyon değerlendirmesine alınır ve seçim ileri doğru devam eder;yoksa işlem orada durdurulur. Bir değişken seçilip işleme alındığında,geride kalan bağımsız değişkenlerle bağımlı değişken arasındaki korelasyonlara bakılır ve en yüksek korelasyona sahip bağımsız değişken bir sonraki aday olur.bu,aynı zamanda en geniş F değerine sahip değişkenin de seçimi olur. www.fikretgultekin.com 8

Geriye Doğru Eleme ( Backward Elimination ) Metodu :Đleri doğru seçimin tersine,burada önce bütün bağımsız değişkenler seçilir;sonra sıra ile belli ölçütlere göre eleme yapılır.spss ; eleme için iki ölçüt koymaktadır. 1. Değişkenin formülde kalabilmesi için en küçük kareler F değeri ( F-toremove,FOUT ).Normal ayar 2,71 dir. 2. En büyük F ihtimali (Probabability of F-to-remove,POUT).Bunun normal ayarı da 0,10 dur. Đlk önce en küçük kısmi korelasyon katsayısına sahip değişken incelenir.öngörülen değerlerden,büyük değere sahip değişken elenir. Adım Adım Seçme (Stepwise Selection) Metodu :Đlk olarak bağımsız değişken seçilir;eğer bu ileri doğru seçmedeki- FIN veya PIN gereklerini yerine getirirse ikinci değişken seçilir;yoksa işlem orada biter.đkinci değişken olarak en yüksek kısmi korelasyona sahip değişken alınır.seçimler yüksek korelasyondan düşüğe doğru yapılır.bağımsız değişkenler ölçütlere uyarsa regresyon analizine başlanır.đlk değişken seçildikten sonra Adım Adım seçme,ileri doğru seçmeden farklılaşır.đlk değişkenin,geriye doğru elemedeki gibi FOUT veya POUT ölçütlerine uyup uymadığı kontrol edilir.yani adım adım seçmede,hem ileri doğru seçme hem e geriye doğru eleme işlemleri yapılır. 6 Çoklu Doğrusal Bağlantı Basit regresyon analizindeki tüm varsayımlar çoklu regresyon analizinde de geçerlidir.bu varsayımları hatırlarsak bağımlı değişken x1 tesadüfi bir değişkendir ve normal dağılım göstermektedir.tahmin hataları tesadüfidir ve normal dağılım gösterirler.hatalar birbirinden bağımsızdır.(otokorelasyon yoktur.).her bağımsız değişkenin değerlerine ait olan bağımlı değişken değerlerinin alt setleri varyansları birbirine eşittir.(eşit varyanslılıkhomoscedasticity).çoklu regresyon analizinde bu varsayımlara bir dördüncüsü eklenmektedir.bu varsayım bağımsız değişkenler arasında basit doğrusal ilişkilerin olmaması şeklinde ifade edilebilir.bağımsız değişkenler arasındaki basit doğrusal korelasyon katsayılarının 0 veya 0 a çok yakın olması şartı şeklinde de açıklanabilen bu varsayıma,istatistikte Çoklu Doğrusal Bağlantı (Multicollinearity) olmama durumu adı verilmektedir. 7 6 Bilimsel Araştırmalarda Bilgisayarlarla Đstatistik Uygulamaları,SPSS for Windows,Prof.Dr.Mustafa ERGÜN 7 Uygulamalı Regresyon Ve Korelasyon Analizi,Doç.Dr.Neyran ORHUNBĐLGE, Đ.Ü Đşletme Fakültesi www.fikretgultekin.com 9