Basit ve Çoklu Doğrusal Regresyon

Benzer belgeler
Bağımlı Gruplar İçin t Testi Wilcoxon İşaretli Sıralar Testi

Tek Yönlü Varyans Analizi (ANOVA) Kruskal Wallis H Testi

19. BÖLÜM BİRBİRİYLE İLİŞKİLİ OLAN İKİ DEĞİŞKENDEN BİRİSİNDEKİ DEĞİŞİME GÖRE DİĞERİNİN ALACAĞI DEĞERİ YORDAMA (KESTİRME) UYGULAMA-I

Regresyon. Regresyon korelasyon ile yakından ilişkilidir

KORELASYON VE REGRESYON ANALİZİ. Ankara Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

Korelasyon testleri. Pearson korelasyon testi Spearman korelasyon testi. Regresyon analizi. Basit doğrusal regresyon Çoklu doğrusal regresyon

Korelasyon, Korelasyon Türleri ve Regresyon

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları II (19 Nisan 2012)

Ortalamaların karşılaştırılması

YILLARI ARASINDA GÜNEY CAROLINA DA OKUL İÇİ ŞİDDET İSTATİSKLERİ ANALİZİ (Bir Önceki Projeden Devam Edilecektir)

REGRESYON ANALĐZĐ. 1

TAŞINMAZ DEĞERLEMEDE İSTATİSTİKSEL ANALİZ

SPSS UYGULAMALARI-II Dr. Seher Yalçın 1

Regresyon Analizi. Yaşar Tonta H.Ü. BBY yunus.hacettepe.edu.tr/~tonta/courses/fall2008/sb5002/ SLIDE 1

BÖLÜM-1.BİLİM NEDİR? Tanımı...1 Bilimselliğin Ölçütleri...2 Bilimin İşlevleri...3

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

8.Sunum. Yrd. Doç. Dr. Sedat ŞEN 1

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Kategorik Veri Analizi

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

REGRESYON. 9.Sunum. Yrd. Doç. Dr. Sedat ŞEN

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

PARAMETRİK TESTLER. Tek Örneklem t-testi. 200 öğrencinin matematik dersinden aldıkları notların ortalamasının 70 e eşit olup olmadığını test ediniz.

7.Ders Bazı Ekonometrik Modeller. Đktisat (ekonomi) biliminin bir kavramı: gayrisafi milli hasıla.

Tekrarlı Ölçümler ANOVA

Bağımsız Örneklemler İçin Tek Faktörlü ANOVA

SANAYİ İŞÇİLERİNİN DİNİ YÖNELİMLERİ VE ÇALIŞMA TUTUMLARI ARASINDAKİ İLİŞKİ - ÇORUM ÖRNEĞİ

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER

LOJİSTİK REGRESYON ANALİZİ

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

Korelasyon. Korelasyon. Merkezi eğilim ve değişim ölçüleri bir defada sadece bir değişkenin özelliklerini incelememize imkan tanır.

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

Çoklu Regresyon Korelasyon Analizinde Varsayımdan Sapmalar ve Çimento Sektörü Üzerine Uygulama *

REGRESYON. 10.Sunum. Dr. Sedat ŞEN

VARYANS ANALİZİ (ANOVA)

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

Aşamalı Dersler Arasındaki İlişkilerin Kanonik Korelasyon Tekniğiyle İncelenmesi: Sınıf Öğretmenliği Örneği 1

Akdeniz Üniversitesi

ÇOKLU REGRESYON ANALİZİNDE VARSAYIMLARDAN SAPMALARIN İNCELENMESİ

TURİZM SEKTÖRÜNDE TALEP TAHMİN MODELLEMESİ

17.ULUSAL TURİZM KONGRESİ

Pazarlama Araştırması Grup Projeleri

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

OLS Klasik Varsayımlar. Çoklu Regresyon. Çoklu Regresyon Modellemesi. Çoklu Regresyon Modeli. Multiple Regression

REGRESYON. 8.Sunum. Yrd. Doç. Dr. Sedat ŞEN

SPSS Uygulamalı Çok Değişkenli İstatistik Teknikleri

İSTATİSTİKSEL VERİ ANALİZİ

3.SUNUM. Yrd. Doç. Dr. Sedat Şen

ISTATISTIK VE OLASILIK SINAVI EKİM 2016 WEB SORULARI

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

Korelasyon ve Regresyon

Normal Dağılımlılık. EKK tahmincilerinin ihtimal dağılımları u i nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.

BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

REPEATED MEASURES ANOVA (Tekrarlı Ölçümler ANOVA )

İÇİNDEKİLER 1. GİRİŞ...

CHAPTER 6 SIMPLE LINEAR REGRESSION

Ch. 12: Zaman Serisi Regresyonlarında Ardışık Bağıntı (Serial Correlation) ve Değişen Varyans

4. TAHMİN SONUÇLARININ DEĞERLENDİRİLMESİ Katsayıların Yorumu

Normal Dağılımlılık. EKK tahmincilerinin ihtimal dağılımları u i nin ihtimal dağılımı hakkında yapılan varsayıma bağlıdır.

İstatistik ve Olasılık

İLERİ BİYOİSTATİSTİK KURSU

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

ALIŞTIRMA 2 GSYİH. Toplamsal Ayrıştırma Yöntemi

İSTATİSTİK-II. Korelasyon ve Regresyon

ÖNGÖRÜ TEKNĐKLERĐ ÖDEV 5 (KEY)

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

Yrd. Doç. Dr. Sedat ŞEN 2

Yrd. Doç. Dr. Sedat ŞEN

İÇİNDEKİLER. Birinci Bölüm UYGULAMA VERİLERİ

BAZI DEĞİŞKENLERİN İLKÖĞRETİM YEDİNCİ SINIF ÖĞRENCİLERİNİN ELEŞTİREL DÜŞÜNME BECERİLERİNİ YORDAMA GÜCÜ

UYGULAMALAR. Normal Dağılımlılık

Çok Değişkenli İstatistik

1 PAZARLAMA ARAŞTIRMASI

Bu örnekte kullanılan veri 200 gözleme sahiptir ve örnek için özel olarak oluşturulmuştur.

EME 3117 SİSTEM SIMÜLASYONU. Girdi Analizi. Özet İstatistikler ve Histogram (Minitab)(1) Örnek: Eczane İçin Servis Süreleri

Beden Eğitimi Bölümü Özel Yetenek Sınavı Puanlarının Akademik Başarı Üzerindeki Yordama Geçerliği

Habib ÖZGAN a Gaziantep Üniversitesi

ÜSTEL DÜZLEŞTİRME YÖNTEMİ

Statistical Package for the Social Sciences

Öğr. Elemanı: Dr. Mustafa Cumhur AKBULUT

DÖNEM II ÜROGENİTAL SİSTEM VE HASTALIKLARIN BİYOLOJİK TEMELLERİ DERS KURULU. Yrd.Doç.Dr.İsmail YILDIZ BİYOİSTATİSTİK AD DERS NOTLARI

ARAŞTIRMA YÖNTEMLERİ

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları III (3 Mayıs 2012)

Korelasyon ve Regresyon

Nedensel Modeller Y X X X

1. İLİŞKİLERİN İNCELENMESİNE YÖNELİK ANALİZLER Sosyal Bilimlerde Nedensel Açıklamalar

YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI. Sibel SELİM 1 Efe SARIBAY 2

Hastane Yönetimi-Ders 8 Hastanelerde İstatistiksel Karar Verme

ÖN SÖZ... XV 1. BÖLÜM İSTATİSTİKTE KULLANILAN TEMEL KAVRAMLAR

Korelasyon ve Regresyon

BİLİŞİM TEKNOLOJİLERİ İÇİN İŞLETME İSTATİSTİĞİ

KONULAR. 14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

HİSSE SENEDİ FİYATLARINI ETKİLEYEN TEMEL MAKROEKONOMİK FAKTÖRLERİN BİST 1OO ENDEKSİ NE ETKİSİNİN ÖLÇÜMLENMESİ

Varyans Analizi (ANOVA) Kruskal-Wallis H Testi. Doç. Dr. Ertuğrul ÇOLAK. Eskişehir Osmangazi Üniversitesi Tıp Fakültesi Biyoistatistik Anabilim Dalı

İLERİ ARAŞTIRMA SORU HAVUZU

Transkript:

Basit ve Çoklu Doğrusal Regresyon Dr. Eren Can Aybek erencan@aybek.net www.olcme.net

IBM SPSS Statistics ile

Basit Doğrusal Regresyon Bir yordayıcı değişkene ait değerleri bildiğimizde, sürekli bir yordanan değişkene ait değerleri tahmin etmek istiyorsak basit doğrusal regresyonu kullanabiliriz. Basit doğrusal regresyonda amacımız bir model oluşturmaktır.

Y = a + b.x + hata Yordanan değişken (Bağımlı değişken) Sabit Yordayıcı değişken (Bağımsız değişken) Amacımız, a ve b değerlerini kestirerek, modelimizi oluşturmak. Yordayıcı değişkenin katsayısı

Araştırma Sorusu Not: Regresyon ile ilgili veriler; Prof. Dr. Şener Büyüköztürk ün Sosyal Bilimler için Veri Analizi El Kitabı nda kullandığı verilerdir. Kitaba: https://www.pegem.net/kitabevi/109-sosyal-bilimler-icin- Veri-Analizi-El-Kitabi-Istatistik-Arastirma-Deseni-SPSS-Uygulamalarive-Yorum-kitabi.aspx Kitaptaki verilere: http://www.pegem.net/dosyalar/dokuman/7171data_dosya.rar adresinden erişebilirsiniz.

Araştırma Sorusu Çalışanların yaşı, iş doyumlarının anlamlı bir yordayıcısı mıdır? NOT: Regresyon, korelasyonun bir üst modeli olarak düşünülebilir. Bu nedenle bazı araştırmacılar, yaş ile iş doyumu arasında anlamlı bir ilişki var mıdır? sorusu ile regresyon analizi yapmaktadır. Ancak, «yordama» ifadesinin kullanımı araştırma sorusu ile uygun analizin eşleştirilmesinde kolaylık sağlayacaktır.

Hipotezler H 0 : Yaş, iş doyumunun anlamlı bir yordayıcısı değildir. H 1 : Yaş, iş doyumunun anlamlı bir yordayıcısıdır.

Varsayımlar Yordanan değişken en az eşit aralıklı düzeyde ölçülmüş olmalı. Yordanan değişken, normal dağılmalı. Yordanan ve yordayıcı değişkenler arasında doğrusal bir ilişki olmalı. Hata puanları normal dağılmalı.

Varsayımların Kontrolü Yordanan değişken en az eşit aralıklı düzeyde Bakalım, yordanan değişkenim normal dağılıyor mu?

Varsayımların Kontrolü

Varsayımların Kontrolü Yordanan değişken OK!

Varsayımların Kontrolü Çarpıklık ve basıklık değerleri *-1; 1+ aralığında

Varsayımların Kontrolü Yordanan değişken ve yordayıcı değişkenler arasındaki ilişkinin doğrusal olup olmadığını belirlemek için saçılım grafiğinden yararlanacağız.

Varsayımların Kontrolü Simple scatter seç Define (tanımla) düğmesine tıkla

Y eksenine iş doyumunu X eksenine yaş değişkenini atıyorum OK!

Yaş ve iş doyumu arasındaki ilişkinin doğrusallığı görülebiliyor. Biz yine de bu grafiğe bir çizgi ekleyelim. Grafiğin üzerine iki kere tıklayın!

Bu düğmeye tıkla

Varsayımların Kontrolü Hataların normal dağılıp dağılmadığını belirlemek için regresyon analizini yapmamız ve analiz sırasında gerekli seçeneği seçmemiz gerek. Dolayısıyla artık basit doğrusal regresyon analizimi yapabilirim.

Yordanan (bağımlı) değişken Yordayıcı (bağımsız) değişken Hataların normal dağılımı için tıkla

Tahmin edilen değerlere ait Z puanları Hatalara ait Z puanları Normalliği görmek için ikisini de işaretliyorum Continue OK!

Hangi değişkenler modele dahil edildi? Modelin özeti. Yaş ile iş doyumunun %51.2 si açıklanıyor (R-Square) Model genel olarak anlamlı mı? p =.000 yani p <.05; evet model bir bütün olarak değerlendirildiğinde anlamlı. Modelin bileşenleri (Sabit ve yaş) anlamlı mı?

Coefficients Tablosuna Daha Detaylı Bakış Constant: Sabit Modeldeki katsayılar Yaş Bileşenin modelde yer alması anlamlı mı? Her ikisi için de p <.05 İş Doyumu = 6.910 + 0.204xYaş + hata

Deneyelim Veri görünümüne dönelim. 1. ve 2. sıradaki kişilerin yaşlarını not edelim. İş doyumu 1 = 6.910 + 0.204x20 = 10.99 İş doyumu 2 = 6.910 + 0.204x23 = 11.60

Deneyelim Regresyon modelim ile yaptığım tahminler: 1. Kişinin iş doyumu 10.99 2. Kişinin iş doyumu 11.60 Gerçekte:

Deneyelim 1. kişi için iş doyumunu daha az bir hata ile tahmin ederken; 2. kişi için daha büyük bir hata ile tahminde bulundum. Modelimde yer alan +hata bu yüzden var.

Deneyelim Modelim, iş doyumunun %51.2 sini açıklıyordu. İş doyumunu ne kadar çok açıklarsam tahmin hatalarım azalacaktır.

UNUTMADAN! Tabloların altında yer alan histogram grafiği incelendiğinde hataların da normal dağıldığı görülüyor.

Yorum Çalışanların yaşının, iş doyumlarının anlamlı bir yordayıcısı olup olmadığını belirlemek üzere yapılan basit doğrusal regresyon analizine ait sonuçlar Tablo 1 de verilmiştir.

Yorum Coefficients tablosundan Model Summary tablosundan ANOVA tablosundan

Yorum Basit doğrusal regresyon analizi sonuçlarına göre, yaş değişkeninin iş doyumunun anlamlı bir yordayıcısı olduğu bulunmuştur (t = 5.420; p <.05). Buna göre, yaş değişkeni ile kurulan model iş doyumu puanlarındaki değişimin %51.2 sini açıklamaktadır. İş doyumunun %48.8 i ise bu araştırmada kullanılmayan başka değişkenlerce açıklanmaktadır. Bütün bu bulgular doğrultusunda, aşağıdaki gibi bir regresyon eşitliği kurulabilir:

Yorum İş doyumu = 6.910 + 0.204xYaş + hata Regresyon eşitliği incelendiğinde, yaş değişkenindeki bir birimlik artış ile iş doyumunda 0.204 birimlik bir artış beklenebileceği söylenebilir. DENEYSEL ÇALIŞMA YAPMADIYSANIZ, NEDEN-SONUÇ İLİŞKİSİ KURMAYIN! BU NEDENLE YORUMDA BEKLENİR İFADESİNİ TERCİH ETTİK.

Çoklu Doğrusal Regresyon

Çoklu Doğrusal Regresyon Az önce iş doyumunu yalnızca yaş değişkeni ile açıklamaya çalıştık. Şimdi ise iş doyumunu açıklamak için yaş, gelir ve denetim puanlarını kullanmayı deneyelim.

Çoklu Doğrusal Regresyon Bu durumda, birden fazla yordayıcı değişken ile bir yordanan değişken tahmin edilmeye çalışılacaktır. İş doyumu = a + b.yaş + c.gelir + d.denetim + hata Biz bu modeli test etmek için çoklu doğrusal regresyon analizinden yararlanıyoruz.

Araştırma Sorusu Yaş, gelir ve denetim puanları birlikte ele alındığında, iş doyumunun anlamlı bir yordayıcısı mıdır?

Varsayımlar Basit doğrusal regresyonun varsayımları + Hatalar ilişkisiz olmalı (otokorelasyon olmamalı) Yordayıcı değişkenler arasında çok yüksek ilişki olmamalı (çoklu bağlantılılık)

Varsayımlar Az önce basit doğrusal regresyonun varsayımlarını test etmiştik. Şimdi yalnızca yordayıcı değişkenler arasında çok yüksek ilişki ve otokorelasyon olup olmadığını inceleyelim. Bunu incelemek için öncelikle regresyon analizini yapmamız gerekiyor.

Yordanan Statistics düğmesine tıklanır. Yordayıcılar Enter yöntemi tüm yordayıcıları modele dahil eder. Forward, iş doyumunu en çok açıklayandan en az açıklayana doğru değişkenleri modele sırayla sokar. Backward, önce tüm değişkenleri modele dahil eder, sonra iş doyumunu en az açıklayanları sırasıyla modelden çıkarır.

Betimsel istatistikler Çoklu bağlantılılık ile ilgili istatistikler Otokorelasyon olup olmadığını test etmek için Durbin-Watson testi. Test sonucunun 1.5-2.5 arasında olması gerek! Continue OK!

Betimsel istatistikler Değişkenler arası korelasyon Yaş ve gelir arasında.794 büyüklüğünde bir korelasyon var. Bu analizlerde sorun yaratabilir. Şimdilik bu bilgiyi cepte tutalım.

Modele hangi değişkenler dahil edildi? Model özeti; bu model iş doyumunun %70.6 sını açıklıyor. Durbin-Watson 1.5-2.5 aralığında Modelin genel olarak anlamlı bir model olup olmadığı. p <.05 yani model anlamlı. Modeldeki bileşenlerin anlamlı olup olmadığı. Yaş ve gelir anlamlı değil, denetim anlamlı.

Basit doğrusal regresyon analizinde yaş, iş doyumunu anlamlı bir şekilde yorduyordu. Şimdi ne oldu???

Acaba değişkenler arasında çoklu bağlantılılık olabilir mi? Tolerance 0.2 den büyük VIF 10 dan küçük Condition Index 30 dan küçük olmalı.

İstenen şartlar sağlanıyor gibi. Fakat az önce gelir ile yaş arasında.794 düzeyinde bir ilişki bulmuştum. Belki de sorun budur. Bu yüzden regresyon analizini bir de forward yöntemiyle deneyelim. Forward yönteminde değişkenlerin modele dahil edilip edilmemesi tamamen SPSS in hesaplamalarına bağlıdır. Değişkenlerinizi tanıyorsanız, modelden yaşı ya da geliri mi çıkaracağınıza siz karar verebilirsiniz.

Forward ı seçip OK e tıklıyorum

Tablolarda değişiklik var. Diyor ki, 1. modele yalnızca denetimi dahil ettim, sonra 2. bir model kurdum ve bu modele denetimin yanına gelir değişkenini dahil ettim. 1. Model ve 2. model için özet tablolar. 1. model iş doyumunun %59.1 ini; 2. model ise %70.4 ünü açıklıyor. İki model de iş doyumunu açıklamada anlamlı modeller.

İkinci model iş doyumunu daha çok açıkladığı için yalnızca bu modeli dikkate alıyorum. Hem denetim hem de gelir modelde anlamlı bir yere sahip. Yaşı elde etmek, geliri elde etmekten daha kolay. O yüzden ben geliri çıkarıp yaşı dahil edeceğim derseniz, regresyon analizini Enter yöntemiyle yapıp, geliri analiz dışında tutabilirsiniz. Stepwise yöntemi de kullanılabilir fakat şimdilik bu konumuz dışı. İş Doyumu = 15.352-0.438xDenetim + 0.525xGelir + hata

Deneyelim Veri görünümüne dönelim. 1. ve 2. sıradaki kişilerin denetim ve gelir puanlarını not edelim. İş doyumu 1 = 15.352 0.438x21 + 0.525x9 = 10.88 İş doyumu 2 = 15.352 0.438x25 + 0.525x8 = 8.60

Deneyelim Regresyon modelim ile yaptığım tahminler: 1. Kişinin iş doyumu 10.88 2. Kişinin iş doyumu 8.60 Gerçekte:

Deneyelim Bu modelle, basit doğrusal regresyon modeline göre daha az hatayla kestirim yaptım!

Yorum Yaş, gelir ve denetim değişkenlerinin, iş doyumunu anlamlı bir şekilde yordayıp yordamadıklarını belirlemek için forward yöntemi kullanılarak yapılan çoklu doğrusal regresyon analizi sonuçları Tablo 2 de verilmiştir.

Coefficients tablosundan ANOVA tablosundan Model Summary tablosundan Beta değerinin mutlak değeri büyük olan değişken, model için daha önemlidir. İş Doyumu = 15.352-0.438xDenetim + 0.525xGelir + hata

Analiz sonuçlarına göre, denetim ve gelir değişkenleri iş doyumunun anlamlı birer yordayıcısıdır (p <.05). Yaş değişkeninin ise iş doyumunun anlamlı bir yordayıcısı olmadığı görülmüştür. Bu durumda, gelir ve yaş arasındaki yüksek korelasyonun (r =.794; p <.05) etkisinin olabileceği düşünülmektedir. Buna göre denetim ve gelir değişkenleri ile birlikte kurulan model, iş doyumu puanlarındaki değişimin %70.4 ünü açıklamaktadır. İş doyumunun %29.6 sı ise araştırmaya dahil edilmeyen başka değişkenlerce açıklanabilir. Tüm bu bulgular sonucunda aşağıdaki gibi bir regresyon eşitliği kurulabilir:

İş Doyumu = 15.352-0.438xDenetim + 0.525xGelir + hata Regresyon eşitliğinden görülebileceği gibi, denetim puanlarındaki bir birimlik artışla iş doyumunda 0.428 birimlik azalma; gelir puanlarındaki bir birimlik artışla iş doyumunda 0.525 puan artma beklenmektedir. DENEYSEL ÇALIŞMA YAPMADIYSANIZ, NEDEN-SONUÇ İLİŞKİSİ KURMAYIN! BU NEDENLE YORUMDA BEKLENİR İFADESİNİ TERCİH ETTİK.