2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

Benzer belgeler
3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

Appendix B: Olasılık ve Dağılım Teorisi

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Matris Cebiriyle Çoklu Regresyon Modeli

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

Ekonometri I VARSAYIMLARI

İstatistik ve Olasılık

17 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

OLS Yönteminin Asimptotik (Büyük Örneklem) Özellikleri SIRADAN EN KÜÇÜK KARELER (OLS) Asimptotik Özellikler: Tutarlılık. Asimptotik Özellikler

13. Olasılık Dağılımlar

SIRADAN EN KÜÇÜK KARELER (OLS)

BASİT REGRESYON MODELİ

Öğr. Elemanı: Dr. Mustafa Cumhur AKBULUT

İÇİNDEKİLER ÖN SÖZ...

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

altında ilerde ele alınacaktır.

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( )

1.58 arasındaki her bir değeri alabileceği için sürekli bir

4. TAHMİN SONUÇLARININ DEĞERLENDİRİLMESİ Katsayıların Yorumu

ÜSTEL DÜZLEŞTİRME YÖNTEMİ

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

Ch. 5: SEKK (OLS) nin Asimptotik Özellikleri

DOĞRUSAL ZAMAN SERİSİ MODELLERİ. Durağan ARIMA Modelleri: Otoregresiv Modeller AR(p) Süreci

ARALIK TAHMİNİ (INTERVAL ESTIMATION):

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

Zaman Serisi Verileriyle Regresyon Analizi

SIMÜLASYON DERS SORUMLUSU: DOÇ. DR. SAADETTIN ERHAN KESEN. Ders No:5 Rassal Değişken Üretimi

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

ISTATISTIK VE OLASILIK SINAVI EKİM 2016 WEB SORULARI

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Merkezi Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

H 0 : θ = θ 0 Bu sıfır hipotezi şunu ifade eder: Anakütle parametresi θ belirli bir θ 0

2016 YILI AKTÜERLİK SINAVLARI: İSTATİSTİK OLASILIK

QUANTILE REGRESYON * Quantile Regression

MAK 210 SAYISAL ANALİZ

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

MATEMATiKSEL iktisat

CEVAPLAR. n = n 1 + n 2 + n 3 + n 4 + n 5 + n 6 + n 7 = = 11 dir.

TÜRKİYE NİN NÜFUSU. Prof.Dr.rer.nat. D.Ali Ercan ADD Bilim Kurulu Başkanı Nükler Fizik Uzmanı. dn (t) / dt = c. n (t)

14 Ekim Ders Kitabı: Introductory Econometrics: A Modern Approach (2nd ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

BİYOİSTATİSTİK Korelasyon Analizi Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

İçindekiler. Ön Söz... xiii

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009


Yatırım Analizi ve Portföy Yönetimi 6. Hafta

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

Örneklem Dağılımları & Hipotez Testleri Örneklem Dağılımı

Ch. 12: Zaman Serisi Regresyonlarında Ardışık Bağıntı (Serial Correlation) ve Değişen Varyans

Appendix C: İstatistiksel Çıkarsama

İstatistik, genel olarak, rassal bir olayı (ya da deneyi) matematiksel olarak modellemek ve bu model yardımıyla, anakütlenin bilinmeyen karakteristik

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

9. ARDIŞIK BAĞIMLILIK SORUNU (AUTOCORRELATION) 9.1. Ardışık Bağımlılık Sorunu Nedir?

ANADOLU ÜNİVERSİTESİ İST 213 OLASILIK DERSİ TANIMLAR VE VERİ SINIFLAMASI

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

Bir Normal Dağılım Ortalaması İçin Testler

ÜNİTE:1. İstatistiğin Tanımı, Temel Kavramlar ve İstatistik Eğitimi ÜNİTE:2. Veri Derleme, Düzenleme ve Grafiksel Çözümleme ÜNİTE:3

Değişken içeren ve değişkenlerin belli değerleri için doğru olan cebirsel eşitliklere denklem denir.

İSTATİSTİK VE OLASILIK SORULARI

İstatistik ve Olasılık

BÖLÜM 12 STUDENT T DAĞILIMI

Rastgele Değişkenlerin Dağılımları. Mühendislikte İstatistik Yöntemler

İstatistik ve Olasılık

7.Ders Bazı Ekonometrik Modeller. Đktisat (ekonomi) biliminin bir kavramı: gayrisafi milli hasıla.

Bekleme Hattı Teorisi

İstatistik ve Olasılık

2018 YILI BİRİNCİ SEVİYE AKTÜERLİK SINAVLARI İSTATİSTİK VE OLASILIK 29 NİSAN 2018

KARŞILAŞTIRMA İSTATİSTİĞİ, ANALİTİK YÖNTEMLERİN KARŞILAŞTIRILMASI, BİYOLOJİK DEĞİŞKENLİK. Doç.Dr. Mustafa ALTINIŞIK ADÜTF Biyokimya AD 2005

DENİZ HARP OKULU TEMEL BİLİMLER BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

H.Ü. Bilgi ve Belge Yönetimi Bölümü BBY 208 Sosyal Bilimlerde Araştırma Yöntemleri II (Bahar 2012) SPSS Ders Notları II (19 Nisan 2012)

BÖLÜM 1: YAşAM ÇÖzÜMLEMEsİNE GİRİş... 1

ZAMAN SERİLERİNDE REGRESYON ANALİZİ

1. BÖLÜM Polinomlar BÖLÜM II. Dereceden Denklemler BÖLÜM II. Dereceden Eşitsizlikler BÖLÜM Parabol

ÇOKLU REGRESYON MODELİ. Bir bağımlı değişkene etki eden çok sayıda bağımsız değişkeni analize dahil ederek çoklu regresyon modeli uygulanabilir.

27 Mart Ders Kitabı: Introductory Econometrics: A Modern Approach (4th ed.) J. Wooldridge. 1 Yıldız Teknik Üniversitesi

BİYOİSTATİSTİK Olasılıkta Temel Kavramlar Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

istatistik El 10 1_ ve 2_ sorular a Ş3 gldakl bilgilere göre Al 4 Bl 6 cı 7 Dl 8 Al 5 B) 12 CL 27 D) 28 E) 35 2Q 10 BS 4200-A

İÇİNDEKİLER 1. GİRİŞ...

PARAMETRİK OLMAYAN İSTATİSTİKSEL TEKNİKLER

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ

İSTATİSTİKSEL PROSES KONTROLÜ

Deney Dizaynı ve Veri Analizi Ders Notları

VEKTÖR UZAYLARI 1.GİRİŞ

CHAPTER 6 SIMPLE LINEAR REGRESSION

Tablo (2): Atıştırma Sayısı ve Günlük Sınav Sayısı Atıştırma Sınav Sayısı (X)

Z = S n E(S n ) V ar(sn ) = S n nµ. S nn. n 1/2 n σ

İleri Diferansiyel Denklemler

Nedensel Modeller Y X X X

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

1. KEYNESÇİ PARA TALEBİ TEORİSİ

2. HAFTA DERS NOTLARI İKTİSADİ MATEMATİK MİKRO EKONOMİK YAKLAŞIM. Yazan SAYIN SAN

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

Transkript:

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI 2.1. Tanım Regresyon analizi, bir değişkenin başka bir veya daha fazla değişkene olan bağımlılığını inceler. Amaç, bağımlı değişkenin kitle ortalamasını, açıklayıcı değişkenlerin sabit (bilinen) değerleri cinsinden tahmin etmek veya öngörebilmektir. Regresyon analizinde fonksiyonel veya deterministik ilişkilerle değil istatistiki ilişkilerle ilgileniriz. İstatistiki ilişkilerde rassal veya stokastik değişkenler yani olasılık dağılımları olan değişkenlerle çalışırız. Deterministik ilişkilerde yine değişkenler vardır fakat bunlar rassal veya stokastik değildir. Fakat burada bağımlı ve açıklayıcı değişkenler açısından bir farklılık vardır: Regresyon analizinde bağımlı değişkenin rassal olduğu yani olasılık dağılımları olduğu varsayılır. Fakat açıklayıcı değişkenlerin sabit değerleri olduğu yani her örnekte aynı değerleri aldığı varsayılır. Regresyon Analizinin Korelasyon Analizinden Farkı: - Korelasyon analizinde, iki değişken arasındaki doğrusal ilişkinin gücü veya derecesi ile ilgileniriz. Örneğin istatistik dersi ile matematik dersi notları arasındaki ilişki. Ama regresyon analizinde amaç bağımlı değişkenin kitle ortalamasını, açıklayıcı değişkenlerin sabit (bilinen) değerleri cinsinden tahmin etmektir. Örneğin bir öğrencinin matematik notunu biliyorsak istatistik notunu öngörebilir miyiz? - Korelasyon analizinde bağımlı değişken-açıklayıcı değişken ayrımı yoktur ve değişkenlerle ilgili aynı varsayımlar yapılır: ikisi de rassal değişkenlerdir. Regresyon ise bu ayrım vardır ve analizinde bağımlı değişkenin rassal olduğu, fakat açıklayıcı değişkenlerin sabit yani stokastik olmadıkları varsayımı yapılır. Regresyon ve nedensellik: Regresyon analizinde bir değişkenin diğerine bağımlılığından söz edilir. Ancak bu bağımlılık nedensellik anlamında değildir. Yani, istatistiki bir ilişki, ne kadar güçlü olursa olsun, kendiliğinden bir nedensellik göstermez. Bu nedenselliği biz teorik inceleme ile kurarız. Örneğin tüketimin gelire bağlı olduğu ön kabulüyle modeli kurarız. 2-1

2.2 Anakütle Regresyon Fonksiyonu (ARF) Örnek 1: Diyelim ki anakütle 60 aileden oluşmaktadır. Amacımız bu toplulukta haftalık gelir (X) ile haftalık tüketim (Y) arasındaki ilişkiyi belirlemektir. Diğer bir deyişle herhangi bir ailenin gelirini biliyorken haftalık tüketimlerinin ortalama olarak ne kadar olacağını tahmin etmek istiyoruz. Veriler Tablo 1 de verilmiştir. Tablo 2.1: 60 Ailenin Kitle (Y i, X i ) Değerleri X i 80 100 120 140 160 180 200 220 240 260 Y i 55 65 79 80 102 110 120 135 137 150 60 70 84 93 107 115 136 137 145 152 65 74 90 95 110 120 140 140 155 175 70 80 94 103 116 130 144 152 165 178 75 85 98 108 118 135 145 157 175 180 -- 88 -- 113 125 140 -- 160 189 185 -- -- -- 115 -- -- -- 162 -- 191 Toplam Y i 325 462 445 707 678 750 685 1043 966 1211 Y i sayısı 5 6 5 7 6 6 5 7 6 7 Örneğin haftalık geliri 80 dolar olan bir ailenin tüketimi 55 dolar, bir diğerininki 60 dolar. Tablo, Y nin koşullu dağılımını gösterir. Yani X değerleri veri iken Y değerlerini verir. Buna dayanarak Y nin koşullu olasılıklarını bulabiliriz. Ör. X=80 iken Y nin alabileceği 5 değer vardır. Yani X=80 iken Y nin bu değerlerden herhangi birisini alma olasılığı 1/5 tir. Örneğin P(Y=55 X=80)=1/5, P(Y=60 X=80)=1/5 gibi. Bu koşullu olasılıklar Tablo 2 de verilmiştir. Tablo 2.2: Her bir anakütle X değeri için Y nin anakütle koşullu olasılıkları X i 80 100 120 140 160 180 200 220 240 260 Y i 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 1/5 1/6 1/5 1/7 1/6 1/6 1/5 1/7 1/6 1/7 -- 1/6 -- 1/7 1/6 1/6 -- 1/7 1/6 1/7 -- -- -- 1/7 -- -- -- 1/7 -- 1/7 Toplam Y i 325 462 445 707 678 750 685 1043 966 1211 Y i sayısı 5 6 5 7 6 6 5 7 6 7 E(Y X i ) 65 77 89 101 113 125 137 149 161 173 2-2

Bu koşullu olasılıklara bakarak Y nin koşullu beklenen değerini bulabiliriz. Yani X herhangi bir X i değerini alması koşulu altında Y nin beklenen değeri E(Y X=X i ) bulunabilir. Örneğin X=80 iken Y nin koşullu beklenen değeri E(Y X=80)= 55*(1/5)+ 60*(1/5)+65*(1/5)+70*(1/5)+75*(1/5) = 65 dir. Bunu tüm X değerleri için yaparsak Y nin koşullu beklenen değerlerini E(Y X i ) bulabiliriz. Tüm X değerleri için hesaplanan koşullu beklenen değerler Tablo 2.3 de verilmiştir. Tablo 2.3: Y nin anakütle koşullu beklenen değerleri X i E(Y X i ) 80 65 100 77 120 89 140 101 160 113 180 125 200 137 220 149 240 161 260 173 Tablo 3, Örnek 1 de yer alan 60 aileden oluşan anakütlede X i ile E(Y X i ) ilişkisini gösterir. X i ile E(Y X i ) arasındaki anakütle ilişkisi anakütle regresyon fonksiyonu (ARF) olarak adlandırılır. ARF doğrusal olarak belirlendiğinde E(Y X i ) = β 0 + β 1 X i şeklini almaktadır. Şimdi bu 60 aile için X i ile E(Y X i ) arasındaki ilişkiyi bulmaya çalışalım. Tablodan görülebileceği gibi X 20şer dolar artarken E(Y X i ) 12 şer dolar artmaktadır. Demek ki bu toplulukta marjinal tüketim eğilimi (β 1 =) 12/20=0.60 dır. Bu durumda sabit terim de (β 0 =) 17 bulunur. Demek ki bu 60 aile için ARF, E(Y X i ) = β 0 + β 1 X i = 17 + 0.60X i dir. 2-3

Grafik 2.1: Anakütle Verileri, Koşullu Beklenen Değerler E(Y X) ve Anakütle Regresyon Fonksiyonu Grafik 2.1 de yer alan noktalar Örnek 1 de yer alan 60 aile için X ve Y nin anakütle değerlerini gösterir. Doğru ise 60 aile için anakütle regresyon doğrusudur. Her bir (E(Y X i ), X i ) ikilisi siyah oval noktalarla gösterilmiştir. Bunların E(Y X i ) değerleri yanlarında yer almaktadır. Anakütle regresyon doğrusu Tablo 2.3 de yer alan 10 noktanın (E(Y X i ), X i ikililerinin) birleşimidir. Geometrik olarak anakütle regresyon doğrusu, açıklayıcı değişkenlerin veri değerleri için bağımlı değişkenin koşullu olasılıklarını veya beklenen değerlerini veren eğridir. Grafik 2.1 den de görülebileceği gibi her bir X i değeri için çeşitli anakütle Y değerleri ve tek bir koşullu beklenen değer vardır ve regresyon doğrusu bu beklenen değerlerden geçer 1. 2.3 Hata Terimi ve Anakütle Regresyon Denklemi (ARD) i. birim (Örnek 1 deki 60 aileden her biri) için rassal ve görünmeyen hata terimi aşağıdaki gibi tanımlanır: u i = Y i E(Y X i ) i. Hata terimi her bir ailenin Y i değeri ile yine o ailenin X i değerine karşılık gelen Y nin koşullu ortalaması (E(Y X i )) arasındaki farktır. 1 Koşullu ortalamalar her zaman düz bir doğru üzerinde olmak zorunda değildir. Buradaki örnek düz çizgi verecek şekilde oluşturulmuştur. 2-4

Bu tanımdan yola çıkarak her bir birimin Y i değeri aşağıdaki gibi yazılabilir. Y i = E(Y X i ) + u i = β 0 + β 1 X i + u i (E(Y X i ) = β 0 + β 1 X i olduğundan) Bu denklem anakütle regresyon denklemi (ARD) olarak adlandırılır. ARD denklemine göre her bir Y i iki bileşenden oluşur: 1) E(Y X i ) = β 0 + β 1 X i : X=X i iken Y nin koşullu ortalaması (geliri X i olan ailelerin ortalama gelirleri) 2) u i = Y i E(Y X i ) : i. birim için rassal hata terimi (her bir ailenin Y i değeri ile kendisi ile aynı gelire sahip -geliri X i olan- ailelerin ortalama gelirleri arasındaki fark). Yine ARD denkleminden yola çıkarak her bir X i ye karşılık gelen hata terimlerinin koşullu beklenen değerinin 0 olduğu sonucuna ulaşırız: E(u i X i ) = 0 i. Kanıt: ARD denkleminin iki tarafının koşullu beklenen değerini alalım: E(Y i X i ) = E(E(Y X i ) X i ) + E(u i X i ) = E(Y X i ) + E(u i X i ) (E(Y X i ) sabit olduğundan) Buradan E(u i X i ) = 0 bulunur. Hata terimleri, anakütle Y i değerlerini belirleyen, X dışındaki tüm diğer bilinmeyen ve gözlemlenemeyen etkileri temsil eder. 2-5

Tablo 2.4: Örnek 1 de Yer Alan 60 Aile için Rassal Hata Terimleri X i = 80 için Y i E(Y X i ) u i = Y i E(Y X i =80) 55 65-10 60 65-5 65 65 0 70 65 5 75 65 10 Toplam 325 0 Ortalama 65 0 X i = 100 için Y i E(Y X i ) u i = Y i E(Y X i =100) 65 77-12 70 77-7 74 77-3 80 77 3 85 77 8 88 77 11 Toplam 462 0 Ortalama 77 0 X i = 120 için Y i E(Y X i ) u i = Y i E(Y X i =120) 79 89-10 84 89-5 90 89 1 94 89 5 98 89 9 Toplam 445 0 Ortalama 89 0 X i = 140 için Y i E(Y X i ) u i = Y i E(Y X i =140) 80 101-21 93 101-8 95 101-6 103 101 2 108 101 7 113 101 12 115 101 14 Toplam 707 0 Ortalama 101 0 X i = 200, 220, 240, 260 için hata terimleri ile koşullu beklenen değerlerinin hesaplanması okuyucuya bırakılmıştır. 2-6

2.4 Örneklem Regresyon Fonksiyonu (ÖRF) Gerçekte tüm anakütleyi gözlemlemek mümkün olmadığından ARF yi bilmemiz mümkün değildir. Bu nedenle ARF yi ancak örneklem verileri kullanarak tahmin edebiliriz. Bu amaçla, anakütleden rassal olarak seçilmiş N gözlemli (X i,y i ) (i=1,, N) örneklem oluşturulacaktır. ARF E(Y X i ) = β 0 + β 1 X i iken örneklem regresyon fonksiyonu (ÖRF) aşağıdaki gibidir. Y i = β 0 + β 1 X i (i=1,, N) Burada Y i ARF nin (E(Y X i ) = β 0 + β 1 X i ) bir tahmini, β 0 sabit terim β 0 ın bir tahmini ve β 1 eğim katsayısı β 1 in bir tahminidir. Örneklem verisinin özellikleri: Örneklemi oluşturan gözlemler, anakütle gözlemlerinin bir alt kümesidir. Anakütleden farklı rassal örneklemler elde edilebilir. Her bir örneklem β 0 ve β 1 için farklı tahmin değerleri verir. Diğer bir deyişle her bir rassal örneklem farklı bir ÖRF (farklı β 0 ve β 1 değerleri) verecektir. Örnek: Örnek 1 de yer alan 60 aileden oluşan anakütleden 10 gözlemli iki faklı rassal örneklem alalım. Örneklem seçilirken 10 adet X değerinin tümü alınmış, bunlara karşılık gelen Y değerleri rassal olarak seçilmiştir. Tablo 2.5: Örneklem 1 ve Örneklem 2 Örneklem 1 Örneklem 2 X i Y i X i Y i 80 70 80 55 100 65 100 88 120 90 120 90 140 95 140 80 160 110 160 118 180 115 180 120 200 120 200 145 220 140 220 135 240 155 240 145 260 150 260 175 2-7

İki örneklemde aynı olan X değerlerine karşılık farklı Y değerleri vardır. Bu nedenle farklı β 0 ve β 1 değerleri elde edilecektir. ÖRF elde edilirken verileri en iyi yansıtacak doğrunun bulunması amaçlanmış ve aşağıdaki ÖRF ler bulunmuştur. Örneklem 1: Y i = 24.46 + 0.51X i Örneklem 2: Y i = 17.17 + 0.58X i Diğer bir deyişle Örneklem 1 verileri kullanıldığında β 0 = 24.46, β 1 = 0.5091, Örneklem 2 verileri kullanıldığında β 0 = 17.17, β 1 = 0.5761 bulunmaktadır. Grafik 2.2 Örneklem 1 ve Örneklem 2 verileri kullanılarak elde edilen ÖRF leri vermektedir. Örneklem 1 ile bulunan eğri daha yatık, Örneklem 2 ile bulunan eğri daha diktir. Grafik 2.2: Örneklem Verileri ve Örneklem Regresyon Fonksiyonları Hangi ÖRF gerçek ARF unu yansıtmaktadır? Gerçek anakütle eğrisine bakmadan bunu bilmek mümkün değildir. Bunların gerçek eğriyi yansıttığı düşünülür. Ancak örnekleme yapıldığından bunlar gerçek ARF ile aynı değildir, ARF ye yalnızca bir yaklaştırmadır (tahmindir). ÖRF nun ARF a ne kadar yakın olduğu, ÖRF nun örneklem verisi kullanılarak nasıl oluşturulduğuna, diğer bir deyişle β 0 ve β 1 tahmin edicilerinin özelliklerine bağlıdır 2. 2 Tahmin edici, örneklem verileri kullanılarak anakütle parametrelerinin nasıl tahmin edileceğini gösteren kural, formül veya metoddur. 2-8

2.5 Örneklem Regresyon Denklemi (ÖRD) Örneklem regresyon denklemi (ÖRD) anakütle regresyon denkleminin (ARD) örneklemdeki karşılığıdır. ARD: Y i = E(Y X i ) + u i = β 0 + β 1 X i + u i ÖRD: Y i = Y i +u i = β 0 + β 1 X i + u i Burada Y i = β 0 + β 1 X i ARF nin (E(Y X i ) = β 0 + β 1 X i ), β 0 sabit terim β 0 ın, β 1 eğim katsayısı β 1 in ve u i i örneklem gözlemi için hata terimidir. ÖRD denklemi, her bir örneklem gözlemini (Y i ) iki bileşenin toplamı olarak belirler: 1) Her bir örneklem X değeri (X i ) için Y nin tahmin değeri: Y i = β 0 + β 1 X i 2) i. örneklem gözlemine karşılık gelen hata terimi: u i = Y i Y i = Y i β 0 β 1 X i (i=1,,n) Grafik 2.3: Anakütle ve Örneklem Regresyon Eğrilerinin Karşılaştırması Anakütle regresyon eğrisi ARF nin (E(Y X i ) = β 0 + β 1 X i ), örneklem regresyon eğrisi ÖRF nun (Y i = β 0 + β 1 X i ) grafiğidir. Bundan sonraki bölümlerde amacımız anakütle regresyon eğrisine en yakın sonucu verecek örneklem regresyon eğrisi tahmin yöntemini bulmak olacaktır. 2-9