Örnek Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız. i. ii. X 1 2 3 4 1 2 3 4 Y 2 3 4 5 4 3 2 1
Örnek Aşağıdaki veri serindeki X ve Y veri çiftlerini kullanarak X=1,5 için Y nin hangi değerleri alacağını hesaplayınız. iii. X 1 2 3 4 Y 1 4 3 1 Veri çiftlerinin eğilimini görsel olarak tespit etmek zor olduğundan tahmin yapmak için istatistiksel hesap tekniklerine ihtiyacımız var.
Regresyon Analizi İki değişken arasındaki ilişkiyi temel alan tahminler yapmak için kullanılan matematiksel yöntemlere regresyon analizi denir. Regresyon: Ortalamaya doğru çekilme Korelasyon analizinde saçılma diyagramı içindeki puan çiftlerinin ortasından çizilen ve değişkenler arasındaki ilişkiyi temsil eden doğruya regresyon doğrusu denir.
Matematiksel Fonksiyonlar Matematiksel fonksiyonlarda hata oranı sıfır olduğu için bağımsız değişkenin herhangi bir değerine karşılık gelen bağımlı değişken değeri tam olarak bilinir. ( Y = 2.X) Örnek: Bir kafede giriş ücreti 5 lira ve her içecek 2 lira ise toplam masraf için modelimiz Matematiksel modellerde hata miktarı olmadığı için bağımsız ve bağımlı değişkenler arasındaki korelasyon mükemmeldir. (r = ±1)
İstatistiksel Fonksiyonlar İstatistiksel modellerde hata miktarı sıfır olmadığı için bağımsız ve bağımlı değişkenler arasındaki korelasyon mükemmel değildir. (Y = 2.X ± Hata) Örnek: Bir kafede giriş ücreti 5 lira ve her içecek 2 liradır. Ayrıca bazı müşteriler garsona bahşiş de vermektedir. Bahşişler 0 ile 2 lira arasında olup ortalaması içecek başına 1 liradır. Bu duruma uygun model Bu nedenle, istatistiksel fonksiyonlarda tahmin yöntemleri kullanılmalıdır.
Regresyon Analizi Regresyon analizi ile bağımsız değişken veya değişkenlerin farklı değerleri için bağımlı değişkenin alacağı değer tahmin edilebilir. Regresyon analizinde tahminlerde kullanılan Bağımsız değişken sayısı 1 ise basit regresyon Bağımsız değişken sayısı birden fazla ise çoklu regresyon denir. Regresyon analizinde hakkında tahmin yapılacak Bağımlı değişken sayısı birden fazla ise çok değişkenli regresyon denir. Ayrıca, doğrusal ve doğrusal olmayan regresyon analizi yöntemleri mevcuttur.
Basit Doğrusal Regresyon Denklemi Herhangi bir i. gözlem için Y = a + bx + i i e i Y: Bağımlı değişkenin değeri X: Bağımsız değişkenin değeri a: Regresyon sabiti (X=0 için Y nin aldığı değer) b: Regresyon doğrusunun eğimi Tahminlerdeki hata payı ihmal edildiğinde X deki 1 birimlik değişime karşılık Y de gözlenen değişim miktarı e: Tahmindeki hata miktarı
Basit Doğrusal Regresyon Denklemi Amaç: Hata miktarını (e) minimuma indirmek ve sıfırlamaktır. Tahmin edilen bağımlı değişkenin (Y) değeri için Ŷ terimi kullanılır. Hata miktarı sıfır olduğunda bağımlı değişkenin tahmini değeri için genel denklem: Ŷ = a + bx Regresyon denkleminde b teriminin işareti bağımlı (Y) ve bağımsız (X) değişkenler arasındaki ilişkinin tipini gösterir. b, + işaretli ise pozitif korelasyon b, - işaretli ise negatif korelasyon b = 0 ise korelasyon sıfırdır ve regresyon analizi yapmak anlamsızdır. Neden?
Regresyon Analizi Regresyon analizinde bağımlı ve bağımsız değişkenler i. Sürekli değişkenler olmalı, ve ii. En az aralık ölçeği şartlarını sağlamalıdır. Sınıflamalı ve sıralamalı değişkenler, boş (dummy) değişken olarak adlandırılan yapay değişkenlere dönüştürülerek işleme alınırlar. Regresyon analizinde bilinmeyen a ve b parametrelerinin tahmin edilmesi için gözlenen veri çiftlerinin (X i, Y i ) oluşturduğu noktalar ile regresyon doğrusu arasındaki farkların karelerinin toplamının en küçük değerde olması amaçlanır. En Küçük Kareler Yöntemi (Least Squares Method)
En Küçük Kareler Yöntemi b YX = r YX s. s Y X = = Ŷ = a + (X (n/ 1).( / bx Y/ (X X).(Y Y) s/. (n 1).(s.s/ ) s X Y/ X).(Y Y) ( X X) 2 ) n/ 1/ X b YX b = r YX = YX s. s Y X (X X).(Y ( X X) 2 Y) Bir regresyon doğrusu her zaman için X ve Y değişkenlerinin ortalamalarının kesiştiği noktadan geçer a YX = Ŷ - b YX X a YX = Y - b YX X
Örnek 5.1. i. Dört öğrenciden elde edilen çalışma saatleri (X) ve başarı puanları (Y) verilerini kullanarak regresyon denklemini bulunuz ve saçılma diyagramında regresyon doğrusunu çiziniz. ii. Bu öğrencilerle aynı sınıfta olup 3 saat ders çalışan bir öğrencinin bu sınavdan başarı puanını tahmin ediniz. Öğrenci X Y A 2 4 B 4 6 C 1 2 D 5 4 X X Y Y ( X X).(Y Y) (X X) 2
Örnek 5.1.
Örnek 5.1. Öğrenci X Y Ŷ Y - Ŷ = A 2 4 B 4 6 C 1 2 D 5 4 e 2 e Tüm regresyon analizlerinde Σe =0 sağlanmalıdır. Neden? Regresyon analizlerinde amaç Σe 2 nin minimum olmasıdır.
Örnek 5.2. Yandaki tabloda bir grup öğrencinin matematik testi puanları (X) ve istatistik testi puanları (Y) verilmiştir. Buna göre, i. Korelasyon katsayısını hesaplayınız. X Y 4 45 2 20 3 28 ii. iii. iv. Regresyon denklemini bulunuz ve saçılma diyagramında regresyon doğrusunu gösteriniz. Matematik testi puanı 6,5 olan bir öğrencinin istatistik testi puanını tahmin ediniz. Matematik testi puanları 3,5 ve 10 olan öğrencilerin beklenen ve gözlenen istatistik testi puanları arasındaki hata miktarlarını hesaplayınız. 4 55 7 62 5 45 7 40 10 80 12 90 1 20
Örnek 5.2.
Örnek 5.2.
Örnek 5.3. Yandaki verileri kullanarak a) Sınav kaygısı ve sınav puanı değişkenleri için regresyon denklemini bularak saçılma diyagramını ve regresyon doğrusunu çiziniz. b) Sınav kaygısı 5 ve 8 olan öğrenciler için beklenen ve gözlenen sınav puanları arasındaki hata miktarlarını hesaplayınız. Öğrenci Sınav Kaygısı Sınav Puanı 1 5 6 2 6 2 3 8 3 4 6 7 5 4 9 6 7 3 c) Sınav kaygısı 3 ve 9 olan iki öğrenci için beklenen sınav puanı değerlerini hesaplayınız.
Örnek 5.3.
Örnek 5.3.