ÖNGÖRÜ TEKNĐKLERĐ ÖDEV (KEY) Aşağıda verilen Y zaman sersisi bir ürünle ilgili satışları,aylar itibariyle, gösteren bir seridir. a) Bu serinin garfiğini çizip serinin taşıdığı desenleri (Trend, mevsimsellik vb.) belirtiniz. b) Mevsimlik değişimleri ve genel terndi yansıtacak bir regresyon modeli önerip bu modelin parametrelerini tahmin ediniz.(gerekli olduğunu düşündüğünüz kukla (Dummy) değişkenleri ekleyiniz.) c) Önerdiğiniz model için yapılan analizleri irdeleyerek bu modelin: anlamlı olup olmadığını; modele dahil edilen bağımsız değişkenler arasında çoklu korelasyon olup olmadığını; hata terimleri arasında seri korelasyon olup olmadığını; hata terimlerinin dağılımının sıfır ortalamalı ve sabit varyanslı olup olmadığını test ediniz. d) Yukarıda önerdiğiniz modeli iyileştirmek amacıyla bağımsız değişkenler grubuna yeni bir değişken olarak z = t 2 yi dahil edip b) ve c) deki analizleri bir kez daha yapınız. Bu Model b) de önerilen modelden daha iyi bir model midir? Neden? e) b) ve d) de önerilen modellerden hangisi daha iyi ise onu kullanarak.ci yılın M ile M2 arasındaki aylarının her biri için öngörü değerlerini hesaplayınız. Eğer.ci yılın aylar itibariyle gerçekleşen satışları aşağıda verildiği gibi ise öngörü değerlerinzi kullanarak bu son 2 ay için modelinizin verdiği RMSE değerini hesaplayınız. aylar t Y Aylar t Y M 87 M 2 604 M2 2 92 M2 26 643 M3 3 07 M3 27 79 M4 4 33 M4 28 868 M 209 M 29 920 M6 6 234 M6 30 93 M7 7 262 M7 3 980 M8 8 28 M8 32 989 M9 9 7 M9 33 897 M0 0 74 M0 34 90 M 23 M 3 84 M2 2 9 M2 36 97 M 3 20 M 37 9 M2 4 289 M2 38 2008 M3 448 M3 39 27 M4 6 497 M4 40 2202 M 7 60 M 4 2288 M6 8 86 M6 42 234 M7 9 97 M7 43 2343 M8 20 6 M8 44 2339 M9 2 3 M9 4 2339 M0 22 43 M0 46 2267 M 23 493 M 47 2206 M2 24 0 M2 48 2226
Cevaplar a) Y serisi hem pozitif trend, hem de ayları mevsim kabul eden bir desen içermektedir. 200 Time Series Plot of Y 220 2000 70 Y 00 20 000 0 20 2 Index 30 3 40 4 b) Y serisi zaman, t, ve ayların etkisini yansıtan bir doğrusal regresyonla modellenebilir. Bu amaçla 2 ayın etkilerini yansıtmak amacıyla m i baz alan m2-m2 arasında sembollerle gösterilen dummy değişken yaratılıp modele dahil edildi. Analiz sonuçları ve model parametrelerinin tahmin değerleri aşağıdaki tablolarda verilmiştir. Regression Analysis: Y versus t; m2;... The regression equation is Y = 840 + 30,3 t + 8,4 m2 + 44 m3 + 67 m4 + 206 m + 204 m6 + 97 m7 + 7 m8 + 77,3 m9 + 33,9 m0-0,9 m - 37,3 m2 Predictor Coef SE Coef T P VIF Constant 839,99 9,987 84, 0,000 t 30,3424 0,989 2,4 0,000, m2 8,4 3,08,4 0,68,8 m3 44,07 3,08,0 0,000,8 m4 67,47 3,09 2,80 0,000,8 m 206,38 3,0,76 0,000,8 m6 203,4 3,,2 0,000,8 m7 96,9 3,3,00 0,000,8 m8 7,3 3, 3,03 0,000,9 m9 77,26 3,7,87 0,000,9 m0 33,92 3,20 2,7 0,0,9 m -0,92 3,22-3,8 0,000,9 m2-37,27 3,26-2,8 0,008,9 S = 8,4894 R-Sq = 99,9% R-Sq(adj) = 99,8% Analysis of Variance Source DF SS MS F P Regression 2 866896 7807 200,0 0,000 Residual Error 3 96 342 Total 47 862886 2
Unusual Observations Obs t Y Fit SE Fit Residual St Resid 36 36,0 97,00 89,0 9,32 6,9 3,88R 4 4,0 2339,00 2282,66 9,9 6,34 3,6R 48 48,0 2226,00 229,6 9,9-33,6-2,2R R denotes an observation with a large standardized residual. Durbin-Watson statistic = 2,003 Burada m2 dummy değişkeninin Y deki değişkenliği açıklamaya katkısı ihmal edilecek kadar küçük görülmektedir. Bu modeli biraz daha iyileştirmek gerekirse, m2 modelden çıkarılabilir. Yeni haliyle modelimizin analiz sonuçları aşağıda verilmiştir. Model 2: The regression equation is Y = 849 + 30,3 t + 3 m3 + 8 m4 + 97 m + 94 m6 + 88 m7 + 62 m8 + 68,0 m9 + 24,7 m0-60,2 m - 46, m2 Predictor Coef SE Coef T P VIF Constant 849,6 7,704 0,22 0,000 t 30,3466 0,206 0,4 0,000, m3 34,86,48,7 0,000,4 m4 8,26,49 3,78 0,000,4 m 97,6,0 7, 0,000,4 m6 94,32, 6,88 0,000,4 m7 87,72,3 6,28 0,000,4 m8 62,2, 4,04 0,000,4 m9 68,03,7,88 0,000,4 m0 24,68,60 2,3 0,040,4 m -60,7,63 -,7 0,000,4 m2-46,,67-3,99 0,000,4 S = 8,7399 R-Sq = 99,9% R-Sq(adj) = 99,8% Analysis of Variance Source DF SS MS F P Regression 86628 783293 2230,44 0,000 Residual Error 36 2643 3 Total 47 862886 Unusual Observations Obs t Y Fit SE Fit Residual St Resid 36 36,0 97,00 89,08 9,4 6,92 3,83R 4 4,0 2339,00 2282,74 0,0 6,26 3,6R 48 48,0 2226,00 229,24 0,0-33,24-2,0R R denotes an observation with a large standardized residual. Durbin-Watson statistic = 2,0886 Bu modelin bir önceki modelden daha iyi olduğunu görüyoruz. Multi-colinearity ve serial correlation sorunları olmayan bir model (D-W istatistiği ve VIF değerelerine bakarak) olduğu görülmektedir. Residual (Hata terimleri analizi aşağıda verimiştir.) 3
Descriptive Statistics: RESI Variable N Mean SE Mean StDev Minimum Q Median Q3 Maximum RESI 48,2402E-4 2,37 6,40-33,24-7,69-0,29,99 6,92 Hataların Ortalaması yaklaşık olarak sıfır olup rassallık özellikleri taşımaktadır. Ancak hataların dağılımının normal olduğu hipotezi ret edilmektedir. (Kolmogorov-Smirnov testinde p-value<0.0 olduğu görülmektedir.) ACF ve PACF grafiklerinde herhangi bir güçlü korelasyon görülmemektedir. DW=2,0886 olup bu da serial korelasyon olmadığının işaretidir. Modelin verdiği öngörü değerleri ile gerçekte gözlemlenen Y değerleri serisinin aynı eksenler sistemindeki grafiği de modelin ne kadar iyi uyum sağladığını göstermektedir. R 2 (adj)= %99,8 olup buda grafiğin görsel olarak yansıttığını sayısal olarak doğrulamaktadır.. P r o b a b ility P lo t o f R E S I N o rm a l Percent 9 9 9 9 0 8 0 7 0 6 0 0 4 0 3 0 2 0 M e a n,2 0 6 4 7 E - 4 S td e v 6,4 0 N 4 8 K S 0, 6 4 P -V a l u e < 0,0 0 0-0 -2 0 R E S I 2 0 7 P artial Au to co rre latio n F u n ctio n fo r R E S I (w ith % s ign ific anc e lim its fo r the pa rtia l au toc orrelations ) Partial Autocorrelation,0 0,8 0,6 0,4 0,2 0,0-0,2-0,4-0,6-0,8 -,0 2 3 4 6 L a g 7 8 9 0 2 4
Auto corre lation Fu nction for R E S I (with % s ignific anc e lim its for the autoc orrelations ) Autocorrelation,0 0,8 0,6 0,4 0,2 0,0-0,2-0,4-0,6-0,8 -,0 2 3 4 6 L a g 7 8 9 0 2 2 0 0 2 2 0 T im e S e rie s P lo t o f Y ; F IT S V a ri a b l e Y F IT S 2 0 0 0 Data 7 0 0 0 2 0 0 0 0 0 2 0 2 In d e x 3 0 3 4 0 4
d) t-sq modele dahil edilirse ne olur sorusunu yanıtlamak amacıyla gerekli regresyon analizleri yapıldı ve aşağıdaki sonuçlar elde edildi. Regression Analysis: Y versus t; t-sq;... The regression equation is Y = 840 + 30,3 t - 0,0000 t-sq + 8,4 m2 + 44 m3 + 67 m4 + 206 m + 204 m6 + 97 m7 + 7 m8 + 77,3 m9 + 33,9 m0-0,9 m - 37,3 m2 Predictor Coef SE Coef T P VIF Constant 839,98,86 70,8 0,000 t 30,3442 0,8007 37,90 0,000 6,8 t-sq -0,00004 0,08-0,00 0,998 6,7 m2 8,4 3,27,39 0,74,8 m3 44,06 3,27 0,8 0,000,8 m4 67,47 3,28 2,6 0,000,8 m 206,38 3,30,2 0,000,8 m6 203,4 3,3,29 0,000,8 m7 96,94 3,33 4,78 0,000,9 m8 7,3 3,3 2,84 0,000,9 m9 77,26 3,37,78 0,000,9 m0 33,92 3,39 2,3 0,06,9 m -0,92 3,42-3,80 0,00,9 m2-37,27 3,4-2,77 0,009,9 S = 8,793 R-Sq = 99,9% R-Sq(adj) = 99,8% Analysis of Variance Source DF SS MS F P Regression 3 866896 662838 883,3 0,000 Residual Error 34 96 32 Total 47 862886 Unusual Observations Obs t Y Fit SE Fit Residual St Resid 36 36,0 97,00 89,06 9,4 6,94 3,83R 4 4,0 2339,00 2282,6 0,72 6,3 3,66R 48 48,0 2226,00 229,,42-33, -2,23R R denotes an observation with a large standardized residual. Durbin-Watson statistic = 2,0030 6
Burada multi-colinearity sorunu(vif değerleri t ve t-sq için çok yüksek çıktı) var. t-sq ve m2 nin katsayıları (model parametre değerleri) sıfır olabilir şeklinde yorumlanacağı için önce m2 değişkenini modele dahil etmesek ne olur sorusunu yanıtlayalım. Regression Analysis: Y versus t; t-sq;... The regression equation is Y = 849 + 30,4 t - 0,0003 t-sq + 3 m3 + 8 m4 + 97 m + 94 m6 + 88 m7 + 62 m8 + 68,0 m9 + 24,7 m0-60,2 m - 46, m2 Predictor Coef SE Coef T P VIF Constant 849,00 0,0 84,44 0,000 t 30,363 0,82 37,43 0,000 6,8 t-sq -0,00030 0,0602-0,02 0,98 6,7 m3 34,8,64,8 0,000,4 m4 8,2,6 3,8 0,000,4 m 97,,67 6,90 0,000,4 m6 94,3,68 6,63 0,000,4 m7 87,7,70 6,04 0,000,4 m8 62,2,72 3,83 0,000,4 m9 68,02,74,79 0,000,4 m0 24,67,77 2,0 0,043,4 m -60,7,80 -,0 0,000,4 m2-46,,84-3,93 0,000,4 S = 9,006 R-Sq = 99,9% R-Sq(adj) = 99,8% Analysis of Variance Source DF SS MS F P Regression 2 86629 7808 987,80 0,000 Residual Error 3 2642 36 Total 47 862886 Unusual Observations Obs t Y Fit SE Fit Residual St Resid 36 36,0 97,00 89,0 9,66 6,90 3,78R 4 4,0 2339,00 2282,67 0,86 6,33 3,6R 48 48,0 2226,00 229,4,7-33,4-2,20R R denotes an observation with a large standardized residual. Durbin-Watson statistic = 2,0872 Multi colinearity hala bir önemli kusur olarak kaldı. t ve t-sq arasında var olan yüksek korelasyon her iki değişkenin de modelde aynı zamanda yer almamasını gerektirir. Ayrıca bu modelin verdiği R-sq(adj) değeri ile denen ikinci modelinki aynıdır (%99,8). Sonuç: t-sq değişkenimi içeren model bir önceki modelden daha iyi değildir.. 7
e) Beşinci yıl için öngörü değerleri hesaplanırken ikinci modelin verdiği regresyon debkleminde t=49-60 arası değerler ile m3-m2 için dummy değişken değerleri konulup aşağıdaki Y-hat değerleri elde edildi. Böylece elde edilen öngörü değerlerini de içeren Y ve Y-hat zaman serilerinin grafikleri aşağıda verildiği gibi olup son 2 dönem için elde edilen değerlerin grafiği hem trendi hem de mevsimlik etki desenlerini yansıtmaktadır. Bu haliyle bakıldığında önerilen ikinci modelin vereceği öngörü değerlerine güvenebileceğimiz kanısına varabiliriz. Sonuç olarak: ikinci model tercih edilmelidir. t Aylar m3 m4 m m6 m7 m8 m9 m0 m m2 Y-hat 49 M 0 0 0 0 0 0 0 0 0 0 2336,00 0 M2 0 0 0 0 0 0 0 0 0 2366,346 M3 0 0 0 0 0 0 0 0 0 23, 2 M4 0 0 0 0 0 0 0 0 0 28,29 3 M 0 0 0 0 0 0 0 0 0 264,4 4 M6 0 0 0 0 0 0 0 0 0 2682,044 M7 0 0 0 0 0 0 0 0 0 270,789 6 M8 0 0 0 0 0 0 0 0 0 270,34 7 M9 0 0 0 0 0 0 0 0 0 2646,788 8 M0 0 0 0 0 0 0 0 0 0 2633,783 9 M 0 0 0 0 0 0 0 0 0 279,277 60 M2 0 0 0 0 0 0 0 0 0 2623,282 Time Series Plot of Y; FITS 200 Variable Y FITS 2000 Data 00 000 6 2 8 24 30 Index 36 42 48 4 60 8