Uluslararası 9. İstatistik Kongresi, 28 Ekim-01 Kasım 2015 ANTALYA/TÜRKİYE

Transkript

1 1

2 ADVISORY BOARD Süleyman DÜNDAR AFYON KOCATEPE ÜNİVERSİTESİ Embiya AĞAOĞLU ANADOLU ÜNİVERSİTESİ Yılmaz AKDİ ANKARA ÜNİVERSİTESİ Müjgan ZOBU AMASYA ÜNİVERSİTESİ M. Bahar BAŞKIR BARTIN ÜNİVERSİTESİ İsmail ERDEM BAŞKENT ÜNİVERSİTESİ Fahrettin ÖZBEY BİTLİS EREN ÜNİVERSİTESİ Muhammet BEKÇİ CUMHURİYET ÜNİVERSİTESİ Hamza EROL ÇUKUROVA ÜNİVERSİTESİ Serdar Kurt DOKUZ EYLÜL ÜNİVERSİTESİ Onur KÖKSOY EGE ÜNİVERSİTESİ Zeki YILDIZ ESKİŞEHİR OSMANGAZİ ÜNİVERSİTESİ Sinan ÇALIK FIRAT ÜNİVERSİTESİ Hülya BAYRAK GAZİ ÜNİVERSİTESİ Nurgül OKUR BEKAR GİRESUN ÜNİVERSİTESİ Hülya ÇINGI HACETTEPE ÜNİVERSİTESİ Adnan MAZMANOĞLU İSTANBUL AYDIN ÜNİVERSİTESİ Esra AKDENİZ DURAN İSTANBUL MEDENİYET ÜNİVERSİTESİ Münevver TURANLI İSTANBUL TİCARET ÜNİVERSİTESİ Zafer KÜÇÜK KARADENİZ TEKNİK ÜNİVERSİTESİ Sevgi YURT ÖNCEL KIRIKKALE ÜNİVERSİTESİ Müjgan TEZ MARMARA ÜNİVERSİTESİ Gülay BAŞARIR MİMAR SİNAN GÜZEL SANATLAR ÜNİVERSİTESİ Dursun AYDIN MUĞLA SITKI KOÇMAN ÜNİVERSİTESİ Aydın KARAKOCA NECMETTİN ERBAKAN ÜNİVERSİTESİ Mehmet Ali CENGİZ ONDOKUZ MAYIS ÜNİVERSİTESİ Ayşen DENER AKKAYA ORTA DOĞU TEKNİK ÜNİVERSİTESİ Aşır GENÇ SELÇUK ÜNİVERSİTESİ Alper SİNAN SİNOP ÜNİVERSİTESİ Cenap ERDEMİR UFUK ÜNİVERSİTESİ Şaban EREN YAŞAR ÜNİVERSİTESİ Ali Hakan BÜYÜKLÜ YILDIZ TEKNİK ÜNİVERSİTESİ H. Eray ÇELİK YÜZÜNCÜ YIL ÜNİVERSİTESİ

3 SCIENTIFIC BOARD Prof. Dr. Farouq ALMEQDADI Prof. Dr. Ildar BATYRSHIN Prof. Dr. İsmihan BAYRAMOĞLU Prof. Dr. Canan BİLEN Prof. Dr. Hamparsum BOZDOGAN Prof. Dr. Carlos Manuel Agra COELHO Prof. Dr. Thorsten DICKHAUS Prof. Dr. Andrzej DZIECH Prof. Dr. Şenol ERDOĞMUŞ Prof. Dr. Roland FREID Prof. Dr. Armando GONÇALVES Prof. Dr. Michael GREENACRE Prof. Dr. Orhan GÜVENEN Prof. Dr. Andreea IACOB Prof. Dr. Miruna Mazurencu MARINESCU Prof. Dr. Zehra MULUK Prof. Dr. Alexandros PAPADOUPULOS Prof. Dr. Simo PUNTANEN Prof. Dr. Klaus RITTER Prof. Dr. Andreas RÖßLER Prof. Dr. Marıa Antónıa Amaral TURKMAN Doç.Dr. Joao Miguel da Costa SOUSA Prof. Dr. Kamil Feridun TURKMAN Prof. Dr. Burhan TÜRKŞEN Prof. Dr. Jakob WASSERMANN Prof. Dr. Hans Joachim WERNER Prof. Dr. Fetih YILDIRIM Prof. Dr. Veysel YILMAZ Prof. Dr. Vladimir ZAIATS Emirates College for Advanced Education, UAE National Polytechnic Institute of Mexico, MEXICO İzmir Ekonomi Üniversitesi, TURKEY North Dakota University, USA University of Tennessee, USA Nova de Lisboa University, PORTUGAL University of Bremen, GERMANY AGH University of Science and Technology, POLAND Osmangazi Üniversitesi, TURKEY Dortmund University, GERMANY Federal University of Rio de Janeiro, BRAZIL Pompeu Fabra University, SPAIN Bilkent Üniversitesi, TURKEY The Bucharest University of Economic Studies, ROMANIA The Bucharest University of Economic Studies, ROMANIA Başkent Üniversitesi, TURKEY Yeditepe Üniversitesi, TURKEY University of Tampere, FINLAND University of Kaiserslautern, GERMANY University of Lübeck, GERMANY University of Lisbon, PORTUGAL Technical University of Lisbon, PORTUGAL University of Lisbon, PORTUGAL TOBB Ekonomi ve Teknoloji Üniversitesi, TURKEY University of Applied Sciences Technicum Wien, AUSTRIA University of Bonn, GERMANY Çankaya Üniversitesi, TURKEY Osmangazi Üniversitesi, TURKEY Universitat de Vic, SPAIN 3

4 TURKISH STATISTICAL ASSOCIATION EXECUTIVE COMMITTEE Ayşen APAYDIN Sevtap KESTEL Süzülay HAZAR Furkan BAŞER İsmet TEMEL Esra AKDENİZ DURAN Haydar DEMİRHAN Atakan ERDEM Gürol İLHAN President Vice President Vice President General Secretary Accountant Member Member Member Member SPONSIRS 4

5 INVITED SPEAKERS 5

6 Multivariate Statistical Methods for Analyzing Genetic Association Studies Thorsten DICKHAUS University of Bremen, Institute for Statistics, P. O. Box , 8344 Bremen, Germany Genetic association studies lead to simultaneous categorical data analysis. The sample for every genetic locus consists of a contingency table containing the numbers of observed genotype-phenotype combinations. The goal of the statistical analysis is to detect associations between the (potentially very large) set of genetic markers and the (typically binary) phenotype of interest. This is a particular multiple test problem which has several challenging aspects, for instance the high dimensionality of the statistical parameter and the discreteness of the statistical model. Furthermore, the locus-specific contingency tables exhibit strong dependencies, at least in blocks of loci which are in linkage disequilibrium (LD), due to the biological mechanism of inheritance. This makes a multivariate statistical analysis the method of choice. In the first part of the presentation, we will consider frequentist multiple test procedures which are based on the concept of the effective number of tests based on probability bounds, see [1,] and Section 4.3 of [3]. Such procedures incorporate LD information in a relaxed multiplicity correction of Bonferroni- or Šidák-type. Due to the extended interpretation of LD provided in [4], this methodology is applicable for a variety of families of test statistics. The second part is based on [5] and deals with Bayesian approaches to contingency table inference for genetic association data. Here, the multiplicity correction is performed via an appropriate construction of the prior probabilities for the validity of the locus-specific null hypotheses of no association. Exploiting the conjugacy of Dirichlet and multinomial distributions, posterior probabilities for the nulls can exactly be computed for any finite sample size, and decision theoretic multiple test procedures can be applied. REFERENCES [1] Dickhaus T. and Stange J. (013), Multiple point hypothesis test problems and effective numbers of tests for control of the family-wise error rate, Calcutta Statistical Association Bulletin, 65(57-60): [] Dickhaus T., Straßburger K., Schunk D., Morcillo-Suarez C., Illig T. and Navarro A. (01), How to analyze many contingency tables simultaneously in genetic association studies, Statistical Applications in Genetics and Molecular Biology, 11(4):Article 1. [3] Dickhaus T. (014), Simultaneous Statistical Inference with Applications in the Life Sciences, Berlin- Heidelberg, Springer-Verlag. [4] Dickhaus T., Stange J. and Demirhan H. (014), On an extended interpretation of linkage disequilibrium in genetic case-control association studies, WIAS Preprint No. 09, [5] Dickhaus T. (015), Simultaneous Bayesian analysis of contingency tables in genetic association studies, Statistical Applications in Genetics and Molecular Biology, 14(4): Key Words: Contingency tables, Dirichlet-multinomial distribution, effective number of tests, linkage disequilibrium, multiple testing, multivariate statistical inference 6

7 Robust and nonparametric detection of shifts in time series Roland FRIED Department of Statistics, TU Dortmund University, 441 Dortmund, Germany We propose and study tests for detecting change-points, particularly level shifts, in time series which are stationary otherwise. We focus on near-epoch dependent time series, which allows us to treat most standard models of time series analysis, such as ARMA and GARCH processes. A classical test for the detection of level shifts in such weakly dependent data is the CUSUM test, which compares the partial sum of the first m observations to the sum of all observations for each candidate changepoint m, and maximizes this statistic with respect to m after some appropriate scaling. Asymptotical critical values for the CUSUM test can be calculated from tables of the Kolmogorov-Smirnov distribution, i.e. the distribution of the supremum of the Brownian bridge process. The CUSUM test statistic, which can be formulated equivalently in terms of the differences between the sample means of the first m and of the remaining observations, is not robust to outliers and can be improved in case of non-normal data, particularly for heavy-tails. Dehling, Fried and Wendler (015) propose a modification of the CUSUM test based on the Hodges-Lehmann two-sample estimator, which is the median of all pairwise differences between the two samples. It is highly robust and has a high efficiency in the case of Gaussian observations. Like for a related test based on the two-sample Wilcoxon statistic (Dehling et al. 015), the asymptotics of the Hodges-Lehmann change-point test can be established under general conditions without any moment assumptions. Both tests offer similar power against a shift in the center of the data, but the test based on the Hodges-Lehmann estimator performs superior if the shift is far from the center. This can be explained by the well-known discretization problems of the Wilcoxon statistic in small samples. CUSUM-type tests comparing all observations before and after each candidate change-point are designed under the idea that there is only one change. MOSUM-type tests restrict the comparison to data in two subsequent moving time windows. This may overcome possible masking effects due to several shifts into different directions. The talk also discusses the findings of Mielke (015), who investigates MOSUM-type tests based on the two-sample Wilcoxon statistic or the Hodges-Lehmann two-sample estimator in case of independent data. In addition to testing for a shift in location, one is often interested in possible changes in the variability of the data. The talk also reports on ongoing work on the robust detection of single or multiple changes of variability under conditions analogous to those mentioned above. REFERENCES [1] Dehling H. and Fried R. (01), Asymptotic Distribution of Two-Sample Empirical U-Quantiles with Applications to Robust Tests for Structural Change, Journal of Multivariate Analysis, vol. 105, pages [] Dehling H., Fried R., Sharipov O.S., Vogel D. and Wornowizki M. (013), Estimation of the variance of partial sums of dependent processes, Statistics & Probability Letters, vol. 83, pages [3] Dehling H., Fried R. and Wendler M. (015), A robust method for shift detection in time series, preprint available at [4] Dehling H., Fried R., Garcia I. and Wendler M. (015), Change-Point Detection under Dependence Based on Two-Sample U-Statistics, in Kulik R. (editor), Asymptotic Methods in Stochastics - Festschrift in Honor of Miklos Csörgö, to appear. [5] Mielke J.I. (015), Entwicklung und Evaluierung von robusten, MOSUM-artigen Teststatistiken für Strukturbruchtests auf Lageänderung 7 unter Unabhängigkeit, Master thesis (in german), Dept. of Statistics, TU Dortmund University, Germany. Key Words: change-points, heavy tails, outliers, time series

8 The parameters, the reliability function and the P(Y<X) for Kumaraswamy s distribution are estimated from the Classical and Bayesian point of view. Alexandros S. PAPADOPOULOS Department of Mathematics, Yeditepe University, İstanbul, Türkiye In this study it is assumed that the parameters of Kumaraswamy s distribution behave as random variables, thus they are estimated, along with the reliability function, from the Bayesian point of view. Furthermore the reliability R=P(Y < X) when X and Y are independent random variables that follow Kumaraswamy s distribution are estimated under different settings. If it is assumed that the first shape parameter is common and unknown, the maximum likelihood estimator (MLE) and the uniform minimum variance unbiased estimator (UMVUE) of R are obtained. Furthermore, Bayes and empirical Bayes estimators for R are obtained when the first parameter is common and unknown. Finally, when all four parameters are different and unknown the ML estimator of R is obtained. In the computation of the Bayes estimators, Lindley s or Tierney and Kadane s approximations are utilized. Monte Carlo simulations are performed to compare the different proposed methods, and conclusions on the findings are given. 8

9 CONTRIBUTED PAPERS (BASED ON SESSIONS) 9

10 SESSION 1 BAYESIAN STATISTICS 0 1

11 Estimation of reliability in a multicomponent stress-strength model based on bivariate generalized exponential distribution 1. Introduction 1 Mustafa NADAR*, Fatih KIZILASLAN 1 Department of Mathematical Engineering, Istanbul Technical University, Istanbul, TURKEY Selimiye, 34668, Uskudar, Istanbul, Turkey * nadar@itu.edu.tr, fkizilaslan@yahoo.com In the reliability context, an s-out-of-k:g system has k s-independent and identically distributed strengths components, and a common stress. This multicomponent stress-strength system functions when s (1 s k) or more components simultaneously survive (see, Bhattacharyya and Johnson (1974)). In recent years, there has been a growing interest in the study of reliability for s-out-of-k and related systems for which both industrial and military applications are available. In this paper, we assume that the underlying distributions are bivariate generalized exponential (BVGE) (see, Kundu and Gupta (009)) for the strength variables, and a generalized exponential (GE) for the stress variable which is s-independent of the strength variables. The estimation of reliability for this system is obtained under the classical, and Bayesian frameworks. The Bayesian estimates are obtained by using both Lindley's approximation and the Markov Chain Monte Carlo (MCMC) method.. Model Description We consider a system which have k identical strength components and each component is constracted by two pair of dependent elements. The system is subject to a common stress and works if at least s (1 s k) components simultaneously operate and a component is alive only if the weakest elements is operating. We assume that the independent strength random vectors X, X ); Y, Y ) is distributed as ( i11 i1 ( i11 i1 BVGE (, 1,, 3), i 1,..., k and the common stress component T has GE (, ). Let Zi 1 max( X i11, X i1) and Zi max( Yi 11, Yi 1) then Z 1, Zi ~ GE(, 1 3). u Ui min( Zi1, Zi) then FU i ( u) 1[1 (1 e ) ] G (t) be the cdf of T and F(u) be the common cdf of,..., U. U The reliability in a multicomponent stressstrength model is given by 1 k i Let. Let strength and stress r.v. s be independent, k k i ki Rs, k P( at least s of the( U1,..., U k ) exceeds T) (1 F( t)) ( F( t)) dg( t) (1) is i In our case, we assume that X, X );( Y, Y ),...,( X, X );( Y, Y ) is a random sample from BVGE with parameters ) ( i11 i1 i11 i1 k11 k1 k11 k1 ( 1, 1,, 3 and T is a r.v. from GE with parameter ( 1, ). By using (1), k ki k 1 we obtain Rs, k (( k i) ( / ) t) ). is j0 i j 3. Maximum likelihood and Bayesian estimation of R s, k In order to obtain the estimators of R s,k, suppose that n systems are put on life-testing experiment. In this case, we obtain the following potential data ( X i11, Xi 1); ( Y i11, Yi 1),, ( X k11, X k1); ( Y k11, Yk 1) and T i, but the actual observed data is U i1, Ui,..., Uik and T i, i 1,..., n. Then, the likelihood function of these observed sample is given as 1 1

12 L(,, u, t) n k i1 j1 The MLE of is given by nonlinear equation nk ij i n k 1 1 ln(1 (1 wij ) ) ( 1) ln(1 wij ) ( 1) nk nk n i1 j1 i1 j1 İ 1 f ( u ) g( t ) e n k i1 j1 n / (1 w n i1 1 ij ) (1 (1 w ln(1 h 1 i ) ln(1 w 1 ij ) 1 ij ) and the MLE of α, say ) n k i1 j1 n k ln(1 w 1 ij ) 0. N ln(1 h 1 i ) n i1 ln( h ) i n k i1 j1, is the solution of the Hence, the MLE of R s, k, by using the invariance property of the MLE, is Rˆ ˆ ˆ k i j k ki i j s, k is j0 t0 (( k i) ( ˆ / ˆ) t) 1 ). Now, assume all parameters α and λ are random variables have independent gamma priors with parameters ( c, d ), i 1,. i i Then, the joint posterior density function of α and λ is (, u, t) nkc 1 Then the Bayes estimate of 1 1 ln(1 (1 wij ) ) ( ln(1 wij ) d1 ) ( ln(1 hi nc 1 R s, k e n k i1 j1 i1 j1 İ 1 under SE loss function is given by n k N 1 ) d ) Rˆ s, k Rs, k (, u, t) dd () 0 0 It is not possible to compute equation () analytically. Two approaches can be applied to approximate, namely (i) Lindley s approximation, (ii) MCMC method. REFERENCES [1] Bhattacharyya, G.K., Johnson, R.A. (1974). Estimation of reliability in multicomponent stress-strength model. Journal of the American Statistical Association, 69, [] Kundu, D., Gupta R.D. (009). Bivariate generalized exponential distribution. Journal of Multivariate Analysis, 100, ABSTRACT Estimation of reliability in a multicomponent stress-strength model based on a generalized bivariate exponential distribution In this paper, we consider a system which have k identical strength components and each component is constructed by two pair of dependent elements. These elements X, X );( Y, Y ),...,( X, X );( Y, Y ) follows bivariate generalized exponential and each ( i11 i1 i11 i1 k11 k1 k11 k1 element is exposed to a common random stress T which follows generalized exponential distribution. The system is regarded as operating only if at least s out of k (1 s k) strength variables exceeds the random stress. The multicomponent reliability of the system is given by R P at least s of the( U,..., U ) exceeds ) where X, X ),max( Y, Y )), Rˆ s,k s, k ( 1 k T Ui min(max( i11 i1 i11 i1 i=1,...,k. We estimate R s, k by using frequentist and Bayesian approach. The Bayes estimate of R s, k have been developed by using Lindley's approximation and the Markov Chain Monte Carlo methods due to the lack of explicit forms. The comparison of the reliability estimators is made in terms of the estimated risks. Key Words: Bivariate generalized exponential distribution; stress-strength model; system reliability. ln( w ) ij 1

13 What determines mathematics achievement: A bayesian network approach Erhan ÇENE 1 Selahattin AYDOĞDU 1 1 Yildiz Technical University, Department of Statistics,340, Esenler, Istanbul, Turkey 1. Introduction ecene@yildiz.edu.tr ; saydogdu@yildiz.edu.tr Factors determining mathematics achievement of students attract great attention from researchers. Although there is not a simple system explaining mathematics achievement, past studies suggest that three main factors take part in explaining it, namely family and student background, student motivation and school or teacher related factors. Each factor has many sub-categories that may be related to mathematics achievement. In this work, possible factors effecting mathematics achievement for 4848 Turkish students are investigated using Bayesian network (BN). Data is gathered from The Programme for International Student Assessment (PISA) which is a triennial international survey which aims to evaluate education systems worldwide by testing the skills and knowledge of 15-year-old students [1]. Regression models, structural equation models, panel estimation techniques and regression trees are widely preferred statistical methods in educational framework. But this work applies BN to an educational data for the first time.. Bayesian network Bayesian network is a graphical model that efficiently visualizes relations between variables using the Bayes theorem. In a BN, variables are represented by nodes and relations between variables are illustrated with directed arcs. BNs are especially useful when number of variables is high. They are also capable of revealing indirect influences as well as direct influences. A BN consist of two parts: A structure part and a parameters part []. Structure part is given by the graph part of the BN and parameter part is given by the probabilistic information contained in the node parts of the graph. 3. Revealing factors on Mathematics achievement A BN is constructed using variables. Definition of variables is given in Table-1. The BN can be seen in Figure-1. In Figure-1, mathematics grade is directly linked to various factors such as mathematics anxiety, grade repetition, familiarity with mathematical concepts, home possessions, classroom size, disciplinary climate, parents education in years, mathematical self-efficacy and attending to kindergarten. Another variable that plays a central role is home possessions which have interactions with many variables. REFERENCES [1] OECD (013), PISA 01 Assessment and Analytical Framework: Mathematics, Reading, Science, Problem Solving and Financial Literacy, OECD Publishing. [] Tonda A., Lutton E., Squillero G., and Wuillemin P.H. (013), A memetic approach to Bayesian network structure learning, in Applications of Evolutionary Computation, A.I. Esparcia-Alczar, ed., Springer, Berlin, Heidelberg, 013, pp

14 BAYESIAN ESTIMATION OF THE PARAMETERS OF THE ARCH MODEL USING LINDLEY S APPROXIMATION Yakup ARI a and Alexandros PAPADOPOULOS b a Financial Economics, Yeditepe University, Ataşehir/İSTANBUL. yakupari@gmail.com b Department of Mathematics, Yeditepe University, Ataşehir/İSTANBUL. apapadopoulos@yeditepe.edu.tr 1. Introduction The basic idea of the ARCH model is that the error term a t of an asset return is serially uncorrelated, though dependent on its p squared lag values. The dependence of a t can be described by a simple quadratic function of its lagged values. The ARCH(p) model assumes that a t = σ t ε t, σ t = α 0 + α 1 a t 1 + α a t +. +α p a t p (1) Engle [1] used the ML method to estimate the unknown parameters α 0, α 1,, α p. Another commonly used estimation procedure for an ARCH model is the QMLE, whose asymptotic properties have been extensively studied. The purpose of this study is applying Lindley s approximation to derive Bayesian estimators for the parameters of the ARCH(p) model, using squared error (SE) and linear exponential (LINEX) loss functions and when the innovations are distributed according to the standard normal or a standardized student-t distribution.. Methodology Lindley [] developed approximate procedures for the evaluation of the ratio of two integrals which are in the form of v(θ) exp{l(θ)} dθ g(θ) exp{l(θ)} dθ () where θ = (θ 1, θ,, θ n ), L(θ) is the logarithm of the likelihood function, and g(θ) and v(θ) = u(θ)g(θ) are arbitrary functions of θ. The posterior expectation of the function u(θ), for given x, is E[u(θ) x] = u(θ) exp{l(θ) + ρ(θ)} dθ/ exp{l(θ) + ρ(θ)} dθ (3) where L(θ) + ρ(θ) is the the posterior distribution of θ except for the normalizing constant and ρ(θ) = lng(θ). Expanding L(θ) + ρ(θ) in equation (4) into a Taylor series expansion about the ML estimates of θ. E[u(θ) x] is asymptotically estimated by u B = u + 1 (u ij + u i ρ j )φ ij + 1 L ijk φ ij φ kl u l (4) i j where i, j, m, l = 1,,, n, and u = u(θ), u i = u, u θ ij = u 3 L, L i θ i θ ijk =, ρ j θ i θ j θ j = ρ, L k θ ij = L j θ i θ j and φ ij is the (i, j)th element of the inverse matrix { L ij } and all are evaluated at the MLE of the parameters. Under the assumption that the innovations follow the the standard normal or a standardized student-t and that the parameters behave as random variables with α 0 having a gamma or vague prior and α 1,, α p a Dirichlet prior, the posterior density is derived which is not a closed form. Therefore, for the estimation of the parameters of the ARCH(1) and ARCH() models Lindley s approximation is used. Finally, an example is given to illustrate the findings of previous sections. In order to compare the different types of estimators a computer simulation study is done Results The Bayesian and ML estimators were compared by means of Monte Carlo simulations with different sample sizes. In particular the sample sizes are 00, 400, 600, 800 and The prior for α 0 is a gamma or an improper prior and for (α 1, α j ) j = 1, Dirichlet function. Using the mentioned innovations, sample sizes and priors the i j k l

15 ML and Bayes estimates of the parameters were obtained under a SE and LINEX loss functions.all the results are based on 1000 repetitions. It is observed that as the sample sizes increase the mean square errors (MSEs) and mean errors (MEs) decrease. This should be expected since the MLEs are consistent. Also, as expected for all the estimates when the sample sizes increase the MSEs and MEs decrease. In all cases the MSEs and MEs when proper priors are used for the Bayes estimates are smaller than the ones corresponding when an improper prior is used for α 0 and to the MLE estimates. Finally, there is little difference between the MSEs and MEs when an improper prior for α 0 is utilized. REFERENCES [1] R. F. Engle (198), Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom inflation, Econometrica, [] D.V. Lindley (1980), Approximate Bayes methods, Trabajos de Estadistica 3 [3] M. Mahmoud (1991), Bayesian Estimation of the 3-parameter Inverse Gaussian Distribution, Trabajos de Estadistica 6 ABSTRACT BAYESIAN ESTIMATION OF THE PARAMETERS OF THE ARCH MODEL USING LINDLEY S APPROXIMATION The procedure that is most commonly used for estimating the unknown parameters of an ARCH model is the maximum likelihood estimation (MLE). In this study, it is assumed that the parameters of the ARCH model are random variables having known prior probability density functions, and therefore they will be estimated using Bayesian methods. The Bayesian estimators are not in a closed form, and thus Lindley s approximation will be used to estimate them. The Bayesian estimators are derived under squared error loss (SEL) and linear exponential (LINEX) loss functions. An example is given in order to illustrate the findings and furthermore, Monte Carlo simulations are performed in order to compare the ML estimates to the Bayesian ones. Finally, conclusions on the findings are given. Key Words: ARCH, QMLE method, Lindley s Approximation, Bayesian Methods, SEL, LINEX 5 1

16 SESSION 1 İSTATİSTİK TEORİSİ 1 6 1

17 FGM ve FRANK KOPULALARI İÇİN İKİ DEĞİŞKENLİ RİSK ÖLÇÜMLERİNİN KARŞILAŞTIRILMASI Ömer L. GEBİZLİOĞLU ve Emel KIZILOK KARA * Kadir Has Üniversitesi, İktisadi, İdari ve Sosyal Bilimler Fakültesi,Uluslararası Ticaret ve Finans Bölümü, Cibali, İstanbul, Türkiye omer.gebizlioglu@khas.edu.tr Kırıkkale Üniversitei, Fen Edebiyat Fakültesi, Aktüerya Bilimleri Bölümü, Yahşihan,71450, Kırıkkale, Türkiye emel.kizilok@gmail.com 1. Giriş Bu çalışmada, iki değişkenli kuzey-güney kuantil noktası (North-South Bivariate Quantile Point-NSBQP) yaklaşımı kullanılarak bağımlı riskler için iki değişkenli risk ölçümleri elde edilmiştir. Burada, Riske Maruz Değer (Value at Risk-VaR) ve Koşullu Riske Maruz Değer (Conditional Value at Risk-CVaR) risk ölçümleri kullanılmıştır. Bağımlı riskler, kopula yaklaşımı ile modellenmiştir. Farlie-Gumbel- Morgenstern (FGM) ve Frank kopulaları için iki değişkenli VaR ve CVaR risk ölçümleri hesaplanarak karşılaştırmalı sonuçlar verilmiştir.. Risk ölçümleri Finans ve aktüerya gibi önemli risk kararlarının alındığı alanlarda risk ölçümlerinin hesaplanması önemlidir. Bu anlamda VaR ve CVaR uygulamada sık kullanılmaktadır. Denuit et al. [1] tarafından, bir X rasgele değişkeni için ve VaR[X; p] = F 1 1 (p), 0 p 1 (1) CVaR[X; p] = E[X VaR[X; p] X > VaR[X; p]], 0 p 1 () ile tanımlanır. 3. Kopula Gerçek yaşamda, risk olaylarının çoğunda bağımlılık durumu ile karşılaşılır. Kopulalar da böyle durumların modellenmesi için önemli bir araçtır. İlk defa Sklar [4] tarafından verilmiş kopula tanımında; F(x) ve G(y) sürekli marjinal fonksiyonları, C: [0,1] [0,1] kopula fonksiyonunu göstermek üzere, X ve Y rasgele değişkenlerinin arasındaki bağımlılık yapısı H(x, y) = C(F(x), G(y)) şeklinde ifade edilen ortak dağılım fonksiyonu ile açıklanır. Bu çalışmada kullandığımız FGM ve Frank (F) kopulalarının dağılım fonksiyonları aşağıdaki gibi tanımlanır. (Nelsen [] ). C α FGM (u 1, u ) = u 1 u [1 + α(1 u 1 )(1 u )], 1 α 1 (3) C α F (u 1, u ) = ( 1 α ) ln [ 1 + ((exp( αu 1) 1) (exp( αu ) 1)) (exp( α) 1) ], α 0 (4) 4. Bağımlı iki değişkenli risk ölçümleri (X, Y) rasgele vektörünün iki değişkenli VaR ölçümünü elde etmek 1 için Chen and Welsh [3] tarafından verilmiş kuzey-güney kuantil yöntemini kullanıyoruz. Bu yönteme 7 dayalı iki değişkenli VaR vektörünü VaR(p 1, p ) = (F 1 1 (p 1, p ), F 1 (p 1 + p )), (5)

18 şeklinde tanımlıyoruz. Dolayısıyla, iki değişkenli CVaR vektörü de CVaR p i (U) = π U i [VaR p (U)]/S U [VaR p (U)], i = 1, bileşenleri ile CVaR p (U) = (CVaR p 1 (U), CVaR p (U)) şeklinde ifade edilebilir. FGM kopulası için Kizilok Kara ve Gebizlioglu [5] tarafından bu yolla elde edilen iki değişkenli VaR ve CVaR ölçümleri bu çalışmada geliştirilmiştir. Frank kopulası için de benzer çıkarımlar yapılarak, sonuçlar risk yönetimi kararlarında önemli olan bazı risk nicelikleri bakımından karşılaştırılmıştır. REFERENCES [1] Denuit M., Dhaene J., Goovaerts M.J., Kaas R. (005), Actuarial Theory for Dependent Risks; Measures, Orders and Models, John Wiley and Sons. [] Nelsen R.B. (006), An Introduction to Copulas, nd edition, Springer, New York. [3] Chen L.A., Welsh A.H. (00), Distribution function based bivariate quantiles, Journal of Multivariate Analysis, 83, [4] Sklar A. (1959), Functions de repartition an dimensions at leurs marges. Publ. Inst. Statist, Univ. Paris, 8, [5] Kizilok Kara E., Gebizlioglu O.L. (014), Measurement of bivariate risks by the north-south quantile point approach, Journal of Computational and Applied Mathematics, 55,

19 BUDANMIŞ (TRIMMED) OLABİLİRLİK TAHMİN EDİCİLERİ Nuri ÇELİK Bartın Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 74100, Bartın 1. Budanmış Olabilirlik Tahmin Edicileri İstatistikte en sık kullanılan nokta tahmin yöntemlerinden biri en çok olabilirlik tahmin yöntemidir. En çok olabilirlik yöntemi olabilirlik fonksiyonunu maksimum yapma ilkesine dayanır. Buna göre f(x; θ) kitle olasılık yoğunluk fonksiyonu olmak üzere en çok olabilirlik tahmin edicisi, θ θ = argmax L(θ x) (1) θ n Burada L(θ x) olabilirlik fonksiyonu olup i=1 f(x i, θ) eşitliğiyle hesaplanır. Bulunan en çok olabilirlik tahmin edicilerinin değişmezlik, tutarlılık ve asimptotik normallik gibi çıkarımsal istatistikte çok kullanılan önemli özellikleri mevcuttur. Ancak, en çok olabilirlik tahmin edicileri uç değerlere (outlier) karşı hassastır ve dolayısıyla sağlam (robust) değildir. Uç değerler, diğer verilerle karşılaştırıldığında veri setine uygun olmadığı düşünülen aşırı değerlerdir. Dolayısıyla, literatürde uç değerlerden etkilenmeyen istatistik tahmin yöntemleri geliştirilmiştir. Bu çalışmada budanmış olabilirlik yöntemi (trimmed likelihood estimator) ele alınmıştır. Buna göre, Y 1, Y,, Y N bağımsız ve aynı dağılıma sahip rasgele değişkenler olmak üzere Y i rasgele değişkeninin olasılık yoğunluk fonksiyonu f(y n ; θ) olsun. y = (y 1, y,, y n ) gözlem vektörü olmak üzere her bir gözlemin log-olabilirlik fonksiyonu l n (y, θ) = logf n (y n, θ) olarak gösterilebilir. Söz konusu log-olabilirlik toplamını maksimum yapmak en çok olabilirlik yöntemi iken, budanmış olabilirlik yöntemine göre logolabilirlik fonksiyonları küçükten büyüğe sırlandıktan sonra en büyük h log-olabilirlik değerini budamayla ulaşılacak fonksiyonu maksimum yapmaya dayanır. Başka bir deyişle, θ TL = arg max θ h n=1 () l (n) (y n, θ) olarak hesaplanır. Burada N-h gözlem budanmış olup, l 1 (y 1, θ) l (y 1, θ) l N (y 1, θ) şeklinde ifade edilebilir. Budanmış olabilirlik tahmin edicileri bilinen varyanslı normal dağılım varsayımı altında en küçük budanmış kareler (least trimmed squares) tahmin edicileriyle aynı işlevi görmektedir (Rousseeuw, 1984, 1985). Rousseeuw (1984, 1985) ve Müller (1995) ve budanmış olabilirlik tahmin edicilerinin normal dağılım varsayımı altında tutarlı ve asimptotik normal olduğunu göstermişlerdir. Ayrıca tahmin edicilerin yüksek kırılma noktası (breakdown point) olduğu da gösterilmiştir. Kaynaklar [1] Müller, C. H. (1995). Breakdown points for designed experiments. J. Statist. Plann. Inference. 45, [] Rousseeuw, P. J. (1984). Least median of squares regression. J. Amer. Statist. Assoc. 79, [3] Rousseeuw, P. J. (1985). Multivariate estimation with high breakdown point. Mathematical Statistics and Applications, Vol. B, eds. W. Grossman, G. Pflug, I. Vincze and W. Wertz. Reidel, Dordrecht, ABSTRACT

20 TRIMMED LIKELIHOOD ESTIMATORS In statistics, Maximum Likelihood (ML) estimation method has been widely used for estimate the unknown parameters. Under regularity conditions ML estimators have nice properties like consistency and asymptotic normality. However, ML estimators are sensitive to outliers for this reason, they are not robust. In this paper trimmed likelihood (TL) estimation method is introduced. Also, the robustness and other properties of TL estimators are shown. The simulation study and real life example are given at the end of the study for strengthen the theory. Keywords: Maximum Likelihood, Trimmed Likelihood, Outlier, Robustness 0

21 GENETİK ALGORİTMAYA DAYALI YENİ BİR SAĞLAM KORELASYON KATSAYISI Vedide Rezan USLU 1, Keziban KILIÇ TOPAL 1* 1. Giriş 1 Ondokuz Mayıs Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, 55139, Samsun, TÜRKİYE, rezzanu@omu.edu.tr, * keziban.kilic@omu.edu.tr İki değişken arasındaki doğrusal ilişkinin gücü ve yönünün sayısal olarak ifade edilmesi korelasyon olarak ifade edilir. Bu ilişkinin gücü ve yönünü gösteren sayısal değere de Korelasyon Katsayısı denir. Korelasyon katsayısını tahmin etmek ve istatistiksel çıkarım yapabilmek için verinin genellikle iki değişkenli normal dağılıma sahip olduğu varsayılır. Pearson [1] birçok araştırmacı tarafından çok sık kullanılan Pearson korelasyon katsayısına matematiksel bir formül geliştirilerek bilime büyük katkıda bulunmuştur. Pearson korelasyon katsayısı ortalamalara dayalı bir formüle sahip olduğu için örneklem verisinde olabilecek aykırı değerlerden oldukça olumsuz etkilenir. O halde veri içerisindeki aykırı gözlemlerden daha az etkilenen veya aykırı değer olarak nitelendirdiğimiz gözlemleri değil de geriye kalan çoğunluk gözlemlerin davranışını temsil edebilecek bir korelasyon katsayısı hesaplamasına gerek duyulmaktadır. Abdullah [] sıklıkla kullanılan Pearson, Spearman ve Kendall korelasyon katsayılarını ve önemli derecede aykırı gözlem olduğu durumlarda aykırı gözlemlerin bu korelasyon katsayılarına etkisini incelemiştir. Bu korelasyon katsayılarına alternatif olarak aykırı gözlemlerden daha az etkilenen En Küçük Medyan Kareler (EKMK) yöntemine dayanan yeni bir korelasyon katsayısı önermiştir. Niven ve Deutsch [3] orijinal verinin alt kümelerinden ya da farklı kombinasyonlar kullanılarak hesaplanan ağırlıklı ortalamaya dayanan sağlam bir korelasyon katsayısı hesaplayarak yeni bir yöntem geliştirmiştir. Yöntem adının baş harflerini yansıtan LOOT kısaltması ile bilinen Leave One Out korelasyon katsayısı α ağırlık üssü parametresine dayanmaktadır. Ancak α için çok kesin bir değer belirtilmemiştir. Bu çalışmada bu dezavantaj dikkate alınmış ve buradan hareketle α ağırlık üssü için sezgisel algoritmalardan genetik algoritma (GA) kullanımı önerilmiştir. Yapılan bu çalışma sonunda genetik algoritmaya dayalı yeni bir sağlam korelasyon katsayısı önerilmiş ve literatürdeki denklerine göre daha doğru sonuçlar sunduğu ortaya çıkarılmıştır.. Uygulama Yöntemin performansının değerlendirilmesi amacıyla literatürde sıklıkla kullanılan bir gerçek hayat verisi olan, yılları arasında ocak ayı için Kootenay nehri üzerinde iki farklı noktadaki Newgate ve Libby su akım ölçümlerini gösteren veri kullanılmıştır (Rousseeuw ve Leroy [4]). Kullanılan veri setinin orijinal hali üzerinde aykırı gözlem sayılabilecek bir değişiklik yapılmış ve yeni veri ile analizler yapılmıştır. Veri setinde yalnızca bir tane aykırı gözlem olduğunda, önerilen yöntem ile LOOT yönteminden elde edilen korelasyon katsayısı ve diğer korelasyon katsayıları karşılaştırılmıştır. Genetik algoritma parametreleri kullanılarak genetik algoritmanın adımları uygulanmış ve LOOT yöntemindeki α ağırlık üssü parametresi için en uygun değer belirlenmiştir. Kullanılan veriye ilişkin en iyi korelasyon katsayısı farklı durumlar incelendiğinde, genetik algoritma parametreleri itr(iterasyon sayısı)=1000, ks(kromozom sayısı)=30, es(elenecek kromozom sayısı)=8, co(çaprazlama oranı)=0.7 ve mo(mutasyon oranı)=0.1 olarak alındığında değişkenler arasındaki korelasyon katsayısı (r LOOT ) bulunmuştur ve α değeri 8.75 bulunarak en iyi korelasyon katsayısı elde edilmiştir. Çizelge 1 de sırasıyla Pearson, Spearman, Kendall, LOOT ve önerilen yöntemden elde edilen korelasyon katsayıları verilmiştir. Çizelge 1. Korelasyon katsayıları Korelasyon Korelasyon katsayıları sonuçları r p r s r τ r LOOT r LOOT 0.945

22 KAYNAKLAR [1] Pearson, K., 1896, Mathematical contributions to the theory of evolution: III. Regression, heredity, and panmixia, Philosophical Transactions of the Royal Society, 187, [] Abdullah, M. B., On a robust correlation coefficient, Journal of the Royal Statistical Society. Series D (The Statistician),39(4), [3] Niven E. B., Deutsch C. V., 01. Calculating a robust correlation coefficient and quantifying its uncertainty, Computers & Geosciences, 40, 1-9. [4] Rousseeuw, P. J., Leroy, A.M Robust regression and outlier detection. New York: Wiley. [5] Karaboğa, D., 004. Yapay Zeka Optimizasyon Algoritmaları, Atlas Yayın Dağıtım, İstanbul. ABSTRACT A NEW ROBUST CORRELATION COEFFICIENT BASED ON THE GENETIC ALGORITHM The aim of robust methods is to ensure high stability of statistical inference under the deviations from the assumed distribution model. The well-known Pearson correlation coefficient gives actually the direction and severity of the linear relationship between two variables. Since this correlation coefficient gives equal weights to all observations the data with one or more outliers can be hidden the severe correlation between the variables in actual. In this study, some other type correlation coefficients which are robust to the outliers and are known in statistical literature, are discussed. Moreover, we propose a new robust correlation based on the leave one out correlation coefficient in which the weight parameter α is generated by genetic algorithm. Key Words: Correlation Coefficient, Outliers, Robust Correlation Coefficients, Genetic Algorithm.

23 GENEL KARMA LİNEER MODEL ALTINDA RASGELE ETKİLER İÇİN BLUP ların KOVARYANS MATRİSLERİ Nesrin GÜLER Sakarya Üniversitesi, Fen Edebiyat Fakültesi, istatistik Bölümü, Sakarya, Türkiye edu.tr 1. Genel Karma Lineer Model ε ε R nx1 rasgele hata vektörü ve u ε R qx1 rasgele etkilerin vektörü olmak üzere, y = Xβ + Zu + ε ya da diğer bir gösterimi M = {y, X β + Zu, D, R, K} (1) olan genel karma lineer model ele alınsın. Bu modelde E (u) = 0, E (ε) = 0, cov (u) = D ve cov (ε) = R olmak üzere, u ile ε vektörlerinin ilişkili yani cov (ε, u) = K olduğu kabul edilmektedir, yani cov ( ε u ) = ( R K K D ) () ve dolayısıyla cov(y) = ZDZ' + R + ZK + KZ' := olarak yazılabilir.. BLUP y vektörü tarafından üretilen ve lineer tahmin edicileri içeren L = {Ay A ϵ R kxn } kümesi göz önüne alınsın. Bu L kümesinin elemanları arasından en iyi olanı belirlemek için bazı ölçütler vardır. Bir tahmin edicinin yansız olmasının yanı sıra, bu ölçütler arasında en çok kullanılanlardan biri Löwner sıralamasına göre kovaryans matrislerinin karşılaştırılmasına dayanır. Her β R px1 için E (Ay) = E (u) = 0, yani bir başka deyişle E (Ay - u) = 0 ise, Ay lineer ön tahmin edicisi u rasgele vektörü için yansızdır. Bu lineer yansız ön tahmin edici diğer tüm yansız ön tahmin ediciler arasında Löwner sıralamasına göre en küçük kovaryans matrisine sahipse en iyi lineer yansız ön tahmin edici (BLUP) olarak tanımlanır. Yani E (By - u) = 0 olacak şekildeki her By vektörü için cov (Ay u) L cov (by u) dir [1]. Ay = BLUP(u M) olmak üzere A matrisi, temel BLUP denklemi olarak bilinen aşağıdaki denklem vasıtasıyla belirlenir []: A (X Σ 1 ) = (0: (DZ + K)X 1 ) (4) Tahmin edicilerin kovaryans matrisleri, tahmin edicilerle 3 ilgili özellikleri belirlemekte önemli bir role sahiptir. Matrislerin rankları ve ranklarla ilgili sonuçlar, bu özellikleri belirlemede kullanılan yöntemlerden biridir [3]. Bu çalışmanın amacı, rasgele etkiler vektörünün BLUP ının kovaryans matrisini diğer bir yansız ön

24 tahmin edicinin kovaryans matrisi ile karşılaştırmaktır. Kovaryans matrislerinin karşılaştırması, ranklar ve katlılığı ile birlikte sayılan pozitif ve negatif özdeğerlerin sayısı ile ilgili özellikler kullanılarak yapılmaktadır. KAYNAKLAR [1] Haslett, S. J. & Puntanen, S. (011), On the equality of the BLUPs under two linear mixed models, Metrika, 74, [] Christensen, R. (00), Plane answers to complex questions: the theory of linear models, 3rd edn. Springer, New York. [3] Tian, Y. (010), Equalities and inequalities for inertias of hermitian matrices with applications, Linear Algebra Appl., 433, ABSTRACT COVARIANCE MATRICES OF BLUPS FOR RANDOM EFFECTS UNDER GENERAL MIXED LINEAR MODEL In this note, the general mixed linear model M = {y, Xβ + Zu, D, R, Kis considered under the assumption that the random vectors can be correlated. We give some equalities based on ranks and inertias of the covariance matrices for the best linear unbiased predictors (BLUPs) to compare the covariance matrices of BLUPs and other predictors. Key Words: BLUP, general mixed linear model, inertia, rank. 4

25 SESSION 1 YÖNEYLEM ARAŞTIRMASI 5

26 Dağılım Aralığı 1. Giriş KRİTER AĞIRLIKLANDIRMA YÖNTEMLERİNİN KARŞILAŞTIRILMASI Nezih TAYYAR ve Mert DURMUŞ Açık İletişim Adresi: Uşak Üniversitesi 1 Eylül Kamp. İktisadi ve İdari Bilimler Fakültesi B Blok Kat: No:7 ntayyar@gmail.com, mert.durmus@usak.edu.tr Karar verme işlevinin hayatın içinde oldukça büyük bir yere ve öneme sahip olduğu bilinmektedir. Karar verme, belirlenen amaç ve hedefe ulaşmak için alternatif durumlar arasından seçim yapma eylemi olarak tanımlanmaktadır (Forman ve Selly, 001:1). Alternatif sayısı ile birlikte verilecek karara büyük etkisi olan kriter sayısının da artması durumu karar verme sürecini uzatmakta ve zorlaştırmaktadır. Bu bağlamda çok kriterli karar verme (ÇKKV) problemlerinin çözümünde kullanılan ağırlık belirleme yöntemleri, kriter önemlerinin belirlenmesi ve karar vericiler için en iyi ve tatmin edici sonucun elde edilmesinde ciddi önem taşımaktadır (Zardari vd., 015). Bu önemine binaen yapılan literatür taraması sonucunda 1965 yılından 015 e kadar kriter ağırlıklandırma yöntemleriyle doğrudan ilgili toplam 4 çalışma yapıldığı görülmüştür. Bu çalışmanın konusu kriter ağırlıklandırma yöntemlerinin ÇKKV sürecindeki önemi ve bu alanda gerçekleştirilen çalışma sayısındaki yetersizlik göz önünde bulundurularak belirlenmiştir. Çalışmada Max100, SWARA ve İkili Karşılaştırma ağırlık belirleme yöntemlerinin değişkenlik düzeylerine göre kullanım koşullarının öğrenilmesi amaçlanmıştır. Ayrıca bu üç yöntemin kullanım kolaylıkları ve karar vericiler için güvenilirlik düzeyleri de incelenmiştir. Yöntemlerin uygulanabilmesi için ise katılımcıların kolay bir şekilde hâkim olabileceği düşünülen otomobil seçim örneği kullanılmıştır. Uygulama için 139 kişilik örneklemden faydalanılmıştır. Bu çalışmanın kriter ağırlıklandırma yöntemleriyle ilgili daha önce yapılan çalışmalardan en büyük farkı, 010 yılında geliştirilen SWARA (Stepwise Weight Assessment Ratio Analysis) yönteminin (Keruliene vd., 010) ilk kez bu çalışmayla kriter ağırlıklandırma yöntemleriyle karşılaştırılmış olmasıdır. İkincisi, karşılaştırılan yöntemler için kullanım koşulları önerilmesidir. Üçüncüsü ise özellikle öznel kriter ağırlıklandırma yöntemleri üzerine yapılmış detaylı bir çalışma olmasıdır.. Sonuç ve Tartışma Anketleri yanıtlayan 139 kişinin otomobil alırken göz önünde bulundurulan beş kritere göre kişisel tercihleri arasında fark olmasına rağmen ortalamalarına göre üç yöntemin kriter önem sıralarının aynı çıktığı görülmüştür. Yöntemlerin üçünde de güvenlik kriteri birinci, yakıt tüketimi ikinci, performans üçüncü, konfor dördüncü ve görsel çekicilik beşinci sırada yer almıştır. Yöntemlerin verdiği sıralamalar aynı olsa da ağırlık ortalamalarının birbirinden farklı olduğu gözlemlenmiştir. En önemli kriter olan güvelik kriteri için Max100, SWARA ve İkili Karşılaştırma nın ortalamaları sırasıyla %4, %8 ve %38 olarak bulunmuştur. En az önem verilen görsel çekicilik kriteri için ise Max100, SWARA ve İkili Karşılaştırma nın ortalamaları sırasıyla %18, %17 ve %1 olarak bulunmuştur Max100 İkili Karşılaştırma SWARA Yöntemler 6 Şekil 1. Yöntemlere Göre Ağırlıklıların Dağılım Aralıkları

27 Şekil 1 deki ortalama dağılım aralıkları dikkate alındığında Max100 ün %11,4, SWARA nın %0, ve İkili Karşılaştırma nın ise %4,5 tir. Kriter ağırlıklarının yöntemlere göre aldıkların ortalama değerler ve dağılım aralıkları göz önünde bulundurulduğunda, İkili Karşılaştırma nın en yüksek, SWARA nın orta düzeyde ve Max100 ün en düşük seviyede değişkenliğe sahip olduğu gözlemlenmiştir. Çalışma sonunda katılımcıların Max100 ü kullanımı en kolay yöntem olarak seçtikleri ve üç yöntemi de güvenilir buldukları görülmüştür. Ayrıca çalışmadan elde edilen sonuçlara dayanarak değişkenliğin az olması istenilen ÇKKV problemlerinde Max100, değişkenliğin orta düzeyde olması istenildiği durumda SWARA ve değişkenliğin yüksek seviyede olması istenildiği durumlarda İkili Karşılaştırma yönteminin kullanılması önerilebilir. KAYNAKLAR Forman, E. H. & Selly, M. A. (001). Decision by Objectives: How to Convince Others that You are Right. World Scientific Press. Kersuliene, V., Zavadskas, E. K. & Turskis, Z. (010). Selection of rational dispute resolution method by applying new step-wise weight assessment ratio analysis (SWARA), Journal of Business Economics and Management 11(), Zardari, N. H., Ahmed, K., Shirazi, S. M. & Yusop, Z. B. (015). Weighting Methods and their Effects on Multi- Criteria Decision Making Model Outcomes in Water Resources Management. Springer, New York. ABSTRACT COMPARING CRITERIA WEIGHTING METHODS The aim of this study is to compare Max100, Pairwise Comparison and SWARA weighting methods according to their variability statistics on related criteria for an automobile selection problem. According to the findings of the study, variability of Pairwise Comparison method is higher than Max100 and SWARA methods. In addition, Max100 is the easiest method to use whereas Pairwise Comparison is the most reliable method. Key Words: Multiple Criteria Decision Making (MCDM), Max100, SWARA, Pairwise Comparison, Weighting Methods, Criteria Weighting, Automobile Selection 7

28 SINAV PROGRAMI ÇİZELGELEME PROBLEMİ İÇİN KARIŞIK TAMSAYILI PROGRAMLAMA MODELİ Hakan ALTUNAY 1, Tamer EREN 1 Fırat Üniversitesi, Mühendislik Fakültesi, Endüstri Mühendisliği Bölümü, Elazığ, haltunay@firat.edu.tr. Kırıkkale Üniversitesi, Mühendislik Fakültesi, Endüstri Mühendisliği Bölümü, Kırıkkale, tamereren@gmail.com. Çizelgeleme, hizmet veya mamul üreten herhangi bir işletmede, matematiksel veya sezgisel teknikler yardımı ile sınırlı kaynakların, tamamlanması gereken görevlere en uygun şekilde tahsis edilmesini amaçlamaktadır [1]. Etkin bir çizelgeleme süreci yardımıyla belirlenen faaliyetlerin, daha az kaynak kullanılarak ve daha kısa sürede tamamlanabilmesi sağlanır [3]. Kurum ve sektörlere göre farklılık gösteren bu faaliyetler; hastanelerdeki sağlık personelinin çalışma saatlerinin düzenlenmesi, belediyelerdeki toplu taşıma araçlarının hareket saatlerinin belirlenmesi veya üniversite ve okul gibi eğitim kurumlarındaki ders veya sınav programlarının hazırlanması gibi zamana bağlı aktiviteleri ifade edebilmektedir. Tüm bu örnekler gibi haftalık veya günlük olarak planlanması gereken faaliyetler zaman çizelgeleme problemleri kapsamında değerlendirilmektedir [4]. Zaman çizelgeleme; sınav, ders ve toplantı gibi faaliyetlerin, bazı kısıtlamalar dikkate alınarak, en uygun zaman dilimlerine yerleştirilmesidir []. Sınav programı çizelgeleme problemi de 1960 lı yıllardan beri üzerinde çalışılan bir tür zaman çizelgeleme problemidir. Sınav programı çizelgeleme faaliyeti bütün eğitim kurumlarını ilgilendiren temel bir aktiviteye dayanmaktadır. Okullar ve üniversitelerdeki dönemler içerisinde uygulanması gereken sınavların, sorumlu öğrenci grupları ve aday gözetmenlere atanarak, çakışmaları önleyecek şekilde belirli zaman dilimleri ve dersliklere yerleştirilmesi işlemi sınav programı çizelgeleme problemi olarak tanımlanmaktadır. Bu çalışmada, sınav programı çizelgeleme probleminin çözümü için yeni bir karışık tamsayılı programlama modeli önerilmiştir. Önerilen model Fırat Üniversitesinde yapılan bir örnek uygulama ile test edilmiştir. KAYNAKLAR [1] Baker K.R. (1974), Introduction to Sequencing and Scheduling, John Wiley and Sons, New York. [] Burke E.K, Petrovic S. Qu R. (006), Case-Based Heuristic Selection for Timetabling Problems, Journal of Scheduling, Vol 9, no., s [3] Güldalı A. (1990), Seri İş-Akışlı Atölye Çizelgelemesinde Sezgisel Teknikler. Yüksek Lisans Tezi, Gazi Üniversitesi, Ankara, Türkiye. [4] Özyandı G. (010), Ders Çizelgeleme Probleminin 0-1 Tamsayılı Programlama Tabanlı Uygulaması. Yüksek Lisans Tezi, Gazi Üniversitesi, Ankara, Türkiye. ABSTRACT A MIXED INTEGER PROGRAMMING MODEL TO EXAMINATION TIMETABLING PROBLEM Examination timetabling problem is a type of scheduling problem which refers to a process of assigning exams, student groups and invigilators to suitable time slots and rooms. This problem is an extremely challenging task that takes place in all academic institutions at each end of semester. Exam timetabling problem is one of the most difficult combinatorial optimization problems and is considered to be NP-Hard. In this study, we used mixed integer programming method that provides optimal solution for examination timetabling problem in universities. This paper also includes an implementation 8 that is the final examination timetable of Business Department in Fırat University. Finally, the obtained and existing timetable was compared and provided some suggestions for future studies. Key Words: Examination Timetabling Problem, Mixed Integer Programming, Scheduling, Operations Research.

29 ROBUST OPTİMİZASYON İLE TÜRKİYE ELEKTRİK ENERJİSİ MODELİ 1. Giriş Prof Dr. Ayşen APAYDIN * Leyla BİLEN KAZANCIK** *Ankara Üniversitesi, Fen Fakültesi, İstatistik Bölümü. ** Ankara Üniversitesi, Fen Bilimleri Enstitüsü İstatistik Anabilim Dalı doktora öğrencisi. lbilen@dpt.gov.tr Kalkınmanın, rekabetin ve büyümenin temel unsurlarından olan enerji konusunda, literatürde dinamik optimizasyon, karma tamsayılı doğrusal programlama, heuoristik optimizasyon gibi modelleri kullanan planlama ve modelleme çalışmaları bulunmaktadır. Türkiye için yapılan bu çalışmada, belirsizlik altında, 03 yılına kadar elektrik enerjisi talebini minimum maliyetle ve güvenilir bir şekilde karşılamak amacıyla kurulacak yeni üretim tesislerinin zamanlaması, miktarı ve kompozisyonuna karar verilecektir. Bu amaçla deterministik doğrusal programlama ile en kötü senaryoya odaklanan Soyster, tarafından geliştirilen robust optimizasyon yöntemleri kullanılacaktır. Ayrıca fosil yakıtlı santrallerin tamsayılı olması için Soyster yaklaşımının kullanıldığı modele dal-sınır algoritması da uygulanacaktır.. Uygulama Kurulan modelde; maliyetler, talep edilen elektrik miktarı ve yenilenebilir enerji santrallerinin üretim miktarları belirsiz olarak alınacaktır. Mevcut ve lisans almış santrallerin devreye girdiği yıl talep edilecek elektriği karşılayamadığında oluşan açık, aday santraller tarafından karşılanacaktır. Buna göre, amaç fonksiyonu: 03 l Min z = t=014 i=1 u i c i x ti (1) Burada; i=1,..14 yakıt türü ve kapasitesine göre sisteme ilave edilecek aday santralin tipini, c i : i tipi aday santralin seviyelendirilmiş birim elektrik üretme maliyetini (yatırım, yakıt, bakım ve işletme maliyetlerini içermektedir), x ti : t yılında i tipi aday santralden kaç tane kurulacağını, u i : i tipi aday santralin yıllık üretebileceği elektrik miktarını ifade etmektedir. Modelin fosil yakıtlı karar değişkenleri: 150 MW gücünde akışkan yataklı linyit santral ünitesi, 360 MW gücünde Elbistan tipi ünite, 300 MWgücünde taş kömürü, 500 MW gücünde ithal kömür, 700 MW gücünde doğalgaz, 1000 MW gücünde nükleer santral ünitesi olarak belirlenmiştir. Yenilenebilir enerji santralleri ise; 3,6 MW gücünde küçük HES, 5 MW gücünde orta ölçekte HES, 100 MW gücünde büyük ölçekli, 40 MW gücünde RES, 3 MW gücünde GES PV, 100 MW gücünde GES depolama özelliği olmayan CSP, 100 MW gücünde 6 saat depolamalı santral GES CSP, 30 MW gücünde binary jeotermal santralleri olarak tanımlanmıştır. Kısıtlar: İlave kapasite için alt sınırı: T l 1 t=019 i=1 k (1+α i ) ix ti d t T=019,00 03 () T l İlave kapasite için üst sınır: t=019 i=1 k i x ti d t T=019, (3) Pik yük kapasite kısıtı: T l t=019 i=1 k it x it 0,17d t i=7,10,11,1,13,14 (4) Üretim kısıtları: T l t=019 i=1 u it x it D t T=019, 00 03; (5) Burada; α i : i. ilave edilebilecek aday santraller için yedek oranını (termik santraller için %15 ve yenilenebilir enerji santralleri için %70 dir) d t : t yılı için tahmin edilen kapasite açığı alt sınırı (MW), d t: t yılı için tahmin edilen kapasite açığı üst sınırı (MW), D t : t yılında mevcut ve lisans almış santrallerle karşılanamayan elektrik miktarını (GWh) ifade etmektedir. Model, Matlab ile deterministik doğrusal programlama olarak çözüldüğünde seviyelendirilmiş minimum toplam üretim maliyeti $ olarak bulunmuştur. Soyster yaklaşımı ile çözüldüğünde 66 değişken ve 31 kısıtlı doğrusal programlama modeli, 18 değişkenli ve 154 kısıtlı bir yapıya dönüşmüştür. Seviyelendirilmiş minimum toplam maliyet $ olup, deterministik 9 model sonucundan %19 daha fazla olmuştur. Dalsınır algoritması ile çözülen Soyster yaklaşımında minimum seviyelendirilmiş maliyeti $ olan 3 uygun çözüm elde edilmiştir. Fosil yakıtlı santrallerin tamsayıya dönüştürülmesi deterministik doğrusal modele göre maliyeti %19, artırmıştır.

30 Yöntem Belirsizlik altında optimizasyon problemleri için geliştirilen robust optimizasyon, duyarlık analizi ve stokastik programlama için tamamlayıcı bir yöntemdir. Belirsiz parametrenin sınırlandırılmış, dışbükey belirsizlik kümesine ait olduğu varsayımı ile yapılmakta olan robust optimizasyon, belirlenen belirsizlik kümesi üzerinden amaç fonksiyonunun maksimum değerinin minimizasyonunu bulmayı amaçlamaktadır. Bu nedenle en kötü durum analizi olarak da adlandırılır. Bu yaklaşım 1970 yılında Sosyter ile başlamıştır (Düzgün, 01). Robust optimizasyon; belirsizlik kümesinin belirlenmesi ve robust eşdeğer problemin oluşturulması olmak üzere iki temel aracı vardır (Li vd, 01). Yaygın kullanılan belirsizlik kümeleri; kutu belirsizlik kümesi (Soyster tarafından geliştirilmiştir), elipsoidal belirsizlik kümesi, poliherdan (çok yüzlü) belirsizlik kümesi ve bunların kombinasyonu olarak ifade edilebilir. Doğrusal optimizasyon problemlerinde belirsizlik, amaç fonksiyonlarında, sağ yan ya da sol yan değerlerinin hepsinde olabildiği gibi bir kısmında da olabilmektedir. En genel haliyle belirsiz doğrusal optimizasyon problemi Eşitlik 6 ile ifade edilir. max c jx j x j j a ij x j b i (6) Burada; c j, a ij, b i belirsiz parametrelerdir. c j [c j, c j ], b j [b j, b j ], a ij [a ij, a ij ] aralığında değer alarak kendi ortalamaları etrafında simetriktir bir dağılıma sahiptir. a ij = a ij + ε ij a ij j εj i, b i = b i + ε i0 b i c j = c j + ε j c j (7) a ij, c j ve b i parametrenin nominal değerleri, a ij, b i ve c j pozitif sabit dalgalanmaları, J i belirsizlik buluna katsayıların değişken indeksini içeren alt kümeyi, ε ij ve ε i0 rastlantı değişkenlerini ifade etmektedir. Rastlantı değişkenleri [-1,1] aralığında dağılmaktadır. Soyster yaklaşımında tüm parametrelerin belirsiz olduğu durumda robust eşdeğer kısıt; max z z j c j x j + Ψ jεj 0 c j x j 0 (8) j a ij x j + Ψ[ jεji a ij x j + b i ] b i u j x j u j olarak ifade edilir. Anahtar Kelimeler: Enerji, Elektrik sektörü, Robust optimizasyon Kaynaklar Ben-Tal A., Nemirovski A., 000 Robust solution of linear programmng problems contaminated with uncertain data. Mathematical Programming, Ser. A 88: Li Z., Floudas C.A.,01. A Comparative Theoritical end Computational Study on Robust Counterpart Optimization: II. Probabilistic Guarantees on Constraint Satisfaction Industrial & Engineering Chemistry Research: Volume 51, Issue 19 sf Moazeni, M., 006. Flexible Robustness in Linear Optimization. Doktora tezi. Waterloo, Ontario, Canada, TEİAŞ, 011. Türkiye Elektrik Enerjisi Üretim Planlama Çalışması ( ). TEİAŞ, 01, Türkiye Elektrik Enerjisi 10 Yıllık Üretim Kapasite Projeksiyonu (01-01). ABSTRACT TURKISH ELECTRICAL ENERGY MODEL WITH ROBUST OPTIMIZATION The aim of this study is to determine the added electrical installed capacity at minimal cost in the long term in Turkey. For this purpose, it will be decided which year, what type of fuel, and how much capacity is to be added to installed capacity by considering resource constraints. In the study, robust linear programming model which was developed Soyster, is preferred as a result of uncertainty in demand, cost of production and production quantity. It will also be used in branch and bound algorithm. Keywords: Energy, the Electricity sector, Robust optimization, 0 3

31 TAGUCHI DENEY TASARIMI YÖNTEMİNİN YAPI ENDÜSTRİSİNE UYGULANMASI İbrahim ÖZDEMİR 1, Pelin KASAP 1, Başak MESCİ, Aytül DUMLU 1 Ondokuz Mayıs Üniversitesi, Fen-Edebiyat Fakültesi, İstatistik Bölümü, 55139, Kurupelit, Samsun Ondokuz Mayıs Üniversitesi, Mühendislik Fakültesi, Malzeme Bilimi ve Mühendisliği Bölümü, 55139, Kurupelit, Samsun ibrahimozdemiradana@gmail.com, pelin.kasap@omu.edu.tr, basakm@omu.edu.tr,aytuldumlu55@gmail.com 1. Giriş Klasik deney tasarımı yöntemlerinin endüstri alanında kullanımı bazı durumlarda verimli olamamaktadır. Sistemi etkileyen faktörlerin sayısı arttıkça gerekli olan deney sayısı da hızlı bir şekilde artmakta, maliyetler yükselmekte, uygulamalar zorlaşmaktadır. Böyle durumlarda az sayıda deney ile optimal sonucun belirlenebileceği Taguchi Deney Tasarımı yönteminin uygulanması daha verimli ve kolay olacaktır. Dr. Genichi Taguchi, kendi adıyla anılan bu yaklaşımı ile deneylerin gerçekleştirilmesinde ve değerlendirilmesinde verimliliği arttıracak bir çözüm getirmiştir (Taguchi [3]). Burada Taguchi nin deney düzenlemek için geliştirdiği yöntemlerin temelini, Dikey Dizimler oluşturmaktadır. Ayrıca Taguchi Deney Tasarımı yönteminde elde edilen deney sonuçları Sinyal/Gürültü (Signal/Noise-S/N) oranına çevrilerek değerlendirilmektedir. Taguchi, 60 ın üzerinde S/N oranından bahsetmektedir (Pignatiello [4]). En çok bilinen üç tanesi; en küçük en iyi, nominal en iyi ve en büyük en iyi S/N oranlarıdır. Problemin amacına göre S/N oranı, kalite değerlerinin hedeflendiği değere göre farklı şekillerde hesaplanabilir. S/N oranları için kullanılan formüller aşağıdaki gibidir: S S N N 1 log n 1 log n Y i 1 Y i 10 n, en küçük en iyi yanıtı için (1) i1 n 10 i1, en büyük en iyi yanıtı için () S N 10log Y S, nominal en iyi yanıtı için (3) Her üç tip problemde de amaç S/N oranını maksimize etmektir. En küçük en iyi yanıtı için hedef değer sıfır, en büyük en iyi yanıtı için hedef değer sonsuz ve nominal en iyi yanıtı için hedef değer belirlenen değerdir. Yapı endüstrisinde birçok malzeme kullanılmaktadır, fakat bir yandan yakıt giderlerinin artması bir yandan da ülkemizin deprem kuşağında olması araştırıcıları ucuz, dayanıklı ve yalıtkan malzeme türleri aramaya zorlamaktadır. Alçı kompozitler, bu amaca yönelik kullanılabilecek malzemelerdir. Tek başına alçı, ısıyı az iletmesi, hafif ve ucuz olması gibi önemli avantajlara sahiptir. Fakat tüm bunların yanı sıra alçı, mekanik dayanımı zayıf bir malzemedir. Bu yüzden olası kullanım alanlarını genişletmek ve sahip olduğu özellikleri geliştirmek için dolgu malzemeleri ile güçlendirilmesi gerekmektedir. Hem alçının kullanımını arttırmak hem de doğada atık olan malzemeleri azaltmak için alçı; kırpık atık araba lastiği ve E-camı ile birleştirilerek sağlam bir kompozit malzeme oluşturulmak istenmektedir. Burada Su/Alçı oranı (A faktörü), E-camı (B faktörü) ve kırpık atık araba lastiği (C faktörü) olmak üzere 3 faktör vardır. Su/Alçı oranı faktörünün 0.6, 0.7, 0.8, E-camı faktörünün %1, %, %3 ve kırpık atık araba lastiği faktörünün %0.5, %1 ve % olmak üzere üçer düzeyi vardır. Fakat alçı, kırpık atık araba lastiği ve E-camı faktörlerinin hangi düzeyleri seçildiğinde daha optimal bir sonuç elde edileceğine karar vermek gerekmektedir. Bu nedenle minimum maliyet ile deney yapmaya imkân sağladığı için Taguchi Yöntemi kullanılmıştır. Bu çalışmada, L 9 (3 4 ) Dikey Dizimi kullanılmıştır ve Taguchi Yönteminin en büyük en iyi yanıtı formülü kullanılarak elde edilen S/N oranları aşağıdaki gibi hesaplanmıştır: 3 1

32 Çizelge 1. Taguchi L 9 (3 4 ) Deney Tasarımına göre deney sonuçları ve S/N oranları Faktörler ve Seviyeleri A B C Deney No Su/Alçı Oranı E-camı miktarı (%) Kırpık atık araba lastiği miktarı (%) Basınç Dayanımı S/N Oranı 1 0,6 1 0,5 8,3 18,405 0,6 1 8,8 18, ,6 3 9,05 19, , ,95 15, ,7 5,93 15, ,7 3 0,5 7,6 17, ,8 1 3,0 10, ,8 0,5 4,05 1, , ,35 1,7698 Yapılan analiz sonucunda Su/Alçı oranının 1. düzeyi, E-camı miktarının 3. düzeyi, Kırpık atık araba lastiği miktarının 3. düzeyi birleştirilerek elde edilen kompozit malzemenin, yapı endüstrisinde kullanılmasının basınç dayanımı bakımından optimal olduğu sonucuna ulaşılmıştır. KAYNAKLAR [1] Karna S. K., Sahai R., (01), An Overwiev on Taguchi Method, International Journal of Engineering and Mathematical Sciences, Vol. 1, pp [] Zaharis Z. D. (01), A modified Taguchi s Optimization Algorithm for Beamforming Applications, Progress In Electromagnetics Research, Vol. 17, pp [3] Taguchi, G. (1987), System of Experimantal Design: Engineering Methods to Optimize Quality and Minimize Cost, UNIPUB, White Plains, New York. [4] Pignatiello, J.J. (1988), An Overview of The Strategy And Tactics of Taguchi, IIE Transactions, Vol.0, pp. 47 ABSTRACT THE APPLICATION OF TAGUCHI EXPERIMENTAL DESIGN METHOD ON CONSTRUCTION INDUSTRY In this study, we try to increase poor mechanical properties of composite material using the Taguchi Experimental Design method. We use L 9 (3 4 ) orthogonal array in experiment. Signal/Noise ratio is used to evaluate the experiment results. Key Words: Experimental design, Taguchi design, Signal-to-Noise ratio, Composite material. 3

33 SESSION 1 EKONOMETRİ 1 3 3

34 AKDENİZ ÜLKELERİNDE TURİZM GELİRLERİ ve EKONOMİK BÜYÜME: PANEL VERİ ANALİZİ Nurzen ÜZÜMCÜ, Kurtuluş BOZKURT*, Aytaç PEKMEZCİ Muğla Sıtkı Koçman Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Kötekli, MUĞLA *Adnan Menderes Üniversitesi, Söke İşletme Fakültesi, Bankacılık ve Finans Bölümü, Söke, AYDIN 1. ÖZET Turizm sektörü 0. yüzyılın ikinci yarısından itibaren, özelliklede. Dünya Savaşının bitmesiyle birlikte dünya genelinde hızla gelişen, hizmet sektörünün en önemli alt sektörlerinden birisi olarak karşımıza çıkmaktadır. Günümüzde ise gerek gelişmiş gerekse gelişmekte olan ülkeler için önemli bir döviz kazandırıcı sektör konumundadır. Bunun dışında özellikle imalat ve tarım ana sektörü başta olmak üzere diğer birçok sektöre de önemli dışsallıklar sağlamakta, çevreye duyarlı bir sektör olarak da sürdürülebilir kalkınmanın sağlanması noktasında başat bir rol oynamaktadır. Bu bağlamda özellikle döviz geliri kazandırıcı özelliği nedeniyle, ülkelerin uluslararası turizm piyasasından pay almaya yönelik rekabetleri özelliklede Türkiye nin de içerisinde yer aldığı Akdeniz bölgesinde her geçen gün artmaktadır. Dünya Turizm Örgütünün 00 yılında dünya turizm gelirinin trilyon dolar olacağına ilişkin projeksiyonu ülkelerin turizm arz potansiyellerini geliştirerek bu pastadan pay alma veya aldıkları payı büyütme mücadelesine girişmelerine neden olmuştur. Turizm sektörünü geliştirerek ülkelerin gelişmişlik seviyelerine göre ulaşmak istediği hedeflerin farklılık gösterdiğini söylemek mümkündür. Gelişmiş ülkelere bakıldığında söz konusu ülkelerin turizm sektörünün gelir yaratıcı etkisinden yararlanmaya çalıştıkları, gelişmekte olan veya az gelişmiş ülkelerin ise, sektörün döviz kazandırıcı ve yeni istihdam olanakları yaratabilme gücünden yararlanmaya çalıştıkları gözlenmektedir. Zira gelişmekte olan ülkelerin ihracat yapabilmeleri büyük oranda ara ve yatırım malı ithalatına bağlı olduğu için döviz ihtiyacı nedeniyle turizm sektörü önemli bir döviz tedarikçisi sektör olarak değerlendirilmektedir. Diğer taraftan ülkelerin en önemli sorunlarından biriside işsizlik sorunudur ve bu noktada emek-yoğun hizmet üreten bir sektör olması nedeniyle yine turizm sektörü gelişmekte olan ve az gelişmiş ülkelere önemli bir istihdam potansiyeli sağlamaktadır. Zira turizm sektörünün yapısal özellikleri, istihdam yaratma potansiyeli açısından onu diğer sektörlerden farklılaştırmaktadır. Turizm sektöründe makineleşme ve bilgisayar sistemlerin kullanımı dışında teknolojik yeniliklerin kullanım alanı oldukça sınırlıdır ve bu sınırlılık, teknolojik ilerlemelerin emek tasarruf ettirici etkisini azaltmaktadır. Analizde zaman boyutuna sahip kesit serileri kullanılarak ekonomik ilişkilerin tahmin edilmesi yöntemi olan panel veri analizi kullanılmıştır. Kesit seri ve zaman serisinin bir araya getirilmesiyle oluşturulan panel veri analizi, zaman serilerinde görülen problemleri de beraberinde taşımaktadır. Bu nedenle zaman serisi verilerinde olduğu gibi değişkenlerin birim kök içerip içermediği, aynı dereceden birim köke sahip değişkenler arasında eşbütünleşme olup olmadığı incelenecektir. Aksi halde verilerin durağan olmaması durumunda elde edilecek regresyon tahminleri yanıltıcı olacaktır. Bu amaçla panel birim kök testleri ve panel eşbütünleşme testleri uygulanarak değişkenler arasında uzun dönemli ilişki olup olmadığı analiz edilecektir. Çalışmanın analiz kısmında, 17 Akdeniz ülkesi için dönemini kapsayan Dünya Bankasının İstatistik Veri Tabanlarından elde edilen turizm gelirleri ve GSYİH (Gayri Safi Yurtiçi Hâsıla) serilerinin logaritmik değerleri kullanılarak bir veri seti oluşturulacaktır. Panel eşbütünleşme testleri uygulanarak değişkenler arasında uzun dönemli ilişki olup olmadığına bakılacaktır. KAYNAKLAR [1] Tatoğlu, F. Y. (013), Panel Veri Ekonometrisi: Stata Uygulamalı, Beta Yayıncılık, İstanbul. [] Bahar, O. ve Bozkurt, K. (010). Gelişmekte Olan Ülkelerde Turizm-Ekonomik Büyüme İlişkisi: Dinamik Panel Veri Analizi, Anatolia: Turizm 3 Araştırmaları Dergisi, 1 (): [3] Baltagi, B. H. (005), Econometric Analysis of Panel Data, Third Edition, John Wiley and Sons, New York. [4] Gökovalı, U. and Bahar, O. (006). Contribution of Tourism to Economic Growth in Mediterrranean Countries: A Panel Data Approach, Anatolia An International Journal of Tourism And Hospitality Research, 17 ():

35 [5] Bozkurt, K. ve Pekmezci, A. (015), Turizm Talebi ve Döviz Kuru Şokları: Türk Turizm Sektörü İçin Ekonometrik Bir Analiz, Osman Gazi Ün. İİBF Dergisi, Ağustos, Cilt: 10-. TOURISM RECEIPTS AND ECONOMIC GROWTH IN MEDITERRAN COUNTRIES: THE PANEL DATA ANALYSIS ABSTRACT The process of globalization has come within inevitable changes about countries sectoral situations. One of that changes is a passing through the service sector from the industry sector. Especially management, technique that based on a information and technology and professional individuals are in a service sector. With this on the other hand tourism sector that is may be called a sub-service sector have enhanced itself for foreign exchange earnings. In this context the objective of this study that analyze the cointegration between tourism receipts and economic growth for 17 Mediterranean countries that includes Turkey also between two dates that For success of this analysis, panel dataset have been created and within panel unit root method the panel cointegration analysis has been done. Key Words: Tourism Receipts, Economic Growth, Panel Data Analysis. 5 3

36 BOOTSTRAP GRANGER NEDENSELLİK TESTİ ÜZERİNE BAZI SİMÜLASYON SONUÇLARI Savaş GAYEKAR*. Yeliz YALÇIN. 1. Giriş Gazi Üniversitesi, İktisadi ve İdari Bilimler Fakültesi, Ekonometri Bölümü, 06500, Ankara, Türkiye, İktisadi değişkenler arasındaki nedensellik yapısını bilmek ekonomistler için önemli bir konudur. Nedenselliğin test edilebilir tanımı Granger nedensellik olarak Granger (1969) da verilmiş ve ekonometrik çalışmalarda sıkça kullanılmaya başlanmıştır. Değişkelerin durağan olduğu varsayımı altında kullanılan Wald istatistiği asimptotik olarak standart dağılıma sahiptir. Ancak Sims (1990) da değişkenlerin durağan olmadığı durumdawald istatistiğinin standart dağılıma sahip olmadığını testin yanlış sonuçlar verebileceğini göstermiştir. Toda-Yamamoto (1995) makalesinde durağan olmayan seriler arasındaki Granger nedensellik ilişkisini test etmede yaygın olarak kullanılan yeni bir yöntem önermişlerdir. Önerdikleri yöntem serilerin maksimum bütünleşme sırasının VAR modeline ilave gecikme uzunluğu olarak eklenmesine dayanmaktadır. Toda- Yamamato (TY) yaklaşımı adı verilen bu testte Wald istatistiği asimptotik olarak dağılımına yakınsamakta ve değişkenler arasında Granger nedensellik yoktur yokluk hipotezi kolaylıkla test edilebilmektedir. Ancak TY testinin başarısı VAR modelinin gecikme uzunluğuna ve serilerin bütünleşme derecesinin doğru tespit edilmesine bağlıdır. Ayrıca Wald istatistiği asimptotik olarak dağılımına yakınsadığı için küçük örneklemlerde testin gücü ve anlamlılık düzeyi etkilenmektedir (Mavrotas ve Kelly, 001). Literatürde son yıllarda durağan olmayan zaman serilerinde Granger Nedensellik testi için bootstrap yönteminin kullanıldığı çalışmalarla karşılaşılmaktadır. Bu çalışmada durağan olmayan zaman serilerinde TY ve Bootstrap Granger Nedensellik (BGN) testleri karşılaştırılmış, farklı durağanlık durumlarını ele alan 4 farklı veri üretme süreci ve örnek çapları kullanılmıştır. TY ve BGN testlerinin, iki zaman serisi arasındaki nedensellik ilişkisini test etmedeki performansları sınırlı veri kümesinde karşılaştırılmıştır. Bu amaçla her iki testin gücü ve anlamlılık düzeyleri farklı veri üretim süreçleri kullanılarak Monte Carlo simülasyon çalışması sonucu değerlendirilmiştir. 3 6 Tablo 1. Durağan olmayan fakat eşbütünleşik seriler için BGN ve TY testlerinin anlamlılık düzeyleri ve Güçleri

37 Sonuç olarak. BGN testinin anlamlılık düzeyi küçük örneklemlerde TY testine göre nominal anlamlılık düzeyine e daha yakın sonuçlar vermiştir ve BGN testinin gücü TY testine göre daha yüksek çıkmıştır. KAYNAKLAR [1] Di lorio F, and Triacca U, (013), Testing for Granger non-causality using the autoregressive metric, Economic Modelling, 33, 10-15, [] Hacker R,S,, Hatemi, J,A, (006) Tests for CausalityBetween Integrated Variables Using Asymptotic and Bootstrap Distributions: Theory and Application Applied Economics, 38: , SOME SIMULATION RESULTS ON BOOTSTRAP GRANGER CAUSALITY TEST Granger (1969) proposed causality using foreseeability as a criterion which is called Granger Causality. If the series are non-stationary, the wald statistic which is using in Granger causality test is not valid. Toda- Yamamoto (1995) proposed test for the causality.this method has some disadvantages like size distortion and low power in small samples. This study propose bootstrap Granger Causality test without the pretest of integration. In addition, Toda-Yamamoto and bootstrap Granger Causality tests are compared. Results show that size of the bootstrap Granger causality test is closer to nominal size than Toda-Yamamoto test and higher power values in small samples. Key Words: (Granger Causality, Bootstrap Method, MWald Test) 7 3

38 MALİ BAŞARISIZLIK KESTİRİMİNDE VERİ MADENCİLİĞİ YAZILIMLARININ LOJİSTİK REGRESYON PERFORMANSLARININ KARŞILAŞTIRLMASI Nurzen ÜZÜMCÜ* Süleyman Demirel Üniversitesi Sosyal Bilimler Enstitüsü Ekonometri Bölümü Ekonometri ABD 360 Çünür/ISPARTA Ömer Utku ERZENGİN Süleyman Demirel Üniversitesi Fen Edebiyat Fakültesi İstatistik Bölümü 360 Çünür/ISPARTA 1. MALİ BAŞARISIZLIK KESTİRİMİNDE VERİ MADENCİLİĞİ YAZILIMLARININ LOJİSTİK REGRESYON PERFORMANSLARININ KARŞILAŞTIRLMASI Ekonomik süreçlerdeki değişime bağlı şirketler mali başarısızlık durumuna düşebilmektedir. Serbest piyasa ekonomisi rekabet kurallarına göre çalışmaktadır. İşletmelerin rekabet ortamında varlıklarını sürdürebilmeleri nakdi ve nakdi olmayan değerlerin dengeli kullanılmasına bağlıdır. 01 yılından bu yana Borsa İstanbul da işlem gören hem ulusal hem de uluslararası bazı şirketler mali açıdan başarısız olup pazardan çekilmek zorunda kalmışlardır. Son yıllarda görülen bu durum mali başarısızlığın belirlenmesinin önemini arttırmıştır. Mali başarısızlığı belirlerken yalın veriler (bilanço ve gelir tablolarındaki tek başına kalemler) yerine mali oranlar kullanılmalıdır. Bilanço ve gelir tablolarında yer alan nakdi ve nakdi olmayan değerlerin birbirlerine oranlanmasıyla finansal oranlar elde edilir. Oranların kullanılması şirketler arasındaki büyüklük farkları ve farklı risk sınıflarında bulunmalarından doğacak etkileri azaltmaktadır. Edward I. Altman ve arkadaşları 1968 den bu yana oranlara bağlı mali başarı/başarısızlık formüllerini ortaya koymuştur. Genel olarak Altman ın ölçeklerinde Z skoruna göre başarı ve başarısızlık ortaya konmaktadır. Bilanço ve gelir tablolarından elde edilen oranlar birbiriyle istatistiksel açıdan ilişki içindedirler. Bazı oranlar hesaplanırken aynı kalemler kullanılabilmektedir. Aynı kalemleri kullanan oranlar çoklu bağlantı sorununu ortaya çıkartmaktadır. Yapılan çalışmada bilanço ve gelir tablolardan elde edilen oranlar arasındaki çoklu bağlantı sorunu temel bileşenler analiziyle (TBA) giderilmiştir. Temel bileşenlere bağlı faktör analizinin amacı, çoklu bağlanım sorunu olan oranların birbirinden bağımsız olarak daha az sayıdaki yeni veri yapısına indirgenmesidir. Altman 1983 yılında yaptığı çalışmada Z skorunun 1.3 ile.99 arası gri bölge olarak tanımlamıştır. Altman Z skoruna göre 1.3 ün altında kalan alan şirketler başarısız ve.99 üzerine çıkan şirketler başarılı olarak kabul edilmiştir. Çeşitli çalışmalarda Altman Z skoruna göre başarısızlık ve başarı kategorik olarak 0-1 şeklinde belirlenmiştir. Yapılan çalışmada ikili lojistik regresyon (İLR) analizinde bağımlı değişken olarak mali başarısızlık kullanılmıştır. Bağımlı değişken y nin aldığı değer 1 ise mali başarıyı, 0 ise başarısızlığı temsil etmiştir. Altman Z skoruna göre bulanık olan bölgenin ne kadarının 0 ne kadarının 1 alacağı bilançolara bağlı İLR deki eğri altında kalan alan ROC (Receiver Operating Characteristic) eğrisine göre belirlenmiştir. Lojistik regresyondaki en doğru sınıflama oranı bulunmaya çalışılmıştır. Yapılan çalışmada Borsa İstanbul da işlem gören şirketlerin 01 yılları bilançolarından ve gelir tablolarından elde edilen veriler kullanılmıştır. Mali başarı ve başarısızlık oranlara bağlı İLR analiziyle incelenmiştir. TBA dan sonra elde edilen faktörler İLR ye sokulmuştur. İLR analizi doğrusal analizlerdeki varsayımlar olmaksızın sınıflama işlemi yapan bir regresyon yöntemidir. Altman Z skoruna göre bulanık olan bölgenin ne kadarının 0 ne kadarının 1 alacağı ROC eğrisi altında kalan alana göre bulunmuş ve lojistik regresyondaki sınıflama oranı optimize edilmeye çalışılmıştır. Yapılacak çalışmada açık kaynak kodlu veri madenciliği yazılımlarının (R, Weka, Orange, Rapid Miner, Knime) lojistik regresyon sınıflama oranları karşılaştırılacaktır. Bilanço ve gelir tablolarından elde edilmiş verilerin temel bileşenler analizinden sonra ikili lojistik regresyon 3 sonrası kesim noktasına bağlı sınıfları incelecek yazılımlar arasındaki farklılıklar tartışılacaktır. 8

39 KAYNAKLAR [1] Altman, E. I. (1968). Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy, The Journal of Finance, Vol. 3, No. 4, pp [] Kleinbaum, D.G., Klein, M. (00). Logistic Regression A Self-Learning Text, Second Edition, Springer- Verlag, New York, 513s. [3] Cortez, P. (010). Data Mining with Neural Networks and Support Vector Machines using the R/rminer Tool, Advances in Data Mining Applications and Theoretical Aspects Lecture Notes in Computer Science, Vol. 6171, pp [4] Altman, E. I., Drozdowska, M.I., Laitinen, E.K., Suvas, A. (014). Distressed Firm and Bankruptcy Prediction in an International Context: A Review and Empirical Analysis of Altman's Z-Score Model (Available at SSRN: or [5] Wahbeh, A. H. (011). A Comparison Study between Data Mining Tools over some Classification Methods. Journal of Advanced Computer Science and Applications(IJACSA), DOI: /SpecialIssue ABSTRACT DATA MINING SOFTWARE LOGISTIC REGRESSION PREDICTION PERFORMANCE COMPARSION OF FINANCIAL DISTRESS Companies have to survive in economical process with competition and has a probabilty falling into financial distress. Companies must balance their monetary and non-monetary assets. To describe financial distress only financial ratios calculated proportioning monetary and non-monetary assets in annual financial statement are not enough. In 1968 Altman showed that the Z-Score could be used to determine the company is financially distressed or not. In this study to predict financial distress Binary Logistic Regression (BLR) was used to esitmate companies specified as successful and unsuccessful according to Altman Z score. The open source data mining softwares classification performance was compared. Key Words: Financial Distress, Altman Z score, Logistic Regression, ROC 9 3

40 OTOKORELASYONLU LİNEER REGRESYON MODELLERİNDE MODEL GEÇERLİLİĞİ İÇİN EN İYİ RİDGE YANLILIK PARAMETRESİNİN BELİRLENMESİ Tuğba SÖKÜT AÇAR* Çanakkale Onsekiz Mart Üniversitesi, Fen Bilimleri Fakültesi, Enstiüsü, Çanakkale M. Revan ÖZKALE Çukurova Üniversitesi, Fen-Edebiyat İstatistik Bölümü, Adana 1. Giriş Model geçerliliği konusu özellikle değişken seçimi için regresyon analizinde önemli bir yere sahiptir. Regresyon modellerinin geçerliliği sıradan çapraz geçerlilik (Ordinary CrossValidation, OCV), genelleştirilmiş çapraz geçerlilik (Generalized Cross-Validation, GCV) ve kavramsal ön tahmin (Conceptual Prediction, Cp) ile belirlenmektedir. Uydurulan bir regresyon modelinin geçerliliği, düşünülen modelin sağlıklı ve etkili bir model olup olmadığını ifade eder. Model iyi bir model değilse, uydurulan model üzerinden yapılacak tahminler de güvenilir sonuç vermez. Veri setinde çoklu iç ilişki problemi olduğu durumlarda Hoerl ve Kennard [] sıradan ridge tahmin ediciyi b R = (Z Z + ki p ) 1 Z'y, k > 0 olarak önermişlerdir. Burada I diag(0,1,1,..,1) dir. Ridge p regresyonda k nın seçimi için kullanılan birçok yöntem, hata kareler ortalamasını minimum yapmaya yönelik önerilmiştir. Regresyon modeli, yanıt değişkenin öngörü performansı için kullanılacaksa, hata kareler ortalamasını minimum yapan yanlılık parametresinin sağlıklı bir seçim olmadığından endişe edilmiştir. Bu nedenle ilişkisiz ve sabit varyanslı hataya sahip lineer regresyon modelinde çoklu iç ilişki olması durumunda OCV, GCV ve Cp istatistikleri birçok yazar tarafından ele alınmıştır. Golub ve ark. [1] OCV ve GCV istatistiklerini b Rüzerinden incelemişlerdir. Montgomery ve Friedman [4] OCV istatistiğini b R için uyarlamış ve k nın seçimi için minimum OCV yi kullanmışlardır. Mallows [3] Cp istatistiğini minimum yapacak şekilde k nın seçimini ele almıştır.. Model y = zβ + ε E(ε) = 0, E(εε ) = σ ψ (1) ile verilen çoklu lineer regresyon modeli ele alınsın. Burada, y: n x 1 tipinde rastgele değişkenlerin gözlenen yanıt vektörü, Z = [ 1 X] n x p tipinde matris, öyle ki; 1: n x 1 tipinde 1 lerden oluşan vektör, X = (x 1,x,...,x r): n x r tipinde merkezileştirilmiş ve standartlaştırılmış 1 x i = 0 x i x i = 1, I = 1,,, r) bilinen açıklayıcı değişkenler matrisi, β p x 1 tipinde sabit terim içeren bilinmeyen parameter vektörü ve ε: n x 1 tipinde hataların gözlenmeyen vektörüdür. (1) modelinde çoklu iç ilişki problemi olduğunda Trenkler [5] ridge tahmin ediciyi β R = (Z ψ 1 Z + ki p ) 1 Z ψ 1 y, k > 0 olarak ifade etmiştir. Bu çalışmada hatalar arasındaki ilişkinin 4 ε 0 i = ρ + u 1, IρI < 1, E(u i ) = 0, E(u i ) = σ u ve E(u iu j ) = 0, i j ()

41 olduğu veri setinde otokorelasyon ve çoklu iç ilişki problemleri olduğunda model geçerlilik ölçümleri ele alınmıştır. OCV, GCVve Cp istatistikleri (1) modeli altında otokorelasyonlu ridge tahmin edicisi üzerinden elde edilmiş, özel durumları incelenerek genelleştirilmiş en küçük kareler, sıradan en küçük kareler ve sıradan ridge tahmin edicileri için OCV, GCV ve Cp istatistikleri verilmiştir. Örneklem genişliği 0, çoklu iç ilişkinin gücü y = 0.99, 0.90, 0.70 ve 0.50, otokorelasyon katsayısı ρ = 0.99,0.90,0.70,0.50 iken çoklu iç ilişki gücünün ve otokorelasyonun OCV, GCV ve Cp istatistiklerini minimum yapan k ya olan etkisi Monte Carlo simülasyon ile incelenmiştir. 3. Sonuç Çalışma göstermiştir ki; model geçerliliğini en iyi yapacak optimum k ile tahmin edilen otokorelasyonlu ridge tahmin edicisi model geçerliliği açısından genelleştirilmiş en küçük karelerden daha iyidir. Optimum k, otokorelasyon katsayısından ve hata teriminin varyansından etkilenmektedir öyle ki hata teriminin varyansı arttıkça optimum k artmakta ve otokorelasyon katsayısı azaldıkça azalmaktadır. Çoklu iç ilişkinin gücünün optimum k üzerinde önemli bir etkisinin olmadığı görülmüştür. KAYNAKLAR [1] Golub G. H., Heath M. and Wahba G. (1979), Generalized Cross-Validation as a Method for Choosing a Good Ridge Parameter, Technometrics, 1():15-3. [] Hoerl A.E. and Kennard R.W. (1970), Ridge Regression: Biased Estimation for NonorthogonalProblems, Technometrics, 1(1): [3] Mallows C. L. (1973), some comments on Cp, Technometrics, 15(4); [4] Montgomery D. C. and Friedman D. J. (1993), Prediction Using Regression Models with Multicollinear Predictor Variables. IIE Trans 5(3), [5] Trenkler G. (1984), On the Performance of Biased Estimators in the Linear Regression Model with Correlated or Heteroscedastic Errors, Commun. Statist.- Theor. Meth., A9(1): ABSTRACT THE DETERMINATION OF BEST RIDGE BIASING PARAMETER FOR MODEL VALIDATION IN THE LINEAR REGRESSION MODELS WITH AUTOCORRELATION The model validation has an important role in the regression analysis. The validity of a regression model is determined by ordinary cross-validation (OCV), generalized cross validation (GCV) and conceptual prediction (Cp). Many authors discussed these statistics under the assumption that the errors are uncorrelated and constant variance. In this study, OCV, GCV and Cp measurement defined for autorocorrelated ridge regression estimators with Ar(1) errors. The best autocorrelated ridge estimator has been determined by optimum ridge biasing parameter so as minimized the OCV, GCV and Cp statistics. For this purpose, a Monte Carlo simulation study is given following the paper. Key Words: Multicollinearity, Cross-Validation, First Order Otoregressive Process, Ridge Estimator 1 4

42 SESSION 1 ÇEŞİTLİ KONULAR 4

43 YÖNSEL VERİLERDE UYUM İYİLİĞİ TESTİ Orhan KESEMEN, Hilal BAYRAK*, Özge TEZEL Karadeniz Teknik Üniversitesi, Fen Fakültesi, İstatistik ve Bilgisayar Bilimleri Bölümü,61080, Trabzon, TÜRKİYE 1. Giriş İstatistik biliminde, örneklemin geldiği popülasyonun dağılımı örneklem dağılımını oluşturmaktadır. Örneklemin geldiği yığındaki birimlerin nasıl dağıldığını bilmek istatistikte hangi testin kullanılacağının belirlenmesinde oldukça önemlidir. Bu yüzden, örneklemin hangi dağılımdan geldiğinin test edilmesi gerekmektedir. Böyle durumlarda önce örnek seçilir ve sonra bu örneğin sözü edilen dağılımdan gelip gelmediğine karar vermek için istatistiksel testler yapılır. Bu testlerin amacı örnek verisinin öngörülen dağılıma uyup uymadığına karar vermektir. Bu tür testlere uyum iyiliği testleri denir. Uyum iyiliği için birçok test önerilmiştir. Bu çalışmada Kolmogorov-Smirnov uyum iyiliği testi kullanılmıştır. Rastgele örneklenmiş verilerin istatistiksel analizinde, verilerin bir rastgele değişkenden geldiği kabul edilir. Bu rastgele değişken değişik ölçü uzaylarında bulunabileceği gibi açısal bir uzayda da bulunabilmektedir. Tek değişkenli açısal değişim gösteren veriler, dairesel veriler olarak isimlendirilmektedir ve birçok bilim dalı için, yapılan herhangi bir araştırmada veri toplanması aşamasında ölçümler açısal olarak elde edilmektedir. Rüzgârların yönleri, kuşların veya diğer hayvanların göç yönleri [1], salgın hastalıkların bir bölgede yayılım yönleri, cisimlerin düzlemdeki yönelimleri dairesel verilere örnek olarak verilebilir. Bu gözlemlerin elde edilmesinde kullanılan iki temel dairesel ölçüm aracı pusula ve saattir. Pusula kullanılarak yapılabilecek gözlemlere örnek olarak göçmen kuşların göç esnasındaki yönelimleri gösterilebilir. Saatle yapılabilecek gözlemlere örnek olarak da, bir hastanedeki acil servis birimine gelen hastaların 4 saat içerisindeki servise geliş zamanlarının dağılımı verilebilir []. Dairesel bir gözlem, birim yarıçaplı bir daire üzerinde bir nokta ya da düzlemde bir birim vektör olarak kabul edilebilir. Açısal değişimli veriler iki değişkenli olursa küresel, ikiden fazla olursa hiperküresel olarak isimlendirilmektedir. Açı tabanlı veriler ise genel olarak yönsel veriler olarak isimlendirilmektedir. Dairesel verilerin dağılımı ilk kez 1918 de Von Mises tarafından incelenmiştir [3]. Dairesel verilerin istatistik uygulamaları yer bilimleri, meteoroloji, biyoloji, fizik, psikoloji, görüntü çözümleme, tıp, astronomi gibi alanlarda kullanılmıştır [] [4]. Açısal gözlemler, deneylerde farklı biçimlerde ortaya çıkmaktadır. Örneğin biyolog, kaplumbağaların hareket yönünü incelerken, jeolog da fay hatlarına ilişkin bir araştırma yapabilir. İlk örnekteki yönsel araştırma iki boyutlu olarak incelenirken, ikinci örnekteki araştırma dünya yüzeyi yaklaşık olarak bir küre şeklinde olduğu için üç boyutta incelenmektedir. Son yirmi yılda veri gösterimi, korelasyon, regresyon ve zamana ya da konuma bağlı yapıdaki verilerin analizi üzerinde durulmaktadır. Yönsel veri çalışmaları, araştırmacılara çok geniş bir alanda ilerleme olanağı vermekte ve yeni istatistiksel yöntemler geliştirmede çok verimli bir alan olduğu görülmektedir. Ayrıca doğal, fiziksel, tıbbi ve de sosyal bilimlerde ortaya çıkan problemler için yeni ve farklı uygulamalar geliştirilebilmektedir.. Önerilen Yöntem Olasılık dağılımları istatistiksel veri analizinde önemli bir yer tutar. Doğrusal verilerdeki dağılımlara karşılık olarak dairesel veriler için de çeşitli dağılımlar vardır. Dairesel dağılım, bütün olasılıkları birim çemberin çevresinde yoğunlaşan bir olasılık dağılımıdır [5]. Bu dağılımları tanımlamadan önce dairesel yoğunluk kavramı verilmelidir. Dairesel dağılımlar genellikle dairesel bir yoğunluk olarak tanımlanırlar. Dairesel bir olasılık yoğunluk fonksiyonu aşağıdaki temel özelliklere sahiptir. 1. θ için f(θ) 0 dır.. f fonksiyonu π periyoduna göre peryodiktir. Yani f(θ) = f(θ + k. π) dir. θ 3. θ 0 için 0 +π f(θ)dθ = 1 θ 0 olmalıdır. 3 4

44 Birim çember üzerindeki en temel dağılım dairesel düzgün dağılımdır. Diğer önemli dağılımlar; Von Mises Dağılımı, Sarmal Normal Dağılım ve Üçgen Dağılım dır. Von Mises dağılımı bilinen normal dağılıma benzer olarak, dairesel veri analizi teorisinin oluşturulmasında önemli bir rol oynamaktadır []. Bu çalışmada özel olarak yönsel verilerin hangi dağılımdan geldiği araştırılmıştır. Yönsel verilerin öngörülen dağılıma uyup uymadığını test etmek için Kolmogorov-Smirnov uyum iyiliği testi kullanılmıştır. KAYNAKLAR [1] S. J. Chang-Chien, M. S. Yang ve W. L. Hung, «Mean shift-based clustering for directional data,» %1 içinde Proceedings of third international workshop on advanced computational intelligence, 010. [] K. V. Mardia ve P. E. Jupp, Directional Statistics, New York: John Wiley & Sons, Inc., 000. [3] R. Von Mises, «Uber die die "Ganzzahligkeit" der Atomgewicht und verwandte Fragen,,» Physikal, cilt 19, pp , [4] N. I. Fisher, Statistical Analysis of Circular Data, Cambridge: Cambridge University Press, [5] S. R. Jammalamadaka ve A. S. Gupta, Topics in Circular Statistics, London: World Scientific Publishing Co. Pte. Ltd., 001. ABSTRACT GOODNESS-OF-FIT TEST FOR DIRECTIONAL DATA The main purpose of this study, determine experimental directional data have come from a random variable with a directional distribution (Von Mises Distribution, Wrapped Normal Distribution, Triangular Distribution, Uniform Distribution). In this study, testing the goodness of fit we use Kolmogorov-Smirnov goodness of fit test for directional data. Key Words: Directional Data, Goodness-of-Fit Test, Angular Space, Angular Distance. 4 4

45 MEKÂNSAL REGRESYON ANALİZİNDE GEODA KULLANIMI Hakan BAŞBOZKURT 1*, Ayşe BASBOZKURT, Adnan KARAİBRAHİMOĞLU 3, Aşır GENÇ 4 1* Bingöl Ticaret ve Sanayi Odası, Bingöl, TÜRKİYE, hakan.basbozkurt@gmail.com Bingöl Üniversitesi, Fen Fakültesi, Coğrafya Bölümü, Bingöl, TÜRKİYE, ayse.basbozkurt@gmail.com, 3 Necmettin Erbakan Üniversitesi, Meram Tıp Fakültesi, TEBAD,4080, Konya, TÜRKİYE, adnankaraibrahim@gmail.com, 4 Selçuk Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Konya, TÜRKİYE, agenc@selcuk.edu.tr GİRİŞ Mekânsal regresyon analizinde, istatistiğe ait olan en temel varsayımlardan verilerin birbirleri ile bağımsız olması varsayımı reddedilir. Tobler in (1970) Coğrafya nın birinci kuralı herşey birbiri ile ilişkilidir, fakat yakın olanlar uzak olanlara nispeten daha fazla ilişkilidir olarak ifade edilir. Mekânsal regresyon analizinin temel felsefesi olan bu kavramla mekânın gözlenen veriler üzerinde etkili olduğu kabul edilir ve yapılan istatistikî analizlere mekân dâhil edilir (Basbozkurt, 015). Dolayısıyla sosyal ve fiziksel kavramların mekânda çoğu kez kümelendiklerinden bahsedilir (Suç, bölgesel oy verme deseni, ırk ayrılığı, yoksulluk sınırı, akciğer kanseri, ev fiyatları, tarım bitkileri, orman yangınları, hayvan yaşam alanları, bitki türleri, toprak kimyası vb.).. AMAÇ Bu çalışmanın amacı, mekânsal regresyon analizinde önemli bir yere sahip olan GeoDa Araştırma Merkezi nin ( ) geliştirmiş olduğu mekânsal regresyon analizlerinde kullanılabilecek ücretsiz yazılım programı olan GeoDa programını uygulamalı olarak incelemektir. 3. MATERYAL VE METOT Çalışmamızda GeoDa uygulaması olarak ABD Toplum Araştırma Sayım Bürosundan ( alınan (Stieve, 01) veri kümesi kullanılmıştır. Dünyanın en kalabalık ve en pahalı şehirlerinden birisi olan Manhattan da eve sahip olmada mekânın önemi ve mekânın ev sahipliliğine olan etkisi mekânsal regresyon modelleri kurularak incelenmiştir. Moran ın I indeksi mekânsal otokorelasyonu (bağımlılığı) ölçer ve ρ (ro) harfi ile ifade edilir. ρ değeri -1 ile +1 arasında değer alır. ρ değerinin beklenenden daha fazla pozitif değer alması benzer değerlerin araştırma alanında kümelenmesine işaret eder. Mekânsal otokorelasyonun hesaplamasında aşağıdaki notasyonlar kullanılmaktadır; n ilgilenilen örnekteki alanların sayısı, i, j herhangi iki alansal ünite, z i i alanındaki ilgilenilen değişkene ait değer, W ij i ve j lokasyonlarındaki benzerlik, ayrıca her i değeri için Wii 0, M ij i ve j gözlemlerine ait değişkenin benzerliği. Moran ın I indeksi aşağıdaki şekli ile formülüze edilir; n I W 0. n n i1 j1 W ( z z ).( z z ) n i1 ij i j ( z z ) Burada normalleştirme faktörü olan W 0 aşağıdaki şekliyle ifade edilir; n n W0 Wij () i1 j1 4 Mekânsal regresyon araştırmaya konu olan bağımlı değişkeni 5 eldeki bağımsız değişkenlerden hareketle tahmin etmede kullanılan modeldir. Klasik istatistikten farklı olarak mekânsal ağırlığı modele dâhil eder. Bu çalışmada mekânsal regresyon modellerinden Mekânsal Adım (Spatial Lag) ve Mekânsal Hata (Spatial Error) modelleri kullanılacaktır. i j (1)

46 .1 Mekânsal lag modelinin basit hali, mekânsal otoregressive (SAR) modeli olarak adlandırılıp, aşağıdaki şekli ile ifade edilir ve iid özelliğine sahiptir ve bu model matris notasyonunda aşağıdaki gibi gösterilir; y Wy X (3) Burada skaler değeri y ve Wy arasındaki mekânsal otoregressive güç ilişkisini gösterir ve genellikle (-1, 1) arası değer alması beklenir (her zaman olmamaktadır). Ayrıca W satırlara göre standardize edilmiş ağırlık matrisidir.. Mekânsal hata modelleri hata terimlerinin bağımlılığı üzerine kuruludur. Mekânsal hata bağımlılığı gözlemlenememiş mekânsal olarak bağımlı gizli değişkenlerden kaynaklanabilir. Bu modeller ayrıca komşulukları doğru bir şekilde belirlenememiş komşu alanlardan kaynaklanabilir. Bu modellerin tespiti zor olduğu içinde sıkıntılı modeller olarak kabul edilirler (Fischer ve Wang, 011). Mekânsal hata modeli matris olaraktan ise aşağıdaki gibi ifade edilir; W u (4) 4. BULGULAR ve SONUÇ Bu çalışmada mekânsal regresyon için kullanılan Moran ın I indeksi ve mekânsal regresyon modelleri GeoDa programı yardımı ile uygulamalı olarak incelenmiştir. Uygulama sonucu Manhattan da ev sahipliliğinde mekânın önemli bir unsur olduğu sonucuna varılmıştır. Araştırma sonucuna göre Manhattan da ev sahipliliğinde mekânın önemini en iyi mekânsal hata regresyon (spatial error) modelinin (R =0,53; p=0,001) açıkladığı görülmüştür. KAYNAKLAR [1] Anselin,L. (005) Exploring Spatial Data with GeoDa: A Workbook. Center for Spatially Integrated Social Science: Urbana-Champaign, IL. [] Basbozkurt, H., (015) Toprağın Bazı Fiziksel ve Kimyasal Özelliklerinin Mekansal Regresyon Yöntemleri Kullanımı ile Analizi, İstatistik, 015. Selçuk Üniversitesi: Konya [3] Fischer, M.M. and J. Wang, (011), Spatial Data Analysis: Models, Methods and Techniques. Springer. [4] Stieve, T. (01) Moran s I and Spatial Regression. [5] Tobler, W.R., (1970) A Computer Movie Simulating Urban Growth in the Detroit Region. Economic Geography, 46: p ABSTRACT USAGE OF GEODA FOR SPATIAL REGRESSION ANALYSIS The aim of this study is to determine the importance of free and open-source GeoDa software ( which have been designed to analyze the spatial events and to model spatial regression. A data set belonging to USA Society Research Cencus Office was applied to model the effect of owning a house in Manhattan using some demographic and household information by spatial regression. According to the results, we found that the spatial dependence is an important component to own a house in Manhattan. Key Words: Spatial Regression, GeoDa, Moran s I 6 4

47 YÜKSEK ÖĞRETİM KURUMLARINDA LİSANS VEYA DOKTORA SINAVINA GİREN ÖĞRENCİLERİN ÖRNEKLEME METODU KULLANILARAK YÖK DÖNÜŞÜM TABLOSU KULLANILDIĞINDA MAĞDURİYETE UĞRAYIP/UĞRAMADIKLARININ BELİRLENMESİ ÜZERİNE BİR ÇALIŞMA (SİNOP ÜNİVERSİTESİ ÖRNEĞİ) Mücahit KURTULUŞ (1), Egemen KURTULUŞ (), Bilal ERDOĞAN (3) Bilindiği üzere bir ülkenin gelişmişlik göstergelerinden en önemlisi okuma-yazma oranının yüksek olmasıdır. Okuma-yazma oranının yüksek olduğu ülkelerde de üniversite bitirmiş olanların oranı da aynı doğrultuda yüksek oranlar da olmaktadır. Ülkemizde de son dönemlerde üniversite bitirmiş (yüksek lisans ve doktora dahil) insanlarımızın sayısı belirgin olarak artış göstermektedir. Nüfusun artması nedeni bağlı olarak sayısal artış gayet doğaldır. Yapılan planlamalar doğrultusunda sayısal olarak artıştan daha da önemli olan faktör yetişmiş (kalifiye) insan gücünün, nicelik (sayısal) olarak değil nitelik (kalifiye) ve nüfustaki oranının yüksek olması, o ülkenin gelişmişlik göstergelerinden en önemli faktör olduğu yadsınamaz. Dünya ekonomisinde üst sıralarda yer almanın sadece ve sadece kuralı yetişmiş insan (kalifiye) gücümüzün niteliğidir. Lisan mezunu öğrencilerimiz, Yüksek Lisans veya Birleştirilmiş Doktora ve Doktora sınavlarına girdiklerinde, üniversitelerimizin öğrencilerine verdikleri yüzlük sistemdeki notları harf sistemine dönüştürülmektedir. Harf sistemindeki notlar ise YÖK (Yüksek Öğretim Kurumu) ün belirlemiş olduğu Dönüşüm Tablosu kullanılarak yüzlük not sistemine dönüştürülmektedir. Bu dönüşüm esnasında geçme notunun 60 (Altmış) olduğu üniversitemizde; öğrencinin gerçek (yüzlük sistemdeki) notunun 6.06 (altmışiki, yüzde altı) olduğu düşünelim Harf notu olarak karşılığı.06 (iki, yüzde altı) karşılık gelmektedir. Öğrencinin Transkript (Not Dökümü) nde sadece harf notu verilmektedir. YÖK Dönüşüm tablosunda ise harf notu yüzlük sistemde e karşılık gelmektedir. Geçme notunun 60 olduğu bir üniversite de gerçek yüzlük sistemdeki notu 6,06 olan öğrenci harf notu karşılığından dolayı ((6, ) = puan) hak kaybına uğramaktadır. Yüzdesel olarak kaybı ise (yüzde 13,39) dur. Bundan dolayı öğrenci sınava girmesi gerekirken sırlamaya bile girememektedir. Gözden kaçırılmamsı gereken en önemli unsur ise; geçme notu 60 iken öğrencinin Dönüşüm tablosunda ki sorundan dolayı başarı puanının 60 (Altmış) puan altına ( 54.73) inmesi bir çelişkidir. Gerçekten de bu durumun böyle olup/olmadığının belirlenebilmesi için Sinop Üniversitesi Rektörlüğü nün tarihli oluru ile Öğrenci İşleri Daire Başkanlığı tüm mezun olan ( bahar dönemi) öğrencilerimizin harf notları ve yüzlük sistemdeki notları alınmıştır.aftan dönen öğrencilerin tamamı kapsam dışı bırakılmıştır. Çünkü harf ve yüzlük sistemdeki başarı notları sağlıklı olarak hesaplanamamaktadır (Önceki dönemlerde geçme notunun 50 (elli) olması vb.). Yığınımızın çerçevesi belirlenmiştir. Çerçeve dışında kalan öğrenci olup/olmadığı tekrar kontrol edilmiştir. Her bir fakülte(4 yıl), Yüksek okul(4 yıl) ve Meslek Yüksek okulları ( yıllık) olmak üzere not ortalamalarına göre sıralanmış listesi olması nedeniyle Basit Rasgele Örnekleme Yöntemi uygulanmıştır. Yığın da bulunan 6490 (Altıbindörtyüzdoksan) öğrenciden, hoşgörü miktarı ( 0.001) olmak üzere; yapılan hesaplama sonucuna göre 41 (İkiyüzkırkbir) öğrenci örnek çapını oluşturmuştur. Örneğe çıkan 41 mezun öğrenci bilgisayar ortamında (Yerine koyarak yöntemi ile normal dağılımdan örnek sıra numaraları çekildi) sıra numaraları belirlenmiştir. Elde edilen bilgiler yardımı ile; verilerin normallik testleri yapılması ve normallik testi sonucuna göre hangi istatistiksel yöntemlerin uygulanacağı, modelin anlamlı olup olmadığı, betimsel istatistikler, grafik ve tablolar ve diğeryapılamsı uygun olan tüm istatistiksel analizler yapılması, yığın parametrelerinin tahmin edilmesi, güven aralıklarının oluşturulması planlanmaktadır. 1 n xi n i 1 x (1) 7 4 n. 1 sx xi x () n 1 i1

48 N = 6490, p = q, V = 0.001, n = 41 (Yaklaşık olarak) olarak hesaplanmıştır. Çizelge1. Öğrencinin Notları ve YÖK tablosu arasındaki farklılıklar Öğrenci Harf Yüzlük YÖK Puan Yüzde Sıra Nosu Puanı puanı puanı Kaybı puan kaybı YÖK Olması gereken Harf Notu kaybı Harf Yüzde kaybı KAYNAKLAR [1] Yamane T. (009), Temel Örnekleme Yöntemleri, Çeviri İstanbul-Türkiye, [1] Bakır M.A. ve Aydın C. (013), İstatistik, Ankara-Türkiye, Nobel Yayınları.. [1] Ünver Ö. ve Gamgam H. (006), Uygulamalı Temel İstatistik Yöntemler, Ankara-Türkiye, Seçkin Yayıncılık. HIGHER EDUCATION INSTITUTIONS EXAMINATION DEGREE OR DOCTORATE IN THE SAMPLING METHOD WHEN NO CONVERSION TABLE IS USED/ A STUDY ON DETERMINING THEY DAMAGES (SİNOP UNIVERSITY SAMPLE) The most important indicator of a country's development, as it is known literacy rate It is high. The rate of literacy in countries with a high proportion of university degree is also higher than in the same direction. In our country, in the last period he had finished university (including master's and PhD) are increasing significantly the number of our people. Language graduate students when they enter the Master's or PhD and PhD Combined exam grades given to university students in the upper system is converted into a letter system. The system notes the letter YÖK (Higher Education Council) 's set by the system using the conversion table is converted to upper grades. Key Words: Simple random sampling, Higher Education, Sinop University. 8 4

49 Kişilerin Refah Seviyesindeki Artış ile Havayolu Ulaşımı Tercihi Arasındaki İlişkinin Araştırılması; Türkiye Örneği Hülya ŞEN 1 Hakkı POLAT 1 Yrd.Doç. Eskişehir Osmangazi Üniversitesi İstatistik Bölümü Doktora Öğrencisi Eskişehir Osmangazi Üniversitesi İstatistik Bölümü 1 hsen@ogu.edu.tr hakkiplt@gmail.com Kişilerin Refah Seviyesindeki Artış ile Havayolu Ulaşımı Tercihi Arasındaki İlişkinin Araştırılması Havayolu taşımacılığı son dönemlerde sağladığı avantajlar nedeniyle en çok tercih edilen ulaşım yöntemi olma yolunda hızla ilerlemektedir. Havacılık sektörüne yapılan yatırımlar, teknolojik gelişmeler ve modern dünyada giderek daha önemli hale gelen vakit kazandırma özelliği sayesinde popülerliğini giderek arttırmaktadır. Fakat sağladığı imkanların yanında ulaşım ücretlerinin ve maliyetlerinin diğer ulaşım yöntemlerine göre fazla olması, özellikle Türkiye gibi nüfusunun büyük çoğunluğunu düşük ve orta gelir grubundan insanların oluşturduğu ülkelerde son dönemlere kadar pek tercih edilememesine sebep olmuştur. Ekonomik büyümenin vatandaşların refah seviyesine pozitif katkısının havayolu ulaşımını tercih etmelerine neden olacağı ve refah seviyesi ile tercihler arasında benzer hareketlilik olduğu bu çalışma sonucunda elde edilmiştir. Havayolu taşımacılığının gelişiminin önündeki engellerin araştırılmasına yönelik çalışmalar genellikle birkaç başlık altında toplanmaktadır. Bunların en başında ise devlet tekelinde olma durumu gelmektedir. Birçok ülkede havaalanları ve sivil uçak işletmeciliğinin devlet tarafından yürütülmesi özel teşebbüslerin bu alana yönelik yatırımlarının kanunlarla engellenmesi halen dünyanın birçok ülkesinde havayolu taşımacılığının en az tercih edilen ulaşım sektörü olmasına neden olmaktadır. Hooper (00), bu durumu Asya ülkelerini kapsayan çalışmasında göstermiştir. Hooper, beklenen özelleştirme ve teşviklerin bir türlü yapılamamasının söz konusu sektörün gelişmesinin önündeki en büyük problemlerden biri olarak göstermiştir. Yukarıda anlatıldığı gibi birçok ülkede işletme haklarının halen devlet elinde bulunması, monopol bir piyasa yapısının oluşmasına sebep olmakta, bu durum da rekabet ortamı oluşmasını engellemektedir. Ashworth ve Forsyth (1984), bu durumu İngiltere de ki havayolu sektörü ve üretim sektörünü kıyaslayan bir model geliştirerek göstermiş ve bu monopol yapının havayolu sektörünün gelişmesinin önündeki en büyük engel olarak göstermiştir. Bunun yanında Backx vd., (00), havayolu taşımacılığının sadece devlet tekelinde bulunan ülkelerle hem devlet hem de özel sektör teşebbüslerinin olduğu ülkelerdeki sektörel durumu karşılaştırmıştır ve özel teşebbüslerin bulunduğu ülkelerdeki kalite ve memnuniyet düzeylerinin devlet eliyle işletilen işletmelere göre çok daha yüksek olduğunu göstermiştir. Ancak son dönemlerde özellikle Türkiye gibi gelişmekte olan ülkelerde yaşanan gelişmeler havayolu taşımacılığının büyümesine sebep olmaktadır. Özellikle Türkiye de yapılan kanuni düzenlemelerle özel sektör teşebbüslerinin faaliyetlerine izin verilmesi rekabet ortamının oluşmasına bu ortamın da 000 li yıllardan sonra Türkiye de söz konusu sektörün büyük gelişim göstermesine sebep olmuştur (Şen ve Polat, 015). Aynı zamanda kişilerin refah seviyelerinde meydana gelen artışında havayolu ulaşımına talebi arttırdığı da söylenebilir Fernandes ve Pacheco, (010), bu durumu Brezilya için kişi başına düşen milli gelir ile havayolu sektör parametreleri arasındaki nedenselliği araştırarak ortaya koymuştur. Şekil.1, Türkiye nin yılları arasında yıllık kişi başına milli geliri ve havayolu taşımacılığını tercih eden kişilerin sayısını göstermektedir. 9 4

50 9,000 Kişi Başına Düşen Gayri Safi Milli Hasıla 100,000,000 Havayolu Yolcu Sayısı 8,000 7,000 6,000 5,000 4,000 80,000,000 60,000,000 40,000,000 0,000,000 3, Şekil GSYMH ve Havayolu Yolcu Sayıları Şekil incelendiğinde özellikle 000 li yıllardan sonra havayolu yolcu sayısında belirgin bir artışın olduğu görülmektedir. 001 yılında yapılan kanuni düzenlemelerin havayolu yolcu sayısının trendi üzerinde yapısal bir kırılmaya bile sebep olduğu söylenebilir (Şen ve Polat, 015). Bu aşamadan sonra Kişi başına düşen gayri safi yurt içi hasıla ile havayolu yolcu sayıları arasında Granger nedensellik testi uygulanmış ve sonuçlar aşağıda verilmiştir. Tablo 1.Granger Nedensellik Testi Sonuçları Sıfır Hipotezi Gözlem Sayısı F-İstatistiği P. DHAVA, DGDP nin Granger Nedeni Değildir DGDP, DHAVA nın Granger Nedeni Değildir * *%95 güvenilirlikle reddedilen hipotezleri göstermektedir. Tablo incelendiğinde, kişi başına düşen milli hasıla ile havayolu yolcu sayıları arasında tek yönlü bir nedenselliğin olduğu görülecektir. Ayrıca uzun dönemli ilişkilerin incelenmesi için eşbütünleşme analizi uygulanmış ve analizler sonucunda her iki değişken arasında eşbütünleşik bir yapının olduğu görülmüştür. KAYNAKLAR [1] Ashworth, M., & Forsyth, P. (1984). Civil aviation policy and the privatisation of British Airways. Institute for Fiscal Studies. [] Backx, M., Carney, M., & Gedajlovic, E. (00). Public, private and mixed ownership and the performance of international airlines. Journal of Air Transport Management, 8(4), [3] Fernandes, E., & Pacheco, R. R. (010). The causal relationship between GDP and domestic air passenger traffic in Brazil. Transportation Planning and Technology, 33(7), [4] Hooper, P. (00). Privatization of airports in Asia. Journal of Air Transport Management, 8(5), [5] Şen H., & Polat, H. (015). The Research Effects Of Law Changes At Air Transportation On Air Passanger Carries For Turkey. Alphanumeric Journal, 3(1). RESEARCHING RELATIONSHIP BETWEEN INCREASING PERSONEL INCOME AND AIR PASSANGER CARRIES; AN AMPRICAL STUDY FOR TÜRKİYE Recently, air transportation has become more important 5because of providing advantages. Investments, technological developments and earning times, lead to 0 be more popular this transportation sector. Despite of have advantages, because of expensive ticket prices and other costs, don t let to peoples prefer very much especially huge amount of peoples has low income countries, like Turkey. In this study, shown that; Economic growth and increasing personnel income can be effective for prefer air transportation. Key Words: Air Passenger Carries, GDP Per Capita, Time Series, Granger Causality, Cointegration

51 SESSION APPLIED STATISTICS 1 1 5

52 DEVELOPING A LIU-TYPE ESTIMATOR FOR THE POISSON REGRESSION Yasin ASAR 1, Adnan KARAİBRAHİMOĞLU, Hakan BAŞBOZKURT 3 and Aşır GENÇ 4 1 Necmettin Erbakan Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Konya, yasar@konya.edu.tr, yasinasar@hotmail.com Necmettin Erbakan Üniversitesi, Tıp Fakültesi, Konya, akara@konya.edu.tr 3 Bingöl Ticaret ve Sanayi Odası, Bingöl, TÜRKİYE, hakan.basbozkurt@gmail.com 4 Selçuk Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Konya, agenc@selcuk.edu.tr 1. Introduction The dependent variable is not always normally distributed as it is in least squares method. Sometimes, it represents a count of a situation, accident or particulate matter etc. It is more proper to use Poisson regression when dealing with count data. The explanatory variables are sometimes correlated to each other especially in the field of economics and health sciences. Maximum likelihood estimator (MLE) is usually used to estimate the parameters in Poisson regression. However, the variance of MLE is inflated when there is multicollinearity. Thus, making statistical inference using MLE becomes difficult due to its large mean squared error (MSE). The problem of multicollinearity has not been discussed in the literature when Poisson regression model is used. Exceptionally, in [] the authors adopted and modified some existing ridge estimators to the Poisson regression model. Moreover, Liu estimator is generalized to the Poisson regression in [3]. Finally, in [4] the authors proposed several estimators for estimating the ridge parameter based on Poisson ridge regression model.. Method and Theory f A reasonable probability model for count data is often the Poisson distribution having the following pdf i yi e i i y where y is the dependent variable, i 1,,..., n and i 0. One popular link function y! i is the following log link function g ln i i xi such that x i is the th i row of the design matrix X of order n p with p explanatory variables and is the coefficient vector of order p 1. The most common method of estimating the coefficients is to use the maximum likelihood estimator (MLE) which can be obtained by using the iteratively weighted least squares (IWLS) algorithm as follows: ˆ ˆ MLE X WX X Wz ˆˆ Wˆ diag Pˆ 1 Pˆ zˆ log Pˆ y Pˆ / Pˆ 1 Pˆ 1 where i i and i i i i i i is the i th element of the vector ẑ. In order to overcome the problem of multicollinearity, we generalize Liu-type estimator to the Poisson 1 X WX ˆ ki X WX ˆ di ˆ where k 0, d. The MSE of regression as follows ˆPLT MLE p p j d PLT is ˆ d k j MSE PLT j1 j 1 j j k j k where j ˆ X WX respect to k and equating the resultant function to 5 zero, we get the individual parameters ˆ j d 1 j j k j. Since each k j should be positive, the condition ˆ j d 1 j j 0 should ˆ is the th j eigenvalue of. We propose an iterative method to estimate k and d as follows: Differentiating ˆPLT j j MSE with

53 hold. Thus, we propose the following shrinkage estimators of k : k ˆAM which is the mean of k j, k ˆGM which is the geometric mean of k j and k ˆMED which is the median of k j. The results of the Monte Carlo simulation show that new proposed methods have better performance than MLE. k ˆAM and k ˆGM have better performances in all situations considered in the simulation. Thus PLT is recommended to the practitioners. REFERENCES [1] Liu, K. (003), Using Liu-type estimator to combat collinearity. Communications in Statistics-Theory and Methods, 3(5), [] Månsson, K. and Shukur, G. (011). A Poisson ridge regression estimator. Economic Modelling, 8(4), [3] Mansson, K., Kibria, B. G., Sjolander, P. and Shukur, G. (01). Improved Liu Estimators for the Poisson Regression Model. International Journal of Statistics and Probability, 1(1), p. [4] Kibria, B. M. G., Månsson, K. and Shukur, G. (014). A Simulation Study of Some Biasing Parameters for the Ridge Type Estimation of Poisson Regression. Communications in Statistics - Simulation and Computation, 44(4), doi: / ABSTRACT A new Liu-type estimator for the Poisson regression model is introduced in this study. This method is a generalization of the Liu-type estimator defined in [1] for the linear model. Maximum likelihood estimator (MLE) is generally used to estimate the parameters in Poisson regression. However, the variance of MLE is inflated when there is multicollinearity. Therefore, we propose a new Poisson Liu-type estimator (PLT) as a remedy to this problem. In order to investigate the performance of PLT and MLE, we design a Monte Carlo simulation. Mean squared error is used to evaluate the estimators. According to simulation results, PLT outperforms MLE. Key Words: Liu-type estimator, Poisson regression, MSE, Monte Carlo simulation. 3 5

54 QUALITY CONTROL CHARTS BASED ON RANKED SET SAMPLING Didem EGEMEN 1, Barış SÜRÜCÜ 1 George Washington University, Department of Statistics, Washington, DC, 005, USA didem@gwu.edu Orta Doğu Teknik Üniversitesi, Department of Statistics, 06800, Ankara, Türkiye sbaris@metu.edu.tr 3. Quality Control Charts There are many techniques to assess the quality of a product. One of these techniques is known to be statistical quality control. Within this concept, quality control charts are pretty popular and are of great use in practice. The method was first developed by Shewhart (1931) to conduct a research at Bell Telephone Laboratories. The aim of the method is to monitor causes and undesirable shifts which lead to process out-of-control and take necessary corrective actions. The most popular control chart is X chart based on simple random sampling (SRS). It is a graphical display technique for a quality characteristic. In this process, rational subgroups of small sizes are used to strengthen the control limits. For a normally distributed random variable, the control limits (upper, central and lower) for X chart are given as 3s UCL x c n CL x 3s LCL x c n 4 4 where x and s are the means of subsample means and subsample standard deviations, respectively; c 4 being a constant to correct the bias for s. For nonnormal distributions, the same approach is still valid and X chart is utilized very extensively. In general, the desired type I error rate and average run length are and approximately 370, respectively. When these values are achieved, the process is said to be under control. However, depending on the underlying distribution, type I error rates and average run lengths may significantly differ from the desired values. That is why one needs to use robust approaches for the estimation of unknown parameters; see Cetinyurek (006) for details. 4. Ranked Set Sampling Ranked set sampling (RSS) is a sampling technique developed by McIntyre (195) to obtain more efficient estimators for unknown parameters of an underlying distribution. In this sampling methodology, a random sample of size n is selected and these sample units are randomly allocated to n samples of size n. In the first step of RSS, each of the n samples is ranked within itself by simply inspecting units visually. In the second step, we only observe the ith order statistic (visually ordered) of the ith sample; see Figure

55 X 1(1) X 1() X 1(3) X 1( n) X 1(1) X (1) X () X (3) X ( n) X () X 3(1) X 3() X 3(3) X 3( n) X 3(3) X n(1) X n() X n(3) X n( n) X n( n) Step1 Step Figure 1: Classical RSS Scheme for a sample of size n. Bu using the sample obtained from the second step, it is possible to write the corresponding likelihood function and obtain the maximum likelihood estimators for the unknown parameters. In this study, we consider some location-scale symmetric families and obtain their estimators by using robust estimation techniques (Egemen, 013). Since the RSS leads to more efficient estimators than SRS, we use robust estimators based on RSS in order to construct quality control chart limits. It should also be mentioned that this approach needs more corrective actions during the construction of the chart limits. We conduct a simulation study to show how much efficiency is gained compared to classical SRS approach. We also give a real life example to explain a practical application of the subject. REFERENCES [1] Cetinyurek, A. (006), Robust Control Charts, ODTÜ, Master Thesis. [] Egemen, D. (013), Quality Control Charts Based on Ranked Set Sampling Under Various Symmetric Distributions, ODTÜ, Master Thesis. [3] McIntyre, G.A. (195), A method for unbiased selective sampling, using ranked sets, Australian Journal of Agricultural Research, 3(4), [4] Shewhart, W.A. (1931), Economic Control of Quality of Manufactured Product, D. Van Nostrand Company Inc. Princeton, New Jersey. 5 5

56 COMPARISON OF THE ROBUST ESTIMATORS OF LOCATION AND SCALE UNDER VARIOUS SITUATIONS VIA SIMULATION Hakan Savaş SAZAK 1*, Hülya YILMAZ 1 Ege University, Faculty of Science, Department of Statistics, 35100, İzmir, Turkey, ssazak@yahoo.com Eskişehir Osmangazi University, Faculty of Medicine, Department of Biostatistics and Medical Informatics, 6480, Eskişehir, Turkey, hulyayilmaz87@yahoo.com 1. Introduction The most well-known estimators of location and scale are the sample mean and the sample standard deviation, respectively. They have the optimal properties under normality but they do not possess robustness which means they lose considerable amount of efficiency in the case of deviations from normality or in the presence of outliers [1-3]. Many robust estimators have been proposed to alleviate this problem. Wilcox [3] gave the definitions and properties of a variety of estimators in detail. In this study, we will compare the performance of the most popular estimators of location and scale through a Monte Carlo simulation study under several situations. In detail, two types of Huber s M estimators (w4 and BS8), the modified maximum likelihood (MML) estimators, and the sample median and the scaled median absolute deviation (MAD), will be compared with the sample mean and the sample standard deviation under the normal and non-normal distributed data sets for various sample sizes. Non-normal conditions are provided with different mixture and outlier models.. Methodology In this study, w4 and BS8 M estimators were used for comparison. Pairs of equations according to w4 and BS8, respectively, are shown below (see Andrews et al. [4] for details) T 0 =median(y i ), S 0 =median ( y i T 0 ) and, z i = (y i T 0 ) ( 1 i n) h S 0. (1) For w4, μ w4 = T 0 + (hs 0 ) tan 1 [ i sin z i ] and i cos z σ w4 = (hs 0 ) [n i where h=.4. () For BS8, μ BS8 = T 0 + (hs 0 ) i ψ(z i ) i ψ (z i ) and σ BS8 = (hs 0 ) [n i ψ (z i ) ]1/ ( i ψ (z i )). (3) i sin(z i ) ]1/ ( i cos(z i )) Here, ψ(z) = { z(1 z ) ; z 1 0 ; z > 1 and ψ (z) = 1 6z i + 5z i 4 where h=8. (4) Assuming long tailed symmetric (LTS) distribution gives the following MML estimators of location and scale for a given value of p (see Tiku and Akkaya [1] for details). μ MML = n i=1 β ix (i) n i=1 β i and n X (i) i=1 β i 1 where B = p n α k i=1 i [X (i) i=1 β i n α i = (1/k)t 3 (i) [1+(1/k)t (i) ] and β i = [1+(1/k)t (i) σ MML = B+ B +4nC n(n 1) ] and C = p β k i=1 i [X (i) i=1 β i n n n i=1 β i ], t (i) = E(z (i) ) where z (i) = x (i) μ X (i) σ ],. (5) In our study we used a calibration technique [5] to estimate p. 5 6 Median (μ ) is one of the widely known robust estimators of the location parameter and Median absolute deviation (MAD) is a simple way to calculate the variation of a data set which is median y i median(y i ). MAD was scaled by dividing it by to make it an unbiased estimator of for normal distribution.

57 3. Conclusion In this study, the performance of various estimators of location and scale are investigated w.r.t the sample mean and the sample standard deviation under standard normal distribution and under the mixture and outlier models of normal distribution with various proportions and extremities of contamination through simulation and it is found that in most of the situations the Huber s M estimators of location are the best. The MML estimator of scale is the best unless the sample size and the extremity of contamination are large where the sample standard deviation should be preferred. REFERENCES [1] Tiku M.L. and Akkaya A.D. (004), Robust Estimation and Hypothesis Testing, New Delhi. [] Huber P.J. (1981), Robust Statistics, Wiley, New York. [3] Wilcox R.R. (005), Introduction to Robust Estimation and Hypothesis Testing, Elsevier Academic Press, Second Edition. [4] Andrews D.F., Bickel P.J., Hampel F.R., Huber P.J., Rogers W.H. and Tukey J.W. (197), Robust Estimates of Location: Survey and Advances, Princeton, NJ: Princeton University Press. [5] Yilmaz H. and Sazak H.S. (014), Double-looped maximum likelihood estimation for the parameters of the generalized gamma distribution, Mathematics and Computers in Simulation, 98, pp ABSTRACT COMPARISON OF THE ROBUST ESTIMATORS OF LOCATION AND SCALE UNDER VARIOUS SITUATIONS VIA SIMULATION In this study we compared the performance of two types of Huber s M estimators (w4 and BS8), the modified maximum likelihood (MML) estimators, and the sample median and the scaled median absolute deviation (MAD) w.r.t. the sample mean and the sample standard deviation via simulation under various situations. Depending on the simulation results, in most of the situations, the Huber s M estimators of location are the best. The MML estimator of scale is the best unless the sample size and the extremity of contamination are large where the sample standard deviation should be preferred. Key Words: Modified Maximum Likelihood; Robustness; M Estimators; Mixture Model; Outlier Model 7 5

58 RISK AVERSION PORTFOLIO OPTIMIZATION PROBLEM VIA THE ROBUST COUNTERPART FORMULA Sibel AÇIK KEMALOĞLU Gültaç EROĞLU İNAN Ayşen APAYDIN Ankara University Faculty of Science Department of Statistics 1. Markowitz Mean-Variance Portfolio Optimization Problem Harry Markowitz s study Portfolio Selection, is the first and important step of Modern Portfolio Theory. He suggested that; investors should decide, between risk and expected return. In the model, risk measured by the variance. of returns. The Markowitz mean variance portfolio optimization problem is defined as two framework, t min X SX t X n i1 X i X i 1 0, i=1,, n (1.1) t max X t X SX n i1 X i X i 1 0, i=1,, n (1.) Returns are denoted as a vector, t R,, 1,, k1 Rkn k m Rki : The weight of i.securities in k.period i=1,...,n k=1,...,m. Where The average vector of returns over in m period is denoted as m m t Rk1 Rkn k1 m k1 m. The corresponding variance n, t 1 and is written as S ij Rki i Rkj j m., k1 m 1 The proportion of total investment funds devoted to this security is denoted n X i 1. i1, are constant, called level degree [3]. 5 8 The another alternative formulation of these model, is risk aversion formulation. The risk aversion formulation of the classical mean-variance optimization problem is defined as,

59 max ' ' X X X ' X l 1, l 1,1,...,1 : risk aversion coefficient [1]..Robust Portfolio Optimization Problem ' In spite of the theoretical success of the mean-variance model,practitioners have shied away from this model. The solution of optimization problems are often very sensitive to perturbations in the parameters of the problem. Since the estimates of the market parameters are subject to statistical errors,the results of the subsequent optimization are not very reliable. Various aspects of this phenomenon have been extensively studied in the literature on portfolio selection. The robust optimization have recently suggested technique in the portfolio selection problems. [1]. The optimal solutions of optimization problems, can be very sensitive to small fluctuations in the problem inputs. Since the real world data are rarely certain, a number of optimization methods have been suggested for treating parameter uncertainty. Robust optimization, is a recently developed technique,are in fact the worst case formulation of the original optimization problem, called robust counterpart of the original problem. The max-min robust counterpart of the risk aversion model is given as,. ' ' max min w ' X X X ' X l 1, l 1,1,...,1 (.1) [1]. REFERENCES [1] Fabozzi et al (007), Robust Portfolio Optimization and Management.John Wiley. [] Goldfarb D., Iyengar G.(003), Robust Portfolio Selection Problems, Mathematics of Operations Research, Vol. 8.No 1, 1-38, U.S.A [3] Markowitz H.M.(195), Portfolio Selection. The Journal of Finance.New York, ABSTRACT RISK AVERSION PORTFOLIO OPTIMIZATION PROBLEM VIA THE ROBUST COUNTERPART FORMULA Markowitz mean-variance model have some difficulties in the practise since real data are uncertain. Robust optimization has recently used to overcome this uncertainty. In this study, we handled the max-min robust counterpart of risk aversion portfolio optimization problem. In the application, we have given a numerical example of the model with real data set. Key Words: mean-variance optimization, risk aversion formulation, robust optimization. 9 5

60 SESSION FİNANS, AKTÜERYA VE RİSK YÖNETİMİ 1 0 6

61 STOKASTİK FAİZ ORANI VE MORTALİTE ETKİSİ ALTINDA HAYAT SİGORTASI PRİM HESAPLAMASI Bükre YILDIRIM *, A. Sevtap SELÇUK-KESTEL, N. Gülden COŞKUN-ERGÖKMEN Orta Doğu Teknik Üniversitesi, Uygulamalı Matematik Enstitüsü, Aktüerya Bilimleri, 06800, Ankara, TÜRKİYE * bukre@metu.edu.tr, skestel@metu.edu.tr Hazine Müsteşarlığı, Kamu Sermayeli Kuruluş ve İşletmeler Genel Müdürlüğü,06510, Ankara, TÜRKİYE gulden.coskun@hazine.gov.tr 1. Giriş Sigorta şirketlerinde risk yönetimi etkinliğinin en önemli unsurlarından olan risk priminin doğru belirlenmesi oldukça önemlidir. Hayat sigortası primi hesaplanırken dikkate alınan temel faktörler faiz oranı ve mortalitedir. Bu faktörler zamana ve içinde bulunulan ekonomik göstergelere göre rassallık göstermektedir. Parametrelerin modellenmesinde son zamanlarda kullanılan en yaygın modeller Lee-Carter ve zaman serisi modelleridir. Bu çalışmanın amacı faiz oranı ve mortalite için stokastik modeller kullanılarak, rassallığın hayat sigortası net tek primi üzerindeki etkisinin incelenmesidir.. Lee-Carter Mortalite Modeli Mortalite hızlarında 0. yüzyıldan itibaren önemli düşüşler gözlemlenmektedir. Süregelen bu düşüş prim hesaplamalarında genellikle dikkate alınmamaktadır. Değişimin aktüeryal hesaplamalara katılabilmesi için Lee- Carter mortalite modeli kullanılan en yaygın modellerden biridir ve aşağıdaki şekilde ifade edilir [1]; ln m x,t = a x + b x k t + e x,t (1) Burada; m x,t merkezi ölüm hızını, a x yaşa göre ölümlülüğü, b x yaşa bağlı ölümlülük değişim hızını, k t t yılı mortalite seviyesini, e x,t ise x yaş ve t yılı için artığı ifade etmektedir. Ayrıca ε, ortalaması 0 varyansı σ olan normal dağılıma sahiptir. Lee-Carter mortalite modeli ile bu çalışmada yılları A.B.D hayat tablosu verileri kullanılarak model parametreleri elde edilmiş ve 030 yılına kadar mortalite projeksiyonu yapılmıştır. 3. Stokastik Faiz Oranı Deterministik faiz oranı yaklaşımının özellikle Türkiye gibi sıklıkla geniş kapsamlı ekonomik değişikliklere maruz kalan ülkeler için uygulanması gerçekçi olmamaktadır. Bu nedenle yılları arasında 6-ay vadeli hazine bonosu ve devlet tahvili faiz oranları enflasyon etkisi de dikkate alınarak aylık olarak ARMA(1,1) zaman serisi modeli kullanılarak aşağıdaki şekilde modellenmiş ve bu modele dayanılarak parametre tahminleri yapılmıştır []; y t = ln(1 + i t ) () y t = δ + φ 1 (y t 1 δ) + β 1 ε t 1 + ε t (3) Altı aylık faiz oranı i t olmak üzere δ uzun dönem ortalamayı, φ 1 AR(1) katsayısını, β 1 MA(1) katsayısını, ε t ise hata terimini göstermektedir. Elde edilen bulgulara göre modelin geçerliliği ACF, PACF ve test istatistikleri yardımıyla incelenmiştir. 4. Hayat Sigortası Prim Değeri Mortalite ve faiz modelleri daha sonra hayat sigortası net tek prim hesaplarına entegre edilerek iskonto faktörü, V n, ve prim beklenen değeri, E(V n ) e, ait çıkarımlar yapılmıştır [3]. Buna göre; nδ (φ 1 + β 1 )ε 0 ( 1 φ 1 n ) ε 1 φ n 1 V n = exp ( n j 1 n 1 t j=1 ε j [1 + (φ 1 + β 1 ) t=0 φ6 1 ] (φ 1 + β 1 ) 1 ( 1 φ 1 n E(V n ) = e nδ M( 1) M[ (1 + (φ 1 + β 1 ) φ 1 t 1 φ 1 ) j=1 φ 1 j ε j ) (4) n 1 n j 1 j=1 t=0 )] (5)

62 Prim beklen değeri, ε un moment çıkaran fonksiyonu M(t) ve ARIMA(p,d,q) fonksiyonu olarak bulunmuştr. parametrelerinin Lee-Carter modeli tahminlerine göre elde edilen p x ve q x+k değerleri kullanılarak Eşitlik 6 da gösterildiği şekilde yaş bazında net prim hesaplaması yapılmıştır. A x = E[ k=0 V nk p x q x+k ] (6) Sonuç olarak elde edilen bulgulara göre stokastik faiz oranı ve mortalitedeki değişimin hayat sigortası net tek primi ve varyansı üzerindeki etkisinin çıkarımı yapılmıştır. KAYNAKLAR [1] Lee, Ronald D., and Lawrence R. Carter. "Modeling and forecasting US mortality." Journal of the American statistical association (199): [] Dhaene, Jan. "Stochastic interest rates and autoregressive integrated moving average processes." ASTIN bulletin 19.S1 (1989): [3] Ergökmen, N. Gülden. "Stochastic modeling of random interest rates in life insurance. " Middle East Technical University, Unpublished Master Thesis, August 001. ABSTRACT NET PREMIUM VALUATION UNDER STOCHASTIC INTEREST AND MORTALITY RATE In this study, we investigate the effect of stochastic interest rate and mortality on the actuarial present value and life insurance premium. ARMA(1,1) time series model for interest rates and Lee-Carter mortality model for mortality rates are utilized. The valuation of the parameters that effects the life insurance are performed. Keywords: Random Interest Rate, ARMA(1,1), Lee-Carter, Actuarial Present Value. 6

63 ÜSTEL-WEİBULL-PARETO BİLEŞİK DAĞILIMI Yasemin GENÇTÜRK Canan HAMURKAROĞLU Ayten YİĞİTER Hacettepe Üniversitesi Fen Fakültesi Aktüerya Bilimleri Bölümü Karabük Üniversitesi İşletme Fakültesi Aktüerya ve Risk Yönetimi Bölümü Hacettepe Üniversitesi Fen Fakültesi İstatistik Bölümü 1. Giriş Sigorta şirketleri prim hesabını yapabilmek, yükümlülüklerini karşılayabilmek için ayırması gereken rezervi belirleyebilmek ve iflas olasılığını hesaplayabilmek gibi konularda hasar tutarlarının dağılımına ihtiyaç duyarlar. Sigortacılıkta hasar tutarı verisi genellikle sağa çarpık ve uzun kuyruklu dağılıma sahiptir. Üstel, Gamma, Lognormal, Pareto ve Weibull gibi bilinen parametrik modellerin hem düşük hem de yüksek tutarlı hasarların yer aldığı veri kümesine yeterince iyi uyum sağlamadığı görülmüştür. Bu nedenle literatürde belirlenen bir eşik değerine kadar olan hasarların bir dağılıma, eşik değeri aşan hasarların ise başka bir dağılıma sahip olduğu düşünülerek yeni dağılımlar elde edilmiştir. Cooray ve Ananda (005), Danimarka yangın hasar verisini Lognormal-Pareto bileşik dağılımını kullanarak modellemişlerdir. Ciumara (006) hasar verisinin modellenmesinde Weibull-Pareto bileşik dağılımının önermesinin ardından, Preda ve Ciumara (006) Lognormal-Pareto ve Weibull-Pareto dağılımlarını karşılaştırmışlardır. Üstel dağılımın basit ve kullanışlı özellikleri nedeniyle Vernic ve Teodorescu (006) Üstel-Pareto bileşik dağılımını ele almış, 009 yılında ise farklı ağırlıklarla Üstel-Pareto bileşik dağılımı elde etmişlerdir. Scollnik (007), Cooray ve Ananda (005) da olduğu gibi her bir dağılıma eşit ağırlık vermek yerine farklı ağırlık vererek Lognormal-Pareto bileşik dağılımını yeniden elde ederek modelleri karşılaştırmışlardır. Vernic, Teodorescu ve Pelican (009) Lognormal-Lognormal bileşik dağılımının temel özellikleri ele alınmıştır. Nadarajah ve Bakar (014) Lognormal-Burr bileşik dağılımını elde ederek, dağılımın Danimarka yangın hasar verisine uyumu incelenmiştir. Bakar, Hamzah, Maghsoudi ve Nadarajah (015) Weibull dağılımına dayalı farklı bileşik dağılımlar elde etmişlerdir. Bu çalışmada hasar tutarları düşük, orta ve yüksek şiddetli olmak üzere üç gruba ayrılarak, Üstel, Weibull ve Pareto dağılımlarının birleşiminden oluşan yeni bir model önerilmiştir. Önerilen modelin temel özellikleri incelenmiştir. KAYNAKLAR [1] Cooray K. and Ananda M.M.A (005), Modeling Actuarial Data with a Composite Lognormal-Pareto Model, Scandinavian Actuarial Journal, Vol. 5, [] Preda V. and Ciumara R. (006), On Composite Models: Weibull-Pareto and Lognormal-Pareto. A Comparative Study, Institute of Economic Forecasting, Vol., [3] Scollnik (007), On Composite Lognormal-Pareto Models, Scandinavian Actuarial Journal, Vol.1, [4] Teodorescu S. And Vernic R. (009), Some Composite Exponential-Pareto Models for Actuarial Prediction, Romanian Journal of Economic Forecasting, Vol.4, [5] Abu Bakar, S.A., Hamzah, N.A., et all. (015), Modeling Loss Data Using Composite Models, Insurance: Mathematics and Economics, Vol.61, COMPOSITE EXPONENTIAL-WEIBULL-PARETO DISTRIBUTION It is important for an insurance company to predict the future claims in order to evaluate premiums, to determine the reserve necessary to meet its obligation and probabilities of ruin, etc. As claim data is highly positively skewed and has heavy tail, no standard parametric model seems to provide an acceptable fit to both small and large losses. Composite models that use one standard distribution up to a threshold and another standard distribution thereafter are developed and it is seen that these composite models provide better fit than the standard models. 6 In this study, we considered claims as low, middle 3 and high. We use the Exponential distribution up to a lower threshold, the Weibull distribution thereafter until a high threshold and the Pareto distribution thereafter. The basic properties of this new Exponential-Weibull-Pareto composite model are provided. Key Words: Exponential distribution, Weibull distribution, Pareto distribution, Composite models.

64 Ar-Ge Harcamaları Ve Ekonomik Büyüme Arasındaki İlişkinin Araştırılması: Türkiye İçin Bir Uygulama Özer ÖZAYDIN 1 Fatih ÇEMREK Hakkı POLAT 3 1 Yrd.Doç. Dr.Eskişehir Osmangazi Üniversitesi İstatistik Bölümü Table 1. Yrd.Doç. Dr.Eskişehir Osmangazi Üniversitesi İstatistik Bölümü 3 Doktora Öğrencisi Eskişehir Osmangazi Üniversitesi İstatistik Bölümü Table. 1 oozaaydın@ogu.edu.tr fcemrek@ogu.edu.tr 3 hakkiplt@gmail.com Ar-Ge Harcamaları Ve Ekonomik Büyüme Arasındaki İlişkinin Araştırılması: Türkiye İçin Bir Uygulama Bir ülkenin teknoloji seviyesi o ülkenin gelişmişlik düzeyi hakkında bilgi verir. Bu sebeple AR-GE bir ülkenin teknoloji yeteneğini tanımlayan en önemli değişkenlerden biridir. Bu çalışmanın amacı AR-GE yatırım harcamalarının ekonomik büyümeye olan etkisini incelemektir. Böylece ekonomik kalkınmayı hedefleyen bir ülke, teknoloji seviyesini arttırmak için AR-GE ye ne derece önem vermesi gerektiği düşünülmüştür. Çalışmada AR-GE harcamaları (milyon dolar) 1 ve ekonomik büyümeye ilişkin olarak Gayri Safi Yurt İçi Hasıla (GSYİH) verileri dönemini kapsayan analizlerde ADF, PP birim kök testleri ve nedensellik testleri kullanılmıştır. AR-GE ve ekonomik büyüme rakamlarından derlenen veri setinin eşbütünleşme analizi ile analiz edilmesi sonucunda, uzun dönemde AR-GE yatırım harcamalarıyla ekonomik büyüme arasında çift yönlü bir ilişki tespit edilmiştir. Ekonomik büyüme teorileri Frank Ramsey in 198 yılında yaptığı A Mathematical Theory of Saving isimli çalışmasıyla başlamış; ekonomide yaşanan değişimlerle birlikte zamanla birçok büyüme teorisi ortaya atılmıştır. Ramsey in çalışmasını Harrod ve Domar tarafından ortaya atılan Harrod-Domar modeli izlemiş; 1950 li yıllarda ise Solow (1956) ve Swan (1956) tarafından geliştirilen büyüme modeliyle bu alana yeni katkılar yapılmıştır. Solow ve Swan çalışmaları ile ortaya atılan Solow-Swan büyüme ya da Neoklasik büyüme modelleri olarak adlandırılan toeriler, üretim fonksiyonun ölçeğe göre azalan getiriye sahip ve teknolojinin dışsal bir değişken olduğundan hareketle, büyümenin nihayetinde durağan bir seyir izleyeceğini ileri sürmüşlerdir. Büyüme sürecinin anlaşılmasında oldukça önemli bir rol oynayan ancak yetersiz kalan Neoklasik büyüme modeli 1980 li yılların sonlarında yerini içsel büyüme teorisine bırakmıştır. İçsel büyüme modelleri ise ölçeğe göre artan getirileri ve teknolojinin içsel bir değişken olduğunu vurgulayıp, durağan durum büyüme oranının üzerinde bir büyümenin gerçekleşebileceğini ileri sürerek literatürde son dönemlerde yerini almıştır. Teknolojinin dışsal olduğunu reddeden ve teknolojiyi AR-GE ve beşeri sermaye kanalıyla içselleştiren içsel büyüme teorileri Romer (1990), Grossman and Helpman (1990), AR-GE Modeli, Romer (1986) Bilgi Yayılmaları Modeli, Lucas (1988) Beşeri Sermaye modeli ve Barro (1990) Kamu Politikası Modeli olarak kendini göstermiştir. AR-GE ye dayalı içsel büyüme modellerinde büyümenin motoru AR-GE olarak kabul edilmiş; böylece AR-GE harcamaları içsel büyüme modellerinde yerini alarak özellikle son yıllarda hem özel sektörün, hem de kamu sektörünün üzerinde önemle durduğu yeni bir boyut kazanmıştır. Kazandığı bu yeni boyutla AR-GE harcamalarının inovasyon, verimlilik ve özellikle de ekonomik büyüme üzerinde önemli bir rol oynadığı yönünde geniş bir literatür oluşmuştur. AR-GE faaliyetleri, ekonomik büyümenin önemli kaynağı olduğundan günümüz dünyasında AR-GE harcamaları ile büyüme arasında güçlü bir ilişkinin olması kaçınılmazdır. Ancak AR-GE harcamaları ve büyüme ilişkisinin yönü de önemlidir. Literatürde yapılan çalışmalar (OECD ülkeleri merkezli) AR-GE harcamalarından büyümeye doğru bir nedensellik ilişkisini göstermiştir. Yani bir ülkenin araştırma ve geliştirme faaliyetlerine yaptığı harcamalar ekonomik büyümeye neden olmaktadır. Bu bağlamda Türkiye nin AR-GE faaliyetleri ile 6 ekonomik büyümeye arasındaki nedensellik ilişkisini kurmak 4 ve Türkiye nin AR-GE faaliyetlerinin büyümeye ne kadar katkı sağladığını araştırmak bu çalışmanın temel amacı olmaktadır. 1 Veriler OECD resmi istatistik veri tabanından alınmıştır Veriler Dünya Bankası resmi istatistik veri tabanından alınmıştır

65 Şekil yılları arası Türkiye de yapılan tüm araştırma geliştirme faaliyetlerinin harcamalarını milyon dolar cinsinden göstermektedir. Veriler OECD nin resmi istatistik veri tabanından elde edilmiştir Şekil Yılları Arası Türkiye'de ki AR&GE Harcamaları (Milyon Dolar) Grafik incelendiğinde özellikle 000 li yıllardan sonra ar&ge harcamalarındaki trend artış hızının daha da fazlalaştığı görülecektir. KAYNAKLAR (1) [1] Barro, R. J. (1990). The stock market and investment. Review of Financial Studies, 3(1), [] Grossman, G. M., & Helpman, E. (1990). Trade, innovation, and growth. The American economic review, [3] Harrod, R. F An Essay on Dynamic Theory. Economic Journal 49 (March):14-33 [4] Lucas, R. E. (1988). On the mechanics of economic development. Journal of monetary economics, (1), 3-4. Ramsey, F. P. (198). A mathematical theory of saving. The economic journal, [5] Romer, P. M. (1986). Increasing returns and long-run growth. The journal of political economy, [6] Romer, P. M. (1990). Human capital and growth: theory and evidence. InCarnegie-Rochester Conference Series on Public Policy (Vol. 3, pp ). North-Holland. [7] Solow, R. M. (1956). A contribution to the theory of economic growth. The quarterly journal of economics, [8] Swan, T. (1956). Economic growth and capital accumulation. THE RESEARCH OF RELATIONSHIP BETWEEN R&D EXPENDITURE AND ECONOMIC GROWTH; AN AMPRICAL APPLICATION FOR TÜRKIYE () The country's development level of a country that gives information about the level of technology. For this reason, R & D is one of the most important variables that define the ability of a country's technology. The aim of this study was to investigate the effects of economic growth in R & D investment expenditures. Thus, a country aspiring to economic development, technology R & D to increase the level considered necessary to give importance to what degree. In this study, for the period, fort he R & D and economic growth variables, ADF, PP unit root tests and causality tests were used. In the results of study, for the series of R & D and economic growth, in the long term, two direction relationship between investment in R & D spending and economic growth have been identified 6 5 Keywords: R & D spending, economic growth, unit root tests, Granger Causality Test.

66 ÜSTEL-UYARLANMIŞ KESİKLİ LİNDLEY DAĞILIMI Mehmet YILMAZ 1, Monireh HAMELDARBANDI 1, Ankara Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Ankara, Türkiye 1 scimehmet@gmail.com, monir6685@gmail.com ve Tübitak 15 bursiyeri 1. Üstel-Uyarlanmış Kesikli Lindley Dağılımı ve Özellikleri Bu çalışmada, parçaların yaşam zamanları 1 ortalamalı üstel olan rasgele M sayıda parçaların seri olarak β bağlandığı sistemin yaşam ömrünün dağılım özellikleri ve parametre tahmin yöntemleri incelenmiştir. Burada M, kesikli Lindley dağılımının parametresinde dönüşüm yapılarak elde edilen ve sıfır değerinden budanmış olan uyarlanmış Lindley dağılımına sahiptir. Tanım 1. Uyarlanmış kesikli Lindley dağılımı aşağıdaki şekilde tanımlanmıştır: Π(m) = P(M = m M > 0) = θ (1 + θ)(1 + θ) (1 θ)m (m + ), (1) Tanım. X = min(x 1, X,, X M ) olsun ve X i ler üstel dağılımından alınsın, burada M rasgele değişkeni de kesikli uyarlanmış Lindley dağılımına sahiptir, şimdi M = m verilmişken X in koşullu olasılık yoğunluk fonsiyonu aşağıdaki gibidir: g(x m) = mβe mβx, x > 0, β > 0, () (1) ve () eşitliğinden X in marjinal olasılık yoğunluk fonksiyonu aşağıdaki gibidir: g(x) = θ (1 + (1 θ)e βx ) 1 + θ [βe βx (1 (1 θ)e βx ) 3 + βe βx (1 (1 θ)e βx ) ], (3) Üstel-Uyarlanmış Kesikli Lindley (ÜUKL) Dağılımının ve Parametreleri için Tahminleri.1. Momentler yöntemi: n m 1 = 1 n X θ i = E(X) = (1 θ θ ln(θ)), (4) β(1 θ)(1 + θ) i=1 n m = 1 n X i = E(X θ ) = β ( ln(θ) + (1 θ)(1 + θ) i=1 k=1 (1 θ)k ), (5) k Lineer olmayan denklem sisteminin çözülmesi ile elde edilir. Fakat burada sonsuz toplam serisi olduğu için yazılımda işlem hızı bakımından (5) ifadesindeki I toplamı için alt ve üst sınırlar bulunarak θ ve β parametreleri için yapay momentler tahmini elde edilmiştir.. En çok olabilirlik yöntemi: (X 1, X,, X n, M) gibi tam gözlemli veri seti göz önünde bulundurularak EM algoritması uygulanmış ve θ ve β için iteratif tahminler elde edilmiştir. 6 6 n θ (1) = n( i=1 A(x i;θ (0),β (0) ) 1+n( n i=1 A(x i ;θ (0),β (0) )) 1, β (1) n = n( i=1 x i A(x i ; θ (0), β (0) ) ) 1 ) 1

67 burada A(x i ; θ (0), β (0) ) = (1+θ(0) )(1 θ (0) ) (r (0) ) +4r (0) +3 ve (1+θ (0) ) (3 r (0) )(1 r (0) ) r(0) = (1 θ (0) )e β(0) x i dir. KAYNAKLAR [1] Adamidis K. and Loukas S. (1998), A lifetime distribution with decreasing failure rate, Statistics Probability Letters, 39, [] Adamidis K., Dimitrakopoulou Th. and Sotirios L. (005), On an extension of the exponential-geometric distribution, Statistics Probability Letters, 73, [3] Ghitany M.E., Al-Mutairi D.K. and Nadarajah S. (007), Zero-truncated poisson-lindley distribution and its application, Journal of Mathematics and Computer Science Research, 79, [4] M. Ristic, M. and Balakrishnan N., (01), The gamma-exponentiated exponential distribution, Journal of Statistical Computation and Simulation, Vol. 8, No. 8, [5] Shanker R. and Mishra A., (013), A quasi Lindley distribution, African Journal of Mathematics and Computer Science Research, Vol. 6(4), pp ABSTRACT EXPONENTIAL-MODIFIED DISCRETE LINDLEY DISTRIBUTION In this study, we consider a series system composed of stochastically independent M-component where M is a random variable having the zero truncated modified discrete Lindley distribution. This distribution is newly introduced by transforming on original parameter. We examine the properties of the distribution of the lifetime of above system under the given circumstances and also parameters of this new lifetime distribution are estimated by using moments and EMalgorithm. Key Words: Modified Discrete Lindley Distribution, Exponential-Modified Discrete Lindley Distribution, Moments Method, Maximum likelihood estimation method, EM-Algorithm. 7 6

68 SESSION BULANIK TEORİ 1 8 6

69 AĞIRLIKLI BULANIK DESTEK VEKTÖR SINIFLANDIRMASI Furkan BAŞER 1, Ayşen APAYDIN 1 Gazi Üniversitesi, İktisadi ve İdari Bilimler Fakültesi, Uluslararası Ticaret Bölümü Beşevler, Ankara furkan.baser@gmail.com Ankara Üniversitesi, Fen Fakültesi, İstatistik Bölümü Tandoğan, Ankara apaydin@science.ankara.edu.tr 1. Giriş İstatistiksel öğrenme teorisinin Vapnik [1] tarafından ortaya atıldığı 1960 lardan bu yana, örüntü tanıma, sınıflandırma ve regresyon gibi birçok problemin çözümlenmesi için iyi makine öğrenmesi tekniğinin geliştirilmesi önemli bir araştırma alanı haline gelmiştir. Destek vektör makineleri (DVM) de fonksiyon tahmini ve sınıflandırma problemlerinin çözümü için önerilmiş olan bir istatistiksel öğrenme algoritmasıdır []. DVM, sınırlı sayıda öğrenme örüntüsü üzerinden iyi bir genelleme düzeyi sunması nedeniyle oldukça geniş uygulama alanına sahiptir [3, 4]. Mevcut bilginin belirsiz ya da bulanık olduğu bazı sistemlerin modellenmesinde, sistemin bir bulanık yapısı mutlaka göz önüne alınmalı ve çözümlenmelidir [5]. Bu yapılar, parametreleri, girdi veya çıktı değişkenleri bulanık kümelerle tanımlı bir bulanık fonksiyon ile temsil edilirler. Bu çalışmada, ağırlıklı bulanık destek vektör sınıflandırması olarak adlandırılan yeni bir bulanık sınıflandırma yöntemi önerilmiştir. Ele alınan sınıflandırma modelinde, sabit (yan) terim ve eğitim örneklerinde girdi çıktı değerleri, asimetrik (simetrik) üçgensel bulanık sayılar olarak tanımlanmıştır. Önerilen ağırlıklı bulanık destek vektör algoritmasına göre parametre tahminleri, DVM nin temelini oluşturan düşünceler kullanılarak gerçekleştirilmiştir. Önerilen yöntemin bir özelliği de oluşturulan karesel programlama problemine ilişkin bulanık işlemlerde, ağırlıklı bulanık aritmetikten faydalanılmasıdır.. Yöntem X ij = (m Xij, l Xij, r Xij ), i = 1,,, n; j = 1,,, d asimetrik üçgensel bulanık sayısı için X i = [X i1 X i X id ] T T(R) d bulanık girdi vektörü göz önüne alınsın. Burada T(R) d ile asimetrik üçgensel bulanık sayıların d boyutlu vektörlerinin bir kümesi gösterilmektedir. Ayrıca gözlenen bulanık girdilerden yararlanarak merkez için m Xi = [m Xi1 m Xi m Xid ] T, sol genişlik için l Xi = [l Xi1 l Xi l Xid ] T ve sağ genişlik için r Xi = [r Xi1 r Xi r Xid ] T vektörleri oluşturulsun. Sınıflandırma problemlerinde, y {+1, 1} olmak üzere (X i, y i ), i = 1,, n bulanık eğitim örneklerinin bir kümesi için hiperdüzlem karar fonksiyonu, D(X i) = w, X i + B, w R d, B T(R) (1) biçiminde tanımlanır. Başarılı bir eğitim süreci sonunda, w ve B katsayı tahminleri kullanılarak, yeni gözlenen X örüntüleri için sign [val (D(X ))] işaret fonksiyonuna göre çıktı üretilir. Burada w = [w 1 w w d ] T kesin (crisp) regresyon katsayıları ve B = (m B, l B, r B ) asimetrik üçgensel bulanık sayı olarak tanımlanan sabit terimdir. Özel bir değerleme yönteminin kullanımına dayanan ağırlıklı bulanık aritmetik, bulanık küme işlem sonuçlarını, kesin reel sayılara dönüştürmek üzere durulaştırma (defuzzification) yaklaşımından yararlanır. val (D(X )) ile tanımlanan kesin sayı işlem sonuçları, bulanık aritmetik işlemlerinin ortalama değeri şeklinde yorumlanabilir. 6 9 Optimum ayırma hiperdüzleminin bulunması, doğrusal kısıtlar ile tanımlı bir karesel optimizasyon problemidir. (X i, y i ), i = 1,, n; X i T(R) d eğitim verisi mevcut olmak üzere önerilen yönteme göre programlama problemi,

70 Amaç fonksiyonu: min w R d,ξ R n,b T(R) [1 w + C n n i=1 ξ i] Kısıtlar: () y i val( w, x i + b) 1 ξ i, i = 1,, n biçiminde oluşturulur. Bu modelde kullanıcı tarafından belirlenmesi gereken C katsayısı, hiperdüzlem karar fonksiyonunun karmaşıklığı ile deneysel risk arasındaki arasındaki değişimi kontrol eder. () ile verilen optimizasyon problemi, yüksek boyutlu girdi uzayları için çözümlenecekse dual formuna dönüştürülmesine ihtiyaç duyulur []. KAYNAKLAR [1] Vapnik, V. and Chervonenkis, A. (1971). On the uniform convergence of relative frequencies of events to their probabilities, Theory of Probability and its Applications, 16, [] Vapnik, V. (1995). The Nature of Statistical Learning Theory, Springer, Newyork. [3] Cherkassky, V. and Mulier, F. (007), Learning From Data: Concepts, Theory, and Methods, New Jersey, John Wiley & Sons. [4] Vapnik, V. (1998). Statistical Learning Theory, John Wiley & Sons, Newyork. [5] Baser, F. and Apaydin, A. (015). Hybrid fuzzy support vector regression analysis, Journal of Intelligent & Fuzzy Systems, 8 (5), ABSTRACT WEIGHTED FUZZY SUPPORT VECTOR CLASSIFICATION Support vector machines (SVM) was originally developed to solve pattern recognition and regression function estimation problems for crisp data. However, in many system modeling applications, the observed input data cannot be measured precisely, so it becomes meaningful to utilize fuzzy theory. In this paper, we propose a new fuzzy support vector machine algorithm for solving two-class problems. Proposed method is complete and meaningful, and could generalize the traditional non-fuzzy SVM to a fuzzy one. Key Words: Classification, support vector machines, weighted fuzzy arithmetic. 0 7

71 ANFIS YÖNTEMİ İLE HAVA SICAKLIK TAHMİNİNİN MODELLENMESİ Cemil ÇELİK* Kasım BAYNAL* *Kocaeli Üniversitesi/Mühendislik Fakültesi, Endüstri Mühendisliği Bölümü, 41380, Kocaeli, TÜRKİYE, Hava sıcaklık tahmini karar destek yöntemlerinden biridir. Özellikle sıcaklığın doğruya yakın tahmin edilmesi başta tarım, hayvancılık, turizm ve birçok sektörün önünü görebilmesi açısından son derece önemlidir. Bu sayede birçok sektör stratejilerini bu tahmine göre belirleyebilirler. Stratejilerini ve amaçlarını uygun belirleyen sektördeki işletmeler pazardaki diğer rakiplerine üstünlük sağlayabilirler. Bu çalışmada sıcaklık tahmin modelinin ilk bölümünde; sıcaklık tahmin modeli için literatür araştırması yapılmış ve sıcaklığı etkileyen en önemli sekiz parametre belirlenmiştir. Bu parametreler hava basıcı, su buhar basıncı, bağıl nem, rüzgâr hızı, yükseklik, bitki örtüsü, kara ve denizlerin dağılımı ve bakı olarak belirlenmiştir. Bu kriterler uzman görüşleri doğrultusunda çok kriterli karar verme yöntemlerinden AHP ve kriterlerin birbirleri ile olan ilişkilerin önemini belirlemede yardımcı olan DEMATEL yöntemleri kullanılarak sıcaklığa etki eden sekiz ana kriterlerin etkinlik sıralaması belirlenmiş ve sıcaklığa en çok etki eden dört kritere düşürülmüştür. Tablo 1. AHP ve DEMATEL yöntemleri ile kriterlerin belirlenmesi AHP-W DEMATEL-W 1. Hava Basıncı 0,31 1. Su Buhar Basıncı. Su Buhar Basıncı 0,5. Rüzgâr Hızı 3. Bağıl Nem 0,16 3. Bağıl Nem 4. Rüzgâr Hızı 0,08 4. Hava Basıncı,143,143,14, Sıcaklığa etki eden sekiz ana kritere iki farklı yöntem uygulanarak Tablo 1 de etkin dört kriter ve ağırlıkları belirlenmiştir. AHP yöntemi ile dört etkin kriterin ağırlıkları toplandığında % 80 lik bir gücünün olduğu görülmüştür. DEMATEL yönteminde ise bu ağırlıkların gücünün % 57 olduğu görülmüştür. Bu sonuçlar tahmin değerinin % 80 ile AHP ve %57 ile DEMATEL ile açıklanabilirliğini göstermektedir. Sıcaklık tahmin modelinin ikinci bölümü; dört aşamalı bir çalışmadan oluşmuştur. İlk aşamada ANFIS girdi seçimi ile çıktıyı en çok etkileyen girdilerin seçimi gerçekleştirilmiş ve en önemli üç girdiye indirilerek eğitim yaptırılmıştır. İkinci aşamada seçilen dört girdi normalize edilerek sistemde eğitime tabi tutulmuştur. Üçüncü aşamada dört girdi ve Sub.Clustering yöntemi ile de eğitime tabi tutulmuştur. Bu eğitimler sonucunda en az hataya sahip üyelik fonksiyonu seçilmiştir. Tablo dikkate alındığında en düşük eğitim hata değerinin başlangıç veri setinin kullanıldığında elde edildiği görülmüştür. Başlangıç eğitim setinde her bir girdiye ait beş üyelik fonksiyonunu verilmesi ile trimf (Üçgen üyelik fonksiyonu) üyelik fonksiyonun sıcaklık tahmininde en iyi üyelik fonksiyonu olduğu belirlenmiştir. Dördüncü aşamada uygun üyelik fonksiyonunu ve adedi belirlenerek ANFIS modeli kurulmuştur. Kurulan modelin etkinliğini gösterme adına Kocaeli ili için farklı veri seti kullanarak hata kareleri ortalamasının karekökü ve mutlak hata yüzdeleri ortalaması hesaplanmıştır. Çalışmada %75 eğitim ve %5 test verileri (hiç görmediği) ile oluşturulan modelin hiç görmediği veriler ile de test edip MAPE değeri hesaplandığında modelin %93,5 doğrulukta bir tahmin gerçekleştirdiği görülmüştür. Bu oran Cho nun sınıflandırmasına göre çok iyi olarak tespit edilmiştir. Bu oran Tablo 3 de yapılmış diğer çalışmalar ile karşılaştırıldığında tutarlı ve etkin olduğu tespit edilmiştir. Ulaşılan sonuçlar diğer çalışmalara göre ANFIS modelinin çok daha tutarlı olduğu ve eldeki girdi-çıktı setine uygun bir yapı sunduğu sonucuna varılmıştır. Bu çalışmada; ANFIS ile sıcaklık tahmininin modellemesinde AHP ve DEMATEL tabanlı bir yaklaşım sunulmuştur. 7 1

72 Tablo. Farklı Eğitim biçimlerinde hata değerleri Çev Eğitim Biçimi rim Sayısı Üyelik Fonksiyon/Kısıt 3 Kriterli Eğitim 40 trimf Normalizasyon Eğitim 40 gbellmf Başlangıç Veri Eğitim 40 trimf Başlangıç Veri Sub Clustering Eğitim 80 RI=0,5 SF=1,5 AR=0,5 RR=0,15 Hata Değeri 0, , , , Tablo 3. Sıcaklık tahmin sonuçları AD Y IL Parkaj Kumar 01 Mehmet Tektaş Nafiz Berber/Aslı Boru TEST SONUCU %91,63 DOĞRU Training; MAE:1,5 ve RMSE:1,63 Testing; MAE: 1,3 ve RMSE: 1,71 %89 DOĞRU KAYNAKLAR [1] Cho V., A Comparison of Three Different Approaches to Tourist Arrival Forecasting, Tourism Managment, 003, 4(3), [] Saaty T.L., (1990), How to make a decision: the analytic hierarchy process, European Journal of Operational Research, 48, p.9-6. [3] Shieh J. I., Wu, H. H., Huang, K. K. (010). A dematel metot in identifying key success factors of hospital service quality., Knowledge-Based Systems, 3(3), [4] Hocaoglu, F., Oysal, Y., Kurban, M., Missing wind data forecasting with adaptive neuro fuzzy inference system, Neural Computation & Application 18: 07-1 (009). THE MODELING OF WEATHER TEMPERATURE FORECAST WITH ANFIS In this study, the first part of the temperature forecasting models; literature searching is made and eight active criterion is determined. These criteria are reduced to the most efficient four criteria according to expert opinion with applying of AHP and DEMATEL methods. The second part of the temperature forecasting models; it consists of a four-stage operation. In the first stage the choice of input has been performed most affecting output with choosing inputs of ANFIS and it was built training the three most important input to reduced. In the second stage the selected four entries is normalized and it has been trained on the system. The third stage four entries have been trained. As a result of this training membership function of having at least one error is selected. In the fourth stage ANFIS model is established with determining the appropriate membership functions and number of membership functions. RMSE and MAPE is calculated to show the effectiveness of the established model also using the different data set. Reached results show that more consistently of ANFIS model according to other studies and it concluded has been reached offered by a structure according to available input output set. In this study, AHP and DEMATEL based approach is presented in the temperature forecasting modeling with ANFIS. Keywords: AHP, ANFIS, DEMATEL, Temperature Forecasting. 7

73 BULANIK AĞIRLIKLI ORTALAMA YÖNTEMİ İLE TEDARİKÇİ SEÇİMİNDE KANAAT UZAYI DEĞERLENDİRMESİ M. Bahar BAŞKIR Bartın Üniversitesi Fen Fakültesi İstatistik Bölümü Merkez-Bartın 1. Bulanık Ağırlıklı Ortalama ile Tedarikçi Seçim Memnuniyeti 1.1. Kanaat Uzayı Temelli Tedarikçi Seçim Memnuniyeti Müşteri-İşletme-Tedarikçi (M-İ-T) nin karar verme sürecindeki davranışları memnuniyetin belirlenmesinde önemlidir. Prasad [1], ürün/servis süreçlerinde karar vericilerin kanaatini göz önüne alan kuramsal model diyagramından bahsetmektedir. Kuramsal karar modellerindeki Kanaat uzayının karar verme süreçlerinde önemli bir etkisi bulunmaktadır. Bu çalışmada, tedarikçi seçimi kapsamında karar vericilerin her bir tedarikçi karakteristiğinin müşteri beklentilerini sağlaması konusundaki deneyim bilgisine (DB) ve güvenine (G) dayalı ortak kanaati (K) (1) de verilen eşitlik ile elde edilmektedir: Gij DBij Gij DBij p p Gij DBij Gij DBij Gij DBij Gij DBij Kij, p 1,..., P p p burada, Gij 1 G ve ij DBij 1 DB, P: karar verici sayısı, n: müşteri beklentisi sayısı (i=1,,,n), m: ij tedarikçi karakteristiği sayısı ( j=1,,,m) dir. Kanaat uzayının iki önemli bileşeni (Deneyim Bilgisi ve Güven) ile yapılan çalışmalarda karar verici değerlendirme sisteminin arka planında yer alan düşünce yapısı kaynaklı belirsizlikler irdelenebilmektedir. Ancak, deneyim bilgisi ve güven değerlendirmelerin öznel niteliği kaynaklı belirsizlik problemi çözümlenememektedir. 1.. Bulanık Ağırlıklı Ortalama Gerçek yaşama dair bir olgunun seçim ve değerlendirme çalışmalarında karar verici düşünce yapısı (algısı) ve farklılıkları etkili olmaktadır. Karar vericilerin ortak karar yapılarını belirlemede kesin ve bulanık birçok yöntem geliştirilmiştir. Bu yöntemler içerisinde klasik ağırlıklı ortalama yönteminin kullanımı yaygındır. Bu yöntem, karar verici algısı kaynaklı belirsizliklerin çözümlenmesinde yetersiz kalmaktadır. Belirsizlik çözümlemesinde Zadeh [] tarafından literatüre mal edilen bulanık mantık ve üyelik dereceleri önemli bir araçtır. Günümüz mühendislik tasarımları, tedarikçi seçim ve değerlendirmeleri gibi alanlardaki karar verme problemleri çalışmalarında bulanık bir yaklaşım olan Bulanık Ağırlıklı Ortalama (BAO) yöntemi kullanılmaktadır (örnek olarak bkz. [3]-[5]). Bu çalışmada, Vanegas ve Labib [3] in Zadeh in genişleme prensibine dayalı olarak önerdiği BAO yöntemi kullanılmaktadır. Vanegas ve Labib in [3] önerdiği Bulanık Ağırlıklı Ortalama (kısaca BAO VL ) yöntemi, mühendislik tasarımlarında öznel değerlendirmelere dayalı olarak karar vericilerin ortak memnuniyetini ortaya koymada bulanık sayıların kullanımı ile daha güvenilir ve kavramsal belirsizliği azaltıcı niteliktedir. Ayrıca, BAO VL yöntemi hesaplamada kolaylık sağlamaktadır. Bu çalışmada, her bir tedarikçi karakteristiğinin müşteri beklentilerini karşılamada karar vericilerin Tedarikçi seçimine ilişkin kanaat uzayı temelli toplam memnuniyeti BAO VL ile hesaplanmaktadır. Tedarikçi seçimi için güncellenmiş BAO VL Tanım 1 de verilmektedir. Tanım 1. n: müşteri beklentisi sayısı olmak üzere her i=1,,,n için, W i : i. müşteri beklentisinin önemini gösteren bulanık sayı, K ij : karar vericilerin j. tedarikçi 7 karakteristiğinin i. müşteri beklentisini sağlanmasındaki kanaat temelli memnuniyeti gösteren bulanık 3 sayı olsun. Toplam Memnuniyet ve i. Müşteri a b a b beklentisi ortak önemi için α-kesit aralıklar sırasıyla K j K j, K j ve Wi Wi, W i ile K K K a gösterilsin. Buna göre,, b j j j p alt ve üst limitleri () deki gibi hesaplanır: p (1)

74 K a j min a b wi Wi, W i n K i1 n i a ij w i w i ve K b j maks a b wi W i, W i n K i1 n i b ij w i w i () w W W a b Vanegas ve Labib [3]-[4], Min ve Maks operatörlerini i i, i olarak tanımlı w i nin tüm olabilir kombinasyonları için minimum ve maksimum değerleri olarak ele almaktadır. KAYNAKLAR [1] Prasad B. (1997), Concurrent engineering fundamentals volume II integrated product development, Prentice Hall PTR, New Jersey. [] Zadeh L.A. (1965), Fuzzy sets, Information Control, 8, [3] Vanegas L.V. and Labib A.W. (001a), Application of new fuzzy-weighted average (NFWA) method to engineering design evaluation, International Journal of Production Research, 39(6), [4] Vanegas L.V. and Labib A.W. (001b), A fuzzy quality function deployment model for deriving optimum targets, International Journal of Production Research, 39(1), [5] Dursun M. and Karsak E.E. (013), A QFD-based fuzzy MCDM approach for supplier selection, Applied Mathematical Modelling, 37, ABSTRACT EVALUATION OF BELIEF SPACE IN SUPPLIER SELECTION USING FUZZY WEIGHTED AVERAGE METHOD In this study, the overall belief-based desirability of decision makers in supplier selection is evaluated using a fuzzy weighted average method. As a result, the fuzzy approach yields more sensitive evaluations compared to the classical weighted average method. Key Words: Supplier selection, Belief space, Fuzzy weighted average. 4 7

75 BULANIK BAYESCİ AĞLAR ve BİR UYGULAMA Duygu İÇEN Hacettepe Üniversitesi, İstatistik Bölümü, 06800, Beytepe, Ankara Derya ERSEL Hacettepe Üniversitesi, İstatistik Bölümü, 06800, Beytepe, Ankara 1. Giriş Bayesci ağlar, raslantı değişkenlerinin çok değişkenli olasılık dağılımını temsil eden ve bu değişkenler arasındaki olasılıksal ilişkilerin anlaşılmasını sağlayan grafiksel modellerdir. Bayesci ağlarda belirsiz tanım kümesini temsil etmek için, veri ve uzman görüşü beraber kullanılabilir. Bazı durumlarda veri ve uzman bilgisindeki yetersizlikler nedeniyle Bayesci ağlarda bilgiyi temsil etmek zordur. Bu zorluğu aşmak için Bayesci ağlarda olasılıklar, Buckley nin önerdiği güven aralığı yaklaşımı ile bulanık olarak hesaplanabilir. Dolayısıyla, olasılıkların hesaplanmasında veri ve uzman bilgisi beraber kullanılarak gerçek hayata daha yakın ve yorumlanması daha kolay sonuçlar bulanık Bayesci ağlar ile elde edilir.. Bulanık Bayesci Ağlar Bir Bayesci ağ, V X,,X raslantı değişkenleri kümesine ilişkin çok değişkenli olasılık dağılımını 1 n temsil eden yönlü dönüşsüz grafiktir. Bayesci ağlar iki bileşenden oluşur. Birinci bileşen, düğümlerin raslantı değişkenlerini, düğümler arasındaki bağların ise bu değişkenler arasındaki doğrudan bağımlılıkları gösterdiği bir grafik yapısıdır. Bu yapı, koşullu bağımsızlık varsayımlarını içerir. Bayesci ağların ikinci bileşeni, ağdaki parametrelerin kümesini gösterir. Bu parametreler, Bayesci ağdaki her bir X raslantı değişkenine ilişkin koşullu olasılık dağılımlarıdır. Bir kümesi i olmak üzere, P i i BN X x i i X i raslantı değişkeni için koşullu olasılık dağılımı, i X i nin ebeveynlerinin biçiminde tanımlanır. Bayesci ağ yapısından ve koşullu olasılıklardan yararlanarak, V için çok değişkenli olasılık dağılımı aşağıdaki eşitlikten yararlanılarak elde edilir. Çok değişkenli olasılık dağılımının bu eşitlikten elde edilmesi zincir kuralı (chain rule) olarak adlandırılır (Jensen 001, Boettcher ve Dethlefsen 003). n 1 n i i (1) Xi i P X,,X P X i1 i1 n Bu çalışmada Bayesci ağlardaki koşullu olasılıkların bulanık olarak hesaplanmasında Buckley nin yaklaşımı A x,, x B x,, x 1 k m n kullanılacaktır (Buckley 003, 004, 006). 1 k ve l m ayrık kümeler olmak üzere bulanık olasılık Pxi ai 1 i n olarak tanımlansın. B değişkeni verildiğinde A değişkeninin koşullu bulanık olasılığı PA B aşağıdaki eşitlikten yararlanılarak hesaplanır (Buckley 006). k ai n il PA B a m i a î,1 i n, ai 1 i1 ai 7 il 5 () Eşt. () deki bulanık olasılıklar uzman bilgisinden veya koşullu olasılıklardan yararlanılarak hesaplanabilir. 3. Sonuç

76 Bu çalışmada, UCI Machine Learning Repository den alınan veri kullanılarak, araç sigortası için araçların risk faktörlerinin belirlenmesinde bulanık Bayesci Ağlar kullanılmıştır. Ele edilen sonuçlar klasik Bayesci ağlardan elde edilen sonuçlarla karşılaştırılmıştır. KAYNAKLAR [1] Buckley J.J. (003), Fuzzy Probabilities: New Approach and Applications, vol 164. Physica, Heidelberg. [] Buckley J.J. (004), Fuzzy statistics, vol 167. Springer, Germany. [3] Buckley J.J. (006), Fuzzy Probability and statistics, vol 70. Springer, Netherlands. [4] Jensen, F.V. (001), Bayesian Networks and Decision Graphs, Springer-Verlag, New York, 68p. [5] Boettcher S.G and Dethlefsen C. (003), deal: A package for learning Bayesian networks. Journal of Statistical Software. 8(0), pp ABSTRACT FUZZY BAYESIAN NETWORKS AND AN APPLICATION Bayesian Networks are graphical models encoding the joint probability distributions of random variables and representing probabilistic relationships among these variables. Data and expert opinion can be used together to represent uncertain domain in Bayesian networks. It is sometimes hard to represent uncertain domain because of the ambiguity in data or expert opinion. To overcome this problem fuzzy probabilities are calculated by Buckley s confidence interval approach in Bayesian networks. In this study, fuzzy Bayesian networks are used to determine the risk factors for automobile insurance by using the data acquired from UCI Machine Learning Repository. Key Words: Bayesian Networks, Fuzzy Probability, Fuzzy Bayesian Networks. 6 7

77 SESSION ÇOK DEĞİŞKENLİ İSTATİSTİKSEL ANALİZ 1 7 7

78 MEME KANSERİ HASTALARINDA POZİTİF LENF NODU SAYISINA İLİŞKİN SIFIR AĞIRLIKLI POİSSON VE NEGATİF BİNOM POİSSON MODELLERİNİN KARŞILAŞTIRILMASI Adnan KARAİBRAHİMOĞLU 1 *, Yasin ASAR, Hakan BAŞBOZKURT 3, Aşır GENÇ 4 1 *Necmettin Erbakan Üniversitesi, Meram Tıp Fakültesi, TEBAD,4080, Konya, TÜRKİYE, adnankaraibrahim@gmail.com Necmettin Erbakan Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Konya, TÜRKİYE, yasar@konya.edu.tr, yasinasar@hotmail.com 3 Bingöl Sanayi ve Ticaret Odası Bingöl, TÜRKİYE, hakan.basbozkurt@gmail.com 4 Selçuk Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Konya, TÜRKİYE, agenc@selcuk.edu.tr 1. GİRİŞ Sayma verisine dayalı kesikli değişkenlerde klasik regresyon modellemesi uygun sonuçlar vermemektedir. Bu tür verilerin regresyon analizi için Poisson regresyon yöntemi geliştirilmiştir. Sayıma dayalı kesikli verilerde dağılım sorunları genellikle sıfır değerinin fazla olması, aşırı yayılım (overdispersion) göstermesi ve karma dağılımlara sahip olması şeklinde karşımıza çıkmaktadır. Sayma değerlerinin ağırlıklı olarak sıfır (0) olduğu durumlar için Sıfır Ağırlıklı Poisson (Zero-Inflated Poisson); aşırı yayılım gösteren dağılımlar içinse Negatif Binom (Negative Binomial Poisson) modelleri geliştirilmiştir. Poisson dağılımı gereği serinin ortalaması varyansına eşit olmalıdır. Ancak aşırı yayılım durumunda bu şart sağlanmaz ve klasik Poisson regresyon modeli anlamlı tahminler vermez. Poisson regresyon modeli için E(Y)=λ iken log( ) X exp( X) dönüşümü yapılır. Sıfır ağırlıklı model için π, fazla sıfır olasılığı olmak üzere P( y 0) (1 ) e ve h e P( yi h) (1 ), h 1 olasılıkları ve ˆ için iterasyon yöntemi ile en çok olabilirlik (maximum h! likelihood) tahmin edicisi kullanılarak sıfır ağırlıklı model elde edilir. Aşırı yayılım durumunda ise negatif binom dağılımının kullanılması daha iyi sonuç vermektedir. Aynı şekilde E(Y)=λ ve r>0 parametreleri için π, fazla sıfır olasılığı olmak üzere dönüşümü ile negatif binom Poisson modeli elde edilir [1],[],[3]. r Meme kanseri tüm kanser türleri içerisinde ikinci, kadınlarda ise birinci sırada ölümcül bir kanser çeşididir. Meme içerisinde gelişen tümör lenf bezlerine yayılırsa bu duruma pozitif lenf nodu denilmektedir. Lenf nodu (bezi), lenfatik sistemin bir parçası olup kol altında yer alırlar ve kollarda, göğüslerde biriken lenf sıvısının boşaltılmasını sağlarlar.. AMAÇ Bu çalışmanın amacı, pozitif lenf nodu sayısını modellemek üzere oluşturulan sıfır ağırlıklı Poisson modeli, negatif binom modeli ve sıfır ağırlıklı negatif binom modellerini karşılaştırmaktır. 3. YÖNTEM ve GEREÇ Çalışmanın evrenini Meram Tıp Fakültesi Tıbbi Onkoloji kliniğine başvuran 1371 meme kanseri hastası oluşturmuştur. Retrospektif olarak yılları arasında hasta dosyaları taranarak veri kümesi oluşturulmuş ve etik onayı alındıktan sonra analizlerin yapılmasına geçilmiştir. Pozitif lenf nodu sayısı bağımsız değişken olarak; çocuk sayısı, vücut kütle indeksi gibi sayısal değişkenlerin yanı sıra menopoz durumu, tümör evresi, kalsifikasyon, ek hastalık, metastaz, mikrokalsifikasyon ve kemik metastazı gibi nominal ve sıralı değişkenler ise bağımsız değişken olarak kabul edilmiştir. Logit modeller oluşturularak log likelihood (LL) ve enformasyon kriter değerleri ile karşılaştırmalar yapılmıştır. 4. TARTIŞMA ve SONUÇ Sıfır ağırlıklı Poisson modelinde anlamlı değişken sayısının fazla olmasına karşın sıfır ağırlıklı negatif binom modeli daha uyumlu bulunmuştur. LL değerinin daha büyük, dolayısıyla AIC ve BIC değerlerinin daha küçük olması nedeniyle ZINB modeli pozitif lenf nodu sayısını açıklamada daha kullanılabilir bir modeldir (Çizelge.1) [4], [5]. 7 8 i

79 Çizelge1. Modellere ilişkin karşılaştırmalar LL AIC BIC Bağımsız değişken (p<0,05) Sıfır ağırlıklı Poisson -396, , ,7 Menopoz, tümör evresi, (ZIP) kalsifikasyon, ek hastalık, metastaz, kemik metastaz Negatif binom Poisson -950,9 59, ,97 Tümör evresi, metastaz, kemik (NB) Sıfır ağırlıklı negatif binom (ZINB) metastaz -11,03 450, ,89 Tümör evresi, kemik metastaz Anahtar Kelimeler: Model uyumu, negatif binom, Poisson regresyon,, sıfır ağırlıklı Poisson. KAYNAKLAR [1] Hilbe, J. M., (011), Negative Binomial Regression, Cambridge University Press, UK [] Cameron, A. C. & Trivedi, P. K. (1998), Regression Analysis of Count Data, Cambridge University Press, USA [3] Lawles, J. F., (1987), Negative Binomial and Mixed Poisson Regression. The Canadian Journal of Statistics, 15 (3): 09-5 [4] Hall, D. B. (000), Zero-Inflated Poisson and Binomial Regression with Random Effects: A case study. Biometrics. 56: [5] Yeşilova, A. (009), Sıfır Değer Ağırlıklı Sayıma Dayalı Verilerin Analizinde Hurdle Modelin Kullanılması. Anadolu Üniversitesi Bilim ve Teknoloji Dergisi. 10(): COMPARISON OF ZERO-INFLATED AND NEGATIVE BINOMIAL REGRESSION MODELS OF NUMBER OF POSITIVE LYMPH NODES ON BREAST CANCER PATIENTS When the dependent variable is a count data, Poisson regression is used in modeling. However there are many types of Poisson-based regression models according to the nature of data. The difference is sourced from, generally, the number of zero counts, overdispersion and having mixture distribution. The aim of this study is to compare zero-inflated Poisson, negative binomial and zero-inflated negative binomial Poisson regression results to model the number of lymph nodes, which is very important in prognosis, on breast cancer patients. According to the results, we found that zero-inflated negative binomial model fits best the data. Key Words: Model fit, negative binomial regression, Poisson regression, zero-inflated Poisson regression 9 7

80 SAĞLAMLIK ÖZELLİĞİNE DAYALI TAHMİN EDİCİLERLE DİSKRİMİNANT ANALİZİ Gamze ŞAHİN* ve Necla GÜNDÜZ Gazi Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 06500, Ankara, Türkiye, 1. Özet Diskriminant analizi gözetimli sınıflandırma için yaygın kullanılan bir istatistiksel yöntemdir. Ancak bu yöntem veride aykırı gözlem olması durumunda güvenilir olmayan sonuçlar verebilmektedir. Böyle bir durumda aykırı gözlemlerin tahmin ediciler üzerindeki etkisini azaltarak güvenilir sonuçlar elde etmek için sağlam tahmin yöntemlerine başvurulabilir.. Giriş Gözlemleri sınıflandırmak, gruplara atamak için kullanılan çeşitli istatistiksel analiz yöntemleri vardır. Ancak bu yöntemleri uygularken karşılaşılan en önemli sorunlardan biri veride aykırı gözlemlerin bulunması durumudur. Aykırı gözlemlerin varlığı istatistiksel analiz yöntemlerinin hatalı sonuçlar vermesine neden olabilir. Gözlemleri gruplara atamada kullanılan istatistiksel analiz yöntemlerinden birisi de diskriminant analizidir. Diskriminant analizi hangi gruptan geldiği belli olmayan bir gözlemin hangi gruba dâhil edileceğini belirlemek için kullanılır. Ancak diskriminant analizinin önemli bir kısıtlayıcısı olan aykırı gözlemlerin var olmaması durumu sağlanmadığında hatalı grup atamaları gerçekleştirilebilir. Aykırı gözlemlerin var olması durumunda aykırı gözlemlerin tahmin ediciler üzerindeki etkisini azaltarak güvenilir sonuçlar elde etmek, etkili bir grup ataması yapabilmek için sağlam tahmin yöntemlerine başvurulabilir. Sağlam tahmin yöntemlerinin temeli Simon Newcomb ile 19. Yüzyılın sonlarına dayanmaktadır (Stigler, 1973). Fakat 1960 lar ve 1970 lerin başında John Tukey (1960) ve Peter Huber (1964) tarafından ilk büyük adım atılmıştır. Son kırk yılda sağlam istatistiklerin çalışma alanı, bir araştırma alanı olarak önemli derecede büyüme sağlamıştır. Sağlam tahmin yöntemlerinde temel amaç, modelde yer alan hata terimleri için varsayılan dağılımların yanlış olması veya aykırı gözlemlerin bulunması durumunda parametre tahminleri için güvenilir sonuçlar verebilmektir. Bu çalışmada, diskriminant analizi uygulamalarında veride hatalı sonuçlar elde edilmesine yol açan aykırı gözlemler olması durumunda, tahmin sonuçlarını aykırı gözlemlerin etkisinden kurtarabilen, kırılma noktası değeri yüksek olan sağlam tahmin ediciler ele alınmıştır. Bu amaçla öncelikle diskriminant analizi, amaçları, varsayımları ve kısıtlayıcıları, diskriminant fonksiyonlarının bulunması, aykırı gözlemler, ortaya çıkış nedenleri ve belirlenme yolları gibi konular ele alınmıştır. Daha sonra sağlamlık, sağlamlık ölçüleri ve veride aykırı gözlem olması durumunda sınıflandırmada önemli rol oynayan sağlamlık özelliğine bağlı olarak elde edilen en küçük kovaryans determinantlı (MCD) ile ilgilig tahmin ediciler açıklanmaktadır. Ve gerçek veri seti üzerinde bir uygulama yapılmıştır. KAYNAKLAR [1] Stigler, S.M., (1973), Simon Newcomb, Percy Daniell, and the History of Robust Estimation , 68 (344), [] Tukey, J.W., (1960), A survey of sampling from contaminated distributions, Contributions to Probability and Statistics. [3] Huber, P.J., (1964), Robust Estimation of a Location Parameter, 35 (1), [4] Maronna, R.A., Martin, R. D., Yohai, V. J., (006), Robust Statistics: Theory and Methods. [5] Hubert, M. and Rousseeuw, P.J. and Van Aelst, S., (008), High-Breakdown Robust Multivariate Methods, 3 (1), ABSTRACT DISCRIMINANT METHOD WITH ROBUST BASE ESTIMATORS Discriminant analysis is a well known classification technique, which is used in the situations where the clusters are known a priori. The aim of discriminant analysis is to classify an observation, or several observations, into these known groups. However, when the data set involves outliers, the outliers affects 8 estimators excessively. So that, it provides incorrect group 0 assignmenst. In order to avoid incorrect group assignment and obtaining reliable results, robust parameter estimation methods have been developed. In this study robust parameter estimators, which have high breakdown point and eliminate outliers effect, are explained for discriminant anlysis. Key Words: Robustness, Outliers, Discriminant analysis

81 SAĞLAMLIK ÖZELLİĞİNE SAHİP EN KÜÇÜK KOVARYANS DETERMİNANTINA İLİŞKİN TAHMİN EDİCİLER 1. Özet Sercan SEZER* ve Necla GÜNDÜZ Gazi Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 06500, Ankara, Türkiye, Mevcut klasik metotlar, veride aykırı gözlem ya da başka bir dağılımdan karışan gözlemlerin varlığından çok fazla etkilenebilirler. Ayrıca, özünde klasik metotlar sonucu aykırı gözlem niteliği kazanmayan gözlemler, deneye ilişkin bilgiyi hatasız yansıtmasına rağmen aykırı gözlem olarak tespit edilmiş olabilir. Böyle bir durumda, klasik metotlar aykırı gözlemlerin tespitine izin vermez hale gelebilir. İşte tam bu noktada sağlam istatistik elde etmenin amacı ortaya çıkmaktadır. Sağlam istatistiklerle, başka bir dağılımdan karışan gözlem ya da gözlem grubunu barındıran eldeki mevcut veri setinden hareketle, aykırı gözlemlerin bulunmadığı ya da etkisinin az tutulduğu duruma yakın tahmin ediciler elde edilebilir. Bunun sonucu olarakta, elde edilen tahmin ediciler ile sağlıklı olasılık cümleleri ve güven aralıkları kurulabilir.. Giriş Diğer tüm istatistiksel yöntemlerde olduğu gibi çok değişkenli istatistiksel yöntemlerde aykırı değerlere karşı oldukça duyarlıdır. Çok değişkenli analiz yöntemlerden biri olan ve yaygın olarak kullanılan diskriminant analizide, her birinde p tane değişken bulunan k sayıda gruptan (k>) elde edilecek doğrusal kombinasyonların yardımıyla, p tane değişkene sahip yeni bir gözlem birimini, bu gruplardan herhangi birine atamak istediğimizde kullanılan bir yöntemdir. Örneğin; mevcut gruplardan biri örnek ortalaması istatistiğini etkileyecek düzeyde aykırı değere sahipse, bu gözlemler aynı zamanda değişkenliğin bir ölçüsü olarak kullanılan varyans istatistiğinin değerini de arttıracaktır. Bunun sonucu olarak; Fisher ve Kanonik Diskriminant yaklaşımı ile elde edilen katsayılar, bu katsayıların oluşturduğu fonksiyonlar, fonksiyonlardan hareketle oluşturulan doğrusal diskriminant skorları, Bayesci yaklaşım sonucu elde edilen gözlem birimlerinin gruplara atanma sonsal olasılıkları, dolayısıyla gözlem birimlerinin ilgili gruplara atanma işleminin kestirilmesi, hatalı olacaktır. Görüldüğü üzere art arda gerçekleşen bu işlemler silsilesi, aykırı gözlem ya da gözlemlerin varlığından olumsuz etkilenecek ve zincirleme bir kestirim hatası meydana getirecektir. Çok değişkenli yapı içerisinde bu hatanın miktarı ve de boyutu sınıflama haritaları ya da sınıflama tutarlılığı tablosu yardımıyla incelenebilir. Bu çalışmada ilk olarak; tek değişkenli konum ve ölçek parametre tahminleri için sağlamlık özelliği tartışılmıştır. Ardından çok değişkenli yapıya ilişkin konum ve yayılım parametre tahminleri için sağlamlık özelliği taşıyan bazı yöntemler ve bu yöntemler sonucu elde edilen sağlam tahmin ediciler ele alınmıştır. Çok değişkenli sağlam tahmin ediciler elde etme sürecinde, n gözlem biriminden h çaplı alt kümeler seçilerek, varyans-kovaryans matrisinin determinantının minimum (MCD) olmasına dayalı MCD metodu incelenerek, lokasyon ve yayılım parametrelerinin sağlamlık özelliğine sahip tahmin edicileri elde edilmiştir. Genel olarak, n gözlem biriminden h çaplı alt kümelerin araştırılması çok yoğun iş hacmi gerektirir. Bu nedenle, Rousseeuw ve Driessen (Rousseeuw (1999)) tarafından geliştirilen FAST-MCD isimli, oldukça hızlı işleyen bir algoritmanın işlerliği de incelenmiştir. Varyans-kovaryans matrisinin elde edilmesine dayalı bazı klasik MCD metotları ve bu metotlar yardımıyla elde edilen tahmin edicilere de bu çalışma kapsamında yer verilmiştir. Bu çalışmada, Doğrusal Diskriminant Analizi için kullanılacak sağlam tahmin ediciler ve elde edilme süreçleri gerçek bir veri seti üzerinde R paket programı kullanılarak uygulanmıştır. Amaç; Çok Değişkenli yapı içerisinde elde edilen Lokasyon ve Ölçek parametrelerinin sağlamlık vasfının ortaya koymuş olduğu avantaj ve dezavantajları gözlemlemektir. KAYNAKLAR [1] Alpar, R. (011). Uygulamalı Çok değişkenli İstatistiksel Yöntemler. Ankara, Türkiye: Detay yayıncılık. [] Rousseeuw, K. V. D. (1999). A Fast Algorithm For The Mininmum Covariance Determinant Estimator. (Belgium). Technometrics 41 (3), [3] Rousseeuw, P., H. P. (011). Robust statistics for 1 outlier detection. (England). Wiley 1(1), [4] Valentin Todorov, A. M. P. (007). Comparative Performance Of Several Robust Linear Disciriminant Analysis methods. (Vienna, Austria). Revstat Journal 5 (1), [5] Peter Filzmoser, V. T. (01). Robust Tools fort he Imperfect World. (Vienna, Austria). Elsevier Volume 45, 4-0

82 ABSTRACT PROPERTIES OF ROBUST MINIMUM COVARIANCE DETERMINANT ESTIMATORS Data outliers or other data inhomogeneities lead to a violation of the assumptions of traditional statistical estimators and methods. Robust statistics offers tools that can reliably work with contaminated data. Here, outlier detection methods in low and high dimension, as well as important robust estimators and methods for multivariate data are reviewed, and the most important references to the corresponding literatüre are provided. Algorithms are discussed, and routines in R provided, allowing for a straightforward application of the robust methods to real data. Keywords: robustness, robust estimators, MCD, outliers, high breakdown, discriminant analysis 8

83 SIRALAYICI ÖLÇME DÜZEYİ İÇİN POLİKORİK KORELASYON KATSAYISININ KULLANIMI VE BİR UYGULAMA ÇALIŞMASI Mehmet SANDAL *, Zeki YILDIZ Eskişehir Osmangazi Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, 6000, Eskişehir, TÜRKİYE, Bireysel tutumlara ve davranışlara yönelik ifadelerin araştırıldığı birçok bilimsel alanda, bazı analiz teknikleri kullanılarak incelenen bu ifadeler hakkında çeşitli değerlendirmeler yapılabilmektedir. Ancak araştırma konusuna yönelik yapılan analizlerden güvenilir ve geçerli sonuçlar elde edilmesinde, kullanılan tekniğin doğru belirlenmesi ve gereken varsayımların yerine getirilmesi oldukça önemlidir. Sosyal bilimler, davranış bilimleri, ekonomi, psikoloji vb. alanlarda yapılan çalışmalarda çoğunlukla kullanılan tekniklerden biri de Likert ölçeklerdir. Tutum ve davranış gibi kişisel özellikleri ölçülmesi amacıyla gerçekleştirilen çalışmalarda çoğu zaman Likert ölçek verilerinden faydalanılmaktadır. (Li, 014). Genellikle Likert ölçeklerden elde edilen veriler için en az eşit aralıklı ölçme düzeyine göre analizler gerçekleştirilmesine rağmen bu tür ölçeklerden elde edilen veriler sıralayıcı (ordinal) ölçme düzeyine sahip olmakta ve bu veriler için uygun istatistiksel tekniklerin kullanılması gerekmektedir (Jamieson, 004). Ordinal değişkenler söz konusu olduğunda bu değişkenler arasındaki ilişkinin tahmin edilmesinde ise polikorik korelasyon katsayıları kullanılmaktadır. Polikorik korelasyonlar, gözlenemeyen değişkenler arasındaki ilişkileri açıklamak için tahmin edilen korelasyon olarak adlandırılmaktadır (Choi vd., 011; Basto ve Pereira, 01). X i ve X j, m i ve m j kategorilerine sahip iki ordinal değişken olmak üzere her bir ordinal değişken için, bu ordinal değişkenlere verilen cevapların alt tutumlarını ifade eden ve dan + aralığına sahip olan bir alt X i ve X j sürekli değişkenleri olduğu varsayılmaktadır. İncelenen veri seti için i, j hücresine düşen bir gözlemin olasılığı olmak üzere u, v 1 1 i j i j Yemekhane memnuniyeti ve hizmet kalitesine ilişkin Likert tipi ölçeklerden elde edilen verilerin faktör analizi için uygulanabilir olduğu belirlenerek, açıklayıcı faktör analizi için polikorik korelasyon matrisi hesaplanmıştır. İlgilenilen değişkenleri temsil eden uygun faktör sayısı, özdeğerler ve toplam varyans yüzde kriterinin yanı sıra Paralel analiz ve Velicer MAP kriterleri de 8dikkate alınarak değerlendirilmiş ve incelenen değişkenlerin dört faktör altında toplanmasının uygun olacağı 3 belirlenmiştir. e 1 u uv v 1 Pr X i, X j u, v dudv ij m m i1 j1 şeklinde ifade edilmektedir (Olsson, 1979, Li, 014). Dolayısıyla m i j ln L n log m i1 j1 şeklinde verilen çok terimli dağılımın log-olabilirlik fonksiyonu maksimize edilerek eşik parametreleri ve "ρ" polikorik korelasyon değeri eş zamanlı olarak tahmin edilebilmektedir. Bu çalışmanın amacı da; ordinal ölçme düzeyinde elde edilen veriler için polikorik korelasyon katsayılarını dikkate alarak, ordinal veriler ile birlikte faktör analizinin kullanımına ilişkin uygun çözümleme yaklaşımı ortaya koymaktır. Bu amaçla Eskişehir Osmangazi Üniversite sinde eğitim gören öğrenciler ile görev yapan akademik ve idari personelin, üniversite yemekhanesine karşı memnuniyet düzeylerinin ve hizmet kalitesinin değerlendirilmesine ilişkin bir uygulama çalışması ile açıklayıcı ve doğrulayıcı faktör analizi gerçekleştirilmiştir. Açıklayıcı faktör analizi ile belirlenen bu faktör yapısının doğruluğunu test etmek için uygulanan doğrulayıcı faktör analizi sonuçları, hem t değerlerine hem de uyum kriterlerine göre bu yapının geçerli bir model olduğunu göstermiştir. Ayrıca doğrulayıcı faktör analizi için En Çok Olabilirlik (ML), Ağırlıklandırılmış En Küçük Kareler (WLS), Ağırlıklandırılmamış En Küçük Kareler (ULS) ve Diyagonal ij ij 1) ) 3) ( ( (

84 Olarak Ağırlıklandırılmış En Küçük Kareler (DWLS) olmak üzere değerlendirilen dört tahmin yöntemi, polikorik korelasyonlar söz konusu olduğunda bazı uyum fonksiyonları da dikkate alınarak uygulanmış ve incelenen bu yöntemlere göre elde edilen sonuçlar karşılaştırılmıştır. En düşük ki-kare değeri DWLS yöntemine göre elde edilirken; ULS, WLS ve DWLS için RMSEA değerlerinin ise yaklaşık olarak aynı olduğu belirlenmiştir. Bu üç teknik için uyum indeksleri sonuçları da benzer şekilde iyi uyum düzeyine sahip olduğunu göstermiştir. Ayrıca örneklem büyüklüğünün yeterince fazla olması, WLS yöntemi ile elde edilen parametre tahminlerinin de diğer tekniklere göre yakın sonuçlar ortaya koyduğunu göstermiştir. KAYNAKLAR [1] Basto, M., Pereira, J.M., 01, An SPSS R-Menu for ordinal factor analysis, Journal of Statistical Software, 46,4, 1-9. [] Choi, J., Kim, S., Chen, J., Dannels, S., 011, A comparison of maximum likelihood and bayesian estimation for polychoric correlation using Monte Carlo simulation, Journal of Educational and Behavioral Statistics, 36,4, [3] Jamieson, S., 004, Likert scales: how to (ab) use them, Medical Education, 38,1, [4] Li, Y., 014, Confirmatory factor analysis with continuous and ordinal data: An empirical study of stress Level, Independent thesis Advanced level, Uppsala University, 34 p. [5] Olsson, U., 1979, Maximum likelihood estimation of the Polychoric Correlation Coefficient, Psychometrika, 44,4, ABSTRACT FACTOR ANALYSİS FOR LEVEL OF ORDİNAL MEASUREMENT AND AN APPLİCATİON In this study, how to apply factor analysis was researched using polychoric correlation matrix when the ordinal data are in the question. For this purpose, an explanatory and confirmatory factor analysis was achieved with an implementation study regarding to refectory service quality and satisfaction level. Results of explanatory factor analysis were attained by using polychoric correlation matrix. Also, results of confirmatory factor analysis showed that determined factor structure was appropriate. Furthermore, prediction methods which were evaluated for confirmatory factor analysis were applied considering some conformity functions when polychoric correlations were in the question and results attained according to four prediction methods were compared. Key Words: Ordinal Data, Polychoric Correlation, Explanatory Factor Analysis, Confirmatory Factor Analysis 4 8

85 SESSION 3 STATISTICS THEORY 5 8

86 Copula modelling for financial risk estimation TOMÁŠ TICHÝ Department of Finance, Faculty of Economics, Technical University of Ostrava 1. Introduction The main objective of this research is to examine how suitable are particular Lévy based subordinated models for the estimation of the future distribution of portfolio returns and subsequent calculation of risk measures (eg. VaR or CVaR) and the impact on the fair price. While several Lévy models are used for marginal distribution, in order to obtain the dependency structure of the portfolio the theory of copula functions are utilized. In order to assess the suitability of particular models and the soundness of the whole procedure, we utilize mainly the historical approach (backtesting procedure). In order to asses the risk of a portfolio, i.e. unexpected changes in its value, a joint probability distribution of all relevant drivers of random evolution should be estimated, though marginal distributions and a suitable tool (a copula function) to express the dependency among particular factors can be estimated separately. Actually, such a decomposition can be of great value since joint probability distribution generally presumes identical margins, at least at elementary levels. By contrast, choosing e.g. copula functions to rebuild independent marginal distributions into dependent structure gives us a great portion of freedom when estimating the marginal probability distribution. Marginal distribution by subordinated Lévy processes The major task of financial model building is to allow one to fit also extreme evolution of market prices. It is a matter of fact that returns at financial markets are neither symmetrically distributed nor without exceed peeks (or heavy tails) over time, which is in contradiction of Gaussian distribution. A very feasible way to fit both skewness (non-symmetry) and kurtosis (heavy tails) is to apply a subordinated Lévy model, a rather nonstandard definition of Lévy models as time changed Brownian motions, which goes back to Mandelbrot and Taylor (1967) and Clark (1973). Generally, a Lévy process is a stochastic process, which is zero at origin, its path in time is right-continuous with left limits and its main property is that it is of independent and stationary increments. Another common feature is a so called stochastic continuity. Moreover, the related probability distribution must be infinitely divisible. The crucial theorem is the Lévy-Khintchine formula consisting of three terms (deterministic drift, diffusion, and jumps): Φ(u) = ıγu 1 σ u + (exp( ıux) 1 ıuxi x <1 )v(dx). In finance we often use subordinated Lévy processes, obtained by replacing standard time t in Brownian motion X with suitable parameters of diffusion and drift by its function l(t): X (l(t); θ, θ) = θl(t) + θz(l(t)) = θl(t) + θ ε l(t) 3. Dependency modeling by copula approach 8 6 A useful tool of dependency modelling are the copula functions, i.e. the projection of the dependency among particular distribution functions into [0,1], c: [0,1] n [0,1]on R n, n {,3, }.

87 Actually, any copula function can be regarded as a multidimensional distribution function with marginals in the form of standardized uniform distribution. For simplicity assume two potentially dependent random variables with marginal distribution functions F X,F Y and joint distribution function F X,Y. Then, following the Sklar's theorem: F X,Y (x. y) = C(F X (x), F Y (y)). If both F X, F Y are continuous a copula function C is unique. Sklar's theorem implies also an inverse relation. Formulation above should be understood such that the joint distribution function gives us two distinct information: (i) marginal distribution of random variables, (ii) dependency function of distributions. Hence, while the former is given by F X (x) and F Y (y), a copula function specifies the dependency, nothing less, nothing more. That is, only when we put both information together, we have sufficient knowledge about the pair of random variables X,Y. The only difficulty arises if the Lévy copulas, ie. the dependency specified by the Lévy measure of the Lévy- Khintchine formula, are ignored. In the statistical study we document the impact of the assumption of standard copulas versus Lévy copulas. REFERENCES [1] Barndorff-Nielsen, O.E., Mikosch, T., Resnick, S.I. (eds.) (001): Lévy processes. Theory and Applications. Boston: Birkhauser [] Clark, P. K. (1973): A subordinated stochastic process model with fixed variance for spekulative prices. Econometrica 41, pp , [3] Mandelbrot, B.H., Taylor, H.M. (1967): On the distribution of stock price differences. Operations Research 15, , [4] Nelsen, R.B. (006): An Introduction to Copulas. nd ed. Springer, 006. Key Words: Copula, Lévy copula, financial risk estimation 7 8

88 TRANSMUTED TWO -PARAMETER LINDLEY DISTRIBUTION Sibel AÇIK KEMALOĞLU, Mehmet YILMAZ Ankara University, Faculty of Science, Department of Statistics, Tandoğan, ANKARA 1. Introduction In this study, it is proposed a new distribution using the quadratic rank transmutation map named as transmuted two parameter Lindley distribution (TTLD). This distribution is more flexible than two parameter Lindley distribution. The properties of the transmuted two parameter Lindley distribution are examined and estimation methods for the parameters of this distribution are discussed. The usefulness of the TTLD is demonstrated on real data.. Two-Parameter Lindley Distribution The cumulative distribution function (cdf) of two parameter Lindley distribution is given by and the corresponding probability density function (pdf) is given by F(x; α, θ) = 1 ( θ+α+αθx ) e θx, x > 0, α > 0, θ > 0 (1) θ+α f(x; α, θ) = θ e θx (1 + αx), x > 0, α > 0, θ > 0. α + θ 3. Quadratic Rank Transmutation Map Let F 1 and F be two distribution functions with a common sample space. The general rank transmutation as given in Shaw and Buckley (007) is defined as where F 1 (ξ) = inf{f(x) ξ}, ξ [0,1]. xεr A quadratic rank transmutation map is defined as G R1 (u) = F (F 1 1 (u)) G R1 (u) = F 1 (F 1 (u)) G Rij (u) = u + λu(1 u), λ < 1, u [0,1]. From this transmutation it follows that F 1 and F satisfy the relationship or G Rij (F i (x)) = F i (x) + λf i (x)(1 F i (x)) () F j (x) = (1 + λ)f i (x) λf i (x) (3) This latter equation generates a transmuted distribution (F j ) of F8 i. If F 1 and F both are continuous distributions then a transmuted probability density function is obtained 8 by differentiating (3) as follows f j (x) = (1 + λ)f i (x) λf i (x)f i (x), j = 1 or, i = 1 or, (i j).

89 4. Transmuted Two-Parameter Lindley Distribution We use (1) in (3) to obtain the cdf of TTLD, then θ + α + αθx F TTLD (x) = (1 + λ) [1 ( ) e θx θ + α + αθx ] λ [1 ( ) e θx ] θ + α θ + α where x > 0, α > 0, θ > 0, λ 1. Since TTLD has an one more parameter, it becomes more flexible than TLD. REFERENCES [1] Elbatal, I. and Elgarhy, M. (013). Transmuted Quasi Lindley Distribution: A Generalization of The Quasi Lindley Distribution. International Journal of Pure Applied Science and Technology 18(), [] Mansour, M.M and Mohamed S.M. (015). A New Generalized of Transmuted Lindley Distribution, Applied Mathematical Sciences, Vol. 9, 015, no. 55, [3] Shahzad, M.N and Asghar, Z. (015). Transmuted Dagum Distribution: A more flexible and broad shaped hazard function model. Hacettepe University, Journal of Mathematics and Statistics. [4] Shanker R., Sharma S. and Shanker, R. (013). A two-parameter Lindley distribution for modeling waiting and survival times data. Appl Math. 4 (), [5] Shaw W. and Buckley, I. (007). The Alchemy of Probability Distributions: Beyond Gram- Charlier Expansions and A Skew- Kurtotic- Normal Distribution from a Rank Transmutation Map. Research Report. Key words: Lindley distribution, quadratic rank transmutation, hazard rate, moments 9 8

90 THE IMPORTANCE OF SERVICE DISCIPLINES IN QUEUEING SYSTEMS AND A GENERAL STUDY ON RECENT SERVICE DISCIPLINES Erdinç YÜCESOY Ondokuz Mayıs Üniversitesi Fen-Edebiyat Fakültesi İstatistik Bölümü erdincyucesoy@gmail.com Queueing systems consist of six basic elements which are: arrival stream, service time, service discipline, the number of service channels, queue capacity, and the capacity of arrivals source. One of these six elements, the arrival stream, is depends on the customer. The capacity of arrival source also depends on customer partially. The remaining four elements are dependent on the service facility and service facility can change these four elements considering the conditions and situations. New service disciplines are constructed regarding the developments in computer and telecommunication technologies. Sometimes these new service disciplines simplify the analysis of system and sometimes these service disciplines are more realistic for today s queueing models. In this study we consider one of these changeable elements: the service discipline. We investigate the importance of service discipline and the relations with other service elements. One of other purpose of this paper is to investigate the benefits of analysis of the system if the service discipline is changed. systems. Keywords: Queueing theory, service discipline, homogeneous channel, heterogeneous channel, Queueing 0 9

91 STATISTICAL METHODS IN SIGNAL PROCESSING: THEORY AND APPLICATIONS Hani Kabajah Birzeit University Mr azek et al. [1] proposed a unified approach to curve estimation which combines localization and regularization. Franke et al. [] used that approach to discuss the case of the regularized local least-squares (RLLS) estimate. In this work we will use the unified approach of Mr azek et al. to elaborate the asymptotic theory of local smoothers with regularization. In particular, we shall discuss the Robust Huber M-estimate and its connections to the L and the L1 cases. For the regularization part, we will use a general class of convex functions. We will introduce sigma filters as in Chu et al. [3] to the approach. The statistical theory elaborated will be used as quality measures to the estimates. Finally, we perform a simulation study to compare different types of estimates. References: [1] P. Mr azek, J. Weickert, and A. Bruhn. On robust estimation and smoothing with spatial and tonal kernels. In R. Klette, R. Kozera, L. Noakes, and J. Weickert, editors, Geometric Properties from Incomplete Data. Springer, Dordrecht, 006. [] J. Franke, J. Tadjuidje Kamgaing, S. Didas, and J. Weickert. Some asymptotics for local least-squares regression with regularization. Report in Wirtschaftsmathematik, No. 107, Department of Mathematics, University of Kaiserslautern, 008. [3] C. K. Chu, I. K. Glad, F. Godtliebsen, and J. S. Marron. Edge preserving smoothers for image processing (with discussion). Journal of the American Statistical Association, 93(44):56 556,

92 Verification of the Probability Default Estimation of Selected Companies via Merton Model Petr GURNÝ Estimation of default probability is very important part of the company risk management. Especially nowadays, when there are a lot of crises and issues that are rehearsing stability of the companies all around the world. In this paper the Merton model is applied on real data of selected companies from four different countries. Two issues are solved in the paper. First, optimization problem for the estimation of the appropriate portion of the liabilities for practical utilization of the Merton model for a different branches is outlined, while utility function is designed as variation between modelled and agency s ratings. Second, prediction of the probability of default via Merton model is examined, while two different stochastic processes are used; Geometric Brownian motion and Variance Gamma process, respectively. It is shown, that utilization of the more sophisticated processes, which enable to model also higher moments of the probability distribution, can capture empirical distribution (particularly in the fat tails of the probability distributions) much better, compared with the usual Gaussian distribution. Key words Probability of default; Merton model; Geometric Brownian motion, Variance Gamma process. JEL codes: C01, C51, G17 9

93 SESSION 3 FİNANS, AKTÜERYA VE RİSK YÖNETİMİ 3 9

94 AKTÜERYADA REGRESYON MODELLEMESİNE ALTERNATİF BİR ANALİTİK YAKLAŞIM Fatma Feyza GÜNDÜZ - Ali İhsan GENÇ Mustafa Kemal Üniversitesi Fen-Edebiyat Fakültesi Matematik Bölümü Hatay-Türkiye Çukurova Üniversitesi Fen-Edebiyat Fakültesi İstatistik Bölümü Adana-Türkiye 1. Risk Tanımı ve Temel Kavramlar f.feyzagunduz@gmail.com agenc@cu.edu.tr Risk, kişi ya da kurumların her türlü maddi, manevi kayıp ve zararının oluşumuna ilişkin belirsizlik hallerinde ortaya çıkan ve tehlikenin ciddiyetine verilen isimdir. Bu durumda riske bir rastgele değişken gözüyle bakılabilir çünkü gerçek sonucunu önceden bilmek mümkün olmayabilir. Risklerin ortaya çıkması halinde karşılaşılabilecek olumsuz durumları bilerek bunlara karşı önceden hazırlıklı olmak amacıyla riskleri ölçme ve kontrol altına alma yolları aranmıştır. Genellikle riskler gerçekleşmeden sigortayla güvence altına alınabilirler. Bu sebeple riski sigortacılık açısından tanımlamak gerekirse, bir kimsenin para ile ölçülebilir bir menfaatini zarara uğratan tehlike olarak ifade edilebilir. (Olivieri, A. and Pitacco, E. (011)) Bir rastgele değişken olarak riskin modellenmesinde normalden daha kalın kuyruklu ve sağa çarpık dağılımların kullanıldığı bilinmektedir. Özellikle sigorta şirketlerinin yükümlülüklerini karşılayabilmesi ve devamlılığını sağlayabilmesi açısından incelenmesi gereken en önemli konulardan birisi, hasar tutarı dağılımlarının modellenmesidir.. Aktüeryal Regresyon Modellemesinde Üslendirilmiş Frechet Yöntemi Dağılımın olasılık yoğunluk fonksiyonu ve kümülatif dağılım fonksiyonu sırasıyla; α > 0, σ > 0, λ > 0 olmak üzere, f(x) = αλσ λ [1 exp { ( σ x )λ }] α 1 x (1+λ) exp { ( σ x )λ } (1) F(x) = 1 [1 exp { ( σ x )λ }] α () olarak ifade edilir (Nadarajah, S. and Kotz, S. (006)). Burada α ve λ şekil parametresi, σ ölçek parametresidir. Dağılımın yoğunluk fonksiyonunda α=1 alınırsa sıradan Frechet dağılımı elde edilir. α küçüldükçe üslendirilmiş Frechet dağılımının kuyruk kalınlığı artar ki bu da büyük kayıpların modellenmesine olanak sağlar. Aktüeryal istatistikte regresyon çözümlemesinde bağımlı değişkenler çoğunlukla normalden daha kalın kuyruklu dağılıma sahip olarak karşımıza çıkmaktadır. Bu nedenle gerçekçi bir model olarak üslendirilmiş Frechet modeli önerilecektir. Regresyon modeli kurulduktan sonra parametre tahminlerine geçilecek ve yöntemin kullanışlılığını görmek amacıyla önerilen yöntem bir otomobil sigortası verisine (De Jong, P. And Heller, G. Z.(008), s.15) uygulanıp diğer yöntemlerle karşılaştırmaları yapılacaktır. KAYNAKLAR [1] De Jong, P. And Heller, G. Z.(008). Generalized Linear Models for Insurance Data, Cambridge University Press. [] Olivieri, A. and Pitacco, E. (011). Introduction to Insurance Mathematics, Verlag Berlin Heidelberg: Springer. [3] Nadarajah, S. and Kotz, S. (006). The Exponentiated Type Distributions, Acta Appl Math, AN ALTERNATIVE ANALYTICAL APPROACH TO REGRESSION MODELING IN ACTUARIAL STATISTICS In this work, we introduce an analytical approach for modeling loss data in a regression structure. We consider the exponentiated Frechet distribution which is a long 9tailed distribution for modeling insurance data. After deriving theoretical results, we demonstrate the proposed 4 model to some real insurance data. Key Words: exponentiated frechet distribution, maximum likelihood estimation, loss modeling long tailed distribution

95 GENELLEŞTİRİLMİŞ DOĞRUSAL MODELLERDE MODEL DEĞERLENDİRMESİ VE SEÇİMİ: KASKO SİGORTASI ÖRNEĞİ Övgücan KARADAĞ ERDEMİR*, Meral SUCU Hacettepe Üniversitesi, Fen Fakültesi, Aktüerya Bilimleri Bölümü, 06800, Ankara, TÜRKİYE Öz Bu çalışmada özel bir sigorta şirketinin bir yıllık kasko hasar sayısı verisinin genelleştirilmiş doğrusal model yardımıyla modelleme aşamaları verilmiştir. Grafiksel inceleme ile başlayan model değerlendirmesi belli testler ile devam etmiş, model seçimi için AIC ve BIC kriterlerinden yararlanılmıştır. Elde edilen sonuçlar tablolar yardımıyla verilmiş ve yorumlanmıştır. Anahtar Kelimeler: Genelleştirilmiş Doğrusal Model, Poisson Regresyon, Kolmogorow-Smirnov Test, AIC, BIC, Log-Olabilirlik Değeri 1. Genelleştirilmiş Doğrusal Model Uygulamalı istatistik ve aktüerya biliminde genelleştirilmiş doğrusal model tahmin ve fiyatlama amacıyla sıklıkla kullanılmaktadır. Genelleştirilmiş doğrusal modeller üç temel bileşenden oluşmaktadırlar. Bunlar; Üstel Dağılım Ailesinden Yanıt Değişkeninin Olasılık Yoğunluk Fonksiyonu Doğrusal Bileşen Bağ Fonksiyonu biçimindedir. Poisson, binom, negatif binom, normal, gamma, ters Gauss gibi dağılımları içeren üstel dağılım ailesi genelleştirilmiş doğrusal modellerin oluşturulmasında bir ön koşuldur []. Doğrusal bileşen i. gözlem için β ( i 1,..., ip) i ve X ( xi 1,..., xip ) i olmak üzere, p i xijij i i j1 X β, i 1,..., n, j 1,..., p (1) şeklindedir. Yanıt değişkenin beklenen değeri ile doğrusal tahmin edici arasında bağ kuran g bağ fonksiyonu, i n () g( ), 1,..., i i şeklindedir. Yanıt değişkenin dağılımına göre bağ fonksiyonları birim, logaritmik, üstel, kakekök ve logit olabilir [1].. Model Değerlendirmesi Eldeki veriye uygun olduğu düşünülen model kurulduktan sonra bir değerlendirme aşamasından geçirilir. Bu aşamada ilk olarak grafiksel inceleme yapılır daha sonra Kolmogorow-Simirnov Testi, Anderson-Darling Testi, Ki-Kare Testi gibi uyum iyiliği testleri ile model değerlendirilir [4]. 3. Model Seçimi Model değerlendirmesi aşamasından sonra uygun olduğu düşünülen birden çok model olabilir. Bu modeller belli bilgi kriterleri yardımıyla ile karşılaştırılılabilir. Bu kriterlerin başında Akaike Bilgi Kriteri (AIC) ve Bayesci Bilgi Kriteri (BIC) gelmektedir. Log-olabilirlik değerleri de karşılaştırma kriteri olarak kullanılmaktadır. 4. Uygulama: Kasko Sigortası Örneği Özel bir sigorta şirketinden alınmış bir yıllık kasko sigortası hasar sayısı verisi öncelikle grafiksel olarak incelenmiş, dağılımı hakkında ön inceleme yapılmıştır. Grafiksel inceleme sonrasında verinin dağılım grafiğinden ve sigortacılıkta hasar sayılarının Poisson dağılımına uyduğu varsayımından hareketle verinin Poisson dağılıma uyumu araştırılmıştır. Verinin teorik dağılıma uyumu Kolmogorov-Smirnov testi ile analiz edilmiştir. Kolmogorov-Smirnov testi sonucunda p 0,80 0,05 olduğundan verinin dağılımı ile Poisson dağılım arasında fark olmadığını öne süren H 0 yokluk hipotezi kabul edilmiştir. Yanıt değişkenin, Poisson dağılımlı hasar sayısı olması nedeniyle modellemede 9 kullanılacak bağ fonksiyonu loagaritmik bağ fonksiyonu olarak alınmıştır. Logaritmik bağ fonksiyonu 5 kullanılarak Poisson dağılımlı yanıt değişkenler için oluşturulan genelleştirilmiş doğrusal modeller Poisson Regresyon olarak adlandırılırlar [3]. Böylece kullanılacak model tipi belirlenmiş ve model değerlendirme aşaması tamamlanmıştır. Çalışmada risk faktörleri (değişkenler); cinsiyet (kadın-erkek), şehir (büyük şehir-küçük şehir), yaş (genç, orta, yaşlı), motor hacmi (küçük, orta, büyük) olarak belirlenmiştir []. Dört, üç, iki ve bir açıklayıcı değişken kullanılarak toplam 15 model elde edilmiştir. Modelin hangi risk faktörlerine göre oluşturulacağı ise AIC ve BIC bilgi kriterleri yardımı ile analiz edilmiştir.

96 Her bir model için AIC ve BIC değerleri ile log-olabilirlik değerleri hesaplanmış, dört modele ilişkin değerler Çizelde 1 de verilmiştir. En uygun model, en küçük AIC, BIC ve en büyük log-olabilirlik değerine sahiptir. Çizelge1. Modeller için Akaike Bilgi Kriteri, Bayesci Bilgi Kriteri, Log-Olabilirlik Değeri AIC Bilgi Kriteri BIC Bilgi Kriteri Log-Olabilirlik Değeri Model-1 AIC: 464,8009 BIC: 475,8855 Log-Olabilirlik: -5,4005 (df=7) Model-3 AIC: 65,3366 BIC: 70,6788 Log-Olabilirlik: -16,6683 (df=6) Model-11 AIC: 101,589 BIC: 100,756 Log-Olabilirlik: -46,79459 (df=4) Model-15 AIC: 38,93817 BIC: 36,3401 Log-Olabilirlik: -16,46909 (df=3) KAYNAKLAR [1] Haberman, S. and Renshaw A. E. (1996), Generalized Linear Models and Actuarial Science, Statistician, 45(4), [] Karadağ, Ö. (013), Genelleştirilmiş Doğrusal Modeller için Sınırlı Dalgalanmalı Kredibilite Yaklaşımı, Hacettepe Üniversitesi, Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi. [3] McCullagh, P. and Nelder, J.A. (1989), Generalized Linear Models, Chapman and Hall, London. [4] Tse Y. K. (009), Non-Life Actuarial Models Theory, Methods and Evaluation, Cambridge University Press. ABSTRACT MODEL EVALUATION AND SELECTION IN GENERALIZED LINEAR MODELS: AN EXAMPLE OF MOTOR OWN DAMAGE İNSURANCE In this paper, stages of modelling of one-yaer motor own damage insurance claim frequency data of special insurance company by generalized linear model is given. Model evaluation started graphical analysis continue with certain tests, AIC and BIC criterias are used for model selection. Results obtained are given by charts and interpreted. Key Words: Generalized Linear Model, Poisson Regression, Kolmogorow-Smirnov Test, AIC, BIC, Log- Likelihood 6 9

97 1. Giriş KESİLMİŞ LOMAX DAĞILIM VE BİR UYGULAMA Betül Zehra KARAGÜL *, Aktüerya Bilimleri Bölümü,Hacettepe Üniversitesi, Beytepe, Ankara, * betul.zehra@hacettepe.edu.tr Gamze ÖZEL İstatistik Bölümü,Hacettepe Üniversitesi, Beytepe, Ankara, gamzeozl@hacettepe.edu.tr İstatistiksel dağılımlar gerçek dünya fenomenlerinin tahmini ve tanımlanması için oldukça kullanışlıdırlar. Geçmiş yıllarda pek çok alanda veri modellemesi için sayısız klasik dağılım kapsamlı olarak kullanılmıştır.. Son gelişmeler iyi bilinen dağılımların genişlemesini sağlayan ve aynı zamanda uygulamada veri modellemesine oldukça esneklik kazandıran dağılımların kesimi üzerine odaklanmıştır. Pareto dağılım mal ve kaza sigortalarını modellemek için uygundur. Ağır kuyruk dağılım özelliğine sahiptir ve bu durum hasar fazlası fiyatlaması gibi büyük olayların yer aldığı uygulamalarda Pareto dağılım kullanımını uygun kılar. Pareto. tip dağılım aynı zamanda Lomax dağılım olarak bilinir ve olasılık yoğunluk fonksiyonu (oyf) eşitlik (1) deki gibidir 1 f x / 1 x /, x,, 0 (1) eşitlikte α biçim parametresi, λ ise ölçek parametresidir. Böylece ilgili kümülatif dağılım fonksiyonu (kdf) elde edilir. x F x 1 1, x,, 0 () Pek çok pratik çözümde kesilmiş dağılımlar doğal olarak ortaya çıkar. Örneğin sigorta, finans gibi rasgele bir değişkenin belirli bir aralıkta gözlemlenecek biçimde sınırlandırıldığı durumlarda oldukça etkili bir biçimde kullanılırlar. Bu çalışmada, kesilmiş Lomax dağılım elde edilmiş, istatistiksel özellikleri araştırılmış ve sigorta verisi üzerinde uygulaması yapılmıştır.. Kesilmiş Lomax Dağılım α, λ, a, ve b parametreleriyle elde edilen keskli lomax dağılımın oyf si şu biçimdedir, 1 x 1 f x, x,,,a,b 0 a b 1 1 (3) Böylece kesilmiş Lomax dağılımın kdf u da şekil (4) te verildiği gibidir, 7 a x 1 1 F x x,,,a,b 0 a b (4)

98 3. Bazı İstatistiksel Özellikler a. Momentler Dağılımların bir çok önemli karakteristik özellikleri momentlerine bakılarak öğrenilebilir. Kesilmiş Lomax dağılımın rinci momenti aşağıdaki gibi yazılabilir; 1 x 1 r b r E( X ) x dx a a b 1 1 b. Quantile (Yüzdelik) Fonksiyon Quantile fonksiyonlar genel istatistikte geniş kullanıma sahiptirler. Lomax dağılımın quantile fonksiyonu Q u, 0 u 1, şöyle bulunmuştur; KAYNAKLAR 1/ b Q u x 1 u u 1. (6) [1] Cramer, E. & Schmiedt, A. B. (011). Progressively type-ii censored competing risks data from Lomax distributions, Computational Statistics and Data Analysis, 55, 3, [] Kleiber, C. & Kotz, S. (003), Statistical Size Distributions in Economics and Actuarial Sciences, Wiley Series in Probability and Statistics 470, John Wiley & Sons. (5) ABSTRACT TRUNCATED LOMAX DISTRIBUTION AND AN APPLICATION Heavy-tail probability distributions are very common in insurance with an upper truncation and/or a threshold. In this study we introduce a truncated version of the Lomax distribution which is one of the heavy-tail distributions and describe the characteristics of this distribution. The statistical properties such as moments, quantile function and order statistics are also obtained. Its probability density function for the selected parameters has been shown graphically. Then, the maximum likelihood estimators are constructed for estimating the unknown parameters of the truncated Lomax distribution. Key Words: Truncated Lomax Distribution, Moments, Quantile function, Order statistics, Maximum likelihood estimation. 8 9

99 ÖLÜM SAYILARININ DAĞILIMININ ÖLÜMLÜLÜK MODELLEMESİNE ETKİSİ Funda KUL Hacettepe Üniversitesi Aktüerya Bilimleri Bölümü Meral SUCU Hacettepe Üniversitesi Aktüerya Bilimleri Bölümü 1. Giriş Ölümlülük modelleri, Demografi alanında nüfus projeksiyonlarının yapılmasında ve Aktüerya Bilimleri alanında ise sosyal güvenlik kurumları, emeklilik ve hayat sigortası şirketlerinin yükümlülüklerine ilişkin sermaye gereksiniminin belirlenmesi ve değerleme çalışmalarında kullanılmaktadır. Ayrıca ülkelerin geleceğe ilişkin planlamaları açısından da önemlidir. Ölümlülük modelleri, deterministik ve stokastik ölümlülük modelleri olarak ikiye ayrılmaktadır: Deterministik ölümlülük modellerinde, ölüm hızları veya ölüm oranları yaşın bir fonksiyonu olarak tanımlanmaktadır[4]. Bu modellerde, gelecekteki ölüm hızlarının değişimin de aynı şekilde devam edeceği varsayımı altında ölümlülük modellenmektedir. Deterministik ölümlülük modellerinde zaman içinde ölüm hızlarındaki değişim dikkate alınmamakta ve popülasyon içindeki tüm bireylerin ölümlülüklerinin aynı olduğu düşünülmektedir. Bu modellerde, ölüm hızı veya oranının zamana ve farklı yaşlara göre değişimi dikkate alınmadığından, ölümlülük projeksiyonlarında önemli ölçüde sapmalar gözlenmiştir. Bu nedenle stokastik modeller geliştirilmiştir [1]. Zaman etkisini dikkate alan ilk stokastik ölümlülük modeli, 199 yılında Ronald Lee ve Lawrance Carter tarafından oluşturulmuştur [3]. Bu modelde tek bir zaman indeksi fonksiyonu ile ölümlülükteki uzun dönem değişimleri tanımlanmaya çalışılmıştır.. Lee ve Carter Modeli Takvim yılı t ve en son tam yaş x ile gösterilmiştir. Yaş ve takvim yılına göre merkezi ölüm hızları şu şekilde elde edilmiştir: m xt, D E xt, (1) xt, Burada; D : t. takvim yılında x yaşında ölen kişi sayısını, xt, E xt, : t. takvim yılı ortasında x yaşındaki kişi sayısını göstermektedir.ölümlülük modellemesinin daha basit olarak yapılabilmesi amacıyla kesirli yaşlar için ölümlülüğün sabit olduğu varsayılmıştır. Lee ve Carter (199) modelinde, merkezi ölüm hızındaki takvim yılı etkisinin tanımlamak için ARIMA zaman serisi modeli kullanılmaktadır. Bu modelde, yaş ve takvim yılına göre merkezi ölüm hızı, log m = + () ( (1) () () x, t x x t x, t eşitliği ile gösterilir. Burada; (1) x : (x) yaşı için merkezi ölüm hızının doğal logaritmasının ortalamasını, () t () x, : zamana göre ölüm hızındaki değişimi, : yıllar itibariyle ölüm hızının genel düzeyindeki değişim hızını, xt : ortalaması sıfır ve sabit varyanslı Normal dağılıma sahip hata terimini göstermektedir. 3. Çalışmanın Amacı 9 Literatürde yapılan çalışmalarda yaş ve takvim yılına 9 göre ölüm sayılarının Poisson dağılımına uyduğu varsayılarak En Çok Olabilirlik Yöntemi'ne göre parametre tahmini yapılmaktadır. Bu çalışmada yaş ve takvim yılına göre ölüm sayılarının Poisson dağılımının yanında Binom ve Negatif Binom dağılımına uyduğu varsayımı altında Lee ve Carter (199) ölümlülük modeli için En Çok Olabilirlik Yöntemi'ne göre parametre tahminleri R programlama dili kullanılarak elde edilmiştir [].

100 4. Uygulama ve Sonuçlar Çalışmada Türkiye için yılları arası için cinsiyet ayrımında beşerli yaş gruplarında ölüm sayıları ve riske maruz kalan birim sayıları kullanılmıştır. Literatürde sıklıkla kullanılan karşılaştırma kriterleri yardımıyla elde edilen sonuçlar yorumlanmıştır. KAYNAKLAR [1] Koissi, M.C., Shapiro, A.F., (008), The Lee-Carter Model Under The Condition of Variables Age-Specific Parameters, Actuarial Research Conference, Regina, Canada,. [] Kul, F., 014, Ölümlülük Yapısındaki Değişimin Modellenmesi ve Projeksiyonu, Hacettepe Üniversitesi, Fen Bilimleri Enstitüsü, Aktüerya Bilimleri AnaBilim Dalı, Doktora Tezi (Devam ediyor). [3] Lee, R.D., Carter, L., (199), Modeling and Forecasting U.S. Mortality, Journal of the American Statistical Association, 87, 419. [4] Tabeau, E., Van Den Berg Jeths, A., Heathcote, C., (001), Forecasting Mortality in Developed Countries Insights From A Statistical, Demographic, and Epidemiological Perspective, Demographic and Epidemiological Perspective, Kluwer Academic Publishers, London, 3,5,7. ABSTRACT EFFECT OF DEATH NUMBER DISTRIBUTION ON MORTALITY MODELING Mortality forecasts are playing an important role for Demography and Actuarial Science. Early attempts to model mortality did not take account of potential future improvements in mortality rates. Many stochastic mortality modelling methodologies are developed in time. The aim of this paper is to investigate effect of death number distribution on mortality modeling. Deaths and exposures to risk of Turkish male and female population are modelled seperately. Key Words: Death Distribution, Lee-Carter, Mortality Modeling. 00 1

101 1. Giriş SABİT VE DEĞİŞKEN KATKILI BİREYSEL EMEKLİLİK PLANLARI Murat KIRKAĞAÇ*, Yasemin GENÇTÜRK Hacettepe Üniversitesi, Fen Fakültesi, Aktüerya Bilimleri Bölümü, 06800, Ankara/TÜRKİYE Bireysel Emeklilik Sistemi (BES), kişilerin aktif çalışma yaşamları süresince yaptıkları tasarrufları uzun vadeli yatırıma yönlendirerek emeklilik dönemlerinde, yaşam standartlarını koruyabilecekleri bir gelir elde etmelerini sağlayan özel bir emeklilik sistemidir [1]. Temelde katkısı belirli emeklilik planları, faydası belirli emeklilik planları ve karma emeklilik planları olmak üzere üçe ayrılan emeklilik planlarında, bireysel emeklilik planları katkısı belirli emeklilik planları olup bu planlarda katkılar sabit veya değişken olabilir. Bu çalışmada sabit katkılı geleneksel planların yanı sıra değişken katkılı, esnek bireysel emeklilik planları da ele alınmıştır.. Sabit Katkılı Bireysel Emeklilik Planları Sabit katkılı bireysel emeklilik planları Türkiye de dahil olmak üzere birçok ülkede çoğunlukla kullanılan geleneksel emeklilik planları olup bu planlarda emeklilik hesabına düzenli aralıklarla, sabit katkılar yapılmaktadır. Bu katkılar genellikle maaşın belirli bir oranı olmakla birlikte önceden belirlenen sabit bir miktar da olabilir. i A, finansal danışman tarafından yapılan getiri tahminini, F T, dönem sonunda hedeflenen fon büyüklüğünü göstermek üzere, katılımcı tarafından her dönem başında yapılacak sabit katkı miktarı (C) aşağıdaki eşitlikten hesaplanmaktadır: C.. s F T T % ia FT T (1 ia) 1 i / (1 i ) A A (1) 3. Değişken Katkılı Bireysel Emeklilik Planları Önerilen bu plan Box ve Luceno [] tarafından yapılan sanayideki süreç kontrolünde kullanılan yönteme dayanmaktadır. Değişken katkılı bireysel emeklilik planları; katılımcı tarafından fona yapılacak katkı miktarının, gerçekleşen fon büyüklüğü ile hedeflenen fon büyüklüğü arasındaki fark göz önünde bulundurularak, sabit miktarda katkı yerine hedef fona ulaşılması için sistematik olarak belirlenen değişken miktarlarda katkının yapıldığı birikim planlarıdır. C t (t,t+1) zaman aralığında fona yapılacak katkıyı, D t, t anında fondaki açığı göstermek üzere, değişken katkı miktarı (C t ); t Ct C 1D t D t j () j 0 biçimindedir. Gerçekleşen fon büyüklüğü hedeflenen fondan saptıkça açık veya fazlalık oluşur. t anındaki farkın 1 katı katkıya eklenir. 1 in uygulama değeri düşük olduğu için bu farkın tamamı o anda katkıya eklenmiş olmaz. Bu nedenle sadece t anında değil, t anından önceki zamanlarda ortaya çıkan açıkların da göz önünde bulundurularak bu açıkların kümülatif toplamının katı kadarının daha ilave edilmesi gerekmektedir. Bu sayede açıkların, açık oluştuğu anda tek seferde katkıya eklenmesi 1 yerine bu açıkların tüm döneme yayılması sağlanmış ve katılımcının yüksek miktarlarda katkı yapmasının 01 önüne geçilmiş olur [3]. Faydası belirli emeklilik planlarında fonlanmamış yükümlülüğün amortismanında yaygın olarak kullanılan, fonlanmamış yükümlülüğün belirli bir döneme yayılarak amortize edildiği yöntem (Spread Period Method) kullanılarak da değişken katkılar belirlenebilir.

102 Yatırım getirisinin tahmin edilenden farklı olması nedeniyle fonun vade sonu değerini gösteren f T, hedef fon büyüklüğü F T den farklı olacaktır. Dolayısıyla vade sonunda bir açık meydana gelecektir. Bu açık miktarı; hedeflenen fon büyüklüğü ile T zamanında gerçekleşen fon büyüklüğü arasındaki farka eşittir: D T = F T f T (3) Katılımcı için risk, bu açığın yüksek olmasıdır. Bu açığın negatif olması ise fazlalık olarak adlandırılır. Fonda açık da fazlalık da istenmeyen durumlardır. 4. Uygulama Bu çalışmada, tekrarlı bir benzetim çalışması ile sabit ve değişken katkılı bireysel emeklilik planlarında dönem sonu açık miktarları karşılaştırılarak; değişken katkılı bireysel emeklilik planlarında dönem sonu açık miktarının sabit katkılı bireysel emeklilik planlarına göre daha düşük olduğu, hedeflenen fon büyüklüğüne daha çok yaklaşıldığı ve değişken katkılı planların daha az riskli olduğu sonucuna varılmıştır. Aynı zamanda vade değişimi, hedeflenen fon büyüklüğündeki değişim ile lamda katsayılarındaki değişimin sonuçlara etkisi de incelenmiştir. KAYNAKLAR [1] E.G.M Emeklilik Gözetim Merkezi A.Ş., (Aralık, 014). [] Box, G.E.P., Luceño, A., Discrete Proportional Integral Control with Constrained Adjustment, The Statistician, 44(4), , [3] Owadally, I., Haberman, S., Hernández, D.G., A Savings Plan with Targeted Contributions, The Journal of Risk and Insurance, 79(1), 1-6, 01. ABSTRACT INDIVIDUAL PENSION PLANS WITH FIXED AND TARGETED CONTRIBUTION In individual pension plans, the saver usually determines a particular fund target and contributes in order to reach this fund target. There are two methods to be used in order that this fund target to be reached. One of these methods is individual pension plans with fixed contribution, which is commonly used in individual pension plans, while the other one is individual pension plans with targeted contribution. In this study, a simulation with iterations is carried out in order to examine in which method fund target is approached more and which one is more risky. It was found out that final fund deficit is lower in the pension plans with targeted contribution than that of the pension plans with fixed contribution, fund target was approached more in the pension plans with targeted contributions, and pension plans with targeted contributions were less risky. Key Words: Individual Pension Sysyem, Individual Pension Plans With Fixed Contribution, Individual Pension Plans With Targeted Contribution, Fund Target, Simulation. 0 1

103 SESSION 3 İSTATİSTİKSEL KALİTE KONTROL 03 1

104 ÇOK DEĞİŞKENLİ OTOKORELASYONLU SÜREÇLER İÇİN KONTROL GRAFİKLERİ Bülent ALTUNKAYNAK* Oğuzhan Fırat ALTUN Gazi Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 06500, Ankara, TÜRKİYE 1. Giriş Geleneksel çok değişkenli kontrol grafikleri, bir ürüne ya da sürece ait değişkenleri eş zamanlı inceleyen ve verinin zaman boyunca bağımsız olduğunu varsayan kalite kontrol yaklaşımlarıdır. Ancak birçok süreçte veri otokorelasyona sahiptir. Çok değişkenli otokorelasyonlu süreçler kısaca VAR(p) veya MAR(p) olarak adlandırılır. Buradaki p otokorelasyonun derecesini göstermektedir. Otokorelasyonlu süreçlerin kontrol grafikleriyle takip edilmesinde genelde iki temel yaklaşım ileri sürülmektedir. Bunlardan birincisi geleneksel kontrol sınırlarını süreç standart sapmasının tahmininden elde edilen otokorelasyonu dikkate alarak düzeltmek, ikincisi ise zaman serisi modellerine dayalı kontrol grafiklerini kullanmaktır. Bu çalışmada, çok değişkenli otokorelasyonlu süreçler için Z, Hotelling T, MEWMA ve MCUSUM kontrol grafiklerinin etkinlikleri simülasyon verisi kullanılarak karşılaştırılmıştır.. VAR Süreçleri İçin Kontrol Grafikleri Z kontrol grafiği, çok değişkenli otokorelasyonlu veriler için Kalgonda ve Kulkarni tarafından geliştirilmiştir [1]. Süreç kontrol altında iken test istatistiği Z it y 0 it i (0) ii, i1,,..., p (1) şeklinde verilebilir. Süreç kontrol altında iken Zt max[ Zit ] C (0), yazılabilir. Hotelling T noktaları grafiği, sürecin ortalama vektörü ve varyans-kovaryans matrisi biliniyorken grafikteki kontrol χ ' -1 0 = n(χ-μ) (Χ-μ) () değerlerinin hesaplanması ile elde edilir. Üst kontrol sınırı olur. p, MEWMA kontrol grafiği ise aşağıdaki gibi verilebilir []. Z RX ( R) Z, i 1,,... (3) i i i1 ' 1 i iz i i Z Z H olduğunda süreç kontrol dışı sinyal verir. MCUSUM grafiği, çok değişkenli birikimli toplam grafiği olarak bilinir. Çok değişkenli CUSUM metodu, 1 1 C ' n S n n Sn n 0 (4) şeklinde ifade edilebilir [3]. 04 1

105 3. Uygulama Uygulama için ortalama vektörüne ait 4 farklı durum için veri setleri üretilmiştir. Ortalama vektöründe herhangi bir farklılaşmanın olmadığı durum A veri seti ile gösterilmiştir. Bu durumda ortalama vektörü (, ) (0,0) olarak alınmıştır. B veri seti ikinci değişkene ait ortalamada 1 birimlik sağa doğru kaymanın olduğu duruma karşılık gelmektedir. C ve D veri setleri birinci değişkene ait ortalamada sırasıyla sağa ve sola birimlik kaymaları temsil etmektedir. Her bir veri seti için n 1 olmak üzere 15 örneklem seçilmiştir. Bu verilerin türetilmesinde otoregressif parametre matrisi ve kovaryans matrisi aşağıdaki gibi alınmıştır. 1 diag(0.5,0.7) Elde edilen sonuçlarda sürecin kontrol altında olduğu durumda Z grafiğinin diğerlerine göre daha etkin olduğu ve yanlış sinyal vermediği görülmüştür. Ancak kontrol dışı durumlarda özellikle süreçteki küçük değişimleri yakalamakta Z grafiği iyi sonuçlar vermemiştir. Birinci değişkendeki farklılaşma T grafiği tarafından da tespit edilememiştir. Kontrol dışı durumlar tespit etmede MEWMA grafiği daha etkin görülürken kaymanın hangi veri noktasında başladığını belirlemede yeterince etkili görülmemiştir. KAYNAKLAR [1] Kalgonda A.A. and Kulkarni S. R. (004), Multivariate Quality Control Chart for Autocorrelated Processes, Kolhapur-India, Taylor & Francis. [] Lowry C.A., Woodall W.H. Champ and Rigdon S.E. (199), A Multivariate Exponentially Weighted Moving Average Chart, USA, Taylor & Francis. [3] Crosier R.B. (1988), Multivariate Generalizations of Cumulative Sum Quality-Control Schemes, United States of America, Taylor & Francis. ABSTRACT CONTROL CHARTS FOR MONITORING MULTIVARIATE AUTOCORRELATED PROCESS Statistical process control provides an important toolbox for improving the process performance and maintaining an efficient manufacturing process. One of the basic assumptions for traditional multivariate control charts is that the data are independent in time. On the other hand, in many cases, the data are serially dependent and cross-correlated. In this study, the performance of the multivariate control charts for different shift sizes are compared using simulated data. To limit the complexity, we use a first-order vector autoregressive process and focus mainly on bivariate data. Key Words: Multivariate Data, Autocorrelation, Z chart, MEWMA, MCUSUM, Hotelling T 05 1

106 HİZMET KALİTESİNİN ÖLÇÜLMESİ: BANKACILIK SEKTÖRÜNDE BİR UYGULAMA BURÇİN GÜL*, PELİN TOKTAŞ** *Başkent Üniversitesi, Bağlıca Kampüsü, Eskişehir Yolu 0. km, Fen Bilimleri Enstitüsü, Kalite Mühendisliği Anabilim Dalı, ANKARA **Başkent Üniversitesi, Bağlıca Kampüsü, Eskişehir Yolu 0. km, Mühendislik Fakültesi, Endüstri Mühendisliği Bölümü, ANKARA 1. Giriş Bir işletmenin rekabet avantajı sağlayabilmesi, rakiplerinden daha kaliteli ürün ve ya hizmet sunması müşterilerin isteklerini karşılayabilmesi ile mümkün olabilir. Son dönemlerde hizmet sektörünün ekonomi içindeki payını da göz önünde bulundurursak, önemi giderek artan hizmet sektöründe başarılı olabilmek için sunulan hizmetin kalitesinin ölçülmesi gerekmektedir. Hizmetin sahip olduğu özelliklerden ötürü kalitesinin ölçülmesi ürün kalitesinin ölçülmesine kıyasla çok daha zor ve karmaşıktır. Hizmet kalitesi ölçümü üzerine literatürde birçok çalışma mevcuttur [1], [], [3]. Bu çalışmalar gözden geçirildiğinde hizmet kalitesi kavramının açıklanması ve ölçümü için birçok modelin oluşturulduğu sektörlere göre yöntemlerin geliştirildiği görülmektedir. SERVQUAL yönteminin ise incelenen çalışmalarda en sık kullanılan yöntem olduğu görülmüştür [4], [5]. Söz konusu bu yöntemin çok farklı alanlarda kullanıldığı görülmüştür. Hizmet kalitesinin ölçümü için kullanılan SERVQUAL yöntemi, bankaların sunduğu hizmeti ölçmek için de kullanılmaktadır.. Uygulama X Bank müşterilerinin bankalarına ilişkin algılanan ve beklenen hizmet kalitesi düzeyini SERVQUAL yöntemiyle ölçmeyi amaçlayan bu çalışma için X Bank ın Rüzgarlı ve Yıldız Şube leri müşterilerinden basit tesadüfi örnekleme yöntemi ile toplam 39 kişiye uygulanmıştır. Çalışmada tek bir ilin sadece iki şubesinin bir dönemlik kesiti ele alınarak yapılmıştır. Elde edilen veriler analiz edilerek müşterilerin beklenti ve algılama düzeyleri karşılaştırılmıştır. Araştırma sonuçlarına göre algılama düzeyleri yüksek çıkmasına rağmen beklentilerin de yüksekliği, SERVQUAL skorlarını negatif büyüklüğe taşımıştır. Ayrıca, X Bank ın hizmet kalitesini ölçmeyi amaçlayan çalışmanın bu bölümünde SERVQUAL Yöntemiyle elde edilen ölçüm sonuçlarını görselleştirerek bilgi türetmek için çalışmaya Quadrant Analizi eklenmiştir. Elde edilen sonuçlar doğrultusunda, X Bank yetkililerine önerilerde bulunulmuştur. KAYNAKLAR [1] Ghobadian, A. Speller, S. ve Jones, M. (1994), Service Quality Consepts And Models, International Journal Of Quality And Reliability Management, 11(9), s. 51. [] Grönross C. (1984), A Service Quality Model and its Marketing Implications, 18(4), s [3] Mei, A.W.O., Dean, A.M., ve White, C.J. (1999), Analyzing Service Quality in the Hospitality Industry, Managing Service Quality 9, s [4] Parasuraman, A. Zeithaml, V.A. ve Berry, L.L. (1985), A Conceptual Model of Service Quality and its Implications for Future Research, Journal of Marketing, 49, s [5] Parasuraman, A. Zeithaml, V.A. ve Berry, L.L. (1980), SERVQUAL: A Multipleitem Scale for Measuring Customer Perceptions of Service Quality, Journal of Retailing, 64, s

107 ABSTRACT THE MEASUREMENT OF SERVICE QUALITY: AN APPLICATION OF BANKING SECTOR Service quality is one of the important factors that affect the success of firms operating in service sector. Service is an intangible concept, so control and evaluation of service quality causes many problems. Many methods have been developed to analyze service quality in literature. Researchers mostly prefer SERVQUAL method to examine the difference between perceptions and expectations of customers. In this study, service quality is measured and compared by using SERVQUAL method in two branches of Bank X in Ankara. In conclusion, some advices have been given to Bank X to improve their service quality. Key Words: SERVQUAL method, banking, service quality, quadrant analysis. 07 1

108 1. Giriş HODGES-LEHMANN TAHMİN EDİCİSİNE DAYALI PARAMETRİK OLMAYAN KONTROL KARTI Sema ALTIN Dokuz Eylül Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 35370, İzmir, TÜRKİYE, İstatistiksel süreç kontrolünün temel hedefi süreci değiştiren özel nedenleri olabildiğince hızlı bir şekilde belirlemek ve süreci kontrol altında tutup düzeltici önlemler alabilmektir. Kontrol kartları, bu amacı yerine getirmek için en çok kullanılan tekniktir. Kontrol kartı, ilk olarak 190 yıllarında Walter A. Shewhart tarafından Bell Labs adına çalışmaları sırasında geliştirilmiştir. Shewhart kontrol kartları, sürecin normal dağılım gösterdiği varsayımı altında kullanılmış ve oldukça iyi sonuçlar vermiştir. Ancak, bazı uygulamalarda araştırmacı, süreç dağılımı hakkında yeterli bilgiye sahip değildir ya da süreç normal dağılım göstermemektedir. Yaygın olarak kullanılan Shewhart kontrol kartları, Cusum ve Ewma kontrol kartları, süreç dağılımı normal olmadığında güvenilir sonuçlar vermezler. Daha iyi sonuçlar elde edebilmek için yeni kontrol kartları geliştirilmiştir ve bu yeni kontrol kartları, normallik varsayımına ya da genel bir ifade ile herhangi belirli bir parametrik dağılımın varsayımlarına bağlı değildir. Bu kartlar, Dağılımdan bağımsız (Distribution-free) ya da Parametrik olmayan (Nonparametric) kontrol kartları olarak adlandırılır. Bu çalışmada, Hodges-Lehmann tahmin edicisinden yararlanılarak elde edilen parametrik olmayan kontrol kartı (HL kontrol kartı) üzerinde durulacak ve normallik varsayımı olmadan, HL kontrol kartının diğer parametrik kartlara göre etkinliği incelenecektir..hodges-lehmann Tahmin Edicisi Her biri n örneklem genişliğinden oluşan m tane alt grup ele alınırsa; X 1,X,,X n seçilen rasgele örneklemdir. HL tahmin edicisini hesaplama adımları: 1. M = n(n+1) değeri hesaplanır.. Walsh averages(w r ) = X i+x j, r =1,,,M, i j, i=1,,,n, j=1,,,n değerleri hesaplanır. 3. Hodges-Lehmann tahmin edicisi (ϴ ) ϴ ={ W (k+1), M tek (W (k) + W (k+1) )/, M çift } k= { M 1 M, M tek, M çift } KAYNAKLAR [1] Chakraborti,S., Van Der Laan,P., Bakır S.T.(001). Nonparametric Control Charts: An Overview and Some Results. Journal of Quality Technology. Sayı [] Pongpullponsak,A., Jayathavaj,V.(014). The New Hodges-Lehmann Estimator Control Charting Technique for the Known Process Distributions. International Conference on Applied Statistics 014, Thailand [3] Ch ng,c.k., Quah,S.H., Low,H.C.(004). The Use of Hodges-Lehmann Estimator in Multiple Response Optimization with Replication. Matematıca. 0() [4] Laha,K.A.,Gupta,D.,Choubey,A.(005). Performance of Nonparametric Control Charts. Indian Institute of Management ABSTRACT

109 NONPARAMETRIC CONTROL CHART BASED ON HODGES-LEHMANN ESTİMATOR Nonparametric or distribution-free charts can be useful in statistical process control problems when there is limited or lack of knowledge about the underlying process distribution. The purpose of this study is introduce the Hodges-Lehmann control chart which based on Hodges-Lehmann estimator and examine the efficiency of the chart. Key Words: Nonparametric control chart, Hodges-Lehmann estimator, Walsh average, Statistical process control. 09 1

110 İSTATİSTİKSEL SÜREÇ KONTROLÜ: BİR ÖRNEK UYGULAMA 1 Ozan ALTUNAY, Hakan ALTUNAY 1 Fırat Üniversitesi, Mühendislik Fakültesi, Bilgisayar Mühendisliği Bölümü, Elazığ, ozanaltunay@icloud.com Fırat Üniversitesi, Mühendislik Fakültesi, Endüstri Mühendisliği Bölümü, Elazığ, haltunay@firat.edu.tr. İstatistiksel Süreç Kontrolü, incelenen herhangi bir üretim veya hizmet sürecinde beklenmeyen bir değişkenlik söz konusu olduğunda, bu değişkenliği neden olan sorunun tespit edilerek çözüm aranması ve sürecin planlandığı gibi ilerlemesini sağlamak amacıyla çeşitli istatistiksel yöntem ve tekniklerin kullanılması olarak tanımlanmaktadır [1], []. Bu teknikler süreçlerde; üretim kalitesinin kontrol edilmesi, sürdürülmesi ve iyileştirilmesi için kullanılmaktadır. Söz konusu istatistiksel süre kontrolü tekniklerinden en yaygın olanı kontrol şemalarıdır. Kontrol grafikleri, öncelikle süreç hatalarının tespit edilmesi ve önlenmesi, sonrasında ise süreç kalitesinin iyileştirilmesini sağlar [3]. İstatistiksel Süreç Kontrolü şemaları doğal bir değişkenliği ifade eden dağılımdan sapma olduğu hipotezinin alınan her yeni örnek grubu ile devamlı olarak test edilmesi şeklinde ifade edilmektedir [4]. İlk aşamada, bir kontrol grafiğinin süreci en iyi şekilde temsil edebilmesi için kontrol sınırları doğru belirlenmelidir. Sonraki aşamada ise süreçler belirli bir süre gözlenerek numuneler alınmaktadır. Alınan numunelerden elde edilen değerler ise kontrol şemalarına işlenerek sürecin kontrol altında olup olmadığını belirlemektedir. Örneğin; alınan numunelere ilişkin değerler belirlenen sınır değerlerinin dışında kalıyorsa süreç kontrol dışındadır. Bu çalışmada bir mermer işleme fabrikasında karşılaşılan en önemli kalite problemlerinin belirlenmesi, üretim süreçlerindeki değişkenliğin analiz edilmesi ve bu değişkenliğin azaltılması amacıyla İstatistiksel Süreç Kontrolü tekniklerinden yararlanılmıştır. Süreçlerin kontrolünün ve sürekliliğinin sağlanması için kontrol şemaları(grafikleri) kullanılmıştır. Süreçlerden alınan örnekler ile grafiklere ait sınır değerleri elde edilmiştir. Oluşturulan kontrol grafikleri yardımıyla işletme içerisindeki üretim süreçlerine ait değişkenlikler takip edilmiştir. Bu değişkenliklere sebep olan nedenler ortaya konularak kontrol grafikleri revize edilmiştir. KAYNAKLAR [1] Anagün A.S. (1997), Düşük Hacimli Üretimde İstatistiksel Proses Kontrolü: Kontrol Grafikleri, III. Ulusal Ekonometri ve İstatistik Sempozyumu, 71-81, Bursa, 9-30 Mayıs. [] Burmak, N. (1996), Toplam Kalite Yönetimi-İstatistiksel Süreç Kontrolü, Osmangazi Üniversitesi, Endüstri Mühendisliği Bölümü, Yayınlanmış Ders Notları, Ekim. [3] Koçer B. Birgören B. (004), Approaches for Problem Diagnosis via Statistical Process Control Charts, G. U. Journal of Science, 17(4), 59-69, 004. [4] Montgomery, D.C. (001), Introduction to Statistical Quality Control 4th ed., Wiley & Sons, New York. ABSTRACT STATISTICAL PROCESS CONTROL: A CASE STUDY Statistical process control is one of the most commonly used quality control techniques in all industries. Statistical process control contains various statistical techniques that are used to provide, continue and improve quality in manufacturing or service processes, the most highly used of these techniques are control charts. 1 Control charts are used to detect and prevent the process 10 problems primarily and also to improve the process quality eventually. In this study, we used statistical process control methods to determination of the quality problems and control them in a marble factory. Key Words: Statistical Process Control, Control Charts, Fault Detection, Quality Control.

111 NİCEL KALİTE KONTROL GRAFİKLERİNİN SİMÜLASYON VERİLERİ İLE KARŞILAŞTIRILMASI Aytaç PEKMEZCİ, Atilla GÖKTAŞ, Yunus Emre MERAL Muğla Sıtkı Koçman Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Kötekli, MUĞLA 1. ÖZET Gelişen dünyamızda üretici ve tüketicilerin konuştuğu ortak dillerden biri kalitedir. Ekonomideki gelişmeler ve küreselleşme sonucu artan rekabet işletmelerin yurt içi ve yurt dışında pazar bulma çabalarını hızlandırmıştır. Günümüzde işletmeler arasında yaşanan katı rekabet şartları, üreticileri minimum maliyetle yüksek kalitede ürün üretmeye zorlamaktadır. Üretimdeki temel amaç satılabilir nitelikteki ürünler olduğundan ürün kalitesinin tüketicinin kararını etkilediği söylenir. Ürün kalitesinde sürekli iyileştirmeyi hedefleyen işletmeler tüketicilerin beklentilerini, isteklerini, tepkilerini, tatmin derecelerini dikkate alarak daha iyi bir ürün veya hizmetin sunulmasını sağlamaya başlamıştır. Kalite Kontrol (KK) üretimin normal koşullar altında yürütülmesini sağlamada çok önemli rol oynayan, sistematik ve tesadüfî sebeplerin sonucu üretimin kontrol dışına çıkmasını hemen bildiren ve gerekli tedbirlerin zamanında alınmasına sağlayan metottur. Ayrıca en ekonomik, en kullanışlı ve tüketiciyi her zaman memnun eden bir ürün geliştirmek, tasarlamak, üretmek ve bakımını yapmaktır. KK ürünleri muayene ederek hataları önlemez ve süreci kontrol etmez. KK basit problemlere hızlı ve güvenilir çözümler getirir, karmaşık problemlere değişik seviyelerde çözüm gösterir. Kalite Kontrolde temel amaç özel nedenleri ve proses kaymalarını ortaya çıkarmaktır. Kontrol grafikleri bu amaç için kullanılan proses kontrol yöntemidir. Üretimden alınan örneklerden elde edilen ölçüm değerlerinin zaman içerisindeki değişimlerinin gösterildiği grafiklerdir. En önemli yararı üretim prosesinin geliştirilmesini sağlar. Üretim esnasında meydana gelebilecek özel bir sebebin üretimi etkilemeye başladığı en kısa zamanda ve en az zararlı bir yanılma ile yetkiliye haber verir ama hatayı tespit edip ortadan kaldıramaz. Günümüzde üretim kapasitelerinin büyümesi, hızlı ve yoğun üretim sistemlerinin gelişmesi, %100 muayene yerine ana kitleden rastgele alınan örnek gruba KK nın yapılması istatistik sayesinde olmuştur. KK gelecekteki üretime önem verir. Bunu sağlamanın en önemli metodu istatistiktir. Büyük miktarda üretimin en az malzeme ve işçilik ile en yüksek kalite de gerçekleşmesiyle istatistik KK da geniş uygulama alanı bulmuştur. Bu konuda yapılmış ilk çalışmalarda Shewhart, üretimden alınan örneklem genişliğinin n 10 olduğunda X grafiği ile birlikte hesaplanma kolaylığından dolayı R grafiğinin kullanılmasını, ancak örneklem genişliğinin n 10 olduğunda σ nın tahmin edicisi olarak R nin etkinliği s ye göre hızla azaldığından s kontrol grafiğinin kullanılmasını önermiştir. Yapılan sonraki çalışmalarda ise örneklem genişliğinin n 5 olması halinde X R, n 6 olması halinde X s kontrol grafiğinin kullanılmasının yeterli sonuç vereceği iddia edilmiştir. Bu çalışmada simülasyon programı yardımıyla sürecin kontrol altında olduğu varsayılan örneklem hacmi (n) 5 ile 5 arasında değişen, örneklem büyüklüğü (k) 50 olan 1000 seri rasgele üretilmiştir. Potansiyel Yeterlilik (C p ) İndeksine göre proses spesifikasyonlarını karşılayan her bir seri için X, R, s hesaplanmıştır. Hesaplanan bu değerler kullanılarak X R kontrol grafiği için Eşitlik 1 ve X s kontrol grafiği için Eşitlik ye göre Üst Kontrol Sınırları (ÜKS) ile Alt Kontrol Sınırları (AKS) belirlenmiştir. 11 1

112 ÜKS X X A R 3 R /d AKS = X 3 R /d X A R n n R 3d ÜKS R 3 d R(1 ) D R d d R 3d AKS R 3 d R(1 ) D R d d (1) 3s ÜKS = X 3 X X A3 s n c n 3 ÜKS s 3 ˆ s s(1 1 c4) B4s c 4 4 3s AKS = X 3 X X A3 s n c n 3 AKS s 3 ˆ s s(1 1 c4) B3s c 4 4 () Bu sınırlara göre sürecin kontrol altında olup olmadığı belirlenerek kontrol grafiklerinin performansları çeşitli kriterlere ve durumlara göre karşılaştırılmıştır. Aynı işlemler sürecin kontrol altında olmadığı varsayılan 1000 seri içinde yapılarak grafiklerin I. tip hataları çeşitli kriterlere ve durumlara göre karşılaştırılmıştır. Her iki işlem sonucunda örneklem hacmine göre hangi kontrol grafiğinin daha tutarlı sonuçlar vereceği belirlenmiştir. KAYNAKLAR [1] Montgomery, D.C., (001) Introduction to Statistical Quality Control, 4.th Edition, Arizona State University, USA. [] Birgören, B., (015) İstatistiksel Kalite Kontrolü, Nobel Yayın, Ankara, 195s. [3] Pekmezci, A., (005), İstatistiksel Kalite Kontrol Yöntemleri ve Uygulaması, Muğla Üniversitesi Fen Bilimleri Enstitüsü, Yüksek Lisans Tezi. [4] Gitlow, H.S., Oppenheim, A., Oppenheim, R., (1995) Quality Management: Tools and Methods for Improvement,. Edition, Irwin Inc., USA. [5] Firuzan, A.R., (1995) Shewhart Kontrol Kartlarında Kontrol Tarifelerinin Belirlenmesi, DEÜ, Fen Bilimleri Enstitüsü, Doktora Tezi. COMPARISON QUANTATIVE QUALITY CONTROL CHARTS BY USING SIMULATION DATA. ABSTRACT In this study, a simulation study is carried out evaluate the performance of quality control charts. For this aim, firstly, 1000 different series are randomly generated from a process assumed under control. The sample size for each of these series is fixed to be 50 and their sample volume varies from 5 to 5. Then the values of X, R, s are calculated for each series and whether a process is under control or not has been checked. Secondly, the study repeated with new generated data for a process that is not under control. The objective in this is to determine which control charts present more consistent result for both cases. Key Words: Quantative Quality Control Charts, Simulation 1 1

113 SESSION 3 ÇOK DEĞİŞKENLİ İSTATİSTİKSEL ANALİZ 13 1

114 AYKIRI DEĞERLERİN VARLIĞINDA FARKLI DAYANIKLI KOVARYANS MATRİS TAHMİNLERİNİ TEMEL ALAN LİNEER DİSKRİMİNANT ANALİZİ SONUÇLARININ İNCELENMESİ B. Barış ALKAN 1 Cemal ATAKAN 1 Sinop Üniversitesi, Fen-Edebiyat Fakültesi, İstatistik Bölümü, Sinop bbalkan@sinop.edu.tr Ankara Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Ankara atakan@science.ankara.edu.tr Lineer Diskriminant Analizi (Fisher, 1936), p tane özelliği bilinen gözlemleri doğal ortamdaki gerçek gruplarına (sınıflarına) hatalı sınıflandırma olasılığını minimize ederek ayırmayı amaçlayan çok değişkenli istatistiksel bir yöntemdir. Diskriminant analizinde, diskriminant (sınıflandırma, atama) fonksiyonu kitleler üzerine konan bazı varsayımlara göre elde edilir. Örneklemlerin alındığı kitlelerin kovayans matrislerinin eşit ya da eşit olmaması durumlarına göre farklı diskriminant fonksiyonları elde etmek mümkündür. Kitlelerin kovayans matrislerinin eşit olması durumunda lineer diskriminant fonksiyonu, farklı olması durumunda karesel diskriminant fonksiyonu elde edilir. π 1, π,, π k, k tane farklı kitle olsun. x, p-boyutlu bir gözlem vektörü f k yoğunluğu ile π k kitlesinden gelir. α 1, α,, α k bireyin sırasıyla π 1, π,, π k kitlelerine ait olması olasılıkları olsun. Burada α 1, α,, α k g lara önsel olasılıklar denmektedir ve k=1 α k = 1 dir. Genellikle, π k ~N(μ k, Σ k ), k = 1,, g, olduğu varsayılır.tüm grupların kovaryans matrisleri eşit (Σ 1 = Σ = = Σ k = Σ) olduğunda π k kitlesine yeni bir x gözleminin hatalı sınıflandırma olasılığı minimize edilir. Bu durumda d k (x) sınıflandırma fonksiyonu, d k (x) = x T Σ 1 μ k 1 μ k T Σ 1 μ k + In(α k ), k = 1,, g. (1) maksimize edilmiş olur (Todorov and Filzmoser 009). (1) eşitliği ile verilen d k (x) fonksiyonu, x de doğrusal olduğu için lineer diskriminant analizi (LDA) olarak ifade edilir. LDA da örneklem grup ortalaması ve örneklem kovaryans matrisi μ k ve Σ yı tahmin etmek için kullanılır. LDA aykırı değerlere karşı dayanıklı değildir. Aykırı değerlerin varlığında klasik lineer diskriminant analizi kullanımında elde edilecek sonuçlar gerçeği yansıtmaktan uzak olacaktır. Bu nedenle aykırı değerlerin varlığında lineer diskriminant analizinin dayanıklı versiyonunun kullanılması uygundur. LDA nin dayanıklı versiyonu μ k ve Σ parametrelerinin dayanıklı tahminleriyle yer değiştirilmesi ile elde edilebilir (Todorov and Filzmoser 009). Diskriminant analizinin dayanıklı versiyonlarının elde edilmesinde R istatistiksel yazılım paketinde yer alan robustbase, rrcov ve stats kütüphaneleri kullanılmıştır (R Development Core Team 009). Bu çalışmada, yapay bir veri kümesi üzerinden farklı dayanıklı kovaryans matrislerini temel alan diskriminant analizi sonuçlarının performansları incelenmiştir. 14 1

115 KAYNAKLAR [1] Fisher, R. (1936). The use of multiple measurements in taxonomic problems. Annals of Eugenics, 7, [] R Development Core Team (009). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN , URL http: // [3] Todorov, V. and Filzmoser, P. (009). An Object-Oriented Framework for Robust Multivariate Analysis. Journal of Statistical Software, 3(3). ABSTRACT EXAMINATION OF RESULTS OF LINEAR DISCRIMINANT ANALYSIS BASED ON DIFFERENT ROBUST COVARIANCE MATRIX ESTIMATES IN THE PRESENCE OF OUTLIERS Linear Discriminant Analysis (LDA) is not resistant to outliers. The results which will be achieved in the use of classical LDA will be far from the truth in the presence of outliers. Therefore,in the presence of outliers, using robust version of LDA is suitable. In this study, we examined the performances of linear discriminant analysis based on different robust cavariance matrix estimates on the artificial data sets. Key Words: linear discriminant analysis, robustness, outliers 15 1

116 BÜYÜK VERİ BÜYÜK PROBLEM: SİNGÜLER KOVARYANS YAPISI Esra PAMUKÇU a a Fırat Üniversitesi Fen Fakültesi İstatistik Bölümü,3119,Elazığ epamukcu@firat.edu.tr 1. Giriş X ; ( pxp ) boyutlu bir veri matrisi olsun. Veri, Gauss veya diğer eliptik konturlu olan çok değişkenli-t, çok değişkenli üstel, çok değişkenli Cauchy, çok değişkenli Laplace gibi dağılımlar ile olasılıksal olarak modellendiği zaman, kovaryans matrisi tahmin edilmelidir. Örnek boyutu n, değişkenlerin boyutu p den küçük olduğu zaman ( n p ), nın klasik örnek maksimum olabilirlik tahmin edicisi ˆ MLE durağan olmayan, kötü şartlandırılmış, pozitif tanımlı olmayan ve hatta singüler bir yapıya sahiptir. Böyle bir durumda, pratik olarak tüm çok değişkenli analizlerde ihtiyaç duyulan ve hassas matris (precision matrix) olarak da ifade edilen kovaryans matrisinin tersi hesaplanamaz. Gerçek kovaryansın doğru bir tahminine dayanan çok değişkenli teknikler için, son zamanlarda küçük örneklem boyutu altında yüksek boyutlu bir pxp kovaryans matrisi tahmin etmek önemli bir problem haline gelmiştir. Büyük p, küçük n (Big p, Small n) probleminin olduğu yerlerde, klasik örnek kovaryans matrisi sistematik olarak bozulan bir öz-yapıya sahip olduğu için bunun üstesinden gelecek farklı tahmin ediciler geliştirmek gereklidir. Stein (1956) da çok öncelerden de rapor edildiği gibi Σ kovaryans yapılı ve sıfır ortalamalı normal dağılan bir anakütleden gelen n boyutlu bir örneğin kovaryans matrisinin maksimum olabilirlik tahmini ˆ MLE, p/n büyük olduğu zaman yansız ve pozitif tanımlı olmasına rağmen, kovaryans matrisinin doğru bir tahmin edicisi değildir. Bu durumda kovaryans matrisinin yapısı, en büyük özdeğerlerin yukarı yönde yanlı, en küçük özdeğerlerin aşağı yönde yanlı olması şeklinde bir bozulmaya uğrar. Bu durumu gösterebilmek amacıyla farklı p/n oranlarına sahip veri setleri üretilmiş ve örnek kovaryans matrislerinin özdeğerleri hesaplanmıştır. Sonuçlar Şekil 1 deki gibidir. Büyük sayılardaki p değerlerinde, p/n oranını ihmal edilebilir yapabilmek için gerekli gözlem sayısına ulaşmak da zordur. Bu yüzden yüksek boyutlu kovaryans matrisleri için iyi şartlandırılmış bir tahmin edici bulmak önemlidir.. Yöntem ve Amaç Yapı olarak gözlem sayısının az, değişken sayısının fazla olduğu aşırı derecede küçük örnekleme sahip büyük veri setlerinde kovaryans yapıları için buraya kadar anlatılan bilgiler göz önüne alındığında, bu verilerin kovaryans matrislerinin maksimum olabilirlik tahminlerinin singüler yapıya sahip olup, pozitif tanımlı olmayacakları açıktır. Bu nedenle, maksimum olabilirlik tahminleri kullanılarak yapılacak klasik çok değişkenli istatistiksel analizlerin doğruluğu ve geçerliliği şüphelidir. 16 1

117 0 15 Farklı p/n oranları için özdegerlerin değişimi p/n=10 p/n= p/n=1 p/n=0.5 p/n= Özdegerler Şekil 1: 1000x100, 00x100, 100x100, 50x100, 10x100 boyutlarında üretilen veri setleri için özdeğerlerin değişimi. Bu çalışmada ilk olarak bu yapıya sahip olan veri setleri için, literatürde var olan bazı düzgünleştirilmiş ve/veya düzenlileştirilmiş kovaryans yapılarının kullanımı ile kovaryans matrisinin singülerlik probleminin çözülüp çözülmediği karşılaştırmalı olarak incelenecektir. İkinci olarak istatistik literatüründe ihmal edilmiş bir kovaryans yapısı olan ve Fiebig (1984) tarafından önerilen Maksimum Entropi Kovaryans Matrisi kullanımı ve onun avantajları gösterilecek ve ayrıca onun diğer yapılar ile hibritleştirilmesinden oluşmuş olan ve Pamukçu ark. (015) tarafından önerilen Hibrit Kovaryans Tahmin Edicisi (Hybrid Covariance Estimator-HCE) nin üstün tarafları tanıtılacaktır. KAYNAKLAR [1] Stein, C. (1956). Some problems in multivariate analysis. Part-1. Technical Report-6: Department of Statistics. Stanford University [] Fiebig, D., G. (1984). On the maximum entropy approach to undersized samples. Applied Mathematics and Computation.14: [3] Ledoit, O. ve Wolf, M. (004). A well conditioned estimator for large dimensional covariance matrices. Journal of Multivariate Analysis. 88: [4] Pamukcu E., Bozdogan H., Çalık S. (015). A Novel Hybrid Dimension Reduction Technique for Undersized High Dimensional Gene Expression Data Sets Using Information Complexity Criterion for Cancer Classification. Computational and Mathematical Methods in Medicine. Volume 015 (015), Article ID ABSTRACT BIG DATA, BIG PROBLEM: SINGULAR COVARIANCE STRUCTURE Estimation of the covariance matrices for small sample size and high dimensions, that is the n p problem, is a difficult problem that has recently attracted the attention of many researchers. When the sample size n is much smaller than the number of features, p, that is, when we have n p, the maximum likelihood (ML) estimator of the covariance matrix is neither invertible nor is it well conditioned. In this paper, therefore, our main objectives is to resolve the n p problem, we introduce the neglected Maximum Entropy (ME) covariance matrix along with other smoothed (or robust) covariance estimators and it s hybridized forms. Keywords: Big Data, Singular Covariance Matrix, Maximum Entropy Covariance Matrix. 17 1

118 DEĞİŞMEZ KOORDİNAT SEÇİMİ İÇİN ÖRNEKLEM DAĞILIŞLARININ KÜMELEME ANALİZİ İLE ELDE EDİLMESİ Yüksel ÖNER Samsun Ondokuz Mayıs Üniversitesi Fen Edebiyat Fakültesi İstatistik Bölümü Fikriye KABAKCI Recep Tayyip Erdoğan Üniversitesi Fen Edebiyat Fakültesi Matematik Bölümü Değişmez Koordinat Seçimi (ICS, Invariant Coordinate Selection) David E. Tyler ve arkadaşları tarafından çok değişkenli veri yapısını ortaya çıkarmak amacıyla tanımlanmış bir yöntemdir. Bu yöntem iki farklı örneklem dağılış matrisinin kullanımına dayanır. Bunlardan biri öncelikle veriyi saflaştırmak için kullanılırken diğeri saflaştırılmış veriye temel bileşen analizi uygulayarak verinin yönünü belirlemede kullanılır. Daha belirgin olarak bu dönüşüm, burada U, 1 1( ) T X Z S X U XB, T spektral değer ayrışımı ile tanımlanmış olup ile verilmiştir. T ( 1) S Z U DU, Hiyerarşik kümeleme yöntemleri nesnelerin, bireylerin veya değişkenlerin belirli bir sisteme göre bir dizi 1 şeklinde düzenlenmesidir Z 1 XS 1 ( X ) Bu dağılış matrisleri hakkında genel bir kural belirtilmeyip hangi dağılış istatistiklerinin en iyi sonuç vereceği problemi hala geçerliliğini korumaktadır. Bu çalışmada alt örneklemler kümeleme analizleri ile seçilmiş ve bunların varyans -kovaryans matrisleri dağılış istatistikleri olarak ICS de uygulamaya konulmuştur. Kümeleme analizi gruplanmamış ya da doğal grupları hakkında yeterli bilgi bulunmayan birimleri ya da değişkenleri benzerlik veya benzemezliklerine göre ya da bunların birbirlerine olan uzaklık veya yakınlıklarına göre sınıflandırmak ve araştırıcıya uygun işe yarar özetleyici bilgiler elde etmek amacıyla kullanılan yöntemlerdir. Kümeleme analizinde kümeleme yöntemleri genel olarak iki grupta toplanır, bunlar hiyerarşik kümeleme yöntemleri ve hiyerarşik olmayan kümeleme yöntemleridir. Bu çalışmada hiyerarşik kümeleme yöntemlerinden Basit bağlantı ( En yakın komşu) Tam bağlantı (En uzak komşu) Ortalama bağlantı

119 Medyan bağlantı hiyerarşik olmayan kümeleme yöntemlerinden ise K-ortalamalar tekniği En çok olabilirlik tekniği yöntemlerine başvurulmuştur. Bu çalışmada farklı veri setleri üzerine öncelikle kümeleme analizi uygulanmış bu yöntemlerden elde edilen alt örneklemlerin daha sonra ICS de kullanılmak üzere varyans- kovaryans matrisleri hesaplanmıştır. İlgili analiz ve hesaplamalar R programında gerçekleştirilmiştir.. KAYNAKLAR [1] David E. Tyler, Frank Critchley, Lutz Dümbgen and Hannu Oja, (009), Invariant co-ordiante Selection, J.R. Statist. Soc. B. (009) 71, Part 3, pp [] David Tyler, Breakdown properties of the M-estimators of multivariate scatter, Inst.Math. Stat. Bull. Vol:15, 116, (1986). [3] Klaus Nordhausen, Hannu Oja, David E. Tyler, Tools for Exploring Multivariate Data: The Package ICS, November 008, volume 8, Issue 6. [4] Anil K. Jain, Richard C. Dubes (1988). Algorithms for Clustering Data, Prentice Hall Englewood Cliffs, New Jersey. ABSTRACT SAMPLE SCATTER STATISTICS DERIVATION WITH CLUSTER ANALYSIS FOR INVARIANT COORDINATE SELECTION Invariant coordinate selection (ICS) has been introduced by David E. Tyler et al. It is defined to uncover structure of the multivariate dataset. This method based on two scatter statistics. In this study we apply some cluster analysis methods to find appropriate scatter statistics for ICS to our datasets. Since R includes package ICS, we have used R to analyse our dataset. Key Words: invariant coordinate selection, R, clustering 19 1

120 İKİ DEĞİŞKENLİ WEİBULL DAĞILIMLI KİTLELERDE DİSKRİMİNANT ANALİZİ Hayrinisa DEMİRCİ BİÇER* Kırıkkale Üniversitesi Fen Edebiyat Fakültesi İstatistik Bölümü Kırıkkale/Türkiye Cemal ATAKAN Ankara Üniversitesi Fen Fakültesi İstatistik Bölümü Ankara/Türkiye Cenker BİÇER Kırıkkale Üniversitesi Fen Edebiyat Fakültesi İstatistik Bölümü Kırıkkale/Türkiye İki değişkenli Weibull dağılımı, güvenilirlik teorisi ve yaşam (sağ-kalım) analizinde yaygın olarak kullanılmaktadır. T rasgele değişkeni parametreli üstel dağılıma sahip bir rasgele değişken olmak üzere, 1 Y T rasgele değişkeni ve parametreli Weibull dağılımına sahiptir. Benzer olarak, çok değişkenli üstel dağılımdan, çok değişkenli Weibull dağılımı da elde edilmektedir. Bu çalışmada, iki değişkenli Weibull dağılımına sahip iki kitle arasındaki diskriminant analizi problemi ele alınmıştır. Dağılımların parametreleri bilindiği ve bilinmediği durumlar için toplam hatalı sınıflandırma olasılığını minimize eden sınıflandırma kuralına göre sınıflandırma bölgeleri, diskriminant fonksiyonu ve sınıflandırma kuralı elde edilmiştir. Elde edilen diskriminant fonksiyonuna göre hata oranının nasıl etkilendiğini incelemek amacıyla bir simülasyon çalışması yapılmış ve hata oranı tahmin değerlerine ilişkin çalışma sonuçları verilmiştir. KAYNAKLAR [1] Adegboye, O. S. (1993), The Optimal Classification Rulefor Exponential Populations, Austral. Journal, 35, [] Fisher, R. A. (1936). The Use of the Multiple Measurements in Taxonomic Problems. Annals of Eugenics, 7, [3] Hanagal, D. D. (1996). A Multivariate Weibull Distribution, Economic Quality Control, Vol. 11, pp [4] Rinne, H. (009). The Weibull Distribution: A Handbook, Taylor & Francis Group, LLC. USA. ABSTRACT DISCRIMINANAT ANALYSIS OF BIVARIATE WEIBULL POPULATIONS In this study, we consider the discriminant analysis problem between the two populations with bivariate Weibull distribution. And also, classify regions, a discriminant function and allocation rules are obtained according to the principle of minimizing the probability of total misclassification for each cases which distributions parameters are known or unknown. Furthermore, A simulation study is conducted to the examine how the misclassification error rate is affected according to the obtained discriminant function and some results are given in the simulation study for the calculated misclassification error rate estimates according to the obtained allocation rule. Key Words: Bivariate Weibull distribution, error rate, discriminant analysis. 0 1

121 İnovasyon Endeksine Göre Türkiye nin Avrupa Ülkeleri Arasındaki Yeri Fatih ÇEMREK 1 Hakkı POLAT 1 Yrd.Doç. Dr.Eskişehir Osmangazi Üniversitesi İstatistik Bölümü Doktora Öğrencisi Eskişehir Osmangazi Üniversitesi İstatistik Bölümü 1 fcemrek@ogu.edu.tr hakkiplt@gmail.com İnovasyon Endeksine Göre Türkiye nin Avrupa Ülkeleri Arasındaki Yeri Bu çalışma, Avrupa Komisyonu tarafından, yenilikçiliği ölçmek için 5 alt gösterge ve bu alt göstergelerden hesaplanan 8 üst göstergeden oluşan Yenilikçilik Birliği Skor Tahtası (Innovation Union Scoreboard) verilerinden hareketle Türkiye nin yenilikçilik anlamında Avrupa ülkeleri arasındaki yerini belirlemeyi amaçlamıştır. 013 yılı için İnsan Kaynakları, Araştırma Sistemleri, Finans ve Destekler, Firma Araştırmaları, Bağlantılar ve Girişimcilik, Entelektüel Varlıklar, Yenilikçiler, Ekonomik Etkiler gibi konuları dikkate alan endekslerle yapılan kümeleme analizleri sonucunda ülkeler temelde 7 kümede toplanmıştır. Türkiye, Malta, Romanya, Makedonya ve Bulgaristan ile birlikte söz konusu göstergeler bakımından en vasat performansı gösteren iki kümeden birine dahil olmuştur. Çalışma sonucunda görülmüştür ki Türkiye yenilikçilik anlamında gelişmiş birçok Avrupa ülkesinin gerisinde kalmıştır. İnovasyon kavram olarak, hem bir süreci (yenilemeyi/yenilenmeyi) hem de bir sonucu ( yenilik i) ifade eder. AB ve OECD literatüründe inovasyon süreç olarak; bir fikri, pazarlanabilir bir ürün ya da hizmete, yeni ya da geliştirilmiş bir üretim ya da dağıtım yöntemine ya da yeni bir toplumsal hizmet yöntemine dönüştürmek olarak tanımlanır. Aynı zamanda bu dönüştürme süreci sonunda ortaya konan pazarlanabilir, yeni ya da geliştirilmiş ürün, yöntem ya da hizmeti de ifade etmektedir (TÜSİAD, 003). Benzer olarak OECD (005) inovasyonu; yeni veya önemli ölçüde değiştirilmiş ürün (mal ya da hizmet), veya sürecin; pazarlama yönteminin; ya da iş uygulamalarında, işyeri organizasyonunda veya dış ilişkilerde yeni bir organizasyonel yöntemin uygulanmasıdır. Şeklinde tanımlamaktadır. İnovasyon skor tahtası-karnesi, ülkelerin bulundukları konuma ilişkin belirli bir değer hesaplamakta, ayrıca büyüme oranlarını da ortaya koymaktadır. Türkiye, büyüme oranları dikkate alındığında sergilediği yüksek oranda büyüme performansını; en çok atıf alan bilimsel yayınlarda, işletmelerin Ar-Ge harcamalarında ve Topluluk ticari markalarında (community trademark) göstermektedir. Topluluk tasarımları kaleminde güçlü bir düşüş izlendiği aktarılmış, insan kaynakları, açık, mükemmel ve cazip araştırma sistemleri, finansman ve destekler ve firmaların yatırımları kalemlerinde ise ortalamanın üzerinde bir büyüme performansı sergilendiği vurgulanmaktadır (Karaata, 01). Var olan yenilik kapasitesini ölçebilmek ve diğer ülkelerle karşılaştırmak yenilikçi bir yapıya ulaşmada önemli bir analiz noktası olarak karşımıza çıkmaktadır. Bu sayede ekonominin göreli yenilik kapasitesi görülmekte ve hedefler ve araçlar belirlenebilmektedir. Yenilik kapasitesini ölçebilmek için zaman içerisinde gelişmiş olan bazı göstergeler kullanılmaktadır. Teknolojik değişim (yenilik) süreci içerisindeki üç aşamanın herhangi bir yerinde girdi ve/veya çıktı olarak yer alan belli başlı unsurlar, teknolojik değişim ve ilerleme sürecine ait göstergeler olarak kabul edilmekte ve tüm dünyada başta OECD ve UNESCO gibi uluslararası kuruluşlar ve ülkeler olmak üzere ilgili çevrelerce derlenmekte, gözlenmekte, değerlendirme ve analizlerde kullanılmaktadır (Karagöz ve Albeni, 004). Türkiye nin gerek coğrafi gerekse kültürel olarak en yakın merkezlerinden olan Avrupa nın artan küresel rekabetle, yaşlanan nüfusunun getirdiği sorunlarla ve krizin etkileriyle mücadele edebilmesi ve yeni iş alanları yaratabilmesi, ürün, servis, iş ve sosyal süreçlerde yenilik yaratabilmesi 1 ile yakından ilişkilidir. Zira Avrupa nın yenilikçilik anlamında geniş bir potansiyeli vardır. Dünya 1 çapında araştırmacılara, girişimcilere ve firmalara sahip olması ve dünyanın en büyük pazarlarından biri olması gibi pek çok avantajına rağmen Avrupa, bu alandaki gerçek potansiyelini tam anlamıyla ortaya koymaktan henüz çok uzaktır (Karataş ve Ayrım, 010). Bu çalışma kapsamında da söz konusu değişkenler kullanılarak kümeleme analizi yapılmış ve oluşan küme yapısı aşağıdaki tabloda verilmiştir.

122 Ülke Adı Slovakya, Hırvatistan, Macaristan, Çek Cumhuriyeti, Yunanistan, Sırbistan Tablo.Ward Metoduna Göre Kümeleme Analizi Sonuçları Küme Numarası İspanya, İtalya, Portekiz Letonya, Polonya, Litvanya 3 Bulgaristan, Romanya, Malta, Türkiye 4 Danimarka, İsveç, Finlandiya, Almanya, İsviçre 5 1 Estonya, Slovenya, Avusturya, Kıbrıs 6 Belçika, Hollanda, Fransa, Lüksemburg, İngiltere, İrlanda, Norveç 7 İzlanda 8 Tablo.1 incelendiğinde Türkiye nin Malta, Bulgaristan ve Romanya ile aynı kümede yer aldığı görülmüştür. Tabloda dikkat çeken bir diğer nokta coğrafi ve kültürel olarak birbirine yakın ülkelerin söz konusu göstergeler bakımında da benzer nitelikte olduklarıdır. KAYNAKLAR [1] Karaata, E.S., (01), Bazı İnovasyon ve Bilgi Ekonomisi Performans Ölçümlerinde Türkiye nin Konumu, Rekabet Formu 01. [] Karataş, E., Ayrım, Y.Z., (010), Yenilikçilik Birliği Notu T.C. Başbakanlık Avrupa Birliği Genel Sekreterliği Sosyal, Bölgesel ve Yenilikçi Politikalar Başkanlığı [3] Karaöz, M., Albeni, M., (004), Türkiye de Teknoloji Çabalarına İlişkin Bir Değerlendirme: Türkiye de Patent Aktivitesi, III. Bilgi Teknolojileri Kongresi, Bilgitek, Pamukkale Üniversitesi, Denizli, 004 [4] OECD (005) The Measurement of Scientific and Technological Activities, Oslo Manual: Guidelines for Collecting and Interpreting Innovation Data 3rd Edition, Paris, OECD. [5] TÜSİAD, Ulusal İnovasyon Sistemi,Yayın No: TÜSİAD-T/003/10/36, İstanbul, Ekim 003 TÜRKİYE S SITUATION ACCORDING TO EUROPEAN INNOVATION INDEX This study work for determine Türkiye s situation according to Innovation Union Scoreboard which includes 5 sun index and 8 major index published by Euro Commission. End of the clustering analysis which included human resources, research systems, finance, supports, firm research, network, entrepreneurship etc it is spotted that; Türkiye is same cluster with Malta, Bulgaria and Romania. And this cluster group is most fair created by end of the analysis. It is not to be say to wrong Türkiye is underdeveloped from other Euro zone countries for this variables. Key Words: Innovation Index, Development, Euro Zone, Cluster 1 Analysis

123 SESSION 4 NONPARAMETRIC STATISTICS 3 1

124 JUMP-PRESERVING ESTIMATES IN VARYING-COEFFICIENT MODELS Yan-Yong Zhao 1;, Jin-Guan Lin 1 and Xing-Fang Huang 1 1 Department of Mathematics, Southeast University, China; yyzhao.stat@gmail.com, jglin@seu.edu.cn, @seu.edu.cn. Presenting author The varying-coefficient models are very important tools to explore the hidden struc-ture between the response variable and its predictors. Fan and Zhang (000), Xue and Zhu (007), Wang and Xia (009) and Tang et al. (013) and other researchers used various esti-mation methods, such as the two-step estimation method, spline estimation approach, empirical likelihood inference, local polynomial smoothing and shrinkage estimation as well as quantile regression etc., to obtain estimators of the unknown coefficients and discussed the asymptotic properties of these estimators. An essential assumption in the above mentioned papers is that all the coefficient functions are assumed to be smooth directly. However, discontinuous coefficient functions are often encountered in many fields, including engineering, economics, meteorology, biomedical sciences and epidemiology. Simply ignoring discontinuity of the coefficient function-s, known as the naive method, will result in inconsistent estimators. Therefore, some suitable consistent estimators should be considered. To our best knowledge, however, a relevant study for such VCMs with discontinuous coefficient functions seems to be missing. This article focuses on the estimation of varying-coefficient models with discontinuous coefficient functions. Based on local linear smoothing, a jump-preserving (JP) regression method is proposed to estimate the coefficient functions with jumps, which can automatically accommodate possible jumps of the coefficient curves without knowing the number and locations of jumps and performing any hypothesis tests. Under some mild conditions, the asymptotical properties of the resulting esti-mators can be established. Furthermore, several numerical studies are conducted to evaluate the finite sample performance of the proposed methodologies. Finally, an application with medical data illustrates the usefulness of the proposed techniques. Keywords. Asymptotic properties; Jump-preserving; Local linear smoothing; Varying-coefficient models. References Fan, J, Zhang, J. (000). Two-step estimation of functional linear models with applications to longitudinal data. Journal of the Royal Statistical Society: Series B (Statistical Methodology) 6(): Xue, L, Zhu, L. (007). Empirical likelihood for a varying coefficient model with longitudinal data. Journal of the American Statistical Association 10(478), Wang, H, Xia, Y. (009). Shrinkage estimation of the varying coefficient model. Journal of the American Statistical Association 104(486), Tang, Y, Wang. H. J., Zhu, Z. (013). Variable selection in quantile varying coefficient models with longitudinal data. Computational Statistics & Data Analysis 57(1),

125 NONPARAMETRIC ESTIMATION OF THE DIFFUSION COEFFICIENT BASED ON NOISY-HIGH- FREQUENCY FINANCIAL DATA Xu-Guo Ye a,b, Jin-Guan Lin a, Yan-Yong Zhao a a Department of Mathematics, Southeast University, Nanjing, 10096, P. R. China b School of Mathematical Sciences, Kaili University, Kaili, , P. R. China Time-homogeneous diffusion models have been widely used to describe the stochastic dynamics of the underlying economic variables. Ren`o (008) introduced a nonparametric estimator of the diffusion coefficient, which is based on the estimation of quadratic variation between observations by means of realized variance. However, using intraday data to implement directly the estimator could be misleading, because intraday data display microstructure effects that could seriously distort the estimate. To filter out the impact of microstructure noise on the diffusion coefficient estimation, in this paper we propose an improved estimator when the step of discretization is fixed and microstructure noise is present in the observed prices. The proposed estimator has the same asymptotic properties as the Ren`o estimator when the step of discretization goes to zero. Some simulations and Shanghai Stock Exchange data from March 3, 00 to December 31, 008 are used to illustrate the performance of the proposed estimator. Key words: Diffusion coefficient; Nonparametric estimation; High-frequency data; Mi- crostructure noise. JEL classification: C13; C14; C. 5 1

126 Ridge type kernel smoothing in semi-parametric regression models: A Comparative Simulation Study 1. Introduction Ersin YILMAZ 1, Bahadır YÜZBAŞI, Dursun AYDIN 1 1Department of Statistics, Faculty of Sciences, Muğla S.K. University, Muğla-Turkey ersinyilmaz@mu.edu.tr*; duaydin@mu.edu.tr Department of Econometrics, Inonu University, Malatya 4480, Turkey b.yzb@hotmail.com Let us consider the following semi-parametric regression model: y x f ( t ), i 1,,..., n (1) where i i i i y i s are observations, x i i1 i ip x, x,..., x, i 1,,..., n, are known p dimensional vector with p n,,,..., p is an unknown p dimensional vector of regression coefficients, f C [0,1] is an unknown smooth function, t i are non-stochastic knot points of an extra univariate explanatory variable t, and model (1) can be write as i s are random errors distributed to be iid 0, 6 1 N. In vector and matrix form y = Xβ +f +ε () where y y,..., y, X = x,..., x, f f ( t ),..., f ( t ) and 1 n 1 n 1 n,..., 1 n. Semi-Parametric Model generalizes both parametric linear regression and nonparametric regression models which correspond to the cases f 0 and β= 0, respectively. The main goal is to estimate the parameter vector β, the function f and the mean vector = X f. In this paper, we consider a modified ridge type estimator for the parameters of semi-parametric regression model using kernel smoothing method adopted by Speckman [4]. For the purposes of this article we will employ the modified ridge regression concept that proposed in 1970 s to combat the multicollinearity in regression problems. Recently, pretest and shrinkage ridge regression estimators based on smoothing spline approach for partially linear models is obtained by Yüzbaşı [5], and Roozbeh, M., et al. [3] proposed a semiparametric ridge regression estimator for partially linear models, the semi-parametric models based on different selection methods are studied and compared by Aydın [1].. Modified Ridge Type Estimators in Semi-Parametric Regression Models The use and interpretation of a regression model often depends on the estimates of the individual regression coefficients. However, the quality of estimates, as measured by their variances, can be seriously adversely affected if the column vectors of the design matrix X in the linear model y = Xβ +ε are closely related to each other. This situation is defined as multicollinearity. Hoerl and Kennard [] have suggested a method of combating multicollinearity called ridge regression. Usually, ridge regression is applied to the centered and scaled variables. For model (), the semi-parametric ridge estimate of and f is obtained by minimizing the following equation: RSS k y X y X k, (3) It yields, ( ; ) argmin ˆ k X X + k I Xy, where k 0 is a tuning parameter that controls the amount of the penalty term, X ( I W ) X, y ( I W ) y and W is the corresponding smoother matrix. Also, we obtain the estimator of f as

127 REFERENCES f ˆ = W ( y X ˆ( k)). [1] Aydın, D. (014). Estimation of partially linear model with smoothing spline based on different selection methods: A comparative study, Pakistan Journal of Statistics, Vol.30 (1), pp: [] Hoerl, A. E. and Kennard, R. W. (1970a). Ridge regression: Biased estimation for non orthogonal problems, Technometrics, 1, [3] Roozbeh, M., Arashi, M. and Niroumanda, H.A. (011a). Semiparameric Ridge Regression Approach in Partially Linear models. Communications in Statistics- Simulation and Computation. 39, [4] Speckman, P. (1988). Kernel smoothing in partially linear model, J. Royal Statist., Soc. B., [5] Yüzbaşı, B. Penalty and Non-Penalty Estimations Strategies for Linear and Partially Linear Models, PhD Thesis, Inonu University, Malatya, 014. ABSTRACT This paper introduces a modified ridge type estimator for the vector of parameters in a semi-parametric model, y x f() t. This estimator is a generalization of the well-known Speckman s approach and is based on kernel smoothing method. In this method, a crucial step is to select a proper smoothing parameter. This parameter considerably affects the quality of the model parameters. Many Criteria of selecting smoothing parameters such as improved version of Akaike information criterion (AIC c ), generalized cross-validation (GCV), cross-validation (CV), Mallows C p criterion, risk estimation using classical pilots (REC) and Bayes information criterion (BIC) are developed in literature. In order to illustrate the ideas in the paper, a real data example and a Monte Carlo simulation study are carried out. Thus, the appropriate selection criteria are provided for a suitable smoothing parameter selection. Key Words: Semi-parametric model; Kernel smoothing; Ridge type estimator; Smoothing parameter; Crossvalidation; Generalized cross-validation; 7 1

128 MOMENTS OF ORDER STATISTICS AND L-MOMENTS FOR THE STANDARD TWO-SIDED POWER DISTRIBUTION Çağatay ÇETİNKAYA* and Ali İhsan GENÇ Çukurova University, The Faculty of Science and Letters, Department of Statistics, 01130, Adana, Turkey, 1. INTRODUCTION Let X have the standard two-sided power distribution (STSP) with pdf f(x α, β) given by (Kotz and van Dorp,00) α ( x β )α 1, 0 < x β f(x α, β) = { 0 x 1, n 0 (1) α ( 1 x 1 β )α 1, β x < 1 For the STSP distribution; β is the reflection parameter and α is the shape parameter. For β = 0.5 the STSP is a symmetrical distribution. For n = 1, the pdf in (1) simplifies to the uniform [0,1] density, for n = it corresponds to a triangular distribution on [0,1], and it simplifies to a power function distribution for β = 1.. PDF AND MOMENTS OF AN ARBITRARY ORDER STATISTIC Order statistics and their moments are extensively used in many areas of statistics. Let X i, 1 i n, be a random sample from f(x α, β), (Arnold, Balakrishnan,008), X r:n be the rth order statistic and μ (k) r:n be its kth moment. It is well-known that the pdf of the rth order statistic is given by n! f r:n (x) = (n r)!(r 1)! [F(x)]r 1 [1 F(x)] n r f(x) () From (),the pdf of the rth order statistic for the STSP distribution can be obtained as αn! (n r)! (r 1)! βr(1 α) x αr 1 (1 β ( x α n r β ) ), 0 < x β f r:n (x) = αn! {(n r)! (r 1)! (1 β)(n r+1)(1 α) (1 x) α(n r+1) 1 (1 (1 β) ( 1 x α r 1 1 β ) ), β x < 1 Further, an exact expression of the kth moment of the rth order statistic for STSP is obtained as (k) 1 = x k f r:n (x)dx 1, r)] μ r:n = 0 n! (n r)!(r 1)! [βk k/α B (β; k + r, n r + 1) + α j=0 (k j ) ( 1) j (1 β) j αb(1 j β; j + n r + α where, B(x; a, b) refers to the incomplete beta function that is defined by x B(x; a, b) = u a 1 (1 u) b 1 du, 0 x 1 0 In particular, an exact expression for the kth moment of sample minimum is; μ (k) 1:n = n [β k k αb (β; k + 1, n) + α(1 α β)n(1 α) B(1 β; αn, k + 1)] Also, for the sample maximum it can be obtained by j μ (k) n:n = n [ αβk+n + k k+nα (k j ) ( 1)j (1 β) j αb(1 β; j j=0 + 1, n) ] α L-moments are defined as a linear functions of the expected order statistics. The mth L-moment, Hosking (1990), is defined by λ m = 1 m 1 m k=0 ( 1)k ( m 1 k ) μ m k:m, m = 1,,. Clearly λ 1 = E(X). L-moments are alternatively used as location and dispersion estimators. In this work, the L-moments from the STSP distribution are determined. 1 8 k

129 REFERENCES [1] J. Rene van Dorp and Samuel Kotz. (00), The Standart Two-Sided Power Distribution and Its Properties: With Applications in Financial Engineerings, American. Stat. 56 () (00), pp [] J. R. M Hosking, (1990), L-Moments: Analysis and Estimation of Distributions Using Linear Combinations of Order Statistics, Royal Stat. Society, Series B, Vol. 5, No. 1 [3] Arnold, B.C., Balakrishnan, N., Nagaraja, H.N., (008), A First Course in Order Statistics. SIAM, Philadelphia, PA. Original Edition, Wiley, 199 ABSTRACT The standart two-sided power (STSP) distribution is introduced by Kotz and van Dorp (00). In this paper; firstly the density function and moments of an arbitrary order statistic from the STSP distribution are obtained. Specifically, the moments of minimum and maximum order statistics are studied. Additionally, domain of minimal, maximal attraction and L-moments of the STSP distribution are investigated. Key Words: Order Statistics, Moments, L-Moments, The Standard Two-Sided Power Distribution 9 1

130 CONVERGENCY RATE OF MISE OF THE DENSITY ESTIMATOR BY USING INTEGRAL MODULUS OF CONTINUITY TYPE MAJORANT Elif ERÇELİK*, Mustafa NADAR Istanbul Technical University, Department of Mathematical Engineering, Maslak, Istanbul, Turkey. The focus of nonparametric density estimation is to construct a sequence of estimators f n of density function f based on the sample x 1, x,, x n when no former parametric structure is specified. There is a vast literature on the estimation of an unknown density function by means of functions of i.i.d random variables X 1, X,. These include the histogram method, the kernel method, the orthogonal series method and the interpolation method. Many of the different methods mentioned here for nonparametric density estimation are special cases of the following general class of density estimators. The sequence {δ m (x, t)} is called a delta sequence on R if δ m (x, t) φ(t)dt φ(x) as m (1) Any estimator that can be written in the form, f n,m (x) = 1 n δ m(x, X i ) n i=1 () is called delta sequence density estimator, where {δ m (x, t)} with m = m(n) is a delta sequence. Nadar (011) studied the local rate of convergence of the mean squared error (MSE) corresponding to delta-sequence based density estimators at a local point by using modulus of continuity type majorants. They obtained the convergency rate of MSE of an estimator of density f L p (R d ) which satisfies Lipschitz condition of order η = 1 at x. These types of results for this area were not presented in the previous Works Nadar and Erçelik (015), investigated the rate of convergency of the MSE of estimator for densities belong to the class of functions which are denoted by the second order finite differences. The main contribution of this study is to obtain stronger convergence rate of a MSE by relaxing the second order differentiability condition when compared with the class of density functions denoted by the first order finite differences. Now, it is natural to ask what is the global rate of convergence for the mean integrated squared error (MISE) of a delta sequence based density estimator. In this work, the global rate of convergency of the MISE of density estimators based on certain delta sequence is obtained for densities having compact support. The conditions on the density function are written in terms of the integral modulus of continuity type majorants. The MISE rate is obtained as m MISE (f n,m (x)) = O n + {( x a [ b 1 m +x w (f; t x ) t x dt) 1/ + ( 1 1+x m w (f; t x ) t x 4 dt) 1 m +x 1/ } dx ] (3) Then, some examples for the different class of functions are presented KAYNAKLAR

131 [1] Nadar M. (011), Local convergence rate of mean squared error in density estimation, Communication in Statistics- Theory and Methods, Vol 40, pp [] Nadar M., Erçelik E. (015), Local Convergency Rate of MSE in Density Estimation Using the Second Order Modulus of Smoothness, Communication in Statistics- Theory and Methods, accepted. [3] Susarla V., Walter G. (1981), Estimation of a multivariate density function using delta sequences, Annals of Statistics, Vol.9, pp [4] Timan A.F. (1963), Theory of Approximation of Functions of a Real Variable, Oxford, England: Pergammon Press. [5] Walter G., Blum.J. (1979), Probability density estimation using delta sequences, Annals of Statistics, Vol.7, pp MSI ABSTRACT CONVERGENCY RATE OF MISE OF THE DENSITY ESTIMATOR BY USING INTEGRAL MODULUS OF CONTINUITY TYPE MAJORANT Many methods have been proposed to estimate probability density function using a sequence X 1, X,. of i.i.d random variables. The histograms, the kernel method, the orthogonal series method and the interpolation method can be given as examples for these methods. Delta sequence method generalizes many of the methods considered here by using delta sequence based density estimators. In this study, the MISE rate of convergency of delta sequence based density estimators is obtained. The conditions on the density function are written in terms of the integral modulus of continuity type majorants. Then some examples are given for the different class of functions. Key Words: Mean Integrated Square Error, Delta Sequences, Density Estimation 31 1

132 SESSION 4 UYGULAMALI İSTATİSTİK 1 3 1

133 AKADEMİSYENLERİN ÇEVREYE KARŞI OLAN TUTUMLARININ YAPISAL EŞİTLİK MODELLEMESİ İLE İNCELENMESİ Birol TOPÇU 1* Cengiz GAZELOĞLU Mehmet YILMAZ 3 1* Namık Kemal Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, 59100, Tekirdağ, Türkiye E mail: topcubirol@gmail.com Abdullah Gül Üniversitesi, Mühendislik Fakültesi, Elektrik-Elektronik Müh., 38100, Kayseri, Türkiye E mail: cengiz.gazeloglu@agu.edu.tr 3 Ankara Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 06100, Ankara, Türkiye E mail: scimehmet@gmail.com Yaşadığımız dünyaya karşı hepimizin birçok alanda sorumlulukları bulunmaktadır. Bu söz konusu alan çevre ise üniversitelerde görev yapmakta olan akademisyenlerin sorumlulukları kat ve kat daha fazla arttığını söylemek mümkündür. Çevre sorunlarının tüm dünya ülkelerinde giderek artarak ortaya çıkmaya başlaması, doğal kaynakların bilinçsizce tüketilmesi, çevreye karşı duyarlı vatandaş sayısının giderek azalmasından dolayı kişilerin eğitim düzey ve kaliteleri ile çevreye karşı duyarlı olmaları arasındaki ilişkilerin yeniden araştırılması ihtiyacı doğmaktadır. Çevre sorunlarının küresel gündemde daha çok yer almasıyla, bu sorunların ortaya çıkışında temel etken olan insanın çevresine karşı tutumu ve farkındalığı daha fazla sorgulanır hale gelmiştir (Oğuz ve ark., 011). Çevre sorunlarını en aza indirmeyi hatta sıfırlamayı hedefleyen çalışmaların başarılı olması küresel ölçekte ve siyasal çerçevede olduğu kadar toplumsal boyutta da gereken sorumlulukların yerine getirilmesine bağlıdır. Toplumdaki her bireyin yüklendiği sorumluluklar, satın alma ve kullanmanın ötesine geçerek, aynı zamanda, tüketimden doğan atıkların çevreye zarar vermeden yok edilmesi ve çevrenin korunmasına yönelik bireysel görev ve sorumlulukları da kapsamaktadır (Özbebek ve ark., 01). Türkiye de örgün eğitim çerçevesinde, çevre eğitimine özel bir müfredat bulunmamakla birlikte, çevre ile ilgili temel bilgiler ilköğretim ve lise eğitim programlarının içinde yer alan farklı dersler kapsamında verilmektedir. Yükseköğretime ilişkin olarak da, ulusal olarak benimsenmiş ya da uygulanan belirli bir çevre eğitimi politikası bulunmamaktadır. Üniversiteler, ders programlarını ve içeriklerini kendi kurumsal yapıları içerisinde çözümlemektedirler. Bu nedenle yükseköğretimde, çevre ile ilgili konularda, ulusal ölçekte standart bir eğitim altyapısından ya da uygulamasından bahsetmek olanaklı değildir. Oysaki yükseköğretim kurumları, küresel toplumun yaşam kalitesinin iyileştirilmesine katkıda bulunacak, gerekli bilgiye, yeteneğe ve değerlere sahip bireylerin yetiştirilmesinden sorumludurlar (Oğuz ve ark., 011). Bu çalışmanın amacı akademisyenlerin çevresel bilgi ve davranışlarının belirlenerek istatistik bilimi ve diğer bilim dalları içerisinde son yirmi beş yılda oldukça sık kullanılmaya başlanan ve büyük öneme sahip olan Yapısal Eşitlik Modellemesi (YEM) ile modellenmesidir. Yapısal eşitlik modellemesi, ölçülen ve ölçülemeyen değişkenler arasındaki ilişkileri ortaya koyan birçok istatistiksel yöntemlerin (yol analizi, regresyon analizi, faktör analizi vb) bir araya getirilmesi ile oluşturulan çok değişkenli istatistiksel yöntemlerden birisidir. Yapısal eşitlik modelleri (YEM) gözlenen ve gözlenemeyen (gizil-latent) değişkenler arasındaki nedensel ilişkilerin sınanmasında kullanılan, özellikle gizil (latent) değişkenler, hem bağımlı hem de bağımsız değişkenlerdeki kapsamlı bir istatistiksel tekniktir. Kuramsal yapıların formüle edilmesiyle ilgili karşılaşılan problemlerin çözümünde de yararlı bir teknik olduğu kanıtlamıştır. Özellikle psikoloji, sosyoloji, pazarlama ve eğitim bilimlerinde değişkenler arasındaki ilişkilerin değerlendirilmesinde ve kuramsal modellerin sınanmasında kullanılan sistemli bir araçtır. Teknik olarak YEM doğrusal yapı eşitlik setindeki bilinmeyen parametrelerin tahmin edilmesinde kullanılır. Eşitliklerdeki değişkenler genellikle doğrudan gözlenen değişkenler ile ilişkili 1 gizil değişkenlerdir. YEM gizil değişkenler seti arasında 33 bir nedensellik yapısının var olduğunu ve gizil değişkenlerin gözlenen değişkenler aracılığıyla ölçülebildiğini varsayar (Yılmaz ve Çelik, 005). Bu amaçla araştırmacılar tarafından belirlenen Türkiye deki bir üniversitenin farklı fakülte ve bölümlerinde görev yapan akademisyenlere internet üzerinden uygulanan 15 geçerli anket üzerinden

134 çözümleme gerçekleştirilerek akademisyenlerin çevreye karşı tutumları üzerinde en fazla ve en az etkili olan faktörler belirlenerek modellenmeye çalışılmıştır. KAYNAKLAR [1] Oğuz, D.,Çakcı, I., Kavas, S., (011). Yüksek öğretimde öğrencilerin çevre bilinci, SDÜ Orman Fakültesi Dergisi, 1: [] Özbebek, T. A., Akdemir Ö. G., Düren A. Z., (01). Çevresel Farkındalık, İ.Ü. Siyasal Bilgiler Fakültesi Dergisi, 47: 7-4. [3] Schermelleh-Engel, K. ve Moosbrugger, H., (003). EvaluatingThe Fit of StructuralEquationModels: Tests of SignificanceandDescriptiveGoodness-of-Fit Measures. Methods of PsychologicalResearch Online, Vol:8 No:, [4] Şehribanoğlu, S., Yapısal Eşitlik Modelleri ve Bir Uygulaması, Yüksek Lisans Tezi, Yüzüncü Yıl Üniversitesi Fen Bilimleri Enstitüsü, Van, (005). [5] Yılmaz, V., ve Çelik, H.E., (005). Bankacılık Sektöründe Müşteri Memnuniyeti ve Bankaya Bağlılık Arasındaki İlişkinin Yapısal Eşitlik Modelleriyle Araştırılması, VII. Ulusal Ekonometri ve İstatistik Sempozyumu, İstanbul Üniversitesi, 6-7 Mayıs 005. ABSTRACT The purpose of this study is to construct a structural equation model which is being used quite frequently by the statistics and the other disciplines during the last twenty- five years and having a great importance, to examine the relationship between environmental knowledge and behaviour for academics. The survey was administered by the researchers via the internet to academics working in different faculties and departments of the universities in Turkey. As a result of this assessment, 15 of them were valid. Based on analysing this survey, we try to model environmental behaviour by determining the most effective and least influential factors reflecting academics's attitudes towards the environment. Key Words: Attitude towards environment, Structural Equation Model 34 1

135 ALG TÜRÜ SAYISINA ETKİ EDEN FAKTÖRLERİN BELİRLENMESİNDE SAYMA VERİ REGRESYON MODELLERİNİN KARŞILAŞTIRMASI Esin AVCI *, Elvan AKTÜRK HAYAT ** * Giresun Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, 8000, Giresun, TÜRKİYE, esinavci@hotmail.com ** Adnan Menderes Üniversitesi, Aydın İktisat Fakültesi, Ekonometri Bölümü, 09010, Aydın, TÜRKİYE, elvanakturk@gmail.com 1. Poisson Regresyon Modeli Belirlenen bir zaman içinde herhangi bir olayın meydana gelme sayısı, sayma verileri olarak ifade edilebilir. Sayma veri modelinde bilinen ilk gelişmeler aktüeryal bilimler, biyoistatistik ve demografide gözlenmiştir. Son yıllarda bu modeller iktisat, politik bilimler ve sosyolojide de sıkça kullanılmaya başlanmıştır. Bağımlı değişkenin sayma veri olması durumunda, Normallik varsayımının sağlanmaması nedeniyle, bağımsız değişkenlere etki eden etkenlerinin incelenmesinde yaygın olarak Poisson regresyon modeli kullanılmaktadır. Poisson regresyon modelinde sayma verisi Poisson dağılımına sahip olmalıdır. Poisson dağılımının en belirgin varsayımı ise koşullu ortalamasının koşullu varyansına eşit olmasıdır. Varsayımın ihlali durumunda parametreler için tutarlı tahmin ediciler elde edilmekte ancak bu tahmin edicilerin anlamlılığının testinde kullanılan standart hatalar düzeltilmek durumundadır (Winkelmann ve Zimmermann, 1995). Varyansın ortalamadan büyük olduğu Aşırı yayılım ve Ortalamanın varyanstan büyük olduğu eksik yayılım durumunda Poisson regresyon modeline alternatif olarak sırasıyla Negatif Binomial regresyon, Poisson Quasi Maksimum Olabilirlik Tahmini yöntemlerinin yanı sıra son yıllarda hem aşırı hem de eksik yayılım durumu için kullanılan Conway-Maxwell- Poisson (COM-Poisson) regresyonu verilebilmektedir. Poisson regresyon modelinde, sayma verisi olan y, x bağımsız değişkenlerine dayanan koşullu ortalamayla Poisson dağılımına sahiptir (Long, 1997). μ i = E(y i x i ) = exp (x i β) (1) Kanonik bağıntı fonksiyonu olarak adlandırılan g(μ) = log (μ), ortalama ile bağımsız değişkenler arasında logdoğrusal bir ilişkiyi ve beklenen sayma değerlerinin pozitif olmasını sağlar. Poisson dağılımının olasılık fonksiyonu, f(y μ) = exp ( μ)μy y! () Poisson dağılımında ortalama varyans eşitliği sözkonusudur. μ i = E(y i x i ) = V(y i x i ) (3). COM-Poisson Regresyon Modeli Ortalama ve varyansın eşitliğine eşit yayılım denir. Uygulamada sayma verileri genellikle ortalamadan daha büyük varyansa sahiptirler. Bu durum aşırı yayılımı (over-dispersion) gösterir. Ortalamanın varyanstan küçük olduğu eksik yayılım (under-dispersion) durumu ise pek yaygın değildir. Hem aşırı hem de eksik yayılım durumu için kullanılan Conway-Maxwell-Poisson (COM-Poisson) 196'de Conway ve Maxwell tarafından verilmiştir. İki parametreli Poisson dağılımının genelleştirilmiş durumudur. COM-Poisson dağılımının olasılık fonksiyonu, 1 35 P(y; λ, υ) = λ y (y!) υ Z(λ,υ) (4)

136 λ s Burada Z(λ, υ) = s=0, ve υ 0 ; υ yayılım parametresi olarak adlandırılmaktadır. υ > 1 ise Eksik yayılım (s!) υ (under-dispersion) ve υ < 1 Aşırı yayılım (over-dispersion). COM-Poisson dağılımı iyi bilinen üç dağılımı içeren özel bir dağılımdır. Poisson (υ = 1), Geometrik (υ = 0, λ < 1) ve Bernoulli (υ, olasılığı ile) 1+λ (Shmueli vd.,005). Bu çalışmada, Giresun ili Batlama deresi üzerinde kurulan dört istasyondan bir yıl boyunca derlenen Alg türlerinden olan Cocconeis Placentula Ehrenberg sayılarına, kontenjans tablosu biçiminde düzenlenen mevsim ve istasyonların etki gösterip göstermediği Poisson ve COM-Poisson regresyon modeli ile karşılaştırlmıştır. Cocconeis Placentula Ehrenberg sayma verisi Eksik yayılım göstermiştir (υ = ). Eksik yayılım parametresinin istatistiksel olarak anlamlı olması (p=0.0000) ve her iki model için elde edilen AIC değerinin Poisson regresyon modelinden daha küçük olması nedeniyle COM-Poisson regresyon modelinin veriler için daha uygun olduğu saptanmıştır. COM-Poisson regresyon modeline göre mevsimlerin ve 3. istasyonun Cocconeis Placentula Ehrenberg sayma verisi üzerine etkili olduğu bulunmuş, yaz ve 1. istasyon referans mevsim ve istasyon alınarak göreli etki sıralaması yapılmıştır. KAYNAKLAR [1] Winkelmann R., Zimmermann K.F., (1995), Recent Developments in Count Data Modelling: Theory and Application, Journal of Economic Survey, 9(1):1-4. [] Long J. S., (1997), Regression Models for Categorical and Limited Dependent Variables, Thousand Oaks, CA: Sage Publication [3] Shmueli G., Minka. T.P., Kadane J.B., Borle S. and Boatwright P. (005), A Useful Distribution for Fitting Discrete Data: Revival of the Conway Maxwell Poisson distribution. Journal of the Royal Statistical Society. Series C (Applied Statistics). 54(1) λ ABSTRACT The Poisson regression model is the most common model for fitting count data. However, it is suitable only for modeling equi-dispersed distribution. The Conway-Maxwell-Poisson (COM-Poisson)regression model allows modelling over and under-dispersion distribution. The aim of this study was to define factors that effect the number of Bothrycoccus Braunii Kützing. Key Words: Poisson regression,com-poisson regression, under-dispersed count data. 36 1

137 KISMİ EN KÜÇÜK KARELER REGRESYONU VE TEMEL BİLEŞENLER REGRESYON TEKNİKLERİNİN RMSECV KRİTERİ AÇISINDAN KARŞILAŞTIRILMASI VE GERÇEK VERİ SETİ ÜZERİNE BİR UYGULAMA Gamze GÜVEN Hatice ŞAMKAR * Eskişehir Osmangazi Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, Eskişehir, Türkiye gamzeguven@ogu.edu.tr hfidan@ogu.edu.tr Çoklu doğrusal regresyon modeli, sayısal bir y bağımlı değişkeni ile x 1, x,, x p bağımsız değişkenleri arasındaki ilişkiyi modellemek için yaygın olarak kullanılan istatistiksel bir yöntemdir. Bu yöntemde regresyon katsayılarını tahmin etmek için EKK tekniği kullanılır. Ancak çoklu doğrusal regresyonda EKK tekniğinin güvenilir sonuçlar vermesi için belli başlı varsayımların sağlanması gerekir. Bu varsayımlardan bir tanesi bağımsız değişkenler arasında ilişki bulunmaması gerektiğidir. Bağımsız değişkenler arasındaki ilişki, çoklu bağlantı sorununa sebep olur. Çoklu bağlantı sorunu, parametre tahminleri üzerinde olumsuz sonuçlar doğurur. Bu sorunu ortadan kaldırmak için çeşitli yollara başvurulabilir. Çoklu bağlantı sorunu ile baş edebilmede en çok kullanılan yöntem yanlı tahmin tekniklerine başvurmaktır. Çoklu bağlantı sorununu veri yapısını indirgeyerek ortadan kaldırmak için kullanılan yanlı tahmin tekniklerinden bir tanesi Temel Bileşenler Regresyon (PCR) tekniğidir. PCR analizi yapılmadan önce değişkenler arasındaki birim farklılıklarını ortadan kaldırmak için X bağımsız değişkenler matrisi standartlaştırılır. Daha sonra aralarında yüksek korelasyon bulunan orijinal bağımsız değişkenler temel bileşenler analizine tabii tutulur ve orijinal değişkenlerin yerine, bu değişkenlerin dik dönüşümü kullanılarak daha az sayıdaki temel bileşenler elde edilir. Son olarak temel bileşenlere EKK tekniği uygulanarak regresyon katsayılarının tahmini yapılır. Veri yapısını indirgeyerek çoklu bağlantı sorununu ortadan kaldıran bir diğer yanlı teknik de Kısmi En Küçük Kareler Regresyon (PLSR) tekniğidir. PLSR, çoklu regresyon ve temel bileşenler analizinin özelliklerini birleştiren bir tekniktir. Bu tekniğin amacı bağımlı ve bağımsız değişkenler arasındaki kovaryansı maksimum yapacak şekilde optimum sayıda gizli (latent) değişken elde etmektir (Abdi, 003). Bu gizli değişkenler birbirine dik olacak şekilde orijinal bağımsız değişkenlerin doğrusal kombinasyonlarından elde edilir. PLSR tekniği işleyişi açısından PCR tekniğine benzemekle birlikte PCR tekniği temel bileşenlerin elde edilmesinde sadece bağımsız değişkenler üzerindeki bilgiyi kullanırken, PLSR tekniği hem bağımlı hem de bağımsız değişkenler üzerindeki bilgiyi kullanır (Naes and Martens,1985). Ayrıca PLSR tekniği, bağımlı değişken sayısı birden fazla olduğu zaman da kullanılabilen bir tekniktir. Bu çalışmada PCR ve PLSR teknikleriyle elde edilen modelleri veriye uyum başarıları yönünden karşılaştırabilmek için PLS_Toolbox da AB 013 işsizlik verileri üzerine bir uygulama yapılmıştır. Karşılaştırma kriteri olarak RMSECV (çapraz geçerliğin hata kareler ortalamasının karekökü) kullanılmıştır. RMSECV RMSECV= n i=1 (y CV,i y i) n = PRESS n eşitliği ile elde edilir (Yeniay and Göktaş,00). Çalışmada kullanılan değişkenler aşağıda verilmiştir. y :İşsizlik Oranı (%) x 1 : Nüfus (milyon) x : Cari Fiyatlarla GSYH (milyar dolar)x 3 : GSYH ın İmalat Sektöründeki Payı (%) x 4 : Tüfe (% değişimi) x 5 : İhracat (milyar dolar) x 6 : İthalat (milyar dolar) x 7 : İhracat artış hızı (%) x 8 : İthalat artış hızı (%) x 9 : Yabancı Sermaye Girişleri(milyar dolar) x 10 : Yabancı Sermaye Çıkışları (milyar dolar) Bu değişkenler dikkate alınarak gerekli analizler yapıldığında, 1 çoklu bağlantı sorununun olduğu tespit edilmiş ve PCR ve PLSR teknikleri uygulanarak elde edilen 37 RMSECV değerleri ve latent değişken sayıları aşağıdaki gibi bulunmuştur.

138 Çizelge1. PCR ve PLSR tekniklerine ilişkin RMSECV değerleri ve bunlara karşılık gelen latent değişken sayıları PCR PLSR RMSECV LV RMSECV LV Yukarıdaki tablo incelendiğinde, PLSR tekniğinin daha düşük RMSECV değeri ve daha az latent değişken sayısına sahip olduğu görülmektedir. Böylelikle, PLSR tekniğinin modele uyum başarısı bakımından, PCR tekniğine göre daha üstün olduğu söylenebilir. KAYNAKLAR [1] Abdi H. (003), Partial Least Square Regression (PLS Regression), Encyclopedia for Research Methods for the Social Sciences : [] Naes T. and Harald M. (1985), Comparison of Prediction Methods for Multicollinear Data, Communications in Statistics-Simulation and Computation, 14(3) : [3] Yeniay O. and Atilla G. (00), A Comparison of Partial Least Squares Regression with Other Prediction Methods, Hacettepe Journal of Mathematics and Statistics, 31(99): A COMPARISON OF PARTIAL LEAST SQUARES REGRESSION AND PRINCIPAL COMPONENT REGRESSION IN TERMS OF RMSECV CRITERION AND AN APPLICATION ON A REAL DATA The aim of regression analysis is to construct mathematical models that describe relationships between the dependent variable and one or more independent variables. However, if there is multicollinearity among the independent variables, then the least squares (LS) methods may lead to unreliable estimates. In this case, the biased estimation methods are used. PLSR and PCR are two of the estimation techniques. In this study, they were briefly examined and compared in terms of data harmonization success on a real data set. Key Words: Multicollinearity, Principal Component Regression, Partial Least Squares Regression, RMSECV 38 1

139 MALİ BAŞARISIZLIK KESTİRİMİNDE VERİ MADENCİLİĞİ YAZILIMLARININ LOJİSTİK REGRESYON PERFORMANSLARININ KARŞILAŞTIRLMASI Nurzen ÜZÜMCÜ* Süleyman Demirel Üniversitesi Sosyal Bilimler Enstitüsü Ekonometri Bölümü Ekonometri ABD 360 Çünür/ISPARTA Ömer Utku ERZENGİN Süleyman Demirel Üniversitesi Fen Edebiyat Fakültesi İstatistik Bölümü 360 Çünür/ISPARTA 1. MALİ BAŞARISIZLIK KESTİRİMİNDE VERİ MADENCİLİĞİ YAZILIMLARININ LOJİSTİK REGRESYON PERFORMANSLARININ KARŞILAŞTIRLMASI Ekonomik süreçlerdeki değişime bağlı şirketler mali başarısızlık durumuna düşebilmektedir. Serbest piyasa ekonomisi rekabet kurallarına göre çalışmaktadır. İşletmelerin rekabet ortamında varlıklarını sürdürebilmeleri nakdi ve nakdi olmayan değerlerin dengeli kullanılmasına bağlıdır. 01 yılından bu yana Borsa İstanbul da işlem gören hem ulusal hem de uluslararası bazı şirketler mali açıdan başarısız olup pazardan çekilmek zorunda kalmışlardır. Son yıllarda görülen bu durum mali başarısızlığın belirlenmesinin önemini arttırmıştır. Mali başarısızlığı belirlerken yalın veriler (bilanço ve gelir tablolarındaki tek başına kalemler) yerine mali oranlar kullanılmalıdır. Bilanço ve gelir tablolarında yer alan nakdi ve nakdi olmayan değerlerin birbirlerine oranlanmasıyla finansal oranlar elde edilir. Oranların kullanılması şirketler arasındaki büyüklük farkları ve farklı risk sınıflarında bulunmalarından doğacak etkileri azaltmaktadır. Edward I. Altman ve arkadaşları 1968 den bu yana oranlara bağlı mali başarı/başarısızlık formüllerini ortaya koymuştur. Genel olarak Altman ın ölçeklerinde Z skoruna göre başarı ve başarısızlık ortaya konmaktadır. Bilanço ve gelir tablolarından elde edilen oranlar birbiriyle istatistiksel açıdan ilişki içindedirler. Bazı oranlar hesaplanırken aynı kalemler kullanılabilmektedir. Aynı kalemleri kullanan oranlar çoklu bağlantı sorununu ortaya çıkartmaktadır. Yapılan çalışmada bilanço ve gelir tablolardan elde edilen oranlar arasındaki çoklu bağlantı sorunu temel bileşenler analiziyle (TBA) giderilmiştir. Temel bileşenlere bağlı faktör analizinin amacı, çoklu bağlanım sorunu olan oranların birbirinden bağımsız olarak daha az sayıdaki yeni veri yapısına indirgenmesidir. Altman 1983 yılında yaptığı çalışmada Z skorunun 1.3 ile.99 arası gri bölge olarak tanımlamıştır. Altman Z skoruna göre 1.3 ün altında kalan alan şirketler başarısız ve.99 üzerine çıkan şirketler başarılı olarak kabul edilmiştir. Çeşitli çalışmalarda Altman Z skoruna göre başarısızlık ve başarı kategorik olarak 0-1 şeklinde belirlenmiştir. Yapılan çalışmada ikili lojistik regresyon (İLR) analizinde bağımlı değişken olarak mali başarısızlık kullanılmıştır. Bağımlı değişken y nin aldığı değer 1 ise mali başarıyı, 0 ise başarısızlığı temsil etmiştir. Altman Z skoruna göre bulanık olan bölgenin ne kadarının 0 ne kadarının 1 alacağı bilançolara bağlı İLR deki eğri altında kalan alan ROC (Receiver Operating Characteristic) eğrisine göre belirlenmiştir. Lojistik regresyondaki en doğru sınıflama oranı bulunmaya çalışılmıştır. Yapılan çalışmada Borsa İstanbul da işlem gören şirketlerin 01 yılları bilançolarından ve gelir tablolarından elde edilen veriler kullanılmıştır. Mali başarı ve başarısızlık oranlara bağlı İLR analiziyle incelenmiştir. TBA dan sonra elde edilen faktörler İLR ye sokulmuştur. İLR analizi doğrusal analizlerdeki varsayımlar olmaksızın sınıflama işlemi yapan bir regresyon yöntemidir. Altman Z skoruna göre bulanık olan bölgenin ne kadarının 0 ne kadarının 1 alacağı ROC eğrisi altında kalan alana göre bulunmuş ve lojistik regresyondaki sınıflama oranı optimize edilmeye çalışılmıştır. Yapılacak çalışmada açık kaynak kodlu veri madenciliği yazılımlarının (R, Weka, Orange, Rapid Miner, Knime) lojistik regresyon sınıflama oranları karşılaştırılacaktır. Bilanço ve gelir tablolarından elde edilmiş verilerin temel bileşenler analizinden sonra ikili lojistik regresyon 1 sonrası kesim noktasına bağlı sınıfları incelecek yazılımlar arasındaki farklılıklar tartışılacaktır. 39 Anahtar Kelimeler: Mali Başarısızlık, Altman Z Skor, Lojistik Regresyon, ROC

140 KAYNAKLAR [1] Altman, E. I. (1968). Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy, The Journal of Finance, Vol. 3, No. 4, pp [] Kleinbaum, D.G., Klein, M. (00). Logistic Regression A Self-Learning Text, Second Edition, Springer- Verlag, New York, 513s. [3] Cortez, P. (010). Data Mining with Neural Networks and Support Vector Machines using the R/rminer Tool, Advances in Data Mining Applications and Theoretical Aspects Lecture Notes in Computer Science, Vol. 6171, pp [4] Altman, E. I., Drozdowska, M.I., Laitinen, E.K., Suvas, A. (014). Distressed Firm and Bankruptcy Prediction in an International Context: A Review and Empirical Analysis of Altman's Z-Score Model (Available at SSRN: or [5] Wahbeh, A. H. (011). A Comparison Study between Data Mining Tools over some Classification Methods. Journal of Advanced Computer Science and Applications(IJACSA), DOI: /SpecialIssue ABSTRACT DATA MINING SOFTWARE LOGISTIC REGRESSION PREDICTION PERFORMANCE COMPARSION OF FINANCIAL DISTRESS Companies have to survive in economical process with competition and has a probabilty falling into financial distress. Companies must balance their monetary and non-monetary assets. To describe financial distress only financial ratios calculated proportioning monetary and non-monetary assets in annual financial statement are not enough. In 1968 Altman showed that the Z-Score could be used to determine the company is financially distressed or not. In this study to predict financial distress Binary Logistic Regression (BLR) was used to esitmate companies specified as successful and unsuccessful according to Altman Z score. The open source data mining softwares classification performance was compared. Key Words: Financial Distress, Altman Z score, Logistic Regression, ROC 40 1

141 ORTAÖĞRETİM ÖĞRENCİLERİNDE ÇEVRESEL DUYARLILIK VE EKOLOJİK DAVRANIŞLARI ETKİLEYEN FAKTÖRLERİN ÖNERİLEN BİR YAPISAL EŞİTLİK MODELİYLE ARAŞTIRILMASI: ESKİŞEHİR DE BİR UYGULAMA Halil Polat, Sonay Mete, Emine Arıkan, Emine Tuğba Tekeli Eskişehir Osmangazi Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, 6000, Eskişehir, TÜRKİYE Murat DOĞAN *, Veysel YILMAZ Eskişehir Osmangazi Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, 6000, Eskişehir, TÜRKİYE, Çevre konusunda bilinçli ve duyarlı bireyler yetiştirmek ve çevresel konulara yönelik sorunları çözmek için en etkili yol, çevreye duyarlı ve çevre koruma konusunda olumlu tutum ve davranışlara sahip bireyler yetiştirilmesidir. Bu nedenle çevre sorunlarını çözmede ve önlemede, verilecek ilk eğitimin zamanının ve yerinin ne kadar önemli olduğu unutulmamalıdır. Çevre sorunlarının küresel boyutlardaki etkisinin azaltılması sorumluluğunu üreticiler kadar tüketicilerin de üstlenmesi gerekmektedir. Tüketicilerin ekolojik ürünleri satın alarak bilinçli tercihlerde bulunması, üretim eylemlerinin de çevreye daha duyarlı olacak biçimde yönünü değiştirebilir. Çevreye karşı duyarlı ve bilinçli tüketicilerin diğer ürünler arasından ekolojik ürünleri satın alması, ekolojik ürünlerin piyasada kalmasını ve ekolojik olmayanların ortadan kalkmasını sağlayarak işletmelerin ürün ve üretim şeklini doğrudan etkileyeceği düşünülmektedir. Bu nedenle tüketicilerin ekolojik ürün tutum ve davranış geliştirmelerine yön veren faktörlerin araştırılması çok önemlidir. Bu çalışmanın amacı da, ortaöğretim öğrencilerinin çevresel duyarlılıkları ve çevresel davranışlarının ekolojik ürün satın alma davranışına etkileri için bir Yapısal Eşitlik Modeli (YEM) önermek ve çeşitli uyum ölçüleri dikkate alınarak modelin uygunluğunu sınamaktır. (Yılmaz, Çelik ve Yağızer, 009) Yapısal eşitlik modellemesi (YEM); gözlenen ve gözlenemeyen (gizil-latent) değişkenler arasındaki nedensel ve karşılıklı ilişkilerin bir arada bulunduğu modellerin test edilmesi için kullanılan kapsamlı bir istatistiksel yaklaşımdır. YEM modelleri, eğitim, psikoloji, ekonometri ve sosyal alanların neredeyse tamamına yakınında değişkenler arasındaki nedensel ilişkiyi açıklamada ve oluşturulmuş bazı modellerin test edilmesinde kullanılan YEM, varsayım olarak gözlenemeyen değişkenler arasında bir nedensellik bağı olduğunu ve gözlenemeyen değişkenlerin gözlenen değişkenler aracılığı ile ölçülebileceğini ifade eder (Yılmaz, 004). Bu çalışmada Eskişehir ilindeki Milli Eğitim Bakanlığı na bağlı dört ortaöğretim okulunda Ekolojik Pazar ve Ekolojik Ürün Tanıtımı adlı eğitimler verilerek, ekolojik ürün konusunda verilen bu eğitimlere katılan öğrencilere eğitim öncesinde ve sonrasında çevresel bilgi ve çevresel duyarlılık ile birlikte ekolojik ürünlere yönelik tutum ve davranışlarındaki değişimi ölçmek amacıyla bir anket çalışması uygulanmıştır. Anket formu; A: Çevresel Bilgi, B: Çevresel Duyarlılık, C: Çevresel Tutum, D: Çevresel Davranış, E: Ekolojik Ürün Tutumu, F: Ekolojik Ürün Satın Alma Davranışı olmak üzere beş faktörde toplanarak ekolojik ürün satın alma davranışı ile faktörler arasındaki ilişkiyi ortaya koyabilmek için LISREL programında YEM analizi uygulanmıştır. Ekolojik ürün satın alma davranışına ilişkin etkileri betimlemek amacıyla Şekil 1 deki yapısal eşitlik modeli önerilmiştir. Şekil 1 de verilen araştırma modelinde Çevresel Bilgisizlik (A), Çevresel Duyarlılık (B), 1 Çevresel Tutum (C) ve Çevresel Davranış 41 (D) boyutları bağımsız gizil değişken, Ekolojik Ürün Satın Alma Davranışı (F) boyutu ise bağımlı gizil değişken olarak tanımlanmıştır.

142 A B C D F Şekil 1: Ekolojik Ürün Satın Alma Davranışına İlişkin Önerilen Yapısal Eşitlik Modeli Çalışmada Ekolojik Ürün Satın Alma Davranışı ile ilgili faktörleri ortaya çıkarmak için doğrulayıcı faktör analizi gerçekleştirilmiştir. Araştırma modeli için oluşturulan YEM sonuçları ve öğrencilerin ekolojik ürün satın alma boyutları ile ekolojik ürün satın alma davranışı arasındaki ilişki için önerilen modelin path diyagramı incelendiğinde; Çevresel bilgisizlik(a) bağımsız gizil değişkeninin Çevresel Duyarlılık(B) bağımsız gizil değişkenini negatif yönde etkilediği fakat Çevresel Duyarlılık(B) bağımsız gizil değişkeninin Çevresel Tutum(C) bağımsız gizil değişkenini, Çevresel Tutum(C) bağımsız gizil değişkeninin Çevresel Davranış(D) bağımsız gizil değişkenini ve Çevresel Davranış(D) bağımsız gizil değişkeninin de Ekolojik Ürün Satın Alma Davranışı(F) bağımlı gizil değişkenini pozitif yönde etkilediği görülmüştür. Bu çalışma için geliştirilen YEM kuramsal yapısı itibariyle, içerdiği faktörlerden dolayı mevcut literatürde yer alan modellere benzer niteliktedir. YEM den edilen sonuçlara göre öğrencilerde çevresel duyarlılığın çevresel tutum aracılığıyla çevresel davranışı etkilediği, yani çevresel tutum geliştiren öğrencilerin ancak çevresel davranış sergiledikleri ortaya çıkmıştır. Ayrıca ortaöğretim okullarında verilmiş olan eğitimlerin çevresel duyarlılık, çevresel tutum, çevresel davranış ve ekolojik ürün satın alma davranışı bakımından etkili olduğu ancak çevresel bilgi bakımından etkili olmadığı görülmüştür. KAYNAKLAR [1] Yılmaz, V., Çelik, H. E., Yağızer, C. (009). Çevresel Duyarlılık ve Çevresel Davranışın Ekolojik Ürün Satın Alma Davranışına Etkilerinin Yapısal Eşitlik Modeliyle Araştırılması, Anadolu Üniversitesi Sosyal Bilimler Dergisi, 9(): [] Yılmaz, V., Çelik, E. H., (009). Lisrel ile Yapısal Eşitlik Modellemesi. Pegem Akademi, Ankara 009. ABSTRACT INVESTIGATION OF FACTORS THAT AFFECTING ENVIRONMENTAL AWARENESS AND ECOLOGICAL BEHAVİOR WITH A RECOMMENDED STRUCTURAL EQUATİON MODEL AT SECONDARY STUDENTS: AN APPLICATION İN ESKİŞEHIR In this study, it was applied questionnaire study for the purpose of observing the changes of attitude and behaviours regarding ecological products at four secondary school in Eskişehir. Also, it was performed Confirmatory Factor Analysis to reveal factors related to Ecological Products Buying Behavior. Based on the results that obtained from Structural Equation Modeling (SEM), it was offered that students who indicate environmental attitude are only display environmental behaviour. Key Words: Confirmatory Factor Analysis, Structural Equation Modeling, Ecological Products 4 1

143 SESSION 4 APPLIED STATISTICS 43 1

144 A COMPARISON OF RESAMPLING BASED HYPOTHESIS TESTING FOR TWO INDEPENDENT SAMPLES Uğur BİNZAT*, Engin YILDIZTEPE Dokuz Eylül University, Faculty of Science, Department of Statistics, 35160, Buca/İzmir/TÜRKİYE 1. Introduction Classical parametric tests compare observed statistics to theoretical distributions. Unlike parametric tests, resampling methods use a computer to generate pseudo samples from observations for further summarizes and analysis. One of the oldest resampling method suggested by R.A Fisher (1930) is permutation test, also known as exact test. Another well-known method, bootstrap, which is inspired by the Jackknife, uses with replacement resample technique and in that way differs from permutation tests. It was first suggested by Efron (1979) and became very famous especially in the last decades. In this study, two bootstrap based methods, permutation test and Wilcoxon-Mann-Whitney test are compared in terms of actual significance level and power.. Methods The Wilcoxon-Mann-Whitney (WMW) test is the well-known nonparametric alternative of the two independent samples t-test. It is a rank based method. The second method, the permutation test (PT) is a type of statistical significance test in which the distribution of the test statistic under the null hypothesis is obtained by calculating all possible values of the test statistic under rearrangements of the labels on the observed data points. The third method, the percentile bootstrap with trimmed mean (PBTRIM), is a more robust type of the percentile bootstrap method and it is better than bootstrap-t method in certain conditions [3]. The last method, bootstrap hypothesis testing for two sample means with null resampling (NR), was proposed by Martin [1]. It is a bootstrap approach to the construction of confidence intervals for the mean difference that honors the null hypothesis. We provide the detailed description of the method in our full paper. 3. Simulation Study In this section, a Monte Carlo simulation study is conducted for the four methods. The simulation study was performed using R The methods were compared in terms of test power and their ability to control the probability of a Type I error when testing at the 0.05 level. Random samples were generated from skewed and heavy tailed theoretical distributions. We used small, moderate and large sample sizes. All simulations were done with 10,000 replications and 1499 bootstrap samples for each n. Regarding the method based on a trimmed mean 0% symmetric trimming were used. 4. Conclusion Most well-known nonparametric test to compare two independent groups, WMW test, was compared with three different resampling test procedures. Here, we only give the results for gamma distribution when n=0. According to these results, actual significance levels of the methods are very close to the nominal level 0.05 except NR. It can be clearly seen from the results that WMW test have slightly better power properties than other methods Table1. Comparison of Type I Error and Power Estimates for Gamma Distribution

145 Sample Size = 0:0, Gamma Distribution with fixed scale (0.5) parameter Shape parameters WMW PT PBTRIM NR REFERENCES [1] Martin, M. A. (007), Bootstrap hypothesis testing for some common statistical problems: A critical evaluation of size and power properties, Computational Statistics & Data Analysis, 51.1 : [] Ozdemir, A. F., R and R. Wilcox, and E. Yildiztepe (013), Comparing Measures of Location: Some Small-Sample Results When Distributions Differ in Skewness and Kurtosis Under Heterogeneity of Variances, Communications in Statistics: Simulation and Computation, 4(), [3] Wilcox, R. R. (01), Introduction to robust estimation and hypothesis testing, Academic Press. ABSTRACT A COMPARISON OF RESAMPLING BASED HYPOTHESIS TESTING FOR TWO INDEPENDENT SAMPLES In this study, two bootstrap based methods, permutation test and Wilcoxon-Mann-Whitney (WMW) test were compared in terms of actual significance level and power via an extensive Monte Carlo simulation. The significance level considered as 5% and samples were generated under skewed and heavy tailed theoretical distributions. We chose varying sample sizes. For the gamma distribution when n=0, all methods gave good performance over controlling Type I error, except null resampling method. For this simulation setting, WMW test had slightly better power properties than other methods. Key Words: (Bootstrap hypothesis testing, Permutation test, Wilcoxon Mann Whitney test, Test power) 45 1

146 COMPARISON OF TWO INDEPENDENT GROUPS BY USING THE LOWER AND UPPER QUANTILES AND PERCENTILE BOOTSTRAP Gözde NAVRUZ *, A. Fırat ÖZDEMİR Dokuz Eylül University, Faculty of Sciences, Statistics Department, 35390, İzmir, TURKEY 1. Introduction The most common idea for comparing two independent groups is to use a measure of location such as mean or median. But, when the matter is to determine whether the differences occur in the tails of distributions or not, the quantiles should be considered as well. A variety of methods for estimating population quantiles and additional comparisons of various estimators are available in the literature. Some of them have advantages in particular situations, but certainly none of them is the best. In this study Harrell Davis estimator and another quantile estimator which was studied by Gumbel are investigated (Harrell & Davis, 198; Gumbel, 1939). Harrell Davis estimator uses all of the order statistics by taking a weighted average. For estimating the qth quantile, consider the random variable Y that have a beta distribution with parameters a=(n+1)q and b=(n+1)(1-q). The probability distribution of Y is (a) (b) (a b) y a1 (1 y) b1, 0 y 1 where is the gamma function. Let, (1) i 1 i Wi P( Y ) () n n Then, the Harrell Davis estimate of the qth quantile is n ˆ WX (3) q i (i) i1 where X(1) X ()... X(n) denotes the order statistics of the sample X 1,X,...,X n. On the other side, q modef(x ) (i1) / (n 1), which is Gumbel's quantile estimator considers the modal position k (i) definition 7 of Hyndman and Fan (1996) and also the default value in R. Note that the aim is to test H 0 :q1 q where q1 and q are the qth quantiles of the first and second group respectively. For the purpose of investigating the control over actual Type I error rates, The Harrell Davis estimator and the quantile estimator that is referred to Gumbel are used in conjunction with a percentile bootstrap method The performance of the given quantile estimators are compared with a simulation study by using R programming language (R version 3..1). The nominal significance level was set at Normal, symmetric and heavytailed, asymmetric and light-tailed, and asymmetric and heavy-tailed distributions are used. In particular, g-and-h distributions are used with different g and h parameters in order to generate data from those specific types of

147 distributions (Hoaglin, 1985). Both small and large sample sizes are considered. Besides median, lower and upper quantiles are compared. Most especially, the attention is focused on the qth quantiles where q=0.1 or 0.9. In particular, when quantiles close to zero or one are compared with small sample sizes, control over the actual Type I error rate is achieved by using the Gumbel's estimator. Detailed results and concluding remarks are discussed, some recommendations are given. REFERENCES [1] Gumbel E.J. (1939). La Probabilité des Hypothèses. Comptes Rendus de l Académie des Sciences (Paris), 09, [] Harrell F.E. and Davis C.E. (198). A new distribution-free quantile estimator. Biometrika, 69, [3] Hoaglin D.C.(1985). Summarizing shape numerically: The g-and-h distribution. In: Haoglin D., Mostseller F., Tukey J. editors. Exploring data tables trends and shapes. New York: Wiley; p [4] Hyndman R.J. and Fan Y. (1996). Sample quantiles in statistical packages. The American Statistician, 50:4, [5] Wilcox R.R., Erceg-Hurn D., Clark F. & Carlson M. (013), Comparing two independent groups via lower and upper quantiles. Journal of Statistical Computation and Simulation, 84:7, ABSTRACT COMPARISON OF TWO INDEPENDENT GROUPS BY USING THE LOWER AND UPPER QUANTILES AND PERCENTILE BOOTSTRAP The frequently used way of comparing two independent groups is to compare in terms of some measure of location such as mean. For non-normal and heteroscedastic cases, trimmed mean, median or some other robust measures of location can be used instead. However, determination of the differences in the tails of the groups might be of interest. For this reason, comparing the lower and upper quantiles becomes an important issue. In this study, Harrell-Davis estimator (Harrell & Davis, 198) and the default quantile estimator of R (Gumbel, 1939) are compared in terms of actual Type I error rates. When quantiles close to zero or one are compared with small sample sizes Gumbel's estimator, and when quantiles close to median are compared with large sample sizes Harrell Davis estimator saved actual Type I error rate better. Key Words: two independent groups, Gumbel estimator, Harrell Davis estimator, percentile bootstrap 47 1

148 An ARMA Type Pi-Sigma Artificial Neural Network for Nonlinear Time Series Forecasting Esra AKDENİZ DURAN 1, Erol EĞRİOĞLU 1 İstanbul Medeniyet University, Faculty of Science and Faculty of Medicine, Department of Statistics and Biostatistics, esra.akdenizduran@medeniyet.edu.tr Giresun University, Faculty of Arts and Science, Department of Statistics This paper provides insight into forecast techniques and proposes a new technique that can be applied to complicated time series. Real-world time series data often have inherent complexity which results from the nonlinearity, and non-stationarity of the generating process, as well as from measurement issues like noise, aggregation, and finite data length-directly correlated with predictability. In practice, artificial neural networks are often employed for modeling nonlinear time series because of their capabilities to adapt to the data at hand. Higher order artificial neural networks can adapt to data structures by increasing their orders thus are used more often than other type of artificial neural networks. In this study, a new recurrent Pi-sigma neural network is proposed. This new artificial neural network model is called ARMA Type Pi-sigma Neural Network. A learning algorithm based on particle swarm optimization is developed for training ARMA Type Pi-sigma Neural Network. As an illustration, the proposed network applied on three real time series data sets. In addition, a simulation study is conducted based on Istanbul Stock Exchange data set. The simulation and application results indicate that the proposed model is promising in terms of forecasting performance. Complicated time-series data are ubiquitous in modern scientific research. In practice, different methods are applied for forecasting time series. The methods can be classified in two main approaches: model based and data based. In neural network approach, the model can be adapted to the data set in hand very efficiently by changing the number of hidden layers and/or the nodes in the hidden layer. Artificial neural works when applied to time series provide a non-linear forecasting method. Neural network forecasting requires a much larger number of observations but it also allows more flexible and complicated models to be fitted. The most widely used type of neural networks is the multi-layer perceptron artificial neural network (MLP-ANN) which has an additive aggregation function. Another important type of neural network is the multiplicative neuron model artificial neural network (MLP-ANN) which has a multiplicative aggregation function. MNM-ANN is proposed by Yadav et al. (007). MNM-ANN is a single neuron model, which could perform better than MLP-ANN model with a smaller number of neurons by means of employing a multiplicative aggregation function. MNM-ANN has different versions. There exist various versions of MNM-ANN in literature. Egrioglu et al. (015) proposed recurrent multiplicative neuron model artificial neural network (RMNM-ANN), Gundogdu et al. (015) proposed Gauss activation function based multiplicative neuron artificial neural network model. Higher order ANN models are another class based on additive and multiplicative aggregation functions. Higher order networks such as sigma pi network (SPNN) (Rumelhart DE and Mcclelland, 1986), higher order processing unt neural network (Giles and Maxwell, 1987), product unit neural network (PUNN) (Durbin and Rummelhart, 1989), have been proposed in the literature. In this study pi-sigma neural network (PSNN) proposed by Shin and Ghosh (1991) has been changed into a recurrent version with a modification in the structure. This new ANN is called as autoregressive moving average type pi sigma neural network (ARMATPSNN). The proposed ANN is trained with a particle swarm optimization algorithm. The proposed model is applied on three Istanbul Stock Exchange time series and the results are promising on behalf of the proposed model. 48 1

149 REFERENCES [1] Egrioglu E., Aladağ Ç.H., Yolcu U., Bas E. Recurrent Multiplicative Neuron Model Artificial Neural Network for Non-Linear Time Series Forecasting, Neural Processing Letters, 41(), 015, [] Gündoğdu, Ö., Egrioglu, E., Aladağ, Ç. H. & Yolcu, U. (015). Multiplicative Neuron Model Artificial Neural Network Based on Gauss Activation Function. Neural Computing and Application, DOI /s x. [3] Hussain AJ, Liatsis P. Recurrent Pi Sigma networks for DPCM image coding. Neurocomputing 00(55): [4] J. Ghosh and Y. Shin, Efficient Higher-order Neural Networks for function approximation and classification Int. J. Neural Systems, vol. 3, no. 4, pp , 199. [5] Kennedy, J., Eberhart, R. (1995). Particle swarm optimization, In Proceedings of IEEE International Conference on Neural Networks, pages , Piscataway, NJ, USA, IEEE Press. ÖZET ARMA TİPİ Pİ-SİGMA YAPAY SİNİR AĞLARI İLE DOĞRUSAL OLMAYAN ZAMAN SERİLERİ ÖNGÖRÜSÜ Gerçek hayat zaman serileri, karmaşık ve doğrusal olmayan yapılara sahiptirler. Literatürde doğrusal olmayan zaman serilerinin çözülmesinde yapay sinir ağları, esnek yapıları ve veriye dayalı yaklaşım olmaları nedeniyle sık kullanılmaktadırlar. Yüksek dereceli yapay sinir ağları, diğer yapay sinir ağı türlerine göre, model derecesinin arttırılabilmesi nedeniyle verilere daha iyi uyum sağlayabilmektedir. Bu çalışmada pi-sigma yapay sinir ağları için yeni bir geri beslemeli mimari yapı önerilmiştir. Yeni yapay sinir ağı modeli ARMA Type Pisigma Neural Network olarak isimlendirilmiştir. ARMA Type Pi-Sigma Neural Network ün eğitimi için parçacık sürü optimizasyonuna dayalı bir eğitim algoritması ortaya koyulmuştur. Önerilen yeni yüksek dereceli yapay sinir ağı üç adet gerçek zaman serisine uygulanmış, ayrıca Istanbul Stock Exchange veri setine dayalı bir simülasyon çalışması gerçekleştirilmiştir. Uygulamalar sonucunda önerilen yeni yapay sinir ağının başarılı öngörü sonuçları üretebildiği görülmüştür. Anahtar Kelimeler: Yüksek Dereceli Yapay Sinir Ağları, Pi-Sigma Yapay Sinir Ağları, Öngörü, Geri Beslemeli Yapay Sinir Ağları, Parçacık Sürü Optimizasyonu. 49 1

150 TIME SERIES ANALYSIS ON THE FREQUENCY DOMAIN OF THE REGIONAL RAINFALL IN TURKEY * Fatma Esra SOYSAL 1 Cemal ATAKAN Yılmaz AKDİ 3 *1 Karamaoğlu Mehmetbey Üniversitesitesi, İ.İ.B.F., İşletme, 70100, Karaman -3 Ankara Üniversitesi, Fen Fakültesi, İstatistik, 06100, Ankara * fesrasoysal@kmu.edu.tr 1. INTRODUCTION Time series are analyzed in two ways using the time domain and the frequency domain. Time domain analysis is preferred when the data have periodic movements. In this case, estimates and forecasts are obtained by using the trigonometric transformations. In this study, monthly rainfall occurred between the years taken from Turkish State Meteorological Service are handled. The rainfall which can t be observed due to several reasons. Therefore, the monthly estimated values (averaging the year of the month) are used in the analysis. As one would expect, the precipitation show periodic fluctuations. Model estimation is going to be performed for each region with the above-mentioned method.. FOURIER COEFFICIENTS Seasonal movements show periodic fluctuations. In such cases, trigonometric functions can be used to express periodic movements as mathematical statements in the model. In time series analysis, the model which is based on trigonometric functions such as sine-cosine functions can be established. If Y t is the value observed in t-th time, then the following model can be considered as Y t =μ+acos(πft)+bsin(πft)+e t, t=1,, 3,..., n. (1) Here f is known as the Fourier frequencies and A, B and are parameters to be estimated. (Box and Jenkins 1976) The model (1) is similar to a regression model. In this way, it is easier to estimate µ, A and B parameters if the model is considered as a linear model given in () y=xβ+e. () The parameters are estimated by the least squares method. Here, (, AB, ) and the estimated values of these parameters are given in (3). μ [ Â] =[ 1 n n t=1 Y t, n n t=1 Y t cos(πft), n n t=1 Y t sin(πft) ]' (3) B From to these statements the actual parameters of sinusoid are derived. 1 (Bloomfield 000, Fuller 1996) The OLS estimates of the parameters A and B (namely a k 50 and b k ) are known as Fourier coefficients. Using these OLS estimates (or Fourier coefficients) the periodogram ordinate of Y t is defined as I n (w k ) = n (a k + b k ) (4)

151 (Akdi and Dickey 1999). 3. CONCLUSION This study has two main categories: time-series analysis and discriminant analysis. After the model established for geographical areas, revised areas' models will be estimated in accordance with the results of discriminant analysis. The rationale for this approach is to get better results with proposed grouping. In other words, whether, assigning the provinces to regions by average rainfall would lead to any change will be examined. Thus, when provinces combined with similar monthly average rainfall, it is shown that the differences between observed and predicted values of monthly averages decrease. ABSTRACT In time series that include seasonal fluctuations, periodic functions are used to occur the model. In this study, the rainfall data shows seasonal movements. Therefore, frequency domain analysis is used for the rainfall data model. Initially, geographical regions models are going to be estimated. Then, discriminant analysis will be applied to the average rainfall of the provinces and new models for reorganised regions based on this anaysis will be composed. Predictions obtained from the two different groupings are going to be compared. Key words: Precipitation, Fourier coefficient, Frequency domain, Time series REFERENCES Akdi, Y. And D.A. Dickey, '' Periodograms for Seasonal Time Series with a Unit Root'' ISTATISTIK, Journal of Turkish Statistical Association, Vol., Number 3, , 1999 Baltagi, B.H Econometric Analysis of Panel Data. John Wiley and Sons, 11-1, London Bloomfield, P Fourier Analysis of Time Series. John Wiley and Sons, 5-8.s. New York Box, G.E.P., Jenkins, G.M Time Series Analysis: Forecasting and Control. Holden-day, 64-65, California Fuller, W.A Introduction to Statistical Time Series. John Wiley and Sons, 1-4, 13-15, New York 51 1

152 TEMPERATURE IN TURKEY AND TURKISH DAY AHEAD ELECTRICITY MARKET Kamil Demirberk ÜNLÜ 1,,*, Ali Devin SEZER 1 1 Middle East Technical University, Institute of Applied Mathematics, 06800, Ankara, Turkey Ankara University, Faculty of Science, Department of Statistics, 06100, Ankara, Turkey * kdunlu@ankara.edu.tr, devin@metu.edu.tr Transition to the free market model of the Turkish electricity market started in 001 with the Electricity Market Law no Generation, wholesale, transmission and distribution activities were separated and some of them were privatized. This transformed the Turkish electricity market into a competitive one and with the increasing competition; on December 1, 009 the Turkish day ahead electricity market started its operations. Al- most 0% of the electricity trade in Turkey takes place in this market while the remaining is realized through bilateral contracts. Establishment of the Turkish day ahead electricity market is a significant development because it allows the forces of supply and demand to establish a fair and public price for electricity. Establishment of this price is essential for the actors in the energy sector to make efficient decisions. One of the key elements in the use of a price is to understand its dynamics. Because the market is so new there are only a very small number of works that analyze the prices that are realized in the Turkish day ahead electricity market. Currently we are only aware of [4], which uses a continuous time framework. The aim of this study is to explore the dynamics of the prices observed in the Turkish day ahead electricity market. There are two levels of our work: 1) study the price process as a univariate process, ) study the same process and temperature as a two dimensional process. The goal of the latter part is to understand to what extent temperature influences the day ahead prices. Since there are no publicly available models of temperature in Turkey, we have built a preliminary model of temperature dynamics in Turkey. We are interested in two processes: temperature and electricity prices established at the day ahead market in Ankara. Most of the temperature models that we have reviewed, such as [1], [] and [3], make use of periodic functions to capture the cyclical behavior of temperature. It appears to us that such an approach often leads to complicated models with many parameters. We propose a simple approach based on the following observation. The temperature process alternates between two phases: a heating phase and a cooling phase. We approximate both of these phases by a model of the form Λt +Xt, where Λt is an affine function of time and Xt is a stationary process. Conditioning on the heating and cooling phases, we see that very simple time series models capture the random stationary part very well. We take a similar approach in modeling electricity prices. However, this behavior is much more complicated than the dynamics of the temperature process. After listing some very salient features of the prices process, we have focused on a particular period (the time interval between February and March ) where clearly the prices seem to follow a model of the form Ψt + Yt, where Ψ is, again, an affine function of time and Y a stationary process. Once again, upon conditioning on this period, those simple time-series models capture the dynamics of Yt remarkably well. A primary aim of this work is to begin an analysis of the effect of temperature on electricity prices. In our approach this effect can be studied in two levels: globally and locally. The global variables in our temperature model are: slopes of the cooling and heating trends, the length of the cooling and heating periods. The local variables are the fluctuations in the temperature conditioned on the global variables. The global variables of our (incomplete) price model are: the starting point of the price-decrease period (the period that includes the February -March interval specified above) and its length. A global analysis of the effect of temperature on prices would look at the dependence between the global variables. This is not simple and may require more data than what is currently available. Instead, in this paper, we limit ourselves to a local analysis. That is, we look at the following question: conditioning on the global variables (i.e., fixing the values of the global variables) what is the relation between fluctuations in temperature and the fluctuations 1 in price? To condition on the global variables we limit our analysis to the February-March period 5 referred to above where all of the global variables described above seem to be fixed. The answer to the question we have just stated, according to our analysis, is that there is little relation between price and temperature fluctuations.

153 REFERENCES [1] Anastasiadou, Z. and Lopez-Cabrera, B., Statistical Modelling of Temperature Risk, SFB Discussion Paper, Humboldt-Universitat zu Berlin, Germany, 01. [] Benth, F.E. and Sˇaltyte Benth, J. and Koekebakker, S., Putting a Price on Temperature*, Scandinavian Journal of Statistics, 34, , 007. [3] Hardle, W.K. and Cabrera, B.L., The implied Market Price of Weather Risk, Applied Mathematical Finance, 19, 59-95, 01. [4] Talasli, I., Stochastic Modeling of Electricity Markets, PhD thesis, IAM, METU, January 01. ABSTRACT TEMPERATURE IN TURKEY AND TURKISH DAY AHEAD ELECTRICITY MARKET One of the key steps of the liberalization of the Turkish electricity market has been the establishment of PMUM (Turkish day ahead electricity market). The aim of this study is to explore the dynamics of electricity prices observed in this market and their relation with temperature observed in Turkey. The electricity price process is studied as a univariate process and the same process is studied along with temperature together as a two-dimensional process, also a relatively complete model of temperature was established for Turkey. The results show that for a given period of time, there is little relation between price and temperature fluctuations. Key Words: Turkish day ahead electricity market prices, temperature, auto-regression, forecasting, modeling 53 1

154 SESSION 4 ÖRNEKLEME 54 1

155 OKUL YÖNETİCİLERİNİN BEDEN EĞİTİMİ VE SPOR DERSİNE YAKLAŞIMŞARININ ÖRNEKLEME METODU (GOOS)( GENİŞLİĞE ORANTLI OLASILIKLI SEÇİM) KULLANILARAK BELİRLENMESİ ÜZERİNE BİR ÇALIŞMA (SAMSUN İLİ ÖRNEĞİ) Sadettin EKİNCİ (1), Mücahit KURTULUŞ () (1) MEB, Beden Eğitimi Öğretmeni, SAMSUN Dünya da yer alan tüm ülkeler hemen hemen her alanda bir yarış içerisindedir. Bunlardan birisi de spor alanıdır. Olimpiyatların amblemi tüm kıtaları simgelemektedir. Dostluk, barış ve kardeşliğin simgesi altında her ülke bu ve benzeri organizasyonlarda en iyisi olabilmek için bir yarış içerisindedir. Görsel olmasının yanında en hızlı, en yüksek, en dayanıklı vb. kriterlere göre bireysel ve takım sporlarının kürsüde yer alması o ülke/ler için önemli bir göstergedir. Unutulmaması gereken en önemli unsur ise yarışmadaki tüm sporcuların kürsüye çıkmak (madalya kazanmak) için illegal yollara sapmamasıdır. Bunu sporcu/lar ülkenin adını ve imajını lekelemektedir. Maalesef bu durum ülke/ler için büyük sıkıntı oluşturmaktadır. Ülkemizde de spor alanında (tüm branşlarda) devletimiz tarafından önemli destek verilmektedir. Bir sporcunun yetiştirilmesinin çok güç olduğu yadsınamaz bir gerçektir. Büyük yatırımlarla, desteklerle, sporsonluklarla, ödüllerle vb. desteklenen sporcu/lar dan başarı beklenmesi doğaldır. Sporcu/lar ın yetişmesi uzun bir süreç almaktadır. Eğitimlerinin (Spor branşına göre) küçük yaşlarda başlaması gerekliliği bilimsel olarak kanıtlanmıştır. Eğitim ve öğretim artık nerede ise bebeklikten başlamaktadır. Eğitim ve öğretimin en önemli unsurlarından birisi de İlköğretimden itibaren başlamaktadır. Okul yöneticilerinin Beden Egitimi ve Spor derslerine bakışının sporcuların yetişmesinde etken olduğu bilinen bir gerçektir. Bundan dolayı yöneticilerimizin görüş ve önerilerinin bilinmesi amacı ile bir Anket Formu hazırlanmıştır. Çalışmamızda Samsun İli Valiliği nin tarih ve E sayılı oluru ile sorulacak soruların Anket Formu onaylanmıştır. Anket çalışmamızın pilot (Survey) uygulaması için Atakum İlçesi seçilmiştir (Tüm okul türlerinin yer alması nedeni ile). GOOS (Genişliğe Orantılı Olasılıklı Seçim) yöntemine karar verilmiştir. Yığınımızın çerçevesi belirlenmiş ve hiç bir okulun çerçeve dışında kalmaması sağlanmıştır. Pilot çalışması Temmuz.015 de tamamlnamıştır. Anket Formu yeniden revize edilmiştir. Anket uygulaması ve analizlerinin Eylül.015 tarihleri arasında tamamlanması planlanmıştır. KAYNAKLAR [1] Yamane T. (009), Temel Örnekleme Yöntemleri, Çeviri İstanbul-Türkiye, [] Bakır M.A. ve Aydın C. (013), İstatistik, Ankara-Türkiye, Nobel Yayınları.. [3] Ünver Ö. ve Gamgam H. (006), Uygulamalı Temel İstatistik Yöntemler, Ankara-Türkiye, Seçkin Yayıncılık. [4] MEB, Samsun İli İl Milli Eğitim Müdürlüğü, Okul ve Yönetici Listeleri 55 1

156 İKİ SAFHALI ÖRNEKLEMEDE BAZI ORANSAL VE ÇARPIMSAL ORTALAMA TAHMİN EDİCİLERİNİN TEORİK VE DENEYSEL KARŞILAŞTIRMASI Özge AKKUŞ Muğla Sıtkı Koçman Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 48000,Muğla, TÜRKİYE Didem ÖKMEN Muğla Sıtkı Koçman Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 48000,Muğla, TÜRKİYE 1. Genel Bilgiler Örnekleme teorisinde, ilgilenilen değişken Y (study variable) ile yüksek derecede ilişkili olan X yardımcı değişkenine ait kitle bilgilerinin çalışmaya dahil edilmesi, tahmin hatalarını önemli ölçüde düşürmektedir. Ancak X in kitle bilgilerine ulaşmak çok kolay olmamaktadır. Böyle durumlarda parametre tahminleri için iki safhalı (two phase) (or double) örnekleme yönteminin kullanılmasına ihtiyaç duyulmaktır. İlk safhada çekilen ön örneklem yardımıyla X yardımcı değişkenine ait kitle bilgileri tahmin edilmekte, ikinci safhada ise bu tahminlerden yararlanılarak çekilen alt örneklem yardımıyla ilgilenilen değişken Y ile ilgili en etkin tahminlere ulaşılmaya çalışılmaktadır. Literatürde iki safhalı örneklemede önerilen çok sayıda ortalama tahmin edicisi vardır. Ancak bu tahmin ediciler önerilirken daha önce önerilen tüm tahmin edicilerden etkinlikleri belirli koşullar altında teorik olarak ispatlanmaktadır. Oransal ortalama tahmin edicilerinin incelendiği bu çalışmada amaç, literatürde var olan çok sayıdaki tahmin edicinin etkinlik koşullarını teorik olarak ortaya koymaktır. Ayrıca, teorik bulguların pratikte geçerliliğini göstermek amacıyla veri kümesinin sağladığı koşullar da dikkate alınarak, Türkiye de 010 yılında sofralık zeytin üretimi ortalamasının en iyi ve en kötü tahminini veren tahmin ediciler belirlenmiştir.. Bulgular Tahmin edicilerin Hata Kareler Ortalaması (HKO) ve Mutlak Hata (MH) değerleri üzerinden yapılan karşılaştırma sonuçları Çizelge 1 de verilmiştir. HKO ölçütüne göre sofralık zeytin üretimi ortalamasının en etkin tahmininin, Singh, Chauhan ve Sawan tahmin edici ailesi ( y 15 ) ile elde edildiği; en kötü tahminin ise Chand tahmin edicisi- ile ( y 5 ) elde edildiği gözlemlenmiştir. Vurgulanması gereken bir diğer önemli nokta ise, teoride ve uygulamada klasik çarpımsal tahmin edicilerin etkinliğinin oran tipi tahmin edicilere oranla daha düşük olduğudur. Şöyle ki, sofralık zeytin üretimi ortalamasının en iyi tahmininin elde edilmeye çalışıldığı uygulama bölümünde ilgilenilen değişken Y ile X yardımcı değişken arasındaki ilişkinin aynı yönlü olduğu dikkate alındığında oran tahmin edicilerinin etkinliklerinin yüksek çıkması beklenen bir sonuçtur. İkinci yardımcı değişken Z ye ait olan basıklık katsayısı ve değişim katsayısı bilgilerine sahip olunduğunda, tahmin edicilerin etkinlik derecesinin arttığı gözlenmektedir. Yardımcı değişken X ile ilgilenilen değişken Y arasındaki korelasyon katsayısının bilindiği durumda ise Singh, Chauhan ve Sawan Tahmin Edici Ailesi ( y 15 ) daha etkin sonuçlar vermektedir. KAYNAKLAR [1] Choudhury, S., Singh, B.K., 01, A Class of Chain Ratio-Product Type Estimators With Two Auxiliary Variables Under Double Sampling Scheme, Journal of the Korean Statistical Society, [] Çıngı, H., 009, Örnekleme Kuramı. H.Ü.Fen Fakültesi Basımevi, Beytepe, Ankara, 78p. [3]Gajendra K. Vishwakarma & Raj K. Gangele, 014. A class of chain ratio-type exponential estimators in double sampling using two auxiliary variates, [4] Özgül N., 007, İki Safhalı Örneklemede Ortalama Tahmin 1 Edicileri, Yüksek Lisans Tezi, Hacettepe Üniversitesi, Ankara. 56 [5] Singh, R., Chauhan, P., Sawan, N., Smarandache, F., 008, Improvement in Estimating Population Mean Using Two Auxiliary Variables in Two Phase Sampling,

157 Çizelge 1. Zeytin Üretimi Verisi İçin Etkinlik Sıralaması of Est. Tahmin Edici 1 x Z xz y0 y x z xz Singh, Chauhan, Sawan Family xbxz Z z y7 y x x byx x x y Upadhyaya Est. y z z C z y13 x x z Z Cz Singh and Upadhyaya Est.-5 Ta hmin Değeri an Y HKO E A KO Sırası H A E Sırası x y y x Classical Product Est. x xz y5 y y x xz Z z Chand Est.- A THEORETICAL AND EXPERIMENTAL EFFICIENCY COMPARISON OF SOME RATIO AND PRODUCT TYPE MEAN ESTIMATORS IN TWO PHASE SAMPLING ABSTRACT In this study, the performance of some ratio and product type mean estimators proposed for the estimation of the population mean in two phase sampling scheme has been discussed. For this purpose, theoretical comparisons have been made over Mean Square Error values and efficiency conditions have been determined. Additionally, a real data set on olive production has been taken from the records of Turkish Statistical Institute to show that the theoretical findings are also valid for a real data set under different conditions. Finally, it has been proved that almost all the theoretical findings are compatible with the empirical findings. Key Words: Efficiency Comparison, Mean Estimator, Two Phase Sampling, Ratio Type Estimator, Product Type Estimator 57 1

158 MEDYAN SIRALI KÜME ÖRNEKLEMESİ ALTINDA RİDGE REGRESYON TAHMİN EDİCİSİNİN FARKLI SHRİNKAGE PARAMETRELERİ İÇİN İNCELENMESİ Yaprak Arzu ÖZDEMİR Meral EBEGİL Fikri GÖKPINAR Gazi Üniversitesi Fen Fakültesi İstatistik Bölümü Beşevler Ankara Çoklu doğrusal regresyon, değişkenler arasında var olan ilişkilerin ortaya çıkarılmasını sağlayan, pek çok alanda yaygın olarak kullanılan istatistik yöntemlerden biridir. Veri analizi yapan araştırmacılar, çoklu doğrusal regresyon yöntemini model kurmak için kullanırlar. Regresyon katsayılarını tahmin etmek için yaygın olarak kullanılan yöntem En Küçük Kareler (EKK) yöntemidir. Ancak, EKK yönteminin doğru sonuçlar vermesi için çeşitli varsayımların sağlanması gerekmektedir. Bunlardan biri bağımsız değişkenler arasında ilişki olmamasıdır. Ancak gerçekte bu durum her zaman sağlanmayabilir. Bu durumda, EKK tahmin yönteminin kullanılması yanlış model bulgularına ve kullanımına neden olabilir. Bu tür birbiriyle bağımlılık gösteren açıklayıcı değişkenlerle analiz yapmak için çeşitli yöntemler geliştirilmiştir. Bu yöntemlerden bir tanesi de yanlı tahmin yöntemleridir. Yanlı tahmin yöntemlerinin başlıcaları; temel bileşenler regresyonu, ridge regresyonu ve bunların türevleridir. Yanlı tahmin ediciler, EKK tahmin edicilerine göre yanlı, ancak daha küçük varyanslı tahminler verirler. Yanlı tahmin yöntemlerinde genel amaç, EKK tahmin yönteminde büyük olan varyansı, küçük bir yan karşılığında daraltmaktır. Böylece EKK yöntemine göre daha doğru sonuçlar elde edilebilir. Çevre, ekoloji, tarım ve tıp gibi bazı alanlarda ilgilenilen değişkenin ölçümünün zaman, bütçe v.b. faktörler bakımından zor veya pahalı olduğu durumlarla karşılaşılabilir. Bu gibi durumlarda, Sıralı Küme Örneklemesi (SKÖ) kullanılarak örnek seçim işlemi, Basit Tesadüfî Örneklemeye (BTÖ) göre daha düşük maliyetle ve daha kısa zamanda gerçekleştirilebilir. Ayrıca yığın dağılımının şekli bilindiğinde, SKÖ nin farklı tasarımları kullanılarak daha etkin tahmin ediciler elde edilebilir. Al- Saleh, SKÖ tasarımlarını yığın ortalaması ve varyansı için sapmalı ve sapmasız tahmin edici ayrımı yapmaksızın hata kare ortalamalarına göre simülasyon yoluyla karşılaştırmıştır [1]. Muttlak sıralamadaki hata miktarını azaltmak ve tek modlu simetrik dağılımlar için etkinliği arttırmak üzere Medyan SKÖ (MSKÖ) tasarımını önermiştir []. Ayrıca Samawi ve diğ. tekdüze dağılım için yığın ortalamasını tahmin etmek üzere uç SKÖ yü önermişlerdir [3]. MSKÖ, özellikle tek modlu simetrik dağılım varsayımı altında bilinen SKÖ den daha iyi sonuçlar vermektedir. Regresyon modellerinde hata genellikle normal dağıldığından tahmin edicilerin etkinliği MSKÖ kullanılarak arttırılabilir. Çoklu bağlantı problemi ortaya çıktığında, medyan sıralı küme örneği kullanılarak, ridge regresyon model parametrelerinin etkin tahmin edicilerini elde etmek mümkündür [4]. Literatürde ridge regresyon için, bir çok shrinkage parametresi (k değeri) bulunmaktadır [5]. Bu çalışmada, regresyon model parametrelerinin etkin tahmin edicilerini elde etmek için, medyan sıralı küme örneği kullanılarak ridge regresyon tahmin edicisi literatürde yaygın olarak kullanılan farklı shrinkage parametreleri için incelenmiştir. Medyan sıralı küme örneği kullanılarak farklı shrinkage parametreleri için elde edilen ridge regresyon tahmin edicisinin, basit tesadüfi örneklemeye göre elde edilen tahmin ediciye göre etkinliğini araştırmak için, farklı bağımsız değişken sayısı, örnek çapı, bağımlılık katsayısı ve hata varyansı dikkate alınarak simülasyon çalışması yapılmıştır. MSKÖ ye göre elde edilen ridge regresyon tahmin edicisinin, basit tesadüfi örneklemeye göre elde edilen ridge regresyon tahmin edicisinden daha etkin sonuçlar verdiği görülmüştür. Anahtar Kelimeler: Sapmalı tahmin ediciler, Ridge Regresyon, Shrinkage Parametresi, Çoklu Bağlantı, Medyan Sıralı Küme Örneklemesi, Göreli Etkinlik. KAYNAKLAR 1 [1] Al-Saleh M.F. (004), On the totality of ranked set 58 sampling, Applied Mathematics and Computation. 47, [] Muttlak H.A. (1997), Median ranked set sampling, Applied Statistical Science, 6(4), [3] Samawi H.M., Ahmed M.S. and Abu-Dayyeh. (1996), Estimation the population mean using extreme ranked set sampling, Biometrical Journal, 38(5),

159 [4] Özdemir Y., Ebegil M. and Gökpınar F. (015), Median Ranked Set Samping for Ridge Regression Estimator, XVIth Internatıonal Symposium On Econometrics, Operations Research And Statistics, Abstracts Book (16. Uluslararası Ekonometri, Yöneylem Araştırması ve İstatistik Sempozyumu, Bildiri Özetleri Kitabı) 94-96, Edirne, Türkiye, Mayıs. [5] Gökpınar F. and Ebegil M. (014), A Comparative Study On Ridge Estimators In Regression Problems, Sains Malasiana, (Basım Aşamasında). RIDGE REGRESSION ESTIMATORS FOR DIFFERENT SHRINKAGE PARAMETERS BASED ON MEDIAN RANKED SET SAMPLING ABSTRACT In this study, ridge regression estimators with different shrinkage parameters are examined by using median ranked set sample to obtain the efficient estimators of regression model parameters. The simulation study is performed for different number of independent variables, sample sizes, correlation coefficients and error variances to investigate the effectiveness of the ridge regression estimator with different shrinkage parameters using median ranked set sample compared to the ridge estimator using simple random sample. It was shown that, ridge regression estimator using median ranked set sample gives more efficient results than ridge regression estimator using simple random sample. Key Words: Biased Estimators, Ridge regression, Shrinkage Parameter, Multicollinearity, Median Ranked Set Sampling, Relative Efficiency. 59 1

160 TABAKALI TESADÜFİ ÖRNEKLEMEDE MALİYET KISITLI PAYLAŞTIRMA YÖNTEMLERİNİN İNCELENMESİ Sinem Tuğba ŞAHİN TEKİN*, Yaprak Arzu ÖZDEMİR, Cenker METİN Gazi Üniversitesi Fen Fakültesi İstatistik Bölümü Beşevler Ankara Gazi Üniversitesi Fen Fakültesi İstatistik Bölümü Beşevler Ankara TÜİK Ankara Örnekleme yöntemlerinin temel amacı, yığın hakkındaki önsel bilgileri kullanarak tahmin edicinin duyarlılığını arttırmaktır. Uygulamada bu amaçla kullanılan pek çok örnekleme yöntemi bulunmaktadır. Yığın heterojen yapıdayken, tabakalı tesadüfi örnekleme ile yığını homojen tabakalara ayırarak duyarlılığı arttırmak mümkündür. Tabaka sayısı ve sınırları genellikle araştırmacı tarafından belirlenir. Tabakalardan seçilecek örnek çapı ise belli bir maliyet kısıtı altında tahmin edicinin varyansını veya belli bir varyans veya maliyet kısıtı altında toplam örnek çapını minimum yapacak şekilde elde edilir. Tabakalardan seçilecek örnek çapları belirlenirken, tabaka çapları ve tabaka varyansları birbir1inden farklı ise Neyman paylaştırma, tabaka çapları ve tabaka varyanslarının farklı olmasının yanında her tabakadan birim seçme maliyeti farklılık gösteriyorsa en uygun paylaştırma yöntemlerinin kullanılması önerilmektedir (Yamane, 1967). Literatürde yapılan çalışmalarda, çoğunlukla tabakalardan birim seçme maliyetlerinin eşit olduğu veya maliyetlerin göz ardı edilebilecek kadar az olduğu varsayılmaktadır. Bankier (1988), Neyman paylaştırma ve eşit paylaştırmadan yararlanarak, yeni bir paylaştırma modeli önermiştir. Bu modelde, tabakalardan birim seçme maliyetleri eşit kabul edilmiştir. Longford (006) ise hem tabaka ortalamalarının tahmininin varyansını, hemde yığın ortalamasının tahmininin varyansını aynı anda minimum yapacak yeni bir model önermiştir. Choundhry ve diğ. (01) yaptıkları çalışmada, Bankier (1988) ve Longford (006) tarafından önerilen paylaştırma modelleri ile yine maliyeti göz önüne almayan bir doğrusal olmayan paylaştırma modelini gerçek bir veri üzerinden karşılaştırmışlardır. Uygulamada, tabakalardan birim seçme maliyetinin aynı olduğu veya göz ardı edildiği durumların sayısı yok denecek kadar azdır. Bu nedenle, maliyetin dikkate alınarak tabakalardan seçilecek örnek çaplarının hesaplanması daha gerçekçi bir yaklaşım olacaktır. Tabaka maliyetlerinin dikkate alınması durumunda genellikle, Eş.(1) deki doğrusal maliyet fonksiyonu kullanılmaktadır. 0 L t t t n (1) h i1 h Burada t; araştırma için toplam maliyet, t 0 sabit maliyet, t h ; h. tabakadan bir birim seçme maliyeti ve n h ; h. tabakadaki örnek çapı olarak tanımlanır (h=1,,,l). Eş.(1) den görüldüğü gibi, maliyet fonksiyonu doğrusal olduğunda, tahmin edicinin varyansını minimum yapacak n h değerlerinin belirlenmesi oldukça kolaydır. Ancak maliyet fonksiyonu doğrusal olmadığında, n h değerlerinin belirlenmesi oldukça karmaşıktır. Cochran (1977), Bretthauer ve diğ. (1999) ve Chernyak (001) doğrusal olmayan maliyet fonksiyonunu aşağıdaki gibi tanımlamışlardır. 0 L t t t n () h h i1 Burada α; h. tabakadan bir birim seçmenin maliyet fonksiyonu üzerine etkisini ifade etmektedir. Tabakalardan bir birim seçme maliyeti farklılık gösteriyorken, Eş.() deki maliyet fonksiyonunun kullanılması önerilir. Bu çalışmada, Bankier (1988) ve Longford (006) tarafından önerilen paylaştırma modellerine doğrusal olmayan maliyet fonksiyonu kısıtı eklenerek yeni paylaştırma yöntemleri önerilmiştir. Doğrusal olmayan maliyet fonksiyonundan yararlanarak aynı zamanda doğrusal maliyet 1 kısıtı altında gerekli örnek çapları da elde edilebilmektedir. Önerilen yeni paylaştırma yöntemleri, 60 Choundhry ve diğ. (01) yaptıkları çalışmada kullandıkları veri kullanılarak yorumlanmıştır. Anahtar Kelimeler: Tabakalı Tesadüfi Örnekleme, Neyman Paylaştırma Yöntemi, En Uygun Paylaştırma Yöntemi, Doğrusal Olmayan Maliyet Fonksiyonu, Doğrusal Olmayan Programlama.

161 THE EXAMINATION OF ALLOCATION METHODS WITH COST CONSTRAINT IN STRATIFIED RANKED SET SAMPLING Sample size of the strata is determined by the help of some allocation methods in Stratified Random Sampling. Although the main objective is to minimize the variance of the estimator, researcher also desire to obtain minimum total sample size because of cost constraint. Most of the allocation methods ignore the selection cost with respect to equal selection cost assumption in all strata. However, in real life applications it is very rare to come across such situations. Therefore, it would be more realistic to take cost into account for allocation procedure. In this study, new allocation methods are proposed by adding nonlinear cost function constraint to Bankier (1988) and Longford (006) method. Key Words: Stratified Random Sampling, Neyman Allocation, Optimum Allocation, Non-linear Cost Function, Non-linear Programming. KAYNAKLAR [1] Bankier J. (1989), Sample allocation in multivariate surveys, Survey Methodology, 15: [] Bretthauer K. M., Ross A., Shetty B. (1999), Nonlinear integer programming for optimal allocation in stratified sampling, European Journal of Operational Research, 116: [3] Chernyak A. (001), Optimal allocation in stratified and double random sampling with a nonlinear cost function, Journal of Mathematical Sciences, 103(4): [4] Choudhry G. H., Rao J.N.K., Hidiroglou M. A. (01), On sample allocation for efficient domain estimation, Survey Methodology, 38(1):3-9. [5] Cochran W. G. (1977), Sampling techniques, John Wiley and Sons Inc. [6] Costa A, Satorra A. and Venture E., (004), Using composite estimator to improve both domain and total area estimation, Applied Statistics, 19, [7] Longford N. T., (006), Sample size calculation for small-area estimation, Survey Methodology, 3,

162 YIĞIN ORTALAMASI İÇİN FARKLI ORANSAL TAHMİN EDİCİLERİN SIRALI KÜME ÖRNEKLEMESİ TASARIMLARI ALTINDA İNCELENMESİ Nurdan YENİAY, Hasan Hüseyin GÜL, Hakan Tahiri MUTLU, Yaprak Arzu ÖZDEMİR* Gazi Üniversitesi Fen Fakültesi İstatistik Bölümü Teknikokulllar/ANKARA Sıralı Küme Örneklemesi (SKÖ), örnekleme birimlerini ölçmenin zor, ancak bu birimleri ilgilenilen değişkenle yüksek derecede ilişkili bir başka değişken yardımıyla veya görsel yolla sıralamanın kolay olduğu durumlarda kullanılan maliyet ve zaman bakımından etkili bir örnekleme tekniğidir. SKÖ, McIntry tarafından 195 yılında Basit Tesadüfi Örneklemeye (BTÖ) alternatif olarak önerilmiştir. McIntry aynı örnek çapı kullanılarak yığın ortalaması için SKÖ tahmin edicisinin BTÖ den elde edilen tahmin ediciye göre daha etkin olduğunu göstermiştir. SKÖ son yıllarda çevre, tıp ve ekoloji gibi alanlarda yaygın olarak kullanılmaktadır. Örneklemede ilgilenilen değişkenle yüksek derecede ilişkili yardımcı değişken bilgisini kullanarak oransal tahmin yöntemi ile yığın parametrelerinin daha duyarlı tahmin edicileri elde edilebilir. Ayrıca ilgilenilen değişkeni ölçmenin zor fakat yardımcı değişkeni ölçmenin kolay olduğu durumlarda SKÖ kullanılarak oransal tahmin edicinin etkinliği arttırılabilir. Samawi ve Muttlak(1996), SKÖ kullanarak yığın ortalaması için oransal tahmin ediciyi incelemişler ve bu tahmin edicinin BTÖ den elde edilen tahmin ediciden daha etkin olduğunu göstermişlerdir. Kadılar ve ark.(007) SKÖ de yığın ortalaması için yeni bir oransal tahmin edici önermişlerdir. Al-Omari ve ark.(009) SKÖ altında yığın ortalaması için yardımcı değişkenin 1. ve 3. çeyrekliklerini kullanarak yeni oransal tahmin ediciler önermişlerdir. Uygulamada beşten fazla birim içeren bir örneğin sıralanması, sıralama hatasına sebep olabilir. Bu nedenle, küme çapının büyük olduğu durumlarda seçim işleminin SKÖ ye göre daha basit yolla yapılması ve sıralama hatasını en aza indirmek amacıyla farklı SKÖ tasarımları geliştirilmiştir. En büyük ve en küçük birimleri görsel yolla sıralamanın kolay olduğu Uç Sıralı Küme Örneklemesi (USKÖ), Samawi ve ark.(1996) tarafından önerilmiştir. Özellikle simetrik dağılımlar altında, USKÖ ile elde edilen yığın ortalamasının tahmin edicisinin yansız ve BTÖ den elde edilen tahmin ediciden daha etkin olduğu gösterilmiştir. Ayrıca, SKÖ de medyan değerleri dikkate alınarak gerçekleştirilen Medyan Sıralı Küme Örneklemesi (MSKÖ), Muttlak (1997) tarafından önerilmiştir. Muttlak aynı zamanda tek modlu simetrik dağılımlar altında, yığın ortalamasını tahmin etmede MSKÖ nin SKÖ den daha etkin sonuçlar verdiğini göstermiştir. Al-Omari (01) yığın ortalaması için oransal tahmin ediciyi MSKÖ kullanarak elde etmiştir. Son yıllarda SKÖ nin farklı tasarımları için önerilen yeni oransal tahmin ediciler bulunmaktadır. Al-Omari ve Gupta (014) ve Al-Omari (01) farklı SKÖ tasarımları için oransal tahmin yöntemini kullanmışlardır. Jozani ve ark. (01) ise, SKÖ de oransal tahmin için farklı tahmin ediciler önermişlerdir. Bu çalışmada, MSKÖ ve USKÖ gibi farklı SKÖ tasarımları altında, yığın ortalaması için önerilen çeşitli oransal tahmin ediciler incelenmiştir. Ele alınan SKÖ tasarımları için farklı örnek çapı ve korelasyon değerleri ile çeşitli dağılımlar kullanılarak, yığın ortalaması için oransal tahmin edicilerin BTÖ ye ve bilinen SKÖ ye göre göreli etkinlikleri simülasyon çalışması ile incelenmiştir. Anahtar Kelimeler: Sıralı küme örneklemesi, oransal tahmin edici, göreli etkinlik. 6 1

163 KAYNAKLAR 1. Mclntyre, G.A. (195). A metod of unbiased selective sampling using ranked sets. Australian Journal of Agricultural Research, Muttlak,H.A. (1997). Median ranked set sampling.. Applied Statistical Science, 6(4), Muttlak, H.A. (003). Modified ranked set sampling. Pakistan Journal of Statistics 19.3(4): Al-Omari,A.I.;Jemain, A.A., Ibrahim, K. (009) New ratio estimators of the using simple random sampling and ranket set sampling. Revista Investigacion Operacional.Vol 30(): Kadılar,C., Unyazıcı, Y., Cıngı,H.,(007). Ratio estimator for the population mean using ranked set sampling. Statistical Papers.Springer. Vol 50(): THE EXAMINATION OF DIFFERENT RATIO ESTIMATORS FOR THE POPULATION MEAN UNDER RANKED SET SAMPLING DESIGNS ABSTRACT In this study, different ratio estimators for the population mean are examined under some modified ranked set sampling designs such as median ranked set sampling and extreme ranked set sampling. Simulation results are presented to demostrate the relative efficiency values of the ratio estimators relative to the simple random sampling for different sample size, distributions and correlation coefficients under modified ranked set sampling designs. Key Words: Ranked set sampling, ratio estimator, relative efficiency. 63 1

164 SESSION 4 OLASILIK ve STOKASTİK SÜREÇLER 64 1

165 AYNI TÜR YEDEĞE SAHİP TAMİR EDİLEBİLEN SİSTEM İÇİN α- SERİ SÜREÇ VE BİR OPTİMAL DEĞİŞTİRME POLİTİKASI Mustafa Hilmi PEKALP, Halil AYDOĞDU, İhsan KARABULUT Ankara Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 06100, Ankara, Türkiye 1. Giriş Bu çalışmada monoton bir sayma süreci olan α-seri süreç, tek bileşenli ve birinin diğerinin yedeği olarak kullanıldığı tamir edilebilen bir sistemin modellenmesi için ele alınmıştır. Bu model altında N değiştirme politikası ile yenileme ödül teoreminden uzun sürede birim zaman başına düşen ortalama masraf N nin bir fonksiyonu olarak açık şekilde elde edilmiştir. Bu ifadeyi minimum yapan N, üstel ve Weibull dağılımları göz önüne alınarak belirlenmiştir.. N değiştirme politikası N bir doğal sayı olmak üzere, N değiştirme politikası N. bozulma zamanında yenisiyle değiştirilmesi olarak tanımlanır. α-seri süreç modeli altında N değiştirme politikasını uygulayabilmek için aşağıdaki varsayımlar yapılır. V1: Başlangıçta aynı türden iki yeni bileşen kullanılır. 1. bileşen çalışır durumda iken. bileşen yedek olarak beklemektedir. V: Bir bileşen bozulduğu anda tek bir tamirci tarafından tamir edilecektir. Tamir aşamasındaki bileşen yerine, yedek olarak bekleyen devreye girecektir. Bozulan bileşen tamir edildiği anda ya çalışmaya başlayacak ya da yedek durumda kalıp diğerinin bozulmasını bekleyecektir. Bir bileşen tamir edilir iken diğeri de bozulur ise tamir edilmek için diğer bileşen tamirinin tamamlanmasını bekleyecektir. Bu durumda sistem çalışmayacaktır. V3: i = 1, ve n = 1,, için i. bileşenin n. dönemi, i. bileşen üzerinde (n 1). ve n. tamirlerinin tamamlandığı anlar arasında kalan zaman aralığı olarak adlandırılır. i = 1, ve n = 1,, için X (i) (i) n ve Y n sırasıyla n. dönemdeki i. bileşenin çalışma ve tamir zamanları olsun. (X (i) n ) dizisi E(X (i) 1 ) = θ 1 > 0 ve α 1 > 0 parametresi ile stokastik azalan ve (Y n (i) ) dizisi E(Y 1 (i) ) = μ 1 > 0 ve α < 0 parametresi ile stokastik artan bir α-seri süreç belirtir. V4: (X n (i) ) ve (Y n (i) ) bağımsızdır. V5: Birinci bileşenin tamirlerinin sayısına bağlı olarak N değiştirme politikası kullanılacaktır. Sistem yenisi ile bu politika altında değiştirilecektir ve değiştirme için geçen süreler ihmal edilecektir. V6: Sistemdeki bileşen yedekte beklediği durum için çalışma ödülü alamayacaktır. Tamir için bekleme durumunda ise herhangi bir masrafa maruz kalmayacaktır. Her iki bileşen için de tamir masraf oranı c r ve çalışma ödül oranı c w dir. Sistemin yer değiştirme masrafı c dir. N değiştirme politikası altında uzun sürede birim zaman başına düşen ortalama masraf yenileme ödül teoreminden aşağıdaki gibi bulunur. c r μ 1 ( N 1 k C(N) = α 1 1 k=1 N α ) c w θ 1 ( N k α + 1 k=1 1 (N + 1) α ) + c 1. 1 θ 1 N+1 1 k=1 k α + μ 1 1 N k=1 k α + N k= ud Φ 0 k (u) + N k=1 vd Ψ 0 k (v) Burada Φ k ve Ψ k, sırasıyla tamir için bekleme ve yedekte bekleme durumlarına karşılık gelen Y () k 1 X (1) k ve X () k Y (1) k rasgele sürelerinin dağılım fonksiyonlarını ifade etmektedir. C(N) minimum olacak şekilde N değiştirme politikasına ilişkin N değeri analitik ya da sayısal yöntemler ile belirlenebilir. 65 1

166 Şekil 3. Tek bileşenli ve birinin diğerinin yedeği olarak kullanıldığı tamir edilebilen sistemin bir gerçeklenişi 3. Uygulama i = 1, için X n (i) ve Y n (i) rasgele değişkenlerinin dağılım fonksiyonları üstel ve Weibull dağılımı olarak ele alınmıştır. Hem üstel hem de Weibull dağılımı durumunda uzun sürede birim zamandaki masrafı minimum yapan N sayısal olarak hesaplanmıştır. KAYNAKLAR [1] Braun, W.J, Li Wei and Zhao, Y.Q (005), Properties of the Geometric and Related Process, Naval Research Logistics, 5, [] Lam, Y. (1988). A Note on The Optimal Replacement Problem, Adv. Appl. Prob. 0, [3] Ross, S.M. (1996). Stochastic Processes. John Wiley and Sons. Inc, California. [4] Zhang, Y.L. (1999). An Optimal Geometric Process Model for a Cold Standby Repairable System, Reliability Engineering and Systems Safety, 63, [5] ABSTRACT AN OPTIMAL REPLACEMENT POLICY FOR α-series PROCESS IN CASE OF A COLD STANDBY REPAIRABLE SYSTEM The aim of this work is to determine optimal replacement policy for a cold standby repairable system consisting of two identical components with one repairman. The sequential working and repair times of this system follow an α-series process which are stochastically non-increasing and non-decreasing, respectively. We have worked on replacement policy N which replaces the system at the N th failure time since the last replacement. By the renewal reward theorem, we have derived the explicit expressions of the long-run expected costs per unit time and calculated the optimal policy N which minimizes thiscosts analytically or numerically. Key Words: Renewal process, α-series process, optimal replacement policy, renewal reward theorem, convolution. 66 1

167 KESİKLİ VE SÜREKLİ ZAMANDA BLOK DEĞİŞTİRME MODELLERİ PELİN TOKTAŞ*, VLADIMIR V. ANISIMOV** *Başkent Üniversitesi, Bağlıca Kampüsü, Eskişehir Yolu 0. km, Fen Bilimleri Enstitüsü, Endüstri Mühendisliği Bölümü, ANKARA ** Advisory Services, Quintiles, Reading, Berkshire, RG 6UU, ENGLAND Bu çalışmada, kesikli ve sürekli zamanda çok değişkenli blok değiştirme modelleri sunuluyor. Toplamda N tane olan birimlerden her biri rasgele bozulmalara maruz kalıyor. Sistemdeki bozulmuş birimler önceden belirlenmiş jt, j = 1,, zamanlarında α olasılığı ile değiştiriliyor. Yenileme süreci şeklinde gösterilemeyen modellerde değiştirme işlemi için harcanan zamanlar göz önünde bulundurulmuyor. Bu doğrultuda ortaya konan üç modelin bazı güvenilirlik özellikleri tartışılıyor. İlk model olan toplam kontrolde sistemdeki tüm birimler jt, j = 1,, zamanlarında kontrol ediliyor. İkinci model olarak kısmi kontrol ortaya konuluyor. Bu modelde sistemden alınan n, 0 < n < N, büyüklüğündeki, örneklemin kontrol edildiği varsayılıyor. Son model olan çevrimsel kontrolde sistemdeki birimler her birinde n tane birim bulunan r gruba ayrılıyor (N = r. n). Önceden belirlenmiş jt, j = 1,, kontrol zamanlarında eğer j k (mod r) ise grup k, k = 1,,, r 1 ve eğer j k = 0 (mod r) ise grup r kontrol ediliyor. Ayrıca kısmi ve çevrimsel kontrolün birleşiminden meydana gelen çevrimsel-kısmi kontrol tanıtılıyor. Son olarak, bahsi geçen bu modellerin uzun vadede ortalama kusurlu parçalar oranı açısından karşılaştırılması yapılıyor. KAYNAKLAR [1] Anisimov V. V. (005), Asymptotic Analysis of Stochastic Block Replacement Policies for Multicomponent Systems in a Markov Environment, Operation Research Letters, 33, s [] Anisimov V. V., Gürler Ü. (003), An Approximate Analytical Method of Analysis of a Threshold Maintenance Policy for a Multiphase Multicomponent Model, Cybernetics and Systems Analysis, 39(3), s [3] Barlow R. E., Hunter L. C. (1960), Optimum Preventive Maintenance Policies, Operations Research, 8, s [4] Barlow R. E., Proschan F. (1996), Mathematical Theory of Reliability, SIAM edition of the work first published by John Wiley and Sons Inc., New York MODIFIED BLOCK REPLACEMENT MODELS IN DISCRETE AND CONTINUOUS TIME In this study, modified multi-component block replacement policies are presented in discrete and continuous time. Units are replaced only at prescribed times jt, j = 1,, A failed unit is replaced with a good one with probability α. Replacement time is negligible. Three replacement policies for models that are not represented as renewal processes are provided under this setup. Some reliability characteristics are discussed. In the first model, total control is considered where all units are controlled at time jt, j = 1,,. In the second model, a partial control is presented in which a sample of size n, (0 < n < N) is taken from all units to inspect. The last model deals with cyclic control: Units are divided into r groups. Group k is controlled at time jt where j k (modulus r), k = 1,,, r 1, and if k is equal to zero, then group 1 r is controlled. Cyclic partial control which combines the partial and cyclic control polices is also 67 introduced. Some of these models are also compared concerning the average long-run proportion of failed units. Key Words: Replacement policies, block replacement, total control, partial control, cyclic control.

168 KUYRUK SİSTEMLERİNDE HİZMET DİSİPİLİNLERİNİN ÖNEMİ VE GÜNCEL HİZMET DİSİPLİNLERİ ÜZERİNE GENEL BİR ÇALIŞMA Vedat SAĞLAM, Erdinç YÜCESOY, Murat SAĞIR Ondokuz Mayıs Üniversitesi Fen-Edebiyat Fakültesi İstatistik Bölümü Kuyruk sistemleri geliş akımı, hizmet süresi, hizmet disiplini, hizmet kanallarının sayısı, kuyruk kapasitesi ve geliş kaynağının büyüklüğü olmak üzere altı temel unsurdan oluşur. Bu altı temel unsurdan geliş akımı müşteriler tarafından belirlidir. Geliş kaynağının büyüklüğü de kısmen müşterilere bağlıdır. Geriye kalan dört temel unsur ise işletmeye aittir ve uygun şart ve durumlara göre değiştirilebilir. Biz bu çalışmada işletme tarafından değiştirilebilen unsurlardan hizmet disiplinini ele aldık. Hizmet disiplininin önemi ve diğer hizmet unsurları ile ilişkisini inceledik. Hizmet disiplininin farklılaşması kuyruk sistemini nasıl değiştirdiği ve çözüme ne gibi katkılar sağladığı araştırılmıştır. Bilgisayar ve iletişim teknolojilerindeki gelişmeye paralel olarak gelişen kuyruk sistemleri yeni hizmet disiplinlerinin ortaya çıkmasına sebep olmuştur. Bu hizmet disiplinleri bazen kuyruk sistemlerinin analizini kolaylaştırmak bazen de gerçek dünyaya daha uygun olduğu için geliştirilmiştir. KAYNAKLAR [1] W. J. Stewart, Probability, Markov Chains, Queues, Simulation, New Jersey, 009. [] U. N. Bhat, An Introduction to Queuing Theory, Boston, 008. [3] M. Zobu, V. Sağlam, M. Sağır, E.Yücesoy and T. Zaman The Simulation and Minimization of Loss Probability in the Tandem Queueing with Two Heterogeneous Channels, Mathematical Problems in Engineering, vol. 013,Article ID 59010, 4, pages, 013. [4] S. Ndreca, B. Scoppola, Discrete time GI/Geom/1 queueing system with priority, European Journal of Operational Research, 189(008),

169 ÖNÜNDE BEKLEME OLMAYAN KUYRUK SİSTEMLERİNDE KAYBOLMA OLASILIKLARI Murat SAĞIR, Müjgan ZOBU *, Vedat SAĞLAM, Erdinç YÜCESOY Amasya Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, 05000, Amasya, Türkiye * Ondokuz Mayıs Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, 550, Samsun, Türkiye vsaglam@omu.edu.tr Önünde bekleme olmayan kuyruk sistemlerinde sistemde ortalama bekleme süresi, sistemde ortalama kişi sayısı ve kaybolma olasılığı olmak üzere üç performans ölçüsü incelenmektedir. Kaybolma olasılığı müşterinin talep ettiği hizmetleri alamadan sistemden ayrılmasıdır. Bu durum müşteri memnuniyetsizliğini ve müşteri kaybı anlamına geldiği için, kaybolma olasılığı önünde bekleme olmayan kuyruk sistemlerinde önemli ve etkin bir göstergedir. Bu bağlamda önünde bekleme olmayan kuyruk sistemlerine ait kaybolma olasılığını bulmak ve belirli koşullar altında bu olasılığını minimize etmek istenmektedir. 1. Paralel Kanallı Kuyruk Sistemlerinde Kaybolma Olasılığı Paralel kanallı kuyruk sistemlerinin önünde bekleme olmadığında, mevcut kanalların tamamı dolu ise gelen müşteri servis almadan sistemden ayrılır ve kaybolma meydana gelir. a) Önünde Bekleme Olmayan Homojen Paralel Kanallı Kuyruk Sisteminde Kaybolma Olasılıkları Önünde bekleme olmayan paralel kanallı kuyruk sisteminde, hizmet kanalları homojen ise kaybolma olasılığı; B(n, ρ) = n! n ρ k k=0 k! sistemde bulunan kanal sayısına ve sistemin trafik yoğunluğuna bağlı olarak hesaplanır. Bu formül Erlag ın B formülü olarak bilinmektedir. Burada n sistemde bulunan kanal sayısı, ρ = λ μ ise trafik yoğunluğudur. λ müşteriler sisteme geliş akımı olan Poisson dağılımının parametresi, μ ise hizmet parametreleridir. Önünde bekleme olmayan homojen paralel kanallı kuyruk sisteminde iki kaybolma anı arasındaki süreye ait Laplace dönüşü; ρ n λ, n = 0 λ + s φ n (s) = λ { s + λ + nμ nμφ n 1 (s), n 1 olarak verilmiştir. Bu formül kanal sayısına bağlı bir fark denklemi içermektedir. Laplace dönüşümünden yararlanarak iki ardışık kaybolma anı arasındaki sürenin beklenen değeri bulunabilir ve kanal sayısının sonsuza yaklaşması (n ) şartı altında kayıp akımının Poisson akımına yaklaştığı gösterilebilir. Önünde bekleme olmayan homojen paralel kanallı bir kuyruk sisteminde kaybolma olasılığı, sistemdeki ortalama kişi sayısı (L s ) ile ters orantılıdır. L s = ρ(1 B(n, ρ)) b) Önünde Bekleme Olmayan Heterojen Paralel Kanallı Kuyruk Sisteminde Kaybolma Olasılıkları Önünde bekleme olmayan paralel kanallı kuyruk sisteminde, hizmet kanalları heterojen ise kaybolma 1 olasılığı; 69 1 = n! n S k p n ρ 1 ρ n k! gibidir. Bu formül, farklı ortalamalı hizmet kanalarına sahip kuyruk sistemlerinde Erlag ın B formülünün genelleştirilmiş halidir. Burada n sistemde bulunan kanal sayısı, ρ i = λ μ i i = 1,, n olarak k=0

170 tanımlanır. λ müşterilerin sisteme geliş akımı olan Poisson dağılımının parametresi, μ i ise i inci kanalın hizmet parametreleridir. S k = E k C(n, k) olarak tanımlanır. C(n, k) n nin k lı kombinasyonu, E k = E k (ρ 1,, ρ n ) ise ρ 1,, ρ n nin k ıncı simetrik fonksiyonudur.. Her Biri Tek Kanallı İki İstasyondan Oluşan Tandem Kuyruk Sistemlerinde Kaybolma Olasılıkları Tandem kuyruk sistemlerinde mevcut olan istasyonlardan en az birinin önünde beklemenin olmaması durumunda kayıp meydana gelir. Eğer ilk istasyonun önünde beklemeye izin verilmiyorsa ve ilk istasyondaki hizmet kanalı dolu veya bloklu ise kayıp meydana gelir. Aralarında bekleme olmayan iki istasyonlu bir kuyruk sisteminde kaybolma olasılığı, birinci aşamada hizmetini tamamlayan müşterinin ikinci aşamanın dolu olması nedeni ile sistemden ayrılması ile meydana gelir. Önlerinde bekleme olmayan iki istasyonlu tandem kuyruk sistemlerinde birinci istasyonda hizmetini alabilmiş olan bir müşteri ikinci aşamadaki hizmet kanalının dolu olması nedeni ile ikinci istasyona geçemez ve birinci istasyonu bloklar. Yani birinci istasyonu meşgul etmeye devem eder. Böyle bir durumda sisteme yeni gelen bir müşteri kaybolur. Eğer müşteri birinci aşamayı tamamladıktan sonra isteğe bağlı olarak sistemden ayrılabiliyor ise π olasılı ile birinci istasyonu bloklar veya 1 π olasılığı ile sistemden ayrılır. Önlerinde bekleme olmayan iki istasyonlu tandem kuyruk sistemlerinde bloklamaya müsaade edilmiyor ise iki farklı kaybolma olasılığı meydana gelir. İkinci istasyon önünde meydana gelen kaybolma olasılığı, birinci istasyon önünde meydana gelen kaybolma olasılığına bağlı olarak hesaplanır. KAYNAKLAR [5] E. Brockmeyer, H. L. Halstrom and A. Jensen, The life and works of A. K. Erlann. Danish Acad. Techn. Sci, No., Koben havn (Denmark), [6] F. Alpaslan, On the minimization probability of loss in queue two heterogeneous channels, Pure and Applied Mathematika Sciences, vol. 43, no. 1-, pp. 1 5, [7] M. Zobu, V. Sağlam, M. Sağır, E.Yücesoy and T. Zaman The Simulation and Minimization of Loss Probability in the Tandem Queueing with Two Heterogeneous Channels, Mathematical Problems in Engineering, vol. 013,Article ID 59010, 4, pages, 013. [8] V. Saglam and A. Shahbazov, Minimizing loss probability in queuing systems with heterogeneous servers, Iranian Journal of Science and Technology, vol. 31, no., pp , 007. [9] V. Sağlam and M. Zobu, A two-stage model queueing with no waiting line between channels, Mathematical Problems in Engineering, vol. 013, Article ID , 5 pages, 013. ABSTRACT IN QUEUEİNG SYSTEMS WİTHOUT WAİTİNG LİNE THE LOSS PROBABİLİTY Three measure of performance; the mean waiting time in the system, mean number of custemers and the loss probability are investigated in a queueing system without waiting line. The loss probability is a departure of a customer without having demanded service. Therefore loss probability is a essential performance of measure since gives us an idea of customer satisfactions. In this manner in queueing systems without waiting line, the optimization of loss probability is very important. The loss probability is investigated in tandem and paralell queueing systems with one service channel. Also the relationship between mean customer number and loss probability is investigated. Finally loss probabilities are analyzed regarding the changes in parameters of queueing system. Keywords: Queueing theory, Service rate, Erlang s loss formula, heterogeneous servers, loss probability, recurrent input, exponential server, overflow distribution. 70 1

171 TÜRK İMALAT SANAYININ TEKNOLOJI ÜRETIM DÜZEYLERI Mücahit KURTULUŞ (1) İlhami MİNTEMUR () Ahmet PALAS (3) 1.GİRİŞ Yeni teknolojileri yaratma, kullanma ve ticarete dönüştürme yüksek teknoloji sektörleri ve girişimler için global yarışta rekabet gücü için önemli ve ekonomik büyüme, verimlilik, sosyal koruma ve genellikle yüksek katma değer yaratma ve işçilere iyi ödeme yapmanın önemli bir kaynağıdır.teknolojik güç uluslararası rekabette ve verimlilik büyümesinde önemli bir faktördür. Teknolojik çaba ekonominin tüm alanlarına aynı şekilde yayılmıyor. İmalat sanayinin performans ve yapısal değişikliğini teknolojik açıdan analiz etmek çok önemlidir. Bu çalışmada amaç, sanayi üretim, yıllık imalat sanayi, üretici fiyat endeksleri ve dış ticaret verilerini kullanarak, yüksek teknoloji faaliyetlerini gerçekleştiren girişim sayısı, ciro, üretim değeri, istihdam, katma değer, ihracat, ithalat ve üretici fiyat endekslerini analiz etmek ve teknoloji düzeylerine göre üretim endeksi hesaplamaktır. İmalat sanayinde faaliyette bulunan girişimler ana faaliyetlerine göre yüksek teknoloji, orta yüksek teknoloji, orta düşük teknoloji ve düşük teknoloji olmak üzere dört ana gruba ayrılmıştır.. İMALAT SANAYİNDE GİRİŞİM SAYISI VE İSTİHDAM Türkiye de 010 yılında, imalat sanayinde toplam girişim faaliyette bulunmuştur.yüksek teknoloji faaliyetlerinde bulunan girişim sayısının imalat sanayindeki girişimlere oranı, yıllarında ortalama olarak % 0.69, yıllarında ise % 0.5 tir. 011 yılında imalat sanayinde bin kişi istihdam edilmiştir. Yüksek teknoloji faaliyetlerinde istihdam edilen 65 bin kişi, imalat sanayindeki istihdamın % sine denk gelmektedir. İmalat sanayinde istihdam, düşük ve orta düşük teknoloji kullanan faaliyetlerde yoğunlaşmaktadır.011 yılında Türkiye de, yüksek teknoloji faaliyetlerinde çalışan sayısı Almanya daki aynı teknoloji düzeyinde çalışanların %10 u, Fransa nın % 5.5 i, Çek Cumhuriyeti nin % 7. si oranında iken, Romanya, Hollanda Avusturya ve Portekiz gibi ülkelerden daha fazla istihdam yaratılmaktadır.1.ciro, ÜRETİM DEĞERİ VE KATMA DEĞER Türkiye yüksek teknoloji faaliyetlerinde, 010 yılında milyon ciro ve milyonluk üretim değeri elde etmiştir. 010 yılında yaratılan ciro değeri aynı yıl Almanya da yüksek teknoloji faaliyetlerinde üretilen cironun % 8.4 üne, üretim değeri ise Almanya dakinin % 8.5 ine denk gelmektedir yıllarında ortalama katma değerin % 70 i düşük ve orta düşük teknoloji faaliyetlerinde yaratılmaktadır. Yüksek teknolojide yaratılan katma değer yıllarında ortalama katma değerin % 5.3 üne sahiptir yıllarında sabit fiyatlarla ortalama olarak katma değer açısından en fazla büyüme, yüksek teknoloji faaliyetlerinde meydana gelmiştir. Bu dönemde imalat sanayi % 3,1 büyürken, yüksek teknoloji faaliyetleri% 9,3 büyüme göstermiştir...ihracat VE İHALAT Yüksek teknoloji ürünleri ihracatının, imalat sanayinin ihracatı içerisindeki payı % 3 olup, ihracat, ağırlıklı olarak düşük ve orta düşük teknolojilerde yoğunlaşmaktadır. 01 de ihracatın % 65.7 si düşük ve orta düşük yüksek teknolojilere aittir. Yüksek teknoloji ürünleri ithalatının imalat sanayindeki ithalat payı %13 olup, ithalat ağırlıklı olarak orta düşük ve orta yüksek teknolojilerde yoğunlaşmaktadır. 011 de ithalatın % 73 ü orta düşük ve orta yüksek teknolojilere aittir..3.imalat SANAYİNDE TEKNOLOJİ DÜZEY ENDEKSLERİ Bilindiği üzere, Türkiye İstatistik Kurumu, aylık ve dönemsel olarak sanayi üretimi ve ana sanayi gruplarına göre endeks ve değişimlerini yayınlamaktadır. 3 Ana sanayi gruplarına ilave olarak teknoloji düzeylerine göre endeks oluşturmak ve yayınlamak sanayinin teknolojik gelişim düzeyini izlemek ve ölçmek açısından önemlidir. Aynı şekilde istihdam, ücret ödemeleri ve dış ticaret verileri kullanılarak ithal ve ihraç edilen ürünlerin teknoloji düzeyleri ölçülebilir. Yüksek teknoloji imalatı, 010 yılından beri üretim endeksi ve diğer istatistik göstergelerinde, imalat sanayi ve sanayinin toplamından daha fazla ve kabul edilebilir bir gelişme göstermiştir. İmalat sanayi döneminde ortalama % 5.6 büyürken yüksek teknoloji faaliyetleri % 7. büyüme göstermiştir Sanayi Üretim Endeksinde NACE Rev. nin Madencilik ve Taş ocakçılığı (B), İmalat (C), ile Elektrik, Gaz, Buhar ve İklimlendirme Üretimi ve Dağıtımı(D)sektörleri (07.1,35.1, 35.13, 35.14, 35., 35.3 ve 38 hariç) kapsanmaktadır.

172 Teknoloji Düzeylerine Göre Yıllık Sanayi Üretim Endeksleri (010=100) Sanayi (Toplam) ,9 116,3 İmalat sanayi ,0 117,5 Düşük teknoloji 105,3 109,0 11,9 Orta düşük teknoloji 111,0 113,6 117, Orta yüksek teknoloji 116,6 116,1 14,0 Yüksek teknoloji 117,6 14,9 1,0 3.SONUÇ VE ÖNERİLER Türk imalat sanayi, yıllarında incelenen göstergeler açısından ( ciro, üretim değeri, istihdam ve katma değer) düşük ve orta düşük teknoloji faaliyetlerinde yoğunlaşmaktadır. 011 yılında; (i) istihdamın % 80 i, (ii) Katma değerin % 70 i, (iii) İhracatın % 65 i düşük ve orta düşük teknoloji faaliyetlerinde bulunmaktadır. Yüksek teknoloji faaliyetlerinde yaratılan istihdam, ciro, üretim değeri ve katma değer gelişmiş AB ülkelerinin hayli gerisindedir. Türk imalat sanayinin yüksek teknoloji faaliyetlerinde, 9 yılda birikimli olarak yaratılan ciro değeri, Almanya da bir yılda yaratılan ciro değerinin % 73,5 i kadardır. Türkiye en çok orta yüksek teknoloji ürünlerini ithal etmektedir. Türk imalat sanayi, 013 yılından itibaren orta yüksek teknolojiye geçiş çabası göstermektedir. Türkiye ekonomisindeki değişimleri takip edebilmek ve sanayi politikaların geliştirilmesine yardımcı olmak için Türkiye İstatistik Kurumu, teknoloji düzey endeksleri hesaplayarak aylık ve dönemsel olarak üretim, istihdam, ücret ödemelerini, ithalat ve ihracat endekslerini yayınlayabilir. KAYNAKLAR 1. Eurostat. High-techstatistics NACE Rev.1.1. Ekonomik Faaliyetlere Göre Bazı Temel Göstergeler. 3. NACE Rev.1.1, Ekonomik Faaliyetlere Göre Bazı Temel Göstergeler Thomas JAEGERS. Carmen LIPP-LINGUA. Digna AMIL. High-technologyandmediumhightechnologyindustries main drivers of EU-7's industrialgrowth.eurostat. ISSN: Cataloguenumber:KS-SF EN-N 5. TUİK. Avrupa Topluluğunda Ekonomik Faaliyetlerin İstatistik Sınıflaması TUİK. Türkiye İstatistik Yıllığı. Ankara 011&01. TURKISH INDUSTRY PRODUCTION TECHNOLOGY PRODUCTION LEVELS In this study, the level of technology, specially high level technology in Turkish manufacturing industry, have been analyzed in terms of number of enterprises, turnover, production value, employment, value added, export, import and domestic producer price indices and in addition to that production indices have been calculated according to level of technology. Key Words: Statistical Classifications, Technology Level, Production Indices 7 1

173 SESSION 5 STATISTICS in SOCIAL SCIENCES 73 1

174 Implications of Early Warning Modeling Approach to Corporate Strategic Planning: A Case Study of the Turkish Higher Educational System. Prof.Dr.E. Abdülgaffar Ağaoğlu Yeditepe University, Department of Business Administration Kayışdağı Campus, İstanbul, Turkey agaoglu@ yeditepe.edu.tr agaoglu_ag@yahoo.com Key Words: Turkish Higher Education System; Econometrics; Statistical Analysis; Discriminant Analysis; Turkish Foundation Universities; Turkish Public Universities; Analysis of Higher Education; Quality of Private Education; Strategic Planning of the Higher Education, Early Warning Models. With the first foundation university founded in 1985, Turkey had 31 universities in total. At the beginning of year 011, there were 166 universities (including 9 private vocational schools). 10 of these were public universities (61.45%); 55 (33.50%) were initiated by foundations; and their were 9 (5.40%) private vocational schools of higher education. Student population of the foundation universities exceeded 10% of the total by the end of 013. The phenomenon, however, is relatively new and expanding on a very rapid pace. Within this perspectice, the content of this article would be based upon the clustering and elaboration of the basic strategic determinants of the Turkish Higher Education System with special focus on Foundation, and Public University groupings. Beginning with emphasis upon the student selection characteristics of the University Entrance Examination System (ÖSYS), we try to capture and interpret a set of multiple modules used for different departments of the universities. However, in this study, we have restricted ourselves to Business Administration and Economics Departments which are present in all universities, hence they can serve as a valid full population case study. In this respect, the domain of this study is composed of the overall population, thus avoiding Validity and Reliability problems, as well as Sample Biases regarding the 0-1 Dummy Regression Model used. The model serves the purpose of discriminating the university groups based upon discrimination analysis approach of the relevant variables. The model is primarily run as a 0-1 dummy regression, having 0 and 1 for Public, and Foundation universities, respectvely, Data for 003 and 009 is being subjected to each individual independent variables, namely, Number of seats available, Number of Seats Left Unoccupied, and the Scores Achieved. Individual descriptive statistics has been derived for each variable. Secondly, all institutions of the Higher Education are then classified according to type of degrees being offered, namely, -year vocational schools, versus 4-year schools of applied sciences and 4-year faculties (together) according to major regions of Turkey. Region-wise analysis of the privately founded versus public institutions of higher education clearly iterate important dimensions of educational privatization in Turkey. The dilemma indicates an early warning signal for the regional implications of Strategic Planning of the Turkish Higher Education System, and renders enormous re-planning as well a growth potential. It seems that the dilemma can only be handled if Regional-Based macroeconomic policies go side by side with the Re-Engineering of the Educational System. These results have further been supplemented by Descriptive Statistics. The initial runs of the model reflects that The Two Population Groups discriminate themselves on the basis of above variables, thus rendering Economies of Scale as well as Economies of Scope problems inherited within the overall system. This sheds light on the sustainability issues regarding any higher educational system which is a MUST pre-requisite for Innovation, Creativity, and Entrepreneurship Development. Important implications of this study has made it possible to develop further platforms of research, which may include the Turkish Republic of North Cyprus, and other Foreign Universities on the list of Turkish Student Selection Board (ÖSYM). A possible extension of the study can focus upon 1 Vocational Schools, rendering strategies for Vocational 74 Education Planning, and many other areas. Most important of all, the study covers a history of higher educational thought for the Turkish Case Sudy, which can serve as a foundation for cross-cultural research. Turkey and BRICS; Turkey and Shangai Cooperation Organization (SCO: Shangai Pact); Turkey and Eurasian Region; and Turkey and EU, etc. are the most relevant areas where this study can be most extended.

175 The Investigation of Factors that Affect the Quality of Financial Reporting: Evidence from Borsa Istanbul E.Abdulgaffar AGAOGLU Yeditepe University, Faculty of Economics and Administrative Sciences, Department of Business Administration, Postal Code 34755, Istanbul, Turkey Ahmet OZCAN* Adana Science and Technology University, Faculty of Business, Department of Management Information Systems, Postal Code 0110, Adana, Turkey ABSTRACT As the world economy is becoming much more globalized than before, the importance of financial information disseminated by business entities increases. Financial reporting process plays a pivotal role in the global business environment, since it primarily exists to create financial information needed by financial market participants. For the business entities, the compliance with International Financial Reporting Standards (IFRS) is the most important priority in the financial reporting process. In the current business climate, financial market participants, creditors, investors, stockholders and government authorities, pay close attention to the quality of financial statements prepared by the business entities. This is because the lack of good quality and timely financial information available to financial market participants can lead irrational and incorrect investment decisions. The past experiences show that the quality offinancial reporting have a massive impact on not only business entities operations but also upon the economic development of country. The investigation of factors that influence the quality of financial reporting has been well documentedfor the developed countries. Yet, there are few research papers regarding the investigation of factors affecting financial reporting quality for emerging countries. This study seeks to investigate the factors that influence financial reporting quality in Turkey. Undoubtedly the factors that affect the quality of financial reporting may vary according to the accounting standards, tax rules, the industry in which business entities operate and the level of economic development. Additionally, the determination of factors that may mitigate the financial reporting quality enables policymakers to design a model that makes significant progress toward the development of the quality of financial reporting quality. The quantitative model of this study would be helpful in detecting firm-specific factors that mitigate the quality of financial reporting. Furthermore, the model also contributes massively to enhancing the quality evaluation of financial reporting process. In this paper, we begin with the examination of theoretical aspects through previous research studies, and then use univariate tests and logit 1model for Borsa Istanbul to examine the 75 relationship that exists between the financial reporting quality and firm-specific factors such as corporate governance characteristics and accounting ratios. Data belonging to is used with the quality of financial reporting as a dichotomous variable andfirm specific factors as independent variables.

176 Keywords: Accounting and Auditing; Financial Economics; Financial Econometrics; Multivariate Modelling;. JEL Codes: B6; C03; C58; M41 REFERENCES: Anderson, R. C., Mansi, S. A. and Reeb, D. M. (004), Board characteristics, accounting report integrity, and the cost of debt, Journal of accounting and economics, Vol. 37 No.3, pp Barth, M. E., Landsman, W. R., and Lang, M. H. (008), International accounting standards and accounting quality, Journal of accounting research, Vol. 46 No.3, pp Beasley, S.M., Carcello, J.V. and Hermanson, D.R. (1999), Fraudulent financial reporting: : an analysis of US public companies, Research Report, COSO. Christensen, H. B., Lee, E., Walker, M., and Zeng, C. (015), Incentives or standards: What determines accounting quality changes around IFRS adoption?, European Accounting Review, Vol. 4 No.1, pp Jensen, M. C. and Meckling, W. H. (1976), Theory of the firm: Managerial behavior, agency costs and ownership structure, Journal of financial economics, Vol.3 No.4, pp

177 MODELLING OF RESIDENTIAL SALES PRICE WITH KRIGING USING DIFFERENT DISTANCE METRICS IN DIFFERENT CORRELATION FUNCTIONS Semra Erpolat TAŞABAT *, Olgun AYDIN Mimar Sinan University, Faculty of Science, Statistics Department, Şişli, Istanbul, TURKEY. 1. KRIGING METAMODELLING Kriging metamodeling technique that can be mathematically expressed as below[1]; 1 ŷ ˆ r ' R ( Y 1 ˆ ) (1) In this equation, ŷ is the predicted response value of unknown x (infill sampling point) and μ is the mean of the stochastic process. Y is the response value of a design point.the correlation matrix R gives the correlation between all of design points (Eq. ). The correlation vector r gives the correlation between infill sampling point and design points (Eq.3)[1]. k R exp x x, 0, p 1, h1 k () i ri exp h xh xh, h 0 h1 ( i) ( j) ph h h h h () (3) Maximum Likelihood Estimation is used for predicting θ parameters. Assuming distribution, likelihood function ( L ) can be written as follows L -1 1 ( y1 )'R ( y1 ) exp n n 1 ( ) ( ) R Y has a normal (4) After obtaining parameters which maximize likelihood function, Kriging model must be validated. For this purpose well known Cross-validation method is used for validation. In this method, a prediction is generated with one data point excluded from the data set. Then check whether that data point falls within a certain confidence interval for the prediction. If the test fails, appropriate transformations such as log or inverse may be applied to the response values[]..distance METRICS A metric or distance function is a function d(x,y) that defines the distance between elements of a set as a non-negative real number. If the distance is zero, both elements are equivalent under that specific metric. Distance functions thus provide a way to measure how close two elements are, where elements do not have to be numbers but can also be vectors, matrices or arbitrary objects. Distance functions are often used as error or cost functions to be minimized in an optimization problem[3] ABSTRACT

178 Modelling and estimating sales prices based on economical conditions is so critical for housing sector. In this study, firstly; investigated economic variables effected mostly to housing sales prices for different cities and then created kriging model for housing sales prices provided from REIDIN. For effective kriging model, need to select most effective correlation functions with optimum correlation function parameters. To determine best correlation function structure and correlation parameter, used different distance metrics for both Exponential and Gaussian correlation functions. Optimum correlation function parameter was obtained based on Maximum Likelihood Estimation (MLE) procedure. To detect normalize of data, used Focused Information Criteria (FIC). Based on Cross Validation criteria selected best distance metric, best correlation function with optimum parameters. This is the first study based on comparing different kriging models for modelling housing sales prices. For comparing best model, cross validation method was used. Calculated standardized residuals according to cross validation method. One of the results comparing euclidian and canberra distance in Gaussian correlation function showed us canberra distance is better than euclidian distance when using Gaussian correlation function for the model economic situation vs. housing sales prices in Dubai. REFERENCES [1] D. R. Jones, M.Schonlau and W. J. Welch(1998), Efficient Global Optimization of Expensive Black-Box Functions, Journal of Global Optimization. [] M. Schonlau,(1997),ComputerExperimentsand Global OptimizatonPhD. Thesis. University of Waterloo,Canada., 00. [3] Jirı Matousek. (00) Lectures on discrete geometry, volume 1 of Graduate Texts in Mathematics. Springer, New York. Key Words: Kriging, Distance Metrics, Maximum Likelihood Estimation, Housing Price, Economical Conditions. 78 1

179 The Inventorial Determinants of Strategic Planning in the Turkish Higher Education System: A Multivariate Case Study of Higher Education in Decision and Statistical Sciences Prof.Dr.E. Abdülgaffar Ağaoğlu Yeditepe University, Department of Business Administration Kayışdağı Campus, İstanbul, Turkey agaoglu@ yeditepe.edu.tr agaoglu_ag@yahoo.com Feride Gülçin Ağaoğlu T.C.Kalkınma Bankası, Retired Istanbul, Turkey agaoglu_ag@yahoo.com This research begins with the conceptual discussion of educational aspects of Mathematical Sciences. While we pick up Decision Sciences and Statistical Sciences through this discussion; we attept to derive the place of this education within the domain of Turkish Higher Educational System. The research continues to pick up macro-policy dimensions of strategic planning through these initial stages of our research. The overall skeleton of this learning exercise is then channelized towards the ingredients of Faculties of Arts and Sciences with programs placing students with the same type of examination scores. Within this perspective and background characteristics, this study would serve as the very first of its nature in the Turkish literature of higher education. The study would also attempt to depict an inventorial perspective of higher education in the areas of Mathematical Sciences. Student selection characteristics of the Turkish University Entrance Examination System (ÖSYS), however, is oriented to department wise (academic program wise) selections utilizing various test modules, which makes it almost impossible for all Mathematical Sciences to be placed with,n the same data matrix. We therefore pick up Statistical Sciences as a prototype, and place them within the cluster of programs taking student inputs with the same type of examination scores. The analysis of the science cluster programs of Faculties of Arts and Sciences, or simply Faculties of Sciences is based upon Physics, Chemistry, Mathematics, Biology, and Statistics. We, on the other hand, bring programs of the Faculties of Administrative Sciences and Economics side by side, and analyze Econometrics which lies within these faculties with different placement criterions, in comparison to the science cluster. We base this initial study upon bench marking Business Administration and Economics Departments of the universities as a non mathematical science cluster to compare and contrast Econometrics programs of these faculties. The advantage of such a selection is that almost all universities tend to have these favorite departments in their portfolios. Thus, it is possible to handle Statistical Sciences without any missing data problem; moreover such a minimum missing data approach would easily avoid any Validity and Reliability problems, which are mostly confronted in quantitative approach such as of this study. Most importantly, 1 this approach is very much in line with the theme of this conference; intending to have 79 a session on Statistics Education. Such a motive will help us to initiate an inventory perspective within the Turkish Higher Education System, which would then be able to provide a strategic planning base for micro and macro analysis. Further strength of this study is that it introduces cross checks the regional attraction clusters for the above domain. These regional based cross checks develop a platform for another forthcoming study.

180 The study indicates the existance of enormous bottlenecks, and such bottlenecks do exist when the competition in the higher education industry is Imperfect due to the presence of two groups with conflicting competitive edges. Any policy orientation what-so-ever, needs to concentrate upon this dilemma, and take corrective actions before any long term macro-based strategy can be designated for long terms, for example, beyond 03. This study is expected to be the major theme of any other research intending to cover Inventorial, as well as Regional perspective of the Turkish Higher Education System. 80 1

181 SESSION 5 İSTATİSTİK TEORİSİ 81 1

182 UYARLANMIŞ OPTİMAL TAHMİN EDİCİNİN PERFORMANSI 1. Giriş Nimet ÖZBAY *, Selahattin KAÇIRANLAR Çukurova Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, O1330, Adana, Türkiye Lineer regresyon modelinde en küçük kareler (OLS) tahmin edici bilinmeyen regresyon parametrelerinin tahmini için kullanılan en iyi lineer yansız tahmin edicidir. Öte yandan, lineer ve yansız olma kriterleri ihmal edildiğinde OLS tahmin ediciye alternatif tahmin yöntemleri geliştirilebilir. Bu tahmin yöntemlerinden biri minimum hata kareler ortalaması (MSE) tahmin yöntemidir (Rao, 1971). Fakat, minimum MSE tahmin edici bilinmeyen parametreler içerdiğinden, tam anlamıyla bir tahmin edici olarak düşünülemez. Bu problemin çözümü için Farebrother (1975), uyarlanmış optimal (AO) tahmin ediciyi önermiştir. AO tahmin edicinin performansını incelemek için pek çok çalışma yapılmıştır fakat bu çalışmalarda uyumun iyiliği kriteri ihmal edilmiştir. Zellner (1994), uyumun iyiliği ve tahminin iyiliği kriterlerini birlikte ele alan dengelenmiş kayıp fonksiyonunu (ZBLF) tanımlamıştır. Daha sonra, Shalabh ve ark. (009), ZBLF yi genişleterek uyumun iyiliği ve tahminin iyiliği kriterleri ile birlikte bu kriterler arasındaki ilişkiyi eş zamanlı olarak içeren genişletilmiş dengeli kayıp fonksiyonunu (EBLF) tanımlamıştır. Bu çalışmada AO tahmin edicinin performansı EBLF altında risk kriterinin kullanılmasıyla teorik olarak incelenmiştir. Bulunan teorik sonuçlar, sayısal örnek ve simülasyon çalışmasıyla desteklenmiştir.. Model ve Tahmin Edici y X u (1) lineer regresyon modeli ele alınsın. Burada y: n1gözlemler vektörü, X : n p tam kolon ranklı açıklayıcı değişkenler matrisi, : p 1 bilinmeyen parametreler vektörü ve u: n 1, Eu 0 ve olan hatalar vektörüdür. (1) modeli için OLS tahmin edici Cov u I n ˆ 1 ( XX ) X y () şeklindedir. Ayrıca, ediciyi aşağıdaki formda tanımlamıştır: ˆ F s ˆ Xy ˆ ˆ X X ˆ 1 s ( y X ˆ ) ( y X ˆ ) n p 8 1 olmak üzere Farebrother (1975), AO tahmin. (3), nın herhangi bir tahmin edicisi olsun. t 1 ve t 0 ile 1 arasında tanımlı sabitler olmak üzere EBLF ( ) t ( X y) ( X y) t ( ) X ' X ( ) 1 (1 t t )( X y) X ( ) (4) 1 formunda tanımlanmıştır (Shalabh ve ark., 009). 3. Uygulama Bu çalışmada elde ettiğimiz teorik sonuçları sayısal örnekle desteklemek için Woods ve ark. (193) tarafından oluşturulan Portland çimento verisi kullanılacaktır. Ayrıca önceki bölümde verilen tahmin edicilerin risk performanslarını EBLF altında karşılaştırmak için Monte Carlo simülasyon çalışması yapılacaktır.

183 4. Sonuçlar Sayısal örnek ve Monte Carlo simülasyon çalışması sonucunda, AO tahmin edicinin OLS den daha iyi sonuçlar verdiği risk değerleri ve grafikler yardımıyla gösterilmiştir. KAYNAKLAR [1] Rao CR. (1971), Unified theory of linear estimation. Sankhya A, 33, [] Farebrother RW. (1975), The minimum mean square error linear estimator and ridge regression. Technometrics, 17, [3] Zellner A. (1994), Statistical Decision Theory and Related Topics V, Springer-Verlag, New York, Chapter 4, Bayesian and non-bayesian estimation using balanced loss functions, [4] Shalabh, Toutenburg H, Heumann C. (009), Stein-rule estimation under an extended balanced loss function. J. Stat. Comput. Simul., 79, [5] Woods H, Steinour HH, Starke HR. (193), Effect of composition of Portland cement on heat evolved during hardening. Ind. Eng. Chem., 4, ABSTRACT THE PERFORMANCE OF THE ADAPTIVE OPTIMAL ESTIMATOR Several adaptive versions of the minimum mean squared error estimator of the coefficient vector in a linear regression model are introduced and discussed by many authors but the goodness of fitted model criterion is quite often ignored which is used to investigate the performance of estimators. Therefore, Shalabh et al. (009) proposed the extended balanced loss function in which the mean squared error, the Zellner s balanced loss function and the predictive loss function are just special cases of it. In this paper, we discuss the performance of the ordinary least squares estimator and the adaptive optimal estimator of Farebrother (1975) under the extended balanced loss function using the risk criterion. Moreover, a numerical example and a Monte Carlo simulation experiment are presented. Keywords Linear regression model; Extended balanced loss function; Ordinary least squares estimator; Adaptive optimal estimator; Large sample properties 83 1

184 İKİ YÖNLÜ KUVVET DAĞILIMININ KONVOLÜSYONUNUN TAM DAĞILIMI Selim GÜNDÜZ- Ali İhsan GENÇ Çukurova Üniversitesi Fen Edebiyat Fakültesi İstatistik Bölümü Adana-Türkiye 1. İki Yönlü Kuvvet Dağılımı Bu kısımda, özellikle risk ve belirsizlik problemlerinde yararlanılan beta dağılımına alternatif olarak kullanılması için [a, b] aralığında tanımlı iki yönlü kuvvet (TSP) dağılımı tanıtılacaktır. TSP dağılımının olasılık yoğunluk fonksiyonu (1) numaralı eşitlikle tanımlanmıştır (Van dorp ve Kotz, 00a, 00b). n ( x a b a m a )n 1, h(x) = { n ( b x b a b m )n 1, a x m m x b (1) TSP dağılımında bulunan parametrelerden a ve b parametreleri tanım uzayının sınır noktaları olarak, n şekil parametresi ve m ise eşik parametresi olarak tanımlanabilir. TSP dağılımına sahip X rastgele değişkeninin olasılık yoğunluk fonksiyonu, parametrelerinin aldığı değerlere göre farklı şekiller almaktadır ve bazı değerlere göre aldığı durumlar Şekil 1 de verilmiştir. Şekil 1. Farklı m ve n değerleri için TSP dağılımının grafikleri. Rastgele Değişkenlerin Konvolüsyonlarının Dağılımı Uygulamalı ve teorik bilimlerin pek çok alanında karşılaşılan problemlerin içinde, rasgele değişkenlerin çeşitli cebirsel kombinasyonlarının dağılımları azımsanmayacak ölçüde yer tutmaktadır. X ve Y rastgele değişken olmak üzere bu kombinasyonlarda da genellikle X + Y, XY, X Y ve X (X + Y) fonksiyonlarının dağılımları öne çıkmaktadır. Örneğin TSP dağılımlı bağımsız iki rastgele değişkenin çarpımının dağılımı (Gündüz ve Genç, 015). Bu 1 çalışmada da X~TSP(a, m, b, n) ve Y~TSP(c, k, 84 d, l) bağımsız iki rastgele değişken olmak üzere, Z = X + Y nin tam dağılımı bulunuşu anlatılacaktır. Z nin dağılımı Van Dorp ve Kotz (003) tarafından [0,1] aralığında tanımlı genel bir aile için ele alınmıştır. Tam dağılımının bulunmasında karşılaşılan yoğunluk fonksiyonlarının parçalı tanımlı olmalarından ötürü

185 bu integralin hesaplanmasında dört farklı durum ve her bir duruma ait üç farklı alt durum ortaya çıkmaktadır. Tüm durum ve alt durumlar Tablo 1 deki gibi verilebilir. Tablo 1. İki rastgele değişkenin toplamının olasılık yoğunluk fonksiyonunu belirlemedeki durumlar ve alt durumlar Durumlar Alt Durumlar a x m, c y k a + k < m + c, a + k = m + c, a + k > m + c a x m, k y d a + d < m + k, a + d = m + k, a + d > m + k m x b, c y k m + k < b + c, m + k = b + c, m + k > b + c m x b, k y d m + d < b + k, m + d = b + k, m + d > b + k Tam dağılımı elde edildikten sonra bu dağılımın şekil analizi, momentleri ve yüzdelik değerleri verilecektir. Son olarak suni bir veri kümesi üzerinde modelleme yapılacaktır. KAYNAKLAR [1] Gunduz S., Genç A.I. 015b. Distribution of the Product of a Pair of Independent Two-Sided Power Variates, Communications in Statistics -Theory and Method, DOI: / [] Van Dorp, J. R., Kotz, S. 00a. The standard two-sided power distribution and its properties: with applications in financial engineering. The American Statistician, 56. [3] Van Dorp, J. R., Kotz, S. 00b. A novel extension of the triangular distribution and its parameter estimation. The Statistician, [4] Van Dorp, J.R., Kotz, S Generalizations of Two-Sided Power Distributions and Their Convolution, Communications in Statistics Theory and Methods, 3:9, ABSTRACT EXACT DISTRIBUTION OF THE CONVOLUTION OF THE TWO SIDED POWER (TSP) DISTRIBUTION Some of the major challenges in statistics related disciplines belong to determining the distributions of numerous algebraic combinations of random variables and many of these problems are related to convolution forms of these variables. In this paper, we study the convolution of two independent TSP distributed random variables to obtain closed form expressions for its exact distribution. Although one can use a simulation method to compute probabilities involving the convolution approximately, the main aim of this paper is to find a closed form expression for the pdf of the sum so that one can compute the probabilities precisely. Key Words: Distributions with bounded range, Function of random variables, Two-sided power distribution 85 1

186 SARMAL RİCHARD DAĞILIMI Arzu EKİNCİ DEMİRELLİ Fırat Üniversitesi Fen Fakültesi İstatistik Bölümü 1. Richard Dağılım Fonksiyonu Richard link fonksiyonu 0 Y(x) 1 aralığında aşağıdaki formda tanımlanır, Y(x) = {1 + (m 1)exp ( kx)} 1 (1 m) (1) Richard yoğunluk ve dağılım fonksiyonları ise sırasıyla aşağıdaki şekildedir, f(x) = k{1 m 1 (1 m) } 1 m (1 m) {1 + (m 1)exp( kx)} exp( kx) () F(x) = (1 m 1 (1 m) ) 1 {(1 + (m 1)exp( kx)) 1 (1 m) m 1 (1 m) } (3) Richard link fonksiyonu istatistiksel veri analizinde yoğun olarak iki grup lojistik ayrımsamada kullanılmaktadır. Standart lojistik dönüşümden daha esnek bir yapıya sahip olması Richard eğrisinin lojistik dönüşüme göre bir avantajıdır. Ancak buna karşılık parametrelerinin en çok olabilirlik tahmin edicilerinin elde edilememesi ise fonksiyonun bir dezavantajıdır. Bu çalışmadaki amacımız: literatürde son yıllarda oldukça ilgi gören dairesel dağılımlar ailesine Richard dağılımını katabilmektir. Dairesel dağılımlar literatürde iki türlü karşımıza çıkmaktadır. Bunlardan ilki Von Misses dağılımıdır. Bu dağılım Bessel fonksiyonunun özelliğinden yararlanılarak elde edilmiştir. Dağılımın yoğunluk fonksiyonu aşağıdaki şekildedir, Wf(x) = exp (Kcos(x μ)) πi 0 (K) (4) Burada I 0 (K) sıfırıncı dereceli modifiye edilmiş Bessel fonksiyonudur. Bu dağılımda trigonometrik fonksiyonlar dağılım içerisinde kendiliğinden yer almaktadır. İkinci tür dairesel dağılımlar ise dağılım fonksiyonunun sonradan sarmal şekle getirilmesiyle oluşturulabilmektedir. Bu tip dağılımların başında da sarmal normal ve sarmal Cauchy dağılımları gelmektedir. Bunlara ilaveten sarmal Richard dağılımı aşağıdaki formda oluşturulmaktadır. Pozitif yarı eksende tanımlı olan Richard dağılımı için aynı uygulamayı yapmaya çalışalım. X > 0 ve [0,π] periyod uzunluğuna sahip olan bir tesadüfi değişken olsun. Richard yoğunluk fonksiyonu f(x) olmak üzere sarmal yoğunluk fonksiyonu aşağıdaki şekilde yazılacaktır, ke k(θ+nπ) k=0 (5) Wf(θ) = (1 + (m 1)e k(θ+nπ) m (1 m) ) 1 m 1 (1 m) Sarmal Richard yoğunluk fonksiyonunun [0,π] aralığındaki integrali, π Wf(θ) dθ = 0 n=0 {(1 + (m 1)e (n+1)kπ ) 1 (1 m) (1 + (m 1)e nkπ ) 1 (1 m) } 1 m 1 (1 m) 1 = 1 m 1 (1 m) lim [(1 + (m 1)e (n+1)kπ ) 1 (1 m) m 1 (1 m) ] = 1 n olacak şekilde elde edilebilir. Sarmal Richard dağılımı ile alt aralıklarda tanımlanan Richard dağılımları yapısal olarak benzerlik göstermektedirler. Her bir alt aralık aynı periyot uzunluğuna sahip olarak alındığında ve dağılımlar, aralıklar birbirini takip edecek şekilde devam ettirildiğinde pozitif yarı eksende tanımlı sarmal Richard dağılımı benzer şekilde elde edilmiş olacaktır. Ancak bu işlemde katsayılar uygun şekilde değiştirilmelidir. Kaynaklar [1] Abramowitz, M. and Stegun, I.A. (Eds.) (1964) Handbook of Mathematical Functions, Applied Mathematics Series, Vol. 55. National Bureau of Standards, US Department of Commerce,Washington, DC. [] A. Gregorczyk (1998) Richards Plant Growth Model J. Agronomy and Crop Science, 181, [3] Scott Menard (00) Applied Logistic Analysis, Sage Publications Inc. California, 106 p. [3] Gatto, R., Jammalamadaka, S. (007) The generalized von Mises distribution. Stat Methodol 4, WRAPPED RICHARD DISTRIBUTION We investigate new wrapped distribution obtained from Richard link function. In the literatüre many 1 probability distributions via normal, Caush, etc. used wrapped form. In this point important thing wrapped 86 distribution must be flexible. Due to this feature from Richard link function is useful. Whereas the Richard link function does not have a distribution form and analitical solution of parameter estimation. In this study we examined properties of wrapped Richard distribution. Key words: Richard curve, Link Function, wrapped distribution.

187 ÇOKLU UNUTMA FAKTÖRÜ İLE UYARLI KALMAN FİLTRESİ Cenker BİÇER* Kırıkkale Üniversitesi Fen Edebiyat Fakültesi İstatistik Bölümü Kırıkkale/Türkiye Levent ÖZBEK Ankara Üniversitesi Fen Fakültesi İstatistik Bölümü Ankara/Türkiye Kalman filtresi dinamik sistemlerin durum tahmini probleminin çözümünde kullanılan en popüler ve çok farklı alandan uygulamalara sahip bir yöntemdir. Dinamik sistemin karkteristiklerinin tam olarak bilinmesi ve hataların Normal dağılımlı olması varsayımı altında Kalman filtresi en iyi tahmin performansına sahiptir. Ancak uygulamalarda sistem parametrelerinin tam olarak bilinememesi veya kısmen bilinmesi gibi durumlar altında Kalman filtresinin tahmin performansında ciddi düşüşler ile karşılşılmakta veya filtre tahminleri güncel değerlerden tamamen ıraksaya bilmektedir. Literatürde Kalman filtresi tahminlerindeki ıraksama problemin önüne geçebilmek için farklı yöntemlerin önerildiği çok sayıda çalışma vardır. Sistem karakteristiklerindeki bilgi eksikliğinden veya farklı sebeplerden kaynaklanabilecek, filtre tahminlerindeki bu ıraksama probleminin önüne geçebilmek ve tahmin performansını artırabilmek için yapılan bu araştırmaların büyük bir kısmında, araştırmacılar tarafından filtre eşitliklerine skaler bir unutma faktörünün eklenmesi önerilmiştir. Ancak önerilen farklı adaptif yöntemler arasında; Unutma faktörünün Kalman filtresi eşitliklerinde nasıl yer alacağı ve optimal unutma faktörünün hesaplamasının nasıl yapılacağı, olmak üzere iki temel farklılık vardır. Bu problem henüz tam olarak çözüme kavuşmamış ve halen açık olan bir problemdir. Kalman Filtresinin skaler bir unutma faktörüyle uyarlanması tek değişkenli sistemler için bir başarım artışı sağlasa da, çok değişkenli sistemlerde modelleme hatası her değişken için farklı oranlarda olabileceğinden dolayı, skaler unutma faktörü yerine çoklu unutma faktörü kullanılmalıdır. Bu çalışmada, çok değişkenli sistemlerde de kullanılabilecek çoklu unutma faktörlerinin kullanıldığı adaptif bir yöntem önerilmiştir. Ayrıca önerilen yöntemin Kalman filtresi tahminlerinde sağladığı performans artışı, bir kompartman modeli üzerinde yapılan simülasyon çalışması ile örneklendirilmiştir. KAYNAKLAR [1] Bicer C, Babacan E. K, Özbek L. (01) Stability of the adaptive fading extended Kalman filter with the matrix forgetting factor, Turkish Journal of Electrical Engineering & Computer Sciences, Vol: 0, No: 5, [] Geng Y, Wang J, (008) Adaptive estimation of multiple fading factors in Kalman filter for navigation applications, GPS Solution, Vol: 1, [3] Grewal S, Andrews A. P (008) Kalman Filtering Theory and Practice Using Matlab, John Wiley & Sons Inc. USA. [4] Xia Q, Rao M, Ying Y, Shen X (1994) Adaptive Fading Kalman Filter with an Application, Automatica, Vol. 30, No 8, pp [5] Özbek L, Aliev F. A (1998) Comments on Adaptive Fading Kalman Filter with an Applications, Automatica, 34(1): ABSTRACT ADAPTIVE MULTIPLE FADING KALMAN FILTER Kalman filter (KF) is most popular estimation technique for solving state estimation problems of dynamical systems. As long as the system characteristics are correctly known and under the Gaussian assumption, KF will run the best estimation performance. However, performance of the KF will decrease when the system characteristics are either unknown or partially known. A many works has been published in order to overcome the performance decreasing problem in the KF, hitherto. This paper is motivated adaptation to KF with the multiple fading factors and a method suggested for this 1 aim. Also, a simulation study is conducted to verify for work results. 87 Key Words: State estimation, Kalman Filter, Fading Factors, Adaptive Fading Kalman Filter, Dynamical systems

188 SESSION 5 UYGULAMALI İSTATİSTİK 88 1

189 SAĞLIK SEKTÖRÜNDE BÖLGELER ARASINDA ETKİNLİĞİN İNCELENMESİ Mehmet ÖKSÜZKAYA* Kırıkkale Üniversitesi İktisadi ve İdari Bilimler Fakültesi Ekonometri Bölümü Bu çalışmanın kapsamı doğrultusunda Sağlık Bakanlığı'nın her yıl düzenli olarak yayınladığı İstatistiki Bölge Birimleri Sınıflandırması (İBBS-1) kullanılarak Türkiye; Akdeniz, Batı Anadolu, Batı Karadeniz, Batı Marmara, Doğu Karadeniz, Doğu Marmara, Ege, Güneydoğu Anadolu, İstanbul, Kuzeydoğu Anadolu, Ortadoğu Anadolu ve Orta Anadolu olmak üzere 1 farklı bölgeye ayrılmıştır. Araştırmanın temel amacı, bölgelere göre Sağlık Bakanlığı na bağlı hastanelerin etkinlik ve verimliliğinin değerlendirilmesidir. Etkinliğin ölçümü için parametrik olmayan Veri Zarflama Analizi tekniği kullanılması düşünülmektedir. Veri Zarflama Analizi çerçevesinde, ölçeğe göre Sabit Getiri (CCR) ve ölçeğe göre değişken getiri (BCC) modelleri kullanılarak bölgeler bazında farklılıklar değerlendirilecektir. Etkinlik ölçümünde kullanacağımız girdiler; uzman hekim, pratisyen hekim, ebe ve hemşire sayıları ile yatak sayıları iken, ameliyat sayısı, kişi başı hastanelere müracaat sayısı ve yatan hasta sayısı ise çıktı olarak kullanılması planlanmaktadır. Elde edilen sonuçlara göre hangi bölgelerin etkin hangi bölgelerin etkin olmadığı tespit edilerek, etkin olmayan bölgeler için potansiyel iyileştirme önerileri geliştirilecektir. İsteklerin sınırsız kaynakların sınırlı olduğu bir dünyada etkinlik ve verimlilik ilgili kavramların önemi hiçbir zaman azalmamıştır. Her türlü mal ve hizmet üretiminin bir emek sonucu ortaya çıktığı düşünülecek olursa, kaynakların sınırsız olduğu hayali bir dünyada bile etkinlik ve verimlilik kavramlarının insan hayatındaki önemi yadsınamaz. Günümüzde bütün ülkeler kalkınma planları içerisinde hayati önem sahip kıt kaynakların kullanımını etkin kullanılacak biçimde planlamaktadır. Bu yüzden yapılan her türlü harcama ekonomik olarak analiz edilerek, yapılan harcamaların amaca uygun olup olmadığı incelenmektedir. Bu durumun en çarpıcı örneği; dünya genelinde yapılan sağlık harcamalarının hem gelişmiş hem de gelişmekte olan ülkeler için göstermiş olduğu artış trendidir. Her bir ülkenin iktisadi faaliyetlerini en verimli şekilde sürdürebilmesi için öncelikle en kıymetli sermayesi olan insanın sağlık şartlarının iyileştirilmesine bağlıdır. Gelişmekte olan tüm ülkelerin kalkınabilmelerindeki temel unsur olan insanın yaşamış olduğu ülkedeki sağlık hizmetlerinden faydalanabildiği ölçüde kendi ülkesine katkıda bulunabileceği ihmal edilemez bir gerçektir. Gelişmiş ülke olabilmenin ön şartlarından biri de sağlıklı vatandaşlar temeli üzerine kurulmuş olmasıdır. Bunun en önemli sebeplerinden biri ise sağlık göstergelerinin ülkelerin kalkınmışlık düzeylerini ortaya koyan en önemli verilerden biri varsayılmasından kaynaklanmaktadır. Ülkemizde sağlık politikalarının oluşturulması ve halkın ihtiyaçları doğrultusunda sağlık hizmetlerini sunma görevi resmi olarak Sağlık Bakanlığı nın görevidir. Bu sebeple, Sağlık Bakanlığı na bağlı olan hastaneler toplumun beklentilerine en uygun şekilde hizmet vermeye çalışmaktadırlar. Doğal olarak birçok sektörde olduğu gibi sağlık sektöründe de verilen hizmetin kalitesini etkileyen farklı unsurlar bulunmaktadır. KAYNAKLAR [1]Bora Başara, B., Güler, C., ve Yentür, G. K. Sağlık Araştırmaları Genel Müdürlüğü Sağlık Bakanlığı ANKARA (014) []Yeşiyurt, C. Ve Alan, M. A. Fen Liselerinin 00 Yılı Göreceli Etkinliğinin Veri Zarflama Analizi (VZA) Yöntemi ile Ölçülmesi. Cumhuriyet Üniversitesi İktisadi İdari Bilimler Dergisi, Cilt 4, Sayı, (003) [3]Güleş, H. K., Öğüt, A., ve Özata, M. Sağlık İşletmelerinde Örgütsel Etkinliğin Artırılmasına Yönelik Veri Zarflama Analizine Dayalı Bir Uygulama, Türkiye Sosyal Araştırmalar Dergisi Sayı 1, (Nisan 007) [4]Temür, Y., ve Bakırcı, F., Türkiye de Sağlık Kurumlarının Performans Analizi: Bir VZA Uygulaması, Sosyal Bilimler Dergisi cilt 10, Sayı 3 (008) 1 89

190 EXAMINING THE EFFECTIVENESS BETWEEN REGIONS IN THE HEALTH SECTOR Each year the Ministry of Health in accordance with the scope of this work to benefit from regular health statistics published by Turkey is divided into 1 different regions. The main purpose of the study, according to the region of the Ministry of Health to evaluate the effectiveness and efficiency of the hospital. Nonparametric data envelopment analysis for measuring the effectiveness of the technique is intended to be used. Within the framework of the DEA, according to scale Fixed Income (CCR) and variable returns to scale (BCC) of using models will be evaluated on the basis of differences. The inputs we use in the activity measurement; specialist physicians, general practitioners, midwives and nurses, while the number of beds and number, number of operations, the number of people applying to the number of patients per hospital inpatient and are intended to be used as output. According to the obtained results of which were identified as being effective in the active region which will develop recommendations for potential improvements inactive regions. Key Words: Health sector, Efficiency, DEA 90 1

191 CryptRndTest: Kriptografik Rasgeleliğin Testi için Bir R Paketi Haydar DEMİRHAN a Nihan BİTİRİM b a Hacettepe Üniversitesi İstatistik Bölümü Beytepe Ankara haydarde@hacettepe.edu.tr b Yüksek Öğretim Kurulu Bilkent Ankara nihkas@hotmail.com 1. CryptRndTest R-Paketi Rasgelelik kriptografi alanının temelini oluşturmaktadır. Şifreleme işlemlerinin temelinde şifreleme için kullanılan sayıları üreten rasgele sayı üreteçleri yer almaktadır. Üretecin tahmin edilmezliği, yapılan şifrelemenin kalitesini doğrudan belirler. Kriptografi için kullanılan rasgele sayılar genel anlamda kullanılan rasgele sayılara göre çok daha zor tahmin edilebilmelidir. Tüm yapay rasgele sayı üreteçleri bir başlangıç dizisine dayandığından ve belli bir algoritmaya bağlı olarak çalıştığından kriptografide kullanılan yapay rasgele sayı üreteçleri genel anlamda kullanılan üreteçlere göre daha zor ve karmaşık koşulları sağlamalıdır. Bu üreteçlerin ürettiği sayılar tahmin edilmezlik özelliğini sağlayabilmek için genel olarak tek biçimli dağılmalı ve otokorelasyonsuz olmalıdır. Kriptografik rasgele sayı üreteçleri temelde tamsayı ve bit olmak üzere iki şekilde üretim yapar. Özellikle bit üreten üreteçlerin testinde genel anlamda kullanılan parametrik olmayan rasgelelik testleri başarılı olmamaktadır. Ayrıca bazı durumlarda üreteçlerin belli özellikleri test edilmek istenebilmektedir. Bu bağlamda özellikle kriptografik rasgele sayı üreteçlerinin rasgeleliğinin test edilmesi için rasgelelik testleri geliştirilmiştir. Bu testler iki aşamada uygulanır. Birinci aşamada test için gelen rasgele sayılar belli bir manipülasyona tabi tutulur. Bu manipülasyon ile elde edilen sayıların dağılımı bilinmektedir. İkinci aşamada test edilen rasgele sayı dizisinin manipülasyon ile elde edilen ampirik dağılımı, bilinen kitle dağılımı ile uyum iyiliği testleri kullanılarak karşılaştırılır. Kriptografi literatüründe genel olarak ki-kare uyum iyiliği testi, nadir olarak da Kolmogorov- Smirnov testi kullanılmaktadır. Geliştirilen kriptografik rasgelelik testleri belli durumlarda güç ve birinci tip hatanın kontrolü anlamında birbirlerine üstünlük sağlamaktadır. Bu özellik nedeniyle çok sayıda kriptografik rasgelelik testi bir araya getirilerek test kümeleri oluşturulmuştur. Bu test kümeleri bir üreteçten gelen test verisine aynı anda uygulanmakta ve testlerin belli bir kısmından ya da tamamından geçen üreteç, kriptografide kullanılabilir görülmektedir. Ancak bu uygulamada çoklu test problemi ile karşılaşılmakta olduğu kriptografi literatüründe yer almamıştır (Demirhan ve Bitirim, 015). Literatürde önerilen bazı testler ise henüz bir test kümesinde yer almamıştır. Bu çalışmada, yazarlar tarafından hazırlanmış olan R paketi CryptRndTest in sürümü tanıtılacaktır. CryptRndTest paketi daha önce bir test kümesinde yer almamış ve bir yazılım tarafından uygulanmayan güncel kriptografik rasgelelik testlerinin R ortamında uygulanabilmesi için kullanıcı dostu bir ortam sunmaktadır. CryptRndTest paketi Adaptive Chi-Square, Birthday Spacings, Book Stack, GCD, Random Walk ve Topological Binary testlerini uygulamaktadır. Bu testlerin ikinci aşamasında Ki-kare, Anderson-Darling, Kolmogorov-Smirnov ve Jarque-Bera testlerinin sonuçları listelenmektedir. Ek olarak, ikinci tip Stirling sayılarını, iki sayının en büyük ortak bölenini ve Toplogical Binary test için kritik değer hesaplayan yardımcı fonksiyonlar CryptRndTest te yer almaktadır. CryptRndTest paketinde yer alan tüm fonksiyonlar 18 bit gibi yüksek bit uzunluklarında Rmpfr R-paketi ile Multiple Precision Floating Point sayıları kullanarak yüksek duyarlıkla çalışabilmektedir. Çalışma kapsamında R yazılımında yer alan yapay rasgele sayı üreteçleri çeşitli bit uzunluklarında CryptRndTest kullanılarak teste tabi tutulmuş ve sonuçlar tartışılmıştır. TEŞEKKÜR Bu çalışma, TÜBİTAK-ARDEB 3001 programı kapsamında yürütülen 114F49 numaralı proje kapsamında gerçekleştirilmiştir. KAYNAKLAR 91 1

192 [1] Alcover P.M., Guillamon A., and Ruiz M.C. (013), A new randomness test for bit sequences. Informatica, 4(3), [] Demirhan H., Bitirim N. (015), Hypothesis testing and multiplicity in the evaluation of cryptographic randomness, The 15th Central European Conference on Cryptology, July 08-10, 015, Klagenfurt, Austria. [3] Doganaksoy A., Calik C., Sulak F. and Turan M.S. (006), New randomness tests using random walk, In: National Cryptology Symposium II, Ankara, Turkey. [4] Marsaglia G. and Tsang W.W. (00), Some Difficult-to-pass tests of randomness. Journal of Statistical Software, 7(3). [5] Ryabko B.Ya., Stognienko V.S. and Shokin Yu.I. (004), A new test for randomness and its application to some cryptographic problems. Journal of Statistical Planning and Inference, 13, [6] Ryabko B.Ya. and Monarev V.A. (005), Using information theory approach to randomness testing. Journal of Statistical Planning and Inference, 133, ABSTRACT CRYPTRNDTEST: AN R PACKAGE FOR CYPTOGRAPHIC RANDOMNESS TESTING In this work, an R package for testing cryptographic randomness, namely CryptRndTest, is demonstrated. The package includes functions to implement actual cryptographic randomness tests. After the demonstration of the package, random number generators included by the R software are tested by using CryptRndTest and results are discussed. Key Words: Randomness, nonparametric test, R-package. 9 1

193 ANALİTİK AĞ SÜRECİ YÖNTEMİ İLE GENÇLERDE MADDE BAĞIMLILIĞI VE ERKEN UYARI SİSTEMİNE İLİŞKİN BİR UYGULAMA Murat ATAN * 1 Hasan TÜRE Deniz KOÇAK 3 1,, 3 Gazi Üniversitesi, İktisadi ve İdari Bilimler Fakültesi, Ekonometri Bölümü, 06500, Ankara, Türkiye *1 Sorumlu Yazar atan@gazi.edu.tr, hasanture@gmail.com, 3 denizkocak36@gmail.com Çok kriterli karar verme yöntemleri, birden fazla kriterin optimize edilerek karar vericinin en iyi alternatifi seçmesine imkân veren metodolojik bir araçtır. Analitik Ağ Süreci (Analytic Network Process - ANP) de oldukça fazla kullanılan çok kriterli karar verme yöntemlerinden biridir. ANP, kriterler ve alternatifler arasındaki bağımlılık ilişkilerine izin veren, bu ilişkileri bir ağ şeklinde ifade eden ve geri bildirim sonuçlarını içeren bir yaklaşımdır. ANP, yaygın olarak kullanılan Analitik Hiyerarşi Süreci (Analytic Hierarchy Process AHP) yönteminin daha genel bir formudur. Ancak AHP de karar verme sürecinin yapısı tek yönlü hiyerarşik ilişki şeklinde oluşturulurken, ANP de bu süreç, üst seviyedeki elemanların ve alt seviyedeki elemanların birbirlerinden bağımsız oldukları varsayımı yapılmadan, elemanlar arasında karmaşık bağımlılık ilişkilerini barındırabilen bir ağ yapısı şeklinde oluşturulur. Çalışmada, çok kriterli karar verme yöntemlerinden olan ANP de kullanılmak üzere, tüm dünyada ciddi bir halk sağlığı sorunu olan ve günümüzde özellikle gençler arasında yaygınlaşan madde kullanımı sorunu ele alınmıştır. Bağımlılık yapıcı madde kullanımı, özellikle gelişmekte olan ülkelerde çeşitli önlemlerin alınmasına rağmen gittikçe artmaktadır. Ülkemizde ise gençler arasında madde kullanımının son yıllarda artış gösterdiği gözlenmektedir. Ancak madde kullanım yaygınlığına, sebep olan faktörlere, risk alanlarının tespitine ve bu konudaki erken uyarı sistemine yönelik yapılan çalışmalar sayı bakımından yetersizdir. Bu kapsamda madde bağımlılığı ve erken uyarı sistemi çalışmasında, Ankara nın Keçiören ilçesinde öğrenimini görmekte olan 500 ilköğretim, ortaöğretim ve lise öğrencisine uygulanan; amacı öğrencilerin aile kurumundaki karşılıklı iletişimleri ile arkadaş çevrelerinin kendi üzerlerinde etkilerini tespit etmek olan Keçiören İlçesi Gençlerde Bağımlılık Araştırması projesinin veri seti, çok kriterli karar verme yöntemlerinden olan ANP de modellenmiştir. Karar modelinin ağ yapısı ile kullanılan kriterler, alanında uzman kişilerin görüşleri alınarak belirlenmiştir. Yöntemdeki hesaplamalar Super Decision paket programı kullanılarak yapılmıştır. Sonuç olarak da madde bağımlılığı konusunda risk taşıyan, destek verilmesi gereken çocukların yoğunluklu olarak bulundukları okullar tespit edilmeye çalışılmıştır ve bu konuda çok kriterli karar verme yöntemleri kullanılarak benzer çalışmaların yapılmasına imkân veren erken uyarı stratejilerinin geliştirilmesine dikkat çekilmiştir. Anahtar kelimeler: madde bağımlılığı, çok kriterli karar verme yöntemleri, analitik ağ süreci KAYNAKLAR [1] Saaty, T.L. (1996), Decision Making with Dependence and Feedback: The Analytic Network Process, RWS Publications, Pittsburgh, PA. [] Meade L. and Sarkis J. (1998), Strategic Analysis of Logistics and Supply Chain Management Systems Using The Analytical Network Process, Elsevier Science, Vol.34, no.3, pp [3] Saaty, T.L. and Vargas L. G. (013), Decision Making with the Analytic Network Process, Economic, Political, Social and Technological Applications with Benefits, Opportunities, Costs and Risks, Springer New York Heidelberg Dordrecht London [4] Jharkharia S. and Shankar R. (007), Selection of Lojistics Service Provider: An Analytic Network Process (ANP) Approach, Omega, The International Journal of Management Science, 35, [5] Keçiören Belediye Başkanlığı Basın Yayın Halkla İlişkiler Müdürlüğü, (015), Keçiören Gençlerde 1 Bağımlılık Araştırma Raporu,

194 DOĞRUSAL OLMAYAN PROGRAMLAMA VE İSTENEBİLİRLİK FONKSİYONU YAKLAŞIMI KULLANILARAK ÇOK YANITLI ÇERÇEVEDE EKMEK ÜRETİM SÜRECİNİN OPTİMİZASYONU Ali İhsan BOYACI Kocaeli Üniversitesi, Mühendislik Fakültesi, Endüstri Mühendisliği, 41000, Kocaeli, Türkiye Cevap Yüzeyi Yöntemi (CYY), bir kaç girdi değişkeninin (faktörün) bir ürün veya sürecin cevabını etkilediği durumlarda ve amaç, bu cevabın optimizasyonu olduğunda, kullanılan matematiksel ve istatistiksel tekniklerin bütünüdür. CYY nde kullanılan teknikler, cevabın ölçülmesini sağlayacak etkin deneylerin tasarlanması, tasarlanan deneye göre toplanan verilere en iyi uyumu sağlayacak modelin kurulması ve optimum cevap değerini veren faktör seviyelerinin belirlenmesini kapsamaktadır. Özellikle son zamanlarda tek bir cevap değişkeni yerine kalite ve maliyet temelli birçok kriterin eş zamanlı olarak optimize edilmesine ihtiyaç duyulmaktadır. Bu nedenle Çok Yanıtlı Cevap Yüzeyi Problemleri (ÇYCYP) ortaya çıkmakta ve bu problemlere çözüm üretecek yöntemler üzerinde çalışılmaktadır. Derringer ve Suich (1980) tarafından tanıtılan istenebilirlik fonksiyonu yaklaşımı ÇYCYP ni ele almada kullanılan en etkin yöntemlerden bir tanesidir. Bu yaklaşım ile temel olarak yapılan şey, çok yanıtlı bir cevap yüzeyi probleminin, tekil ve bileşik istenebilirlik fonksiyonları kullanılarak tek cevaplı bir problem durumuna getirilmesidir. Bu yöntem cevap değişkenlerinin ağırlıklandırılmasına da izin verdiği için sıklıkla tercih edilen bir yöntemdir. Uygulama çalışmasında, oldukça önemli bir besin kaynağı olan ekmeğin, çeşitli kalite karakteristikleri yanıt değişkeni olarak belirlenmek suretiyle, üretim sürecinin optimizasyonu hedeflenmiştir. Çalışma için Şekil 1 de verilen metodoloji kullanılmıştır. Sürece ilişkin faktörlerin ve cevap değişkenlerinin belirlenmesi Probleme uygun bir deney deseninin seçilmesi ve deneylerin gerçekleştirilmesi Her bir cevap değişkeni için anlamlı bir cevap yüzeyi denkleminin elde edilmesi Her bir cevap değişkeni için tekil istenebilirlik fonksiyonlarını tanımlamak Bileşik istenebilirlik değerini maksimize edecek matematiksel modelin kurulması Kurulan modelin çözülerek optimum parametrelerin elde edilmesi Şekil 1. Çok yanıtlı çerçevede süreç optimizasyonu için kullanılan metodoloji Marmara bölgesinde faaliyet gösteren EKSUN gıda işletmesinin laboratuvarında gerçekleştirilen, ekmeğin kalitesini arttırmaya yönelik bu uygulama çalışması, kullanılan unun gluten oranı (4%, 3%), alfa amilaz enzim ilavesi (0 ppm, 40 ppm), kullanılan su miktarı (60%, 65%), yoğurma süresi (7 dakika, 11 dakika), fermantasyon sıcaklığı (8 0 C, 38 0 C) ve fermantasyon süresi (45 dakika, 75 dakika) 1 olmak üzere altı adet bağımsız değişken (faktör) içermektedir. Ekmek kalitesini belirlemek için 94 seçilen cevap değişkenleri ise, ekmeğin özgül hacmi, kabuk rengi ve yapısı, şekil düzgünlüğü ve iç gözenek yapısı olmak üzere dört tanedir. Çalışma kapsamında hacim ölçümü, Amerikan Tahıl Kimyagerleri Derneği nin onaylı metotlarından tohumla ölçme metodu (seed displacement metot) baz alınarak yapılmıştır. Ekmeklerin kabuk rengi ve yapısı, uzmanlar tarafından incelenmiş ve 1-10 arası bir skala kullanılarak değerlendirilmiştir. Şekil düzgünlüğüne ise

195 ekmeklerin yükseklikleri enlerine oranlanarak karar verilmiştir. Gözenek yapısı cevap değişkeninin değerlendirilebilmesi için görüntü işleme tekniğinden yararlanılmıştır. Bunun için tam ortasından kesilen ekmekler gözenek yapılarının bilgisayar ortamına aktarılabilmesi için yüksek çözünürlükte taranmıştır. Daha sonra bu ekmek resimleri görüntü işleme programı ImageJ 1.48v yazılımında incelenerek ekmeklerin gözeneklerinin dağılımı değerlendirilmiştir. Çalışmada doğrusal ve etkileşim etkilerinin yanında kareli etkileri de inceleyebilmek için ikinci derece bir model kullanılmıştır. Oldukça ekonomik olan ve ikinci derece modeller için yaygın şekilde kullanılan Box- Behnken deney tasarımı tercih edilmiş ve veriler bu deney desenine göre toplanmıştır. Rassallığın etkisini ortadan kaldırmak ve daha sağlıklı sonuçlar elde etmek amacıyla deneyler rassal bir sıra ile gerçekleştirilmiş ve her bir deneme kombinasyonu için üç adet tekrar yapılmıştır. Deney verileri elde edildikten sonra her bir cevap değişkeni ile faktörler arasındaki ilişkiyi ifade eden ikinci derece denklemler regresyon analizi ile elde edilmiştir. Kurulan modeller ve tahmin edilen katsayılar için istatistiksel anlamlılık testleri yapılarak (α = 0,05) kurulan modellerin anlamlılığı sınanmıştır. İstatistiksel olarak anlamsız terimler modelden çıkarılarak hesaplamalar tekrar yapılmıştır. Bu analizler için Minitab paket programının versiyonundan yararlanılmıştır. Regresyon denklemleri elde edildikten sonra, her bir cevap değişkeni için istenebilirlik fonksiyonları tanımlanmış ve nihayetinde bileşik istenebilirlik değerini en büyükleyecek doğrusal olmayan bir programlama modeli kurulmuştur. Kurulan bu model genelleştirilmiş azalan gradyenler yöntemi ve GAMS adlı paket programın versiyonundan yararlanılarak çözülmüş ve böylelikle faktörlerin optimum seviyeleri elde edilmiştir. Çalışma sonunda gluten oranı için 8.748%, alfa amilaz enzimi ilavesi için ppm, su yüzdesi için 6.471%, yoğurma süresi için dakika, fermantasyon sıcaklığı için C ve fermantasyon süresi için dakika seviyeleri optimum seviyeler olarak elde edilmiştir. Belirlenen faktör seviyeleri ile cevap değişkenleri için değerler sırasıyla 5.39, 6.98, 0.65, olarak elde edilmiştir. KAYNAKLAR [1] Derringer, G. ve Suich, R. (1980). Simultaneous optimization of several response variables. Journal of Quality Technology, 1, ABSTRACT OPTIMIZATION OF BREAD-MAKING PROCESS IN MULTI-RESPONSE FRAMEWORK USING NON-LINEAR PROGRAMMING AND DESIRABILITY FUNCTION APPROACH Response surface methodology is a bunch of mathematical and statistical techniques used when multiple factors affect the outcome of a product or process and the aim is to optimize that outcome. In this study, bread making process is analyzed in multi response framework using desirability function for enhancing the quality of bread. In this context, six factor and four response variables are chosen. The optimum levels are found as 8.748% for gluten ratio, ppm for alfa amilaz enzyme addition, minutes for knead duration, C for fermantation temperature and minutes for fermantation duration. Key Words: (Times New Roman, 1pt, Multi-Response Surface Optimization, Desirability Function, Bread-Making Process. 95 1

196 SESSION 5 VERİ ZARFLAMA ANALİZİ 96 1

197 Panel VZA ve Bootstrap VZA ile Türkiye deki Sağlık Kurumlarının Etkinlik Analizi Elvan AKTÜRK HAYAT*, Esin AVCI** *Adnan Menderes Üniversitesi, Aydın İktisat Fakültesi, Ekonometri Bölümü, 09010, Aydın, TÜRKİYE **Giresun Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, 8000, Giresun, TÜRKİYE, 1. Panel VZA ve Bootstrap VZA Doğrusal programlama temeline dayalı parametrik olmayan bir yöntem olan Veri Zarflama Analizi (VZA) ile üretim fonksiyonu için teknik etkinlik (TE) hesaplanabilmektedir. VZA da panel veriler söz konusu olduğunda etkinlik değerlerinin dönem içindeki değişimi Malmquist Toplam Faktör Verimlilik (TFV) endeksi kullanılarak ölçülmektedir. VZA da tek bir girdi ve tek bir çıktı olması durumunda etkinlik ölçümü temelde çıktı/girdi oranına dayanır: TE i = Q i /P i, i=1,, n (1) Burada, TE i, i. firmanın teknik etkinliğidir. Bu oran 0 ile 1 arasında değerler alabilir. 0 değeri firmanın teknik olarak etkin olmadığını, 1 değeri ise bu firmanın maksimum teknik etkinliğe sahip olduğunu belirtir. Panel VZA ise, klasik VZA nın bir genişletilmesi olarak düşünülebilir. Panel VZA ile teknik etkinlik eşitlik deki gibi hesaplanabilir: TE it = Q it /P it, i=1,, n, t=1,, n () Burada, i firma sayısını, t ise zamanı gösterir. TE it ise i. firmanın t dönemindeki teknik etkinliğidir (Coelli, 1996). Panel veri ile gerçekleştirilecek analizlerde daha tutarlı tahminler elde etmek ve yaklaşık güven aralıkları üretmek için Bootstrap metodu kullanılabilir. Efron (1979) tarafından önerilen Bootstrap metodu, parametrik ve parametrik olmayan istatistik analizlerde kullanılabilen basit ve güvenilir bir metottur. Bootstrap VZA ile yapılacak etkinlik ölçümlerinin daha doğru ve açıklayıcı bilgi verdiği düşünülmektedir. Bu çalışmada, Panel VZA ve Bootstrap temeline dayalı VZA yöntemlerinden elde edilen teknik etkinlik skorlarının karşılaştırılması amaçlanmıştır. Bu amaçla, dönemi verileri kullanılarak, Türkiye de bölgeler bazında sağlık kurumlarının performansları Panel VZA ve Bootstrap VZA ile analiz edilmiş ve sonuçlar değerlendirilmiştir.. Uygulama Bir hizmet alanı olarak sağlık, bir yandan insan ve toplum yaşamını doğrudan ilgilendirmekte; öte yandan emek faktörünün kalitesine katkıları yanında yatırım, istihdam ve üretim yoluyla bir bütün olarak ekonomik performansı etkilemektedir. (Bayraktutan ve Pehlivanoğlu, 01). Sağlık sektörünün gelişmişlik düzeyi, bir ülkenin başta gelen kalkınma göstergelerinden biridir. Bu nedenle sağlıkta geçerli, güvenilir ve kullanılabilir performans ölçüm araçlarına ihtiyaç duyulmaktadır. Bu araçlar sayesinde rekabette üstünlük sağlanabilecektir (Li ve Benton, 1996). Panel VZA ve Bootstrap VZA ile Türkiye deki sağlık kurumlarının performansının belirlenmesinde, 1 istatistiki bölge ve 5 yıllık döneme ilişkin 3 girdi ve çıktı değişkeni çalışmaya dahil edilmiştir. Veri seti, T.C Sağlık Bakanlığı Sağlık İstatistikleri yıllıklarından dönemi itibari ile İBBS-1 e (İstatistiki Bölge Birimleri Sınıflaması) göre derlenmiştir. Girdi ve çıktı değişkenleri aşağıdaki gibidir: Girdiler: X1: kişiye düşen toplam hekim sayısı 1 X: kişiye düşen hemşire ve ebe sayısı 97 X3: kişiye düşen hastane yatağı sayısı Çıktılar: Y1: 1000 kişiye düşen ameliyat sayısı Y: Hastanelerde Yatan Hasta Ortalama Kalış Günü

198 3. Sonuç Panel VZA ile sadece etkinlik değerleri hesaplanır. Bootstrap VZA da ise, yeniden örnekleme temelinde simülasyonlarla, etkinlik değerleri ve bunlara ilişkin güven aralıkları elde edilmektedir. Panel VZA ve Bootstrap VZA yöntemlerinden elde edilen teknik etkinlik skorlarının karşılaştırıldığı bu çalışmada, gerçek veri seti ile bir uygulama gerçekleştirilmiştir. 5 yıl ve 1 bölge için yapılan analizlerde, daha açıklayıcı bilgi sağlayan Bootstrap VZA sonuçları Panel VZA sonuçlarını doğrulamıştır. KAYNAKLAR [1] Coelli, T., (1996). A Guide to DEAP Version.1: A Data Envelopment Analysis(Computer) Program, CEPA Working Papers, Department of Econometrics, University of New England, Armidale, NSE 351, Australia. [] Efron, B., (1979). Bootstrap Methods: Another Look at the Jackknife. The Annals of Statistics 7(1): 1 6. [3] Bayraktutan Y. ve Pehlivanoğlu F. (01), Sağlık İşletmelerinde Etkinlik Analizi: Kocaeli Örneği, Kocaeli Üniversitesi Sosyal Bilimler Enstitüsü Dergisi, 3: [4] Li L.X. and Benton W.C. (1996), Performance Mesaurement Criteria in Health Care Organizations: Reviewand Future Research Directions, European Journal of Operational Research, 93: ABSTRACT EFFICIENCY ANALYSIS OF TURKEY HEALTH CARE FACILITIES USING PANEL DEA AND BOOTSTRAP DEA In this study, we aimed to compare the technical efficiency scores obtained from Panel Data Envelopment Analysis (Panel DEA) and the Bootstrap method based on the DEA. For this purpose, the performances of the health institutions in Turkey, using data from the period, were analyzed by Bootstrap DEA and Panel DEA and the results were evaluated. Key Words: Panel DEA, Bootstrapping DEA, efficiency 98 1

199 AKADEMİK BİRİMLERİN PERFORMANSLARININ VERİ ZARFLAMA ANALİZİ İLE DEĞERLENDİRİLMESİ Hakan ALTUNAY Fırat Üniversitesi, Mühendislik Fakültesi, Endüstri Mühendisliği Bölümü, Elazığ, Üniversitelerdeki akademik birimlerin performanslarının değerlendirilmesi, mevcut kaynakların doğru kullanımı ve dağıtımı açısından oldukça önemlidir. Her geçen gün artan öğrenci, program ve bölüm sayılarına karşın; yapılan yatırımların yetersiz kalması, üniversiteler için etkinlik kavramının ön plana çıkmasına sebep olmuştur. Karar verme birimlerinin etkinliklerinin değerlendirilmesi için öncelikle doğru performans ölçüm aracının belirlenmesi gereklidir. Bu çalışmada, akademik birimlerin etkinliklerinin değerlendirilmesi amacıyla etkili bir performans ölçüm aracı olan Veri Zarflama Analizi (VZA) yönteminden yararlanılmıştır. Üniversite içerisindeki akademik birimler ise karar verme birimleri olarak değerlendirilmiştir. VZA; doğrusal programlama prensiplerine dayanan, karar verme birimlerinin (KVB) kullandıkları girdileri, hangi etkinlik derecesinde çıktıya dönüştürdüğünü tespit etmemize imkân sağlayan ve duyarlılık analizi yöntemiyle kaynakların daha etkin kullanılması amacıyla girdi ve çıktıların ayarlanmasını mümkün kılan bir yöntem olarak ifade edilmektedir. Veri Zarflama Analizi ilk olarak Charnes, Cooper ve Rhodes tarafından 1978 yılında kâr amaçlı kurulmayan ve kamu hizmeti sağlayan kuruluşların örgütsel performansını izleyebilmek amacıyla geliştirilmiştir. VZA; sağlık, bankacılık, ulaşım gibi pek çok sektörde uygulama alanı bulmakla birlikte, eğitim kurumları için yapılan performans ölçümü çalışmaları da giderek önem kazanmaktadır. KAYNAKLAR [1] Agha, S.R, Kuhail, I., Abdulnabi, N., Ghanim, A. Salem, S. (011) Assessment of Academic Departments Efficiency Using Data Envelopment Analysis, Journal of Industrial Engineering and Management, Vol. 4, No., pp [] Charnes A., Cooper W.W. and Rhodes E. (1978), Measuring the Efficiency of Decision Making Units, European Journal of Operational Research. [3] Çakmak, Z., Uzgören, N., Keçek, G., (005), Kümeleme Analizi Teknikleri İle İllerin Kültürel Yapılarına Göre Sınıflandırılması Ve Değişimlerinin İncelenmesi, Dumlupınar Üniversitesi Sosyal Bilimler Dergisi, Sayı:1, Haziran 005. [4] Eroğlu, Ergün ve Melek C. Atasoy (006), Veri Zarflama Analizi ile Etkinlik Ölçümü ve Etkin Karar Birimlerinin Duyarlılık Analizi, İstanbul Üniversitesi İşletme Fakültesi Dergisi, 35(), ss [5] Johnes J. (006), Measuring Teaching Efficiency in Higher Education: An Application of Data Envelopment Analysis to Economics Graduates from UK Universities European Journal of Operational Research 174, [6] Kuah C.T. and Wong K.Y. (011), Efficiency Assessment of Universities through Data Envelopment Analysis. Procedia Computer Science. In Press, 3: ABSTRACT PERFORMANCE EVALUATION OF ACADEMIC DEPARTMENTS WITH DATA ENVELOPMENT ANALYSIS Data Envelopment Analysis (DEA) is a non-parametric productive efficiency measurement method for operations with multiple inputs and multiple outputs. In this study we analyze the relative efficiency of academic departments at the Fırat University in Turkey, by using Data Envelopment Analysis (DEA). Firstly, the inputs and outputs for academic department performance measurement were determined. Then, the potential improvements and efficiency scores are computed for inefficient and efficient academic departments respectively Key Words: Data Envelopment Analysis, Efficiency, Performance Management, Academic Departments, Operations Research.

200 1. Giriş İKİ AŞAMALI VERİ ZARFLAMA ANALİZİ İLE ANKARA DAKİ DEVLET HASTANELERİNİN PERFORMANSLARININ İNCELENMESİ Merve KANDEMİR, H. Hasan ÖRKCÜ Gazi Üniversitesi Fen Fakültesi İstatistik Bölümü Teknikokullar ANKARA Günümüz dünyasında insanların sağlık hizmetine olan ihtiyaçları diğer sektörlere göre daha fazla artmaktadır. Kısıtlı kaynaklarla sağlık ihtiyaçlarının karşılanmasında kurumların kaynaklarını olabildiğince verimli kullanmaları kaçınılmaz olmuştur. Hastaneler sağlık hizmeti sunmak üzere değişen teknoloji, artan maliyet ve rekabet koşullarında faaliyetlerini sürdüren, sağlık kurumlarıdır. Çok fazla miktarda kaynak harcanan sağlık sektöründe, kaynakların doğru bir şekilde kullanılarak sağlık alanındaki kurumların performanslarının incelenmesi ve performansı etkileyen faktörlerin ortaya çıkarılması önemini sürdürmektedir. Sağlık sektöründe rekabetin giderek artması ve harcamaların ileri düzeyde yükselmesi, bu sektördeki işletmelerin önemli bölümünü oluşturan hastaneleri, kaynaklarını daha etkin şekilde kullanmayı zorlamaktadır. Bu nedenle hastanelerin performans düzeylerini belirlemeleri, etkin olmamaları durumunda kullandıkları girdilerinde ne kadarlık bir azaltma ya da ortaya koydukları çıktılarında ne kadarlık bir artırma yapmaları gerektiğini saptayarak, daha etkin konuma gelebilmek için nasıl bir strateji uygulayacaklarına karar vermeleri gerekmektedir. Veri Zarflama Analizi (VZA), homojen birimlerden oluşan karar verme birimlerinin (KVB) (hastane, okul, işletme veya herhangi bir stratejik sistemin) etkinliğini ölçmek için kullanılan bir performans ölçme tekniğidir. VZA nın kullanıldığı ilk tanıtım makalesi Charnes, Cooper ve Rhodes tarafından 1978 yılında European Journal of Operational Research'de yayınlanmıştır. Bu yöntemin sahip olduğu en önemli özellik, her karar verme birimindeki etkinsizlik miktarını ve kaynaklarını tanımlayabilmesidir. Bu özelliği ile yöntem etkin olmayan karar verme birimlerinde ne kadarlık bir girdi azaltma ve/veya çıktı miktarının ne kadar arttırılması gerektiğine ilişkin olarak yöneticilere yol gösterebilir. VZA sağlık alanındaki işletmelerin performans değerlendirmesinde başarıyla kullanılmıştır. Grosskopf ve Valdmanis in [3] Measuring Hospital Performance: A Nonparametric Approach adlı çalışmasında, kamu kesimine ait devlet hastanelerinde etkinlik düzeyi ile mülkiyet biçimi arasındaki ilişki incelenmiştir. Mülkiyet ile etkinlik arasında anlamlı bir ilişki kurulamamıştır. Kavuncubaşı ve Ersoy [5] tarafından 199 yılı verileri kullanılarak, Sağlık Bakanlığına ait hastanelerin etkinlik değerlendirilmesi girdi yönelimli VZA yöntemiyle yapılmıştır. Özcan ve McCue (1996) tarafından ABD de faaliyet gösteren Akut Bakım Hastaneleri nin finansal performansları VZA tekniği ile değerlendirmiştir. Chang [] girdi yönelimli VZA yaklaşımıyla Tayvan da merkezi yönetime ait kamu hastanelerinde verimlilik ölçümü yapmıştır. Çalışmanın bulgularına göre bakılan hastaların türü ve hizmet sunum biçimi hastane etkinliğini negatif yönde etkilemektedir. Güçlü [4] tarafından Türk Silahlı Kuvvetleri Hastanelerinde Verimlilik Ölçümü VZA ile yapılmıştır. Harris ve ark. [6] tarafından yapılan bir başka çalışmada ise hastanelerin birleşmelerinin hastane etkinliği üzerine etkisi VZA yöntemiyle incelenmiştir. Hastane birleşmelerinin genel olarak etkinliğe olumlu yansıdığı gözlemlenmiştir. Şahin ve Özgen [7], Sağlık Bakanlığı İl Devlet Hastanelerinin Karşılaştırmalı Verimlilik Analizi adlı çalışmada, Sağlık Bakanlığı bünyesindeki il devlet hastanelerinin karşılaştırmalı teknik verimliliklerini ölçmek ve verimsiz hizmet ürettiği belirlenen hastaneler için verimsizlik kaynakları ve düzeyleri incelenmiştir. Bayraktutan ve Pehlivanoğlu [1] tarafından yapılan Kocaeli deki kamu ve özel sektör hastanelerinin etkinlik karşılaştırmasını yapmak için VZA kullanmaları sonucunda özel hastanelerin ortalama olarak daha yüksek hizmet performansı gösterdiği sonucuna varılmış, devlet ve üniversite hastanelerinin etkinlik seviyesinin düşük çıkma nedenleri açıklanmıştır. Son yıllarda iki aşamalı ya da genel olarak çok aşamalı bir şekilde üretime sahip olan sistemlerin performans değerlendirmesi için de VZA tabanlı modeller geliştirilmektedir. İki aşamalı sistem için, birimler ilk aşamada girdilerini kullanarak orta girdiler adı verilen yeni değişkenleri 00 ortaya koymakta ve ikinci aşamada ise orta girdilerini kullanarak da nihai çıktılarına ulaşmaktadırlar. Bu çalışmada Ankara daki devlet hastaneleri iki aşamalı VZA modeli ile ele alınmaktadır. Çalışmada, yatak sayısı, hekim sayısı (uzman ve pratisyen), poliklinik sayısı, cerrahi alet sayısı, sterilizasyon merkezi alanı,

201 sterilizasyon merkezinde çalışan personel sayısı, kalite değerlendirme sonuçları ve yıl bazında toplam gider değişkenleri kullanılmıştır. Bu değişkenler ile bir iki aşamalı VZA modeli kurularak, Ankara daki devlet hastanelerinin performans analizi ortaya konmuştur. KAYNAKLAR [1] Bayraktutan, Y.; Pehlivanoğlu, F. (01), Sağlık İşletmelerinde Etkinlik Analizi: Kocaeli Örneği, Kocaeli Üniversitesi Sosyal Bilimler Enstitüsü Dergisi. 3:17-16 [] Chang, H.H. (1998) Determinants of Hospital Efficiency:The Case of Cenral Government-owned Hospitals in Taiwan, Omega. 6(): [3] Grosskopf and Valdmanis in (1987), Measuring Hospital Performance: A Non-parametric Approach,Journal of Health Economics. 6: [4] Güçlü, A. (1999), Türk Silahlı Kuvvetleri Hastanelerinde Teknik Verimlilik Ölçümü, Genelkurmay Başkanlığı Gülhane Askeri Tıp Akademisi Sağlık Bilimleri Enstitüsü [5] Kavuncubaşı, Ş.; Ersoy K. (1995), Hastanelerde Teknik Verimlilik Ölçümü, Amme İdaresi Dergisi. 8(3):3 THE EFFICIENCY INVESTIGATION OF HOSPITAL IN ANKARA BY TWO-STAGE DATA ENVELOPMENT ANALYSIS ABSTRACT The objective of this study is to evaluate the technical efficiency of state hospitals in Ankara by using twostage Data Envelopment Analysis (DEA). Source data of research is the 013 Union General Secretariat of Public Hospitals Center Evaluation of the Current Situation of the Sterilisiation Unit and the Ministry of Health Statistics and Modelling, Analysis and Information Systems Department. It was included to research 18 state hospitals which of 11 are central hospitals and which of 6 are district hospitals. Key Words: Hospital efficiency, Data Envelopment Analysis, two-stage efficiency analysis, Ministry of Health. 01

202 PARÇACIK SÜRÜ OPTİMİZASYONU İLE VERİ ZARFLAMA ANALİZİ TABANLI OPTİMAL PORTFÖY DEĞERLENDİRMESİ: İMKB-30 ENDEKSİ ÜZERİNE BİR UYGULAMA Tuğcan ÖZSOY, H. Hasan ÖRKCÜ Gazi Üniversitesi Fen Fakültesi İstatistik Bölümü Teknikokullar ANKARA Hızla değişen finans piyasalarında portföy yönetimi en ilgi çekici konulardan biri olmuştur. 196 yılında ABD bonosuna yapılan 1 dolar yatırım 71 yıllık sürecin sonunda 14 dolara çıkabilirdi, yine 1 dolarlık yatırım S&P 500 e yatırılmış olsaydı getirisi 1370 dolar olacaktı. Yine bu iki yatırım aracı kullanılarak iyi bir karar verici tarafından her ay maksimum getiri sunacak olan yatırım aracı seçilmiş olsaydı 71 yıllık süreç sonunda getiri,96,183,456 dolar olacaktı []. Bu iki yatırım aracı kullanılarak elde edilebilecek maksimum getiri portföy yönetiminin ilgi çekici olmasının sebebini açıklamaktadır. Minimum risk altında maksimum getiriyi hedefleyen portföy yönetiminde yatırımcıların karar verme sürecini 1950 li yıllara kadar menkul kıymet çeşidi arttıkça portföy riski azalacağını savunan geleneksel portföy teorisi etkilerken, 1950 li yıllardan sonra yatırımcılar modern portföy teorisini benimsemişlerdi. 000 li yıllara gelindiğinde ise sezgisel yöntemler tercih edilmeye başlanmıştır [3]. Optimizasyon problemlerinin çözümünde klasik yöntemler olarak adlandırılan matematiksel yöntemler önceleri çok yaygın olarak kullanılmaktaydı. Bu tür yöntemlerin esnek olmaması ve matematiksel fonksiyonlarla tanımlama gereksinimi gibi dezavantajları, son zamanlarda, bilim adamlarında genel amaçlı ve performansı yüksek yöntemler geliştirme çabalarını artırmış ve doğadaki olaylardan esinlenmeye başlamışlardır. [4] Optimizasyon problemlerinin çözümü için birçok algoritma geliştirilmiştir. En iyilemeyi gerçekleştirmek için doğadan esinlenilerek oluşturulan bir sezgisel optimizasyon teknikleri, özellikle büyük boyutlu optimizasyon problemlerinde optimuma yakın sonuç vermektedir. Bu çalışmada İMKB 30 indeksine ait hisse senetleri ile portföy değerlendirmesi amaçlanmıştır. İndekste yer alan şirketlerin çeşitli girdi-çıktı değişkenleri kullanılarak veri zarflama analizi ile performans değerlendirmesi yapılarak birbiriyle daha yakın ve rekabet edebilir şirektlerin değerlendirilmesi amaçlanmıştır. Daha sonra ise günlük getiri oranları kullanılarak parçacık sürü optimizasyonu ve klasik optimizasyon teknikleri kullanılarak portföyler elde edilmiştir. Bu çalışmada kuş sürülerinin davranışlarından esinlenerek ortaya çıkarılmış bir sezgisel optimizasyon tekniği olan, geniş çözüm uzayına sahip ve karmaşık problemlerde kısa sürede kabul edilebilir bir sonuca gidilebilen parçacık sürü optimizasyonu ile veri zarflama analizi tabanlı bir portföy optimizasyonu yapılmıştır. Uygulanılan optimizasyon yöntemlerinden elde edilen portföyler, performans ölçütü olan Sharpe Oranı ile karşılaştırılmıştır. İMKB-30 indeks verilerine ait hisse senetlerinin günlük getirileri kullanılarak, etkin olan hisse senetleri seçilmiş ve piyasada geneli etkileyen krizler ve ya hisse senedi bazlı özel durumlar da çalışmaya dâhil edilerek duruma çok yönlü bakılmıştır. Böylece çalışmada, insan psikolojisine benzer bir şekilde işleyen ve birçok uyaranı olan finansal piyasaların hareketliliği ile ilgili daha kapsamlı sonuçlara ulaşmak hedeflenmiştir. KAYNAKLAR [1] R. J. Kuo, C. W. Hong, "Integration of Genetic Algorithm and Particle Swarm Optimization for Investment Portfolio Optimization" [] H. Genel, "Genetik Algoritmalarla Portföy Optimizasyonu", Yüksek Lisans Tezi, T.C. Ankara Üniversitesi Sosyal Bilimler Enstitüsü İşletme Anabilim Dalı, 004 [3] A. Z. ÇELENLİ, E. EĞRİOĞLU, B. Ş. ÇORBA, İMKB 30 İndeksini Oluşturan Hisse Senetleri İçin Parçacık Sürü Optimizasyonu Yöntemlerine Dayalı Portföy Analizi, Doğuş Üniversitesi Dergisi, 16 (1) 015, 5-33 [4] M. ÖZSAĞLAM, M. ÇUNKAŞ, "Optimizasyon Problemlerinin Çözümü için Parçacık Sürü Optimizasyonu Algoritması", Politeknik Dergisi Journal 0 of Polytechnic Cilt:11 Sayı: 4 s , 008 Vol: 11 No: 4 pp , 008 [5] S. TETİK, İşletme Performansını Belirlemede Veri Zarflama Analizi, Yönetim Ve Ekonomi Yıl :003 Cilt :10 Sayı : Celal Bayar Üniversitesi İ.İ.B.F., Manisa

203 PARTICLE SWARM OPTIMIZATION ALGORITHM FOR INVESTMENT PORTFOLIO BASED DATA ENVELOPMENT ANALYSİS: AN APPLICATION OF ISE-30 STOCK SHARES ABSTRACT Many optimization techniques used in solving optimization problems has been developed by inspiring from the events in nature. Particle swarm optimization is a population based stochastic optimization technique, inspired by social behavior of bird flocking or fish schooling. In this study, particle swarm optimization based data envelopment analysis been applied to optimize the portfolio that contains ISE 30 stock shares. Key Words: Particle swarm optimization, genetic algorithm, portfoli optimization, optimization in finance 03

204 SESSION 6 ECONOMETRICS, FINANCE, ACTUARY and RISK MANAGEMENT 04

205 How effective is SCR when the association is measured with Copulas? Etkin HASGUL*. A. Sevtap KESTEL* *ODTU UYGULAMALI MATEMATIK ENSTITUSU, 06800, ÇANKAYA-ANKARA Kasırga YILDIRAK HACETTEPE UNIVERSITESI AKTUERYA BILIMLERI BOLUMU, 06800, BEYTEPE-ANKARA 1. Introduction Capability of a firm to maintain its business in long-term while meeting all obligations and having enough equity to carry on operations and meeting liabilities is known as solvency. In other words, solvency is a regulatory framework of determining the capability of financially being solvent of an insurance or reinsurance company in respect of ability to compensate claims of insured people. The aim of the system is to maintain the operations of the companies or to carry their business on especially in case of financially distress periods. The risks of underwriting, market, credibility, operational and liquidity are in main concerns of Solvency II in addition to regulations and audit. The Solvency II Directive consists of three pillars. Pillar I consists of quantitative measurements, applied model and its validation and calculation of capital requirements, which are Solvency Capital Requirement (SCR) and Minimum Capital Requirement (MCR). Pillar II requires wellstructured internal audit, strong risk management skill of the insurers in undertaking their own risks and corporate governance. Pillar III indicates the reporting of the firm to external auditors and transparency to public. Since adequate financial supervision for the insurance companies has not been set yet in Turkey, a thorough planning has to be implemented to the system by adapting to evolving Solvency II regulations in EU. The current legislation and the inadequacies in financial monitoring are under an updating process with respect to the compliance process to EU standards. Similar arrangements as in EU system are implemented by the decree Law No on 3/6/007. Literature on quantitative models in solvency in Turkey is limited. Genc (00, 006), Ocak (015), Isseveroglu (005) applied multi-dimensional statistical methods to predict the failures from the beginning time and to select the indicators/factors to insurance companies acted in non-life elementary branches in Turkey. The aim of this study is to determine how efficient SCR is when the Copula Correlation is used instead of Pearson Correlation.. Solvency II Quantitative Methods Solvency II has two basic components: SCR and MCR. Standard approach model and internal models are used in order to calculate these components. These models vary according to the type of the company so that the models also change based on the risk exposure. Therefore, developed insurance companies should use their own internal model approach which needs to be approved by Supervisory Institutions. SCR is the target capital which helps to meet unexpected significant amount of loss and also brings the confidence to fill the claims of insured. While SCR is the higher amount, Minimum Capital Requirement (MCR) is the applicable lowest capital. SCR calculation employs the Value-at-Risk (VaR) method by using one-year related equity amounts in 99.5% confidence interval. Either standard formula or internal models can be used to calculate SCR and MCR. At least five risks, which can be considered as non-life insurance risk, life insurance risk, health insurance risk, credit risk, operational risk, should be used in VaR, separately. Those risks are evaluated by using risk premiums, paid loss amounts and reserve risks. While standard formula is defined by European Commission, internal formula is defined by companies and confirmed by Auditor Committee. 3. Association Measures Pearson correlation is the most common method which is used to measure linear relationship between two variables. The covariance of two variables is divided by 05 the product of standard deviations of the variables in order to calculate Pearson correlation coefficient. Although Copula Method is widely used in the area of Financial Mathematics, adaptation of Copula which measures Solvency II Requirements Indicators is not commonly used. In this study, Gaussian Copula and t- copula methods will be applied instead of Pearson Correlation.

206 According to Sklar Theorem, if marginal distribution functions are continuous, a single Copula is obtained. Gaussian Copula method which will be used in the study is applied under the assumption that the marginal distributions have standard normal distribution and t-copula method is applied under the assumption that marginal distributions have t-distribution. 4. Data Financial ratios like Liquid Asset/Total Asset, Premium Collection Ratio, Net premium Receivables/Total Asset, Loss/Premium, Profit/Paid Capital, Premium Production/Coverage, Payables on Reinsurance Op./Equity, Liability (Short-term)/Liquid Asset, Total Reserve/Net Premium, Total Reserve/Net Premium, Total Reserve/Liquid Asset, Technical Profit/Premium, Total Income/Total Asset, Total Payables (Long&Shortterm)/Equity and Reinsurance share/gross Premium are used in this study [1]. The ratios of 17 firms are taken into consideration while study is conducted. 5. REFERENCES [1] Ocak, G. (015). An Early Warning Model for Turkish Insurance Companies (Master s Thesis, Middle East Technical University, Ankara, Turkey). [] Genç, A. (00). Hayatdışı Sigorta Şirketlerinde Mali Yeterliliğin Ölçülmesi ve Türkiye için bir erken Uyarı Modeli Önerisi, Doktora Tezi, Ankara Üniversitesi, İşletme A.B.D. [3] Isseveroglu, G. (005). Sigorta Sirketlerinde Finansal Başarının Ölçülmesi ve Bir Uygulama (Ph.D. Thesis, T.C. Uludağ University Institute of Social Sciences, Bursa, Turkey) ABSTRACT HOW EFFECTIVE IS SCR IF THE ASSOCIATION IS MEASURED BY COPULAS? Solvency can be described as capability of a firm to maintain its business in long term while meeting all obligations and liabilities and having enough equity to carry on operations. In addition to regulations, Solvency Capital Requirement (SCR) is the target capital which helps to meet unexpected significant amount of loss and to fill all the claims. In this study, adaptation of copula methods to SCR is performed in order to see improvement in correlation. Key Words: (Solvency II, Solvency Capital Requirement, Gaussian Copula, t-copula) 06

207 Determinants of FDI: Evidence from panel regression analysis Erhan ÇENE 1 Filiz KARAMAN 1 1 Yildiz Technical University, Department of Statistics,340, Esenler, Istanbul, Turkey ecene@yildiz.edu.tr ; fkaraman@yildiz.edu.tr 1. Introduction Foreign direct investment (FDI) is a key factor for both multinational enterprises (MNEs) and governments. MNEs use FDI to expand their sales, to acquire resources and to minimize competitive risks [1]. Governments may also encourage FDI, to achieve income, economic growth or to increase employment [], or to acquire new technology, products and skills [3]. Main aim of this article is to reveal the determinants of FDI and how they affect firms and governments policies.. Possible determinants of FDI Revealing determinants of FDI is a popular topic and there are numerous studies in this area. Kok and Ersoy s work [4] have a wide range of literature and interested readers may refer to it. On the other hand, Prüfer and Tondl [5], stated that, there are various factors effecting FDI including market size, human capital and infrastructure, labor costs and taxation, resources, trade openness, macroeconomic stability and institutional factors. Each of these factors should be considered carefully by substituting them with a proper variable. 3. Dataset and results In this work, possible determinants of FDI are investigated for 15 countries in within a panel data analysis context. List and description of variables are given in Table-1, country list is given in Table-1 and panel regression analysis results are given in Table-3. Population which is a proxy for market size appeared to be main determinant of FDI. Also human capital, freedom index and corruption perception index appeared to be effective on FDI. These results are consistent with previous works as significant variables have positive effect on the FDI received by a country. Table-1: Variable names and descriptions Variables Description Source FDI Logarithm of Inward FDI flows US Dollars at current prices and current UNCTAD exchange rates in millions Population Logarithm of absolute values in thousands UNCTAD Growth GDP Annual average growth rates per capita based on gross domestic product at UNCTAD constant 005 U.S. dollars. Freedom Index Economic Freedom Index 1: Low economic freedom 10: High economic Fraser Institute freedom Corruption Perception Index Corruption Perception Index 0: Highly Corrupt 10: No Corruption Transparency International Human Capital Human capital index PWT 8.1 Trade Openness (Import+Export)/TotalGDP WDI and Own Calculation Inflation Annual percentage change of average consumer prices WEO Table-: Country List Europe Italy Poland Portugal Spain Turkey Asia China India Indonesia Malaysia South Korea South America Argentina Brazil Mexico Peru Venezuela 07

208 Table-3: Regression analysis results Pooled LS Regression Pooled LS with Dummies Panel Regression (FE) Driscoll-Kraay Estimator (FE) Growth GDP (1.4) 0.68 (.9)** 0.016(1.4) (1.39) Population (7.77) *** (10.10)*** 6,31 (.90)*** 6.31 (3.4)*** Trade Openness -0.6 (-1.6) (.7)*** 1,170 (1,4) (.35)** Human Capital (4.06) *** (3.88)*** -,708 (-1.88)* -.71 (-.01)* Inflation (0.6) (0.69) (1.1) (1.86)* Corruption Perception Index 0.5 (3.87) *** 0.34 (3.70)*** 0.17 (1.47) (.44)** Freedom Index (0.60) (1.79)* (3,09)*** (3.70)*** constant (-4.61) *** (-7.48)*** (-.98)*** (-3.46)*** Asia Dummy (-4.35)*** South America Dummy 0.38 (1.69)* R RE vs FE (Hausman Test) Notes: ***, **, * indicates significant levels at 1, 5 and 10% respectively. Numbers within parenthesis indicate t-statistic or z-statistic based on analysis. REFERENCES [1] Daniels, J. D., Radebaugh L. H. and Sullivan D. P. (004) International business: environments and operations, Upper Saddle River, NJ: Prentice Hall, 10th ed. [] Kok, R., and Ersoy B. A. (009) Analyses of FDI Determinants in Developing Countries, International Journal of Social Economics, 36, [3] Holland, D. and Pain N. (1998) The Determinants and Impact of Foreign direct investment in the transition economies: A panel data analysis, in V Edwards (ed), Convergence or Divergence: Aspirations and Reality in Central and Eastern Europe and Russia, Proceedings 4th Annual conference, Centre for Research into East European Business, University of Buckingham. [4] Kok, R., and Ersoy B. A. (009) Analyses of FDI Determinants in Developing Countries, International Journal of Social Economics 36, [5] Prüfer, P., and Tondl, G. (008), The FDI-growth nexus in Latin America: The role of source countries and local conditions, Center DP , Tilburg University Center for Economic Research, Working Paper. ABSTRACT DETERMINANTS OF FDI: EVIDENCE FROM PANEL REGRESSION ANALYSIS In this work, possible determinants of FDI are investigated for 15 countries in within a panel data analysis context. Population which is a proxy for market size appeared to be main determinant of FDI. Also human capital, freedom index and corruption perception index appeared to be effective on FDI. These results are consistent with previous works as significant variables have positive effect on the FDI received by a country. Key Words: Foreign Direct Investment, FDI, Panel Regression Analysis 08

209 ENERGY CONSUMPTION and ECONOMIC GROWTH in TURKEY: IS COPULA FRAMEWORK POSSIBLE? Ömer Ozan EVKAYA* Atılım Üniversitesi, Fen-Edebiyat Fakültesi, Matematik Bölümü, İncek Gölbaşı, Ankara, Türkiye Ceylan Talu YOZGATLIGİL ODTÜ, Fen-Edebiyat Fakültesi, İstatistik Bölümü, Çankaya, Ankara, Türkiye Sevtap KESTEL ODTÜ, Uygulamalı Matematik Enstitüsü, Aktüerya Bölümü, Çankaya, Ankara, Türkiye 1. Introduction and Motivation Energy is one of the most prominent and crucial source (input) for the sustainable economic growth and social life all over the world. Both demand and supply part of the economy is highly dependent to energy. It is the reason that energy is a key factor for the economic and social development of countries. In this sense, it is expected some relationships between the energy consumption and national income should be exist. Especially for developing countries, highly dependent on others with respect to energy sources, it is a hot topic to achieve its economic growth by diagnosing the correct direction with the energy consumption. Most of the empirical studies indicate many different relationship structures based on the selected duration and the used methodology. For instance, Granger-Causality, Johansen Co-integration tests and some analogues of them are most widely used tools to derive the direction of the relationship between energy consumption and economic growth. Even if the simplicity and ease interpretation of such tests, the results of empirical studies change based on the time duration selected at the beginning. For instance, in some studies show that unidirectional causality occurs from energy consumption to economic growth, whereas some others can represent no causality between variables. The motivation of this study is try to explore any possible benefit, can be gained via copulas, to explore the debated dependence structure. Disparately, different copula families allow us to derive such relationship probabilistically based on statistical properties of the variables. Mainly, the linkage between energy consumption and economic growth is considered for Turkey using the copula modeling.. Data Set and Methodology This copula based econometric study focuses on the following time series data over the period annually. Table 1. Data Set for the study Abbreviation Explanation GDP Gross Domestic Product (in $) GDP_pc Gross Domestic Product per capita (in $) PEC Primary Energy Consumption (in million TEP) TNEC Total Net Electricity Consumption (in GWh) Firstly, derived time series data is converted into logarithmic form and analyzed using the classical time series approach before copula modeling. Afterwards, different copula families are tested to model the bivariate relationships between selected parameters. The most significant model is decided by using the Goodness-of-fit tests for the copulas. 09

210 Figure 1. Log of Macroeconomic Time Series Figure. Log of Energy Consumption Time Series REFERENCES [1] Topallı, N. and Alagöz, M. (014), Energy Consumption and Economic Growth In Turkey: An Empirical Analysis, Selcuk University Journal of Institute of Social Sciences, (3), [] Akan, Y., Doğan, E. M. and Işık, C. (010), The Causality Relationship Between Energy Consumption and Economic Growth: The Case of Turkey. Enerji, Piyasa ve Düzenleme, 1 (1), [3] Nelsen, R. B. (006), An Introduction to Copulas, Springer Science+Business Media Inc, nd Ed. [4] Patton, A. J. (01), Copula Methods for Forecasting Multivariate Time Series, Handbook of Economic Forecasting, (). [5] Hofert, M., Kojadinovic, I., Maechler, M. and Yan, J. (015), Multivariate Dependence with Copulas, Copula R-package. ENERGY CONSUMPTION and ECONOMIC GROWTH in TURKEY: IS COPULA FRAMEWORK POSSIBLE? ABSTRACT The economic growth of any country primarily based on the efficient usage of energy sources. When the unequally distributed energy sources are considered, it deserves more attention to analyze the relationship between the energy consumption and changes in gross domestic product (GDP). Copulas are very recent and beneficial tool to capture the dependencies between variables probabilistically. They allow us to model the dependence structure among the random variables, independently of the margins involved in a flexible manner. The main goal of this study is investigating the dependence between economical growth and energy consumption in Turkey via copula functions. The annual Gross Domestic Product (GDP), GDP per capita in USA dollar volume, Primary Energy Consumption (PEC) in million TEP unit and the Total Net Electricity Consumption (TNEC) in gigawatt-hours (GWh) basis data for years are considered for copula analysis. Different bivariate copula families are employed and the best model is selected based on the goodness-of-fit test for copulas. Key Words: econometry, GDP, energy consumption, copulas, dependence 10

212 ÖZEL MARKALI ÜRÜNLERE OLAN TÜKETİCİ TALEBİNİN SIRALI LOJİSTİK REGRESYON ANALİZİ İLE İNCELENMESİ Hatice ŞAMKAR * Gamze GÜVEN Eskişehir Osmangazi Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, Eskişehir, Türkiye hfidan@ogu.edu.tr gamzeguven@ogu.edu.tr Özel markalı ürünler, perakendecinin satış noktalarında kendi adı yada kendi markasıyla satılan fiyatdağıtım-tutundurma-markalama ve marka yönetimi gibi konularda tek hâkimiyetin perakendecide olduğu ürünlerdir (Albar and Öksüz, 013). Bu markaların en önemli özelliği sadece marka sahibi perakendecilerin mağazasında satışa sunulmaları ve kitle iletişim araçlarında reklamının yapılmamasıdır. Önceleri ulusal markaların ucuz bir taklidi olarak görülen ve düşük gelirli tüketici kitlelerinin ihtiyacını karşılamak amacıyla ortaya çıkan özel markalı ürünlerin günümüzde önemli ölçüde pazar paylarını artırdıkları ve kaliteli ulusal markalara ciddi birer rakip haline geldikleri gözlenmektedir. Özel markalı ürünlerin tercih edilirliğinin gün geçtikçe artması ilginin, ürünleri satın alan tüketicilere yönlenmesine neden olmaktadır. Tüketicilerin sosyo-ekonomik özellikleriyle özel markalı ürünleri tercih edip etmemesi arasında bir ilişkinin bulunup bulunmadığının araştırılması ve özel markalı ürünleri tercih etme sıklığında etkili olabilecek faktörlerin belirlenmesi özel markalı ürünleri üretip pazarlayanlar açısından son derece önemlidir. Bu çalışma, özel markalı ürünlerin tercih edilme sıklığında sosyo-ekonomik değişkenlerin etki payını belirlemenin yanı sıra özel markalı ürünlerin ürün kalitesi ve pazarlanmasına yönelik tüketici fikirlerini değerlendirilmeyi amaçlamaktadır. Bunun için tüketicilerin sosyo-ekonomik niteliklerini ve özel markalı ürünlerin kalitesi, ambalajı ve pazarlama stratejileri konusundaki fikirlerini almaya yönelik likert tipi sorulardan oluşan bir anket hazırlanmış ve Eskişehir merkezinde bulunan 470 kişiye uygulanmıştır. Likert tipi sorulardan oluşan ölçeğin güvenilirliği Cronbach Alfa katsayısıyla incelenmiş ve bulunduğundan ölçeğin güvenilir olduğuna karar verilmiştir. Daha sonra Özel markalı ürün satın alma sıklığı bağımlı değişken, kişilerin sosyo-ekonomik nitelikleri ve likert tipi sorular bağımsız değişken olarak alınıp elde edilen veriler sıralı lojistik regresyon analizine tabii tutulmuştur. Lojistik regresyon, doğrusal regresyonda olduğu gibi bir bağımlı değişken ile bir yada daha çok bağımsız değişken arasındaki ilişkiyi tanımlayacak en uygun modeli bulmak için kullanılan istatistiksel bir metottur. Lojistik regresyon modelini doğrusal regresyon modelinden ayıran ise lojistik regresyonda bağımlı değişkenin kategorik olmasıdır. Eğer lojistik regresyon analizinde bağımlı değişkenin yapısı bu çalışmada olduğu gibi sıralı kategorik bir yapı izliyorsa, sıralı lojistik regresyon modeli kullanılır. Lojistik regresyon modeli aşağıdaki gibi verilir: β 0 β e Π(x) β 1 e 0 x 1 β 1 x Burada Π(x), x verilmişken Y nin koşullu beklenen değeri yani Π(x) =E(Y\x) dir. Π(x) in lojit dönüşümü aşağıdaki gibi tanımlanır (Hosmer and Lemeshow, 000): Π(x) (x) ln 1 Π(x) g = β0 β1x Lojistik regresyonda bilinmeyen parametreleri tahmin etmek için En Çok Olabilirlik Metodu kullanılır. Parametreler tahmin edildikten sonra lojistik regresyon modelinin uyum iyiliği ölçütleri, parametre tahminlerinin istatistiksel testleri ve tahmin edilen olasılıkların geçerliliği incelenir (Peng and So, 00). Bu çalışmada modelin genel anlamlılığı Likelihood Oran testi ile araştırılmış ve kurulan lojistik regresyon modeli istatistiksel olarak anlamlı (LR = (p < 0.000)) bulunmuştur. Nagelkerke R =0.6 olarak hesaplanmıştır. Bu değer bağımlı değişkendeki değişimin 1 %6. sinin kurulan model tarafından açıklandığını göstermektedir. Paralel eğriler varsayımı sağlanmış (değer = (p > 0.05)) ve tahmin edilen regresyon katsayılarının bağımlı değişkenin her bir kategorisinde aynı olduğuna karar verilmiştir. Ayrıca kurulan modelin gözlemlenen bireyleri doğru sınıflandırma oranı %7.76 dır. Model parametrelerinin anlamlılığı Wald istatistiği ile incelenmiş ve anlamlı bulunan parametrelerin yorumları odds oranları dikkate alınarak gerçekleştirilmiştir.

213 Özel markalı ürünlerin tercih edilme sıklığında gelir, meslek, yaş ve cinsiyet değişkenleri anlamlı bulunmuştur. Ayrıca özel markalı ürünlerin kalitesi, kullanım ömrü ve pazarlama stratejilerine ilişkin bazı değişkenlerin de yine özel markalı ürünlerin tercih edilme sıklığında anlamlı değişkenler olduğu gözlemlenmiştir. KAYNAKLAR [1] Ablar B.Ö. and Öksüz G. (013), Özel Markalı Ürünlerin Pazarlanmasında Tutundurma Stratejilerinin Etkisi, The Journal of Academic Social Science Studies, 6(7): [] Hosmer D.W. and Lemeshow S. (000), Applied Logistic Regression. John Wiley&Sons, Inc. pp:375. [3] Peng C.Y.J. and So T.S.H. (00). Logistic Regression Analysis and Repoting: A Primer. Teacing Articles. Understanding Statistics, 1(1): AN INVESTIGATION OF CONSUMER DEMAND FOR PRIVATE LABEL PRODUCTS WITH ORDINAL LOJISTIC REGRESION ANALYSIS Private label products are goods with brand that is owned by the retailer or the distributer and is sold only in its own outlets. They are often positioned as lower cost alternatives to regional, national or international brands. But it has been observed that the market share of private label products demonstares an increasing trend and they become competitor to quality national brand in the recent years. The aim of this study is to determine the impact of socioeconomic variables on consumers preference for private label products and, in addition, to assess consumers perception towards quality and marketing strategies of private label products. Key Words: Private labels products, Ordinal Lojistic Regression, Consumers Preference 13

214 SAĞLAM FAKTÖR ANALİZİ VE BİR UYGULAMA Özlem ALPU* Gamze GÜVEN Eskişehir Osmangazi Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, 6480 ESKİŞEHİR 1. Giriş Açıklayıcı faktör analizi çok sayıdaki değişkenin ilişki yapısını incelemek ve bu değişkenler arasındaki ilişkileri, faktör olarak isimlendirilen çok daha az sayıdaki gözlenemeyen gizli değişkenler bakımından açıklamayı sağlamak üzere düzenlenmiş çok değişkenli istatistiksel bir tekniktir. Faktör analizinin altında yatan varsayımlar karşılanması oldukça zor varsayımlardır. Bununla birlikte pek çok araştırmacı bu varsayımların gerekli olup olmadığını araştırmıştır. Klasik kestirimlerin bazı zayıf varsayımlar altında iyi asimptotik özelliklere sahip olduğunu göstermişlerdir (Mooijaart ve Bentler, 1991; Browne ve Shapiro, 1988). Klasik faktör analizi örneklem kovaryans veya örneklem korelasyon matrisinin hesabıyla başlar ve modele göre bu matrisi ayrıştırarak ikinci adıma geçilir. Aykırı değerler birinci adımda büyük bir etkiye sahip olduklarından bu yaklaşım veri setindeki aykırı değerlere karşı sağlam değildir. Bu çalışmanın amacı aykırı değerlerin parametre kestirimlerini yanlı yapmayacak özellikte faktör analizi metodunu kullanmaktır. Bu metot ise sağlam faktör analizi olarak isimlendirilir ve gerçekleşmesi araştırmacılar tarafından zor bulunan parametrik model varsayımlarını hesaba katar. Sağlam metot aykırı değerlerin etkisini azaltarak verilerin çoğunluğuna uyan modeli tahmin etmeye çalışır.. Sağlam faktör analizi Aykırı değerler her hangi bir uygulama alanındaki neredeyse her veri setinde ortaya çıkabilmektedir. Bazen zararsızdırlar ve analize aykırı değerlerle devam edilse de, analiz öncesi silinse de sonuçları değiştirmeyebilirler. Klasik çok değişkenli konum ve ölçek kestiricilerinden olan örneklem ortalaması ve örneklem kovaryans matrisi eğer veriler normal dağılımdan geliyorsa optimaldir, ancak tek bir aykırı değerin varlığına dahi aşırı derecede duyarlıdırlar. Veri setinde aykırı değer olması durumunda bu iki kestirici etkileneceğinden klasik faktör analizinin performansı da bağlı olarak kötüleşecektir (Pison ve arkadaşları, 003). Sağlam faktör analizi aykırı değerlerin etkisine dirençli olan yapıyı oluşturmayı amaçlamaktadır. Faktör analizi korelasyon veya kovaryans matrisine dayalı olduğundan, aykırı değerler kadar uç değerler (extreme values) de faktör analizi üzerinde ciddi derecede etkiye sahip olabilir (Pison ve arkadaşları, 003). Aykırı değerler istatistiksel analize başlamadan önce gözardı edilebilir, veya aykırı değerlerle başa çıkabilecek istatistiksel metotlar kullanılabilir, ve uygun dönüşüm metotları aracılığıyla uç değerlerin etkisi azaltılabilir. Ancak bu yollara nadiren başvurulmaktadır. Nedeni ise sonuçlarının ne olacağı konusundaki bilgi eksikliği, veya aykırı değerlerin silinmesiyle/uç değerlere az ağırlık verilmesiyle faktörlerde beklenilen sonuçların ortaya çıkmayacağı düşüncesi, üçüncü bir neden ise aykırı değerlerle kolaylıkla baş edebilecek yazılımın genellikle mevcut olmamasıdır. Şu an için aykırı değerlerin etkisini azaltmanın en iyi (etkili) yolunun faktör analizinin sağlam versiyonunu uygulamak olduğu söylenebilir. Böylelikle amaç aykırı değerleri ve uç değerleri içeren tüm gözlem değerlerine uyan klasik faktör analizi yapmak yerine gözlem değerlerinin çoğunluğuna uyan modeli tahmin etmek olacaktır. Sağlam faktör analizi kullanıldığında, aykırı değerler belirlenebilir ve sağlam faktörler üzerindeki faktör skorları yorumlanabilir. Faktör analizini sağlamlaştırmak için literatürde birkaç farklı metot yer almaktadır. Bu çalışmada Rousseeuw (1985) tarafından önerilen minimum kovaryans determinantı (MCD) kestiricisi kullanılacaktır. MCD oldukça sağlam bir kestirici olup bu kestiriciden daha önce popüler olan minimum hacimli elipsoit (MVE) kestiricisinden daha hızlı bir şekilde yakınsama sağlamaktadır. Ayrıca Rousseeuw ve Van Driessen (1999) tarafından MCD için geliştirilen yeni algoritma sayesinde çok hızlı bir şekilde hesaplama olanağı sunmaktadır. Diğer taraftan MCD kovaryans matrisi aykırı değerlere karşı sağlam olduğundan, sağlam faktörlerin elde edilmesine de olanak vermektedir.. 14

215 KAYNAKLAR [1] Browne M.W. and Shapiro A. (1988), Robustness of normal theory methods in the analysis of linear latent variable models, British J. Math. Statist. Physchol., 41: [] Mooijaart A. and Bentler P.M. (1991), Robustness of normal theory statistics in structural equation models, Statist. Neerland., 45: [3] Pison G., Rousseeeuw P.J., Filzmoser P. and Croux C. (003), Robust Factor Analysis, Journal of Multivariate Analysis, 84, [4] Rousseeuw P.J. (1985), Multivariate estimation with high breakdown point, In W. Grossmann, G. Pflug, I. Vincze, and W. Wertz (Eds.). (pp ). Mathematical statistics and applications, Vol. B. Budapest: AkadCmiai Kiad6. [5] Rousseeuw P.J. and Van Driessen K. (1999), A fast algorithm for the Minimum Covariance Determinant estimator, Technometrics, 41:1 3. ROBUST FACTOR ANALYSIS AND AN APPLICATION Factor analysis is an important statistical tool in multivariate analysis. Many researchers have used factor analysis in their researches at almost every branch of science. But the analysis is often applied without testing whether the data support it, and violate assumptions required for the analysis, or if there are outliers or not. Researchers might involuntarily misuse the analysis without changing the default settings on widely used statistical packages, and might be unaware of the package limitations. This paper aims to compare classical exploratory factor analysis with robust factor analysis in the presence of outliers on real data set. Key Words: Robust factor analysis, robust estimation, outlier, multivariate analysis 15

216 SIFIR DEĞER AĞIRLIKLI REGRESYON YARDIMIYLA MİDYE PARAZİT SAYISI DAĞILIM FAKTÖRLERİNİN BELİRLENMESİ Olcay ALPAY 1*, Emel ÇANKAYA 1, Nazan DANACIOĞLU 1, Ahmet ÖZER 1 Sinop Üniversitesi Fen Edebiyat Fakültesi İstatistik Bölümü, 57000, Sinop, TÜRKİYE Sinop Üniversitesi Su Ürünleri Fakültes Su Ürünleri Yetiştiriciliği Bölümü, 57000, Sinop, TÜRKİYE olcayb@sinop.edu.tr, ecankaya@sinop.edu.tr, nazand@sinop.edu.tr, aozer@sinop.edu.tr Ekolojik çalışmaların tür popülasyon takibi uygulamalarında, tür sayılarının pek çok faktöre bağlı olarak aşırı artış ya da azalış göstermesi ve hatta yok (sıfır değerli) olması durumuyla sıklıkla karşılaşılır. Bu tip sayım verilerinin sıfır değerde aşırı yoğunluğu nedeniyle sağa çarpık dağılımlı olması, sıfır yayılmalı özel dağılımlar kullanan regresyon yöntemlerinin geliştirilmesine neden olmuştur. 1. Poisson Regresyon Belli bir dönemde sayımla elde edilen verilerin modellenmesinde genellikle Poisson regresyon kullanılır. Bağımlı değişken olan Y sayım verisi ile X açıklayıcı değişkenler arasındaki ilişki, Poisson dağılım parametresi V y x e X E y x i 0 1x 1i px pi ) (1) varyansının eşit olması gerekir. Bu varsayımın ekolojik verilerde sağlanması ise hemen hemen imkansızdır. Yayılımın beklenenden fazla olması problemi, modele yayılım parametresi eklenmesine olanak sağlayan Negatif Binom dağılımı ile çoğu zaman aşılabilir.. Negatif Binom Regresyon Geleneksel negatif binom modeli, poisson-gamma karma dağılımından türetilmiştir. Yirmiden fazla gösterimi olan negatif binom regresyon modelinin genel formu: şeklinde verilebilir, burada 0 1 y 1 P( Y y x) y 0,1,... y! olan yayılım parametresidir. i 1 1i 1i y 1 () 3. Sıfır Değer Ağırlıklı (Zero-inflated) Regresyon Modelleri 199 yılında Lambert tarafından tanıtılan bu modeller, sıfırların sayısının çoğunlukta olduğu durumlarda verilerin modellenmesini sağlayan diğer bir yöntemdir. Bu modeller bağımlı değişkenin sıfır değeri için Bernoulli denemesi yapılarak belirlenen bir yoğunluk ve sıfır değerini de içeren sayım değerleri için kesikli bir i 1 i P( Si 0) yi 0 P( Y yi ) (1 i ) P( Si yi ) yi 0 (3) Burada S raslantı değişkenine ilişkin olasılıklar için herhangi bir kesikli dağılım seçilebilir. Genellikle Poisson ya da Negatif Binom dağılımı tercih edildiğinden modeller ZIP ve ZINB olarak adlandırılır. 4. Hurdle (Engelli) Model 16 Sıfır ağırlıklı modellere benzer bir model ise hurdle modeldir. İki bileşenin karması olan bu modelin birinci bileşeni sıfır sayımlara (0) karşı pozitif sayımları (1) gösteren binary cevapları; ikincisi ise yalnız pozitif sayımları içermektedir. Bernoulli denemeler ile kontrol edilen birinci bileşen sonucu pozitif sayımı gösterdiğinde

217 engel (hurdle) aşılarak, pozitif sayımların koşullu dağılımı olarak belirlenmiş sıfır değer-sınırlandırılmış (truncated) kesikli bir dağılım kullanılır. Binary kısım logit, probit veya complementary loglog kullanılarak modellenmektedir. Bu çalışmada logit bağ fonksiyonu ile ikinci kısım için Poisson ve Negatif Binom kesikli dağılımları tercih edilmiştir. P( Y y ), y 0 için modeller: Hurdle (P): (1 w) e i (1 e ) i i yi i y! şeklindedir. Burada w P(Y 0) 5. Uygulama i i i i i ve Hurdle (NB): y (1 i ) 1 i ( yi ) yi yi i 1 i i w y! i Türkiye için ekonomik değeri olan midye avcılığı ve yetiştiriciliği, midyenin enfekte olması durumunda önemli bir kayba uğramaktadır. Bu çalışmada döneminde Sinop ili İskele, Adabaşı ve Sarıada kıyı bölgelerinde yakalanan midyelerde görülen dominant bir parazit türü olan Nematopsis legeri sayısı ile midye kondisyon indeksi, su sıcaklığı, tuzluluğu, ph, Nitrit, Nitrat, Fosfat ölçümlerinin ilişkisinin modellemesi, verilerin %50 den fazlasının sıfır değerli olması sebebiyle, yukarıda tanıtılan sıfır ağırlıklı kesikli modeller ile yapılmıştır. Model kıyaslanmasında bilgi ölçütleri yanısıra Voung testinden faydalanılmıştır. İstatistiksel analizlerde R programı kullanılmıştır. KAYNAKLAR [1] Agresti, A. (1996), An Introduction to Categorical Data Analysis, USA, John Wiley & Sons. [] Hilbe, J.M. (011), Negative Binomial Regression, New York, Cambridge University Press. [3] Lawless, J.F. (1987), Negative binomial and mixed Poisson regression, The Canadian Journal of Statistics Vol. 15, No.3, [4] Zuur, A.F., Ieno, E.N., Walker, N.J., Saveliev, A.A., Smith, G.M. (009), Mixed Effects Models and Extensions in Ecology with R, Springer., ABSTRACT DETERMINATION OF FACTORS FOR THE DISTRIBUTION OF MUSSEL PARASITE NUMBERS USING ZERO-INFLATED REGRESSION MODELS Zero occurences of species counts appear in many ecological studies and for modelling purposes, new discrete models that account for such zero values should be preferred to the classical regression models. This study therefore aims to illustrate and compare the performances of some of the zero-inflated regression models: ZIP, ZINB, Hurdle-Poisson and Hurdle-Negative Binomial for the determination of important biotic and abiotic factors on the distribution of the most dominant parasite (Nematopsis legeri) counts, more than 50% of which is zero-valued, on mussels collected monthly during from the three coastal regions: Iskele, Adabası and Sarıada, of Sinop city. Model comparisons were performed via information criterion and the Voung test. Key Words: Poisson regression, Negative binomial regression, Zero-inflated regression model, Hurdle model 17

218 TÜKETİCİLERİN NAYLON POŞET KULLANIMINA İLİŞKİN TUTUM VE DAVRANIŞLARININ ARAŞTIRILMASI: ESKİŞEHİR İLİ ÖRNEĞİ Rana ŞEN DOĞAN Murat DOĞAN * Büşra AYKUT Duygu ÖZEN Eskişehir Osmangazi Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, ranasen07@gmail.com mrtdogan87@gmail.com duygu_ozenn@hotmail.com busra.aykut@hotmail.com.tr Araştırmanın Amacı ve Uygulanışı Naylon poşetleri kullanmaya bu kadar alışmışken doğaya ve canlılara verdiği zararlar nedeniyle kullanımını azaltmamız gereklidir. Naylon poşetlerin kullanımı, çevreye ve sağlığa verdiği zararlar nedeniyle bazı ülkelerde ve şehirlerde (San Francisco, Paris, Bangladesh, Londra, Kenya, Kanada, Çin, İsrail, Taiwan) insanların bilinçlendirilmesiyle hızla azalmaya başlamıştır. Alışverişten sonra market çıkışları, açık pazarlar ve AVM ler dikkatlice izlendiğinde gereksiz naylon poşet kullanımı görülmektedir. Alışverişlerde kullanılan naylon poşetler tekrar tekrar başka amaçlar için kullanılmalıdır. Sebze, meyve, et ürünleri naylon ambalaj içerisinde satın alınmamalı, naylon ambalaj yerine cam kavanozlar kullanılmalıdır. Günümüzde, bez torbaların eskisi kadar maliyetli olmadığı bilinen bir gerçektir. Bu nedenle artık alış verişe gelirken tüketicilerin yanlarına bez torbalarını getirmeleri, tekerlekli alışveriş çantası ve sepet kullanmaları tartışılmalıdır. Bu da tüketicilerin gereksiz naylon poşet kullanımı konusunda bilinçlenmesi ve alışveriş merkezlerinin topluca bu konuda geliştirecekleri politikalar ve motive edici kampanyalarla gerçekleşebilir. İstatistiksel Analiz Eskişehir il merkezinde bulunan Emek Mahallesi, Işıklar Mahallesi, Büyükdere Mahallesi, Hamamyolu, Doktorlar Caddesi, İkieylül Caddesi, Cengiz Topel Caddesi, Özdilek AVM, Espark AVM ve Kanatlı AVM den rassal olarak seçilen 31 bireye anket uygulanmıştır. Araştırmada SPSS paket programından yararlanılarak Eskişehir il merkezindeki ailelerin naylon poşet kullanma niyetleri 4 değişken ile açıklanmaya çalışılmıştır Anket yoluyla elde ettiğimiz verilere faktör analizi yapmadan önce 4 anket ile güvenilirlik testi yapılmıştır. Croncbachs Alpha (α) katsayısı ile güvenirlilik sağlanmıştır. Ölçek 5 li likert tipindedir. Güvenilirlik analizi 4 kişiye uygulanmıştır. Sonuçların güvenilir çıkmasından sonra rassal olarak seçilen 31 kişinin tümüne faktör analizi uygulanmıştır.5 li Likert ölçeğindeki seçenekler Kesinlikle Katılıyorum, Katılıyorum, Kısmen, Katılmıyorum ve Kesinlikle Katılmıyorum şeklindedir. Bulgular Katılımcılara market alışverişlerinden bir haftada ne kadar naylon poşet getirildiği sorulduğunda %, sinin hiç, %15.3 ünün 1-, %1. sinin 3-4, %15.3 ünün 5-6, %16, sinin 7-8, %1,8 inin 9-10 ve %17,11 inin 11 ve üzeri adet naylon poşet getirdiğini belirtmişlerdir. 11 ve üzeri naylon poşet kullanımı cevabı baz alındığında 1yılda minimum 57 adet naylon poşet kullanıldığı sonucuna ulaşılmaktadır. Maliyeti ise 0.71kr a denk gelmektedir. Pazar alışverişleri de bu hesaplamalara dâhil edildiğinde 11 ve üzeri poşet kullanımı için naylon poşetlerin maliyeti minimum 41.4kr a denk gelmektedir. Ailelerin üç kişi yaşadığı ve toplam alışverişlerinde 0 adet naylon poşet tükettikleri varsayıldığında Eskişehir İl Merkezinde bulunan Odunpazarı ve Tepebaşı nüfusuna göre 1 yılda 8,788, tl naylon poşet kullanımına harcanmaktadır. Bez torba kullandığımızda haftada 6 plastik torbayı kullanımdan çıkardığımız düşünüldüğünde ayda 4 torba, yılda 31 torba, ortalama bir yaşam sürecince(77 yıl) bin 04 torba eder. Ülkemizde her beş kişiden biri bunu yaparsa yaşamımız süresince 34 milyar 357 milyon 440 bin plastik torbadan kurtulmuş oluruz. KAYNAKLAR 1) Chung, S.,(008) Using plastic bag waste to assess the reliability of self-reported waste disposal data. Elsevier. Ss:8 ) Jayaraman, K., Haron, H., Sung, G. B., Lin, S.K., (011) 18 Consumer reflections on the usage of plastic bags to parcel hot edible items:an empirical study in Malaysia. Ss:18 3)Ohtomo, S., Ohnuma, S., (014) Psyhological interventional approach for reduce resource consumption: Reducing plastic bag usage at supermarkets. Ss:84

219 RESEARCHING CONSUMER ATTITUDES AND BEHAVIOR RELATED TO THE USE OF PLASTIC BAGS: THE CASE OF ESKİŞEHİR We are used to use so much nylon bag. We should reduce the use of nylon bags because of damaging nature and biology.survey was randomly selected 31 individuals from street Emek,Işıklar,Büyükdere,etc in Eskişehir. The results were explained by 4 variables. Safety testing was conducted by 4 survey before factor analysis.cronbach's'alph A reliability coefficient of was achieved When asking participants how many nylon bag was used in a week in market shopping, assuming that the answer 11 and over nylon bags that means min.57 nylon bags are used in one year. The cost corresponds to 0.71 piastre. When sunday shopping also is included in these calculations of 11 and above,total cost of the use of nylon bags is equal to min piastre. Key Words: Unnecessary Use Of Plastic Bags, Factor Analysis, Cloth Bag 19

220 SESSION 6 ZAMAN SERİLERİ 0

221 ÇOK DEĞİŞKENLİ ZAMAN SERİLERİNDE, SANAYİ ÜRETİM ENDEKSLERİ ÜZERİNDEN, BİR KISA DÖNEM VE UZUN DÖNEM UYGULAMASI Engün Aksüt Çalışmada, Çok Değişkenli Zaman Serilerinde Kısa Dönem Ve Uzun Dönem İlişkileri hakkında bilgi verilmiştir. Verilen teorik bilgiler bir uygulama ile hayata geçirildi. Uygulama Almanya, Fransa ve Türkiye için aylık olarak takip edilen Sanayi Üretim Endeks serileri üzerinden yürütüldü. Serilerin analizinde uzun dönemli hareketler için Eşbütünleşme Testi kullanıldı. Serilerin kısa dönemli hareketleri için Nedensellik Testi kullanıldı. Uygulama için, 005 Ocak ile 015 Haziran ayları arasındaki (16 dönemlik) Almanya Sanayi Üretim Endeksi (ASÜE), Fransa Sanayi Üretim Endeksi (FSÜE) ve Türkiye Sanayi Üretim Endeksi (TSÜE) serileri kullanıldı. Analizler sonucunda ASÜE, FSÜE ve TSÜE serileri arasındaki uzun dönem ve kısa dönemli ilişkiler ortaya çıkarıldı. Sonuçlar Aksüt,01 çalışması ile birlikte değerlendirildi. Aksüt, 01 çalışmasından sonraki 45 aylık vadede ortaya çıkan yeni durum değerlendirildi. Yapılan değerlendirmelere göre, Almanya, Fransa ve Türkiye arasındaki sanayi sektörü ilişkileri ortaya çıkartıldı. Ortaya çıkarılan ilişkiler ışığında, Türkiye nin Avrupa Birliği (AB) üyelik sürecindeki uyumu yorumlandı. Anahtar Sözcükler: Çok değişkenli zaman serileri, uzun dönem, kısa dönem, Sanayi Üretim Endeksi (SÜE), Eşbütünleşme Testi, Nedensellik Testi 1

222 KAOTİK ZAMAN SERİLERİ ANALİZİ: BIST100 ENDEKSİ Ayşe İŞİ*, Fatih ÇEMREK** 1. Giriş * Gazi Üniversitesi, P.Sosyal Bilimler MYO, Gölbaşı Yerleşkesi/Ankara, isiayse@gmail.com **Eskişehir Osmangazi Üniversitesi Meşelik Kampüsü İstatistik Bölümü /Eskişehir fcemrek@gmail.com Sözlük anlamı, karışıklık, kargaşa olan kaos kavramının bilim dünyasında pek çok tanımı olmasına karşın kaotik verilerin modellenmesine esas teşkil edecek kaos tanımı, Gleick [1] in düzenli bir düzensizlik ifadesidir. Kaotik sistemlerin en önemli özellikleri, ünlü meteorolog Lorenz tarafından ortaya konan başlangıç koşullarına hassas bağlılık göstermeleri ve Mandelbrot tarafından tanımlanan fraktal yapıya sahip olmalarıdır. Başlangıç koşullarına hassas bağlılık gösteren ve fraktal yapıya sahip bir zaman serisinin kaotik yapısının ortaya konması için öncelikle serinin doğrusal olup olmadığının incelenmesi daha sonra da dinamik sistemlerin resimleri olarak tanımlanan çekicilerin konumlandığı faz uzayının yeniden yapılandırılması için zaman gecikmesinin ve gömülü boyutun belirlenmesi gerekmektedir. Son olarak da Korelasyon boyutu ve Lyapunov üstelleri incelenerek serinin kaotikliği konusunda bilgi sahibi olunmaktadır. Bu çalışmanın amacı, söz konusu kaotik incelemelerin ampirik çalışmalarda nasıl kullanılacağını BIST100 endeksi kapanış değerleri üzerinde uygulayarak anlatmaya çalışmaktır.. BIST 100 Zaman Serisinin Kaotik İncelemesi dönemini içeren 1135 gözlemlik BIST100 kapanış endeksi değerlerine ilişkin Şekil.1 de verilen zaman serisi grafiği incelendiğinde serinin doğrusal olmayan bir yapıya sahip olduğu görülmektedir. Ayrıca BDS testi ile serinin doğrusallığı incelenmiş ve serinin doğrusal olmayan bir yapıya sahip olduğu belirlenmiştir. Şekil 1. BIST100 Serisinin Zaman Grafiği Doğrusal olmayan dinamik sistemler için en uygun zaman gecikmesi, Fraser ve Swinney []tarafından önerilen ortalama karşılıklı bilgi (Avarage Mutual Information) yöntemi ile belirlenmektedir. BIST100 serisi için zaman gecikmesinin bir fonksiyonu olan I I(T ) ortalama karşılıklı bilgi değeri 0. gecikmede ilk minimum değerini aldığından optimum gecikme değeri ( ) 0 olarak tahmin edilmiştir (Şekil ). Şekil. T=0,1,,50 için Ortalama Karşılıklı Bilgi Grafiği Kaotik bir sistemin gömülü boyutunu belirlemek için Kennel, Brown ve Abarbanel [3] tarafından geliştirilen Yanlış En Yakın Komşular (False Nearest Neighbours) yöntemi kullanılmaktadır. BIST100 serisi için

223 en yakın komşu değeri 6. ve 7. gecikme civarında sıfıra yaklaştığından en uygun gömülü boyut değeri, m=6 olarak tahmin edilmiştir ( Şekil 3). Şekil 3. m=1,,10 için Yanlış En Yakın Komşu Grafiği Grassberger ve Procassia (1983) tarafından önerilen korelasyon boyutu, bir çekicinin fraktal boyutunun belirlenmesi için kullanılmaktadır [4]. Kaotik sistemler için korelasyon boyutu genel olarak birden büyük olmakta ve kesirli değerler almaktadır. BIST100 serisinin korelasyon boyutu değerlerinin birden büyük ve kesirli değerler aldığı görülmektedir (Şekil 4). Şekil 4. m=1,,10 için Korelasyon Boyutu Grafiği Bir zaman serisinin kaotik olduğunun kesin olarak belirlenmesi için Lyapunov üstelleri kullanılmaktadır. En büyük Lyapunov üsteli ( ) pozitif olduğunda, sistem kaotik olmaktadır. BIST100 serisi için hesaplanan max en büyük Lyapunov üsteli 083 olarak tahmin edilmiştir. max 0, Analiz sonuçları, BIST100 zaman serisinin deterministik kaos yapısına sahip olduğunu göstermektedir. KAYNAKLAR [1] Gleick, James, 1995, (Çev. Fikret Üçcan), TÜBİTAK. [] Fraser, A. M. and Swinney, H. L.,1986, Independent Coordinates for Strange Attractors from Mutual İnformation. Physical Reviews A, 33, [3] Kennel, M.B., Brown,R., and Abarbanel,H.D.I.,199, Determining Embedding Dimension for Phase- Space Reconstruction Using a Geometrical Construction, Physical Review A, 45(6), [4] Gkana,A. and Zachillas, L., (015), Sunspot Numbers: Data Analysis, Predictions and Economic Impacts, Journal of Engineering Science and Technology Review, 8(1), ABSTRACT CHAOTIC TIME SERIES ANALYSIS: BIST100 INDICES We analyze the daily BIST100 Indices closed values from to for the chaotic analysis. We use the BDS test to nonlinearity analysis and use Avarage Mutual Information Criteria, False Nearest Neighbours methods to determine the optimum embedding parameters for the recurrence phase space. Also we calculate correlation dimension and Lyapunov exponents. The positive maximal Lyapunov exponent and the results of other analysis indicate that the daily BIST100 closed values is a chaotic time series. Key Words: Chaos, Chaotic time series analysis, BIST100 Indices. 3

224 KESİRLİ SIKLIKLI ESNEK FORM FOURİER BOOTSTRAP BİRİM KÖK TESTİ Furkan EMİRMAHMUTOĞLU Gazi Üniversitesi İ.İ.B.F Ekonometri Bölümü Beşevler/Ankara Tolga OMAY Çankaya Üniversitesi Bankacılık ve Finans Bölümü, Ankara 1. Giriş Literatürde serilerdeki çoklu yumuşak geçişli kırılmaların modellenmesi üzerinde pek çok yöntem geliştirilmiştir. Becker vd. (006), Enders ve Lee (01a,b) ve Rodrigues ve Taylor (01) tarafından çoklu yumuşak geçişli kırılmalar Esnek Form Fourier (FFF) Dönüşümler yardımıyla modellenmiştir. Fourier yaklaşımı ile bilinmeyen yapıdaki deterministik trend fonksiyonunun davranışı yansıtılabilmektedir. Fourier yaklaşımının avantajı kırılmaların anlık veya yumuşak geçişli olup olmadığına aldırmayan kukla değişken yöntemlerinden (örneğin Perron (1989, 1997) gibi) daha iyi çalışmakta ve kırılmaların tipi, sayısı ve zamanının seçimi gibi problemlerden kaçınmaktadır. Fourier yaklaşımını ele alan yukarıdaki çalışmalarda fourier frekansının tam sayı olduğu varsayılarak birim kök testleri geliştirilmiştir. Öte yandan Omay (015) Enders ve Lee (01b) nin birim kök testi yaklaşımını Becker vd. (004) ün Trig-testini dikkate alarak kesirli sıklıklı esnek formda fourier birim kök testi olarak geliştirmiştir. Omay (015) yeni geliştirdiği kesirli sıklıklı esnek formda fourier (FFFFF) birim kök testinin sınırlı veri kümesinde Enders ve Lee (01b) den daha güçlü olduğunu göstermiştir. Bu çalışmada Chang ve Park (003) tarafından geliştirilen Sieve Bootstrap yöntemi kullanılarak Omay (015) in kesirli sıklıklı esnek form fourier birim kök testinin bootstrap versiyonu önerilmiştir. Önerilen bootstrap birim kök testinin sınırlı veri kümesinde testin I. tip hata olasılığı ve gücü incelenmiştir.. FFFFF li Birim Kök Testi etmektedir. Omay (015) aşağıda verilen regresyon eşitliğini kullanarak H : 1 0 birim kök yokluk hipotezini test * * p k t k t yt t 1 sin 1 cos yt 1 jyt j t T T j1 Burada (1) * k kesirli fourier frekansı göstermektedir ve Becker vd. (004) tarafından önerilen trig-test yöntemiyle tahmin edilmektedir. H : 1 0 yokluk hipotezini test etmek için gereken kritik değerler Omay (015) çalışmasında yer almaktadır. Bu çalışmada Omay (015) ten farklı olarak test istatistiğinin ( t ˆ ) ampirik dağılımı Chang ve Park (003) tarafından önerilen Sieve Bootstrap yöntemi kullanılarak elde edilecektir. 3. Sınırlı Örnek Performansı Sieve Bootstrap yaklaşımına dayanan FFFFF birim kök testi için sınırlı veri kümesinde testin I. tip hata olasılığı ve gücünün incelenmesi için aşağıda verilen veri üretim süreci (DGP) kullanılmıştır. * * k t k t yt 1sin 1cos xt () T T 4 x x u (3) t t 1 t u 0.4u ~ iid N(0,1) t t1 t (4) t

225 DGP de 1 3 ve 1 5 olarak atanmıştır. Aynı zamanda testin I. tip hata olasılığı için 1, güç için * ise 0.9 alınmıştır. k değerleri ise 1.1 den başlayarak 1.9 a kadar alınmıştır. Testin sınırlı örneklerde performansını incelemek için 5000 simülasyon deneyi yapıldı ve her simülasyon deneyinde de 999 bootstrap tekrarı kullanılarak kritik değerler elde edilmiştir. Sabit Terimli Sabit Terim ve Trendli I. Tip Hata Güç II. Tip Hata k * /T KAYNAKLAR [1] Becker, R., Enders, W., Hurn, S. (004), A General Test for Time Dependence in Parameters. Journal of Applied Econometrics, 19, [] Chang Y., Park J.Y. (003), A Sieve Bootstrap for The Test of A Unit Root, Journal of Time Series Analysis, 4(4), [3] Enders, W., Lee, J. (01b), The flexible Fourier form and Dickey Fuller Type Unit Root Tests, Economics Letters, 117, [4] Omay T. (015), Fractional Frequency Flexible Fourier Form to Approximate Smooth Breaks in Unit Root Testing, Economics Letters, 134, ABSTRACT A BOOTSTRAP UNIT ROOT TEST USING FRACTIONAL FREQUENCY FLEXIBLE FOURIER FORM In this study, we propose a unit root based on the sieve bootstrap methodology for Fractional Frequency Flexible Fourier Form DF-type unit root test proposed by Omay (015). Proposed test has good size and power properties. Key Words: Fractional Frequency Flexible Fourier Form, Structural break, Nonlinear trend, Sieve Bootstrap 5

226 YILLIK SICAKLIK ANOMALİLERİNİN MODELLENMESİ Hülya ŞEN 1, Hakkı POLAT 1 Yrd.Doç. Eskişehir Osmangazi Üniversitesi İstatistik Bölümü Doktora Öğrencisi Eskişehir Osmangazi Üniversitesi İstatistik Bölümü 1 hsen@ogu.edu.tr, hakkiplt@gmail.com 1.Günlük Sıcaklık Anomalilerinin Modellenmesi Sıcaklık anomalileri, küresel iklim değişikliğinin önemli göstergelerinden biridir. Bu nedenle iklimbilimciler açısından bu anomalilerin analiz edilmesi ve modellenmesi önemlidir. Bu anomalilerin sebepleri ve diğer etkenlerle ilişkisi bazı çalışmalarda araştırılsa da sahip olduğu karakteristikleri doğrudan istatistiksel yöntemler ile açıklamaya çalışan araştırma sayısı çok azdır. Bu çalışmada, Amerikan Uzay ve Havacılık Dairesi (NASA) tarafından dünyanın birçok yerinde günlük olarak ölçülen sıcaklık anomalilerinin modellenmesine çalışılmıştır. Çalışma sonucunda, Engle (198) tarafından bulunan Otoregresif Koşullu Değişen Varyans (ARCH) modelinin sıcaklık anomalilerin zamana bağlı olarak değişen varyansını modellemede de başarılı olduğu görülmüştür. Meydana gelen sıcaklık anomalilerinin altında yatan sebepleri araştırmak için literatürde birçok çalışma yapılmıştır. Bu çalışmaların çoğu sıcaklık anomalilerinin altında yatan temel sebep olarak sera gazları etkisini göstermektedir (Boer vd., 199; Hegerl vd., 1996; Shindell vd., 1999; Houghton ve Callander, 199; Boer vd., 000; Watson vd., 1996). Söz konusu anomalilerin birçok farklı etkisinin olduğu yapılan çalışmalarda gösterilmiştir. Anomalilerin, olağandışı sıcaklık artışlarına (Schär vd., 004) yada azalışlarına (Shindell vd., 1999), yağış rejimlerinde değişikliklere (Reason ve Mulenga, 1999), fırtına yada hortum gibi güçlü ve yıkıcı hava olaylarına (Timmermann, vd., 1999) yada atmosfer katmanlarındaki iklim karakteristiklerinin değişmesine (Chiang ve Sobel, 00) yol açtığı söylenebilir. Etkilerinin çok farklı ve küresel boyutta olmasından dolayı söz konusu anomalilerin modellenmesi ve iyi analiz edilmesi son derece önemlidir ve literatürde bu yönde yapılmış gerçek ve simülatif birçok çalışma da mevcuttur. Reynolds (1988), okyanus ve yüzey sıcaklarında meydana gelen anomalileri gerçek zamanlı verileri dikkate alan bir modelle açıklamaya çalışmıştır. Bunun yanında temel istatistiksel yaklaşımları dikkate alan çalışmalarda mevcuttur. Diodato, vd., (013), İtalya ve Adriyatik denizi civarındaki ölçüm istasyonlarından elde edilen uzun dönemli sıcaklık anomali verilerini analiz ederek lineer olmayan bir regresyon modeli ile modellemeyi başarmışlardır. Tatlı ve Şen (1998) Türkiye için Kandilli Rasathanesinden elde edilen günlük en yüksek sıcaklık değerlerini dikkate alarak zaman serileri analizlerinin dışında alternatif bir bulanık modelleme yaklaşımı ile modellemeye çalışmışlardır. Söz konusu zamana bağlı bir değişkenin analiz edilmesi olduğunda zaman periyodunu mümkün olduğunca geniş almakta fayda vardır. Efstathiou, vd., (011), yılları arasında okyanus yüzeyinde meydana gelen sıcaklık anomalilerini baz alan temel zaman serileri yaklaşımlarını kullanarak trend etkisini araştırmış ve çalışmaları sonucunda trend etkisini gideren bir model önermişlerdir. Kärner ve Freitas (010) ise kısa dönemli modeller yerine uzun dönemli etkileri içeren bir analiz önererek yılları arasındaki sıcaklık anomalilerini Box&Jenkins metodu ile modellemişlerdir. Yapılan çalışmalar çok farklı yaklaşımlar ve varyasyonlar içerse de hiç biri söz konusu anomaliler için zamana bağlı koşullu olarak değişen varyansı açıklamak için bir model önermemişlerdir. Bu çalışma; Amerikan Uzay ve Havacılık Dairesinin (NASA) sıcaklık anomalilerini ölçen Goddard Uzay Araştırmaları Enstitüsü (Goddard Institute for Space Studies (GISS)) tarafından derlenen arası kara yüzey sıcaklık anomalilerini Engle (198) tarafından temeli atılan ve daha sonra birçok varyasyonu geliştirilen ARCH&GARCH modelleri ile modelleyecektir. Çalışma söz konusu veriler için böyle bir yaklaşımı kullanması açısından literatürde bir ilk olma özelliğini taşımaktadır. Öncelikli olarak Yıllık Küresel Sıcaklık Anomalilerini içeren serinin kartezyen grafiği aşağıda verilmiştir. Şekil.1 incelendiğinde grafiğin sürekli olarak artan bir trende sahip olduğu görülecektir. Özellikle 1970 li yıllardan sonraki trenddeki bu artışın daha da belirginleştiği ve 010 yılına yaklaşıldığında zirve yaptığı görülecektir. Bu aşamadan sonra elde edilen ARCH&GARCH modeline ilişkin veriler Tablo.1 de verilmiştir. Tablo.1 incelendiğinde ARCH&GARCH modellerinin küresel yıllık sıcaklık anomalilerini modellemekte başarılı oldukları söylenebilir. Model Akaike Hata Kriteri Schwarz Hata Kriteri GARCH(1,1) -1,38-1,5 GARCH(0,) -1,31-1,18 E-GARCH(1,) -1,3-1,15 Tablo 3.ARCH&GARCH Model Sonuçları 6

227 1. Global Annual Temperature Anomalies KAYNAKLAR Şekil Yılları Arası Yıllık Küresel Sıcaklık [1] Boer, G. J., Flato, G., & Ramsden, D. (000). A transient climate change simulation with greenhouse gas and aerosol forcing: projected climate to the twenty-first century. Climate Dynamics, 16(6), [] Boer, G. J., McFarlane, N. A., & Lazare, M. (199). Greenhouse gas-induced climate change simulated with the CCC second-generation general circulation model. Journal of Climate, 5(10), [3] Bollerslev, T. (1986). Generalized autoregressive conditional heteroskedasticity. Journal of econometrics, 31(3), [4] Chiang, J. C., & Sobel, A. H. (00). Tropical tropospheric temperature variations caused by ENSO and their influence on the remote tropical climate. Journal of climate, 15(18), [5] Diodato, N., Bellocchi, G., Bertolin, C., & Camuffo, D. (013). Mixed nonlinear regression for modelling historical temperatures in Central Southern Italy. Theoretical and applied climatology, 113(1-), [6] Efstathiou, M. N., Tzanis, C., Cracknell, A. P., & Varotsos, C. A. (011). New features of land and sea surface temperature anomalies. International journal of remote sensing, 3(11), [7] Engle, R. F. (198). Autoregressive conditional heteroscedasticity with estimates of the variance of United Kingdom inflation. Econometrica: Journal of the Econometric Society, [8] Hegerl, G. C., von SToRcH, H., Hasselmann, K., Santer, B. D., Cubasch, U., & Jones, P. D. (1996). Detecting greenhouse-gas-induced climate change with an optimal fingerprint method. Journal of Climate, 9(10), [9] Houghton, J. T., & Callander, B. A. (199). Climate change 199: the supplementary report to the IPCC scientific assessment. Cambridge University Press. [10] Kärner, O., & de Freitas, C. R. (01). Modelling long-term variability in daily air temperature time series for southern hemisphere stations. Environmental Modeling & Assessment, 17(3), 1-9. [11] Lai Y.J. and Hwang C.L. (199), Fuzzy Mathematical Programming, Berlin-Heidelberg, Springer-Verlag [1] Reason, C. J. C., & Mulenga, H. (1999). Relationships between South African rainfall and SST anomalies in the southwest Indian Ocean. International Journal of Climatology, 19(15), [13] Reynolds, R. W. (1988). A real-time global sea surface temperature analysis. J. of climate, 1(1), [14] Schär, C., Vidale, P. L., Lüthi, D., Frei, C., Häberli, C., Liniger, M. A., & Appenzeller, C. (004). The role of increasing temperature variability in European summer heatwaves. Nature, 47(697), [15] Shindell, D. T., Miller, R. L., Schmidt, G. A., & Pandolfo, L. (1999). Simulation of recent northern winter climate trends by greenhouse-gas forcing. Nature, 399(6735), [16] Tatli, H., & Sen, Z. (1999). A new fuzzy modeling approach for predicting the maximum daily temperature from a time series. Journal of Engineering and Environmental Science, 3, [17] Timmermann, A., Oberhuber, J., Bacher, A., Esch, M., Latif, M., & Roeckner, E. (1999). Increased El Niño frequency in a climate model forced by future greenhouse warming. Nature, 398(679), [18] Watson, R. T., Zinyowera, M. C., & Moss, R. H. (1996). Climate Change 1995 impacts, adaptations and mitigation of climate change: Scientific-technical analysis. Cambridge University Press. MODELLING ANNUAL GLOBAL TEMPERATURE ANOMALIES Temperature anomalies an important indicator for global climate changes. Therefore modelling and analyzing this anomalies is important for climate researchers. Although some researches explain behavior and relationship with other effect, modelling and directly analyzing by the statistical methods is very rare for thus anomalies. In this study, working to analyze, annual global temperature anomalies, recording by National Aeronautics and Space Administration (NASA) from all around the world. Finally it is spotted that, trials 7 successful for modelling thus anomalisms conditional variances by ARCH model family which developed by Engle (198). Key Words: Annual Global Temperature Anomalies, Climate Changes, Time Series Analysis, Volatility Models

228 SESSION 6 GÜVENİRLİK 8

229 COHEN KAPPA NIN META ANALİZİ VE BİR TANI TESTİ UYGULAMASI Davut CANLI Ordu Üniversitesi Fen Edebiyat Fakültesi Matematik Bölümü 500, ORDU Yüksel TERZİ Ondokuz Mayıs Üniversitesi Fen Edebiyat Fakültesi İstatistik Bölümü 55139, SAMSUN Spearman (1904) tarafından ortaya atılan klasik test teorisine göre gözlenen puan, X gerçek puan, T ile ölçüm kaynaklı hata puanının e toplamı olarak ifade edilir (X = T + e) [3]. Güvenilirlik ise bu teoriye dayalı olarak gerçek puan varyansının gözlenen puan varyansına oranı olarak tanımlanır. Literatürde ölçümlerin güvenilirliğini tahmin etmeye olanak veren birçok farklı istatistik mevcuttur. Cohen Kappa, κ güvenilirlik katsayısı da bahsi geçen istatistikler arasında yer alan çok önemli ve geniş kullanım alanına sahip bir istatistiktir [4]. İlk olarak Jacob Cohen (1960) tarafından ortaya atılan katsayı, iki kategorili nitel bir değişken için iki puanlayıcı arasındaki karşılıklı uyumun güvenilirliğini tahmin etmede kullanılır []. Şansa bağlı uyumun hesaba katılması sebebiyle benzer uyum katsayıları ile karşılaştırıldığında daha sağlam sonuçlar verdiği düşünülmektedir. κ katsayısı, matematiksel olarak p 0 gözlenen uyumu ve p c şansa bağlı beklenen uyumu göstermek üzere (1) deki gibi bulunur. κ = p 0 p c 1 p c (1) Meta analizi ise son günlerde popülerliği gittikçe artan, farklı yer ve zamanda yürütülmüş benzer çalışmaların sistematik olarak derlenip toplanmasına ve bu çalışmalardan elde edilen sonuçların birleştirilip daha genel bir sonuç elde etmeye ve yorumlamaya olanak veren istatiksel bir yöntem bilimidir. Çalışmalardan elde edilen özet istatistikler meta analizinde etki büyüklüğü olarak adlandırılır [1]. Bahsi geçen etki büyüklüklerinin güven katsayıları olarak ele alınması halinde özel bir takım yöntemler ile meta analiz çalışması sürdürülebilmektedir. Güven katsayılarına bu meta analitik yaklaşımların uygulanması yıllar öncesine dayansa da Vacha-Haase (1998), tarafından literatürde güvenilirlik genelleştirmesi olarak kavramlaştırılmış ve sonrasında bu tür çalışmalar bu kavram ile de anılmaya başlanmıştır. Vacha-Haase, çalışmasında ayrıca bu tür meta analitik yaklaşımların güven katsayılarına uygulanmasına üç ana neden göstermiş ve bu nedenleri şu şekilde belirtmiştir. Güvenilirlik genelleştirmesi, (a) çalışmalarda verilen bir test için puanların karakteristik güvenilirliğini, (b) verilen ölçümler için güven katsayılarındaki değişkenliğin miktarını ve (c) çalışmalardan elde edilen güven katsayılarındaki değişkenliğin kaynaklarını saptamada kullanılır [5]. Bu çalışmada, κ güvenilirlik katsayısına ilişkin meta analitik yöntemler tanıtılmış ve katsayının güvenilirlik ölçütü olarak yer aldığı belirli bir tanı testine uygulaması yapılmıştır. Sistematik tarama sonucu ile tanı testinden elde edilen κ tahminleri birleştirilerek testin karakteristik güvenilirliği saptanmaya çalışılmış, güven katsayılarının çalışmadan çalışmaya gösterdiği değişkenlik ölçülmüş ve değişkenliğin kaynakları araştırılmıştır. Son olarak mevcut bulgular üzerine yorumlama yapılmıştır. Anahtar Kelimeler: Cohen Kappa, Puanlayıcılar arası güvenilirlik, Meta-analizi, Güvenilirlik genelleştirmesi KAYNAKLAR [1] Borenstein M., Hedges L. V., Higgins J. P. T. & Rothstein H. R., Meta-Analize Giriş Çev. Serkan Dinçer. Anı Yayıncılık, Ankara [] Cohen J. (1960), A Coefficient of Agreement for Nominal Scales, Educational and Psychological Measurement 0: [3] Spearman C. E. (1904), The proof and measurement of association between two things The American Journal of Psychology, 15(1),

230 [4] Sun S. (011), Meta Analysis of Cohen s Kappa, Health Services and Outcomes Research Methodology, Springer-US. [5] Vacha-Haase T. (1998), Reliability generalization: exploring variance in measurement error affecting score reliability across studies, Educational and Psychological Measurement, 58, 6-0. ABSTRACT META ANALYSIS OF COHEN S KAPPA AND AN APPLICATION OF A DIAGNOSTIC TEST In this study, the Meta analytic methods for the reliability coefficient, κ was introduced and an application of a specific diagnostic test reporting κ coefficient as an estimate of reliability was performed. After a systematic review, the collected estimates of κ obtained by this diagnostic test was combined and analyzed to characterize the typical reliability of the test scores, the amount of the variability in reliability coefficients and the sources of the existing variability. Finally, an interpretation on present findings was given. Key Words: Cohen s Kappa, Inter-rater reliability, Meta-analysis, Reliability generalization 30

231 1. Giriş ETKİ-TEPKİ MODELİ İÇİN YENİ BİR GÜVENİLİRLİK SKORU Gökhan GÖKDERE, Mehmet GÜRCAN Fırat Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 3119, Elazığ, Türkiye Teknik sistemlerin güvenilirliği modern bilimin geldiği bugünkü noktada önemli araştırma konularının başında gelmektedir. Son zamanlarda yapılan birçok çalışmada bu problem belirlenen bir veya birkaç etki altında çalışan makinenin çalışma performansının değerlendirilmesi ve sonrasında sistem için bir çalışma endeksinin hesaplanmasıyla çözülmektedir. Bu noktada X Y çalışmada konuya önemli bir farklılık katacak olan nokta X Y Pr olasılığı temel olarak alınmaktadır. Yapılan bu Pr olasılığının yerine Kullback- Leibler divergence kullanılmasıdır. Çok durumlu sistem modellerinde sistem ve sistemi oluşturan bileşenlerin seviyeleri 0,1,,,M olabilen M+1 olası durumda olabilir. Burada 0 tamamen arızalı durumu, M mükemmel çalışan durumu ve diğerleri farklı seviyelerdeki çalışma durumlarını göstermektedir. Aslında, iki ayırt edici özelliğe sahip (mükemmel çalışan ve tamamen arızalı) ikili sistem çok durumlu sistemin en basit bir durumudur. İkili sistemde, her bir bileşen ve sistemin durum uzayı {0,1} olarak kabul edilir. Etki-dayanıklılık modelleri güvenilirlik analizinde özel bir önem taşımaktadır. Etki- dayanıklılık modellerinde hem sistemin dayanıklılığını gösteren Y hem de sisteme uygulanan etkiyi gösteren X tesadüfî değişken olarak ele alınır. Sistemin güvenilirliği, P X Y FxdGx G xdfx (1) şeklinde ifade edilmektedir. Burada Fx PX x, Gx PY x ve Gx Gx 1 dir. Literatürde etki-dayanıklılık modelleri üzerine yapılmış birçok çalışma mevcuttur [1]. Kullback-Leibler divergence (KLd), iki tesadüfi değişkenin dağılımları arasındaki uzaklığı ölçmek amacıyla kullanılmaktadır []. P ve Q nun yoğunluk fonksiyonları sırasıyla p x ve q x olmak üzere P den Q nun KLd si aşağıdaki gibi elde edilir: p x D KL PQ p x log dx. () qx Burada, D KL PQ 0 ve DKLPQ DKLQP dir.. Yeni Güvenilirlik Skoru G t Bu bölümde, sisteme uygulanan etkilere karşı ortaya çıkan ve zaman geçtikçe azalan x t Y t tepkisinin sürekli P Y x kümülatif dağılım fonksiyonuna sahip olduğu ve zaman içerisinde sabit 1 F x P X x, l 1, etkilerinin de sürekli X ve X l l dağılım fonksiyonuna sahip bağımsız aynı dağılımlı oldukları kabul edildi. Weibull süreci, zaman içerisinde değişen olayları modellemede kullanışlı olduğundan x G t x 1 exp, t x 0 (3) ve x F 1 exp l x, x 0 l 31 (4) olarak ele alındı. Bu varsayımlar altında (1), (3) ve (4) kullanılarak güvenilirlik fonksiyonu 1 Rl t PX l Yt 1 t, t 0 (5) l

232 t şeklinde hesaplanabilir. Y den X l nin KLd sini hesaplayabilmek için (3) ve (4) ün olasılık yoğunluk fonksiyonları () de kullanılırsa t l D log 1 KL Y t X l (6) t l c elde edilir. (5) ve (6) da t alınırsa sırasıyla t 1 tl c Rl t ve D log 1 1 t c KL Y t X l l c tl olur. Yukarıda verilen eşitliklerde ilk olarak c, t, ve parametrelerinin seçilmiş değerleri için tablolar t oluşturulup ve daha sonra da tablo değerleri için t t u 1 u l 1 t 1 1 t eşitliği kullanılırsa yeni bir güvenilirlik skoru elde edilebilir. Yukarıda verilen eşitlikte t 1 D 1 KL Y X 1, t1 t t t t 1 1, t t, t, t t 0 1 0, t t1 t t 0, t u t u1, 0, l supt DKL Y X l olarak ele alındı. Ayrıca 1 değerlerinin sıfıra eşit oldukları anlar olarak kabul edildi. KAYNAKLAR 0 ve t vet sırasıyla 0 D KL Y t ve Y t [1] Kotz S., Lumelskii Y. and Pensky M. (003), The Stress-Strength Model and its Generalizations. Theory and Applications, Singapore: World Scientific. [] Kullback S. and Leibler R. A. (1951), On information and sufficiency. Ann.Math.Statist. X 1 D KL X ABSTRACT NEW RELIABILITY SCORE FOR STRESS-STRENGTH MODEL The reliability of technical systems is one of the most important research subjects in the point reached by modern science today. In many recent studies this problem is solved by evaluating the operation performance of determined one or more machines operating under stress and then calculating an operation index. At this point, Pr X Y is taken as a basis. In this study the point that will add an important difference to the subject is Pr X Y. that Kullback- Leibler Divergence will be used instead of Key Words: Stress-Strength model, Multi-state systems, Kullback-Leibler divergence. 3

233 İKİ-BAĞIMLI-BİLEŞENLİ KARARLI YEDEĞE ANAHTARLAMA İLE GEÇİŞ YAPAN SİSTEMİN GÜVENİRLİK ÖZELLİKLERİ Mehmet YILMAZ a, Muhammet BEKÇİ b, Birol TOPÇU c a Ankara Üniversitesi Fen Fakültesi İstatistik Bölümü, Tandoğan,ANKARA, b Cumhuriyet Üniversitesi, Fen Fakültesi, İstatistik Bölümü, SİVAS c Namık Kemal Üniversitesi, Tıp Fakültesi, Biyoistatistik Anabilim Dalı, TEKİRDAĞ 1. Giriş yilmazm@science.ankara.edu.tr, mbekci@cumhuriyet.edu.tr, topcubirol@gmail.com Parçanın yaşam zamanı ile birlikteliği olan bir diğer yaşam zamanlı parçanın oluşturduğu paralel sisteme anahtarlama yapılarak bir sistem oluşturulmaktadır. Bu sisteme göre, anahtar I konumunda iken parçanın sadece kendisi verilen işlevi yürütmek ile görevlendirilmiştir. Anahtar II konumunda iken birlikteliği olan bir diğer parça ile paralel bağlı olacak biçimde verilmiş olan işlevi yürütmektedirler (bkz. Şekil1). Şekil 5 Anahtar ile bağımlı paralel sisteme geçiş. Sistemin Yapısının Oluşturulması Asıl parçanın (A) yaşam zamanı T 1, sisteme sonradan dahil olan parçanın (B) yaşam zamanı T olmak üzere, bu iki yaşam zamanının ortak yaşam fonksiyonu Farlie- Gumbel- Morgenstern dağılım ailesinden geldiği varsayılmaktadır. S(t 1, t ) = Pr(T 1 > t 1, T > t ) ve S i (t i ) = 1 Pr(T i t i ) = 1 F i (t i ) (i = 1,) biçiminde tanımlanmak üzere, S(t 1, t ) = S 1 (t 1 )S (t )[1 + αf 1 (t 1 )F (t )], t i > 0, α [ 1,1] (1) (T 1, T ) rasgele vektörünün yaşam fonksiyonunu temsil etmektedir (Morgenstern, 1956, Gumbel, 1960). Burada α birliktelik parametresini göstermektedir. Parçaların yaşam zamanları sırası ile θ i ortalamalı üstel dağılım olarak ele alınmıştır. Anahtarın konumunu (I ve II) belirleyen ve ikili değer alan rasgele değişken D D = { 1, Pr(D = 1) = λ 0, 1 λ şeklinde tanımlansın. Bu rasgele değişken parçaların çalışma zamanlarından bağımsız olarak değer almaktadır yani anahtarın konumunu değiştirmesi parçaların çalışma durumlarından bağımsızdır. Sistemin yaşam zamanı ise T sistem rasgele değişkeni ile ifade edilsin; T sistem = DT 1 + (1 D)max{T 1, T } Sistemin yaşam fonksiyonu, S(t) = Pr(T sistem > t) = Pr(DT 1 + (1 D)max{T 1, T } > t) = Pr(T 1 > t D = 1)Pr(D = 33 1) + Pr(max{T 1, T } > t D = 0)Pr(D = 0) şeklinde ifade edilir. Yukarıdaki tanımlamalara ve varsayımlara dayanarak S(t) = λs 1 (t) + (1 λ)[1 F(t, t)] = λe t θ 1 + (1 λ) [1 (1 e t θ 1 ) (1 e t θ ) {1 + αe t( ) θ 1 θ }]

234 sistemin yaşam fonksiyonunun açık şekli elde edilir. 3. Sistemin Güvenirlik Özellikleri Önerilen sistemin bozulma oranı anahtarın konum geçiş olasılığı λ ve birliktelik parametresine α göre esneklik göstermektedir. Şekil 6 Çeşitli anahtar olasılıklarına ve birliktelik parametresi değerlerine göre sistem yaşam zamanına iatbozulma oranı grafikleri Bu bağlamda, böyle bir kurgusu olan sistemin güvenirlik özelliklerinin incelenmesi (bozulma oranı, ortalama kalan ömür) ve bazı sıralamaların elde edilmesi amaçlanmaktadır. KAYNAKLAR [1] Gumbel, E. J. (1960). Bivariate exponential distributions, Journal of American Statistical Association, 55, pp [] Morgenstern, D. (1956). Einfache Beispiele zweidimensionaler Verteilungen, Mitteilungsblatt fuèr Mathematische Statistik, 8, pp [3] Joo, S., Mi, J. (010). Some properties of hazard rate functions of systems with two components. Journal of Statistical Planning and Inference, 140(), ÖZET RELIABILITY PROPERTIES OF THE SYSTEM CONSTRUCTED BY SWITCHING BETWEEN ONE COMPONENT AND TWO-DEPENDENT UNIT REDUNDANT STANDBY SYSTEM In this work, we consider a system with switching towards to standby redundant system composed of two dependent components. Marginal distributions of component lifetimes are exponential and joint distribution belongs to Farlie-Gumbel-Morgenstern family. We examine reliability properties of switching system such as shape of hazard rate function, mean residual lifetime and investigate some stochastic orders under determined circumstances on parameter spaces. Key Words: Switching system, Farlie-Gumbel-Morgenstern distribution, redundant system, hazard rate 34

235 TUTARLI SİSTEMLERİN ORTAK GÜVENİLİRLİK ve ORTAK ARIZA BİLEŞEN ÖNEM ÖLÇÜMLERİ Yunus BULUT 1, Yusuf KIRAÇ, Mehmet GÜNGÖR 3, M. Şamil ŞIK 4 Açık İletişim Adresi: 1,3,4 İnönü Üniversitesi, İİBF, Ekonometri Bölümü, 4480, Malatya, Siirt Üniversitesi, TBMYO, 56100, Siirt 1 ybulut79@gmail.com, yusufkirac7@gmail.com, 3 mgungor44@gmail.com, 4 mhmd.sml85@gmail.com 1. GİRİŞ Tutarlı sistemlerin geliştirilmesinde ve tasarımında kritik rol oynayan bileşen önem ölçüleri arasında en çok kullanılan Birnbaum Güvenilirlik Önem Ölçümü dür. Birnbaum önem ölçümü, Marjinal Güvenilirlik Önem Ölçümü (MRI) olarak da bilinmektedir. MRI, sistemdeki herhangi bir bileşenin güvenilirliğindeki değişimin, sistem güvenilirliğindeki değişime oranı olarak tanımlanır []. En yüksek MRI ölçümüne sahip bileşenlerin güvenilirliğindeki gelişmeler sistem güvenilirliğinde en büyük artışa neden olur. Fakat; MRI, sisteminde yer alan birden fazla bileşenin, sistem güvenilirliğini nasıl etkilediği hakkında bilgi vermez. MRI nin bu eksikliğini ortadan kaldırmak için, Ortak Güvenilirlik Önem Ölçümü (JRI) tanımlanmıştır. MRI ve JRI, bileşen ve sistemin çalışması üzerine kurulmuştur. MRI ve JRI ile benzer şekilde Marjinal Arıza Önem Ölçümü (MFI) ve Ortak Arıza Önem Ölçümü (JFI), tanımlanmıştır [1,3]. Fakat, MFI ve JRI, bileşen ve sistemin çalışmaması üzerine kurulmuştur [3]. Bu çalışmada, JRI ve JFI, tutarlı sistemler için incelenmiştir.. TUTARLI SİSTEMLERİN ORTAK GÜVENİLİRLİK ve ORTAK ARIZA BİLEŞEN ÖNEM ÖLÇÜMLERİ ölçümü, n tane bileşenden oluşan bir tutarlı sistemin güvenilirliği R p olmak üzere, c i bileşenlerinin MRI R p MRI(c i )= ;i=1,,3,...,n p ile tanımlanır. Burada, c i bileşeninin güvenilirliği i oluşturan bileşenler aralarında bağımsız ise esas ayrışım yardımı ile MRI(c )=R 1, p -R 0, p i 35 p olmak üzere, p p,p,...,p 1 n dir[5]. Sistemi i i i eşitliği yazılabilir. Burada, R1 i,p, i. bileşenin çalışması şartı altında sistemin güvenilirliğini ve 0 R i,p, i. bileşenin arızalı olma şartı altında sistemin güvenilirliğini belirtmektedir[5]. Bu çalışmada, benzer ifadeler için aynı yorumlar yapılacaktır. Bir tutarlı sistemde; i. ve j. bileşenler için JRI, R p JRI c i,c j ;i j ve i,j=1,,3,...,n pp i j şeklinde tanımlanmıştır [4]. JRI, sistem güvenilirliğinin belirlenmesinde hangi bileşenlerin etkileşimde olduğunu c ve c bileşenleri için esas ayrışım yardımı ile JRI, gösterir. Bağımsız 1 JRI c,c R 1, 1, p R 1, 0, p R 0, 1, p R 0, 0, p şeklinde de yazılabilir [4] c,c ve c gibi üç bileşenin JRI ölçümü eşitliği ile tanımlanır. JRI c,c, c R p p p p 1 3

236 c 1,c ve c 3 bileşenleri bağımsız ise esas ayrışım yardımı ile JRI c,c, c R 1, 1, 1, p R 1, 1, 0, p R 1, 0, 1, p -R 0, 1, 1, p R 1, 0, 0, p +R 0, 1, 0, p R 0, 0, 1, p R 0, 0, 0, p eşitliği yazılabilir[4]. JFI de JRI ye benzerdir. JFI de bileşenlerin ve sistemin arızalı olması durumu göz önüne alınır. Her hangi bir c i bileşeninin Marjinal Arıza Önem Ölçümü (MFI) R q MFI c i = q şeklinde tanımlanır. c 1 ve c bileşenlerinin JFI ölçümü de i R q JFI c1, c = q 1 q ile tanımlanmıştır [3]. JRI&MRI, JRI&JFI ve JFI&MFI arasında bazı ilişkiler kurulmuştur [3]. KAYNAKLAR [1] Armstrong, M.J., Joint reliability-importance of components, IEEE Transactions on Reliability 44 (3), , [] Barlow, R.E. and F. Proschan, Importance of system components and Fault Tree evens, Stochastic Process and Their Applications 3 (1), , [3] Gao, X., Cui, L. and J. Li, Analysis for joint reliability importance of components in coherent systems,european Journal of Operational Research18, 8 99, 007. [4] Hong, J.S., Koo, H.Y. and Lie, C.H. Joint reliability importance of k-out-of-n systems, European Journal of Operational Research , 00. [5] L.W. Birnbaum, On the importance of different in a multi-component system, in: Krisnaiah (Ed), Multivariate Analysis II, Academic Press., pp , ABSTRACT JOINT RELIABILITY IMPORTANCE AND JOINT FAILURE IMPORTANCE OF COHERENT SYSTEMS COMPONENTS In this study, we examined the relationships of marginal (joint) reliability importance and marginal (joint) failure importance of coherent systems components. Key Words: System Reliability, Coherent Systems, Marginal Reliability Importance, Joint Reliability Importance, Joint Failure Importance 36

237 SESSION 7 MULTIVARIATE STATISTICS 37

238 PAIRWISE TO MULTI-CLASS CLASSIFICATION USING SUPPORT VECTOR MACHINES Engin TAŞ Afyon Kocatepe Üniversitesi Fen Edebiyat Fakültesi İstatistik Bölümü, Afyonkarahisar Abstract Any binary or multi-class classification problem can be transformed into a pairwise prediction problem. This expands the data and brings an advantage of learning from a richer set of examples, in the expense of increasing costs when the data is in higher dimensions. Therefore, this study proposes to adopt an online support vector machine to work with pairs of examples. This modified algorithm is suitable for large data sets due to its online nature and also can handle the sparsity structure existing in the data. Performances of the pairwise setting and the direct setting are compared in two problems from different domains. Results indicate that the pairwise setting outperforms the direct setting significantly. We also demonstrated the effect of sample size on the classification performance in a document classification task and observed that the classification performances are increased linearly with the sample size. Keywords: online learning; pairwise learning; support vector machines; kernel methods; multi-class classification 1. Introduction The central idea of Support Vector Machine (SVM) is to construct an optimal separating hyperplane over linearly separable data [1]. It can also learn a large margin hyperplane over linearly inseparable data by using kernels and soft margin formulations. However, SVM is originally designed for binary classification and there are two principal approaches for extending SVM to the multi-class scenario. One approach is to generalize the binary algorithm to multi-class [, 3], another approach is to decompose the multiclass problem into a series of binary problems. The earliest and one of the most widely used implementations is the one-against-all approach (see, for example, [4]) which constructs M binary SVM classifiers, each of which separates one class from all the rest. The ith SVM is trained with all the training examples of the ith class with positive labels, and all the others with negative labels. Pairwise classification is an alternative technique for solving multiclass problems by considering pairwise comparisons obtained from each of the two-class problems [5]. A test observation is assigned to the class that wins the most pairwise comparisons. We compared the classification performance of the pairwise setting and the direct setting according to the classification accuracy (ACC) and the area under the ROC curve (AUC). Figure 1 summarizes results from 0- Newsgroups dataset using 3x5 cross validation. We see that the pairwise settings achieved significantly better classification performances than the direct setting. There is statistically insignificant little difference between performances of MLPK and TPPK, but MLPK leads to slightly better results than TPPK in the first set of experiments. In the second set of experiments, we tried to see the effect of enriching the original data by forming pairs using several combinations of documents. Therefore, we generated training pair data sets with sample sizes ranging from to Results indicated that indirect setting performs significantly better than the direct setting. Among the pairwise kernels, TPPK has better ACC and AUC scores. We also tested the gaussian kernel in conjunction with pairwise kernels and see that the gaussian kernel performs poor in this data set. This is due to the curse of dimensionality, gaussian kernel has lost the sense of locality. In the second set of experiments MLPK is slightly better than TPPK. We think that this difference arose from the fact that MPLK imposes a symmetry on the pairwise relations. 38

239 Figure 1. Classification performances in 0-newsgroups data set using criteria a)acc b)auc References [1] B. Boser, I. Guyon, V. Vapnik, A training algorithm for optimal margin classifiers, in: Proceedings of the Fifth annual workshop on Computational learning theory, ACM, pp [] J. Weston, C. Watkins, Support vector machines for multi-class pattern recognition, in: Proceedings of the seventh European symposium on artificial neural networks, volume 4, pp [3] E. Mayoraz, E. Alpaydin, Support vector machines for multi-class classification, Engineering Applications of Bio-Inspired Artificial Neural Networks (1999) [4] T. Dietterich, G. Bakiri, Solving multiclass learning problems via error correcting output codes, Journal of Artificial Intelligence Research (1995) 86. [5] J. Friedman, Another approach to polychotomous classification, Technical Report, Technical report, Stanford University, Department of Statistics,

240 Performance Comparison of Some Classification Techniques** ZEHRA KARHAN 1, Taner TunÇ Ondokuz Mayıs Üniversitesi, SAMSUN/TÜRKİYE The right decisions in the field of health is very important to be able to effectively and quickly. [1]. With the increase of patient data it has accumulated a large amount of health records. Therefore be processed data generated by health care operations are very complex and can not be analyzed by conventional methods is voluminous. At this stage, the data into useful information for healthcare decision-making data mining has become increasingly more important to convert these mounds[]. The most difficult point encountered in medical science is the process of discovery of useful information[3]. Diagnostic analysis of the process parameters is difficult and time consuming. Therefore, data mining techniques have been developed to design automated diagnostic systems. This issue of the medical diagnostic field of health benefits due to the use of classification techniques is increasing[4-5]. Data mining and classification techniques with this aspect of statistics, database technology, signal and signal processing, artificial intelligence and is used in many fields [6]. In this paper, the masses in mammograms data and blood values in the lungs data make it possible to reach a judgment about the disease. Disease process related classification; k-nearest neighbor, Naive Bayes, support vector machines, neural networks, logistic regression algorithms are implemented using.classification process related disease k-nearest neighbor, Naive Bayes, support vector machines, neural networks, algorithms are implemented using logistic regression. After the classification process on two separate data success rates were compared between classification algorithms. The experimental results showed that classification techniques give different results on two different datasets. Therefore, the classification technique which showed the highest accuracy rate and lowest error rate over two datasets has been selected as the best classification technique. Results demonstrated that the SVM classifier is faster and significantly more reliable than other classification techniques on mammographic mass and lung cancer datasets. This technique can be applied on medical datasets to help physicians to make more accurate decisions about determination of classification. REFERENCES [1]. The Henry J Kaiser Family Foundation, []. H.C. Koh and G. Tan, Data mining applications in healthcare, Journal of Healthcare Information Management, Vol.19 (), pp.64-7, 005. [3]. S. Gupta, D. Kumar, and A. Sharma, Performance analysis of various data mining classification techniques on healthcare data International Journal of Computer Science & Information Technology (IJCSIT), Vol. 3(4), August 011. [4].V. Anuja Kumari, R.Chitra, Classification Of Diabetes Disease Using Support Vector Machine, International Journal of Engineering Research and Applications (IJERA), Vol. 3(), pp , March -April 013. [5]. N. Hirokawa and R. Takemura, "Biochemical and molecular characterization of diseases linked to motor proteins," Trends Biochem Sci, Vol. 8, pp , Oct 003. [6]. Özekeş S., Veri Madenciliği Modelleri Ve Uygulama Alanları İstanbul Ticaret Üniversitesi Dergisi 003. Abstract 40 In this study, done using some classification algorithms classification data on lung cancer and mammograms audience was given a comparative performance data. Age of patient data in the lungs and some blood parameters used information; mammogram data contained in the independent categorical variables were used. These variables; mammograms in the form of mass, the edge information is information on the intensity of the patient's age. Normalization process necessary before the classification is made on the variables. Classification

241 phase of the data mining classification algorithms commonly used in the k-nearest neighbor, support vector machines, neural networks, Naive Bayes and logistic regression methods were used. Accuracy rate of between classifiers, sensitivity, precision criteria are given as comparative. As a result, the accuracy of the classification is performed on these two separate data that showed the best results compared to other algorithms used support vector machine. Keywords K-Nearest Neighbor, Naive Bayes, Support Vector Machines, Neural Networks, Logistic Regression. *Note of the Editors: The full version of this extended abstract (5 pages) is supposed to be submitted to the Journals proposed by the Conference. The original 5 page abstract is shortened due to the requirements of Extended Abstract announced at the website of the Confremce. 41

242 STATISTICAL ANALYSIS OF GENE EXPRESSION Pelin AKIN Ondokuz mayıs üniversitesi,fen Edebiyat Fakültesi,istatistik bölümü,55139 Samsun/Türkiye The data are taken from Hodgman et al. work which is uncovering a regulatory switch controlling the tomato fruit ripening. AP is a major regulator of tomato fruit ripening and in the fruit pericarp, APa regulates the expression of CNR in a negative attitude [1]. Levels of CNR and AP gene expression in Wild-type tomato and Mutant type tomato were compared in order to investigate the mechanism of ethylene action []. Every type is divided eight break points. In Wild type is observed two variables in the each first and third breakpoints and in other each breakpoints have three variables. Totally, Wild type has twenty two variables. Another type has three observation for each breakpoints, totally it has twenty four variables. The aim of the study is investigating whether significant to breakpoints and Wild and Mutant types for CNR and AP level. Linear model is used for data and looking significance of the time and types (Wild, Mutant). In this project, type and time columns are made. Type column is included the 0 and 1. 0 represents the Wild type and 1 representing the Mutant type. Time column is included the 0,1,...,7 which represents breakpoints. Firstly, it is looked model for CNR. General model is; R squared is approximately 85 % of variation in CNR can be explained by our model (Time and type). First fitted model is If we look p value all significant over the model. It was made a graph which is shown mean level of CNR for Wild and Mutant types. Wild and Mutant types of CNR are oscillations look like sine and a period of oscillations is days for Wild type, 3 days for Mutant type. The other linear model is transformed with a sine function and R squared is approximately 85 % of variation in CNR can be explained by our model. Model s p value is small and model is significant. The other model is weighted least squares. The reason of using it is Wild type has twenty two variables, however Mutant type has twenty four variables so the model can be non-constant variance of error. R squared is approximately 84%. All p values are smaller than 0.05 so all parameters are significant. Akaike Information criterion values and the first model (77.861) is smaller than the second model (78.909) and third model ( ) so the first model is the best model. In summary, oscillations are not significant for CNR level. Secondly, linear model and weighted least square are used for AP level of Wild and Mutant type. Linear model does not transform with other functions because the graph of the mean level of AP for Wild and Mutant is demonstrated the oscillations are not clear. Firstly, it is checked general linear model. The result of R squared 81 %. In addition, time is not significant so time (breakpoints) is not important when the model explanations for AP level in the model. The second model is weighted least squares and can be described 80% of variation in AP with type point. The last model s Akaike Information Criterion valuable are smallest in this model ( ). As a result, time is not significant for the level of AP and weighted least model is beneficial than the linear model. The last model is weighted least model only with type points. Akaike information about the last model is the smallest in this model. The result of linear model time and type variables are significant for CNR level. In addition, we reached constant variance and oscillations are not significant for the CNR level of Mutant and Wild types. AP level of the Wild and Mutant types have non-constant variance of errors so in this project applied the linear model and weighted least model. Two of the models are time is not significant so time (breakpoints) is not important when the model explanations for AP level. REFERENCES [1] Karlova, R., et al.: Transcriptome and metabolite profiling show that apetalaa is a major regulator of tomato fruit ripening. The Plant Cell, 3:93,941, March 011. []Chung, M. et al.: A tomato (solanum lycopersicum) apetala/erf gene,slapa, is a negative regulator of fruit ripening. The Plant Journal,

243 PROGRESS OF MONITORING AFTER DECOMPRESSION TIME SERIES AND CLUSTER ANALYSIS Karel HRACH J.E.Purkyne University in Usti nad Labem, Faculty of Health Studies, Usti nad Labem, CZECH REP. 1. Introduction In our study during observing neurological patients lactate/pyruvate ratio (LPR), glycerol (GLY), glucose (GLU) and oxygen (PTI) values are monitored. One of the goals was to find out the similarities among these variables. Some of the statistical results were published e.g. at the ISCB congress (Hrach, 014). This contribution is dedicated to the data processing of the first three patients. Their parameters had been monitored after the decompression surgery for at least five days (the maximum was nine days).. Statistical methods The over-four-hour averages were calculated and standardised (because of different scales). Resulting time series represent the day means. The line plot (see Figure1) and cluster analysis (see Figure) were applied to these time series to illustrate and to detect the similarities among them. SW STATISTICA was used. 1,0 Line Plot of multiple variables STAND 5-DAY AVER indep 0v*5c 0,8 0,6 0,4 0, 0,0-0, -0,4-0,6-0,8-1, Figure1. Day means for five days after the surgery (standardised variables) sglu sgly spti slpr 43

244 Tree Diagram for 4 Variables Single Linkage Euclidean distances sglu slpr sgly spti 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 Linkage Distance Figure. Results of clustering (standardised variables) 3. Statistical results Based on these first three patients, glycerol (GLY) and oxygen (PTI) showed very similar (mostly) decreasing trend. LP ratio (LPR) started with a decrease during the first day of monitoring, but it showed an increasing trend then. Firstly, glucose (GLU) looked like LP ratio but in the end it decreased again. Applying two-means clustering glycerol and oxygen belonged to the first cluster, while LP ratio and glucose joined within the second cluster. Glycerol and oxygen were significantly correlated (r=0.89). The study is conducted in the co-operation between Krajská zdravotní, a.s. (Neurosurgery Clinic) and J. E. Purkyně University in Ústí nad Labem (the Faculty of Health Studies), with the support of a project grant from the Czech Ministry of Health (NT /01). REFERENCES [1] Hrach K. (014), Progress of bilateral monitoring - case study, Abstract Book, 35 th ISCB Congress, Vienna,

245 SESSION 7 VERİ MADENCİLİĞİ 45

246 MÜŞTERİ KAMPANYA GERİ DÖNÜŞ ORANLARININ RFM YÖNTEMİ İLE ARTIRILMASI M. Özgür DOLGUN *, Derya ERSEL DATAMIND, Bestekar Sokak, 4/1, Kavaklıdere, Ankara, Türkiye Hacettepe Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 06800, Ankara, Türkiye Giriş Son yıllarda, birçok sektörde baskı ve rekabetin hızla artması nedeniyle firmalar kitle pazarlama yöntemleri yerine doğrudan pazarlama yöntemlerini daha çok tercih etmektedirler. Doğrudan pazarlama, bir firmanın olası müşteri kitlesini belirlemesi ve bu müşteri kitlesine ürettiği ürünün tanıtımını yapmasıdır. Bir doğrudan pazarlama yöntemi olan RFM (Recency, Frequency, Monetary) analizi ile müşterilerin en son ne zaman (recency), ne sıklıkta (frequency) ve ne kadarlık harcama (monetary) yaptıkları incelenerek müşterilerin davranış ve değer segmentleri belirlenmeye çalışılır. Veri depolama tekniklerinin gelişmesi ve büyük veri tabanlarının ortaya çıkması ile birlikte RFM analizinin gerçekleştirilmesinde veri madenciliği yöntemleri sıklıkla tercih edilmektedir. RFM analizi ile veri madenciliği tekniklerinin bir arada kullanılması şimdiki ve olası müşteriler hakkında ayrıntılı ve yararlı bilginin elde edilmesini sağlar. RFM analizi sonucunda elde edilen RFM skorları kullanılarak, araştırmanın amacına göre kümeleme, sınıflandırma, birliktelik analizi gibi veri madenciliğinde kullanılan tüm tekniklerinden yararlanılabilir [1, ]. Bu çalışmada, bir süper marketin gerçekleştireceği bir kampanyaya geri dönüş yapacak müşterilerin belirlenmesinde RFM analizi ile birlikte sınıflandırma yöntemlerinden karar ağacı algoritmalarından CHAID, C&R Tree ve C5.0 yöntemleri kullanılmıştır.. Plan ve Yöntem Verilere sahip olan firmanın; i. Müşteri veri tabanı, ii. Kampanya veri tabanı, iii. İşlemsel veri tabanı, iv. Ürün veri tabanı ve v. Finansal veri tabanlarında yer alan verilere erişilip birleştirilerek analiz aşamasında kullanılacak olan ilgili data mart elde edilmiştir. Nihai olarak kullanılacak olan verilere ilişkin ekran çıktıları aşağıda verişmiştir. Şekil 1. İşlemsel Veriler 46 Şekil. Müşteri Verileri

247 Şekil 3. Kampanya Verisi Şekil 4. RFM Verisi Analiz sonucunda; 1. Kampanyaya geri dönüş yapmayı etkileyen önemli değişkenler,. Kampanyaya geri dönüş yapan müşteri profili, 3. Müşteri değer segmentleri ve 4. Kampanyaya geri dönüş olasılığı yüksek olan hedef liste elde edilmiştir. KAYNAKLAR [1] Birant, D. (011), Data Mining Using RFM Analysis, Knowledge-Oriented Applications in Data Mining, Prof. Kimito Funatsu (Ed.), ISBN: , InTech. [] Han J., Kamber M. and Pei, J. (011), Data Mining: Concepts and Techniques, The Morgan Kaufmann, Third Edition. ABSTRACT INCREASE CAMPAIGN RESPONSE RATES WITH RFM ANALYSIS In recent years, due to the rapid increase in pressure and competition in many sectors, companies tend to prefer direct marketing instead of mass marketing. Direct marketing is determining a company's potential customers and promoting its products to them. With RFM analysis which is a direct marketing method, the best customers are determined by investigating how recently customers has purchased, how often they purchase and how much they spends. In this study, RFM analysis and data mining classification methods are used to determine the customers who will likely to return to the campaign which will be performed by a supermarket. Key Words: RFM Analysis, Classification, Decision Trees, Neural Networks, Data Mining 47

248 KÜMELEME ANALİZİ YARDIMIYLA OECD ÜLKELERİNİN YEŞİL BÜYÜME GÖSTERGELERİNE GÖRE DEĞERLENDİRİLMESİ Murat ÇOLAK, Ali İhsan BOYACI, Gülşen AKMAN Kocaeli Üniversitesi, Endüstri Mühendisliği Bölümü, Umuttepe Yerleşkesi,41380, Kocaeli Günümüzde artan nüfus ve üretim ihtiyacı sanayi faaliyetlerinin artmasına neden olmaktadır. Sanayi faaliyetlerinin artmasının bir sonucu olarak CO salınımının yüksek seviyelere çıktığı görülmektedir. Bu durumda başta küresel ısınma olmak üzere birçok çevresel soruna yol açmaktadır. Bu bağlamda ülkeler CO salınımını en aza indirecek üretim teknolojilerini daha çok tercih etmektedirler. Son zamanlarda yaşanan çevresel ve ekonomik problemlerin bir sonucu olarak yeşil büyüme ve yeşil ekonomi kavramları ortaya çıkmıştır. Yeşil büyüme çevreye en az zarar verecek ürün ve hizmetlerin üretim ve tüketimini teşvik eden bir bakış açısı olarak tanımlanabilir. Bu yaklaşım ile çevresel sürdürülebilirlik, ekonomik gelişmişlik ve istihdam imkanlarının artması mümkün görülmektedir. Ekonomik Kalkınma ve İşbirliği Örgütü (OECD) yeşil büyüme kavramına önem vermekte ve sürdürülebilir kalkınma ile yeşil büyüme arasında iyi bir ilişki olduğunu belirtmektedir. OECD ortaya koyduğu yeşil büyüme göstergeleri ile üye ve üye olmayan ülkelerin yeşil büyüme verilerini ortaya koymaktadır. Bu çalışmada OECD üyesi olan 34 ülkenin ortaya koyulan 0 kriter açısından yeşil büyümelerine göre değerlendirilmesi amaçlanmıştır. Bir OECD ülkesi olan Türkiye nin yeşil büyüme konusunda nerede olduğunu ve diğer ülkelerle karşılaştırıldığında ne durumda olduğunu incelemek hedeflenmiştir. Faktör analizi yardımı ile 0 değişken 7 değişkene indirgenmiştir. Sonraki aşamada faktör analizi sonucunda elde edilen değişkenler yardımıyla kümeleme analizi yapılmıştır. Kümeleme analizinde kümeler arası benzerliğin minimum küme içi benzerliğin maksimum olması amaçlanmış ve K-ortalamalar yöntemi kullanılmıştır. Çalışmanın adımlarına ilişkin akış şeması Şekil 1 de verilmiştir: Değerlendirmede Kullanılacak Kriterlerin ve Ülkelerin Belirlenmesi Verilerin Toplanması ve Analize Uygun Hale Getirilmesi Faktör Analizi Yardımıyla Kriter Sayısının Azaltılması Kümeleme Analizinin Yapılması Sonuçların Değerlendirilmesi ve Türkiye nin Diğer OECD Ülkeleri İle Karşılaştırılması Şekil 1. Akış Şeması 48

249 Çalışmada kullanılan değerlendirme kriterleri OECD verilerinden elde edilmiş ve Çizelge 1 de sunulmuştur: Çizelge 1. Değerlendirmede Kullanılan Kriterler Değerlendirme Kriterleri C1: Gayri Safi Yurtiçi Hasıla C11: Mera Oranı C: Kilometrekare Başına Nüfus Yoğunluğu C1: Orman Oranı C3: Üretime Dayalı CO Salınımı C13: Nüfus İle İlgili Atık Su Miktarı C4: Üretime Dayalı CO Verimliliği C5: Üretime Dayalı CO Yoğunluğu C6: Talep Tabanlı CO Verimliliği C7: Yenilenebilir Enerji Tedariği C8: Yenilenebilir Enerjiye Dayalı Elektrik Enerjisi Üretim Miktarı Oranı C14: Çevresel AR-GE'de Halk Harcamaları C15: Yeşil Patent Sayısı C16: Hibrit ve Elektrikli Araç Patent Sayısı C17: Binalarda Enerji Verimliliği İle İlgili Patent Sayısı C18: Yenilenebilir Enerji Patent Sayısı C9: Toplam Tatlı Su Çıkarımı C19: Toplam Resmi Kalkınma Yardımı C10: Ekilebilir Arazi ve Tarla C0: Toplam Çevre Vergileri Kümeleme analizi sırasında farklı küme sayıları denenmiş ve ANOVA tablolarının incelenmesi sonucu küme sayısı 5 olarak belirlenmiştir. 34 OECD ülkesinin yer aldığı kümeler Çizelge de verilmiştir: Çizelge. OECD ülkelerinin yeşil büyümelerine göre yer aldığı kümeler Ülke K K Ülke üme No üme No Almanya 1 Kanada 3 Belçika 1 Lüksemburg 3 Birleşik Krallık 1 Yeni Zelanda 3 Çek Cumhuriyeti 1 Avusturya 4 Hollanda 1 Danimarka 4 İsrail 1 Fransa 4 İtalya 1 İrlanda 4 Kore 1 İspanya 4 Macaristan 1 İsveç 4 Polonya 1 İsviçre 4 Şili 1 Meksika 4 Türkiye 1 Norveç 4 Amerika Portekiz 4 Japonya Slovakya 4 Avusturalya 3 Slovenya 4 Estonya 3 Yunanistan 4 Finlandiya 3 İzlanda 5 ABSTRACT EVALUATION OF OECD COUNTRIES ACCORDING TO GREEN GROWTH INDICATORS USING CLUSTERING ANALYSIS In this study, it is aimed to assess 34 OECD countries in terms of 0 criteria which are green growth indicators. After reducing 0 criteria to 7 factors using factor analysis, a clustering analysis is performed with these factors. Countries are collected in five groups. Finally 49 Turkey is compared with other countries as a OECD country. Key Words: Green Growth, OECD Countries, Clustering Analysis, Factor Analysis.

250 BANKA SADAKATİNE İLİŞKİN BİR YAPISAL EŞİTLİK MODELİ ÖNERİSİ Erkan ARI* Dumlupınar Üniversitesi, İ.İ.B.F Ekonometri Bölümü, Kütahya. Veysel YILMAZ; Rana DOĞAN Eskişehir Osmangazi Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Eskişehir. e- 1. GİRİŞ İçinde bulunduğumuz hızla gelişen bilgi ve teknoloji çağında, işletmelerin çağın gerisinde kalmamak ve sektördeki diğer rakiplerine üstünlük sağlamak için dikkat etmesi gereken hususlardan en önemlisi müşterilerini iyi tanımaları, onların beklentilerini ve bu beklentilerin nasıl karşılanabileceğini bilmeleridir (Gençtürk vd., 011:6). Bu bağlamda bankacılık; halkla ilişkiler faaliyetlerinin en gelişkin olduğu iş kollarından birisidir ve teknolojik gelişmeleri anında uygulamaya sokan bankacılık işkolu, değişime öncülük etmektedir. Halkla ilişkiler faaliyetlerinin yoğunluğuna karşın, bu faaliyetlerin önemi hiçbir zaman azalmamakta ve her geçen gün daha da önem kazanmaktadır (Özdemir, 01:5). Son dönemlerdeki sıkı rekabet nedeniyle müşteri memnuniyeti, müşteri tutma ve müşteri hizmetlerine odaklanmak herhangi bir bankanın varlığını devam ettirebilmesi için daha da önemli hale gelmiş ve bankacılık işlemlerinde müşteri memnuniyet anahtar faktör olarak kabul edilmiştir (Kaytancı vd., 013: 80).. YÖNTEM.1. Araştırma Modeli ve Hipotezler Araştırma modeli, banka müşterilerinin bankalar tarafından sunulan hizmetlerden algıları ile bankalarına duydukları memnuniyetleri ve sadakatleri arasındaki ilişkiyi betimlemek amacıyla Servqual boyutlarına dayanılarak oluşturulmuş bir modeldir. Önerilen model Şekil 1 de verilmiştir. A-Müşteriye Sağlanan Güvence; B- Bankaya Olan Güvenilirlik; D-Bankaya Erişilebilirlik; G- Bankanın ATM Hizmeti, E- Memnuniyet; F- Sadakat Şekil 1. Bankacılık Hizmet Kalitesi ile Memnuniyet ve Sadakat Arasındaki İlişki İçin Önerilen Model Araştırma modeline dayalı olarak oluşturulan araştırma hipotezleri aşağıda verilmiştir. H A : Bankaya duyulan güvence arttıkça bankaya duyulan memnuniyet artar. H B : Banka çalışanlarının sunduğu hizmetlerindeki güvenilirlik arttıkça müşterilerin bankaya duydukları memnuniyet artar. H D :Bankayla erişilebilirlik olanakları kolaylaştıkça, müşterilerin bankadan duydukları memnuniyet artar. H G :Bankanın sunmuş olduğu ATM hizmetlerinden memnuniyet arttıkça, bankaya duyulan genel memnuniyet artar. H E :Bankaya duyulan genel memnuniyet arttıkça, müşterilerin 50 bankaya olan sadakatleri artar. 3. BULGULAR Çalışmada banka müşterilerinin bankaya duydukları memnuniyet ve sadakate ilişkin ilgili Servqual boyutlarını ortaya çıkarmak ve yapı geçerliliğini kontrol etmek amacıyla Doğrulayıcı Faktör Analizi yapılmıştır.

251 0,50 den düşük faktör yüklerine sahip değişkenler analizden çıkartılmıştır. Yapılan t testi sonucunda H A, H B H D, H G H E desteklenmiştir. ABSTRACT A STRUCTURAL EQUATION MODEL PROPOSALON BANKING LOYALTY In the study, it is aimed to reveal the relationship between the factors that affect the satisfaction and loyalty of bank costumers' by the help of Servqual service quality a proposed research model. For this purpose a survey conducted to 9 bank costumers live in Ankara city center in March 015 In analyzing the data Structural Equation Model (SEM) used in order to evaluate the coherence of the model and to reveal the factors that affect the relationship between the satisfaction and the loyalty of bank costumers. As the result of SEM analyze, it is concluded, the parameters of the assurance provided to costumer, bank reliability, bank accessibility, the ATM services affect the satisfaction parameter positively, and satisfaction affects the bank loyalty positively as well. Keywords: Banking Sector, Servqual, Loyalty, Structural Equation Model (SEM). KAYNAKÇA [1]GENÇTÜRK, M., KALKAN, A., OKTAR, Ö.F. (011). Bireysel Bankacılıkta Müşteri Memnuniyetini Etkileyen Faktörler: Burdur ve Isparta İllerinde Bir Uygulama. SDÜ İktisadi İdari Bilimler Fakültesi Dergisi,16(), []KAYTANCI, B.G., ERGEÇ, E.H., TOPRAK, M. (013). Katılım Bankası Müşterilerinde Bankacılık Ürün ve Hizmetlerine Yönelik Memnuniyet: Türkiye Örneği. International Conference on Eurasıan Economies, [3]ÖZDEMİR, İ. (01). Bankacılıkta Halkla İlişkiler ve Müşteri İlişkileri (01). Bankacılık ve Sigortacılık Araştırmaları Dergisi, 1(3),

252 AYLIK KÜMES HAYVANCILIĞI ÜRETİM İSTATİSTİKLERİNDE VERİ MADENCİLİĞİ YÖNTEMLERİ İLE VERİ ANALİZİ Fethi Şaban ÖZBEK, Kadir Korhan BABADAĞ, Murat ATA, Hatice Burcu ESKİCİ, Necmettin Alpay KOÇAK, İrfan UZUNPINAR Devlet Mah. Necatibey Cad. No: Çankaya/Ankara 1. Giriş Türkiye İstatistik Kurumu (TÜİK) 4 tarafından yürütülen aylık kümes hayvancılığı üretim istatistikleri çalışmaları; kümes hayvancılığı sektörünün kısa dönemlerle gelişiminin izlenmesini sağlamak ve uluslararası karşılaştırmalara olanak vermek amacıyla istatistikî birimi kümes hayvancılığı üretimi yapan sanayi işletmeleri, coğrafi kapsamı tüm Türkiye olan istatistikî çalışmalardır (TÜİK, 015). Kümes hayvancılığı üretim istatistikleri çalışmasında, damızlık tavuk sayısı, üretilen kuluçkalık yumurta sayısı, kümes hayvanı sayısı, üretilen yumurta sayısı, kuluçkaya giren yumurta sayısı, kullanım için ayrılan civciv sayısı ile kesilen kümes hayvanı sayısı ve üretilen beyaz et miktarı değişkenlerine ait veriler derlenmektedir. Kümes hayvancılığı üretim istatistikleri çalışması aylık olarak derlenen ve büyük boyutlarda veri setine sahip bir çalışmadır. Çalışmanın hem yayımlanma sıklığı hem de büyük boyutlarda veri setine sahip olması verinin etkin ve hızlı bir şekilde analiz edilmesini gerektirmektedir. Bu kapsamda, veri madenciliği yöntemleri uygun bir çözüm olarak karşımıza çıkmaktadır. Veri madenciliği, "büyük miktarda veri içinden gelecekle ilgili tahmin yapılmasını sağlayacak bağıntı ve kuralların bilgisayar programlan kullanarak aranması" şeklinde de tanımlanabilir (Babadağ, 003). Bu çalışma ile daha kaliteli istatistikler üretilmesi amacıyla Kümes Hayvancılığı Üretim İstatistikleri nde TÜİK de uygulanan veri madenciliği yöntemleri değerlendirilmiştir.. Veri Madenciliği Süreci Kümes hayvancılığı üretim verileri TÜİK Bölge Müdürlükleri aracılığıyla işletmelerden elektronik anket aracılığıyla aylık olarak derlenmektedir. Veri girişinden, haber bülteninin yayımlanmasına kadar geçen sürede, yapılacak analizlerin detaylı ve etkin olması istatistik üretim süreci açısından büyük önem taşımaktadır. Aynı zamanda tespit edilen hatalı/şüpheli kayıtların çok hızlı bir şekilde alana döndürülmesi gerekmektedir. Tüm bu kısıtlar dikkate alındığında, veri analizinde veri madenciliği yöntemlerini kullanmanın büyük avantaj sağlayacağı açıktır. Veri girişinin yapılması ile birlikte, veri madenciliği süreci başlamakta ve analizler gerçekleşmektedir. Yapılan analizlerden bazıları şunlardır: (i) Karar ağacı modelleri kullanılarak Türkiye, bölge, istatistikî birim bazında tahminlerin elde edilmesi, (ii) Uç ve aykırı değer tespiti, (iii) Anomali tespiti (iv) Önceki ay/yıl ile kontroller (v) Büyük değişim gösteren kayıtların yanında hiç değişim göstermeyen kayıtların incelenmesi, (vi) Veri setinde olmayan değişkenlerin türetilmesi ile daha etkin sonuçların alınması Modelleme sürecinde, yorumlanabilir ve görselleştirilebilir olması açısından karar ağaçları kullanılmaktadır. Analizlerde karar ağaçları yöntemlerinden biri olan CHAID (Chi-Squared Automatic Interaction Detection) modeli kullanılmaktadır. Bu model, bağımlı değişkendeki varyasyonu bölümler içi minimum, bölümler arası maksimum olacak şekilde farklı alt gruplara veya bölümlere tekrarlı olarak parçalayan bir yöntemdir (Zırhlıoğlu, 011). En iyi bölmeyi hesaplamak için tahmin değişkenleri hedef değişkene uyan bir çiftin içinde istatistik olarak anlamlı bir fark kalmayıncaya kadar birleştirilmektedir. En uygun bölümleri seçmek için Ki-kare testi kullanılmaktadır (Albayrak ve Yılmaz, 009; Ritschard, 010). Çalışmada tahmin edilmek istenen değişken hedef değişken olarak tanımlanmakta ve bu değişken üzerinde etkili olduğu düşünülen diğer değişkenler girdi değişken olarak belirtilmektedir. Model tahmin değeri ile gerçekleşen değerler istatistiksel ölçümler kullanılarak kontrol edilmekte ve farkın yüksek olduğu kayıtlar tekrar kontrol edilmek üzere alana gönderilmektedir. Kurulan modeller hem tüm Türkiye verisi üzerinden kurulmakta hem de bölgesel farklılıklar olacağı dikkate alınarak bölgesel seviyede de kurulmaktadır. Burada ifade edilmesi gereken önemli noktalardan birisi de yapılan tüm analizlerin alandan veri girişi ile paralel olarak hareket etmesidir. Yazılan arayüz sayesinde alanda veri girişi yapıldıktan sonra veritabanları üzerinde veri madenciliği süreci başlamakta ve analiz sonrası tespit edilen şüpheli kayıtlar bu arayüz ile veri kontrolünü yapacak kişinin bilgisayar ekranında listelenmektedir. Bu sayede, alan uygulaması devam ederken şüpheli kayıtların kontrolü mümkün olmaktadır Sonuç 4 Bu çalışmada yer alan bulgular ve değerlendirmeler, yazarların kendi görüşleri olup hiçbir şekilde TÜİK i bağlamamaktadır.

253 TÜİK tarafından uygulanan veri analiz yöntemleri ile anket yolu ile derlenen kümes hayvancılığı üretim verilerinde; firma ve Türkiye/bölge modeli yapısından farklı davranış gösteren kayıtlar, yıl içindeki değişimi yüksek/düşük olan kayıtlar, önceki aya göre değişimi fazla olan kayıtlar gibi analizler veri madenciliği yöntemleri kullanılarak sistematik bir şekilde tespit edilmektedir. Böylelikle veri seti içerisindeki aykırı değerler tespit edilmekte ve ilgili çalışmanın alan uygulaması devam ederken cevaplayıcı birimler tarafından düzetilmesi ya da doğrulanması sağlanmaktadır. KAYNAKLAR [1]Albayrak A.S. ve Koltan Yılmaz Ş. (009). Veri madenciliği: Karar ağacı algoritmaları ve İMKB verileri üzerine bir uygulama, Süleyman Demirel Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi 14(1): []Babadağ, K. (003). Veri madenciliği yaklaşımı ve veri kalitesinin artması için kullanılması, Devlet İstatistik Enstitüsü Uzmanlık Tezi, Ankara. [3]Ritschard G. (010). CHAID and earlier supervised tree methods, [4]Türkiye İstatistik Kurumu (015). Kümes hayvancılığı üretimi haber bülteni, ( [5]Zırhlıoğlu G (011). İnternet bağımlılığının CHAID analizi ile incelenmesi: Van ili örneği, Eğitimde ve Psikolojide Ölçme ve Değerlendirme Dergisi, (): DATA ANALYSIS AND MODELING ON MONTHLY POULTRY PRODUCTION STATISTICS The study on monthly poultry production statistics, which has been executed by Turkish Statistical Institute (TurkStat), is the statistical study that allows for monitoring poultry sector development in short terms, and allows for international comparisons. TurkStat has been using data mining applications in data analyses for monthly poultry production statistics. In current study, data analyses methods (e.g. outliers and anomalous data detection, CHAID (Chi-Squared Automatic Interaction Detection) model, change ratio), used for producing poultry production statistics more accurate and in high quality, are examined. Key Words: CHAID, data analyze, data mining, outliers, poultry statistics 53

255 1. Giriş HACETTEPE ÜNİVERSİTESİ İSTATİSTİK BÖLÜMÜ MEZUNLARININ MEZUNİYET SÜRELERİNİ ETKİLEYEN FAKTÖRLERİN YAŞAM ÇÖZÜMLEMESİ İLE İNCELENMESİ Hatice IŞIK*, Nihal ATA TUTKUN, Durdu KARASOY Hacettepe Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 06800, Ankara, TÜRKİYE, Yaşam çözümlemesinde, bir birimin belirli bir başlangıç zamanı ile başarısızlığı arasında geçen zamana yaşam süresi ya da başarısızlık süresi adı verilmektedir. Birçok durumda incelenen yaşam süresinin başka faktörler tarafından da etkilenebileceği göz önünde bulundurulduğunda, yaşam süresi üzerinde açıklayıcı değişkenlerin de etkilerinin modellendiği regresyon modelleri yaşam çözümlemesinde önemli bir yer almaktadır. Yaşam verilerinin modellenmesi için en çok kullanılan yaşam modeli Cox regresyon modelidir. Cox regresyon modelinin kullanılabilmesi için orantılı tehlikeler varsayımının sağlanması gerekmektedir. Varsayım sağlanmadığında kullanılan alternatif Cox regresyon modelleri ve parametrik modeller mevcuttur.. Cox Regresyon Modeli ve Alternatif Modeller Yaşam sürelerinin olasılık dağılımının belirli bir biçimi olmaması nedeniyle Cox regresyon modeli parametrik regresyon modellerine göre daha avantajlıdır. Cox regresyon modeli, h(t; x) = h o (t)e βx biçimindedir. Burada x açıklayıcı değişkenler vektörü, β regresyon katsayıları vektörü, h o (t) ise temel tehlike fonksiyonudur. Orantılı tehlikeler varsayımı sağlanmadığında kullanılan parametrik olmayan modeller ve veri kümesinin dağılımı belirli bir olasılık dağılımına uyduğunda kullanılan parametrik regresyon modelleri Cox regresyon modeline göre daha etkili parametre tahminleri verir. Yaşam çözümlemesinde hızlandırılmış başarısızlık süresi (HBS) modelleri, parametrik orantılı tehlikeler (OT) modellerinin de alternatifi olarak kullanılır. OT modellerinde açıklayıcı değişkenlerin tehlike üzerine etkisi ölçülürken, HBS modellerinde tehlike yerine yaşam süresi üzerine açıklayıcı değişkenlerin direk etkisi değerlendirilebilir. HBS modelde (X 1, X,, X p ) açıklayıcı değişkenleri için, yaşam olasılıkları S(t x) = S 0 (t/η(x)) biçimindedir. Burada, S 0 (t) temel yaşam fonksiyonu, η hızlandırma faktörüdür. Hızlandırma faktörü, η(x) = exp (α 1 x 1 + α x + + α p x p ) biçiminde ifade edilir. Yaşam fonksiyonu ve tehlike fonksiyonu ilişkisine göre, (X 1, X,, X p ) açıklayıcı değişkenli bir birimin tehlike fonksiyonu h(t x) = [1 η(x)]h 0 [t η(x) ] biçiminde verilir. HBS modelinin karşılık gelen logaritmik doğrusal formu logt i = μ + α 1 X 1i + α X i + + α p X pi + σε i 55 biçimindedir. Burada, μ kesişim, σ ölçek parametresi ve ε i ise belirli bir dağılıma sahip olduğu varsayılan rastgele bir değişkendir.

256 Bu çalışmada, Hacettepe Üniversite İstatistik Bölümü nün kuruluş yılı olan 1967 yılından 015 yılına kadar mezun olan öğrencilerin mezun olma süreleri ve öğrenci bilgileri kullanılarak mezuniyet süresini etkileyen faktörler yaşam çözümlemesi yöntemleri ile incelenmiştir. Bu çalışma, daha sonra mezun olacak öğrencilerin mezun olmaları gereken sürede mezun olabilmeleri için alınması gereken önlemlere ışık tutması amaçlanmaktadır. KAYNAKLAR [1] Bruinsma, M.J. and Ellen P.W.A. (009), When will I Succeed in my First Year Diploma? Survival Analysis in Dutch Higher Education, Higher Education Research & Development, 8(1), [] Cox, D.R. (197), Regression Models and Life-Tables, Journal of the Royal Statistical Society, Series B, 34, [3] Lawless, J.E. (198), Statistical Models and Methods for Lifetime Data, New York: John Wiley & Sons, Inc. [4] Van der Berg S., Ronelle B. (00), Education and Socio-Economic Differentials: A Study of School Performance in the Western Cape, South African Journal of Economics, 71(3), [5] Wei, L.J. (199), The Accelerated Failure Time Model: A Useful Alternative to the Cox Regression Model in Survival Analysis, Statistics in Medicine, 11, ABSTRACT ANALYZING FACTORS AFFECTING THE GRADUATION TIME OF HACETTEPE UNIVERSITY DEPARTMENT OF STATISTICS STUDENTS USING SURVIVAL ANALYSIS Survival analysis is defined as a set of statistical techniques that are used for the analysis of random positive definite variables. It is a useful method for examining the events both in social and natural sciences. The factors that affect the survival time is analyzed by semi-parametric and parametric survival models. With this study, it was aimed to examine the graduation time of students from the departments of Statistics at Hacettepe University and determine the factors that affect the graduation time by survival analysis methods. Therefore, the data of students who graduate from the department from the foundation of the department to 015 was used. Key Words: Censoring, Cox regression model, Accelerated failure time, Graduation time, Survival analysis. 56

257 SENDROMİK İZLEMEDE KULLANILAN ERKEN UYARI ALGORİTMALARININ KARŞILAŞTIRILMASI 1. Giriş İmren SAYGIR, Dursun AYDIN Muğla Sıtkı Koçman Üniversitesi, Fen Fakültesi,İstatistik Bölümü, Muğla-Türkiye * ; duaydin@mu.edu.tr Bulaşıcı hastalıkların izlenmesi halk sağlığını ilgilendiren önemli bir konudur. Bu amaçla yüzyıllar boyunca çeşitli izleme yöntemleri uygulanmış, teknolojinin ve bilgi sistemlerinin giderek gelişmesi ile ilkel izleme yöntemleri yerini modern yöntemlere bırakmıştır İzlemenin ortak bir tanımı şu şekilde verilmiştir: Halk sağlığı uygulamalarının planlanması, değerlendirilmesi ve uygulanması için kullanılan sonuca özgü verilerin sistematik olarak toplanması, analiz edilmesi ve yorumlanmasıdır. Analizi kolaylaştırmak için anormalliği belirleyen algoritmalara başvurmadan önce bu veriler genellikle «sendromlar» olarak adlandırılan gruplar içinde sıralanır. Böylece hastalık izlemenin bu türü «sendromik izleme» olarak adlandırılmıştır. Halk sağlığı izlemenin daha ilgi çekici yönü ise yüksek ölüm ve hastalıklılık oranına neden olan bulaşıcı hastalıkların erken tanısıdır. Son yıllarda kuş gribi gibi ölümcül virüslerin ortaya çıkmasından dolayı hastalık izleme daha fazla gündeme gelmiştir. Teknolojinin gelişmesi, bilgisayarların yaygınlaşmasından sonra izleme için kullanılabilecek programlama dilleri ve algoritmalar geliştirilmiştir. Kamu ve yerel sağlık kuruluşlarında EARS (Early Aberration Reporting Systems), ESSENCE (Electronic System for the Early Notification of Community-based Epidemics) gibi modern izleme sistemi uygulamaları yaygınlaşmaya başlamıştır.. EARS C1 C C3 METHODLARI C1, C, C3 methodları CUSUM benzeri methodlar olarak tasarlanmıştır. C1 ve C her gözlemi standardize etmek için hareketli örneklem ortalaması ve örneklem standart sapmasını kullanan Shewhart methoduna benzemektedir. C1 methodu, örneklem ortalaması ve örneklem standart sapmasını hesaplamak için mevcut gözlemin 7 gün öncesini kullanır. C methodu da C1 methodununa benzerdir fakat 7 gün öncesini iki günlük gecikme ile kullanır. C3 ise C methodunun bilgileri kullanılarak hesaplanır. Y(t), t ile temsil edilen bir periyottaki gözlem sayısı olsun. (Örneğin t günde spesifik bir sendromla hastanelerin acil servislerine bireysel varışların sayısı) C 1 (t) istatistiği aşağıdaki gibi hesaplanır: C 1 (t) = Y t Y 1(t) S 1 (t) Burada Y 1(t) ve S 1 (t) sırasıyla hareketli örneklem ortaması ve standart sapmasıdır. Y 1(t) = 1 t 7 Y(i) 7 i=t 1 S 1 = 1 t 7 [Y(i) Y 1(i)] 6 i=t 1 C1 istatistiği örneklem ortalamsının 3 standart sapma üstüne sabitlenen bir eşik değerini aştığında sinyal verir, C 1 (t) > 3. C (t) = Y t Y 3(t) S 3 (t) 57 Y 1(t) = 1 t 9 Y(i) 7 i=t 3 S 3 = 1 t 9 [Y(i) Y 3(i)] 6 i=t 3 C, C1 ile benzer durumda sinyal verir, C 1 (t) > 3.

258 t C 3 (t) = max[0, C (i) 1] i=t C3 istatistiği örneklem ortalamsının standart sapma üstüne sabitlenen bir eşik değerini aştığında sinyal verir, C 3 (t) >. KAYNAKLAR 1) Lombardo J.S., Ross D. (007) Disease Surveillance, a Public Health Priority, 1-39, Lombardo J.S., Buckeridge D.L, Disease Surveillance, A Public Health Informatics Approach, the United States of America, 458s. ) Fricker R.D., Hegler B.L., Dunfee D.A. (008) Comparing syndromic Surveillance detection methods: EARS versus a CUSUM-based methodogy, Statist. Med. 7: ) Hagen K.H., Fricker R.D., Hanni K.D., Barnes S., Michie K. (011) Assessing the Early Aberration Reporting Sysyem s Ability to locally detect the 009 influenza pandemic, Statistics, Politics, and Policy, :1 ABSTRACT In this paper, we consider some of the syndromic surveillance systems implemented by the Centers for Disease Control and Prevention s (CDC) BioSense program. The focus of this study is based on compare the performance of three detection methods, entitled C1, C, and C3, that are implemented in the early aberration reporting system (EARS) versus EWMA chart (exponentially weighted moving average chart). A real example is used to demonstrate the performances of the methods employed in syndromic surveillance algorithms. Key Words: CDC, EARS, EWMA Chart, C1, C, C3 58

259 SANSÜRLÜ VERİ İÇEREN BİR VERİ SETİNİN DAĞILIMININ BELİRLENMESİ Hayrinisa DEMİRCİ BİÇER* Cenker BİÇER Cemal ATAKAN Kırıkkale Üniversitesi Fen Edebiyat Fakültesi İstatistik Bölümü Kırıkkale/Türkiye Kırıkkale Üniversitesi Fen Edebiyat Fakültesi İstatistik Bölümü Kırıkkale/Türkiye Ankara Üniversitesi Fen Fakültesi İstatistik Bölümü Ankara/Türkiye Verilen bir veri setinin hangi dağılım ile modelleneceği oldukça önemlidir. Literatürde verilen bir veri setinin tam veri (sansürlü veri içermemesi) olması durumunda bilinen iki olasılık dağılımından hangisi ile modelleneceği ile ilgili birçok çalışma mevcuttur. Dey ve Kundu (01), II.tip sansürlü veri içeren bir veri setinin Weibull veya Log-Normal dağılımlarından hangisi ile modelleneceği konusunu ele almışlardır. Bu çalışmada, II.tip sansürlü veri içeren bir veri setinin Weibull ya da Gamma dağılımlarından hangisi ile modelleneceği problemi ele alınmıştır. Yapılan simülasyon çalışması ile elde edilen doğru seçim olasılıklarına göre yorumlar yapılmıştır. KAYNAKLAR [1] Bain, L. J. and Englehardt, M. (1980), Probability of correct selection of Weibull versus Gamma based on likelihood ratio, Communications in Statistics, Series A. vol [] Dey, A. K. and Kundu, D. K. (01), Discriminating between Weibull and Log-Normal distributions for type-ii censored data, Statistics, 46, [3] Dumonceaux, R. and Antle, C.E. (1973), Discriminating between the Log-Normal and Weibull distribution, Technometrics, vol [4] Kundu, D. and Manglick, A. (004), Discriminating between the Weibull and Log-Normal distributions,naval Research Logistics, 51, [5] Gupta, R. D. and Kundu, D. K. (003), Discriminating between Weibull and generalized exponential distributions, Computational Statistics and Data Analysis, 43, ABSTRACT DISTIRBUTION DETERMINATION FOR A DATA SET WHICH CONTAIN THE CENSORED DATA In order to make true statistical inference, it is important to know the underlying distribution of set of observed data. An extensive number of works has been published related to distribution determination which a selection from two probability distributions for a given data set, hitherto. The problem of discriminating between Weibull and Log-Normal distributions for type-ii censored data was considered by Dey and Kundu (01). In this study, we are consider to the problem of discriminating between Weibull and Gamma distributions for type-ii censored data. Also, obtained results of the work are verified through a simulation study and some comments are given. 59 Key Words: Weibull distribution, Gamma distribution, Likelihood ratio tests, Probability of correct selection

260 TIPTA UZMANLIK ÖĞRENCİLERİNİN İSTATİSTİK VE BİLİMSEL ARAŞTIRMA DERSLERİNE YÖNELİK TUTUM VE KAYGILARI Adnan KARAİBRAHİMOĞLU 1 *, Nazan KARAOĞLU 1 1 Necmettin Erbakan Üniversitesi, Meram Tıp Fakültesi, TEBAD, 4080, Konya, TÜRKİYE adnankaraibrahim@gmail.com, drnkaraoglu@gmail.com 1. GİRİŞ Biyoistatistik bilgisi sağlık profesyonellerinin eğitim sırasında lisans düzeyinin ilk yıllarında aldıkları ancak uzmanlık, yüksek lisans ve doktora döneminde mutlaka kullanmaları gereken bir bilgi olması, sağlık profesyonellerinin meslek dersleri ile biyoistatistik arasındaki bağın çok farkında olmamaları gibi nedenlerle kaygı yaratmaktadır. Özellikle tez aşaması, bilimsel araştırma tasarlama ve yürütme süreçlerinde, toplanan verilerin nasıl yorumlanacağı konuları biyoistatistik bilgisini zorunlu kıldığından endişeyi artırmaktadır. Bu kaygı nedeniyle araştırma planlama sürecinde aksamalar olması pek çok araştırmada yanlış, gereksiz veri toplanmasına, ihtiyaçtan fazla malzeme kullanımına ve tabiî ki en önemlisi yanlış yorumlar ile akademik yanılgılara, hatalara sebep olunmaktadır [1].. AMAÇ Bu çalışmanın amacı, Meram Tıp Fakültesi hastanesinde çalışan tıpta uzmanlık öğrencilerinin istatistik ve bilimsel araştırma yöntemlerine yönelik tutum-davranış ve kaygılarını tespit etmektir. 3. YÖNTEM ve GEREÇ Bu çalışma, kesitsel ve tanımlayıcı bir çalışmadır. Meram Tıp Fakültesi ve hastanesi sorumluluk alanı içerisinde çalışan uzmanlık öğrencileri gönüllülük esasına göre çalışma evrenini oluşturmuştur. Etik onaylı çalışmada kullanılan anket üç bölümden meydana gelmektedir. Birinci bölüm uzmanlık öğrencilerinin sosyo-demografik bilgilerini içeren sorulardan oluşmaktadır. Anketin ikinci bölümü 33 ifadeden oluşan İstatistiğe Yönelik Tutum Ölçeği ; üçüncü bölüm ise 1 ifadeden oluşan Araştırmaya Yönelik Kaygı Ölçeği nden oluşmuştur [,3]. Her iki ölçek de beşli Likert ile değerlendirilen (1- Kesinlikle katılmıyorum, - Katılmıyorum, 3-Emin değilim, 4- Katılıyorum, 5- Kesinlikle katılıyorum) bir yapıdadır. Ölçeklerdeki ters ifadeler ters puanlanmıştır. Tanımlayıcı ölçülerin hesaplanmasının yanı sıra grup karşılaştırma testleri ve anketin geçerlik ve güvenirlik testleri de yapılmış, p<0.05 anlamlı kabul edilmiştir. 4. BULGULAR Anket uygulamasına katılan 138 uzmalık öğrencisinin yaklaşık %5 si erkek (n=7), %60 ı Konya dışından (n=8), %75 i orta düzey ekonomik duruma sahip (n=101) ve %60 ı (n=8) tez konusunu henüz almamıştır. Uzmanlık eğitimlerinin ilk üç yılında olan %80 civarında katılımcı varken diğerleri 4. ve 5. yıl içerisindeydiler. Tezine henüz başlamamış olanlar ile tezini bitirenlerin oranları birbirlerine eşit ve katılımcıların %0 sini oluşturmuştur. Anket puanlarının gruplara ilişkin ortalama değerleri Çizelge.1 de verilmiştir. Ölçeklerin güvenirlik katsayıları %9 civarındadır. Faktör analizi sonucu elde edilen KMO ve Bartlett testi sonuçları önemli düzeyde anlamlıdır. Uzmanlık eğitim süresinin son yılında istatistiğe yönelik kaygı puanı yüksek iken, bilimsel araştırma yöntemlerine yönelik 60 kaygı puanı ters orantılı olarak düşüktür (r=-0,554; p<0,001).

261 Çizelge.1 Anket puanlarına ilişkin tanımlayıcı ölçüler İstatistiğe Yönelik Tutum Ölçeği Araştırmaya Yönelik Kaygı Ölçeği (Min-Maks=33-165) p (Min-Maks=1-60) p Cinsiyet Erkek Ortalama±ss 100,3±19,54 31,31±10,04 0,561 Bayan Ortalama±ss 98,35±0,50 3,74±9,33 0,387 Memleket Konya Ortalama±ss 97,3±30,5 31,16±8,93 0,316 Konya dışı Ortalama±ss 100,78±19,50 3,56±10,1 0,407 Ekonomik Durum İyi Ortalama±ss 98,57±,06 31,6±10, 0,750 Orta Ortalama±ss 99,8±19,4 3,07±9,54 0,671 Tez konusu Aldı Ortalama±ss 97,68±16,69 33,93±9,66 0,407 Almadı Ortalama±ss 100,54±1,71 30,67±9,56 0,053 Şekil.1 Anket puanlarının eğitim süresine göre ortalamaları 5. TARTIŞMA ve SONUÇ İstatistiğe yönelik kaygı puanlarının tüm gruplarda yüksek olduğu, buna karşın bilimsel araştırma yöntemlerine yönelik kaygının orta düzeyde olduğu göze çarpmaktadır (Şekil.1). Özellikle eğitim sürecinin son yılında tezin sonuçlanması veya bilimsel yayın çalışmalarının artması öğrencilerde bir kaygı oluşturmaktadır. İlk yıllarda yüksek olan bilimsel araştırma kaygı puanı daha sonra yerini analiz kaygısına bırakmaktadır.. KAYNAKLAR [1] Hannigan, A., Hegarty, AC. & McGrath, D. (014), Attitudes Towards Statistics of Graduate Entry Medical Students:The Role of Prior learning Experiences. BMC Medical Education, 14(70):1-7 [] Yaşar, M. (014), İstatistiğe yönelik tutum ölçeği: Geçerlilik ve Güvenirlik Çalışması, Pamukkale Üniversitesi Eğitim Fakültesi Dergisi, 36(): [3] Büyüköztürk, Ş. (1997), Araştırmaya yönelik kaygı ölçeğinin geliştirilmesi, Eğitim Yönetimi, 3(): Anahtar kelimeler: İstatistik, tıpta uzmanlık eğitimi, bilimsel araştırma, tutum, kaygı ATTITUDES AND ANXIETY OF RESIDENTS OF MERAM MEDICAL SCHOOL TOWARDS STATISTICS AND SCIENTIFIC RESEARCH METHODS The importance of biostatistics and the basic knowledge about research methods in the health sciences are known, but generally understood after graduation. The purpose of this study is to determine the attitudes and anxiety levels of postgraduate medical students towards statistics and scientific research methods using SAS and SRMAS scales in Meram Medical School. According to the results, the level of anxiety towards statistics is getting higher in education. Key Words: Statistics, postgraduate medical education, scientific 61 research, attitude, anxiety

262 SESSION 7 EKONOMETRİ 6

263 TURİZM GELİRLERİ ve EKONOMİK BÜYÜME: TÜRKİYE için ARDL ANALİZİ Ersin YILMAZ, Aytaç PEKMEZCİ, Kurtuluş BOZKURT* Muğla Sıtkı Koçman Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Kötekli, MUĞLA *Adnan Menderes Üniversitesi, Söke İşletme Fakültesi, Bankacılık ve Finans Bölümü, Söke, AYDIN Turizm sektörü 0. yüzyılın ikinci yarısından itibaren, özelliklede. Dünya Savaşının bitmesiyle birlikte dünya genelinde hızla gelişen, hizmet sektörünün en önemli alt sektörlerinden birisi olarak karşımıza çıkmaktadır. Günümüzde ise gerek gelişmiş gerekse gelişmekte olan ülkeler için önemli bir döviz kazandırıcı sektör konumundadır. Bunun dışında özellikle imalat ve tarım ana sektörü başta olmak üzere diğer birçok sektöre de önemli dışsallıklar sağlamakta, çevreye duyarlı bir sektör olarak ta sürdürülebilir kalkınmanın sağlanması noktasında başat bir rol oynamaktadır. Dünya Turizm Örgütünün 00 yılında dünya turizm gelirinin trilyon dolar olacağına ilişkin projeksiyonu ülkelerin turizm arz potansiyellerini geliştirerek bu pastadan pay alma veya aldıkları payı büyütme mücadelesine girişmelerine neden olmuştur. Turizm sektörünü geliştirerek ülkelerin gelişmişlik seviyelerine göre ulaşmak istediği hedeflerin farklılık gösterdiğini söylemek mümkündür. Gelişmiş ülkelere bakıldığında söz konusu ülkelerin turizm sektörünün gelir yaratıcı etkisinden yararlanmaya çalıştıkları, gelişmekte olan veya az gelişmiş ülkelerin ise, sektörün döviz kazandırıcı ve yeni istihdam olanakları yaratabilme gücünden yararlanmaya çalıştıkları gözlenmektedir. Zira gelişmekte olan ülkelerin ihracat yapabilmeleri büyük oranda ara ve yatırım malı ithalatına bağlı olduğu için döviz ihtiyacı nedeniyle turizm sektörü önemli bir döviz tedarikçisi sektör olarak değerlendirilmektedir. Türkiye açısında turizm sektörüne bakılacak olursa 1980 yılında ekonomik hayatta yaşanan dışa açılma sürecinin turizm sektörü içinde bir dönüm noktası olduğu söylenebilir. Zira sektörün gelişim profili incelendiğinde 1980 sonrası dönemde ciddi oranda sektöre yönelik yatırımların yapılmaya başlandığı, kronik olarak dış ödemeler bilânçosu açığı veren bir ülke konumunda olan Türkiye açısından döviz kazandırıcı bir sektör olarak gerek istihdamda gerekse yaratmış olduğu net katma değer bağlamında genel ekonomi içerisindeki ağırlığının arttığı görülmektedir. Dolayısıyla turizm sektörü, Türkiye için önemli bir döviz kaynağı olmasının yanında, yeni istihdam olanaklarının oluşturulmasına imkan sağladığı için Türkiye için kronik hale gelen işsizliğin doğal işsizlik oranı seviyelerine düşürülmesinde ve özelikle de yine kronik hale gelen ödemeler dengesi problemlerinin giderilmesinde başat bir rol üstlenmektedir ve bu nedenle de Türkiye nin ekonomik kalkınma stratejisinde önemli bir konuma sahiptir. ARDL(Autoregressive-Distributed Lag) ekonomik zaman serilerinde uzun dönem ilişkiyi gösterebilmek için son zamanlarda kullanılan çok değerli bir araçtır. En basit şekliyle ARDL regresyon modeli Eşitlik 1 deki gibidir; yt 0 1yt 1... p yt p 0xt 1xt 1 xt... q xtq t (1) Burada modelin otoregresif olması demek y nin bir parça da olsa kendi gecikmeleriyle açıklanabilmesidir. Regresyon modelinde açıklayıcı değişken olarak x değişkeninin gecikmeleri kullanılır. Bazı x değerlerinin, gecikmelerin dağılımından çıkartıldığı durumlar olabilir. ARDL modelinin tahmininde OLS yöntemi kullanıldığında regresyon katsayıları yanlı tahmin edilmektedir. Ayrıca OLS tahminleri tutarsız olmaktadır. ARDL yönteminin kullanılmasının en önemli nedenlerinden biri düzeyde durağan olan ve olmayan serilerin birlikte analiz edilebilmesidir. Ayrıca veri sayısının çok az olduğu durumlarda da kullanılabilmektedir. Fakat yine de çok az veri olduğunda ARDL yöntemi seriler arasında eşbütünleşme araştırırken yetersiz kalmaktadır. ARDL yöntemini kullanarak uzun süreli ilişki belirlemek için birkaç varsayım ve kurala uyulması gerekmektedir. Bunların başında gelenlerden bir tanesi hataların serisel bağımsız olmasıdır. Ayrıca düzeyde durağan olmayan serilerin en fazla birinci farkları alındığında durağan olmaları gerekmektedir. Ayrıca modelin dinamik kararlı olması gerekmektedir. Çalışmanın analiz kısmında, Türkiye için 003:01-015:01 dönemini kapsayan Türkiye İstatistik Kurumunun İstatistik Veri Tabanlarından elde edilen turizm 63 gelirleri ve GSYİH (Gayri Safi Yurtiçi Hâsıla) serilerinin logaritmik değerleri kullanılarak bir veri seti oluşturulacaktır. Ayrıca ARDL analizi yapılarak değişkenler arasında uzun dönemli ilişki olup olmadığı analiz edilecektir. KAYNAKLAR

264 [1] Bahar, O. and Kozak M. (007). Advancing Destination Competitiveness Research: Comparison Between Tourists and Service Providers, Journal of Travel and Tourism Marketing, (): [] Bahar, O. ve Bozkurt, K. (010). Gelişmekte Olan Ülkelerde Turizm-Ekonomik Büyüme İlişkisi: Dinamik Panel Veri Analizi, Anatolia: Turizm Araştırmaları Dergisi, 1 (): [3] Pesaran, Shin and Smith, (001), Bounds Testing Approaches to the Analysis of Level Relationships Journal of Applied Econometrics. 16: [4] Bozkurt, K. ve Pekmezci, A. (015), Turizm Talebi Ve Döviz Kuru Şokları: Türk Turizm Sektörü İçin Ekonometrik Bir Analiz, Osman Gazi Ün. İİBF Dergisi, Ağustos, Cilt: 10-. [5] Bozkurt, K. ve Bahar, O. (015). Talep Şokları: Türk Turizm Sektörü İçin Bir Analiz, Anatolia: Turizm Araştırmaları Dergisi, 6 (1). TOURISM RECEIPTS AND ECONOMIC GROWTH: THE ARDL ANALYSIS FOR TURKEY ABSTRACT The process of globalization that has come within inevitable changes about countries sectoral situations. One of that changes is a passing through the service sector from the industry sector. Especially management, technique that based on a information and technology and professional individuals are in a service sector. With this on the other hand tourism sector that is may be called a sub-service sector have enhanced itself for foreign exchange earnings. In this context the objective of this study that analyzes a relationship between tourism receipts and economic growth between two dates that 003:01-015:01. For that, time series have been created that compass between 003:01-015:01 and ARDL analysis has been done. Key Words: Tourism Receipts, Economic Growth, ARDL Analysis. 64

265 Petrol Fiyatlarının Seçilmiş Petrol İhracatçısı ve İthalatçısı Ülkelerin Makroekonomisine Etkileri: Panel Veri Analizi Nezir KÖSE* Gazi Üniversitesi, İ.İ.B.F., Ekonometri Bölümü, 06500, Ankara, Türkiye, Sabit BAİMAGANBETOV Hoca Ahmet Yesevi Üniversitesi, Ekonomi Bölümü, Türkistan, Kazakhistan, Petrol fiyatlarındaki dalgalanmaların ekonomik faaliyetler üzerinde etkili olduğuna dair geniş bir literatür bulunmaktadır. Özellikle, 1973 yılında petrol fiyatlarında meydana gelen şokun devamında gelişmiş ülkelerde yaşanan ekonomik durgunluk, petrol fiyatlarının ekonomik büyüme üzerindeki etkilerini ampirik olarak araştıran çalışmaların yapılmasına neden olmuştur. Petrol ithalatçısı ve ihracatçısı ülkelere göre etkilerin farklılık göstereceği beklenmektedir. Petrol fiyatlarındaki artışlar ihracatçı ülkeler için iyi haber iken ithalatçı ülkeler için kötü haber olmaktadır. Buna karşın petrol fiyatlarında düşüş olduğunda durum tersine dönmektedir. Hamilton (1983) çalışmasında İkinci Dünya Savaşı sonrasında Amerika Birleşik Devletleri nde yaşanan sekiz ekonomik durgunluktan yedisinin petrol fiyatlarında yaşanan büyük artışlara bağlı olarak açıklanması, petrol ithalatçısı gelişmiş ülkeler üzerine yapılan ampirik çalışmalarda hızlı bir gelişime neden olmuştur. Bu çalışmalardan bazıları Gisser ve Goodwin (1986), Mork (1989), Lee vd. (1989), Bernanke vd. (1997), Hamilton (003), Hamilton and Herrera (004), Jimenez-Rodriguezand Sanchez(004), Hsing (009) olarak sıralanabilir. Bu çalışmalardan elde edilen bulgular, petrol fiyatlarındaki artışların petrol ithalatçısı ülkelerin ekonomik büyümesi üzerinde negatif etkiye sahip olduğuna işaret etmektedir. Buna karşın petrol ihracatçısı ülke veya ülkeler grubu üzerine yapılan ampirik çalışmalar petrol fiyatları ile ekonomik büyüme arasındaki ilişkinin genel olarak pozitif yönde olduğunu göstermektedir. Örneğin, Ortadoğu ve Kuzey Afrika ülkelerinin incelendiği Berument vd. (010) çalışması, Bahreyn, Mısır, Lübnan, Fas ve Yemen hariç petrol ihracatçısı ülkelerden dokuzu için petrol fiyatlarındaki şokların ekonomik büyüme üzerinde pozitif etkisi olduğunu göstermiştir. Petrol fiyatlarının ülkelerin makroekonomik göstergelerine etkilerini panel veri analizine dayalı olarak araştıran çalışmalar sınırlı sayıdadır. Bu çalışmalardan bazıları Lescaroux ve Mingo (008), Jayataman ve Lau (011), Mehrara ve Mohaghegh (011), Akıncı, Aktürk ve Yılmaz (01), M. S. Mohammadi ve H. Mohammadi (013), Yardımcıoğlu ve Gülmez (013), Mercan ve Göçer (014) olarak sıralanabilir. Bu çalışmada 14 petrol ihracatçısı ve 15 petrol ithalatçısı ülkenin yılları arasındaki üçer aylık zaman serisi verileri kullanılarak petrol fiyatlarının ekonomik büyüme, reel döviz kuru ve enflasyon üzerindeki etkileri panel veri analizi ile incelenmiştir. Bu ülkeler ekonomik gelişmişlik düzeylerine göre gruplara ayrılarak panel veri analizleri gerçekleştirilmiştir. Buna göre gelişmekte olan petrol ihracatçısı ülkeler Azerbaycan, Nijerya, İran, Ekvator, Kolombiya, Kazakistan, Malezya, Meksika ve Venezüella iken gelişmiş petrol ihracatçısı ülkeler ise İngiltere, Kanada, Norveç, Rusya ve Suudi Arabistan olarak sınıflandırılmıştır. Gelişmekte olan petrol ithalatçısı ülkeler Hindistan, Çin, Türkiye iken gelişmiş petrol ithalatçısı ülkeler grubu ABD, Almanya, Avustralya, Belçika, Güney Kore, Fransa, İtalya, Hollanda, Japonya, Norveç, İsveç ve Singapur olarak sınıflandırılmıştır. Analizde kullanılan değişkenlerle ilişkin veriler Uluslararası Para Fonu nun (IMF) Uluslararası Finans İstatistikleri (IFS), Datestream, Bloomberg, Türkiye Cumhuriyeti Merkez Bankası, NBK, Venezüella Merkez Bankası, İran İslam Cumhuriyeti Merkez Bankası, Hindistan Merkez Bankası, Azerbaycan Merkez Bankası, Bank for International Settlements (BİS) veri tabanlarından alınmıştır. Brent ham petrol fiyatına ilişkin veriler Uluslararası Enerji Ajansı veri tabanından alınmıştır. Birinci nesil panel birim kök testleri hata terimleri arasında yatay-kesit bağımlılığın olmadığı varsayımı altında yapılmakta iken ikinci nesil panel birim testleri bu bağımlılığı dikkate almaktadır. Bu nedenle yatay-kesit bağımlılık Friedman (FR), Frees (FRS) testleri ile araştırılmıştır. FR ve FRS testleri sonucunda sıfır hipotezi reddedilmiş ve böylece yatay-kesit bağımlılığın var olduğu kabul edilmiştir. Çalışmada ele alınan değişkenlerin bütünleşme sıraları yatay-kesit bağımlılığı dikkate alan Pesaran (007) panel birim kök testi ile araştırılmıştır. Bu testten elde edilen bulgular reel gayri safi yurt içi hâsıla, 65 reel döviz kuru ve tüketici fiyat endeksi serilerinin birinci sıra fark durağan diğer bir ifadeyle bütünleşme sıralarının 1 olduğunu göstermiştir. Brent petrol fiyatı ve çalışmada ele alınan makroekonomik göstergeler arasındaki uzun dönemli ilişkiler Westerlund (007) eş-bütünleşme testi ile araştırılmıştır. Elde edilen bulgular petrol ihracatçısı ülkelerin

266 ekonomik büyüme ve reel döviz kuru üzerinde petrol fiyatların etkili olduğunu göstermiştir. Buna karşın gelişmekte olan petrol ithalatçısı ülkelerin ekonomik büyüme, reel döviz kuru ve hatta enflasyonu üzerinde petrol fiyatlarının anlamlı bir etkiye sahip olmadığı belirlenmiştir. Bu sonuçlar petrol fiyatlarındaki gelişmelerin özellikle petrol ihracatçısı ülkelerin makroekonomik performansı üzerinde etkili olduğuna işaret etmektedir. Anahtar Kelimeler: Petrol fiyatları, Panel eşbütünleşme, Yatay kesit bağımlılığı Kaynaklar 1. Akıncı, M., E. Aktürk ve Ö. Yılmaz (013), Petrol Fiyatları İle Ekonomik Büyüme Arasındaki İlişki: OPEC ve Petrol İthalatçısı Ülkeleri İçin Panel Veri Analizi, Uludağ Üniversitesi İktisadi ve İdari Bilimler Fakültesi Dergisi, Cilt/Vol. XXXI, Sayı/No., Berument, H., N. B. Ceylan, and N. Dogan (010) The Impact of Oil Price Shocks on the Economic Growth of the Selected MENA countries, The Energy Journal. 31(1), Lescaroux, F. and V. Mignon (008) On the Influence of Oil Prices on Economic Activity and Other Macroeconomic and Financial Variables, CEPII, Working Paper No: Mercan, M. ve İ. Göçer (014), Ticari Dışa Açıklığın Ekonomik Etkileri: Orta Asya Ülkeleri İçin Ampirik Bir Analiz, Uluslararası Yönetim İktisat ve İşletme Dergisi, Cilt 10, Sayı, Westerlund J. (007), Testing for Error Correction in Panel Data, Oxford Bulletin of Economics and Statistics,Vol. 69, Issue 6, pages The impact of oil price on macroeconomics in the selected oil importing and oil exporting countries: A panel data analysis The effects of oil price on macroeconomics are expected to be different in oil importing and in oil exporting countries. Namely, an oil price increase (decrease) should be considered good (bad) news in oil exporting countries and bad (good) news in oil importing countries. This paper assesses empirically the effects of real Brent oil price on the economic growth, real exchange rate and inflation for the quarterly period in 14 oil importing and in 15 oil exporting countries by using Westerlund (007) panel co-integration test. The empirical findings show that the oil prices have an impact on economic growth and real exchange rate for oil exporting countries. On the other hand, oil prices have not significant impacts on macroeconomics for oil importing countries. Key Words: Oil prices, Panel cointegration, Cross section dependency 66

267 Kendinden Uyarımlı Eşik Otoregresif Modeller (Self-Exciting Threshold Autoregressive Models) Kapsamında Doğrusal Olmayan Döviz Kuru Modellemesi Emrah Hanifi FIRAT Fırat Üniversitesi, İİBF, İktisat Bölümü, Elazığ, Türkiye Dışa açık ekonomilerde makroekonomik bir değişken olarak döviz kurlarının sayısal değeri, özellikle ekonomiler arası karşılıklı bağımlılık dikkate alındığında büyük önem arz etmektedir. Politik ekonomi cephesinden tahlil edildiğinde makroekonomik tasarımdaki fotoğrafı bozmamak için çaba sarf eden ve özellikle ihracat güdümlü büyüme karakteristiğine sahip olan ekonomilerde döviz kurlarının hedeflenen seviyesi hayati önem taşımaktadır. Küresel ölçekte bakıldığında döviz kuru rejimi ve politikalarının paritelere yansıyan sayısal değerleri, kur politikasını uygulayan ülkeden diğer ülkelere doğru resesyonist bir etki dahi doğurabilmektedir. Bu anlamda egemen ekonomilerin takip edecekleri kur politikaları diğer dünya ekonomilerini manipüle edecek, global ekonomik projeksiyonu bir anda değiştirebilecektir. Makro politikalar bakımından bu kadar önemli olan döviz kurları diğer makro ekonomik değişkenler ile de yakın temas halindedir. Ancak bu durum döviz kurunun (t+1). dönemdeki değerinin ne olacağı problemini halletmemekte, stokastik niteliği bulunan bir değişkeni yine stokastik başka bir değişkenle izah etmek anlamına gelmektedir. Bu durumda sorun çığ gibi büyüyecektir. Tam bu noktada döviz kuru tahmininin neden önemli olduğunu anlatmaktan daha öteye gitmemiz gerekmektedir. Ayrıca konuyu sadece ekonometrik bir neden sonuç olayı olarak düşünmek de kısıtlı sayıda veya bilinemeyecek olan stokastik bağımsız değişkenlerle uğraşmak anlamına gelecektir. Bu yüzden ekonometrik boyuta ilaveten zaman serileri analizi boyutunun da modelleme sürecine dâhil edilmesi gerekmektedir. Her zaman serisinin kendi içsel dinamiklerine (bazen bu dinamikler zaman serisi bileşenleri olarak da ifade edilir) duyarlı bir yapısının olduğu düşünüldüğünde bu dinamikler tahmin açısından koordinat vermekte ve başka dışsal değişkenlere olan zaruri bağımlığı ciddi oranda ortadan kaldırabilmektedir. Bu çalışmada tam olarak yapılan da budur. Forex (foreign exchange) piyasası bahsi geçen döviz kurlarının alınıp satıldığı anlık veya uzun vadeli işlem yapılabilen spot bir döviz kuru piyasasıdır. Dünyanın en büyük işlem hacmine sahip piyasası konumundaki Forex piyasası zaman serileri deneyiminin herhalde en güzel yaşanabileceği veri madenlerinden biri durumundadır. Forex piyasası tasarruf sahipleri açısından da büyük kaldıraç oranları eşliğinde çok ciddi bir hareket sahası sağlamaktadır. Buradan aslında şu önemli noktaya vurgu yapmak istenilmektedir. Ekonomilerdeki döviz kuru paritelerinin önemi sadece dış ticarete verdikleri hareketlilikle kalmamakta aynı zamanda bireysel ve kurumsal tasarruf sahiplerinin de ciddi anlamda ilgisini çekmektedir. Bu yüzden bu çalışmada döviz kuru paritelerinin tahmini, yatırımcılar için de farklı ve çok ciddi bir teknik analiz niteliği taşımaktadır. Bu çalışmada tahmini gerçekleştirilen modelleme yaklaşımının çok uzak olmayan bir gelecekte Forex yatırım platformlarına da dahil olacağı beklentisi ayrıca muhafaza edilmektedir. Bu çalışmada öncelikle konu ile alakalı doğrusal zaman serileri analizi kapsamlı bir şekilde verilmiş, bu analize dair sonuçlar ile betimsel istatistikler ilgili döviz kuru pariteleri için ayrı ayrı zaman dilimlerinde verilmiştir. Ardından, doğrusal olmayan zaman serileri analizine öncelikle doğrusallık testleri bağlamında değinilmiş ve doğrusallık testleri yine tüm pariteler için ayrı ayrı zaman dilimleri için uygulanmıştır. Daha sonra çalışmanın konu başlığı olan SETAR modellemesi detaylı olarak doğrusal olmayan örüntüyü açıklamak için tatbik edilmiştir. SETAR modelleme süreci ve bu modele ait diğer tanısal istatistiki analizler, tüm paritelerde ayrı ayrı zaman dilimleri için uygulanmıştır. KAYNAKLAR [1] Dickey, David A., Fuller Wayne A. (1979), Distribution of the Estimators for Autoregressive Time Series With a Unit Root, Journal of the American Statistical Association, Vol. 74, No. 366, pp [] Nelson, C.R., Plosser C.I. (198), Trends and random walks In Macroeconomic Time Series, Journal of Monterey Economics, 10, pp [3] Gimeno R., Manchado B., Minguez R. (1999), Stationarity Test for Financial Time Series, Physica, A 69 (1999) 7-78 [4] Zivot, E. and Andrews, K. (199), Further Evidence 67 On The Great Crash, The Oil Price Shock, and The Unit Root Hypothesis, Journal of Business and Economic Statistics, Vol. 10, No: 3, pp

268 Amerika Makro Veri Açıklamalarının Altın Fiyatları Üzerine Etkisi Emre SARI T.C. Merkez Bankası, Piyasalar Genel Müdürlüğü, 06100, Ankara, Türkiye, Yeliz YALCIN* Gazi Üniversitesi, İktisadi ve İdari Bilimler Fakültesi, Ekonometri Bölümü, 06500, Ankara, Türkiye, Yüksek frekanslı verilerin ulaşılabilir olmasıyla birlikte makroekonomik verilerin piyasalarda yarattığı etki daha hassas bir şekilde incelenebilmektedir. Literatürde makroekonomik veri açıklamalarının döviz piyasalarına, hisse piyasalarına, bono piyasaları ve onların oynaklıklarına etkilerini inceleyen çalışmalar son yıllarda artmaktadır (i.e. Balduzzi, Elton, and Green, 001; Boyd, Hu, and Jagannathan, 005; Andersen, Bollerslev, Diebold, and Vega, 003). Ancak bu açıklamaların altın, gümüş gibi emtia fiyatları üzerine etkisini incleyen çalışmaların sayısı sınırlıdır (i.e. Hess ve diğerleri, 008; Roache ve Rossi, 010; Elder ve diğerleri, 01). Düşük oynaklığa sahip olan altının bu verilerle olan etkileşimini analiz edebilmek için uygun bir modelle birlikte yüksek frekanslı verinin kullanılması önemlidir. Çalışmalar genel olarak incelendiğinde döviz, hisse senedi ve bono piyasalarına nazaran emtia piyasalarını anlamlı düzeyde etkileyen makroekonomik açıklamaların daha az sayıda olduğu görülmektedir (Hess ve diğerleri, 008). Emtia fiyatları üzerine yapılan çalışmaların ve elde edilen bulguların kısıtlı olmasının en büyük nedeni yüksek frekanslı gün içi verilere ulaşma zorluğudur. Bununla birlikte, özellikle altınla ilgili yapılan çalışmaların çoğunda günlük veri kullanılması nedeniyle makroekonomik açıklamaların etkileri gün boyu gerçekleşen diğer olayların etkileriyle karışmış, bu durum da anlamlı değişken sayısını azaltmıştır. Çalışmanın amacı, merkez bankaları için önemli bir yatırım aracı olan altının fiyatının hangi makroekonomik açıklamalardan daha fazla etkilendiğini anlamak, özelde altın piyasasının davranışını incelerken diğer piyasalar hakkında da bazı genel çıkarımlar yapmak, bir makroekonomik açıklamanın piyasada neden olduğu etkiyi şiddeti, yönü ve hızı açısından incelemek, olumlu ve olumsuz gelen verilerin muhtemel asimetrik etkisini incelemek, nispeten kısıtlı çalışmanın olduğu bu alanda literatüre katkı sağlamak ve altın piyasasının yeni bilgiyi işlemede etkin olup olmadığını araştırmaktır. Ocak 008 Şubat 015 yılları arasında altın spot fiyatı ile ABD de açıklanan makroekonomik veriler arasındaki ilişki EGARCH (1,1) modeli ile analiz edilmiştir. Çalışmada altın fiyatı olarak Bloomberg tarafından sağlanan 15 dakikalık ABD Doları cinsinden altın spot fiyatı, ayrıca ABD Doları endeksi, ABD ye ait 17 adet makroekonomik değişken gerçekleşmeleri ve beklentileri kullanılmıştır. Makroekonomik haberlerden kaynaklanan fiyat hareketlerini analiz edebilmek için makroekonomik beklentilerde değişikliklere neden olabilecek sürpriz haberlerin incelenmesi gerekmektedir. Sürprizlerin büyüklüğü ile fiyat hareketlerinin büyüklüğü arasında doğru orantılı bir ilişki olması beklenmektedir. Makroekonomik veriler farklı birimlerdedir. Örneğin işsizlik oranı yüzde ile ifade edilmekte iken tarım dışı istihdam milyonlarla ifade edilen bir sayıdır. Sürprizlerin büyüklüklerinin kolayca karşılaştırılabilir olması için sürpriz değişkenlerinin uygun şekilde tanımlanması gerekmektedir. Çalışmada Balduzzi ve diğerleri (001) ve Andersson ve diğerleri (009) tarafından da tercih edilen S i,t = 100 G i,t B i,t σ i[g B] Tanımlama kullanılmıştır. Burada S i,t : t periyodunda i makroekonomik verisinin sürpriz değişkeni değeri; G i,t veb i,t : t periyodunda i makroekonomik verisinin gerçekleşen ve beklenen değeri; σ i[g B] i makroekonomik verisinin tahmin hatasının standart sapmasıdır. Sürpriz değişkenlerin altın spot fiyatlarındaki ve oynaklığı üzerindeki etkilerini görebilmek için EGARCH(1,1) modeli log(σ t ) = ω 0 + δlog(σ t 1 ) + γ ε t 1 + α [ ε t 1 ] σ t 1 68 σ t 1 kullanılmıştır. Asimetrik etkiyi dikkate alan EGARCH modeli ilk olarak Nelson (1991) tarafından önerilmiştir. Modeldeki α katsayısı simetrik etkinin büyüklüğü ile ilgili bilgi vermektedir. δ katsayısı ise oynaklıktaki süreklilik eğilimi hakkında bilgi verir. Eğer δ katsayısı büyükse bir şok ardından yaşanan oynaklık artışının normale dönmesi uzun zaman alacaktır (Alexander, 009). γ terimi ise getiri şoklarının neden

269 olabileceği asimetrik etki hakkında bilgi verir. Örneğin getiri ile oynaklık arasında ters yönlü bir ilişki varsa γ < 0 olur. Asimetrik etkinin olmadığı durumlarda γ = 0 dır. γ < -1 olması durumunda ise negatif şoklar oynaklığı artırırken pozitif şoklar oynaklığı azaltmaktadır. Çalışma sonunda ABD de açıklanan verilerin büyük çoğunluğunun altın getiri ve oynaklığını etkilediği anlaşılmıştır. Açıklamalar içinde özellikle ekonomik istihdam ve ekonomik aktivite seviyesi hakkında bilgi içerenlerin ve enflasyon oranının altın fiyatı üzerinde daha etkili olduğu anlaşılmıştır. Elde edilen bulgular altın piyasasının etkin çalıştığı tezini desteklemektedir. Kaynaklar Balduzzi, P.,Elton, E ve Green, C. (001). Economic News and Bond Prices: Evidence from the U.S. Treasury Market. Journal of Financial and Quantitative Analysis, vol. 36,No.04, pp Nelson, B. D. (1991). Conditional Heteroskedasticity in Asset Returns: A New Approach. Econometrica, 59, pp Nowak, S., Andritzky, J., Andreas, J. ve Tamirisa, N. (009). Macroeconomic Fundamentals, Price Discovery and Volatility Dynamics in Emerging Markets. Erişim 15 Ocak 014, IMF Working Papers, vol., pp ft/wp/009/wp09147.pdf. Anahtar Kelimeler: EGARCH Modelleri, Altın Getirisi, Makroekonomik Açıklamalar The Effects of US Macroeconomic Announcements on Gold Prices Abstract: In this study, the impact of US macroeconomic announcements on gold spot price is examined for period. Impact of announcements on return and volatility of gold spot price, the time needed for price adjustment, the asymmetric effects of positive and negative macroeconomic news are analyzed using high frequency data with an EGARCH model. In addition USD Index is added to the model to control for exchange rate effect. The primarily results reveal that, majority of US news affects both return and volatility of gold price. Gold market is efficient in absorbing new information. Keywords: EGARCH Models, Gold Return, Macroeconomic Announcements 69

270 SESSION 7 ÇEŞİTLİ KONULAR 70

271 HESAPLAMALI YAKLAŞIM METODUYLA İNVERSE GAUSSİAN DAĞILIMININ ÖLÇEK PARAMETRELERİNİN HOMOJENLİĞİ İÇİN BİR TEST Hasan Hüseyin GÜL, Hülya BAYRAK, Fikri GÖKPINAR, Esra Yiğit GÖKPINAR, Hakan Tahiri MUTLU Gazi Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 06500, Ankara, Türkiye ve parametreli Inverse Gaussian (IG) dağılımının olasılık yoğunluk fonksiyonu aşağıdaki gibidir: 1/ f ( x,, ) exp ( ), 0,, 0 3 x x x x burada ortalama parametresi ve ise ölçek parametresidir. Olasılık dağılımı ile ilgili ilk olarak Schrödinger ve Smoluchowski tarafından verilen Brownian hareketi ile bahsedilmiştir. Tweedie, IG dağılımının kümülant üreten fonksiyonu ile normal dağılımın kümülant üreten fonksiyounu arasında ters bir ilişki olduğunu göstermiştir. Wald ardışık olabilirlik oran testinin ortalama örnek sayısının (ASN) dağılımı ile IG dağılımının ilişkisini elde etmiştir. Bu sebepten dolayı IG dağılımı Wald dağılımı olarak da bilinir. IG dağılımı kardiyoloji, finans ve yaşam testleri gibi birçok alanda karşımıza çıkan sağa çarpık verilerin analizinde geniş şekilde kullanılmaktadır. IG dağılımı ile ilgili yaygın olarak ele alınan problemlerden biri ortalamaların eşitliğinin test edilmesidir. Bu problemle ilgili en çok kullanılan testlerden biri ANORE F testidir. Heterojenlik altında ortalamaların eşitliğinin tesi için Weeranhandi genelleştirilmiş test önermiştir. Heterojenlik altında ölçek parametrelerinin ortalamalarının eşitliğinin test edilmesi için Tian [1] genelleştirilmiş p değerine dayanan bir test ileri sürmüştür. Ma ve Tian [] bu problem için bir parametrik bootstrap yaklaşımı önermiştir. Gökpınar ve ark. [3] heterojenlik altında ortalamaların eşitliğinin testi için yeni bir hesaplamalı yaklaşım testi geliştirmişlerdir. Bu çalışmada k IG ölçek parametrelerinin homojenliğinin test edilmesi problemi ele alınmıştır. i ortalamalı, i ölçek parametreli, i=1,,,k, k bağımsız IG yığını olsun. X i1, X i,..., X in i, IG( i, i ), i=1,,,k, dağılımından rasgele bir örneklem olsun. Homojenlik testi için hipotezler aşağıdaki gibidir: H 0 : 1... k H1 : en az bir i farklı. Ölçek parametrelerinin homojenliğinin test edilmesi problemi için Chhikara ve Folks [4] tarafından Bartlett yaklaşımını kullanarak yaklaşık testi (CFT) geliştirilmiştir. Liu ve He [5] tarafından Weerahandi nin genelleştirilmiş test metoduna dayalı olarak genelleştirilmiş olabilirlik oran testi (GLR) önerilmiştir. Son zamanlarda, hesaplamalı yaklaşım testi birçok farklı istatistik problemine uygulanabilmektedir. Bu yöntem yokluk hipotezinin doğruluğu altında kısıtlı en çok olabilirlik tehmin edicisine dayalı olup test istatistiğinin dağılımını teorik olarak elde etmek gerekmemektedir. Bu çalışmada, IG dağılımının ölçek paramterelerinin homojenliğinin test edilmesi için yeni bir hesaplamalı yaklaşım testi önerilmiştir. Önerilen bu test istatistiği CFT ve GLR testleri ile farklı örnek çapları, ortalama ve ölçek parametreleri altında I. tip hata ve testin gücü balımından bir karşılaştırılması yapılmıştır. Simülasyon 71 sonuçlarında, önerilen test istatistiği I. tip hata oranı bakımından tatminkar, testin gücü bakımından ise hemen hemen her durumda diğer testlerden daha iyi sonuçlar vermiştir.

272 KAYNAKLAR [1] L. Tian. (006), Tesitng equality of inverse Gaussian means based on the generalized test variable, Computational Statistics and Data Analysis 51, pp [] C. Ma, and L. Tian. (009), A parametric bootstrap approach for testing equality of inverse Gaussian means under heterogeneity, Communication in Statistics-Simulation and Computation, 38, pp [3] E.Y. Gökpınar, E. Polat, F. Gökpınar, and S. Günay. (013), A new cumputational approach for testing equality of inverse Gaussian means under heterogeneity, Hacettepe Journal of Mathematics and Statistics, 4 (5), pp [4] R.S. Chhikara, and J.L. Folks. (1989), The inverse Gaussian distribution, New York: Dekker. [5] X. Liu, and D. He. (01), Testing homogeneity of inverse Gaussian scale parameters based on generalized likelihood ratio, Communications in Statistics-Simulation and Computation, 4, pp ABSTRACT A NEW TEST FOR HOMOGENEITY OF SCALE PARAMETERS FOR INVERSE GAUSSIAN DISTRIBUTION BASED ON COMPUTATIONAL APPROACH TEST In this study, a new testing prodecure based on computational approach test is proposed for testing homogeneity of scale parameters from k inverse Gaussian populations. Simulation results are presented to compare the performances of the proposed method and existing methods in terms of type I error rates and powers of tests. Our simulations results indicate that our proposed test has excellent type I error rates and power performance. Key Words: Inverse Gaussian distribution, ANORE F test, cumputational approach test 7

273 HOMOJEN OLMAYAN VARYANS VARSAYIMI ALTINDA VARYANS ANALİZİ İÇİN YENİ BİR HESAPLAMALI YAKLAŞIM TESTİ Hakan Tahiri MUTLU, Fikri GÖKPINAR, Esra GÖKPINAR, Hasan Hüseyin GÜL Gazi Üniversitesi Fen Fakültesi İstatistik Bölümü Tek yönlü varyans analizi (ANOVA) normal dağılımdan seçilen ikiden fazla bağımsız grubun ortalamaları arasındaki farkın anlamlılığının test edilmesinde kullanılır. Bu yöntemde, herbiri normal dağılımdan gelen k adet yığından n hacimli bağımsız tesadüfi örnekler seçildiğinde, bu örneklerin ortalamalarından hareketle yığın ortalamalarının birbirinden farklı olup olmadığı test edilirken yokluk ve alternatif hipotezler aşağıdaki gibi olur: H 0 : Ortalamalar arasında fark yoktur. H 1 : En az iki ortalama arasında anlamlı bir farklılık vardır. Tek yönlü varyans analizi normallik, bağımsızlık ve yığın varyanslarının homojenlik varsayımına dayanır. Bu varsayımlar arasından özellikle varyansların homojenliği varsayımı sağlanmadığında ve örnek çapları farklı iken klasik F testinin kullanılması uygun olmamaktadır. Çünkü yapılan çalışmalarda klasik F testinin bu durumdan çok etkilendiği ve deneysel 1.nci tip hatasının nominal değerinin çok üzerinde çıktığı gözlemlenmiştir. Bununla birlikte varyanslar arasındaki fark çok büyük olduğunda, klasik F testinin gücü bu durumdan etkilenmekte ve oldukça düşmektedir. Böyle bir durumda veriler dönüşüm yoluyla varyans analizi tekniğine uygun hale getirilebileceği gibi uygun bir parametrik olmayan yöntemle de çözülebilir. Bunula birlikte varyans analizine alternatif parametrik yöntemler de kullanılabilir. Literatürde bu problemi ortadan kaldırmak için kesin, asimptotik ve yeniden örneklemeye dayalı birçok test istatistiği geliştirilmiştir. Bu test istatistiklerinin bazılarının dağılımı tam olarak bilinirken bazılarının dağılımı simülasyon yoluyla yaklaşık olarak bulunmaktadır. Varyansların homojenliği varsayımının sağlanmadığı durumda normal dağılımdan gelen ikiden fazla yığının ortalamalarının eşitliği hipotezinin testi Behrens-Fisher problemi olarak bilinmektedir. Bu problemin çözümü için önerilen ilk testlerden Welch (1947) in geliştirdiği test, kesin testlerde yaygın olarak kullanılan yöntemlerden birisidir. Welch (1951) bu testi k yığının ortalamasının eşitliğine ait hipotezin testi için genelleştirmiştir. Daha sonraları bu problemin çözümü için Scott ve Smith (1971) tarafından yine kesin testlerden biri olan Scott-Smith test istatistiği geliştirilirken, Brown-Forsythe (1974) tarafından klasik F testinin bir uyarlaması olan Brown-Forsythe testi önerilmiştir. Ayrıca Weerahandi (1995), yeniden örneklemeye dayalı Genelleştirilmiş F testini geliştirmiştir. Bu konuda yapılan çalışmalar incelendiğinde Gamage ve Weerahandi (1998) simülasyon yoluyla Genelleştirilmiş F testini, klasik F, ağırlıklandırılmış F, Welch ve BrownForsythe testleri ile karşılaştırmışlardır. Gerami ve Zahedian (001) ise çalışmasında Welch testi, Scott-Smith testi, Weerahandi nin Genelleştirilmiş F testi ve Chen ve Chen (1998) tarafından önerilen Tek Aşamalı testlerin karşılaştırmasını simülasyon yoluyla yapmışlardır. Yakın zamanda da Gökpınar ve Gökpınar (01) hesaplamalı yaklaşım testine dayalı önerdikleri test istatistiği ile Welch, Brown-Forsythe, Genelleştirilmiş F ve parametrik bootstrap yöntemlerini karşılaştırmışlardır. Bu çalışmada, bu sorunun çözümü için parametrik bootstrap yönteminin özel bir hali olan hesaplamalı yaklaşım testine (Computational Approach Test-CAT) dayalı yeni bir test istatistiği önerilmiştir. Bu yöntem, yokluk hipotezinin doğruluğu altında kısıtlı en çok olabilirlik tahmin edicisine dayalıdır. Ayrıca, test istatistiğinin dağılımını teorik olarak bulmak gerekmediğinden ve p değerini doğrudan elde ettiğinden dolayı kullanımı kolay bir yöntemdir. 73 Bu çalışmada önerilen CAT yöntemine dayalı yeni test istatistiği farklı yığın çapları, yığın ortalamaları ve yığın varyansları altında deneysel I.tip hata oranı ve testin gücü bakımından diğer testlerle karşılaştırılmıştır. Elde edilen sonuçlarda, önerilen bu testin diğer testlerden birçok durumda daha iyi sonuçlar verdiği görülmüştür.

274 KAYNAKLAR [1] Brown, M.B. ve Forsythe, A.B. (1974). The small sample behavior of some statistics which test the equality of several means. Technometrics 16, [] Gamage, J. ve Weerahandi, S. (1998). Size performance of some tests in one-way ANOVA Communications in Statistics and Simulations 7(3), [3] Scott, A.J. ve Smith, T.M.F. (1971). Interval estimates for linear combinations of means. Applied Statistics 0(3), [4] Weerahandi, S. (1995). Exact statistical method for data analysis. Springer-Verlag, NewYork, -50. [5] Welch, B.L. (1947). The generalization of student s problem when several different population variances are involved. Biometrika 34, ABSTRACT A New Computational Approach Test For ANOVA Under Heteroscadasticity This paper proposes a new test statistic based on the computational approach test (CAT) that is a special case of the parametric bootstrap. This proposed test was compared with other tests in type I error and power under different combinations of variances, means, population numbers and sample sizes. In the result, it was observed that the proposed test yields better results than other tests in many cases. KeyWords: Computational approach test, one-way anova, Generalized F test, Parametric Bootstrap test 74

275 HETEROJENLİK ALTINDA ÇOK DEĞİŞKENLİ İKİ GRUP ORTALAMA VEKTÖRLERİ FARKI İÇİN YENİ TEST Sezen KARANFİL, Fikri GÖKPINAR, Esra GÖKPINAR, Hakan Tahiri MUTLU Gazi Üniversitesi Fen Fakültesi İstatistik Bölümü Çok değişkenli analiz yöntemlerin en önemlilerinden biri olan çok değişkenli varyans analizi (MANOVA), bir kategorik değişkenin birden çok bağımlı değişken üzerine etkisini araştırır. Bu analizde, kategorik değişkenin düzeyleri gruplar gibi düşünüldüğünde, bu değişkenler bakımından, grup ortalamaları arası farklılık çok değişkenli varyans analizi ile test edilir. Çok değişkenli varyans analizinde temel varsayımlar aşağıdaki gibi verilebilir. 1) Rasgele örnekler çok değişkenli normal dağılımdan gelir. ) Tüm gruplar için çok değişkenli normal dağılımının kovaryans matrisleri homojendir. 3)Gözlemler birbirinden bağımsızdır. Çok değişkenli varyans analizinde, kovaryans matrislerinin eşitliği varsayılarak, ortalama vektörlerinin eşitliğini test etmek için bazı popüler testler kullanılmaktadır. Bunlar; Roy un en büyük kök istatistiği (1945), Lawley-Hotelling iz istatistiği(1938), Wilks in Lambdası (193) ve Pillai-Bartlett iz istatistiği (1955) dir. Bu test istatistikleri içinde en çok kullanılan ve bilinen ilk kez Wilks (193) tarafından tanımlanan Wilks Lambda istatistiğidir. Grup sayısı,3 veya değişken sayısı 1, olduğunda tam F dağılımı gösterir. Tek değişkenli analizde, iki örnek ortalaması, çok değişkenli analizde ise iki örnek ortalama vektörü arasındaki farkın sıfır olduğuna dair kurulan hipotezin testinde, yığınların varyansını ifade eden varyansların veya varyans-kovaryans matrislerinin homojen olmadığı durumlarda kullanılabilecek test istatistiğinin dağılımı ve ortaya çıkacak problemlerle ilgili ilk çalışmalar; Behrens(199) ve Fisher(1939) tarafından yapılmıştır. Bilindiği üzere yığının varyansı veya varyans-kovaryans matrisleri eşit olduğu durumlarda; tek değişkenli analizde, bağımsız iki örnek ortalamasının karşılaştırılmasında Student t- testi, çok değişkenli analizlerde ise iki ortalama vektörünün karşılaştırılmasında Hotelling T istatistiği kullanılmaktadır. Yığınların varyansları farklı olduğu zaman bu istatistiklerin dağılımı değişmektedir. Bu durum kısaca Behrens-Fisher problemi olarak bilinir. Çok değişkenli Behrens-Fisher problemi için birçok test önerilmiştir. Bunlardan en önemlileri Bennett(1951), Brown and Forsythe (1974), Jame (1954), Yao (1980), Johansen (1980), Nel and Merwe (1986) ve Kim (199) in testleridir. Günlük yaşantıda kovaryans matrislerinin eşit olduğu durumlarla çok az karşılaşılmaktadır. Bu nedenle homojen olmayan kovaryans matrisi için çok değişkenli varyans analizi önem kazanmaktadır. Bu çalışmada, çok değişkenli varyans analizin özel bir hali olan iki grup otalama vektörleri karşılaştırılmasını dikkate alınmıştır. Bu durum için hesaplamalı yaklaşım testine dayalı yeni bir test istatistiği önerilmiştir. Bu yaklaşım kısaca parametrik bootstrap yönteminin özel bir halidir. Bu yöntem, yokluk hipotezinin doğruluğu altında kısıtlı en çok olabilirlik tahmin edicisine dayalıdır. Ayrıca, test istatistiğinin dağılımını teorik olarak bulmak gerekmediğinden ve p değerini doğrudan elde ettiğinden dolayı kullanımı kolay bir yöntemdir. Bu çalışmanın ilk kısmında çok değişkenli normal dağılıma sahip ancak homojen kovaryans matrisleri varsayımı sağlanmadığında iki yığın ortalama vektörünün eşitliği hipotezinin testi için geliştirilen bazı test istatistiklerine yer verilmiştir. Daha sonra hesaplamalı yaklaşım testine dayalı yeni bir test istatistiği için prosedür verilmiştir. Çalışmanın son kısmında ise test istatistikleri karşılaştırılarak sonuçlar yorumlanmıştır. Elde edilen sonuçlara göre yeni önerilen test diğer testlere göre testin gücü bakımından birçok durumda oldukça iyi sonuçlar verimiştir. testi Anahtar Kelimeler: Hesaplamalı yaklaşım testi, Çok değişkenli varyans analizi, Bennett testi, Johansen 75 KAYNAKLAR

276 [1] Keskin, S., Ankaralı, A., (007), Çok Değişkenli Varyans Analizinde Gruplar Arasındaki Farkın Tespiti: Bir Uygulama, Turkiye Klinikleri J MedSci. [] Kotz, S., Johnson, N.L., Encyclopedia of Statistical Sciences. Vol:6 John Wiley&Sons, New York. [3] Willam, F. Christensen ve ark.,(1997), A comparison of Type I error rates and power levels for seven solutions to the multivariate Behrens-Fisher problem,communications in Statistics Simulation and Computation, 6(4), [4] Welch, B.L., (1947), Thegeneralization of student s problem when several different population variances are involved, Biometrika, 34:8-35. [5] HirokazuYanagihara, Ke-HaiYuan, (005), Three Approximate Solutions to the Multivariate Behrens Fisher Problem, Communications in Statistics Simulation and Computation, 34: ABSTRACT A NEW TEST FOR THE EQUALITY OF TWO MEAN VECTORS UNDER HETEROSCEDASTICITY This paper proposes a new test statistic for the equality of two mean vectors under heteroscedasticity based on the Computationa Approach test method. This proposed test was compared with other tests in type I error and power under different combinations of covariance matrix, mean vectors and sample sizes. In the result, it was observed that the proposed test yields better results than other tests in many cases. KeyWords: Computational approach test, Multivariate analysis of variance, Bennett test, Johansen test 76

277 MARJİNAL DAĞILIMLARIN NORMAL OLMASI DURUMUNDA KAPULA REGRESYON MODELLERİ Sıddık Arslan T Bu çalışmanın birincil amacı, Y, X T rastgele vektörünün marjinal dağılımlarının bilinmesi durumunda kapula tabanlı regresyon fonksiyonunun tahmin edilmesidir. Çalışmanın ikinci amacı, elde edilen regresyon fonksiyonunu kullanarak istatistiksel sonuç çıkarımı yapılmasıdır. Tanım kümesi d I, değer kümesi I olan C : I d I u Cu (1) fonksiyonuiçin; temelli fonksiyon, a b olan tüm bileşenleri 1 ise Cu uk a, için a, b 0 d b I koşulları sağlandığında C ye d boyutlu kapula denir. T Sklar (1959) ın çalışmalarına göre, T F x F x,..., olmak üzere, CF 0 y,fx 1 1 F d x d V H ve u nun bir tane k u hariç Y, X rastgele vektörünün dağılım fonksiyonu, kapulası ile ifade edilir. Y bağımlı değişken, X 1, X,..., X d bağımsız değişkenler olmak üzere, X x olarak verildiğinde Y nin koşullu beklenen değeri (regresyon fonksiyonu) kapula Y, X1, X,..., X d rastgele vektörünün kapulası cinsinden e Fx m x E Y w F0 Y, F x c X Fx () d C olarak yazılır. Burada u 1, u,..., u d c u1, u,..., u d, C kapulasına karşılık gelen kapula yoğunluğu u u... u olmak üzere dir. w u c u, u 0 0, u ve eu E Y c F Y u c X 1 Arslan, A Arşimedyen Kapulalar Üzerine Bir Çalışma. Doktora tezi (basılmamış).ankara Üniversitesi 111s, Ankara. Nelsen, R. B., 006. An Introduction to Copulas. Springer, 70s., New York. Sungur, A. E Some Observations on Copula Regression Functions, Communications in Statistics Theoryand Methods 34: Noh, H.,Ghouch, A. ve Bouezmarni, T. 01. Copula Based Regression Estimation and Inference, Journal of the American Statistical Association Volume 108, Issue 50: d , 0 1 u F u c u u, du Rastgele değişkenlerin dağılımları arasında, yaygın kullanılan dağılımlardan birisi normal dağılım olduğundan; regresyon fonksiyonu, regresyon fonksiyonunun tahmin edicisi ve istatistiksel sonuç çıkarımı, marjinal dağılımların normal dağılım olmasıyla sınırlandırılmıştır. Çalışmada uygulama olarak hem simülasyon, hem de gerçek veriler kullanılarak sonuçlar tartışılacaktır. KAYNAKLAR 0 (3)

278 COPULA REGRESSION MODEL WHEN MARGINAL DISTRIBUTION BEING NORMAL STATE Abstract The primary purpose of this study to estimate copula based regression function when marginal T distribution of Y, X T random vector was known by certainty. Secondary purpose of the study is to utilyze the obtained regression function to make statistical inferences. Given the defination set of d I,value set of I; forthefunction of The copula based function of a b except all other members is 1 then if Cu uk C : I d I u Cu (1), 0 and given as b I and for u having only one u k conditions has been satisfied C called as d dimensional copula. d a, forvh a b T According tosklar s study (1959), Y, X T random vector s distribution function, comprised of Fx F 1x1,..., F d x d and is defined by CF 0 y,fx copula. When Y being dependent variable, X 1, X,..., X d are independent variables and if X x is given, y s conditioal expected value (regression function), the copula of Y, X1, X,..., X d could be stated as in terms of random vector s copula: m e Fx x E Y w F Y, Fx 0 c X Fx d C u1, u,..., u d Where, cu 1, u,..., u d, corresponding copula C as a copula density is given as; u u... u w u 1 c u, u 0 0, u ve eu E Y c F Y u c X d () , 0 1 u F u c u u, du Among the random variable distribution, since one of the commonly utilyzed distribution is normal distribution; regression function, predictor of regression function and statistical infereces has been constrained by marginal distribution is being as normal distribution. In the study, as an applicaiton both smulation and real World data will be used and the result will be discussed. Key Words: Copulas, Gaussian Copulas, Archimedean copulas, Regression, Copula Based Regression. 0 (3) 78

279 SESSION 8 APPLIED STATISTICS 3 79

280 Comparison of Some Imputation and Deletion Methods through MSE of Estimation Onur TOKA, Meral ÇETİN 1. INTRODUCTION Hacettepe University, Department of Statistics, 06800, Beytepe, Ankara, TURKEY Statistical methods are being used in many fields of disciplines. A clear majority of researchers ignore the missing value or outlier problems. Both missing data and contamination cannot be solved with classical imputation methods. Therefore, some robust imputation methods have been being suggested by researcher to overcome mentioned issues. This paper investigates commonly used data imputation applications under the presence of missing values and outliers. Simulation studies are conducted to collect missing and contaminated data and the results of imputation methods are compared by mean squared error (MSE). To compare missing data methods, imputation error is used in another presentation in 01 (Toka and Çetin, 01). In this study, mean vector estimation results are used to compare methods through mean squared error.. MISSING DATA METHODS Listwise deletion and pairwise deletion can only be answer to get data without missing part. Moreover, getting full data matrix with listwise deletion method implies to take all missing part of data out of analysis. Similarly, pairwise deletion method can deal with data to analyze get all observed part of variables separately and combine the results. Mean/median imputation is to get mean/median of observed values for every variable and then impute all missing part of variables with their own means/medians. Demspter et all. (1977), proposed EM algorithm -iterative methods- with the part of expectation (E-step) and maximization (M-step). Little and Smith (1987) proposed ER (expectation robust) algorithm to EM algorithm. They changed M-step to get more resistant estimators in contaminated data. Verboven et. al (007) proposed sequential imputation (SEQimpute). Covariance matrix and determinant play an important role in this method. Branden and Verboven (009) proposed robust version of SEQimpute and they called it as robust imputation (ROBimpute) method. All of the steps are same as SEQimpute method but the initial robust mean and robust covariance matrix of the complete data matrix are used. 3. SIMULATION STUDY In the simulation study, a data matrix with three variables and 50 observations were generated from multinomial normal distribution MN(0, I). Data was contaminated with proportion 10% and 0% respectively by data generating from multinomial normal distribution MN(5, I). Otherwise, missingness was formed by excluding some values missing at randomly for every data sets with the proportion 5% and 10% respectively. Imputation methods were compared by mean squared error for 500 iteration. For all data structures, MSEs of imputation methods are also given in Figure 1. For contamination, it can be seen ER algorithm and robust imputation method are better methods than the other ones. 4. RESULTS Missingness is not a big problem if you know how can handle it. In this study, some missing methods that can be used in continuous data type were given and compared. The results showed that ER algorithm and robust imputation can be answer for missing data in case of outliers and contamination 80

281 . 0 0, 0,4 0,6 0,8 1 REFERENCES Figure 1 MSEs of Imputation and Deletion Methods [1] Toka, O. and Çetin, M. (01), Comparison of Some Classic and Robust Imputations, 8 th International Statistics Day Symposium, Eskişehir, Turkey. [] Dempster, A. P., Laird, N. M., Rubin, D. B., 1977, Maximum likelihood from incomplete data via the EM Algorithm, Journal of the Royal Statistical Society, Series B, 39, [3] Little, R. J. A., Smith P. J., 1987, Editing and imputing for quantitative survey data, Journal of the American Statistical Association 8, [4] Verboven, S., Branden K.V., Goos, P., 007, Sequential imputation for missing values, Computational Biology and Chemistry, 31, [5] Branden, K. V., Verboven S., 009, Robust data imputation, Computational Biology and Chemistry, 33(1), Key Words: Robust imputation, ER and EM algorithm, Sequential imputation, Missing data. 81

282 Parametric Bootstrap and Generalized Approach for One-Way ANOVA under Unequal Variance with Nonnormality Evren Özkip To test the equality of several normal means when the variances are unknown and unequal, classical tests do not provide exact solutions. In the literature, to overcome this problem parametric bootstrap and generalized approaches are developed. Test variable that is distribution free of unknown parameters is obtained by using these approaches. Distribution of this test variable can provide exact inferences for problems in the presence of unknown parameters. Simulation studies showed that the parametric bootstrap and generalized approaches work well for one-way ANOVA when assumption of equality of variance is violated. In this study, Monte Carlo simulation studies are conducted to evaluate the type I error and power of these approaches for the nonnormal distributions under heterocedasticity. 8

283 Shrinkage Ridge-Type Estimators in Linear Models Bahadır YÜZBAŞI 1, S. Ejaz AHMED and Mehmet GÜNGÖR 3 1,3 Department of Econometrics, Inonu University, Malatya 4480, Turkey Department of Mathematics and Statistics, Brock University, St. Catharines, ON LS 3A1, Canada 1 b.yzb@hotmail.com, sahmed5@brocku.ca and 3 mgungor44@gmail.com 1. Introduction Consider a linear regression model y i = x i β + ε i, i = 1,,..., n, (1) where y i s are responses, x i = (x i1, x i,..., x ip ) is design points, β = (β 1, β,..., β p ) is vector denoting unknown coefficients, ε i s are unobservable random errors and the superscript " " denotes the transpose of a vector or matrix. Further, ε = (ε 1, ε,..., ε n ) has a cumulative distribution function F(ε); E(ε) = 0 and Var(ε) = σ I n, where σ is finite and I n is an identity matrix of dimension n n. In the existence of multicollinearity may lead to wide confidence intervals for individual parameters or linear combination of the parameters and may produce estimates with wrong signs, etc.. In literature, to overcome this problem, many studies have been made. Ridge estimation is proposed by [,3], is one of the most effective methods to solve the problem of multicollinearity. In this study, we consider a linear regression model (1) in a more realistic situation when model is assumed to be sparse. Under this assumption, the vector of coefficients β can be partitioned as (β 1, β ) where β 1 is the coefficient vector for main effects, and β is the vector for nuisance effects or insignificant coefficients. We are essentially interested in the estimation of β 1 when it is reasonable that β is close to zero.. Estimation Strategies The ridge estimator can be obtained from the following model y = Xβ + ε subject to β β φ, () where φ is inversely proportional to λ R, y = (y 1, y,..., y n ) and X = (x 1, x,..., x n ). From (), full model or unrestricted ridge estimator β 1RFM of β 1 is given by β 1RFM = (X 1 M R X 1 + λ R I p1 ) 1 X 1 M R y, where M R = I n X (X X + λ R I p ) 1 X. A sub-model or restricted model with a general restriction is defined as: y = Xβ + ε subject to β β φ and Rβ = r, where R is an s p restriction matrix, and r is an s 1 vector of constants. In this study, we let X = (X 1, X ), where X 1 is an n p 1 sub-matrix containing the regressors of interest and X is an n p sub-matrix that may or may not be relevant in the analysis of the main regressors. Similarly, β = (β 1, β ) be the vector of parameters, where β 1 and β have dimensions p 1 and p, respectively, with p 1 + p = p, p i 0 for i = 1,. In order to obtain relevant hypothesis, we consider R = [0, I], and r = 0, where 0 is a p p 1 matrix of zeroes and I is the identity matrix. If β = 0, then we have the following restricted linear regression model y = X 83 1 β 1 + ε subject to β 1 β 1 φ. (3) For model (3), the sub-model or restricted estimator β 1RSM of β 1 has the form β 1RSM = (X 1 X 1 + λ 1 R I p1 ) 1 X 1 y.

284 Generally speaking, β 1RSM performs better than β 1RFM when β close to zero. However, for β away from the zero, β 1RSM can be inefficient. But, the estimate β 1RFM is consistent for departure of β from zero. The pretest test estimator was introduced by [1]. This estimator is a combination of β 1RFM and β 1RSM through an indicator function I(L n c n,α ), where L n is appropriate test statistic to test H 0 : β = 0 versus H A : β 0. Moreover, c n,α is an α level critical value using the distribution of L n. We define test statistics as follows: L n = n σ (β FM ) X M 1 X (β FM ), where σ = 1 n 1 (y Xβ RFM ) (Y Xβ RFM ) is consistent estimator of σ, M 1 = I n X 1 (X 1 X 1 ) 1 X 1 and β FM = (X M 1 X ) 1 X M 1 y. Under H 0, the test statistic L n follows chi-square distribution with p degrees of freedom for large n values. Now, we can choose an α level critical value c n,α and introduce pretest test ridge regression estimator of β 1 defined by β 1RPT = β 1RFM (β 1RFM β 1RSM )I(L n c n,α ). Hence, β 1RPT choose β 1RSM when H 0 is tenable; otherwise, β 1RFM is chosen. The shrinkage or stein-type ridge regression estimator of β 1 defined by β 1RS = β 1RSM + (β 1RFM β 1RSM )(1 (p )L n 1 ), p 3. The estimator β 1RS is general form of the Stein-rule family of estimators, where shrinkage of the base estimator is towards the restricted estimator β 1RSM. Shrinkage estimator is pulled towards the restricted estimator when the variance of the unrestricted estimator is large. The positive part of the shrinkage ridge regression estimator of β 1 defined by β 1PRS = β 1RSM + (β 1RFM β 1RSM )(1 (p )L n 1 ) +, where z + = max(0, z). REFERENCES [1] Bancroft, T. A. (1944). On biases in estimation due to the use of preliminary tests of significances. Annals of Mathematical Statistics, 15, [] Hoerl, A. E.. Kennard, R. W. (1970). Ridge Regression: Biased estimation for non-orthogonal problems. Technometrics, [3] Hoerl, A.E., Kennard, R.. W. and Baldwin, K.F. (1970). Ridge regression: Applications to Nonorthogonal Problems. Technometrics, 1(1), ABSTRACT In this paper, we establish pretest ridge regression, shrinkage ridge regression and positive shrinkage ridge regression estimators for a multiple linear regression model. Monte Carlo studies were conducted to compare their performance with some penalty estimators which are lasso, adaptive lasso and SCAD. Finally, asymptotic risk properties of the suggested estimators have been showed. Key Words: Ridge Regression, Shrinkage Estimation, Penalty Estimation. 84

285 VENTRICULO-PERITONEAL SHUNT SURGERY AND DIFFUSION TENSOR IMAGING - STATISTICAL RESULTS Karel HRACH J.E.Purkyne University in Usti nad Labem, Faculty of Health Studies, Usti nad Labem, CZECH REP. karel.hrach@ujep.cz 1. Introduction Our data of diffusion tensor imaging (DTI) is presented by two groups. The group A consists of 7 patients (a female 37 %) after implantation (ventriculo-peritoneal shunt surgery) and the group B consists of 4 controls (a female 46 %) recruited as volunteers. The groups were comparable in the mean age (A=7.4, B=69.3). The following variables were observed as fractional anisotropy (FA) and mean diffusivity (MD), both at posterior limb of internal capsule (PLIC), anterior limb of internal capsule (ALIC) and corpus callosum (CC). The variables were measured twice in the group A (before and after the surgery) and once in the group B. The statistical analysis presented here includes paired tests (comparison within the group A) and two-sample tests (comparing the group B with the values for the group A before or after the surgery, respectively) for each variable.. Paired tests As concerns paired tests of the patients group A, the only variable FA at PLIC performed statistically significant difference (p 0.001). Its average values are 0.70 before the surgery and 0.63 after the surgery. The results can be found in Table1. Table1. FA (fractional anisotropy) paired tests and descriptive characteristics (patients group A) location (p-value) PLIC ( ) ALIC (0.111) CC (0.96) before after before after before after minimum maximum average value standard deviation MD (mean diffusivity) paired tests and descriptive characteristics (patients group A) location (p-value) PLIC (0.890) ALIC (0.717) CC (0.335) before after before after before after minimum maximum average value standard deviation Two-sample tests Descriptive characteristics for the control group B together with the p-values of the two-sample tests (F-test and t-test in one-tailed version) can be found in Table. Based on F-tests, the variances are comparable between the groups for FA at PLIC before as well as after the surgery. For remaining statistical variables their variances differ significantly. Based on t-tests, all the mean values are significantly lower in the control group, regardless of whether before or after the surgery. 4. Discussion In conclusion, the ventriculo-peritoneal shunt surgery did not affect the monitored variables except the significant change (decrease) of fractional anisotropy (FA) at posterior limb of internal capsule (PLIC). This change of FA at PLIC is consistent with results of previously 85 published studies, e.g. Nicot et al. (014). All the mean values were before the surgery and remained after the surgery significantly higher than in the control group. Ongoing further analysis should confirm the usefulness of the disproportionately enlarged subarachnoidspace hydrocephalus (DESH) indicator as e.g. in Hashimoto et al. (010).

286 The study is conducted in the co-operation between Krajská zdravotní, a.s., and J. E. Purkyně University in Ústí nad Labem with the support of a project grant from the Czech Ministry of Health NT /013. Table. Descriptive characteristics (control group B) and two sample tests FA PLIC MD PLIC FA ALIC MD ALIC FA CC MD CC minimum maximum average value standard deviation Two-sample tests (comparison with the patients group A before surgery) F-test (p-value) t-test (p-value) Two-sample tests (comparison with the patients group A after surgery) F-test (p-value) t-test (p-value) REFERENCES [1] Nicot, B., Bouzerar, R., Gondry-Jouet, C., Capel, C., Peltier, J., Fichten, A. and Balédent, O. (014), Effect of surgery on periventricular white matter in normal pressure hydrocephalus patients: Comparison of two methods of DTI analysis, Acta Radiologica, 55 (5), pp [] Hashimoto, M., Ishikawa, M., Mori, E. and Kuwana, N. (010), Diagnosis of idiopathic normal pressure hydrocephalus is supported by MRI-based scheme: A prospective cohort study, Cerebrospinal Fluid Research, 7, art. no. 18. Key Words: paired test, two-sample test, shunt surgery, diffusion tensor imaging 86

287 SESSION 8 BULANIK TEORİ 87

288 BULANIK UZMAN SİSTEMLERİN BULANIK DOĞRUSAL REGRESYON ANALİZİNDE KULLANIMI Duygu İÇEN Hacettepe Üniversitesi, İstatistik Bölümü, 06800, Ankara, TÜRKİYE Süleyman GÜNAY Hacettepe Üniversitesi, İstatistik Bölümü, 06800, Ankara, TÜRKİYE 1. Giriş Uzman sistemler, özel bir alanda ele alınan problemi konu ile ilgili uzmanların çözdüğü şekilde çözebilen bilgisayar programlarıdır. Bulanık uzman sistemler ise veri üzerinde akıl yürütme yapabilmek için klasik mantık yerine Zadeh [1] tarafından önerilen bulanık mantığı kullanan sistemlerdir. Bulanık uzman sistemler genel olarak, bulandırma arayüzü, bilgi tabanı, çıkarım motoru ve durulama arayüzü olmak üzere dört bölümden oluşur. Bulanık uzman sistemin genel yapısı Şekil 1 ile verilmiştir. Şekil 1. Bulanık uzman sistemin genel yapısı Bulanık regresyon analizinde gözlenen değerler ile hesaplanan değerler arasındaki sapmaların klasik regresyondaki gibi ölçüm ve gözlem hatalarından değil, model parametrelerinin bulanıklığından kaynaklandığı kabul edilir []. Bulanık doğrusal regresyon model parametrelerinin tahmini için Monte Carlo yönteminin kullanımı çok yeni ve üzerinde çok çalışılmamış bir konudur. Bu çalışmada Eşitlik 1 ve Eşitlik ile verilen bulanık doğrusal regresyon modelleri ele alınmıştır. Y A A x A x A x (1) 0 1 1l l m ml Y a a X a X a X () 0 1 1l l m ml Yukarıdaki eşitliklerde verilen model parametrelerinin tahmini için bulanık uzman sistem kullanılarak her parametrenin geldiği düşünülen aralık belirlenmiştir. Daha sonra Monte Carlo yöntemi kullanılarak model parametreleri tahmin edilmiştir.. Sonuç ve Öneriler 88 Bulanık doğrusal regresyon model parametrelerinin tahmininde kullanılan Monte Carlo yönteminde, model parametrelerinin geldiği düşünülen aralıkların belirlenmesi için bulanık uzman sistem kullanılması önerilmiştir.

289 Böylece ele alınan her iki regresyon modeli için uzun ve karmaşık matematiksel işlemlere gerek kalmadan en uygun parametre değerine ulaşılmıştır. KAYNAKLAR [1] Zadeh, L. A. (1965) Fuzzy Sets, Information Control, 8(3), [] Chang, Y.H.O. and Ayyub, B.M., (001) Fuzzy regression methods-a comparative assessment, Fuzzy Sets and Systems, 119, ABSTRACT USE OF FUZZY EXPERT SYSTEMS IN FUZZY LINEAR REGRESSION ANALYSIS Expert systems are computer programs that solve the problems in a way of the experts dealing with in a specific area. Fuzzy experts systems use fuzzy logic, which is introduced by Zadeh [1], instead of classical logic for reasoning on the data. In this study, fuzzy expert system is introduced for determining the parameter intervals for estimating the fuzzy linear regression model parameters. Key Words: Fuzzy linear regression analysis, Fuzzy expert systems, Monte Carlo method 89

290 BULANIK KÜMELEME İLE DEPREM SİGORTASI RİSK DEĞERLENDİRMESİ Furkan BAŞER 1, A. Sevtap SELCUK-KESTEL, Ayşen APAYDIN 3 1 Gazi Üniversitesi, İktisadi ve İdari Bilimler Fakültesi, Uluslararası Ticaret Bölümü Beşevler, Ankara furkan.baser@gmail.com Orta Doğu Teknik Üniversitesi, Uygulamalı Matematik Enstitüsü Çankaya, Ankara skestel@metu.edu.tr 3 Ankara Üniversitesi, Fen Fakültesi, İstatistik Bölümü Tandoğan, Ankara apaydin@science.ankara.edu.tr 1. Giriş Belirli bir bölgede bulunan, kayıtlı deprem geçmişi yansız kestirimler yapmak üzere yetersiz olan yapılar için doğru primin belirlenmesi sigorta ve reasürans şirketlerinin temel problemi olarak görülmektedir. Ekonomik kayıpların kestirimi; yapının fiziksel durumu ve dayanıklılığı, deprem kaynağına olan konumu gibi yapı özelliklerine bağlıdır [1]. Sigortalama, sigortalanabilir risklerin seçimi ve sınıflandırılması sürecidir. Deprem sigortalarında; özel şartlar, durumlar ve primler gibi sigorta poliçesi öğelerinin sigortalanan riske uygunluğu sigorta şirketi ve sigortalanan açısından öneme sahiptir. Bu çalışmada, bina yapılarının benzer özelliklerine, hasar üretme ihtimaline ve bu hasarların büyüklüğüne göre değerlendirmek üzere bulanık c-ortalama (BCO) kümeleme algoritması kullanılmıştır. Önerilen bulanık tip kümeleme ile örüntülerin risk gruplarına üyelikleri hakkında daha fazla bilgi sağlanması amaçlanmaktadır.. Yöntem Bulanık kümeleme yöntemi, nesnelerin kümelere hangi derece ile ait olduğunu belirleyen üyelik fonksiyonlarını hesaplamak ve veri seti içerisindeki örtüşen kümeleri saptamak üzere kullanılmaktadır []. X = {x 1, x,, x n } nesneler kümesini göstermek üzere; her bir i nesnesi (i = 1,,, n), d boyutlu x i = [x 1,i x,i x d,i ] T R d vektörü ile temsil edilsin. Bir bulanık kümeleme algoritması X veri kümesini, U parçalanma matrisi tasarımıyla c sayıda örtüşen kümeye parçalar. Bulanık parçalanma matrisi, U, her k (k = 1,,, c) kümesinde yer alan x i (i = 1,,, n) nesnelerinin üyelik derecelerinden oluşan bir matristir. k kümesindeki i. vektörün üyelik derecesi μ k,i U ile gösterilir. Bulanık kümeleme algoritmasında her bir küme, küme merkez vektörü veya küme prototip vektörü ile temsil edilir. d boyutlu veri vektörlerinden oluşan bir X matrisi için bulanık kümeleme algoritması v i, k = 1,,, c küme merkez vektörlerini belirler. V = {v 1, v,, v c } R c d olmak üzere her bir küme merkezi, v i R d, d boyutlu bir vektördür. Bu küme merkezleri genellikle, d sayıda nesnenin ağırlık merkezi olarak ifade edilir [3]. BCO kümeleme yöntemi, optimum çözüme amaç fonksiyonunun minimumu ile ulaşan bir kısıtlı optimizasyon problemine dayanır. Küme sayısı (c) ve bulanıklık parametresi (m) gibi iki önsel bilgi ile bu optimizasyon problemi; c k=1 n i=1 min J(X; U, V) = (μ k,i ) m d (x i, v k ) 0 μ k,i 1, i, k c μ k,i = 1, i > 0 n 0 < μ k,i < n, k > 0 90 k=1 (1) i=1 matematiksel modeli ile tanımlanır [4]. Burada d (x i, v k ) ise i. nesne ile k. küme merkezi arasındaki uzaklık ölçüsüdür. Karesel uzaklık, amaç fonksiyonunun negatif tanımlı olmamasını, J > 0, sağlamaktadır.

291 3. Uygulama Doğal Afet Sigortaları Kurumu (DASK) veri tabanı, her bir poliçenin çeşitli karakteristikleri ve primlerini, hasar geçmişini barındıran büyük bir bilgi havuzudur. Bu çalışmanın kapsamı, ikinci derece sismik bölge içerisinde bulunan Eskişehir ili ile sınırlıdır. Toprak yapısı, yer altı su seviyesinin yüksekliği ve merkezinden aktif bir fay hattının geçmesi dolayısıyla şehir, beşten büyük şiddette birçok deprem yaşamıştır. Bu gerçekler ışığında, Eskişehir deprem sigorta verileri yardımıyla mevcut bina yapılarının deprem risklerine göre değerlendirilmesi önem arz etmektedir. Veri seti, adet poliçe için sigorta miktarı, bina yapı türü, kat sayısı, bina yapım zamanı, kat alanı, kat numarası gibi bina özellikleri ve prim bilgilerini içermektedir. Hasar kestiriminde öneme sahip olan bu risk faktörlerinin birçoğu DASK prim hesaplama metodolojisinde göz ardı edilmektedir. KAYNAKLAR [1] Liu, R., Wang, Z., Zhu, M. (006). Study on financial loss and its adjustment in earthquake insurance. Acta Seismologia Sinica, 19(), [] De Oliveira, J. V., Pedrycz, W. (007). Advances in fuzzy clustering and its applications, Wiley, West Sussex. [3] Celikyilmaz A., Türksen, I. B. (009). Modeling Uncertainty with Fuzzy Logic: With Recent Theory and Applications, Springer-Verlag, Berlin Heidelberg. [4] Bezdek, J.C. (1981) Pattern Recognition with Fuzzy Objective Function Algorithms, Plenum Press, New York. ABSTRACT FUZZY CLUSTERING FOR EARTHQUAKE INSURANCE RISK ASSESSMENT Determining earthquake insurance premiums requires knowledge on many factors and properly classified risks. In this paper, fuzzy c-means clustering algorithm is employed in order to assess earthquake insurance risks of building structures based on their features such as insurance amount, construction type, construction date, number of storey, area and risk floor number. According to the numerical application carried out for insurance policies collected from TCIP (DASK), it is found that proposed method gives remarkable results. Key Words: Earthquake insurance, risk classification, fuzzy c-means. 91

292 BULANIK KÜMELEMEYE DAYANAN ENGLE - GRANGER TESTİ Aytaç PEKMEZCİ, Nevin GÜLER DİNCER, Arzu EKİCİ Muğla Sıtkı Koçman Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Kötekli, MUĞLA aytac0803@yahoo.com, nguler@mu.edu.tr, arzuekici@gmail.com 1. ÖZET Ekonometrik modellerin çoğu zaman serilerine dayanmaktadır. Zaman serilerinin en önemli amaçlarından biri geleceğe yönelik tahmin yapmasıdır. Bu tahminler serinin durağan olması durumunda anlamlıdır. Gerçek hayatta karşılaşılan zaman serilerinin çoğu bir trend bileşeni içerdiğinden durağan olmayan serilerdir. Zaman serilerinin durağan olmaması eşbütünleşme kavramının ortaya çıkmasına neden olmuştur. Eşbütünleşme analizi, durağan olmayan zaman serilerinin doğrusal bileşimlerinin durağan bir süreç olabileceğini göstermektedir. Eşbütünleşme testleri kullanılarak değişkenler arasındaki uzun dönemli denge ilişkisi saptanabilmekte ve uzun dönem katsayıları güvenilir bir şekilde tahmin edilebilmektedir. Eşbütünleşme analizi ile ilgilenilen ekonometrik zaman serileri arasında uzun dönemli bir ilişki olup olmadığı belirlenmeye çalışılır. Ayrıca eşbütünleşme ile her biri ayrı ayrı durağan olmayan iki ya da daha fazla zaman serisi arasındaki ilişki açıklanabilmektedir. Analiz sonucu uzun dönemli bir ilişkinin var olduğu söylenebilirken, bunlar arasındaki kısa dönemli sapmalar durağandır. Değişkenler arasında eşbütünleşme ilişkisinin varlığı, bu değişkenlerin uzun dönemde birlikte hareket ettiği anlamına gelmektedir. Ekonomik uygulamalarda eşbütünleşme analizinin kullanıldığı çalışmaların çoğunda incelenen değişkenlerin birinci derecenden bütünleşik olduğu durumlar ele alınmıştır. X t ve Y t birinci dereceden farkı alınmış I(1) olan iki zaman serisi olmak üzere bu iki serinin doğrusal birleşimi de I(1) olacaktır. Ancak bazı koşullarda iki I(1) değişkeninin doğrusal birleşimi I(0) olan bir değişken ortaya çıkabilir. Bu durumda bu iki değişkene eşbütünleşik seriler denir. Günümüzde uzun dönemli denge ilişkisini araştıran eşbütünleşme testlerinden birisi literatürde kullanılan Engle-Granger (EG) testidir. EG tek denkleme dayalı eşbütünleşme analizini geliştirmiştir. Bu analiz iki ya da daha fazla değişken arasında bir denge ilişkisi olabileceğini göstermiştir. Bu test iki değişken arasında uzun dönemli bir ilişkiyi araştırırken modelde yer alan tüm değişkenlerin I(1) ve bu değişkenlerin doğrusal birleşiminden elde edilen hata teriminin I(0) yani durağan olduğunu varsaymaktadır. Hata terimlerinin durağanlığı, ele alınan değişkenler arasındaki eşbütünleşmenin göstergesidir. İki aşamada gerçekleştirildiği için iki aşamalı yöntem olarak adlandırılmaktadır. İlk aşamada değişkenler arasındaki uzun dönem denge ilişkisini gösteren denklemdeki parametreler gerçeğe en yakın şekilde tahmin eden En Küçük Kareler (EKK) yöntemi ile tahmin edilir ve hata terimleri elde edilir. İkinci aşamada hata teriminin birinci farkı alınarak yeni bir denklem kurular ve hata teriminin durağan olup olmadığı ADF birim kök testi yardımıyla belirlenir. Her iki aşamada değişkenler arasında eşbütünleşme ilişkinin varlığı, bulunan parametrelere ait tahmin değerlerinin tutarlı olmasını gerektirmektedir. EKK tekniği veri setinin birbirinden farklı dağılımdan oluşması, değişkenler arasındaki ilişkinin polinom fonksiyon şeklinde (doğrusal, kuadratik vs) olmaması durumunda tatmin edici sonuçlar vermemektedir. BCRM küme merkezi doğrusal veya doğrusal olmayan fonksiyonlara karşılık gelen bir kümeleme algoritmasıdır. Algoritmanın çalışma prensibi şu şekildedir: ilk olarak küme sayısının belirlenmesi gerekmektedir. Bu amaca yönelik olarak çeşitli küme doğrulama kriterleri kullanılmaktadır. Ancak bu çalışmada BCRM in minimum şartlardaki performansını değerlendirmek amacıyla küme sayısı simülasyon ile üretilen tüm veri setleri için olarak seçilmiştir. Bulanık üyelik değerleriyle ağırlıklandırılmış hata kareler fonksiyonunu minimum yapacak küme merkezlerine ilişkin parametreler tahmin edilir. Her küme için tahmin değerleri hesaplanır ve anahtarlama özelliği kullanılarak elde edilen tahmin değerleri birleştirilir. Elde edilen hata değerlerine ADF testi uygulanarak hataların durağan olup olmadığı test edilir. 9 Bu çalışmada, farklı fonksiyonel ilişkilerin incelenmesine izin veren bulanık kümelemeye dayanan modelleme tekniklerinden Bulanık C-Regresyon Model (BCRM) ile EG testinin geliştirilmesi amaçlanmıştır. Bunun için BCRM nin eşbütünleşmedeki performansını değerlendirmek amacıyla bir simülasyon çalışması gerçekleştirilmiş ve elde edilen sonuçlar ile EG testi karşılaştırılmıştır.

293 KAYNAKLAR [1] Hathaway R. J., and Bezdek, J.C., (1993) Switching regression models and fuzzy clustering, IEEE Trans. Fuzzy Systems, vol. 1, pp [] Engle, R. F., and Granger, C.W.J., (1987) Cointegration and Error Correction: Representation, Estimation and Testing, Econometrica, 55: [3] Haug, A.A., (1996) Tests for Cointegration A Monte Carlo Comparison, Journal of of Econometrics, 71: [4] Enders, W., (1995) Applied Econometric Time Series, John Wiley and Sons. Inc., New York, 433p. [5] Pekmezci, A., (011) Eşbütünleşme Yöntemlerinin Simülasyon Verileri ile Karşılaştırılması ve Bir Model Uygulaması, Doktora Tezi, Muğla Üniversitesi Fen Bilimleri Enstitüsü. ENGLE-GRANGER TEST BASED ON FUZZY CLUSTERING ABSTRACT One of cointegration tests investigating the long-run equilibrium relationship is Engle-Granger (EG) test. In EG test, the parameters indicating long-run equilibrium relationship between the variables are estimated by OLS method. However, OLS technique does not give satisfactory results in case that data set consist of two or more than two classes that have different distributions and/or the relationship between variables does not correspond to a polynomial function such as linear. Thus in this study, it is aimed at improving EG test with Fuzzy C-Regression Model (FCRM) that is one of the fuzzy clustering techniques allowing to investigate different functional relationship. Key Words: Cointegration, FCRM, Fuzzy Clustering, EG Test, Time Series 93

294 SESSION 8 YAPAY ZEKA 94

295 Medyan Nöron Modeline Dayalı Sinir Ağları Kullanılarak Döviz Kurlarının Öngörülmesi Cagdas Hakan ALADAG 1*, Bulent ALPTEKIN 1* Toronto University, Department of Mechanical and Industrial Engineering, Toronto, Canada Middle East Technical University, Faculty of Arts and Sciences, Department of Statistics, Ankara, Turkey s: Yapay sinir ağları, son yıllarda, zaman serisi öngörüsü için sıklıkla kullanılmaktadır. Bunun nedeni, yapay sinir ağlarının klasik zaman serisi yaklaşımlarındaki kısıtlayıcı varsayımları içermemesi ve esnek hesaplama yeteneğidir [1]. Literatürde farklı nöron modeline sahip yapay sinir ağları ortaya atılmıştır. Bunlardan en yaygın olanı Rumelhart vd. nin önerdiği çok tabakalı algılayıcılardır []. Çok Tabakalı Algılayıcı (Multi Layered Perceptron) modeli, son 0 yılda zaman serileri öngörülerinin elde edilme sürecinde sıklıkla kullanılmaktadır [3]. Bu model ile öngörü yapılırken, verideki aykırı değerlerden çok fazla etkilenmesi tahmin performansı üzerinde olumsuz yönde etki yaratmaktadır [4]. Son yıllarda alternatif yöntemler olan Genelleştirilmiş Ortalama Nöron Modeli (Generalized-Mean Neuron), Geometrik Ortalama Nöron Modeli (Geometric Mean Neuron) ve Tek Çarpımsal Nöron Modeli (Single Multiplicative Neuron) yöntemlerinin literatürde çalışıldığı görülmektedir. Buna karşın, belirtilen modellerde de kullanılmakta olan toplam işlemine dayalı birleştirme fonksiyonu nedeniyle yapay sinir ağlarının öngörü performansı aykırı değerlerden etkilenmektedir. Aladağ vd. [4] tarafından önerilen Çok Tabakalı İleri Beslemeli Medyan Nöron Modeli ile aykırı değer ya da değerlerden kaynaklanan sorunlarla başa çıkılarak, yüksek öngörü doğruluk düzeyine ulaşılmıştır. Önerilen bu modelde birleştirme fonksiyonu olarak ortancaya dayalı bir fonksiyon kullanılmıştır. Belirtilen sinir ağı modelinin eğitimi için Değiştirilmiş Parçacık Sürü Optimizasyonu [5] yönteminden yararlanılmıştır. Yapılan bu çalışmada, Aladağ vd. [4] çalışmasında önerilen sinir ağı modelinin tanıtımı amaçlanmış ve modelin uygulanabilirliği gerçek zaman serileri üzerinde gösterilmiştir. Uygulamada, Türk Lirası na karşı farklı döviz paritelerinin öngörüleri elde edilmiştir. Uygulama sonucunda, belirtilen yöntemin döviz kuru serileri için güvenilir öngörüler ürettiği görülmüştür. Anahtar kelimeler: Öngörü, Yapay sinir ağları, Medyan nöron modeli, Aykırı gözlem, Zaman serileri KAYNAKLAR [1] Aladag C.H., Egrioglu E., Yolcu U. (010), Forecast combination by using artificial neural networks, Neural Process Lett 3(3): [] Rumelhart E., Hinton G.E., Williams R.J. (1986), Learning internal representations by error propagation, Chapter 8, The M.I.T. Press, Cambridge, [3] Egrioglu E., Aladag C.H., Gunay S. (008), A new model selection strategy in artificial neural network, Applied Mathematics and Computation, 195, [4] Aladag C.H., Egrioglu E., Yolcu U. (014), Robust multilayer neural network based on median neuron model, Neural Computational and Application, 4, [5] Kennedy J., Eberhart R.C. (1995), Particle Swarm Optimization, In Proceedings of IEEE International Conference on Neural Networks, ABSTRACT Forecasting Exchange Rates by Using Neural Networks Based on Median Neuron Model 95

296 Multilayer perceptron has been widely used in time series forecasting for last two decades. However, it is a wellknown fact that the forecasting performance of multilayer perceptron is negatively affected when data have outliers and this is an important problem. In recent years, some alternative neuron models such as generalized mean neuron, geometric mean neuron, and single multiplicative neuron have been also proposed in the literature. However, it is expected that forecasting performance of artificial neural network approaches based on these neuron models can be also negatively affected by outliers since the aggregation function employed in these models is based on mean value. Therefore, Aladag et al. (014) proposed a new approach which is called neural networks based on median neuron model. By using this approach, problems arising from outliers can be dealt with. In this approach, a function based on median is utilized as aggregation function. And, modified particle swarm optimization is employed as training algorithm. In this study, the method proposed by Aladag et al. (014) is introduced. In order to show its applicability, the method is applied to real world time series. In the implementation, exchange rates series are forecasted by neural networks based on median neuron model. As a result of the application, it is seen that the method produces accurate forecasting results for the exchange rate series. Key Words: Forecast, Artificial neural networks, Median neuron model, Outlier, Time series 96

297 TÜRKİYE İTHALAT İHRACAT PERFORMANSININ ARIMA VE YAPAY SİNİR AĞLARI YÖNTEMLERİ İLE İNCELENMESİ Selim DÖNMEZ*, Özer ÖZAYDIN Osmangazi Üniversitesi Fen Edebiyat OsmangaziÜniversitesi Fen Edebiyat 1. Yapay sinir ağları yöntemi ve ARIMA yöntemleri Yapay sinir ağları yöntemi son 50 yılda ortaya çıkmış olup çok kısa zamanda parametrik olmayan yöntemler arasında en geniş kapsamlılardan biri olmuştur. Kullanım alanları geniş olup bu yöntem teknolojinin ilerlemesi ile önem kazanmıştır. Bu yöntemin bir parametrik olmayan yöntem denmesinin temel sebebi, herhangi bir veri için spesifik bir tasarım içerisinde parametreleri istediği gibi düzenleyerek yapay sinir ağlarının istediği biçimde kendini veriye adapte etmesinden gelmektedir. Bir başka deyişle yapay sinir ağları veriden öğrenerek analiz eden bir yöntemdir. İstatistiksel yöntemler uygulanırken, model için belirtilmiş parametreler için bazı koşullandırmalar lazım gelmiştir. Örneğin ARIMA modelleri için model oluşturulurken model için belirtilmiş birtakım kıstaslar belirtilmektedir. Bu kıstaslar rezidülerin ortalaması, varyansı, dağılımı ve ilişkisizliğine ilişkindir. Bu kıstaslar altında azami olabilirlik tahmin yöntemi uygulanarak ideal model oluşturmaya çalışılır. ARIMA modeli doğru tanımlandığı vakit, sorunsuz bir biçimde analiz gerçekleştirilir. Ancak bu yaklaşım veriye uyumu etkilemektedir. Bu noktada yapay sinir ağları ile ARIMA yöntemleri arasında bir çelişki olmaktadır ve yapay sinir ağları ile ARIMA yöntemleri arasındaki temel farklılık, burada doğmaktadır. Yapay sinir ağları yöntemi ile ilgili en önemli mesele, tasarım meselesidir. Bugüne kadar geliştirilmiş olan bütün tasarımlar amaca göredir. Zaman serileri analizi için geliştirilecek olan tasarımda bizim yaklaşımımız, istatistiksel kıstas koymaktır. Girdi nöronları için sinaptik ağırlıklara bir başlangıç noktası koymak bu işi kolaylaştırabileceği gibi zorlaştırabilir. Bu işi doğru bir istatistiksel analizle yaptığımız vakit bunun kolaylaştırıcı olması gerekmektedir. Yapay sinir ağı yöntemi uygulanırken MINITAB 16 programıyla ön model elde edilmiş ve buna göre girdi tabakasındaki nöron sayısı belirlenmiştir. Örneğin, zaman serisinde AR(1) tipi bir model varsa, yapay sinir ağı tasarımında girdi nöronu ve 1 çıktı nöronu bulunmaktadır. Hata düzeltmeli öğrenme gerçekleştirilmiş ve öğrenme katsayısı düşük tutulmuştur. Hata düzeltmeli öğrenmeyle sinaptik ağırlıklar şu şekilde güncellenir: w kj (n + 1) = w kj (n) + ηe k (n)x j (n) (1) Burada η öğrenme katsayısı, e k (n) ve x j (n) sırayla k. hata ve j. girdi nöronu için değerleri ifade etmektedir. Öğrenme katsayısı düşük tutulmuştur ve yapay sinir ağı modellemesini bir çeşit yöneylem araştırması problemi olarak ele almayı ifade etmektedir. Yöneylem araştırmasında çözüm için bu kısıtları koyma tekniğine TABU araması adı verilmiştir. İlk olarak Glover and McMillan(1986) tarafından geliştirilen ve Glover(1989, 1990) tarafından formülleştirilen bu yöntem herhangi bir çözüm arama yaklaşımının performansını geliştirerek en ideal sonuca varmasını sağlamaktır. Çalışmada sinaptik ağırlıklar rasgele dağıtılırken daha önceden geliştirilmiş olan modelde katsayıların güven aralıkları kullanılarak en uygun çözüm bulmaya çalışılmıştır. Türkiye ithalat ve ihracat verileri, 1997 nin ocağından 015 şubatına kadar aylık toplanmış olup 18 birimdir ve 10 tabanlı logaritması alınarak verilerin işlenmesi yapılmıştır. Sonra da yapay sinir ağlarından elde edilen modelle, MINITAB dan elde edilen ön model kıyaslanmış ve başarılı sonuçlar elde edilmiştir. Yapay sinir ağları modeline göre grafik ve MINITAB model ile yapay sinir ağlarından elde edilen öngörüleri içeren tablo şu şekildedir: 97

298 Grafik 1: Yapay sinir ağları modelinin, gerçek veriyle uyumu Çizelge 1: Yapay sinir ağları modelinin, gerçek değer ve MINITAB öngörüsüyle kıyaslanması Yapay sinir ağları Tarih modeli öngörüsü Gercek Değer MINITAB Öngörüsü E E E E E E+07 KAYNAKLAR [1] Glover F. (1989) Tabu Search - Part 1, ORSA Journal on Computing, 1,, [] Glover F. (1990) Tabu Search - Part, ORSA Journal on Computing,, 1, [3] Glover, F. and McMillan, C. (1986) The general employee scheduling problem: an integration of MS and AI, Computers and Operations Research, 13, 5, [4] Haykin, S. (1998) Neural Networks: A Comprehensive Foundation nd Edition, Prentice-Hall 98

299 ŞUBE VERİMLİLİK VE LOKASYON TAHMİNİ: ZİRAAT BANKASI UYGULAMASI Ayfer ÇELİK, Sinan TANRIKULU, Dr. İlker MET, M. Özgür DOLGUN *, Cenk BALKAN Anafartalar Mahallesi, Atatürk Bulvarı No:8 Ziraat Bank Genel Müdürlüğü Altındağ, Ankara Bestekar Sokak No:4/1 Kavaklıdere, Ankara Giriş Son yıllarda bilgi sistemleri ve teknolojinin gelişmesi sonucunda; kamu kurum ve kuruluşları, işletmeler ve diğer kuruluşlar veritabanlarında kuruluşun amacına ve yapısına bağlı olarak çeşitli türlerde veri toplamaktadır. Fakat bu veriler işlenmediği sürece anlamsız bir veri yığını olarak veritabanlarında depolanmaktadır [1]. Uygun yazılımların gelişimi ve firmaların topladığı veriyi kullanılabilir bilgiye çevirme isteği toplanan bu veriyi işleyerek, verinin içerisindeki kullanılabilir ve ilginç ilişkilerin, birlikteliklerin ve örüntülerin (patterns) ortaya çıkarılmasını gerekli hale getirmiştir. Günümüzde pek çok kurum verilerini müşteri nitelikleri ve müşterilerin satın alma örüntülerine ilişkin yararlı, kullanışlı bilgiler elde edecek yöntemler ile işlemeye başlamamıştır. Ham veri zengini, nitelikli bilgi (knowledge) fakiri durumunda olan kurumların rekabetçi piyasada başarılı olmaları ve başarılarını sürdürmeleri her geçen gün daha da zorlaşmaktadır. Veri toplamanın önemini kavramış olan ve geçmişe yönelik sorgularla veriden en üst düzeyde fayda sağlayamayacağını görmeye başlayan bütün kurumların en büyük yardımcısı veri madenciliğidir [,3].. Plan ve Yöntemler Ziraat Bankası, analitik dünyaya ayak uydurabilmek için mümkün olan bütün platform ve teknik bilgiyi kullanmakta ve kritik kararları bu analitik araçlar ile almaya çalışmaktadır. Bu kapsamda, şubelere ilişkin; i. Şube değer ve potansiyel değer segmentasyonu, ii. Şube verimlilik ve lokasyon tahmini ve iii. Şube operasyon kadrosunun belirlenmesi çalışmaları Kurumsal Mimari Grup Başkanlığı bölümünde gerçekleştirilmiştir. Bu çalışmalar ile; i. Bir şubenin şu andaki ve olması gereken değeri, ii. Bir şubenin verimliliği, iii. Açılması planlanan koordinatlarda beklenen verimi ve karlılığı, analitik araçlar ile tespit edilmiştir. Bu amaç doğrultusunda, IBM SPSS Modeler ve çeşitli istatistik (Doğrusal Regresyon ve GLM) ve yapay zeka algoritmaları (Karar Ağaçları, Yapay Sinir Ağları) tahmin, K-Means ve Two-Step algoritmaları ise kümeleme amacıyla kullanılmıştır. Model sonuçları ile tahmin edilen potansiyel değer, gerçek değer ve verim puanları, Banka tarafında kullanılmakta olan harita sistemi üzerine aktarılmış olup, şube açılmak istenen koordinatın verilerine model tahmin sonuçları ile ulaşılabilmektedir. Şube Operasyon kadrosunun tahmini modelleme ve kümeleme yöntemleri ile tahmin edilmiştir. Şubelerde yapılan işlerin niteliğine göre kümeleme yöntemi ile 5 kümeye 99 ayrılan şubeler ve şube operasyon kadroları iş bilgisi ve istatistiksel sonuçlar ile birlikte yorumlanarak şubenin niteliğine göre şubede çalışan operasyon norm kadrosunun uygun olup olmadığı araştırılmıştır.

300 . KAYNAKLAR [1] Dolgun M.Ö. (014), Veri Madenciliği Sınıflama Yöntemlerinin Başarılarının; Bağımlı Değişken Prevelansı, Örneklem Büyüklüğü ve Bağımsız Değişkenler Arasındaki İlişki Yapısına Göre Karşılaştırılması, Doktora Lisans Tezi, Hacettepe Üniversitesi Sağlık Bilimleri Enstitüsü, Ankara. [] Han J., Kamber M. and Pei, J. (011), Data Mining: Concepts and Techniques, The Morgan Kaufmann, Third Edition. [3] Larose D.T. (006), Data Mining Methods and Models, Wiley-Interscience, New Jersey, 3p. ABSTRACT BRANCH EFFICIENCY AND LOCATION FORECASTING: APPLICATION OF ZIRAAT BANKASI Ziraat bank, has performed branch value and potential value segmentation, branch efficiency and location forecasting, and branch operations staff studies by using with statistical and data mining methods. The results were integrated into the system by the Enterprise Architecture Group and has been in operational use by the bank. Key Words: value and potential value segmentation, location forecasting, data mining 00 3

301 ZAMAN SERİSİ KÜMELEMESİ KULLANILARAK TÜRKİYE DEKİ HAVA KALİTESİ İZLEME İSTASYONLARINDAKİ BİLGİ FAZLALIĞININ TESPİT EDİLMESİ Nevin GÜLER DİNCER, Öznur İŞÇİ GÜNERİ, M. Oğuzhan YALÇIN Muğla Sıtkı Koçman Üniversitesi, Fen Fakültesi, İstatistik Bölümü, Kötekli, MUĞLA 1. Otoregresif Modele Dayanan Bulanık C-Medoidler Zaman Serisi Kümelemesi Zaman serisi kümelemesi son zamanlarda, hava, su, deprem vs. gibi ölçüm ve izleme istasyonlarındaki bilgi fazlalığının azaltılması, izleme istasyonlarının optimal konfigürasyonun tespit edilmesi, benzer istasyonların belirlenerek izleme maliyetlerinin azaltılması konusunda sıkça kullanılmaya başlanmıştır[1][][3][4]. Bu çalışmada otoregresif modele dayanan zaman serisi kümelemesi kullanarak Türkiye de benzer davranışa sahip hava kirliliği izleme istasyonlarının belirlenmesi amaçlanmıştır. Zaman serileri PM 10 ve SO kirleticilerine ilişkin haftalık ölçümlerden oluşmaktadır ve (Nisan) dönemini kapsamaktadır. Bu amaca yönelik olarak izlenen adımlar şu şekildedir: Adım 1: Yti (i 1,,..,K) i. istasyondan elde edilen haftalık ölçümleri göstersin. İlk olarak Augmented Dickey-Fuller birim kök testi uygulanarak serinin durağanlığı test edilir. tanımlanan otoregresif model tahmin edilir: ti i0 i1 ( t1)i i (t )i ip (t p)i t Seri durağan ise aşağıdaki gibi Y Y Y... Y (1) Burada { 0, 1,,..., } R p i i i ip i. otoregresif modelin tahmin edilen parametrelerini göstermektedir. Adım : Seri durağan değilse logaritması veya farkları alınarak durağanlaştırılır ve elde edilen durağan seri için (1) eşitliği tahmin edilir. Adım 3: K tane istasyon, { 0, 1,,..., } R p i i i ip parametre vektörlerine göre kümelenir. Burada kümeleme algoritması olarak Bulanık C-Medoidsler (BCM) [5] kullanılmıştır. BCM algoritmasının tercih edilme sebebi, diğer istasyonlara göre çok farklı davranan istasyonların bir başka deyişle aykırı değerlerin kümeleme sonucunu olumsuz etkilemesi engellemektir. BCM yöntemi aşağıdaki amaç fonksiyonunun iteratif olarak minimize edilmesine dayanır: K c m (U,,V) ij ( i, j ) i1 j1 J u d () Burada m bulanıklık indeksini, istasyon sayısını, c küme sayısını, u ij i. zaman serisinin j. kümeye üyeliğini, j j. kümeye ilişkin medoidi, K d (, ) ise i. istasyona ilişkin otoregresif parametre vektörü ile j. medoid i j arasındaki Öklit uzaklığını göstermektedir. () eşitliğinde verilen amaç fonksiyonu minimize edildiğinde üyelik ve medoidler için güncelleştirme eşitlikleri aşağıdaki gibi elde edilir. u ij 1 c d (, ) m 1 i j k 1 d ( i, k) (3) n m j arg min (, ) k j uij d i k i (4) BCM algoritmasının çalışma prensibi şu şekildedir: K tane otoregresif parametre arasından c tane başlangıç medoidi olarak seçilir. (3) eşitliği kullanılarak üyelik değerleri hesaplanır. Yeni üyelik değerlerine göre (4) eşitliğinden c tane medoid yeniden hesaplanır. Bu işlemlere üyelik değerleri sabitlenene kadar devam edilir.

302 Adım 4: Kümeleme sonucunda elde edilen medoidleri temsil eden hava kirliliği izleme istasyonları izlenecek istasyonlar olarak seçilir. Bir başka deyişle, medoid istasyonlardan elde edilen hava kirliliği bilgisi diğer istasyonlar için kullanılabilir, böylece muhtemel bilgi fazlalığı azaltılmış olacaktır. Bunun dışında, aynı küme içinde yer alan istasyonlar eğer coğrafi olarak da birbirine yakın ise, bazı istasyonlardaki ölçüm aletlerinin başka istasyonlara transferine karar verilebilir. KAYNAKLAR [1]. Ortuno C, Jaimes M, Mun oz R, Ramos R, Paramo VH. (005), Redundancy analysis for the Mexico City air monitoring network: the case of CO. Air and Waste Management Association's - 98th Annual Conference and Exhibition. []. Lu H-C., Chang C-L., Hsieh J-C., (006). Classification of PM 10 distributions in Taiwan, Atmospheric Environment, 40: [3]. Giri, D.; Murthy, V. K.; Adhikary, P. R.; Khanal, S. N., 007. Cluster analysis applied to atmospheric PM10 concentration data for determination of sources and spatial patterns in ambient air-quality of Kathmandu Valley, Research Communications, 93(5): [4]. D Urso P., Lallo DD., Maharaj, EA., 013. Autoregressive model-based fuzzy clustering and its application for detecting information redundancy in air pollution monitoring networks, Soft Computing, 17: [5]. Krishnapuram R., Joshi A., Nasraoui O., and Yi L., (001), Low-complexity fuzzy relational clustering algorithms for web mining, IEEE Transactions on Fuzzy Systems, vol. 9, no. 4, pp IDENTFYING OF INFORMATION REDUNDANCY IN AIR QUALITY MONITORING NETWORKS AT TURKEY BY USING TIME SERIES CLUSTERING ABSTRACT Time series clustering is widely used in reduction of information redundancy in water, air and earthquake monitoring networks, determination optimal configuration of them and thus decreasing the monitoring cost. The main objective of this study is to identify possible information redundancy in monitoring networks in Turkey, that is, to provide adequate information with a smaller number of monitoring networks. For this aim, autoregressive based clustering time series method has been applied to time series data sets consisted of the weekly mass concentrations of particulate matter with an aerodynamic diameter less than 10 μm (PM 10 ) and Sulphur dioxide (SO ). Keywords: Fuzzy C-Medoids Clustering, Tıme Series Clustering, Reduction of Information Redundancy 0 3

303 SESSION 8 MODELLEME ve BENZETİM 03 3

304 BİLGİ KARMAŞIKLIĞI KRİTERİ (ICOMP) İLE OLASILIKLI TEMEL BİLEŞENLER ANALİZİ NDE BOYUT SAYISINA KARAR VERME ÜZERİNE SİMULASYON ÇALIŞMASI Esra PAMUKÇU a Hamparsum BOZDOĞAN b a Fırat Üniversitesi Fen Fakültesi İstatistik Bölümü,3119,Elazığ epamukcu@firat.edu.tr 1. Amaç b Department of Business Analytics and Statistic, The University of Tennessee Knoxville, TN 37996, U.S.A. bozdogan@utk.edu Sözlü Sunum Temel Bileşenler Analizi ile çok boyutlu değişken uzayını en az bilgi kaybıyla daha az boyutlu değişken uzayına indirgemek, hem diğer çok değişkenli analiz yöntemlerine veri hazırlama bakımından hem de başlı başına kendisinin bir analiz tekniği olması açısından araştırmacılar tarafından çok başvurulan bir yöntemdir. Temel bileşenler analizi alanında birçok araştırma halen yapılmakta ve yaygın bir şekilde kullanılmaktadır. Tekniğin görünüşteki basitliğine rağmen uygulamada araştırmacıların en sık karşılaştığı problem olan önemli bileşen sayısına yani boyut sayısına karar vermek, literatürde hala tatmin edici bir şekilde çözülememiş olan bir problemdir. Bu çalışmanın amacı, Bozdogan (1987,1994, 000a, 004 ) tarafından geliştirilen bir model seçim kriteri olan Bilgi Karmaşıklığı Kriteri ICOMP ile, eş zamanlı olarak model kompleksliğini de göz önüne alarak önemli bileşen sayısına nasıl karar verilebileceğini bir simülasyon çalışması ile ortaya koymaktır.. Yöntem ICOMP (Information Complexity) tipi kriterler, Bozdoğan tarafından geliştirilen ve günümüzde de çalışmaları devam eden, çok değişkenli doğrusal ve doğrusal olmayan modellerde model seçimi için geliştirilen ve bilgi karmaşıklığına dayanan yeni bir istatistiksel model seçim kriterleri ailesidir. ICOMP tipi kriterlerin amacı, bir modelin karmaşıklığı ve uyumu arasındaki en uygun dengeyi sağlamaktır. ICOMP, modeldeki parametrelerin birbirleriyle nasıl ilişkili olduklarını ölçen bir komplekslik ölçüsünü de göz önüne alarak bu dengeyi kurmayı amaçlar. Bu nedenle, her ne kadar Akaike Information Criterion-AIC temeline dayanan bir ölçü olsa da, AIC dan farklı olarak, bağımsız parametre sayısını direkt olarak cezalandırmak yerine, modelin kovaryans kompleksliğini cezalandırmaktadır. Model seçim kriterlerinin ve dolayısıyla ICOMP bilgi karmaşıklığı kriterinin yapısı gereği, bir model için bilgi kriteri uygulayabilmenin en önemli zorunluluğu, maksimum olabilirlik tahmin edicisinin var olmasıdır. Halbuki klasik temel bileşenler analizi, maksimum olabilirlik tahminin elde edilmesi için gerekli olan bir olasılık modelinden yoksundur. Michael E. Tipping ve Christopher M.Bishop (1997) de faktör analiziyle yakından ilişkili olan bir gizli (latent) değişken modelinde parametrelerin maksimum olabilirlik tahminleri sayesinde, gözlenen veri vektörlerinin bir setinin temel eksenlerinin oluşturulabileceğini göstermişler ve Probabilistic Principal Component Analysis-PPCA yani olasılıklı temel bileşenler analizini önermişlerdir. Bir olasılık çerçevesi içinde çalışmanın en kritik ve en önemli avantajı, istatistik tabanlı model seçim araçlarının kullanılmasına imkan vermesidir. Buradan hareketle çalışmanın ilk adımı olarak PPCA modeli için bilgi kriterleri türetilmiştir. 3. Simülasyon Çalışması Çalışmanın amacı doğrultusunda önerilen yöntemin tutarlı çalışıp çalışmadığını tespit edebilmek amacıyla, yapısal olarak gerçek boyut sayısının bilindiği veri setlerini türetebilmek ve ICOMP ile gerçek boyutun tespit edilip edilmediğini göstermek gerekmektedir. Bunun için bir simülasyon protokolü hazırlanmıştır. Bu noktada amaç, yapısal olarak gerçek boyut sayısının önceden bilindiği bu veri setlerine bilgi kriterleri ile PPCA analizi yapmak, bilgi kriterleri ile boyut sayısına karar 3vermek ve yinelemeli olarak bu işlemler tekrar edildiğinde, bilgi kriterlerinin hangilerinin gerçek boyutu 04 daha isabetli bir şekilde tespit edebildiğini ortaya koyabilmektir. Farklı senaryolarda, farklı gözlem sayılarında ve farklı yayılım ölçülerine sahip olan veri setleri, çeşitli iterasyon sayılarında türetilerek sonuçlar elde edilmiştir. Hesaplamalar MATLAB programında yazılan bir program ile yapılmıştır.

305 4. Sonuç ICOMP bilgi kriterinin PPCA ile boyut indirgeme yapılması esnasında, boyut sayısına karar verme aracı olarak kullanılabilmesi, boyutun araştırmacı tarafından keyfi olarak seçilmesinin önüne geçmekte ve sahip olduğu teorik dayanak noktasından dolayı seçilen boyut sayısına duyulan güveni artırarak literatüre yeni bir bakış açısı kazandırmış olmaktadır. KAYNAKLAR [1] Tipping, M., E. ve Bishop, M., C. (1999). Probabilistic principal component analysis, Journal of the Royal Statistical Society, Series-B. 61(3):611-6 [] Bozdogan, H. (1988). ICOMP: A new model selection criterion. Classification and Related Methods of Data Analysis [3] Pamukcu E., Bozdogan H., Çalık S. (015). A Novel Hybrid Dimension Reduction Technique for Undersized High Dimensional Gene Expression Data Sets Using Information Complexity Criterion for Cancer Classification. Computational and Mathematical Methods in Medicine. Volume 015 (015), Article ID ABSTRACT A SIMULATION STUDY ON DETECTING THE NUMBER OF DIMENSIONS IN PROBABILISTIC PRINCIPAL COMPONENT ANALYSIS USING INFORMATION COMPLEXITY CRITERIA In this study, to reduce the dimensionality of the data and to choose the number of probabilistic PCs (PPCs) to be retained, we introduce and develop information theoretic measure of complexity (ICOMP) criterion of Bozdogan. A large- scale simulation study was carried out to demonstrate how to choose the best number of dimensions needed in the PPCA with information criteria. It is observed that the information criteria detect the true dimension in simulated data in selecting the optimal number of PPCs with high degree of accuracy. The results show the flexibility and utility of the new approach presented. Keywords: Probabilistic Principal Component Analysis, Information Complexity, Dimension Reduction, Simulation Study 05 3

306 İSTATİSTİKSEL TEST TABLOLARININ BENZETİM İLE ELDE EDİLMESİ Buğra Kaan TİRYAKİ*, Orhan KESEMEN Karadeniz Teknik Üniversitesi, Fen Fakültesi, İstatistik ve Bilgisayar Bilimleri Bölümü, Trabzon, TÜRKİYE 1. Giriş Çıkarımsal istatistik, modern istatistiğin temel konularından birisidir. Çıkarımsal istatistik, ileri sürülen bir hipotez eşliğinde, parametrik ve parametrik olmayan testler olmak üzere, iki biçimde incelenmektedir [1]. Hem parametrik testler için hem de parametrik olmayan testler için ileri sürülen hipotezin testinde, çoğu zaman α anlamlılık düzeyinde karar kuralı oluşturulması gerekmektedir. Hesaplanan test istatistiği, ilgili testin tablo değeriyle karşılaştırılarak hipotezin kabulü ya da reddi için karar verilmektedir. Bu sebeple, istatistikte hem parametrik hem de parametrik olmayan yöntemler için kritik değerler tablosu büyük önem taşımaktadır. Bu çalışmada istatistiksel olarak sık kullanılan testlerden ki-kare uyum iyiliği testi ve Kolmogorov-Smirnov testi kritik değerler tablosu benzetim ile elde edilmiştir. Benzetim ki-kare uyum iyiliği testi tablosunda her bir serbestlik derecesi için bir milyon kez, benzer şekilde Kolmogorov-Smirnov tablosunda da her bir örneklem için bir milyon kez deneme ile gerçekleştirilmiştir. Ki-kare uyum iyiliği testi kritik değerler tablosu ve Kolmogorov- Smirnov testi kritik değerler tablosu, benzetim ile elde edilen tablo değerleriyle %99 u aşan sonuçlar göstermektedir. Benzetim MATLAB paket programında gerçekleştirilmiştir.. Yöntemler Ki-Kare Uyum İyiliği Testi Ki-kare istatistiği uyumun yeterliliği için karar vermek amacıyla kullanılır. Uyum terimi gözlenen örneklem dağılımlarının ya da deneysel sonuçlarla elde edilen dağılımların, beklenen ya da normal, binom, Poisson ve düzgün dağılım gibi kuramsal dağılımlarla karşılaştırılması için kullanılır. Beklenen frekansların eğrisi gözlenen frekansların eğrisi üzerine çizilir ve ki-kare istatistiği uyumun yeterli olup olmadığını belirlenir []. c (G j B j ) Χ h j=1 B j (1) G j : j inci sınıftaki örnek birimlerin sayısı (gözlenen frekans) j=1,,,c B j : j inci sınıf için beklenen frekans c:sınıf sayısı Karar Kuralı: χ h > χ c 1,α ise H 0 reddedilir χ h χ c 1,α ise H 0 reddedilemez. Kolmogorov-Smirnov Uyum İyiliği Testi Kolmogorov Smirnov istatistiği ile yokluk hipotezinde verilmiş bir deneysel olasılık dağılımı gösteren örneklem verilerinin, dağılım parametreleri tam olarak bilinen bir kitlenin olasılık dağılımına uyum gösterip göstermediği test edilir. Bu tip problemlerde yokluk hipotezi örneklem verilerin deneysel dağılımının tam tanımlanmış bir kitlenin olasılık dağılımından gelmiş olduğu üzerinedir [3]. S(x) = x değerine eşit veya daha küçük değerli örnek birimlerin sayısı n 06 3 () D h = sup S(x) F 0 (x) x (3)

307 F 0 (x) : Yokluk hipotezinde belirtilen birikimli dağılım fonksiyonu S(x) : Örnekten elde edilen birikimli dağılım fonksiyonu Karar Kuralı: D h D k ise H 0 reddedilir D h < D k ise H 0 reddedilemez. 3. Sonuç Benzetimle 0.1, 0.05, 0.05, 0.01, anlamlılık düzeylerinde ki-kare uyum iyiliği testi ve Kolmogorov- Smirnov uyum iyiliği testleri için kritik değerler tablosu oluşturulmuştur. Ki-kare uyum iyiliği testi kritik değerler tablosu için serbestlik derecesi 4 den 50 ye kadar alınarak hesaplanmıştır. Kolmogorov-Smirnov uyum iyiliği testi için kritik değer tablosu için örneklem genişliği 1 den 40 a kadar alınarak hesaplanmıştır. Ki-kare uyum iyiliği testi kritik değerler tablosu ve Kolmogorov-Smirnov testi kritik değerler tablosu, benzetim ile elde edilen tablo değerleriyle %99 u aşan sonuçlar elde edilmiştir. KAYNAKLAR [1] H. Bircan, H., Karagöz Y. ve Kasapoğlu, Y., (003) Ki-Kare Ve Kolmogorov Smirnov Uygunluk Testlerinin Simulasyon İle Elde Edilen Veriler Üzerinde Karşılaştırılması, C.Ü. İktisadi ve İdari Bilimler Dergisi, Cilt 4, Sayı 1, 00. [] Prof.Dr. Fikri AKDENİZ (007), Olasılık ve İstatistik, Nobel Kitabevi. [3] Stephens, M. A. (1974). "EDF Statistics for Goodness of Fit and Some Comparisons". Journal of the American Statistical Association (American Statistical Association) 69 (347): ABSTRACT DETERMINING STATISTICAL TABLES USING SIMULATION In this study, the chi-square goodness of fit test and Kolmogorov-Smirnov test critical values tables were obtained with simulation. The simulation was performed a million times in each degree of freedom for chisquare goodness of fit test table and also, the simulation was performed a million times in each sample for Kolmogorov-Smirnov test table. The simulation was performed 0.1, 0.05, 0.05, 0.01, significance levels. In conclusion, the simulation was resulted in close to 99% of success. Key Words: Statistical test tables, chi-square goodness of fit test, Kolmogorov-Smirnov test 07 3

308 YAPISAL EŞİTLİK MODELİ İLE MONTE CARLO SİMULASYON ÇALIŞMASI Murat DOĞAN *, Veysel YILMAZ Eskişehir Osmangazi Üniversitesi, Fen Edebiyat Fakültesi, İstatistik Bölümü, 6000, Eskişehir, TÜRKİYE, YEM, istatistiksel bağımlılığa dayalı modellerle ilgili bütünleşik hipotezler içindeki değişkenlerin sebep-sonuç ilişkisini açıklayabilen ve kuramsal modellerin bir bütün olarak test edilmesine olanak veren etkili bir model test etme ve geliştirme yöntemidir. YEM modelleri araştırmacılara, değişkenler arasında doğrudan ve dolaylı etkileri belirleme olanağı sağlamaktadır. Aynı zamanda YEM, modele kuramsal yapılar arasındaki etkileşimleri, ölçme hatalarını ve hatalar arasındaki ilişkileri yapılara dâhil ederek modelleyen çok değişkenli istatistiksel bir yaklaşımdır. YEM, eşanlı eşitlik modelleri veya çok değişkenli regresyon modelleri olarak da tanımlanmaktadır (Bollen, K.A., (1989), Schumacher R.E., Lomax R.G.,(004)). YEM ayrıca gözlenen ve gözlenemeyen (gizil, latent) değişkenler arasındaki nedensel ilişkilerin sınanmasında kullanılan kapsamlı bir istatistiksel teknik olarak da tanımlanmaktadır. YEM de kullanılan parametre tahmin yöntemlerinin önerilmesi, geliştirilmesi ve hangi koşullarda tercih edilmesine yönelik yapılan çalışmaların yanı sıra, tahmin yöntemleri, örneklem hacimleri, dağılımsal koşullar, gizil değişken sayısı, gözlenen değişken sayısı, modelin yanlış belirlenme derecesi, faktör yükleri, faktör korelasyonları, uygun olmayan çözümler ve yakınsama hatası gibi etmenlerinde model uyum ölçüleri üzerindeki etkilerini incelemek için farklı deneysel tasarımlar kullanılarak yapılan simülasyon çalışmalarının, YEM literatürüne katkı sağladıkları görülmektedir. Monte Carlo (MC) simülasyonu da YEM için istatistiksel kestirimleri değerlendirmede oldukça yaygın bir yöntem olmuştur. Bu yöntem, örneklem büyüklüğü, normal dağılımlı olmama, model karmaşıklığı ve modelin yanlış belirlenmesi gibi çeşitli koşullar altında tahminler ve uyum iyiliği istatistiklerini değerlendirmede üstün bir yöntemdir (Paxton P., et.al., (001)). Ayrıca MC yöntemi rassal olarak üretilen sayıları kullanarak değişkenlerin dağılımlarının özelliklerini belirleyebilmektedir (Gentle, J.E., (1985)). MC yöntemi birçok avantajı olmasına rağmen uygulaması zordur. Bu yüzden çalışmada MC simülasyonu i. İlgilenilen araştırma sorusunun teorik olarak geliştirilmesi, ii. Soruya uygun modelin oluşturulması, iii. Çalışmaya uygun deneysel koşulların seçilmesi, iv. Kitle parametre değerlerinin seçilmesi, v. Uygun yazılım programının seçimi, vi. Simülasyonun yürütülmesi, vii. Simülasyon çıktılarının uygun şekilde depolanması, viii. Sorun giderme ve doğrulama, ix. Sonuçların özetlenmesi. olmak üzere 9 adımda oluşturulmuştur. MC simülasyonu adım adım uygulanan bir teknik olmasına rağmen her bir adım birbiriyle bağlantılı olduğundan simülasyonun bir bütün halinde oluşturulması avantaj sağlamaktadır. Bu çalışmanın amacı da, normal dağılıma sahip olmayan (NDSO) değişkenler için YEM de kullanılan tahmin yöntemlerinin uyum ölçülerine etkisini Monte Carlo simülasyonu yardımıyla karşılaştırmaktır. Bu amaçla ilk olarak, farklı örneklem hacimlerinde çok değişkenli normal ve normal olmayan veri setleri üretilmiş, daha sonra üretilen veriler için dört parametre tahmin yöntemi yardımıyla parametreler ve uyum ölçütleri hesaplanmıştır. Çalışmanın sonucunda kullanılan tahmin yönteminin uyum ölçütlerine etkileri tartışılmış ve örneklem hacmi 00 den küçük olduğunda, AGLS yönteminin kullanılmasının uygun olmadığı belirlenmiştir. Ayrıca 400 birim ve üstü örneklem hacimlerinde ve çok değişkenli normallikten sapma durumlarında dört tahmin tekniği yakın sonuçlar vermiştir. Ki kare uyum ölçüsü çok değişkenli normallik varsayımı altında örneklem hacmi arttıkça büyük değerler alarak gerçekçi olmayan sonuçlar verirken, normallik varsayımının olmadığı durumlarda örneklem hacminin büyümesinden çok fazla etkilenmemektedir. NFI ve CFI uyum indeksleri ise ML ve LS tahmin yönteminde ve sadece normallik varsayımının sağlandığı 3 durumlarda iyi sonuç ortaya koymuştur. 08 KAYNAKLAR

309 [1] Bollen, K.A., (1989), Structural Equations with Latent Variables, Wiley, New York, 514p. [] Gentle, J.E., (1985), Monte Carlo methods, in The encyclopedia of statistical sciences, Eds. Kotz, S., Johnson, N.L., Vol.5, pp , New York: Wiley [3] Paxton P.,, Patrick J. Curran, Kenneth A. Bollen, Jim Kirby & Feinian Chen (001): Monte Carlo Experiments: Design and Implementation, Structural Equation Modeling: A Multidisciplinary Journal, 8:, [4] Schumacher R.E., Lomax R.G.,(004). A Beginner s Guide to SEM, nd ed, Lawrenge Erlbaum Associotes, Publishers, New Jersey. ABSTRACT MONTE CARLO SİMULATİON STUDY WİTH STRUCTURAL EQUATİON MODELİNG In this study, Monte Carlo simulation is used to evaluate the characteristics of Confirmatory Factor Analysis (CFA) fit indices under different conditions (such as sample size, estimation method and distributional conditions). The simulation study was performed using different samples and four different estimation methods (Maximum Likelihood, Generalized Least Square, Least Square and Weighted Least Square). A simulation study was conducted with EQS software to examine the effect of these conditions on the most common eleven fit indices that are studied in CFA and Structural Equation Modeling (SEM). As a result of this study, all of the factors studied are shown to have an influence on the fit indices. Key Words: Structural Equation Modeling, Monte Carlo Simulation, Confirmatory Factor Analysis 09 3

310 KÜÇÜK ÖRNEKLEMLERDE NORMALLİK TESTLERİNİN GÜÇLERİ YÖNÜNDEN KARŞILAŞTIRILMASI Deniz TAŞÇI*, Süleyman GÜNAY Hacettepe Üniversitesi, Fen Fakültesi, İstatistik Bölümü, 06800, Beytepe, Ankara, Türkiye * deniztasci@hacettepe.edu.tr, sgunay@hacettepe.edu.tr Günlük yaşamda alınan tüm kararlarda istatistiksel teknikler doğal biçimde yoğun olarak kullanılır. Karşılaşılan olaylar neden sonuç çerçevesi içerisinde değerlendirilir ve doğru olduğu düşünülen fakat doğruluğundan emin olunmayan kararlarla gelecek şekillendirilir. Bu duruma bir istatistikçi gözüyle bakıldığında ise doğruluğu iddia edilen bir hipotez test edilerek hayata yön vermeye çalışılır, hatta yaşam ve alınan kararlar modellenir, ilerleyen yıllarda hayatta hangi noktada olunacağı tahmin edilmeye çalışılır. Parametrik istatistiksel yöntemlerle tahmin yapabilmek için birçok varsayımın sağlanması gerekmektedir. Bu varsayımlardan en çok karşılaşılanı ise tahmin yapmak için kullanılan örneklemin, normal dağılımlı bir kitleden gelmiş olması varsayımıdır. Bu noktada araştırmacılar, bu uyumu incelemek adına uyum iyiliği testlerinden yararlanırlar. Bilinmeyen bir kitleden çekilen n birimlik örneklemin hangi kitleye ait olduğunu araştırmak için uyum iyiliği testleri kullanılır. Yaygın olarak kullanılan uyum iyiliği testlerinden bazıları Ki-kare, Cramer-von Mises, Kolmogorov- Smirnov, Anderson-Darling, Shapiro-Wilk, Shapiro-Francia, Lilliefors, Jarque-Bera, D Agostino-Pearson testleri olarak verilebilir. Günümüzde 40 dan fazla uyum iyiliği testi olduğu söylenebilir [1]. Bu çalışmada, uyum iyiliği testleri yapılarına göre ele alınmıştır. Deneysel dağılıma, sıralı istatistiklere ve momentlere dayalı testler belirlenmiştir. Belirlenen bu uyum iyiliği testleri normalliği incelemek üzere Monte Carlo (MC) benzetim çalışmasında ele alınmış, küçük örneklemlerde I. Tip hata ve güç değerleri aracılığıyla elde edilen sonuçlar yardımıyla uyum iyiliği testleri karşılaştırılmıştır. Karşılaştırılan testler içerisinde küçük örneklemlerde hangi testin hangi koşullarda daha güçlü olduğu saptanmıştır. Anahtar Kelimeler: Uyum İyiliği Testleri, Ki-kare, Cramer-von Mises, Kolmogorov-Smirnov, Anderson- Darling, Shapiro-Wilk, Shapiro-Francia, Lilliefors, Jarque-Bera, D Agostino-Pearson, Küçük Örneklem, I. Tip hata, Testin Gücü, Monte Carlo benzetimi KAYNAKLAR [1] Dufour J. M., Farhat A., Gardiol L., Khalaf L. (1998), Simulation-based finite sample normality tests in linear regression. Econometrics Journal, 1, [] Yap B., Sim C. (010), Comparison of Various Type of Normality Tests, Journal of Statistical Computation and Simulation, 81(1), [3] Yazici B., Yolacan S. (007), A Comparison of Various Tests of Normality, Journal of Statistical Computation and Simulation, 77(), [4] D Agostino R. B., Stephens M. A. (1986), Goodness-of-fit Techniques, CRC Press, New York. [5] Razali N. M., Wah Y. B. (011), Power Comparisons of Shapiro-Wilk, Kolmogorov-Smirov, Lilliefors and Anderson-Darling Tests, Journal of Statistical Modeling and Analytics, (1),

311 ABSTRACT POWER COMPARISONS OF NORMALITY TESTS IN SMALL SAMPLE SIZE Most of the parametric tests are based on the assumption that the underlying distribution is normal. To test this assumption, several goodness of fit tests has been suggested by researchers. In this study, some of these goodness of fit tests are considered. For these tests Type I Error and power of tests are obtained in small sample size by using Monte Carlo simulations. Results of simulation study is discussed. Key Words: Goodness of Fit Tests, Chi-Square, Cramer-von Mises, Kolmogorov-Smirnov, Anderson- Darling, Shapiro-Wilk, Shapiro-Francia, Lilliefors, Jarque-Bera, D Agostino-Pearson, Small Sample Size, Type I Error, Power of the Test, Monte Carlo Simulation 11 3

312 POSTERS 1 3

313 RISK MEASURES ON THE BURR XII- NEGATIVE BINOMIAL DISTRIBUTION Sibel ACIK KEMALOGLU * and Emel KIZILOK KARA Ankara University, Faculty of Sciences, Department of Statistics,Tandogan, Ankara,, Turkey acik@science.ankara.edu.tr Kirikkale University, Faculty of Arts and Sciences, Department of Actuarial Science, Yahsihan, Kirikkale, Turkey emel.kizilok@gmail.com 1. Introduction In this study, it is examined risk measures of the Burr XII-Negative binomial (BXIINB) distribution. This distribution is obtained by mixing the negative binomial distribution with the Burr XII distribution. The value at risk (VaR) and the conditional value at risk (CVaR) are two commonly used risk measures for actuarial risk management. The method of maximum likelihood is used for estimating the model parameters of BXIINB distribution. As an application, risk measures are calculated for real lifetime data, modelled with BXIINB distribution.. The BURR XII-Negative Binomial Distribution The negative binomial distribution is widely used as alternative to the poisson distribution. In literature, several authors have been studied mixing the negative binomial distribution with any continuous distributions. Percontini et. al. give a close form for compounding negative binomial with any continuous distribution. For any cumulative distribution function (cdf) G(x), and x e R, they defined the G-Negative Binomial (G-NB) family of distributions with probability density function (pdf) f (x) and cdf F(x) given by f(x) = sβ [(1 β) s 1] g(x){1 β[1 G(x)]} s 1 (1) F(x) = (1 β) s {1 β[1 G(x)]} s [(1 β) s 1] () respectively. Ramos et al. used the cumulative distribution of Burr XII distribution for G(x), and they called this new distribution as Burr XII negative binomial (BXIINB) distribution. The cdf and pdf of the BXII distribution are given by and G(x; c, k, a) = 1 [1 + ( x k c] a ) g(x; c, k, a) = cka c x c 1 [1 + ( x k 1 c] a ) (3) respectively, where k > 0 and c > 0 are shape parameter. The BXIINB distribution is obtained by inserting equations (3) into (1) and (). Then, the pdf and cdf of the distribution (for x > 0) are given as below, respectively f(x) = sβcka c [(1 β) s 1] xc 1 [1 + ( x c k 1 a ) ] {1 β [1 + ( x c k a ) ] } s 1

314 F(x) = (1 β) s {1 β [1 + ( x k s a )c ] } [(1 β) s. 1] Here a > 0 is a scale parameter and s > 0, c > 0, k > 0 and β (0, 1) are shape parameters. 3. Risk measures of BXIINB distribution VaR and CVaR measures for a risk X and a probability level p (0, 1) are respectively defined as VaR p (X) = F X 1 (p) (4) CVaR p (X) = E[X VaR p (X) X > VaR p (X)] = CTE p (X) VaR p (X) (5) where CTE (conditional tail expectation) is defined as CTE p (X) = E[X X > VaR p (X)]. If F X is continuous then it can be written CTE p (X) = 1 1 VaR 1 p p ξ(x) dξ. (Denuit et.al). VaR and CVaR measures are important for making decisions in risk analysis. These risk measures modelled with BXIINB distribution are obtained by using real lifetime data. REFERENCES [1] Denuit M., Dhaene J., Goovaerts M.J., Kaas R. (005), Actuarial Theory for Dependent Risks; Measures, Orders and Models, John Wiley and Sons. [] Kongrod S., Bodhisuwan W., Payakkapong P. (014), The negative binomial-erlang distribution with applications, Introduction Journal of Pure and Applied Mathematics, 9, 3, [3] Percontini, A., Cordeiro, G. M., & Bourguignon, M. (013). The G-Negative Binomial Family: General Properties and Applications. Advances and Applications in Statistics, 35, [4] Ramos, M. W. A., Percontini, A., Cordeiro, G. M., & da Silva, R. V. (015). The Burr XII Negative Binomial Distribution with Applications to Lifetime Data. International Journal of Statistics and Probability, 4, [5] Willmota G.E., Sheldon L. (011), Risk modelling with the mixed Erlang distribution, Appl. Stochastic Models Bus. Ind, 7, 16. Key words: Burr XII distiribution, the Burr XII- Negative Binomial distribution, Value at Risk, Conditional Value at Risk. 14 3

315 HALKA ARZLARDA DÜŞÜK FİYATLAMAYA LOJİSTİK REGRESYON ANALİZİ YAKLAŞIMI: BORSA İSTANBUL VE EURONEXT PARİS KARŞILAŞTIRILMASI Ceyda AFACAN* Görkem KAVÇAK** Evren ÖZTÜRK** *MSGSÜ, Fen Fakültesi, İstatistik Bölümü, 34380, İstanbul, TÜRKİYE, **Yıldırım Holding, Araştırma Bölümü, 34398, İstanbul, TÜRKİYE, 1. Giriş Şirketlerin daha hızlı ve etkin sermaye bulma veya arttırma konusunda başvurdukları en iyi yollardan biri hisse senedi arzıdır. İlk halka arzlarda, ilk gün getirisi performansı piyasanın geri kalanına göre kayda değer oranda daha yüksek olursa, düşük fiyatlama gerçekleşmiş sayılmaktadır. Bu çalışmada, Türkiye den Borsa İstanbul ve Fransa dan Euronext Paris, son yıllarda halka arzlarda gerçekleşen düşük fiyatlama açısından karşılaştırılmıştır. Her iki borsadaki halka arz kriterleri incelendiğinde; birçok açıdan benzerlikler ve farklılıklar vardır. Araştırmanın yokluk hipotezi iki borsa arasında düşük fiyatlama açısından fark olmadığı, alternatif hipotez ise fark olduğu şeklindedir.. Yöntem İki borsada gerçekleşen halka arzların düşük fiyatlama oranları Ki-kare homojenlik testi ile karşılaştırılmıştır. Ek olarak her iki borsada düşük fiyatlama varlığına etki eden risk faktörlerinin benzer olup olmadığı Adımsal Lojistik Regresyon Analizi ile incelenmiştir yılları arasında halka arz olmuş, Borsa İstanbul dan 8 ve Euronext Paris ten 73 şirketten, verilerine ulaşılabilen 87 si araştırma kapsamına alınmıştır. 3. Bulgular Euronext Paris (%54) ile Borsa İstanbul da (%57) tespit edilen düşük fiyatlama oranı arasındaki fark istatistiksel olarak anlamlı bulunmamıştır. (χ=0,186; p=0,667). Çizelge1. Düşük Fiyatlama Varlığına Etki Eden Risk Faktörleri için Adımsal Lojistik Regresyon Analizi Sonuçları 95% Güven Standart Borsa Bağımsız Değişkenler ß p OR Aralığı Hata Alt Üst Borsa İstanbul Euronext Paris Hasılat < ,04 0,48 0,031,83 1,10 7,31 Halka arz oranı <%8,6 1,1 0,48 0,00 3,07 1,19 7,91 Hasılat < ,83 0,67 0,006 6,5 1,67 3,5 Halka arz oranı <%3,0 1,89 0,67 0,005 6,60 1,77 4,58 Düşük fiyatlama varlığına etki eden risk faktörlerini araştırmak için yapılan Adımsal Lojistik Regresyon analizi sonucunda; Borsa İstanbul da hasılatı den düşük olan halka arzlarda düşük fiyatlama riski,83 kat yüksek bulunurken, Euronext Paris te hasılatı dan yüksek olan halka arzlarda 6,5 kat yüksek bulunmuştur. Borsa İstanbul da halka arz oranı %8,6 dan düşük olan halka arzlarda düşük fiyatlama riski 3,07 kat yüksek bulunurken, Euronext Paris te halka arz oranı %3 den düşük olan halka arzlarda düşük fiyatlama riski 6,6 kat yüksek bulunmuştur. Lojistik regresyon modelinin doğru tahmin oranı Borsa İstanbul için %63,4 ve Euronext Paris için %59,8 olarak bulunmuştur. (Çizelge1). Borsa İstanbul da halka arz hasılatı ve halka arz oranı, düşük fiyatlamanın Cox & Snell R-kare değerine göre 3%11, sini; Nagelkerke R-kare değerine göre %15,1 ini açıklayabilirken, Euronext Paris te ise Cox & 15 Snell R-kare değerine göre %14 ünü; Nagelkerke R- kare değerine göre %18,6 sını açıklayabilmektedir. 4. Sonuç

316 Her iki borsada düşük fiyatlama varlığı benzer oranda görülmüştür. Her iki borsada da halka arz hasılatı belirli bir miktarın (6-9 Milyon avro civarı) altında kaldığında ve halka arz oranı belirli bir değerin (%3-%8) altında kaldığında düşük fiyatlama riski artmaktadır. Bu çerçevede; halka arz sürecine girmek isteyen firmaların süreç öncesinde tayin edecekleri strateji içinde, Borsa İstanbul ve Euronext Paris borsalarında, belli bir halka arz hasılatı ve oranı üstünü hedeflemeleri halinde düşük fiyatlamadan daha az oranda etkilenebilecekleri ortaya çıkarılmıştır. KAYNAKLAR [1] Karlis, P. L. (000), IPO Underpricing, The Park Place Economist: Vol. 8, pp [] Chia, J. and Padgett, C. (005), Short-Run Underpricing And İts Characteristics İn Chinese İnitial Public Offering (IPO) Markets. Research in International Business and Finance 19, pp [3] Akgül, A. and Çevik, O. (005), İstatistiksel Analiz Teknikleri SPSS'te İşletme Yönetimi Uygulamaları. Ankara: Mustafa Kitabevi. [4] Büyüköztürk, Ş., Çokluk, Ö. and Şekercioğlu, G. (010), Sosyal Bilimler İçin Çok Değişkenli İstatistik. Ankara: Pegem Akademi. ABSTRACT LOGISTIC REGRESSION ANALYSIS OF LOW PRICING ON INITIAL PUBLIC OFFERINGS: COMPARISON OF BORSA ISTANBUL AND EURONEXT PARIS If the first day returns perform significantly better than the rest of the market, this is considered low pricing. This study compares cases of low pricing in initial public offerings made on 8 IPOs in Borsa Istanbul in Turkey and 87 IPOs in Euronext Paris in France, from 007 to 013. There was no significant different between Borsa İstanbul (%57) and Euronext Paris (%54) in terms of low pricing ratio of IPO s (p=0,667). According to Logistic Regression, low pricing risk in Borsa İstanbul and Euronext Paris was effected from either low IPO return or low IPO ratio (p<0,05). Key Words: IPO, Low Price, Logistic Regression 16 3

317 Regression Estimator for Unequal Probability Sampling Sevil Bacanlı Department of Statistics, Hacettepe University, Beytepe 06800, Ankara, Turkey. 1.Introduction The ratio and regression estimators are developed in order to estimate the population mean ( Y ) by using the known values of the population parameters of the auxiliary variable x. That is, when the population parameters of the auxiliary variable x such as population mean, coefficient of variation, kurtosis, skewness, correlation coefficient, etc. is, also, known, a number of ratio estimators and their modifications are suggested. In sampling literature, Kadılar and Çıngı(004) proposed KC ratio- type estimators by adapting the estimator s type of Ray and Singh(1981) to trational and the other ratio-type estimators in simple random sampling. These estimators which are suggested in a simple random sampling are extended into the stratified random sampling by Kadılar and Çıngı(003), Shabbir and Gupta(006), Koyuncu and Kadılar (009,010). Bacanlı and Kadılar(008) suggested ratio type estimators for unequal probability sampling by adapting Hovitz- Thompson(HT) estimator. Moreover, Bacanlı (015) proposed HT ratio- type estimators based on regression estimator. These HT ratio-type estimators are more efficient than the other HT ratio-type estimators. The regression estimator for the unequal probability sampling can be written as y y Bˆ ( X x ), (1) where reght HT HT HT y HT n n y i 1, r1 i r1 i estimator, based on the inclusion probabilities, is given by n n x i 1 r1 i r1 i US 3 where X 17 SD X Cx ; X SK X x; XUS X x Cx x =Coefficient of kurtosis; C x = Coefficient of variation. MSE for these proposed estimators can be given as x HT n x x y y x x n ˆ i HT i HT i HT B i1 i i1 i Horvitz-Thompson MSE of MSE( y reght and ˆB is a weighted regression shape. () 1 ) N N i1 y reght is given by N ji ij i i j j y y ' i ' j. (3) The regression type estimator given in (1) is adapted to the KC ratio-type estimators and proposed HT ratio- type estimators of the population mean will be as follows: yreght y ˆ P X R KC KC X 1 1 xht (4) yreght y ˆ P X KC SD RKC X SD x (5) HTSD y y X Rˆ X (6) reght PKC SK KC 3 3 SK xht SK y y X Rˆ X (7) reght PKC US 4 1 KC4 US1 xht US1 y y X Rˆ X (8) reght PKC US 5 KC5 US xht 1 ; XUS XCx x ;

318 MSE y 1 N N ij i j * * prl yik y jk (9) N i1 ji i j where y * ik yi RKC x,x k 1,,...,5. i k REFERENCES 1 Thompson, S.K. and Seber, G.A.F. (1996), Adaptive Sampling, John Wiley and Sons, NewYork. Shabbir J.,and Gupta S., (006), A new estimator of population mean in stratified sampling, Commun. Statist. Theory Math. 35, , Kadılar, C. and Cıngı, H. (004), Ratio estimators in simple random sampling, Applied mathematics and computation 151, Bacanlı, S., and Kadılar, C. (008), Ratio estimators with unequal probability designs, Pakistan J.statist 4(3), Bacanlı, S., (015), Horvitz- Thompson Ratio Type Esrimator in Estimating Population Mean, SOP transactions on statistics and analysis, (1), 1-7. ABSTRACT In this study, regression estimator that can be examined under unequal probability sampling and proposed HT ratio- type estimators based on regression estimator. Mean square error (MSE) all of the proposed HT estimators is obtained and compared with other HT ratio-type estimators which is presented by Bacanlı and Kadılar (008). The theoretical results are supported by a numerical illustration. Key Words: Auxiliary variable, Horvitz-Thompson estimators, Ratio-type estimators, Regression-type estimator. 18 3

319 ANOM TESTİNİN TIP ALANINDA MİNİTAB PROGRAMIYLA KULLANIMI * Ebru DUMLUPINAR 1, Ali PARLAR, Fatih ÜÇKARDEŞ 1 1 Adıyaman Üniversitesi, Tıp Fakültesi, Biyoistatistik ve Tıp Bilişimi Anabilimdalı, 0000, Adıyaman, Türkiye, edumlupinar@adiyaman.edu.tr Adıyaman Üniversitesi, Tıp Fakültesi, Farmakoloji ve Klinik Farmakoloji Anabilimdalı, 0000, Adıyaman, Türkiye, parlar.ali@hotmail.com 1.Giriş ANOM testi ilk olarak Laplace tarafından önerilmiş, daha sonraki yıllarda Halperin ve Ott tarafından geliştirilmiş ancak günümüzde hala çok bilinmeyen ve kullanılmayan bir istatistiksel yöntemdir [1]. Bağımsız grupları karşılaştırmak için günümüzde; Anova, Welch, Brown-Forsythe, ortogonal karşılaştırma gibi pek çok istatistiksel yöntem kullanılmakla birlikte, ortalamaların Analiz Yöntemi (ANOM), bu yöntemlere bir alternatif olarak genel ortalama ile grup ortalamalarını karşılaştıran grafiksel bir yöntemdir [3]. Aynı zamanda varyansların homojenlik testinde ve oranların karşılaştırılmasında da kullanılabilmektedir. Bu çalışmanın amacı; ANOM testinin tıp alanında örnek bir veri seti üzerinde çözümünün Minitab programıyla yapılışının gösterilmesi amaçlanmıştır..materyal-metot Bu çalışmaya ait veriler 10-1 aylık, yaklaşık gr ağırlığındaki 5 sıçanın barsaklarında iskemi reperfüzyon sonuçlarına ait 5 farklı etmenin (1:Sham, : İskemi/reperfüzyon, 3:Kanabinoid reseptör agonisti, 4:Kanabinoid reseptör antagonisti ve 5: Kanabinoid reseptör agonisti ve antagonisti) etkisi miyeloperoksidaz (MPO) 460 nm adsorbandında ölçülmüşür. ANOM testinin alt ve üst güven aralıkları aşağıdaki formüllerle hesaplanır. S p ( c 1) X hc, n c, S n S p ( n ni ) X hc, n c, nn i p S c S i n ( ni 1 Si n c ) p 1 n... n i (1) Burada, c: Çalışmadaki grup sayısı, n: Grupların gözlem sayıları toplamı; Genel populasyon ortalaması, 3. Sonuç ve Tartışma S p : Hata kareler ortalaması ve ( n i lerin en az bir tanesi farklı) () n n n... n 1 c, X : hc, n c : Kritik ANOM tablo değeri []. ANOM testinin Minitab ile yapılışına ait ekran görüntüleri Şekil 1. ve. de verilmiştir. Şekil 3 te ANOM grafiği görülmektedir. Bu grafiğe göre yorum; yeşil çizgi genel ortalamayı, kırmızı çizgiler ise alt ve üst güven aralıklarını göstermektedir. Grup ortalamalarından herhangi biri güven aralıklarının dışına çıkarsa o grup ya da grubun farklı olduğu şeklinde yorumlanır. Bu grafiğe göre, iki numaralı iskemi reperfüzyon, en etkili barsak iskemiye neden olduğu saptanmıştır. Diğerlerinde herhangi bir farklılık gözlenmemiştir. Mendes ve ark. [3] bildirdiğine göre ANOM testinin deneme başına hata oranı varyansların homojen olduğu ve grupların tekerrür sayılarının farklı olduğu durumlarda çok fazla etkilenmediği bildirilmiştir. 19 3

320 Şekil 1. ANOM testinin seçimi Şekil. Değişken atama Şekil 3. Anom sonuç grafiği Grup ortalamalarının birbirleri arasındaki farklılığı test etmekte Tukey, SNK ve Duncan gibi testleri kullanılırken, ANOM ise her bir grup ortalamasının genel ortalama ile farklılığını test etmekte kullanılır. ANOM, diğer yöntemlere göre grafiksel gösterimin pratikliği bakımından bir avantaja sahiptir. Bundan dolayı, istatistik bilgisi yeterli olmayan araştırıcılar bu yöntemi rahatlıkla kullanıp yorumlayabilirler. Bu çalışmanın tıp alanında farklı doz etkilerinin genel doz ortalaması ile karşılaştırılması önemi ve kapsamını uygulamada kullanılabilirliğini göstermek bakımından yararlı olabileceği ümit edilmektedir. KAYNAKLAR [1] Peter R. N., Peter S. W. and Koren A. F. C. (005), The Analysis of Means: A Graphical Method for Comparing Means, Rates and proportions, s [] Mendes M. (01), Uygulamalı Bilimler için İstatistik ve Araştırma Yöntemleri, s [3] Mendes M. and Yigit S. (013), Comparison of Anova-F and ANOM Tests with Regard to Type I Error Rate and Test Power, J. Statist. Comput. Simulation, 83:11, s ABSTRACT USING THE TEST OF ANOM WITH MINITAB IN MEDICINE Analysis of means method (ANOM) is aimed to hold up as an example in the field of medicine. For this purpose five different kind of bowel ischemia MPO values which are obtained from 5 rats are used. In consequence of this study it is more effective found out that ischaemia reperfusion. Key Words: ANOM test, Minitab, Bowel Ischemia. 0 3

Daha göster