ARAŞTIRMA MAKALESİ /RESEARCH ARTICLE

Benzer belgeler
AŞIRI YAYILIMLI VERİLER İÇİN GENELLEŞTİRİLMİŞ POİSSON KARMA MODELLERİN HAVA KİRLİLİĞİ ÜZERİNE BİR UYGULAMASI. e posta:

İÇİNDEKİLER ÖNSÖZ... Örneklem Genişliğinin Elde edilmesi... 1

QUANTILE REGRESYON * Quantile Regression

İçindekiler. Ön Söz... xiii

2. BASİT DOĞRUSAL REGRESYON 12

2018 YILI BİRİNCİ SEVİYE AKTÜERLİK SINAVLARI İSTATİSTİK VE OLASILIK 29 NİSAN 2018

ĐST 474 Bayesci Đstatistik

OLASILIK ve KURAMSAL DAĞILIMLAR

BÖLÜM 1: YAşAM ÇÖzÜMLEMEsİNE GİRİş... 1

İstatistikçiler Dergisi

2x2 ve rxc Boyutlu Tablolarla Hipotez Testleri

Ekonometri I VARSAYIMLARI


rasgele değişkeninin olasılık yoğunluk fonksiyonu,

İstatistik ve Olasılık

Farklı Sıcaklıkların Scymnus subvillosus un Bıraktığı Yumurta Sayıları Üzerine Etkilerinin Karışımlı Poisson Regresyon ile Analiz Edilmesi

İÇİNDEKİLER 1. GİRİŞ...

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

Rastgele Değişkenlerin Dağılımları. Mühendislikte İstatistik Yöntemler

ADMIT: Öğrencinin yüksek lisans programına kabul edilip edilmediğini göstermektedir. Eğer kabul edildi ise 1, edilmedi ise 0 değerini almaktadır.

altında ilerde ele alınacaktır.

6. Ders. Genelleştirilmiş Lineer Modeller (Generalized Linear Models, GLM)

Örnek. Aşağıdaki veri setlerindeki X ve Y veri çiftlerini kullanarak herbir durumda X=1,5 için Y nin hangi değerleri alacağını hesaplayınız.

YABANCI DİL EĞİTİMİ VEREN ÖZEL BİR EĞİTİM KURUMUNDAKİ ÖĞRENCİLERİN BEKLENTİLERİNİN ARAŞTIRILMASI. Sibel SELİM 1 Efe SARIBAY 2

TRAFĠK KAZA ĠSTATĠSTĠKLERĠNE ANALĠTĠK BĠR BAKIġ. Prof.Dr.Tülay Saraçbaşı Hacettepe Üniversitesi İstatistik Bölümü, Ankara. Özet

İÇİNDEKİLER ÖN SÖZ...

13. Olasılık Dağılımlar

ARAŞTIRMA MAKALESİ / RESEARCH ARTICLE

ÖZGEÇMİŞ. 1. Adı Soyadı : Kamile ŞANLI KULA İletişim Bilgileri : Ahi Evran Üniversitesi, Fen Edebiyat Fakültesi, Adres Matematik Bölümü, KIRŞEHİR

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

Dr.Öğr.Üyesi HALİL TANIL

DEÜ MÜHENDİSLİK FAKÜLTESİ MÜHENDİSLİK BİLİMLERİ DERGİSİ Cilt: 14 Sayı: 1 sh Ocak 2012

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

RİSK ANALİZİ VE AKTÜERYAL MODELLEME

Kullanılacak İstatistikleri Belirleme Ölçütleri. Değişkenin Ölçek Türü ya da Yapısı

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

Dependent Variable: Y Method: Least Squares Date: 03/23/11 Time: 16:51 Sample: Included observations: 20

İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications*

İstatistik 1. Bölüm 5 Olasılık Teorisi ve Kesikli Olasılık Dağılımları. Ankara Üniversitesi SBF, GYY

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5

ANKARA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ DÖNEM PROJESİ TAŞINMAZ DEĞERLEMEDE HEDONİK REGRESYON ÇÖZÜMLEMESİ. Duygu ÖZÇALIK

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

Matris Cebiriyle Çoklu Regresyon Modeli

AR. GÖR. SİBEL AL PROF. DR. HÜLYA ÇINGI HACETTPE ÜNİVERSİTESİ İSTATİSTİK BÖLÜMÜ

GAZİ ÜNİVERSİTESİ, İ.İ.B.F, İSTATİSTİK VE OLASILIĞA GİRİŞ I, UYGULAMA SORULARI. Prof. Dr. Nezir KÖSE

BİYOİSTATİSTİK Bazı Olasılık Dağılışları Dr. Öğr. Üyesi Aslı SUNER KARAKÜLAH

A. Regresyon Katsayılarında Yapısal Kırılma Testleri

EME 3117 SİSTEM SIMÜLASYONU. Girdi Analizi. Özet İstatistikler ve Histogram (Minitab)(1) Örnek: Eczane İçin Servis Süreleri

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Eşanlı Denklem Modelleri

Bu tip verilerde bir gruba ait olan gözlemler birbirlerine benzerlik gösterirken diğer

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER

SA Ğ KALIM ANAL Ġ ZLER Ġ

IE 303T Sistem Benzetimi

Regresyon. Regresyon korelasyon ile yakından ilişkilidir

Temel Biyoistatistik Kursu-I

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

ÖZGEÇMİŞ. : :

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

RİSK ANALİZİ VE AKTÜERYAL MODELLEME MAYIS 2015

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

Tesadüfi Değişken. w ( )

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ

İstatistik ve Olasılık

IE 303T Sistem Benzetimi DERS 4 : O L A S I L I K T E K R A R

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

CEVAPLAR. n = n 1 + n 2 + n 3 + n 4 + n 5 + n 6 + n 7 = = 11 dir.

3. TAHMİN En Küçük Kareler (EKK) Yöntemi 1

Normallik Varsayımı ve Ençok Olabilirlik Yöntemi

Ch. 5: SEKK (OLS) nin Asimptotik Özellikleri

SAYMA VERİ MODELLERİ İLE ÇOCUK SAYISI BELİRLEYİCİLERİ: TÜRKİYE DEKİ SEÇİLMİŞ İLLER İÇİN SOSYOEKONOMİK ANALİZLER (*) ÖZET

Meslek lisesi ve devlet lisesine giden N tane öğrenci olduğu ve bunların yıllık okul harcamalarına ait verilerin olduğu varsayılsın.

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Ders Bilgileri Ders Kodu Yarıyıl T+U Saat Kredi AKTS FEN BİLİMLERİNDE İSTATİSTİKSEL TEKNİK VE UYGULAMALAR

ANADOLU ÜNİVERSİTESİ BEKLENEN DEĞER. X beklenen değeri B[X] ile gösterilir. B[X] = İST 213 OLASILIK DERSİ BEKLENEN DEĞER VE MOMENTLER

SÜREKLİ RASSAL DEĞİŞKENLER

ELEKTRONİK MÜHENDİSLİĞİ NDE KİMYA EĞİTİMİNİN GEREKLİLİĞİNİN İKİ DEĞİŞKENLİ KORELASYON YÖNTEMİ İLE İSTATİSTİKSEL OLARAK İNCELENMESİ

EME 3105 SİSTEM SİMÜLASYONU. Girdi Analizi Prosedürü. Dağılıma Uyum Testleri. Dağılıma Uyumun Kontrol Edilmesi. Girdi Analizi-II Ders 9

İSTATİSTİK MHN3120 Malzeme Mühendisliği

Appendix B: Olasılık ve Dağılım Teorisi

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

2018 İKİNCİ SEVİYE AKTÜERLİK SINAVLARI RİSK ANALİZİ VE AKTÜERYAL MODELLEME 12 MAYIS 2018

EME 3117 SİSTEM SİMÜLASYONU. Üçgensel Dağılım. Sürekli Düzgün Dağılım. Sürekli Rassal Değişkenlerin Modellemesinde Kullanılan Dağılımlar

DOKUZ EYLÜL ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ DEKANLIĞI DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: END 2303

TABLO I: Bağımlı değişken; Tüketim,- bağımsız değişkenler; gelir ve fiyat olmak üzere değişkenlere ait veriler verilmiştir.

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

Sağlık Sigortasında Toplam Hasar Tutarının Kestirimi için Tek-kısım ve İki-kısım Modellerin Karşılaştırılması

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

BİYOİSTATİSTİK DERSLERİ AMAÇ VE HEDEFLERİ

DENİZ HARP OKULU TEMEL BİLİMLER BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

İstatistik ve Olasılık

EME 3117 SISTEM SIMÜLASYONU. Üçgensel Dağılım. Sürekli Düzgün Dağılım. Sürekli Rassal Değişkenlerin Modellemesinde Kullanılan Dağılımlar

SIRA İSTATİSTİKLERİ VE UYGULAMA ALANLARINDAN BİR ÖRNEĞİN DEĞERLENDİRMESİ

Oluşturulan evren listesinden örnekleme birimlerinin seçkisiz olarak çekilmesidir

EME Sistem Simülasyonu. Giriş. Olasılık Dağılımı. Rassal Degiskenler

Ankara Üniversitesi, SBF İstatistik 2 Ders Notları Prof. Dr. Onur Özsoy 1

ALKÜ EKONOMİ ve FİNANS BÖLÜMÜ ISL 207 İSTATİSTİK I ALIŞTIRMALAR

Ch. 12: Zaman Serisi Regresyonlarında Ardışık Bağıntı (Serial Correlation) ve Değişen Varyans

Transkript:

ANADOLU ÜNİVERSİTESİ BİLİM VE TEKNOLOJİ DERGİSİ ANADOLU UNIVERSITY JOURNAL OF SCIENCE AND TECHNOLOGY Cilt/Vol.:10-Sayı/No: 2 : 467-475 (2009) ARAŞTIRMA MAKALESİ /RESEARCH ARTICLE SIFIR DEĞER AĞIRLIKLI SAYIMA DAYALI VERİLERİN ANALİZİNDE HURDLE MODELİN KULLANILMASI Abdullah YEŞİLOVA 1 ÖZ Sayıma dayalı olarak elde edilen veriler, çok fazla sayıda sıfır değerine sahip olabilirler. Fazla sayıda sıfır değerine sahip bağımlı değişkenin modellenmesinde kullanılan yöntemlerden biri de hurdle modelidir. Hurdle model iki kısımdan oluşmaktadır. Kısımlardan birincisi, sıfır sayımlara (0) karşı pozitif sayımları(1) gösteren binary cevapları; ikincisi ise yalnız pozitif sayımları içermektedir. Binary cevaplar, binary modeli kullanırken, pozitif sayımlar sıfır değer-sınırlandırılmış sayıma dayalı modelini kullanmaktadır. Binary kısım logit, probit veya complememtary loglog kullanılarak modellenmektedir. Pozitif sayımlara dayalı kısım ise Poisson, geometrik ve negative binomial dağılım kullanılarak modellenmektedir. Çalışmada, pozitif sayımlar için Poisson ve negatif binomiyal hurdle modeller kullanılmıştır. Bağımlı değişken olarak alınan akar sayılarının %77.2 si sıfır değerlidir. Elde edilen Akaiki bilgi ölçütü negatif binomiyal hurdle modelin, Poisson hurdle model modelden daha iyi sonuç verdiğini göstermiştir. Anahtar Kelimeler : Sıfır değer ağırlıklı veriler, Negatif binomiyal hurdle model, Poisson hurdle model. USING HURDLE MODEL IN ANALYSIS OF ZERO- INFLATED COUNT DATA ABSTRACT Data obtained based on count could have too many zero values. In this cases, the hurdle model is one of the methods used in the modeling the dependent variable having too many zero data. Hurdle model constitutes of two parts. First part includes binary response demonstrating positive counts (1) in opposition to zero counts (0). A second part includes only positive count. While binary responds use binary model, positive counts use zero-truncated count model. Binary part is modeled using logit, probit, or complementary loglog. The part based on positive counts is modeled using Poisson, geometric, and negative binomial distributions. In the present study, Poisson and negative binomial hurdle models for positive counts. The 77.2 % of acar that considered as dependent variable had zero values. The obtained Akaiki Information criteria showed that negative binomial hurdle model was better than Poisson hurdle model. Keywords: Zero-inflated data, Negative binomial hurdle mode, Poisson hurdle mode. 1, Yüzüncü Yıl Üniversitesi, Ziraat Fakültesi, Zootekni Bölümü, Biyometri- Genetik ABD, 65080 VAN. yesilova@yyu.edu.tr Geliş: 23 Haziran 2008; Kabul: 9 Şubat 2009

468 1. GİRİŞ Poisson Regresyon (PR) analizi, bağımsız değişkenler ile sayıma dayalı olarak elde edilen bağımlı değişken arasındaki ilişkiyi açıklamaktadır. PR de bağımsız değişkenlerin doğrusal yapısını, bağımlı değişkenin beklenen değerine bağlayan bağlantı fonksiyonu, logaritmik dönüşüm ile verilmektedir (Agresti, 1997; Cameron ve Trivedi, 1998; Stokes vd, 2000). Uygulamada, Poisson dağılımı gösteren sayıma dayalı olarak elde edilen gözlemler, beklenenden daha fazla sayıda sıfır değerine sahip olabilir. Böyle durumlarda, fazla sayıda sıfır değerine sahip Poisson dağılımı gösteren bağımlı değişkenin ortalama ve varyansı arasında var olan eşitlik sağlanamamaktadır. Bilindiği gibi, Poisson dağılımında ortalama ile varyans birbirine eşittir. Varyansın ortalamadan büyük olması aşırı yayılım (overdispersion), küçük olması ise az yayılım (underdispersion) olarak tanımlanmaktadır (Cox, 1983; Breslow, 1990; Böhning, 1994; Cameron ve Trivedi, 1998; Stokes vd, 2000; SAS, 2007). Sıfır değerlerinin çok fazla sayıda olduğu veri kümelerine, PR yi uygulamak doğru olmayan parametre tahminlerinin elde edilmesine neden olacaktır (Yeşilova vd, 2007). Hurdle model sıfır değerlerinin çok olduğu veri kümelerinin analizinde kullanılan alternatif bir yöntemdir (Dalrymple vd, 2003). Hurdle model iki kısımdan oluşmaktadır. Kısımlardan birincisi, sıfır sayımlara (0) karşı pozitif sayımları(1) gösteren binary (ikili) cevapları, ikinci kısım ise yalnız pozitif sayımları (sıfırdan büyük değerler) gösteren süreçtir. Binary cevaplar binary model kullanılarak modellenmektedir. Pozitif sayımlar ise sıfır değer- sınırlandırılmış sayıma dayalı (zero-truncated count) model kullanılarak modellenmektedir (Long ve Freese, 2005; Martin vd, 2006; Hilbe, 2007). Başka bir ifadeyle, birinci aşama sıfır veya sıfır olmayan sonuçların meydana gelip gelmediğini belirleyen binomial olasılık modelidir. Pozitif sonuçları tanımlayan sınırlandırılmış sayıma dayalı veriler ise ikinci aşama olarak modellenmektedir (Dalrymple vd, 2003). Binary kısım logit, probit veya complememtary loglog kullanılarak modellenmektedir. Pozitif sayımlar kısmı ise Poisson, geometrik ve negative binomial kullanılarak modellenmektedir. Elde edilen veriler Poisson dağılımı kullanılarak modellendiğinde, Poisson hurdle model olarak adlandırılmaktadır. Benzer şekilde, Elde edilen veriler negatif binomiyal dağılım kullanılarak modellendiğinde, negatif binomiyal hurdle model olarak adlandırılmaktadır (Long ve Freese, 2005; Martin vd., 2006). Anadolu Üniversitesi Bilim ve Teknoloji Dergisi, 10 (2) 2. MATERYAL ve YÖNTEM 2.1 Materyal Çalışmanın materyalini, Van merkez ilçesinden seçilen bir bahçede, Mayıs-Ekim ayı sonuna kadar golden elma ağaçlarından, haftalık olarak alınan yaprak örnekleri üzerindeki, zararlı akar Panonychus ulmi Koch (Acaring: Tetranychidae) ile bu akarın avcısı olan Zetzellia mali (Ewing) (Acarina: Stigmaeidae) ye ait sayımlar oluşturmuştur. Yaprak örnekleri, toplam 10 ağaçtan ve ağaç başına 10 yaprak olarak toplanmıştır. Toplanan yapraklar laboratuvara getirilerek, stereobinoküler mikroskop altında incelenerek, yaprağın her iki yüzeyi üzerindeki akarlar sayılıp, kaydedilmiştir. Denemenin yürütüldüğü bahçe 02.07.2002 ve 27.07.2002 tarihlerinde iki defa Fluvalinate etkili bir tarımsal savaş ilacı ile ilaçlanmış ve bu ilaçlamanın akarlar üzerine etkisi araştırılmıştır. Bunun dışında, Van merkez ilçesinin aylık ortalama sıcaklık değerleri, Devlet Meteoroloji İstasyonundan alınmış ve akarların populasyonuna etkisi değerlendirilmiştir. 2.2 Yöntem Yöntem bölümü Poisson ve negatif binomiyal hurdle model olmak üzere, iki başlık altında incelenecektir. 2.2.1 Poisson Hurdle Model Sınırlandırılmış sayıma dayalı olarak elde edilen pozitif gözlem değerleri ( y i >0) Poisson dağılımı kullanılarak modellendiğinde, Poisson hurdle model olarak adlandırılmaktadır. y i, i=1,2,,n birbirinden bağımsız sayıma dayalı olarak elde edilen gözlem değerleri olsun. y i =0 ( ) olma olasılığı 1 p( x) ve y i ~sınırlandırılmış Poisson λ ( z) olma olasılığı p ( x ) olsun. Burada x ve z kovariet matrisleridir. Poisson hurdle model (Dalrymple vd, 2003), ( y = 0 ) = 1 ( ) P x p x P i ( y q x, z) i ( ) λ( ) ( ) ( ) exp λ( ) q!1 exp λ ( z) px z z = = ( ) q, q=1,2, (1)

Anadolu University Journal of Science and Technology, 10 (2) 469 p ( x ) ve ( z) λ sırasıyla logit ve log-doğrusal fonksiyonları kullanılarak modellenmektedirler. Yani, log ' ( λ ( z) ) = xi log it p ' ( ) = i i β z α (2) (3) biçiminde modellenmektedirler (Lambert, 1992). Eşitlik 2 ve eşitlik 3 te verilen β ve α sırasıyla bilinmeyen parametre vektörleridir. Bilinmeyen β, α parametrelerinin tahmin edilmesinde en çok olabilirlik (maximum likelihood) yöntemi kullanılmaktadır. Poisson hurdle için log-olabilirlik aşağıdaki gibi yazılabilir. ( ( iβ )) LL = xiβ log 1+ exp x y > 0 i= 1 i n = LL( β) + LL( α) ( ) ( yi ) ( ) ( ( )) + yiziα exp ziα log 1 exp exp ziα log! y > 0 i (4) Eşitlik 4 te verilen ve lojistik modeli esas alan LL( β ) olabilirlik, bilinen genelleştirilmiş doğrusal model (generalized linear model) kullanılarak uyumu yapılabilir. Bununla birlikte LL( α ) olabilirlik fonksiyonun maksimize edilmesiyle, α bilinmeyen parametre vektörünün en çok olabilirlik tahminleri elde edilmektedir. 2.2 Negative Binomiyal Hurdle Model Negatif binomiyal hurdle modelde, sayıma dayalı olarak elde edilen bağımlı değişkenin sıfır ya da sıfır değerli olmama sonuçlarını belirleyen binomial olasılık modeli ile pozitif sonuçları tanımlayan sınırlandırılmış sayıma dayalı modeli için verilen log-olabilirlik fonksiyonu aşağıdaki gibi yazılabilir (Long ve Freese, 2005; Hilbe, 2007), { } ( ( )) ( ) ( ) LL= ln f 0 + ln 1 f 0 + ln P j (5) Eşitlikte 5 te, f ( 0) modelin binary kısmının olasılığını, p ( j ) pozitif sayımın olasılığını göstermektedir. Logit model kullanıldığında durumda, sıfır değerli gözlemin olasılığı, f ( 0) = P( y = 0; x) = 1 ( 1+ exp( xb1) ) ve 1- f ( 0) ise (sıfırdan büyük gözlemler), ( xb ) ( + ( xb )) exp 1 1 exp 1 biçiminde yazılabilir. Böylece negatif binomiyal hurdle modelin her iki kısmı için log-olabilirlik fonksiyonu aşağıdaki gibi yazılabilir. cond { y== 0,ln ( 1 1 exp ( xb1 )), ( ( xb ) ( + ( xb ))) + y ( xb) ( + ( xb) ) ( ) ln exp 1 1 exp 1 * ln exp 1 exp ( ( xb) ) α ( y α) ( y ) ( α) ln 1+ exp + ln Γ + 1 ln Γ + 1 ln Γ 1 ( ( ( xb) )( α) )} ln 1 1+ exp 1 (6) Eşitlik 6 da verilen log-olabilirlik fonksiyonun maksimize edilmesiyle, bilinmeyen parametrelerin en çok olabilirlik tahminleri elde edilmektedir. 3. BULGULAR Çalışmada, gerekli analizler R istatistik yazılım programları kullanılarak yapılmıştır. Tüm dönemlere ait toplam akar sayısı bağımlı değişken; ilaçlama, sıcaklık, dönemler (haftalar) ve Zetzellia mali (avcı akar) bağımsız değişkenler olarak modele dahil edilmiştir. Bağımlı değişken olan toplam akar sayına ait 1292 gözlemin 998 i (%77.2) sıfır değerlidir. Tüm dönemlere ait toplam akar sayısına ilişkin grafik Şekil 1 de verilmiştir. Sıfır değerlerinin çok fazla sayıda olmasından dolayı, verilerin dağılımı sağa çarpık olmuştur. 3.1 Negative Binomiyal Hurdle Model Sonuçları Sıfırdan büyük değere sahip akarlar (bağımlı değişken) için log-link fonksiyonu kullanılarak sınırlandırılmış negatif binomial modelden elde edilen en çok olabilirlik parametre tahminleri ver standart hataları Tablo 1 de verilmiştir.

470 Anadolu Üniversitesi Bilim ve Teknoloji Dergisi, 10 (2) Şekil 1. Tüm dönemlere ait toplam akar sayısının dağılımı Tablo 1. Sınırlandırılmış negatif binomiyal model için parametre tahmin değerleri ve standart hataları Parametreler Tahmin (standart hata) Intercept 9.63876(0.68063)** Zetzellia mali (avcı) -0.04025(0.02392)** İlaçlama 1.07869(0.22733)** Sıcaklık -0.19721(0.03813)** Dönemler -0.45766(0.02420)** **p<0.01 Tablo 1 e bakıldığında, avcı akarın (Zetzellia mali), ilaçlamanın, sıcaklığın ve dönemlerin, bağımlı değişken olan toplam akar sayısı üzerine olan etkileri istatistiksel olarak önemli bulunmuştur (p<0.01). Sıfır olan ve olmayan akarların sayısını gösteren binary cevaplara ilişkin hurdle model sonuçları Tablo 2 de verilmiştir. Parametre tahminleri, logit bağlantı fonksiyonu kullanılarak elde edilmiştir. Tablo 2 ye bakıldığında, bütün bağımsız değişkenlerin toplam akar sayısı üzerine olan etkileri önemli bulunmuştur (p<0.01). Sıcaklık, avcı ve ilaçlamanın binary cevaplar üzerine olan etkileri (sıfır değerli akarlar ve sıfır değerli olmayan akarlar) pozitif iken, dönemlerin etkisi negatif olmuştur. 3.2 Poisson Hurdle Model Sonuçları Sıfırdan büyük değere sahip akarlar (bağımlı değişken) için log-link fonksiyonu kullanılarak sınırlandırılmış Poisson modelden elde edilen en çok olabilirlik parametre tahminleri ver standart hataları Tablo 3 te verilmiştir. Tablo 3 te bakıldığında, avcı akarın (Zetzellia mali), ilaçlamanın, sıcaklığın ve dönemlerin, bağımlı değişken olan toplam akar sayısı üzerine olan etkileri istatistiksel olarak önemli bulunmuştur (p<0.01). Sıfır ve sıfır olmayan akar sayısının sayısını gösteren binary cevaplara ilişkin hurdle model sonuçları Tablo 4 de verilmiştir. En çok olabilirlik parametre tahminleri, logit bağlantı fonksiyonu kullanılarak elde edilmiştir. Tablo 4 e bakıldığında, bütün bağımsız değişkenlerin toplam akar sayısı üzerine olan etkileri önemli bulunmuştur (p<0.01).

Anadolu University Journal of Science and Technology, 10 (2) 471 Tablo 2. Negatif binom hurdle modelde binary cevaplar için parametre tahmin değerleri ve standart hataları Parametreler Tahmin (standart hata) Intercept -3.95243(0.43299)** Zetzellia mali (avcı) 0.01592(0.01827)** İlaçlama 0.29893(0.21660)** Sıcaklık 0.17024(0.02601)** Dönemler -0.09122(0.01689)** **p<0.01 Tablo 3. Sınırlandırılmış Poisson model için parametre tahmin değerleri ve standart hataları Parametreler Tahmin (standart hata) Intercept 8.29448(0.12568)** Zetzellia mali (avcı) -0.05785(0.01268)** İlaçlama 0.87778(0.04022)** Sıcaklık -0.12974(0.00958)** Dönemler -0.39710(0.00679)** **p<0.01 Tablo 4. Poisson hurdle modelde binary cevaplar için parametre tahmin değerleri ve standart hataları Parametreler Tahmin (standart hata) Intercept -3.95243(0.43299)** Zetzellia mali (avcı) 0.01592(0.01827)** İlaçlama 0.29893(0.21660)** Sıcaklık 0.17024(0.02601)** Dönemler -0.09122(0.01689)** **p<0.01 Negatif binomiyal ve Poisson hurdle modellerine ilişkin tüm dönemlere ait akar değerlerine ait hata grafikleri sırasıyla, Şekil 2 ve Şekil 3 de verilmiştir. İki regresyon modelinde de hata terimleri benzer dağılım göstermişlerdir. Negatif binomiyal ve Poisson hurdle modellerine ilişkin tüm dönemlere ait akar sayımların uyum değerlerinin grafikleri sırasıyla, Şekil 4 ve Şekil 5 de verilmiştir. İki regresyon modelinde de uyum değerleri benzer dağılım göstermişlerdir. Ayrıca gerçek değerlerde olduğu gibi, uyum değerlerinin de dağılımı sağa çarpık olmuştur (Şekil 3 ve Şekil 4). 4. SONUÇ Sayıma dayalı olarak elde edilen verilere, Poisson regresyonun uygulanabilirliğini gösteren sapma (deviance) ve Pearson Khi-kare (Pearson Chi-square) uyum istatistikleri büyük önem taşımaktadır (SAS, 2007). Uygulanan Poisson regresyon yönteminin doğruluğu bakımından, her iki uyum istatistiğinin 1 e eşit ya da yakın bir değer alması gerekmektedir (SAS, 2007).Uygulanan Poisson regresyon yön- teminin doğruluğu bakımından, her iki uyum istatistiğinin 1 e eşit ya da yakın bir değer alması gerekmektedir (SAS, 2007). Çalışmada, her iki uyum istatistiğine ait değerler oldukça büyük çıkmıştır (sapma= 235.532 ve Pearson Khikare=258.709).

472 Anadolu Üniversitesi Bilim ve Teknoloji Dergisi, 10 (2) Şekil 2. Negatif binomiyal hurdle model için akar sayılarına ait hatalar Şekil 3. Poisson hurdle model için akar sayılarına ait hata değerleri Şekil 4. Negatif binomiyal hurdle model için akar sayılarına ait uyum değerleri

Anadolu University Journal of Science and Technology, 10 (2) 473 Şekil 5. Poisson hurdle model için akar sayılarına ait uyum değerleri Bu sonuç, veri kümesinde aşırı yayılım olduğunu göstermektedir. Aşırı yayılımın nedenlerinden bazıları, yanlış bağlantı fonksiyonun kullanılması, gözlem değerlerin birbirlerinden bağımsız olmaması, modelde olması gereken önemli terimlerin modele dahil edilmemesi, gözlem değerleri arasındaki varyasyonun büyük olması ve örnek büyüklüğünün yetersiz olması şeklinde verilebilir (Cox, 1983; Breslow, 1990; Böhning, 1998; Cameron ve Trivedi, 1998). Sayıma dayalı olarak elde edilen bağımlı değişkende sıfır değerli gözlemlerin çok fazla sayıda olmadığı durumlarda, PR ve negatif binomiyal (NB) regresyon modellerinin kullanılması daha uygun olmaktadır. Ancak böyle bir veri kümesinde aşırı yayılım söz konusu ise, NB regresyon modeli PR modeline tercih edilir (Lawles, 1987; Agresti, 1997; SAS, 2007; Yeşilova vd, 2007). Standart Poisson regresyonunda, aşırı yayılım parametre tahminleri üzerinde küçük bir etkiye sahiptir, ancak standart hataların yanlış tahmin edilmesine neden olmaktadır (Cox, 1983). Veri kümesinde sıfır değerlerinin çok fazla sayıda olması durumunda, hurdle model yaygın olarak kullanılan bir yöntemdir (Logn ve Freese, 2006; Martin vd, 2006; Hilbe, 2007). Hurdle model, sıfırdan büyük pozitif sayımlar için daha çok Poisson ve negatif binomiyal dağılımlarını esas almaktadır. Çalışmada hem Poisson hurdle hem de negatif binomiyal hurdle modellerine ilişkin parametre tahmin sonuçları verilmiştir. Tablo 1 ve tablo 2 de verilen negatif binomiyal hurdle Poisson hurdle modellerine ilişkin parametre tahminleri ve standart hataları birbirlerinden oldukça farklı bulunmuşlardır. Her iki Tabloda, bütün bağımsız değişkenlerin toplam akar sayısı üzerine olan etkileri önemli bulunmuştur (p<0.01). Sıfır olan ve olmayan akar sayılarını gösteren binary bağımlı cevaplar için elde edilen binomiyal hurdle model sonuçları Tablo 2 ve Tablo 4 te benzerlik göstermişlerdir. Sıcaklık, akarın gelişmesi ve çoğalması üzerine önemli etkilerden biridir (Kasap,2004). Tablo 1 ve Tablo 2 de sıcaklığın akar sayısı üzerine olan etkisi önemli bulunmuştur (p<0.01). Çalışmada ana materyal olan akarlar uygun sıcaklıklarda (18-32 C sıcaklık) oldukça yüksek sayılara ulaşabilirler. Ancak bu koşulların dışındaki oranlarda üremeleri yavaşlar hatta 35C üzerinde ve 15C altında üremeleri durur ve ölümler başlar. Sıfır değerleri akarların üremelerinin en düşük olduğu ve ölümlerin en yüksek olduğu dönemlerde ortaya çıkar. Çalışmada kullanılan 1292 gözlem değerin, 998 i (%77.2) sıfır değerlidir. Bu nedenlerden dolayı sıfır değerli verilerin faklı bir şekilde incelenmesi populasyonun gelişmesi açısından önemlidir. Çalışmada, incelenen bağımsız değişkenlerden biri olan dönemler, 2002 Mayıs-Ekim ayı sonuna kadar olan zamandaki haftaları göstermektedir. Dönemlerin (haftalar) etkisinin önemli çıkması (p<0.01), elde edilen akar sayılarının haftadan haftaya faklılık yarattığını göstermektedir. Poisson ve negatif binomiyal hurdle modellerine ilişkin Akaiki bilgi ölçütü (Akaiki information Criteria=AIC) değerleri sırasıyla 27082.29 ve 3816.39 olarak bulunmuştur. Bilindiği gibi en küçük AIC değerine sahip regresyon modeli, en iyi model olarak tanımlanmaktadır (Dalrymple vd, 2003). AIC bilgi ölçütü, AIC = 2logL + 2r (7)

474 biçiminde hesaplanmaktadır (Dalrymple vd, 2003; Yeşilova vd, 2007). Eşitlik 7 de, LogL hurdle modelde iterasyon bittikten sonra elde edilen log-olabilirlik değerini, r parametre sayısını ve n örnek büyüklüğünü göstermektedir. Çalışmada, negatif binomiyal hurdle modeline ilişkin AIC değeri, Poisson hurdle modelden elde edilen AIC değerinden daha küçük olduğundan dolayı, negatif binomiyal hurdle modelin daha uygun bir model olduğu saptanmıştır. Bununla birlikte sıfır değer ağırlıklı Poisson (ZIP) regresyonu ve sıfır değer ağırlıklı negatif binomiyal (ZINB) regresyon, sıfır değer ağırlıklı verilerin analizinde kullanılan alternatif diğer yöntemlerdir (Lawless, 1987; Hall, 2000; Lambert, 1992; Böhning, 1998; Hall, 2000; Ridout vd, 2001; Cheung, 2002; Jansakul, 2005; Long and Freese, 2006; Yeşilova vd, 2007). Çalışmada, PR, NB, ZIP, ZINB, Poisson hurdle ve negatif binomiyal hurdle için AIC uyum ölçütü elde edilmiştir. Elde edilen AIC uyum ölçütlerinden en küçük regresyon modelinin ZINB, daha sonra sırasıyla negatif binomiyal hurdle, NB, Poisson hurdle, ZIP ve PR biçiminde sıralanmıştır. Elde edilen sonuçlara göre, negatif binomiyal dağılım esaslı modellerin daha iyi sonuç verdiği görülmüştür. Çünkü negatif binomiyal model aşırı yayılımdan kaynaklanan etkiyi modele dahil ederek, parametre tahmini yapmaktadır, Lambert, 1992; Böhning, 1998; Hall, 2000; Yeşilova vd, 2007). TEŞEKKÜR Bu çalışmada veri kümesini kullanmama izin veren Çanakkale Onsekiz Mart Üniversitesi, Ziraat Fakültesi, Bitki Koruma Anabilim Dalı Öğretim Üyesi Doç. Dr. İsmail KASAP a teşekkür ederim. KAYNAKLAR Agresti, A. (1997). Categorical Data Analysis. New Jersey, Canada; John and Wiley & Sons, Incorporation. Böhning, D. (1994). A Note on a Test for Poisson Overdispersion. Biometrika 81, 418-419. Böhning, D. (1998). Zero- Inflated Poisson Models and C.A.MAN: A Tutorial Collection of Evidence. Biometrical Journal 40(7), ss.833-843. Breslow, N. (1990). Tests of Hypotheses in Overdispersed Poisson Regression and Other Quasi-Likelihood Models. Journal of American Statistical Association 85(410), 565-571. Anadolu Üniversitesi Bilim ve Teknoloji Dergisi, 10 (2) Cameron, A.C. ve Trivedi, P.K. (1998). Regression Analysis of Count Data. New York: Cambridge University Pres. Cheung, Y.B. (2002). Zero-Inflated Models for Regression Analysis of Count Data: A Study of Growth and Development. Statistics in Medicine 21, 1461-1469. Cox, R. (1983). Some Remarks on Overdispersion. Biometrika 70, 269-274. Dalrymple, M.L., Hudson, I.L. ve Ford, R.P.K. (2003). Finite Mixture, Zero-Inflated Poisson and Hurdle Models with Application to SIDS. Computational Statistics & Data Analysis 41, 491-504. Hall, D.A. (2000). Zero-Inflated Poisson and Negative Binomial Regression with Random Effects: A Case Study. Biometrics 56, 1030-1039. Hilbe, J.M. (2007). Negative Binomial Regression. Cambridge University Pres, Cambridge CB2, 8RU, UK. Kasap, İ. (2004). Effect of Different Apple Cultivars and of Temperatures on Biology and Life Table Parameters of TwoSpotted Spider Mite, Tetranychus Urticae Koch (Acarina: Tetranychidae). Phytoparasitica 32(1), 73-82. Lambert, D. (1992). Zero-Inflated Poisson Regression, with an Application to Defects in Mnaufacturin. Technometrics 34(1), 1-13. Lawles, J.F. (1987). Negative Binomial and Mixed Poisson Regression. The Canadian Journal of Statistcs 15(3), 209-225. Long, J.S. and Freese, J. (2006). Regression Models for Categorical Depentent Variable Using Stata. A Stata Pres Publication, StataCorp LD Collage Station, Texas, USA. Jansakul, N. (2005). Fitting a Zero-inflated Negative Binomial Model via R. In Proceedings 20th International Workshop on Statistical Modelling. Sidney, Australia, p. 277-284. Martin, S.W., Rose, C.E., Wannemuehler, K.A. ve Plikaytis, B.D. (2006). On the of Zeroinflated and Hurdle Models for Medelling Vaccine Adverse event Count Data. Journal of Biopharmaceutical Statistics 16, 463-481.

Anadolu University Journal of Science and Technology, 10 (2) 475 Ridout, M., Hinde, J. ve Demetrio, C.G.B. (2001). A Score Test for a Zero-Inflated Poisson Regression Model Against Zero- Inflated Negative Binomial Alteratves. Biometrics 57, 219-233. SAS. (2007). SAS/Stat. Software. Hangen and Enhanced, USA: SAS, Institute. Incorporation. Stokes, M.E., Davis, C.S. ve Koch, G.G. (2000). Categorical Data Analysis Using the SAS System. USA; John and Wiley & Sons, Incorporation. Yeşilova, A., Kaki, B. ve Kasap, İ. (2007). Sıfır değer ağırlıklı sayıma Dayalı Olarak Elde Edilen Bağımlı Değişkenin Modellenmesinde Kullanılan Regresyon Yöntemleri. İstatistik Araştırma Dergisi 5(1),1-8.Ağaoğlu, A. E. (1989). Türkiye de Banka İşletmelerinin Ekonomik Analizi ve Gelişme Eğilimleri. Yayımlanmamış Doktora Tezi, Ankara. Abdullah YEŞİLOVA, Van da 1971 yılında doğdu. 1990 yılında giridiği Ankara Üniversitesi Fen Fakültesi İstatistik Bölümü nden 1995 yılı içinde İstatistikçi olarak mezun oldu. 1996 yılında Yüzüncü Yıl Üniversitesi Ziraat Fakültesi Zootekni Ana Bilim Dalında yüksek lisansa başladı. Yüksek lisans öğrenimini 1998 yılında tamamlayarak aynı yıl doktora öğrenimine başladı. 2003 yılında doktora eğitimini tamamladı. Aynı yıl Biyometri Genetik Bölümü nde Yardımcı Doçent olarak göreve başladı.

Anadolu University Journal of Science and Technology, 9 (1) 5