ARAŞTIRMA MAKALESİ / RESEARCH ARTICLE



Benzer belgeler
Lojistik Regresyonda Meydana Gelen Aşırı Yayılımın İncelenmesi

İki veri setinin yapısının karşılaştırılması

YER ÖLÇÜLERİ. Yer ölçüleri, verilerin merkezini veya yığılma noktasını belirleyen istatistiklerdir.

BEKLENEN DEĞER VE VARYANS

Regresyon ve Korelasyon Analizi. Regresyon Analizi

Tahmin Edicilerin ve Test Đstatistiklerinin Simülasyon ile Karşılaştırılması

Zaman Skalasında Box-Cox Regresyon Yöntemi

ÖRNEKLEME YÖNTEMLERİ ve ÖRNEKLEM GENİŞLİĞİ

Gamma ve Weibull Dağılımları Arasında Kullback-Leibler Uzaklığına Dayalı Ayrım

Olabilirlik Oranı Yöntemine Dayalı, Yapısal Homojen Olmayan Varyans Testlerinin Piyasa Modeli İçin Karşılaştırılması

ÖLÇÜM, ÖLÇÜM HATALARI ve ANLAMLI RAKAMLAR

MERKEZİ EĞİLİM ÖLÇÜLERİ

Tanımlayıcı İstatistikler

Giriş. Değişkenlik Ölçüleri İSTATİSTİK I. Ders 5 Değişkenlik ve Asimetri Ölçüleri. Değişkenlik. X i ve Y i aşağıdaki gibi iki seri verilmiş olsun:

Değişkenler Arasındaki İlişkiler Regresyon ve Korelasyon. Dr. Musa KILIÇ

Tanımlayıcı İstatistikler (Descriptive Statistics) Dr. Musa KILIÇ

= k. Aritmetik Ortalama. Tanımlayıcı İstatistikler TANIMLAYICI İSTATİSTİKLER. Sınıflanmış Seriler İçin Aritmetik Ortalama

WEİBULL DAĞILIMININ ÖLÇEK VE BİÇİM PARAMETRELERİ İÇİN İSTATİSTİKSEL TAHMİN YÖNTEMLERİNİN KARŞILAŞTIRILMASI

ARAŞTIRMA MAKALESİ /RESEARCH ARTICLE

denklemini sağlayan tüm x kompleks sayılarını bulunuz. denklemini x = 64 = 2 i şeklinde yazabiliriz. Bu son kompleks sayıları için x = 2iy

REGRESYON ANALİZİNDE KULLANILAN EN KÜÇÜK KARELER VE EN KÜÇÜK MEDYAN KARELER YÖNTEMLERİNİN KARŞILAŞTIRILMASI

Bir KANUN ve Bir TEOREM. Büyük Sayılar Kanunu

ETKİN SINIR VE BETA KATSAYI KISITLI PORTFÖY SEÇİM MODELİ ÜZERİNE BİR UYGULAMA

Sayısal Türev Sayısal İntegrasyon İnterpolasyon Ekstrapolasyon. Bölüm Üç

Quality Planning and Control

Polinom İnterpolasyonu

= İÇİNDEKİLER. E(X) = k Pascal (Negatif Binom) Dağılımı Hipergeometrik Dağılım N y=

TÜRKİYE ŞEKERPANCARI ÜRETİMİNDE FAKTÖR TALEP ANALİZİ ( ) (TRANSLOG MALİYET FONKSİYONU UYGULAMASI) Yaşar AKÇAY 1 Kemal ESENGÜN 2

Parametrik Olmayan İstatistik Çözümlü Sorular - 2

EMEKLİLİK YATIRIM FONLARI DEĞERLENDİRMESİ AÇIKLAMA NOTLARI VE VARSAYIMLAR

ĐÇI DEKILER 1. TEMEL ĐSTATĐSTĐK KAVRAMLAR VE OTASYO LAR 1

Tanımlayıcı İstatistikler

TALEP TAHMİNLERİ. Y.Doç.Dr. Alpagut YAVUZ

POISSON REGRESYON ANALİZİ

4/16/2013. Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

Sıfır Ağırlıklı Sayma ile Elde Edilen Veriler İçin Çok Seviyeli ZIP Regresyon * Multilevel ZIP Regression for Zero-Inflated Count Data

PORTFÖY OPTİMİZASYONUNDA ORTALAMA MUTLAK SAPMA MODELİ VE MARKOWITZ MODELİNİN KULLANIMI VE İMKB VERİLERİNE UYGULANMASI

İSTATİSTİKSEL TAHMİNLEME VE

YÖNEYLEM ARAŞTIRMASI III. Dinamik Programlama. Örnek 3: Tıbbi Müdahale Ekiplerinin Ülkelere Dağıtımı

BİR KARMAŞIK SİSTEMİN GÜVENİLİRLİK BLOK DİYAGRAMI İÇİN OLASILIK YOĞUNLUK FONKSİYONUNUN OLUŞTURULMASI VE İSTATİSTİKSEL GÜVENİLİRLİK HESAPLAMALARI*

SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

Doç. Dr. Mehmet AKSARAYLI

Operasyonel Risk İleri Ölçüm Modelleri

Tanımlayıcı İstatistikler

TABAKALI ŞANS ÖRNEKLEME

DEÜ MÜHENDİSLİK FAKÜLTESİ FEN ve MÜHENDİSLİK DERGİSİ Cilt: 9 Sayı: 1 s. 1-7 Ocak 2007 HİDROLİK PROBLEMLERİNİN ÇÖZÜMÜNDE TAŞIMA MATRİSİ YÖNTEMİ

DOGRUSAL REGRESYONDA SAGLAM TAHMiN EDiciLER VE BiR UYGULAMA Meral Candan ÇETiN1, Aynur ORSOY1

Çok Aşamalı Sıralı Küme Örneklemesi Tasarımlarının Etkinlikleri Üzerine Bir Çalışma

TOBB Ekonomi ve Teknoloji Üniversitesi İKT351 Ekonometri I, Ara Sınavı

Servis Yönlendirmeli Sistemlerde Güven Yayılımı

1. GAZLARIN DAVRANI I

Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi Pamukkale University Journal of Engineering Sciences

Đst201 Đstatistik Teorisi I

DEÜ MÜHENDİSLİK FAKÜLTESİ FEN BİLİMLERİ DERGİSİ

TEZ ONAYI Nur ÇELİK tarafıda hazırlaa ANOVA Modellerde Çarpık Dağılımlar Kullaılarak Dayaıklı İstatstksel Souç Çıkarımı ve Uygulamaları adlı tez çalış

İstatistik ve Olasılık

T.C. SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

ÖRNEKLEME TEORİSİ VE TAHMİN TEORİSİ

İşlenmemiş veri: Sayılabilen yada ölçülebilen niceliklerin gözlemler sonucu elde edildiği hali ile derlendiği bilgiler.

Genelleştirilmiş Ortalama Fonksiyonu ve Bazı Önemli Eşitsizliklerin Öğretimi Üzerine

RAYLEIGH DAĞILIMININ ARDIŞIK OLASILIK ORAN TESTİ SEQUENTIAL PROBABILITY RATIO TEST OF RAYLEIGH DISTRIBUTION

Kuruluş Yeri Seçiminde Bulanık TOPSIS Yöntemi ve Bankacılık Sektöründe Bir Uygulama

Mühendislikte Olasılık, İstatistik, Risk ve Güvenilirlik Altay Gündüz. Mühendisler için İstatistik Prof. Dr. Mehmetçik Bayazıt, Prof. Dr.

YILLIK ÜCRETLİ İZİN YÖNETMELİĞİ ( tarihli ve sayılı Resmi Gazete'de yayımlanmıştır.) BİRİNCİ BÖLÜM Amaç, Kapsam ve Dayanak

HĐPERSTATĐK SĐSTEMLER

UYUM ĐYĐLĐĞĐ TESTĐ. 2 -n olup. nin dağılımı χ dir ve sd = (k-1-p) dir. Burada k = sınıf sayısı, p = tahmin edilen parametre sayısıdır.

α kararlı dağılım, VaR, Koşullu VaR,, Finansal α KARARLI DAĞILIMLARLA FİNANSAL RİSK

Yrd. Doç. Dr. İhsa KARABULUT u daışmalığıda, Begül ARKANT tarafıda hazırlaa bu çalışma 3/07/008 tarhde aşağıdak jür tarafıda oy brlğ le Akara Üverstes

Tanımlayıcı İstatistikler

6. Uygulama. dx < olduğunda ( )

Bağıl Değerlendirme Sisteminin Simülasyon Yöntemi ile Test Edilmesi: Kilis 7 Aralık Üniversitesi Örneği

Tarihli Mühendislik ekonomisi final sınavı. Sınav süresince görevlilere soru sormayın. Başarılar dilerim.

5.1 Olasılık Tarihi Temel Olasılık Kavramları

ÜRETİM PLANLAMASINDA HEDEF PROGRAMLAMA VE BULANIK HEDEF PROGRAMLAMA YÖNTEMLERİNİN KARŞILAŞTIRILMASI

Rasgele sayıda bağımlı aktüeryal risklerin beklenen değeri için alt ve üst sınırlar

Orkun COŞKUNTUNCEL a Mersin Üniversitesi

CHAID Algoritması ile Balık Eti Tüketimini Etkileyen Faktörlerin İncelenmesi

AES S Kutusuna Benzer S Kutuları Üreten Simulatör

Hasar sıklıkları için sıfır yığılmalı kesikli modeller

İSTATİSTİK 2. Tahmin Teorisi 07/03/2012 AYŞE S. ÇAĞLI.

Biyoistatistik (Ders 9: Korelasyon ve Regresyon Analizi)

Tahmin Edici Elde Etme Yöntemleri

DEĞİŞİM ÖLÇÜLERİ 4. TAŞINMAZ GELİŞTİRME TEZSİZ YÜKSEK LİSANS PROGRAMI. Ünite: 4 DEĞİŞİM ÖLÇÜLERİ. Doç. Dr. Yüksel TERZİ İÇİNDEKİLER İÇİNDEKİLER

İstatistik ve Olasılık

T.C. SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ AZALAN BOZULMA ORANINA SAHİP ÜÇ PARAMETRELİ YENİ BİR YAŞAM ZAMAN DAĞILIMI

X = 11433, Y = 45237,

ISF404 SERMAYE PİYASALARI VE MENKUL KIYMETYÖNETİMİ

Yüksek Mertebeden Sistemler İçin Ayrıştırma Temelli Bir Kontrol Yöntemi

ÇOKLU REGRESYON MODELİ, ANOVA TABLOSU, MATRİSLERLE REGRESYON ÇÖZÜMLEMESİ,REGRES-YON KATSAYILARININ YORUMU

NİÇİN ÖRNEKLEME YAPILIR?

ˆp x p p(1 p)/n. Ancak anakütle oranı p bilinmediğinden bu ilişki doğrudan kullanılamaz.

ALTERNATİF SİSTEMLERİN KARŞILAŞTIRILMASI

ALTERNATİF SİSTEMLERİN KARŞILAŞTIRILMASI

Açık Artırma Teorisi Üzerine Bir Çalışma

RANKI 2 OLAN SERBEST LIE CEBİRLERİNİN OTOMORFİZM GRUPLARININ SUNUMLARI 1 Reports Of Free Groups Otomorfizm Rank 2 Lie Algebras

T.C. SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

İleri Teknoloji Bilimleri Dergisi Journal of Advanced Technology Sciences ISSN:

EKONOMETRİYE GİRİŞ II ÖDEV 4 ÇÖZÜM

Korelasyon ve Regresyon

Transkript:

ANADOLU ÜNİVERSİTESİ BİLİM VE TEKNOLOJİ DERGİSİ A Uygulamalı Blmler ve Mühedslk ANADOLU UNIVERSITY JOURNAL OF SCIENCE AND TECHNOLOGY A Appled Sceces ad Egeerg Clt/Vol.: 3-Sayı/No: : 5-63 (202 ARAŞTIRMA MAKALESİ / RESEARCH ARTICLE E-POSTA TRAFİĞİNİN SIFIR DEĞER AĞIRLIKLI REGRESYON YÖNTEMLERİ KULLANILARAK İNCELENMESİ Yılmaz KAYA, Abdullah YEŞİLOVA 2 ÖZ Sayıma dayalı olarak elde edle verler bekleede fazla sıfır değere sahp olablrler. Bu tp verler aalzde sıfır değerler dkkate ala regresyo yötemler kullaılması daha uygu olmaktadır. Bekleede fazla sayıda sıfır değere sahp bağımlı değşke modellemesde sıfır değer ağırlıklı Posso (ZIP, sıfır değer ağırlıklı egatf bomal (ZINB, Posso Hurdle (PH veya egatf bomal Hurdle (NBH regresyo yötemler kullaılması daha uygu yaklaşımlardır. Bu çalışmada, Yüzücü Yıl Üverstes (YYÜ e-posta suucusuda persoel 2009 bahar eğtm öğretm döemde yaptıkları e-posta trafğ celemştr. Ver kümesde bekleede fazla sayıda sıfır (%78,9 değerler bulumasıda dolayı ver kümese ZIP, ZINB, PH ve NBH regresyo yötemler uygulamıştır. Göderle e-posta sayılarıda hem sıfır yayılımı hem de aşırı yayılım olduğuda dolayı aşırı yayılımı ve sıfır yayılımıı dkkate ala ZINB ve NBH regresyolarıı doğru souçlar gösterdkler saptamıştır. Uyum ölçütler ve Voug statstklere göre ZINB ver kümes açıklaya e y model olduğu görülmüştür. Aahtar Kelmeler: E-posta trafğ, Sıfır değer ağırlıklı modeller, Sıfır yayılımı, Ver madeclğ. INVESTIGATION OF E-MAIL TRAFFIC BY USING ZERO-INFLATED REGRESSION MODELS ABSTRACT Based o cout data obtaed wth a value of zero may be greater tha atcpated. These types of data sets should be used to aalyze by regresso methods takg to accout zero values. Zero- Iflated Posso (ZIP, Zero-Iflated egatve bomal (ZINB, Posso Hurdle (PH, egatve bomal Hurdle (NBH are more commo approaches modelg more zero value possessg depedet varables tha expected. I the preset study, the e-mal traffc of Yüzücü Yıl Uversty 2009 sprg semester was vestgated. ZIP ad ZINB, PH ad NBH regresso methods were appled o the data set because more zeros coutg (78.9% were foud data set tha expected. ZINB ad NBH regresso cosdered zero dsperso ad overdsperso were foud to be more accurate results due to overdsperso ad zero dsperso sedg e-mal. ZINB s determed to be best model accordg to Vuog statstcs ad formato crtera. Keywords: E-mal traffc, Zero flated models, Zero flated data sets, Data mg., Srt Üverstes, Mühedslk Mmarlık Fakültes, Blgsayar Mühedslğ, Srt. E-mal: ylmazkaya977@gmal.com Tel: (506 488 49 90 2, Yüzücü Yıl Üverstes, Zraat Fakültes, Zootek, Va. Gelş: 4 Aralık 20; Düzeltme: 28 Hazra 202; Kabul: 5 Temmuz 202

52 Aadolu Üverstes Blm ve Tekoloj Dergs - A 3 ( Uygulamalı Blmler ve Mühedslk. GİRİŞ Ver madeclğ, verler çersdek deseler, lşkler, değşmler, düzeszlkler, kuralları ve statstksel olarak öeml ola yapıları keşfedlmesdr (Feerer ve ark., 2008. Ver madeclğ statstksel br yötemler sers olarak görmek mümkü olablr. Dolayısıyla ver madeclğ çalışması esas olarak br statstk uygulamasıdır. Regresyo, ver madeclğde değşkeler arasıda ede souç lşkler celeye statstksel yötemlerdr. Doğru souçları elde edlmes ç ver kümese uygu br regresyo yötem seçlmes gerekr. Ver kümese uygu br model seçlmesdek amaç verlerdek değşm e y şeklde açıklamak, varyasyo kayaklarıı doğru belrlemek ve sapmasız parametre tahmler elde etmektr (Yeşlova ve ark., 200. Sayıma dayalı olarak elde edlmş verler geellkle Posso dağılımı (PD gösterr ve Posso regresyo (PR le aalz edlrler. PR, bağımsız değşkeler le sayıma dayalı olarak elde edle bağımlı değşke arasıdak lşky açıklamaktadır. PR da bağımlı değşke varyasıı ortalamasıda büyük çıkması aşırı yayılım (overdsperso olarak fade edlmektedr (Wag ve ark., 2002; Yeşlova ve ark., 2007. Aşırı yayılım durumuda PR y uygulamak parametre tahmler ve stadart hatalarıı sapmalı olmasıa ede olmaktadır (Khoshgoftaar ve ark., 2005. Bu gb durumlarda aşırı yayılımı dkkate ala egatf bomal (NB regresyo model kullaılması daha uygu olablr (Jasakul, 2005; Joh ve ark., 2007; Jasakul ve Hde, 2009. Ver kümesde bekleede fazla sayıda sıfır değer olması sıfır değer yayılımı (zero flato olarak taımlamaktadır (Mart ve ark., 2006; Cu ve Yag, 2009. Gözlemler büyük br kısmıı sıfır olduğu ver kümelerde, sıfır değerler aalz dışı tutulması doğru olmaya souçları elde edlmese ede olmaktadır. Ver kümesde bekleede fazla sıfır değer buluması durumuda ver kümes sıfırları göz öüde buludura sıfır değer ağırlıklı modeller (zero-flated models le aalz edlmes daha uygu olmaktadır (Rdout ve ark., 200. Hurdle modeller sıfır değerler çok olduğu ver kümeler ç kullaılmaktadır. Hurdle modeller k aşamada oluşmaktadır. Brcs, sıfır sayımlara (0 karşı poztf sayımları ( göstere kl (bary cevaplar; kcs se yalız poztf sayımları meydaa geldğ süreçtr (Yeşlova ve ark., 200. Bary cevaplar logt bağlatı foksyou kullaılarak modellemektedr. Poztf sayımlar se sıfır değer sıırladırılmış (zero-value trucated sayma model ya log bağlatı foksyou kullaılarak modellemektedr (Mart ve ark., 2006. Sayma kısmıı Posso dağılımı göstermes durumuda Posso Hurdle (PH, egatf bom dağılımı göstermes durumuda se NB Hurdle (NBH model kullaılmaktadır (Gerdtham,997. Sıfır değer ağırlıklı Posso (Zero Iflated Posso=ZIP regresyou da, ver kümes bekleede fazla sayıda sıfır değer çermes durumuda bağımlı değşke modellemesde kullaılmaktadır. ZIP regresyou, bağımlı değşke k farklı ver grubuda oluştuğuu varsaymaktadır. Bularda brcs, sıfır değerler de çereblecek Posso dağılımlı ver grubu olurke, bua karşı kc grup se dama sıfır değerler çermektedr (Camero ve Trved, 998. ZIP regresyoda logt foksyou bağımlı değşke hag ver grubua dâhl olduğuu belrlemek ç kullaılır. Posso dağılımı göstere grup se PR le modeller. Posso dağılımı göstere kc grupta aşırı yayılım söz kousu olduğuda ZIP regresyou yere sıfır değer ağırlıklı egatf bomal (Zero Iflated Negatve Bomal=ZINB regresyou kullaılması daha uygu olmaktadır (Hall, 2000. ZIP modelde olduğu gb sıfır gözlemler le sıfır olmaya gözlemler ayrı olarak modeller. Acak ZIP regresyoda farklı olarak ZINB de sıfır olmaya gözlemler NB regresyou le modellemektedr. PR, NB, PH, NBH, ZIP ve ZINB regresyo modellerde parametre tahmler yaygı olarak EM algortmasıı esas ala e yüksek olablrlk (Maxmum Lkelhood=ML yötem kullaılarak elde edlmektedr (Kare ve Kelv, 2005. Uygu model seçmde Akak (AIC blg ölçütü kullaılablr. E küçük blg ölçütlere sahp model e y model olarak kabul edlmektedr. Bu çalışmada e-posta trafğ sıfır değer ağırlıklı regresyo yötemler le celemştr.

Aadolu Uversty Joural of Scece ad Techology - A 3 ( Appled Sceces ad Egeerg 53 Çalışmadak ver kümes Yüzücü Yıl Üverstes (YYÜ 568 akademk ve 595 dar toplam 63 persoelde elde edlmştr. Öcelkle YYÜ e-posta suucusuda persoele at e- posta adresler elde edlerek, her persoel 2008-2009 öğretm yılı bahar döemde (Mart, Nsa, Mayıs, Hazra göderdğ e-posta sayıları suucu kayıt(log dosyalarıda elde edlmştr. Daha sora 63 persoele aket uygulaarak kşler çalıştığı brm, uva, csyet, mede hal, yaş, kşler kulladıkları e-posta adres sayısı, e çok kulladıkları e-posta adres yyu.edu.tr uzatılı olup olmadığı, ms-cq gb herhag br sohbet programıı kullaıp kullamadıkları, yyu.edu.tr uzatılı e- posta adres le herhag br blmsel toplatıya katılıp katılmadıkları, ortalama br güde kaç saat teret kulladıkları, web steler olup olmadığı, evde teret bağlatılarıı olup olmadığı ve dzüstü blgsayarlarıı olup olmadığı sorularıa lşk cevaplar elde edlmştr. Ver kümesdek bekleede fazla sıfır değerler bulumasıda dolayı, ZIP, ZINB, PH, NBH regresyoları uygulamıştır. Modeller karşılaştırılması AIC blg ölçütü Voug statstklerde yararlaılmıştır. 2. MATERYAL VE YÖNTEM 2. Materyal YYÜ e-posta suucusuda ve aket yolu le elde edle değşkeler Çzelge de verlmştr. Toplam değşke bağımlı değşke, Persoel tp, Brm kodu, Uva kodu, Csyet, Mede hal, Yaş, E-posta adet, E-posta YYU, Sohbet programı, Blmsel toplatı, Ortalama teret, Webste, İteret bağlatısı ve Dzüstü blgsayar değşkeler se bağımsız değşkeler olarak değerledrlmştr. Bu çalışmada, aalzler ç R yazılımı kullaılmıştır. R statstk, matematk, ver madeclğ gb çok farklı amaçlar ç kullaılablecek br programlama dldr. Açık kayaklı br program olup GNU lsası altıda dağıtılmaktadır. 2.2 Yötem 2.2. Sıfır Yayılımı Ver kümeler bekleede daha fazla sıfır değer çermes durumuda, sıfır yayılımı (Zero flato=zi meydaa gelmektedr. Sıfır değer ağırlıklı dağılımlar gözlemler k gruba at olduğuu varsaymaktadır. Brc grup (g, gözlemler doğruda sıfır olarak gözledğ gruptur. İkc grup (g2 Posso veya NB dağılımı göstere gözlemler at olduğu gruptur. Z ye (dkatör değşke bağlı olarak gözlem g grubua at olma olasılığıı belrte dkatör değşkedr ve Z ~ Bereull( p bçmde yazılablr (T, 2008. p = Pr( g Z p = q= Pr( g 2 Z ( olduğu varsayılsı. Bu durumda sıfır değer ağırlıklı model geel formu, Pr( y x,z = p + ( p g( μ eğer y =0 (2 Pr( y x,z = ( p f ( μ eğer y >0 bçmde yazılablr. g( μ = Pr( y = 0 x bağımlı değşke sıfır olduğuu göstermektedr. f( μ Posso veya NB dağılımlarıda herhag br göstermektedr (Domque ve ark., 2005. 2.2.2 Posso Hurdle Regresyo Hurdle modelde verler elde edlş k farklı aşamada gerçekleşr. Brc aşama geçş aşaması (trasato stage olarak blr ve bomal dağılım gösterr. Bu aşamada bağımlı değşke sıfır veya sıfır olmaması belrler (Jasakul ve Hde, 2009. İkc aşama olay aşaması (evet stage olarak blr. Tüm sıfır değerler harç elde edle değerler bu aşamada modeller. Posso hurdle model, solda sıırladırılmış sayıma dayalı olarak elde edle poztf gözlem değerler (y >0 Posso dağılımı kullaılarak modelledğde, Posso hurdle model olarak adladırılmaktadır (Rose ve ark.,2006. y, =,2,., brbrde bağımsız sayıma dayalı olarak elde edle gözlem değerler olsu. y,=0 olma olasılığı -p(x ve y sıırladırılmış Posso λ (z olma olasılığı p(x olsu. Burada x ve z ortak değşke matrslerdr. Posso hurdle model,

5 Aadolu Üverstes Blm ve Tekoloj Dergs - A 3 ( Uygulamalı Blmler ve Mühedslk Çzelge. Ver kümes oluştura değşkeler. Kod Değşke Açıklama Persoel Tp Persoel Tp =Akademk Persoel, 0=İdar Persoel Brm Kodu Brm Kodu Her fakülte veya yüksekokula br kod verlmştr. Uva Kodu Uva Kod =Prof. Dr., 2=Doç. Dr., 3=Yrd.Doç. Dr., 4=Öğr. Grv., 5=Okutma, 6=Araş.Grv., 7=Uzma, 0=İdar Persoel Csyet Csyet 0=Baya, =Bay Mede Hal Mede hal 0=Bekar, =Evl Yas Yaş Persoel yaşı Toplam Göderle e-posta sayıları Her persoel göderdğ e-posta sayısı Eposta Adet Kş e-posta sayısı Her persoel e-posta adres sayısı Eposta YYU Sohbet Programı Blmsel Toplatı Ortalama İteret E çok kullaıla e-posta adres yyu.edu.tr uzatılı mı? MSN, ICQ gb sohbet programları kullaıyor musuuz? YYU uzatılı e-posta le br blmsel toplatıya katıldıız mı? Ortalama gülük teret kullaımı kaç saat? =Evet, 0=Hayır =Evet, 0=Hayır =Evet, 0=Hayır Ortalama gülük teret kullaımı (saat Web Ste Web stez var mı? =Evet, 0=Hayır Iteret Bağlatısı Evde teret bağlatıız var mı? =Evet, 0=Hayır Dzüstu Blgsayar Dzüstü blgsayarıız var mı? =Evet, 0=Hayır P( y = 0 x = p( x P( y = q x,z = p(xexp( λ(z λ(z q! exp( ( z ( λ q (3 bçmde yazılablr (M ve Agrest., 2005. Eştlk 3 de verle p(x ve λ (z sırasıyla logt ve log-doğrusal foksyoları le modellemektedrler. Ya, ( λ = log ( z x β (4

Aadolu Uversty Joural of Scece ad Techology - A 3 ( Appled Sceces ad Egeerg logt( p = z α (5 bçmde modellemektedrler (Rose ve ark.,2006. Eştlk 4 ve eştlk 5 te verle β ve α sırasıyla blmeye parametre vektörlerdr. β,α parametreler tahm edlmesde ML yötem kullaılmaktadır. Posso hurdle ç log olablrlk foksyou, y > 0 = y > 0 [ ( β L = x β log + exp( x + y z α exp( z α ( α log exp( exp( z log( y! = L( β + L( α (6 { = 0 ( + + ( + cod y,l( exp( xb, l exp( xb ( exp( xb y* l exp( xb ( exp( xb l( + exp( xb α + l Γ( y + α l Γ( y + l Γ( α l( ( + exp( xb ( α 2.2.4 Sıfır Değer Ağırlıklı Posso Regresyo 5 (8 Ver kümesde beklee fazla sayıda sıfır değerler buluması durumuda PR ve NB modeller yere, fazla sayıda sıfırlarda kayaklaa aşırı yayılımı dkkate ala ZIP model kullaılablr. Fazla sayıda sıfır değere sahp y açıklamak ç, ZIP regresyo model, } bçmde yazılmaktadır. L ( β ve L( α ayrı ayrı maksmze edlerek ML tahmler elde edlmektedr (M ve Agrest., 2005. 2.2.3 Negatf Bom Hurdle Regresyou Negatf bomal Hurdle da, sayıma dayalı olarak elde edle bağımlı değşke sıfır ya da sıfır değerl olmama souçlarıı belrleye bomyal olasılık model le poztf souçları taımlaya sıırladırılmış sayıma dayalı model ç verle log olablrlk foksyou aşağıdak gb yazılablr (Joh ve ark., 2007, (7 Eştlk 7 te verle f(0 model bary kısmıı olasılığıı göstermektedr. P(j poztf sayımı olasılığıı göstermektedr. Logt model kullaılması durumuda, sıfır sayımı olasılığı, ve { [ f ] } L = l( f(0 + l (0 + l P(j f ( 0 = P( y = 0;x = + exp( x β f (0 se, exp( x β ( + exp( x β π +( π exp( μ y = 0 Pr( y x = y ( π exp( μ μ y! y > 0 (9 bçmde yazılablr (Rose ve ark., 2006. Eştlk 9 da, π ekstra sıfırları olma olasılığıı göstermektedr. y = 0 ola gözlemler k grupta oluşmaktadır. Bu gruplarda br, gözlemler Posso sürec göstermedğ, dğer se gözlemler, 0 exp(-μ μ 0!=exp(-μ olmasıda dolayı μ ortalamalı Posso dağılımı gösterdğ gruptur. ZIP regresyoda her k grup ç farklı bağlatı foksyou kullaılır. Logt bağlatı foksyou, potasyel yyu.edu.tr uzatılı e-posta adres kullaa kullaıcıları göstermek ç kullaılırke, log bağlatı foksyou se yyu.edu.tr e-posta adres kullaa kullaıcıları göderdkler e- posta sayıları le bağımsız değşkeler arasıdak bağlatıyı sağlamaktadır. Ya, log( μ = X β μ = exp( X β (0 bçmde yazılablr. Böylece egatf bomyal Hurdle model her k kısmı ç log olablrlk foksyou aşağıdak gb yazılablr.

5 π log t( π = log = Gγ π exp( G γ π = + exp( G γ ( Aadolu Üverstes Blm ve Tekoloj Dergs - A 3 ( Uygulamalı Blmler ve Mühedslk (k G γ( k exp( X β ( + e, y = 0 z = 0, y =,2,... (4 bağlatı foksyoları kullaılarak parametre tahmler elde edlmektedr [7]. Eştlk 0 ve de X ve G ortak değşke matrsler β ve γ sırasıyla, (p+x ve (q+x boyutlu blmeye parametre vektörlerdr. ZIP regresyo model ç log olablrlk foksyou, Gγ ( Xβ ( ( β Xβ Gγ ( L( y, βγ, = log e + exp e + y X e 0 y= y > 0 log e log( y! = y > 0 + (2 bçmde yazılablr (Cu ve Yag, 2009 Eştlk 2 de G ve X, G ve X matrsler c sırasıı göstermektedr. Eştlk 2 da verle log olablrlk foksyoudak üssel termler maksmze edlmes oldukça karmaşıktır. Bu edele söz kousu log olablrlk foksyou maksmze edlmes ç farklı br yol zlemektedr. Buu ç sıfır ve br değerler ala ve tesadüf olduğu varsayıla z dkatör değşke modele dahl edlr. y değer sıfır olduğuda Z = ve y Posso durumda (sıfırda büyük değerler aldığıda z = 0 olduğu varsayılır. Bu durumda, tüm verler ç log olablrlk foksyou, ( γβ = ( ( γ + ( ( β L,,y,Z log f Z log f y Z, = = = Gγ ( ZGγ log ( e X β ( ( β ( = + + Z y X e Z log( y! = = ( γ ( β ( = L ; y,z + L,y,Z Z log( y! = (3 bçmde yazılablr. ML tahmler EM algortması kullaılarak elde edlr. EM algortması kullaılarak, E-aşaması: gözlemş verler verlmşke, z tesadüf dkatör değşke, bçmde yazılablr. Eştlk 4 de verle k EM algortmasıı terasyo sayısıı göstermektedr (Cu ve Yag, 2009. M-aşaması: Tüm verler ç eştlk 4 de verle log olablrlk foksyouu maksmze edlmesyle γ parametres, (k (k (k ( γ = y = 0 γ y = 0 ( + Gγ (k Gγ y = ( ( + 0 Z log e L ;y,z Z G Z log e (5 bçmde tahm edleblr. Yukarıda verle E ve M aşamaları yakısama ölçütü (0-6 elde edlceye kadar devam edlr (Yeşlova ve ark., 200; Rose ve ark., 2006. 2.2.5 Sıfır Değer Ağırlıklı Negatf Bomyal Regresyo Sıfır değer ağırlıklı egatf bomyal regresyo (Zero-flated egatve bomyal regresso=zinb Sıfır değerler çok fazla olduğu y bağımlı değşke modellemesde kullaıla alteratf regresyo yötemdr. ZINB regresyo model, α π + ( π ( + αμ, y = 0 y y Pr( y x = Γ ( y + α α μ ( π, y y > 0 + α y! Γ ( α ( + αμ (6 bçmde yazılablr (Jasakul ve Hde, 2009. Eştlk 6 da, π ve μ parametreler kovaretlere bağımlı ve ( α 0 yayılım parametresdr. ZINB modelde α ve π sıfıra eşt olması durumuda ZINB dağılımı posso dağılımıa döüşmektedr (Mwall ve ark., 2008. ZINB log olablrlk foksyou,

Aadolu Uversty Joural of Scece ad Techology - A 3 ( Appled Sceces ad Egeerg 5 L( μ,α,π ;y= I log ( π +αμ y =0 ( α +π + Γ y + (αμ I log π α y y >0 ( y!γ ( +αμ α y + α = I log ( π +αμ y =0 ( α +π + I y log π >0 ( α log ( +αμ y log + αμ + log Γ y + k log Γ log y α! bçmde yazılablr. Eştlk 7 de, I(. br dkatör foksyoudur. 2.2.6 Model Seçm (7 tesadüf Akak blg ölçütü (AIC model uyumu ç kullaıla uyum ölçütüdür (M ve Agrest, 2005. AIC blg ölçütü; AIC = 2log L + 2r (8 bçmde hesaplamaktadır. AIC blg ölçütü modeller karşılaştırılmasıda kullaılablrler. E küçük blg ölçütüe sahp e uygu model olarak kabul edlr (Hall, 2000. 2.2.7 Vuog İstatstğ Voug statstğ modeller brbrler le karşılaştırmak ç kullaılır (Vuog, 989. Vuog statstğ, V = m S m (9 bçmde hesaplaır (Vuog, 989. Burada Pˆ( Y X m =, P S geellkle Posso ˆ PS ( Y X veya NB dağılımlarda br ve P se sıfır değer ağırlıklı Posso veya hurdle dağılımlarıda br olmaktadır. m statstğ; m ortalamalı ve Sm stadart sapmalıdır. V asmtotk olarak ormal dağılımlıdır. Eğer V>.96 se sıfır değer ağırlıklı model uygu olmaktadır. V<=.96 se NB veya Posso regresyo yötemler daha uygu olmaktadır. 3. BULGULAR 3. Aşırı ve Sıfır Yayılımlarıı Belrlemes YYÜ e-posta suucusu üzerde herhag br e-posta adres olmaya persoel e-posta göderemeyeceğde dolayı göderle toplam e-posta değşke doğruda sıfır olacaktır. Bu sıfırlar sstematk sıfırlar (true zeros, samples zeros, systematc zeros olarak taımlamaktadır. Dğer tarafta YYÜ e-posta suucusu üzerde br e-posta hesabı olup da ele alıa süre çde e-posta gödermeyeler ç alıa toplam değşke yapısal veya şasa bağlı sıfırları (false zeros, structural zeros, radom zeros kabul edlmektedr. Sıfır kayaklarıı persoel tpe ve csyete göre dağılımı Çzelge 2. te verlmştr. YYÜ e-posta suucusu üzerde e-posta hesabı olmaya 22 akademk persoel ve 496 dar olmak üzere toplam 77 persoel bulumaktadır. Dolayısıyla bağımlı değşke 77/63=0.66 (%6.6 sı sstematk sıfırlarda, 202/63 =0.73 (%7.3 sı se şasa bağlı sıfırlarda kayaklamıştır. Böylece ver kümesdek sıfırları oraı 0.66+0.73=0.789 olarak elde edlmştr. Ver kümesdek sıfır yayılımıı olup olmadığı, ZI(Zero Iflato=Sıfır Yayılım=+log(p o /µ =+log(0.789/2.033=0.98 şeklde hesaplamıştır. ZI>0 olduğuda ver kümesde sıfır yayılımıı olduğuu göstermştr. p0 bağımlı değşkedek sıfır oraıı, μ se bağımlı değşke ortalamasıı göstermektedr. Göderle e-posta sayılarıı (bağımlı değşke ortalaması 2.033 ve varyası 5.247 olarak elde edlmştr. Varyası ortalamada çok büyük olması ver kümesde aşırı yayılım olduğuu göstermştr. Posso modele göre ortalaması 2.033 ola değşke ç beklee sıfır sayısı, E( Frk( Y = Frk( Y*exp( Y = e λ = 63*exp( 2.033 8 olarak elde beklelmektedr. Göderle e-posta sayıları dağılımı Şekl de verlmştr.

5 Aadolu Üverstes Blm ve Tekoloj Dergs - A 3 ( Uygulamalı Blmler ve Mühedslk Çzelge 2. Elde edle sstematk ve şasa bağlı sıfırları persoele tpe göre dağılımı. Sıfır Kayağı Akademk Persoel İdar Persoel Sstematk Şasa bağlı sıfırları Sstematk Şasa bağlı Csyet sıfırları sayısı sayısı sıfırları sayısı sıfırları sayısı Bay 64 2 42 55 Baya 57 9 84 7 Toplam 22 40 496 62 Şekl. Göderle e-posta sayıları dağılımı. Şekl celedğde ver kümesdek sıfır değerler yoğuluğuda dolayı bağımlı değşke dağılımı sola doğru çarpıklık göstermştr. ZIP, ZINB, PH ve NBH modellere at Akak blg ölçütler değerler Çzelge 3 te verlmştr. Hag model ver kümes e y açıkladığı AIC blg ölçütüe göre karar verleblr. Çzelge 3 te verle AIC değerlere göre ver kümes e y açıklaya model ZINB model olmuştur. E küçük AIC değere sahp model e uygu model olarak kabul edlmektedr. Kullaıla modeller ver kümes açıklama yüzdeler Çzelge 4 de verlmştr. Çzelge 3. AIC değerler ZIP ZINB PH NBH 8858.88 2944.902 8858.92 2945.325

Aadolu Uversty Joural of Scece ad Techology - A 3 ( Appled Sceces ad Egeerg 5 Çzelge 4. Modeller ver kümes açıklama yüzdeler. AIC Δ = AIC AIC m w = exp[ Δ ] 2 exp[ Δ ] 2 m = ZIP 8858.88 593.286 0 ZINB 2944.902 0 0.5526788 PH 8858.92 593.29 0 NBH 2945.325 0.423 0.447322 Çzelge 4 e göre ver kümes e y açıklaya ZINB modeldr. Dğer modellere göre ZIB model %55.27, NBH %44.73, ZIP %0 ve PH %0 uygu modeller olarak fade edlmektedr. Vuog, k model brbrler le karşılaştırarak hag model ver set y açıkladığıı belrte br testtr. ZIP, ZINB, PH ve NBH regresyoları kl olarak karşılaştırmalar soucu elde edle Vuog statstkler Çzelge 5 te verlmştr. Çzelge 5 te.sütu Model,.satır Model2 y göstermektedr. Çzelge 5. Vuog İstatstkler Model 2 ZIP ZINB PH NBH Model ZIP V= -8.55 P= 6.3e-8 Model2>Model V= 0.69 P= 0.24 Model>Model2 V= -8.55 P= 6.34e-8 Model2>Model ZINB V= 8.55 P=0.00 Model>Model2 V= 0.88 P= 0.89 Model>Model2 PH V= -8.55 P= 6.34e-8 Model2>Model

Aadolu Üverstes Blm ve Tekoloj Dergs - A 3 ( Uygulamalı Blmler ve Mühedslk Vuog statstklere bakıldığıda e y model ZINB model olduğu saptamıştır. ZIP ve ZINB modeller karşılaştırıldığıda ZINB model ZIP modelde daha uygu (-8.55, p<0.00 olduğu, ZINB ve PH modeller karşılaştırıldığıda ZINB model PH modelde daha uygu (8.55, p<0.00 olduğu ve ZINB model le NBH modeller karşılaştırıldığıda ZINB model NBH modelde daha uygu (V= 0.88, p>0. olduğu saptamıştır. Vuog statstklere göre ZINB, regresyo yötemler çde e y souçları vermştr. ZINB regresyo modele at parametre tahmler ve stadart hatalar Çzelge 6 da verlmştr. Çzelge 6. ZINB regresyoua at parametre tahmler Negatf Bomyal Kısmı (Log Değşke Parametre Tahmler Stadart Hata ˆ t değer p > t e β Itercept.42954 0.63698 2.237 0.025302 ** 4.080720 Persoel_Tp 0.38658 0.26488.462 0.43829.47372 Brm_Kod -0.04268 0.00553 -.352 0.76368 0.9858337 Uva_Kod 0.08666 0.04777 0.396 0.692353.08845 Csyet 0.05995 0.88744 0.085 0.932466.06232 Mede_Hal -0.054806 0.59028-0.345 0.730370 0.9466683 Yas 0.003772 0.0277 0.334 0.738005.0037792 Posta_Adet 0.028656 0.06064 0.473 0.636386.0290703 Posta_YYU 0.5429 0.2400 4.372.23e-05 ***.796475 Sohbet_Prog 0.49007 0.437 4.293.76e-05 ***.6323447 Blmsel_Top 0.659047 0.4204 4.667 3.05e-06 ***.9329490 Ortalama_It 0.9709 0.022308 5.366 8.04e-08 ***.27687 WebSte 0.56504 0.25038 4.49 7.0e-06 ***.7533069 Iteret_Bag 0.23902 0.5739.40 0.58638.238507 Dzustu_Bl -0.32028 0.80807-0.730 0.465257 0.87636 Logt Kısmı Değşkeler Parametre Tahmler Stadart Hata ˆ t değer p > t e β Itercept 4.865.09242 4.454 8.45e-06 *** 29.68542966

Aadolu Uversty Joural of Scece ad Techology - A 3 ( Appled Sceces ad Egeerg Çzelge 6. (Devamı ZINB regresyoua at parametre tahmler Persoel_Tp -2.78044 0.4747-5.897 3.69e-09 *** 0.062025 Brm_Kod 0.0396 0.0679.903 0.056995 *.03247948 Uva_Kod 0.35032 0.09032 3.879 0.00005 **.495273 Csyet -0.0468 0.3449-0.043 0.966044 0.98542423 Mede_Hal 0.20276 0.29968 0.677 0.498683.22477268 Yas 0.025 0.0936 0.627 0.530338.02295 Posta_Adet -0.6790 0.59-5.833 5.45e-09 *** 0.5073865 Posta_YYU -.09429 0.2554-4.350.36e-05 *** 0.33477862 Sohbet_Prog 0.46296 0.2508.846 0.06499 *.58876446 Blmsel_Top -2.7345 0.26358-0.374 < 2e-6 *** 0.06492604 Ortalama_It -0.3553 0.04530-7.759 8.55e-5 *** 0.7036368 WebSte 0.03288 0.29900 0.0 0.92434.03342765 Iteret_Bag -0.4302 0.28789-0.497 0.69337 0.86673386 Dzustu_Bl 0.505 0.3069.63 0.06737.6506287 ***p<0.00, **p<0.05, *p<0. ZINB modelde parametre tahm yorumlaırke logt ve log kısımlarıı ayrı değerledrmek gerekr. Logt kısmı ç ZINB regresyou souçları, π = exp( 4.9-2.8Persoel_Tp+0.03Brm_Kod+0.35Uva_Kod-0.02Csyet π + 0.20Mede_Hal+0.0Yas-0.67Posta_Adet -.09Posta_YYU+0.46Sohbet_Prog -2.74Blmsel_Top-0.35Ortalama_It+0.03WebSte-0.4Iteret_Bag+0.50Dzustu_Bl olarak elde edlmştr. e-posta göderme olasılığı üzerde Brm_Kod, Uva_Kod, Sohbet_Prog değşkeler poztf yöde, Persoel_Tp, Posta_Adet, Posta_YYU ve Blmsel_Top değşkeler egatf yöde statstksel olarak öeml br etk gösterdkler saptamıştır (p<0.05. İdar persoel akademk 2.78 persoele göre (e ~0.06 %94 daha az e- posta göderme eğlmde oldukları saptamıştır. Brmler arası farklılık e-posta 0.03 göderme olasılığıı ( e ~.032 %3 değştrmştr. Persoel akademk üva olarak yükselmes e-posta gödermey 0.35 ( e ~.49 %42 artırmıştır. Kşler e- posta adres sayısıdak br adet artış e-posta 0.67 gödermey (e ~0.5 %49 oraıda azaltmıştır. E çok yyu.edu.tr uzatılı e-posta adres kullaa persoel kullamayalara.094 göre e-posta gödermey ( e ~ 0.334 %67 azaltmıştır. Br sohbet programıı kullaa persoel kullamayalara göre e-posta göderme 0.4629 olasılığıı ( e ~.588 %59 artırmıştır. yyu.edu.tr uzatılı e-posta adres le br blmsel toplatıya katıla persoel katılmayalara göre e-posta gödermey 2.73 ( e ~ 0.065 %93 azaltmıştır. Gülük ortalama teret kullaımı artıkça e-posta göderme olasılığıı(e ~.03 %3 azaldığı 0.43 saptamıştır. ZINB regresyou NB kısmı ç elde edle regresyo deklem,

2 Aadolu Üverstes Blm ve Tekoloj Dergs - A 3 ( Uygulamalı Blmler ve Mühedslk μ = exp(.4+0.37persoel_tp-0.02brm_kod+0.02uva_kod+0.02csyet 0.05Mede_Hal+0.0Yas+0.03Posta_Adet +0.54Posta_YYU+0.49Sohbet_Prog + 0.66Blmsel_Top+0.2 Ortalama_It+0.56WebSte+0.2Iteret_Bag-0.3Dzustu_Bl olarak elde edlmştr. Parametre tahmlere bakıldığıda, göderle e-posta sayısı üzerde Posta_YYU, Sohbet_Prog, Blmsel_Top, Ortalama_It, Webste değşkeler statstksel olarak öeml bulumuştur (p<0.00. E-posta gödermek ç e çok yyu.edu.tr uzatılı e- posta adres kullaa persoel kullamayalara göre göderle ortalama e-posta 0.542 sayısıı( e ~.79 %72 artırmışlar. Herhag br sohbet programıı kullaa persoel kullamayalara göre göderle ortalama e- 0.49 posta sayısıı (e ~.63 %63 arttırdıkları saptamıştır. yyu.edu.tr uzatılı e-posta le br blmsel toplatıya katıla persoel katılmayalara göre ortalama e-posta sayısıı 0.659 ( e ~.932 %93 artırdıkları ve Web stes ola persoel olmayalara göre ortalama e- 0.565 posta sayısıı (e ~.75 %75 artırdıkları saptamıştır. 4. SONUÇ Sayıma dayalı olarak elde edle verlere Posso regresyou uygulaablrlğ ver kümes ortalama le varyaslarıı brbre eşt olmasıa bağlıdır. Göderle e-posta sayılarıı (bağımlı değşke ortalaması 2.033 ve varyası 5.247 olarak elde edlmştr. Varyası ortalamada çok büyük olması ver kümesde aşırı yayılım olduğuu göstermştr. Ver kümesde bekleede fazla sıfır değerler olması durumuda sıfır yayılımı meydaa gelr. toplam değşke %78.9 u sıfır değerlerde oluştuğuda ver kümesde sıfır yayılımı da söz kousudur. Ver kümelerde sıfır yayılımı durumuda Posso Hurdle, NB Hurdle, ZIP ve ZINB gb modeller yaygı olarak kullaılmaktadır. Ver kümes e y açıklaya model ZINB model olmuştur. ZINB hem aşırı hem de sıfır yayımlıı dkkate aldığıda e uygu model olarak gözlemştr. ZINB model e uygu model olduğu AIC blg krter (2944.902 ve Voug statstkler de desteklemştr. ZINB e y model parametre tahmlere göre göderle e-posta sayısı üzerde Posta_YYU, Sohbet_Prog, Blmsel_Top, Ortalama_It, Webste değşkeler statstksel olarak öeml bulumuştur (p<0.00. E-posta göderme olasılığı üzerde se Brm_Kod, Uva_Kod, Sohbet_Prog, Persoel_Tp, Posta_Adet, Posta_YYU ve Blmsel_Top değşkeler statstksel olarak öeml br etk gösterdkler saptamıştır (p<0.05. KAYNAKLAR Camero, A.C. ad Trved, P.K. (998. Regresso Aalyss of Cout Data. New York: Cambrdge Uversty Pres. Cu, Y. ad Yag, W. (2009. Zero-flated geeralzed Posso regresso mxture model for mappg quattatve trat loc uderlyg cout trat wth may zeros. Joural of Theoretcal Bology 256, 276 285. Domque, L., Smo, P.W. ad Joh, N.I. (2005. Posso, Posso-gamma ad zero-flated regresso models of motor vehcle crashes: balacg statstcal ft ad theory. Accdet Aalyss ad Preveto 37, 35 46. Gerdtham, U.G. (997. Equty I Health Care Utlzato: Further Tests Based o Hurdle Models Ad Swedsh Mcro Data. Health Ecoomcs 6, 303 39. Feerer, I., Hork, K. ad Meyer, D. (2008. Text Mg Ifrastructure R. Joural of Statstcal Software 25(5, 2-8. Hall, D.B. (2000. Zero-flated Posso ad egatve bomal regresso wth radom effects: A case study. Bometrcs 56, 030-039.

Aadolu Uversty Joural of Scece ad Techology - A 3 ( Appled Sceces ad Egeerg 63 Jasakul, N. (2005. Fttg A Zero-Iflated Negatve Bomal Model va R. 20th Iteratoal Workshop o Statstcal Modellg. Sydey, Australa. 277-284. Jasakul, N. ad Hde, J.P. (2009. Score Tests for Extra-Zero Models Zero-Iflated Negatve Bomal Models. Commucatos Statstcs - Smulato ad Computato 38(, 92-08. Joh, M.W., Hug, M.L., Robert, H.L. ad Alle, W.H. (2007. Power Calculatos for ZIP ad ZINB Models. Joural of Data Scece 5, 59-534. Kare, C.H.Y. ad Kelv, K.W.Y. (2005. O modelg clam frequecy data geeral surace wth extra zeros. Mathematcs ad Ecoomcs 36, 53 63. Khoshgoftaar, T.M., Gao, K. ad Szabo, R.M. (2005. Comparg Software Fault Predctos of Pure ad Zero- flated Posso Regresso Models. Iteratoal Joural of Systems Scece 36(, 707-75. Mart, S.W., Rose, C.E, Waemuehler, K.A. ad Plkayts, B.D. (2006. O the of Zero-flated ad Hurdle Models for Medellg Vacce Adverse evet Cout Data. Joural of Bopharmaceutcal Statstcs 6, 463-48. M, Y. ad Agrest, A. (2005. Radom effect models for repeated measures of zeroflated cout data. Statstcal Modellg 5, 9. Mwall, S.,M., Lesaffre, E. ad Declerck, D. (2008. The zero-flated egatve bomal regresso model wth correcto for msclassfcato: A example cares research. Statstcal Methods Medcal Research 7, 23 39. Rose, C.E., Mart, S.W., Waemuehler, K.A. ad Plkayts, B.D. (2006. O the Use of Zero-Iflated ad Hurdle Models for Modelg Vacce Adverse Evet Cout Data. Joural of Bopharmaceutcal Statstcs 6, 463 48. T, A. (2008. Modelg zero-flated cout data wth uderdsperso ad overdsperso. SAS Global Forum. Paper 372. Vuog, Q.H. (989. Lkelhood rato tests for model selecto ad o-ested hypotheses. Ecoometrca 57, 307 333. Wag, K., Kelv, K.W.Y. ad Ady, H.L. (2002. A zero-flated Posso mxed model to aalyze dagoss related groups wth majorty of same-day hosptal stays. Computer Methods ad Programs Bomedce 68, 95 203. Yeşlova, A., Kak, B. ad Kasap, İ. (2007. Sıfır Değer Ağırlıklı Sayıma Dayalı Olarak Elde edle Bağımlı Değşke Modellemesde Kullaıla Regresyo Yötemler. İstatstk Araştırma Dergs 5(, 9. Yeşlova, A., Kaya, Y., Kak, B. ad Kasap, İ. (200. Aalyss of plat protecto studes wth excess zeros usg zeroflated ad egatve bomal hurdle models. GU Joural of Scece 23(2, 3-36. Yeşlova, A, Kayda, M.B. ad Kaya, Y. (200. Modelg sect-egg data wth excess zeros usg zero-flated regresso models. Hacettepe Joural of Mathematcs ad Statstcs 39(2, 273 282. Rdout, M., Hde, J. ad Demetro, C.G.B. (200. A Score Test for a Zero-Iflated Posso Regresso Model Agast Zero- Iflated Negatve Bomal Alteratves. Bometrcs 57, 29-233.

52 Aadolu Üverstes Blm ve Tekoloj Dergs - A 3 ( Uygulamalı Blmler ve Mühedslk