Sıfır Ağırlıklı Sayma ile Elde Edilen Veriler İçin Çok Seviyeli ZIP Regresyon * Multilevel ZIP Regression for Zero-Inflated Count Data



Benzer belgeler
Hasar sıklıkları için sıfır yığılmalı kesikli modeller

PARÇALI DOĞRUSAL REGRESYON

ÇOKLU REGRESYON MODELİ, ANOVA TABLOSU, MATRİSLERLE REGRESYON ÇÖZÜMLEMESİ,REGRES-YON KATSAYILARININ YORUMU

PARAMETRİK OLMAYAN HİPOTEZ TESTLERİ Kİ-KARE TESTLERİ

NİTEL TERCİH MODELLERİ

X, R, p, np, c, u ve diğer kontrol diyagramları istatistiksel kalite kontrol diyagramlarının

Genel Doğrusal Karışık Modellerde Farklı Kovaryans Yapıları ve Tahmin Yöntemlerinin Performanslarının Karşılaştırılması 1

Korelasyon ve Regresyon

Sürekli Olasılık Dağılım (Birikimli- Kümülatif)Fonksiyonu. Yrd. Doç. Dr. Tijen ÖVER ÖZÇELİK

KIRMIZI, TAVUK VE BEYAZ ET TALEBİNİN TAM TALEP SİSTEMİ YAKLAŞIMIYLA ANALİZİ

HAFTA 13. kadın profesörlerin ortalama maaşı E( Y D 1) erkek profesörlerin ortalama maaşı. Kestirim denklemi D : t :

BÖLÜM 5 İKİ VEYA DAHA YÜKSEK BOYUTLU RASGELE DEĞİŞKENLER İki Boyutlu Rasgele Değişkenler

ENDÜSTRİNİN DEĞİŞİK İŞ KOLLARINDA İHTİYAÇ DUYULAN ELEMANLARIN YÜKSEK TEKNİK EĞİTİM MEZUNLARINDAN SAĞLANMASINDAKİ BEKLENTİLERİN SINANMASI

AKADEMİK YAKLAŞIMLAR DERGİSİ JOURNAL OF ACADEMIC APPROACHES

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ÇOKLU İÇ İLİŞKİ VE EKOLOJİK REGRESYON İSTATİSTİK ANABİLİM DALI

FARKLI VERİ YAPILARINDA KULLANILABİLECEK REGRESYON YÖNTEMLERİ

ALGILANAN HİZMET KALİTESİ VE LOJİSTİK REGRESYON ANALİZİ İLE HİZMET TERCİHİNE ETKİSİNİN BELİRLENMESİ. Özet

Obtaining Classical Reliability Terms from Item Response Theory in Multiple Choice Tests

UYUM ĐYĐLĐĞĐ TESTĐ. 2 -n olup. nin dağılımı χ dir ve sd = (k-1-p) dir. Burada k = sınıf sayısı, p = tahmin edilen parametre sayısıdır.

SUÇ VERİ TABANININ LOJİSTİK REGRESYON ANALİZİ İLE TAHMİNİ: BURSA ÖRNEĞİ Estimating of Crime Database with Logistic Regression Analysis: Bursa Case

İki Durumlu Karışımlı Lojistik Regresyona İlişkin Bir Uygulama. An Application for Binary Mixture Logistic Regression

PROJE SEÇİMİ VE KAYNAK PLANLAMASI İÇİN BİR ALGORİTMA AN ALGORITHM FOR PROJECT SELECTION AND RESOURCE PLANNING

kadar ( i. kaynağın gölge fiyatı kadar) olmalıdır.

ARAŞTIRMA MAKALESİ/RESEARCH ARTICLE TEK ÇARPIMSAL SİNİR HÜCRELİ YAPAY SİNİR AĞI MODELİNİN EĞİTİMİ İÇİN ABC VE BP YÖNTEMLERİNİN KARŞILAŞTIRILMASI ÖZ

UYGULAMA 2. Bağımlı Kukla Değişkenli Modeller

YAŞAM ÇÖZÜMLEMESİNDE AYKIRI DEĞERLER OUTLIERS IN SURVIVAL ANALYSIS

2005 Gazi Üniversitesi Endüstriyel Sanatlar Eğitim Fakültesi Dergisi Sayı:16, s31-46

TÜKETĠCĠLERĠN FĠYAT BĠLĠNCĠ ÜZERĠNDE ETKĠLĠ OLAN FAKTÖRLERE ĠLĠġKĠN BĠR ĠNCELEME

YARIPARAMETRİK KISMİ DOĞRUSAL PANEL VERİ MODELLERİYLE ULUSLAR ARASI GÖÇ

EKONOMETRİYE GİRİŞ II ÖDEV 4 ÇÖZÜM

Tek Yönlü Varyans Analizi

PARAMETRİK OLMAYAN HİPOTEZ TESTLERİ. χ 2 Kİ- KARE TESTLERİ. Doç.Dr. Ali Kemal ŞEHİRLİOĞLU Araş.Gör. Efe SARIBAY

BANKACILIKTA ETKİNLİK VE SERMAYE YAPISININ BANKALARIN ETKİNLİĞİNE ETKİSİ

MIT Açık Ders Malzemeleri Bu materyallerden alıntı yapmak veya Kullanım Koşulları hakkında bilgi almak için

YÖNETİM VE EKONOMİ Yıl:2006 Cilt:13 Sayı:1 Celal Bayar Üniversitesi İ.İ.B.F. MANİSA

KENTSEL ALANDA ET TALEP ANALİZİ: BATI AKDENİZ BÖLGESİ ÖRNEĞİ. Dr. Ali Rıza AKTAŞ 1 Dr. Selim Adem HATIRLI 2

5.3. Tekne Yüzeylerinin Matematiksel Temsili

Bitkisel Ürün Sigortası Yaptırma İsteğinin Belirlenmesi: Tokat İli Örneği

FAKTÖR A ALĐZ SKORLARI KULLA ILARAK KARAYAKA KUZULARI DA CA LI AĞIRLIK TAHMĐ Đ

Doğrusal Korelasyon ve Regresyon

Merkezi Eğilim (Yer) Ölçüleri

Asimetri ve Basıklık Ölçüleri Ortalamalara dayanan (Pearson) Kartillere dayanan (Bowley) Momentlere dayanan asimetri ve basıklık ölçüleri

Antalya Đlinde Serada Domates Üretiminin Kâr Etkinliği Analizi

Bulanık Mantık ile Hesaplanan Geoid Yüksekliğine Nokta Yüksekliklerinin Etkisi

4.5. SOĞUTMA KULELERİNİN BOYUTLANDIRILMASI İÇİN BİR ANALIZ

Deney No: 2. Sıvı Seviye Kontrol Deneyi. SAKARYA ÜNİVERSİTESİ Dijital Kontrol Laboratuvar Deney Föyü Deneyin Amacı

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

REGRESYONDA ETKİLİ GÖZLEMLERİ BELİRLEME YÖNTEMLERİ VE KARŞILAŞTIRMALARI. Can DARICA YÜKSEK LİSANS TEZİ İSTATİSTİK

Farklı Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = s 2 Eşit Varyans

dir. Bir başka deyişle bir olayın olasılığı, uygun sonuçların sayısının örnek uzaydaki tüm sonuçların sayısına oranıdır.

YAŞAM ÇÖZÜMLEMESİNDE ZAYIFLIK MODELLERİ FRAILTY MODELS IN SURVIVAL ANALYSIS

Kar Payı Politikası ve Yaşam Döngüsü Teorisi: İMKB İmalat Sektöründe Ampirik Bir Uygulama

Tek Yönlü Varyans Analizi (ANOVA)

A İSTATİSTİK. 4. X kesikli rasgele (random) değişkenin moment çıkaran. C) 4 9 Buna göre, X in beklenen değeri kaçtır?

MESLEK SEÇİMİ PROBLEMİNDE ÇOK ÖZELLİKLİ KARAR VERME VE ÇÖZÜME YÖNELİK GELİŞTİRİLEN BİREYSEL KARİYER PLANLAMA PROGRAMI

K-Ortalamalar Yöntemi ile Yıllık Yağışların Sınıflandırılması ve Homojen Bölgelerin Belirlenmesi *

Basel II Geçiş Süreci Sıkça Sorulan Sorular

ÖZET Yüksek Lsans Tez TAM VE SANSÜRLÜ ÖRNEKLEM DURUMLARINDA WEIBULL DAĞILIMI İÇİN BAZI İSTATİSTİKİ SONUÇ ÇIKARIMLARI Dlşen TAMAM Ankara Ünverstes Fen

Farklı Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = σ i2. Eşit Varyans. Hata. Zaman

Akıllı Telefon Seçiminin Belirleyicileri: Üniversite Öğrencileri Üzerine Bir Uygulama

Türkiye de Süt Ürünleri Tüketim Harcamalarına Etki Eden Faktörlerin Analizi: Çoklu Heckman Örneklem Seçicilik Sistem Yaklaşımı

Rasgele Değişken Üretme Teknikleri

1. KEYNESÇİ PARA TALEBİ TEORİSİ

ADJUSTED DURBIN RANK TEST FOR SENSITIVITY ANALYSIS IN BALANCED INCOMPLETE BLOCK DESIGN

LOJİSTİK REGRESYON ANALİZİ İLE ESKİŞEHİR İN SİS

DOĞRUSAL HEDEF PROGRAMLAMA İLE BÜTÇELEME. Hazırlayan: Ozan Kocadağlı Danışman: Prof. Dr. Nalan Cinemre

T.C. SELÇUK ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ

Sabit Varyans. Var(u i X i ) = Var(u i ) = E(u i2 ) = s 2

Ege Bölgesi orman işletmelerindeki orman mühendisi dağılımının Atkinson endeksi ile değerlendirilmesi

SEK Yönteminin Güvenilirliği Sayısal Bir Örnek. Ekonometri 1 Konu 11 Sürüm 2,0 (Ekim 2011)

Sıklık Tabloları ve Tek Değişkenli Grafikler

İki veri setinin yapısının karşılaştırılması

a IIR süzgeç katsayıları ve N ( M) de = s 1 (3) 3. GÜRÜLTÜ GİDERİMİ UYGULAMASI

Türkiye deki Đşsizlik Oranının Bulanık Doğrusal Regresyon Analiziyle Tahmini

TRANSPORT PROBLEMI için GELIsTIRILMIs VAM YÖNTEMI

Kİ KARE ANALİZİ. Doç. Dr. Mehmet AKSARAYLI Ki-Kare Analizleri

TEKNOLOJİ, PİYASA REKABETİ VE REFAH

Lojistik Regresyonlarda Değişken Seçimi

Samsun Bölgesindeki Hava Kirliliğinin Neden Olduğu Hastalıkların İstatistiksel Modellenmesi

FARKLI REGRESYON YÖNTEMLERİ İLE BETA KATSAYISI ANALİZİ

Türkiye de Sağlık Hizmetleri Talebinin Sayma Veri Modelleriyle İncelenmesi: İçsellik Sorunu

Sansürlenmiş ve Kesikli Regresyon Modelleri

Kİ-KARE TESTLERİ A) Kİ-KARE DAĞILIMI VE ÖZELLİKLERİ

İyi Tarım Uygulamaları Ve Tüketici Davranışları (Logit Regresyon Analizi)(*)

ALTERNATİF AKIM DEVRE YÖNTEM VE TEOREMLER İLE ÇÖZÜMÜ

Standart Model (SM) Lagrange Yoğunluğu. u, d, c, s, t, b. e,, Şimdilik nötrinoları kütlesiz Kabul edeceğiz. Kuark çiftlerini gösterelim.

OLASILIĞA GİRİŞ. Biyoistatistik (Ders 7: Olasılık) OLASILIK, TIP ve GÜNLÜK YAŞAMDA KULLANIMI

Hisse Senedi Fiyatları ve Fiyat/Kazanç Oranı Đlişkisi: Panel Verilerle Sektörel Bir Analiz *

ÇUKUROVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ YÜKSEK LİSANS TEZİ

ARAŞTIRMA MAKALESİ / RESEARCH ARTICLE

HİSSE SENETLERİNİN BEKLENEN GETİRİ VE RİSKLERİNİN TAHMİNİNDE ALTERNATİF MODELLER

Obtaining Classical Reliability Terms from Item Response Theory in Multiple Choice Tests

Bölüm 3. Tanımlayıcı İstatistikler

Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi Pamukkale University Journal of Engineering Sciences

ROBİNSON PROJEKSİYONU

TÜRKİYE DEKİ 380 kv LUK 14 BARALI GÜÇ SİSTEMİNDE EKONOMİK YÜKLENME ANALİZİ

( ) 3.1 Özet ve Motivasyon. v = G v v Operasyonel Amplifikatör (Op-Amp) Deneyin Amacı. deney 3

DEÜ MÜHENDİSLİK FAKÜLTESİ MÜHENDİSLİK BİLİMLERİ DERGİSİ Cilt: 16 Sayı: 48 sh Eylül 2014 KRİL SÜRÜSÜ ALGORİTMASI İLE ATÖLYE ÇİZELGELEME

DENEY 4: SERİ VE PARALEL DEVRELER,VOLTAJ VE AKIM BÖLÜCÜ KURALLARI, KIRCHOFF KANUNLARI

BÖLÜM 1 1.GİRİŞ: İSTATİSTİKSEL DOĞRUSAL MODELLER

Transkript:

Yüzüncü Yıl Ünverstes Fen Blmler Ensttüsü Dergs/ Journal of The Insttute of Natural & Appled Scences 18 (1-):01-08, 013 Araştırma Makales/Research Artcle Sıfır Ağırlıklı Sayma le Elde Edlen Verler İçn Çok Sevyel ZIP Regresyon * Suna AKKOL 1, Hayrettn OKUT 1, Sanem ŞEHRİBANOĞLU 1 :Yüzüncü Yıl Ünverstes, Zraat Fakültes, Zootekn Bölümü, Byometr ve Genetk ABD. Kampüs VAN : Yüzüncü Yıl Ünverstes, İstatstk Bölümü, VAN. e-posta:, sgakkol@yyu.edu.tr ÖZET: Çeştl çalışma alanlarında sıfır ağırlıklı sayma le elde edlen verlerle sıklıkla karşılaşılmaktadır. Bu tp verler çn sıfır ağırlıklı Posson (Zero-nflated Posson: ZIP) regresyon ve sıfır ağırlıklı negatf bnom (Zero-nflated negatf bnomal: ZINB) regresyon kullanılmaktadır. Üzernde çalışılan ver kümes boylamsal (longtudnal) br yapıya sahp olduğunda gözlemlern bağımsızlık varsayımı geçerllğn ytrmektedr. Blnen yöntemler yerne bu tür verlern analz çn son yıllarda çok sevyel modeller kullanılmaya başlanmıştır. Bu çalışmada, sıfır ağırlıklı sayma le elde edlen ver kümesnde gözlemlern brbrnden bağımsız olmaması durumunda ortaya çıkan problemlern üstesnden geleblmek çn çok sevyel ZIP regresyon model kullanılmıştır. Bu amaçla boylamsal yapıya sahp sıfır ağırlıklı sayma le elde edlen ver kümes üzernde br uygulama yapılmıştır. Anahtar Sözcükler: sıfır ağırlıklı modeller, çok sevyel modeller, Posson ve negatf bnomal regresyon, boylamsal ver. Multlevel ZIP Regresson for Zero-Inflated Count Data ABSTACT: Posson regresson models are often used for analyss of zero-nflated count data from several studes. Both, zero-nflated Posson (ZIP) and zero nflated negatve bnomal (ZINB) can handle the exstng heterogenety n data structure. Data are correlated and have herarchcal structure hen research study that nvolves repeated observatons of the same tems over long perods of tme. The am of present paper s to ntroduce multlevel ZIP model to overcome on heterogenety for zero-nflated count data and llustrate technques for fttng and nterpretng the zero-nflated Posson regresson. We provded an emprcal applcaton and llustraton of the multlevel ZIP regresson from a longtudnal study. Keyords: zero-nflated models, multlevel models, Posson and Negatve Bnomal Regresson, longtudnal data Grş Sayma le elde edlen verler le çeştl çalışma alanlarında sıklıkla karşılaşılmaktadır. Bu tp verlern analznde genellkle Posson regresyon model kullanılır. Fakat pratkte sayma le elde edlen verler yaygın olarak Posson dağılışına göre beklenenden çok sayıda sıfıra sahp olablrler. Dolayısıyla bu tür verlere Posson veya Negatf Bnom regresyon model uygulandığı takdrde parametre tahmnlerndek stenlen sapmasızlık özellğ geçerllğn ytrr (Gosh ve dğ., 006). Posson dağılışına uymayan çok sayıda sıfıra sahp sayıma dayalı ver çn önerlen br yaklaşım sıfır ağırlıklı (zero-nflated) Posson dağılışının kullanılmasıdır. İk parametrel, p ve λ, olan bu dağılışta populasyonun k tp breyden oluştuğu varsayılır. Bunlardan brncs p olasılıklı her zaman sıfır olan sayıma dayalı ver, kncs se (1-p) olasılıklı Posson (λ) dağılışlı sayıma dayalı very çerr. Lambert (Lambert, 199), bu dağılışı kullanarak zeronflated Posson (ZIP) regresyon smnde yen br model tanıtmıştır. Bu model aslında 1 : Bu çalışma TÜBİTAK TOVAG 105O04 ve YYÜ BAPB 006-ZF-B03 tarafından desteklenmştr.

Akkol ve ark., karışımlı Posson (mxture Posson) regresyon modelnn özel br haldr (Dange, 004). ZIP regresyon son yıllarda yoğun olarak çeştl araştırmacılar (Böhnng ve dğ., 1999, Lee ve dğ., 001, Cheung, 00) tarafından kullanılmaktadır. Ver kümesnn sıfır olmayan kısımdak verler aşırı yayılıma sahp se ZIP dağılışı yerne alternatf br yaklaşım olarak zero-nflated negatf bnomal (ZINB) dağılışı gb aşırı yayılımı dkkate alablecek br dağılış önerlmektedr (Cheung, 00, Böhnng, 1998, Yau ve dğ., 003, Sheu ve dğ., 004). Sıfır ağırlıklı sayma le elde edlen verler boylamsal (longtudnal) yapıya sahp olablrler. Bu tp verler son yıllarda çok sevyel modelleme çnde değerlendrlmektedr (Akkol, 004, Hall., 000; Yau ve Lee, 001; Hur ve dğ., 00; Wang ve dğ., 00). Lee ve arkadaşları (Lee ve Dğ., 006) tarafından sıfır ağırlıklı boylamsal (longtdunal) sayma le elde edlen verler çn çok sevyel ZIP regresyon model kullanılmıştır. Bu çalışmada çok sayıda sıfıra sahp sayma le elde edlmş boylamsal verler çn ZIP, ZINB ve gözlemlern bağımsızlığını ytrmes durumunu dkkate alan çok sevyel ZIP regresyon modeller kullanılacaktır. Bu amaçla önce ZIP, ZINB ve çok sevyel ZIP regresyon modeller çn genel br değerlendrme yapılacaktır. Daha sonra çok sayıda sıfıra sahp sayma le elde edlmş boylamsal verler çn bu üç yöntem karşılaştırılarak ver setn çn en y model tespt edlecektr. Yöntem Sıfır ağırlıklı Posson (Zero-Inflated Posson=ZIP) Regresyon Model: ZIP regresyon, şans değşkenler Y nn karışımlı br modele sahp olduğunu ve bunun k alt populasyondan oluştuğunu varsayar. Bu alt populasyonlarda br şans değşkenlernn p olasılıkla sıfır değernn aldığı ( Y 0 ) populasyonu gösterrken dğer se şans değşkenlernn1 p olasılığı le Y y Posson değern aldığı alt populasyonu fade eder. Bundan dolayı ZIP aşağıdak gb fade edlr (Gosh ve dğ., 006); Pr( Y y p (1 p ) e p, ) (1 p ) e y / y! f y 0, f y 0, y ~0 y ~ Po( ) y 1,... (1) Burada ( 1,..., ) ve N p ( 1,..., ) p pn olup, her k alt populasyonda parametre tahmn çn aynı model kullanılmamaktadır. p olasılıklı alt populasyon çn logt(p ) ve 1-p olasılıklı Posson alt populasyonu çn se log( ) bağlantı (lnk) fonksyonları kullanılarak modelleme yapılır. log( ) B log t( p ) log ( p (1 p )) G () Yukarıda B ve G, B ve G kovaryet (açıklayıcı değşken) matrsne lşkn nnc (, ; y ) sırayı, ve regresyon parametrelern göstermektedr. Bu dağılışa lşkn ortalama ve varyans sırasıyla, E( Y ) (1 p ) ve var( Y ) (1 p ) (1 p ) fade edlr. Genel olarak yukarıdak regresyon model çn tüm verlere at log olablrlk fonksyonu (3 numaralı eştlk) kullanılarak model parametreler ve tahmn yapılır (Gosh ve dğ., 006; Hall., 000). N G B B G u loge exp e (1 u ) y B e log1 e (1 u )log( y!) (3) 1 Sıfır ağırlıklı Negatf Bnomal (Zero- Inflated Negatve Bnomal=ZINB) Regresyon Model: Cevap değşken Y nn sıfır ağırlıklı negatf bnomal (ZINB) dağılışa sahp olması durumunda p olasılığı le Y ~0 ve (1- p ) olasılığı le Y ~ NB (, ) gösterr ve bu dağılışın olasılık yoğunluk fonksyonu, Yüzüncü Yıl Ünverstes Fen Blmler Ensttüsü Dergs/ Journal of The Insttute of Natural & Appled Scences

Sıfır Ağırlıklı Sayma le Elde Edlen Verler İçn Çok Sevyel ZIP Regresyon Pr( Y 1 p (1 p )(1 ) y ) y (1 p ) y! 1 y 0 1 y y y 0 1 1 y (4) ZINB de şans değşkenlernn Y karışımlı br modele sahp olduğunu ve bunun k alt populasyondan oluştuğu varsayılır. ZIP modelnde olduğu gb p olasılıklı alt populasyon çn logt(p ) ve 1-p olasılıklı, negatf bnom alt populasyonu çn se log( ) bağlantı (lnk) fonsyonları kullanılarak modelleme yapılır. ZINB dağılışına sahp herhang br cevap değşken çn ortalama ve varyans sırasıyla aşağıdak gb verlr. E( y ) 1 p, (5) Var( y ) 1 p 1 p Burada ve p parametreler aynı zamanda modelde yer alan açıklayıcı değşkenlere bağlı olarak değşr ve olasılık fonksyonunda 1,, p; y I y log 1 p 1 0 Iy log1 p 1 1 1 log1 logy log } yer alan y 0 şeklnde skaler br büyüklüğü fade eder. ve p nn her ksn de 0 dan büyük olduğu durumlarda Y nn marjnal dağılışı dan dolayı aşırı yayılım ve p den dolayı çok sayıda sıfır çerme durumu gözlenr. Yukarıda verlen (7) numaralı eştlkte p 0 olduğu zaman negatf bnomal dağılış söz konusu olacaktır. Yne aynı eştlkte 0 olması durumunda artık söz konusu eştlk ZIP modele ndrgenr. Y ( 1,..., n) gözlemler çn ZINB logolablrlk fonksyonu 6 numaralı eştlktek gb yazılır (Jansakul, 005); { 0 y log y log log y y (6) Çok sevyel (Mult-level) ZIP Regresyon Model: İk sevyenn olduğu çok sevyel br modelleme problemnde, lk olarak en yüksek sevyeden örnek brmler alınır. Daha sonra mevcut brmlerden alt brmler örneklenr. Söz konusu alt brmler brnc sevye alt brmlerdr. Buna göre brnc sevyedek brmler genellkle tamamen bağımsız olmazlar (Akkol, 004; Hox, 1998; Goldsten, 1995; Agrest ve dğ., 000). Y j, nnc breye at j nnc tekrarı göstersn m ( 1,,..., m; j 1,,..., n ve n n toplam 1 sayıdır). Buna göre şansa bağlı katsayı ve eğme sahp k sevyel ZIP regresyon model aşağıdak gb yazılır. p j log log tp G (7) j (1 pj ) log( ) B u j j j 0 u j 1 Yukarıdak eştlkte logt kısımdak G j sabt etklere at desen matrsn, blnmeyen regresyon parametresn, 0 knc sevyeye at şansa bağlı katsayı ve j 0 1 1 şansa bağlı eğm (slope) göstermektedr. log kısımdak B j sabt etklere at desen matrsn, bu kısımdak blnmeyen regresyon parametresn, u 0 bu kısımdak knc sevyeye at şansa bağlı katsayıyı ve u 1 yne bu kısımdak knc sevyeye at şansa bağlı eğm göstermektedr. 0 ~ N0,, 0 01 1 01 1 u 0 u ~ N 0, u, u 0 u (8) 01 u u1 u 01 u1 Parametre tahmn edlrken kullanılan EM algortmasının (McLachlan 1997) M aşamasında ve matrs elemanlarının u blndğ varsayılır. Pratkte bunlar blnmez ve tahmn edlmes gerekr. GLMM e göre en y doğrusal sapmasız tahmnleyc (BLUP) tp log-olablrlk, 1 şeklnde k kısımda verlr (Lee ve Dğ., 006; Yau ve Lee, 001; Wang ve dğ., 00). Clt/Volume: 18, Sayı/Issue1-:. 013 3

Akkol ve ark., j exp exp j 1 exp exp 1 log exp y j 0 j y j 0 yjj exp j logyj! log1 j (9) 1 1 1 m log m log uu (10) u u Başlangıçta varyans unsurlarının sabtlenmes le brlkte ZIP model çn 1 maksmze edlmeye başlar. Bu, parametre tahmnleme sürecnn lk aşamasıdır. Daha sonra kısıtlanmış en çok olablrlk (REML) kullanılarak varyans unsurlarının değerler güncellenr. dek şansa bağlı etklerde ve 1 parametre tahmnlernde beklenen düzeyde yakınsama sağlandıktan sonra EM algortması kullanılır. Uygulama Bu çalışmada kullanılan ver kümes daha önce Okut ve arkadaşları (Okut ve dğ., 005) tarafından yapılan br çalışmada kullanılmış olan Amerka Youth Survey den alınmıştır. Ver kümesnde kullanılan cevap değşken 5 yıl süre le breylern evden kaçış sayılarını fade etmektedr. Şekl 1. Breylern 5 yıl süre le evden kaçış sayılarına at frekans dağılımı Uygulama amaçlı sunulan örnekte 5 yıl süre le aynı breylern her yıl evden kaçış sayıları Şekl 1 de özetlenmştr. Modele breylern cnsyet, br yılda kullandıkları ortalama madde kullanım sayısı, ırkı, ebeveynlern evllk durumu ve ale gelrler açıklayıcı değşken olarak dahl edlmştr. Çalışmada kullanılan ver kümesnn % 55. sn erkekler gerye kalanı bayanlardan oluşmaktadır. Irklar dkkate alındığında, beyazlar ver kümesnn %8.36 sını syahlar %13.18 n oluştururken gerye kalan %4.45 lk kısmını dğerler olarak adlandırılan çeştl ırklardan nsanların br araya geldğ grubu fade etmektedr. Çalışmaya dahl edlen breylern ebeveynlerne at meden durumları k başlık altına toplanmıştır. Bunlardan ebeveynn evl olduğu breylern toplam breyler çndek oranı % 79.33 ken bekar olanların oranı %4.67 dr. Alenn gelr ve madde kullanımına lşkn temel statstkler Çzelge 1 de özetlenmştr. Çzelge 1. Analzde kullanılan değşkenler çn temel statstkler Değşken Ortalama (St.Sapma) Ale gelr 4.31 (.33) Madde kullanımı Brnc Yıl İknc Yıl Üçüncü Yıl Dördüncü Yıl Beşnc Yıl 5.34 (4.48) 6. (5.09) 8.7 (6.36) 9.34 (6.73) 8.75 (4.81) Bulgular ve Tartışma Çalışmada kullanılan ver kümesndek cevap değşken olan breyn evden kaçış sayısı yaklaşık olarak %95 sıfır değerne sahptr. Bu oran saymayla elde edlen verler çn beklenenden daha yüksektr. Dolayısıyla ver kümesnn analz çn öncelkle ZIP ve ZINB, daha sonra k sevyel ZIP regresyon analz uygulanmıştır. Bu amaçla analzler yapılırken Stata (Stata/SE 9.0) ve SAS (SAS, 007) paket programları kullanılmıştır. Çok sayıda sıfıra sahp boylamsal ver kümes çn kullanılan ZIP ve ZINB regresyon model Yüzüncü Yıl Ünverstes Fen Blmler Ensttüsü Dergs/ Journal of The Insttute of Natural & Appled Scences 4

Sıfır Ağırlıklı Sayma le Elde Edlen Verler İçn Çok Sevyel ZIP Regresyon çn aynı açıklayıcı değşkenler, modeln hem lojstk hem de log kısmında değerlendrmeye alınmıştır. Tahmn edlen parametre sonuçları ve bunlara at standart hatalar Çzelge le sunulmuştur. Çzelge. ZIP ve ZINB regresyon modelne lşkn sonuçlar Değşkenler/Parametreler ZIP ZINB Logstc log tp G j j j Sabt 0.1851(.874) -7.744(3.068)* Gelr düzey -0.0701(.058) 0.133(.135) Cnsyet -0.5306(.1705)** -0.9605(.476)* Madde kullanımı -0.1097(.0135)** -0.099(.099)** Etnste 0.641(.137)**.45848(.7818)** Meden durum -0.81(.1990) 1.73(.5498)* Yaş 0.393(.0419)** 0.963(.1400)* Log log( ) B j j j Sabt -0.0359(.0741) -4.087(1.446)** Gelr düzey -0.3458(.0467)** -0.1567(.0694)* Cnsyet -0.401(.133)** -0.3784(.778) Madde kullanımı 0.009(.0094) 0.0816(.01)** Etnste 0.7415(.1368)**.0408(.5310)** Meden durum -0.0989(.1403)* 1.0473(.3337)** Yaş 0.0847(.0335) -0.0595(.0989) 1 1.996(.770)** Regresyon modeln k kısımda nceleyen sıfır ağırlıklı modellerden ZINB ver kümesnde sıfır olmayan kısımda aşırı yayılım olduğu zaman kullanılır. Eğer aşırı yayılım yoksa ZIP regresyon ZINB ye terch edlen regresyon model olur. Çzelge ncelendğnde aşırı yayılımı modelleyen 1 nn öneml olduğu dkkat çekmektedr. Bu parametrenn öneml olması aşırı yayılımın varlığını göstermektedr. Bu çalışmada kullanılan ver kümes çn aşırı yayılımı dkkate alan ZINB regresyon model ZIP modele terch edlmektedr. Üzernde çalışılan ver kümes çn elde edlen Voung test (Moghmbeg ve dğ., 009) sonuçlarına göre ZIP regresyon, Posson regresyona terch edlmştr. Benzer sonuç negatf bnom çn de elde edlmş ve ZINB regresyon, NB regresyona terch edlen regresyon model olarak tespt edlmştr. Çok sayıda sıfıra sahp ver kümes çn bu beklene br sonuçtur. Ver kümesndek boylamsal yapıyı dkkate alan br yaklaşım, çok sevyel modellemedr. Bu yaklaşım le breylere at beş tekrarlı olarak elde edlen ver kümes, brey ç yıllar olmak üzere br sınıflandırmaya sahptr. Burada tekrarlar brnc ve breyler knc sevye olmak üzere verler k sevyel model özellğ göstermektedr. Bu tp verler çn kullanılan modellere aynı zamanda büyüme eğrs modeller (groth curve models) sm de verlmektedr (Okut ve dğ., 005). Çok sevyel modelleme kullanılarak her k sevyeye lşkn şansa bağlı etkler ve dolayısıyla bunlara at varyans ve kovaryanslar modele tanıtılmıştır. İk sevyel ZIP regresyon modelnden elde edlen sonuçlar modeln her k kısmı ( Logt ve Log) çn Çzelge 3 de verlmştr. Clt/Volume: 18, Sayı/Issue1-:. 013 5

Akkol ve ark., Çzelge 3. Çok sevyel ZIP regresyon modelne lşkn sonuçlar Logt Kısım Değşkenler Log Kısım Değşkenler log p j Sabt 0.917 j log( j) Sabt -0.565 j (1 pj) Gelr düzey -0.063 Bj u0 u1 Gelr düzey -0.400** logtp jgj 0 Cnsyet -0.570** Cnsyet -0.506** 1 Madde kullanımı 0.089** Madde kullanımı 0.195** Etnste 0.83* Etnste -0.47** Meden durum 0.067 Meden durum 0.004 Yaş -0.198** Yaş 0.0107 Var 0.0408 Varyans ˆ ).888 *:p<0.05, **:p<0.01 Var cov 0 0 0.0591 Varyans ˆ ) 0.04 1 1 0, 1 01 0.099 Co yans( ˆ, ˆ ) 3.304 ( 0 ( 1 var 0 1 Boylamsal yapıya sahp sıfır ağırlıklı saymayla elde edlen verler çn en y model belrlemek üzere ZIP, ZINB ve k sevyel ZIP regresyon modeller çn logolablrlk, AIC ve BIC değerler Çzelge 4 te verlmştr. Çzelge 4. Kullanılan Modeller İçn Log-olablrlk, AIC ve BIC Değerler Model Log-lkelhood AIC BIC ZIP -133.7 675.5 765.5 ZINB -1067.7 165.4 61.8 İk sevyel ZIP -985. 014.4 155.4 Yukarıdak çzelgeye göre ZINB regresyon modelnn ZIP den daha y logolablrlk, BIC ve DIC değerlerne sahp olduğu görülmektedr. Zra ZIP den farklı olarak modelde yer alan yayılım parametres öneml bulunmuştur. İk sevyel ZIP regresyon model se hem ZIP hem de ZINB regresyon modellernden daha y bulunmuştur. Çünkü k sevyel ZIP regresyon model ver kümesndek boylamsal yapıyı dkkate almaktadır. Başka br fadeyle çok sevyel modelleme boylamsal ver yapısını dkkate alarak parametre tahmn yapmakta ve bu nedenle çok sayıda sıfıra sahp boylamsal ver kümes çn ZIP ve ZINB ye terch edlmektedr. Sonuç Sayma le elde edlen ver kümesnde çok mktarda sıfır olması durumunda ZIP regresyon (Gosh ve dğ., 006) model Posson regresyona terch edlr. Ver kümesnn sıfır olmayan kısmında aşırı yayılım söz konusu se ZINB regresyon model kullanılmaktadır (Böhnng, 1998; Rdout ve dğ., 001). Bu çalışmada kullanılan cevap değşken breylern evden kaçma sayılarını göstermekte ve büyük oranda sıfır (%95) çermektedr. Çalışmaya başlarken bu ver kümes çn ZIP ve ZINB regresyon modeller kullanılmıştır. Çzelge 4 de verlen sonuçlar gösterd k üzernde çalışılan ZINB regresyon, ver kümesnn uyumunu ZIP regresyondan daha y yapmıştır. Tablo 3 de verlen yayılım parametresnn () öneml çıkması ver kümesnde br aşırı yayılımın olduğunu ve bunun modellenmes le uyumun daha y olableceğn göstermektedr. Boylamsal yapıya sahp br ver kümes aynı zamanda hyerarşk br yapı sergler. Bu tp hyerarşk br yapıya veya sınıflandırmaya sahp verlern analz çn son yıllarda çok sevyel modelleme kullanılmaya başlanmıştır (Yau ve Lee, 001; Lee ve Dğ., 006; Moghmbeg ve dğ., 009; Lochner, 003). Ver kümesndek boylamsal yapının varlığını dkkate alan çok sevyel modelleme le gözlemlenemeyen heterojenlk kaynağı dkkate alınmaktadır. Çalışmada kullanılan ZIP, ZINB ve k sevyel ZIP regresyon analznn Toblo 4 le verlen sonuçları değerlendrldğnde, k sevyel ZIP regresyon analzne at değerlern (log-olablrlk=-985., AIC=014.4 ve BIC=155.4) en küçük değerler olduğu tespt edlmştr. Dolayısıyla Yüzüncü Yıl Ünverstes Fen Blmler Ensttüsü Dergs/ Journal of The Insttute of Natural & Appled Scences 6

Sıfır Ağırlıklı Sayma le Elde Edlen Verler İçn Çok Sevyel ZIP Regresyon çalışmada kullanılan regresyon modellernden (ZIP, ZINB ve k sevyel Kaynak Agrest A., Booth J. G., Hobert J. P. and Caffo B., Random Effect Modellng of Categorcal Response Data, Socologcal Methodology, 30 (1), 7-80. 000 Akkol S., Çok sevyel genelleştrlmş doğrusal modellerde parametre tahmnlemesnde MQL, PQL ve MCMC yöntemlernn karşılaştırılması, Doktora Tez, Zraat Fakültes, YYU, 004. Böhnng D., Zero- Inflated Posson Models and C.A.MAN: A Tutoral Collecton of Evdence, Bometrcal Journal 40(7), 833-843, 1998. Böhnng D., Detz E., Schlattmann P., Mendonça L., Krchner U., The zeronflated Posson modeland decayed, mssng and flled teeth ndex n dental epdemyology, Jornal of Royal Statstcal Socety, seres A, 16, 1030-1039, 1999. Cheung Y. B. Zero-nflated models for regresson analyss of count data: a study of groth and development, Statstcs n Medcne, 1, 1461-1469. 00. Dagne A. G., Herarchcal Bayesan Analyss of Correlated Zero-nflated Count Data, Bometrcal Journal, 46(6), 653 663. 004. Ghosh S. K., Mukhopadhyay P., and Lu J. C., Bayesan Analyss of Zero-Inflated Regresson Models Journal of Statstcal Plannng and Inference, 136(4), 1360-1375, 006 Goldsten, H., 1995. Multlevel Statstcal Models, http://.google.com.tr/search?hl=tr& q=appled+multlevel+analyss+hox&b tng=ara&aq=f&aq=&aql=&oq=&gs_r fa= Hall D.B., Zero-nflated Posson and bnomal regresson th random effects: a case study, Bometrcs, 56, 1030-1039. 000. Hox J. Multlevel Modellng n Wndos; A Revev of MLN, Multlevel Modellng Nesletter, 10():-5, 1998. ZIP) en ysnn, k sevyel ZIP regresyon olduğu sonucuna varılmaktadır. Hur K., Hedeker D., Henderson W., Khur S., Daley, J., Modelng clustered count data th excess zeros n health care outcomes research, Health Serv. Outcomes Res Method, 3, 5-0. 00. Jansakul N. Fttng a zero-nflated Negatve Bnomal model va R, In Proceedngs 0th Internatonal Workshop on Statstcal Modellng, Sdney, Australa, 77-84, 005. Lambert D., Zero-nflated Posson regresson, th an applcaton to defects n manufacturng, Technometrcs, 34:1-14, 199 Lee A. H., Wang K., Yau KKW, Analyss of zero-nflated Posson data ncorporatng extend of exposure, Bometrcal Juornal, 43, 963-975, 001. Lee A.H., Wang K., Scott J.A., Yau K.K.W., McLachlan G.,J., Mult-level zeronflated Posson regresson modelng of correlated count data th excess zeros, Statstcal Methods n Medcal Research, 15, 47-61, 006. Lochner, K.A., Kaach, I., Brennan, R.T., Buka, S.L., Socal Captal and Neghborhood Mortalty Rates n Chcago, Socal Scence&Medcne, 56, 1797-1805, 003. McLachlan G J., On the EM algorthm for overdspersed count data, Statstcal Methosds n Medcal Research, 6, 76-98, 1997. Moghmbeg A., Eshraghan M. R., Mohammad K., McArdle B., Multlevel zero-nflated negatve bnomal regresson modelng for overdsperson count data th extra zeros, Journal of Appled Statstcs, 35(10), 1193-10, 008. Moghmbeg A., Eshraghan M. R., Mohammad K., McArdle B., A score test for zero-nflaton n multlevel count data, Computatonal Statstcs and Data Analyss, 53, 139-148, 009. Okut H., Duncan C. S., Duncan E. T., Groth Mxture Modelng of Zero- Inflated Count Data, JSM (Jont Statstcal Meetng), Mnneapols, 005. Clt/Volume: 18, Sayı/Issue1-:. 013 7

Akkol ve ark., Rdout M., Hnde J., Demétro C.G.B. A Score test for testng a zero-nflated Posson regresson model aganst zeronflated negatve bnomal alternatves, Bometrcs, 57, 19-3. 001. SAS, 007. SAS/STAT, Carry Inc. Relgh, NC. Sheu M., Hu T., Keler T. E., Ong M., Sung H. Y., The effect of a major cgarette prce change on smokng behavor n Calforna: a zero-nfated negatve bnomal model, Health Economcs, 13: 781 791, 004. Snger J.D., Usng SAS PROC MİXED to ft multlevel models, herarchcal models, and ndvdual groth models, Journal of Educatonal and Behavoral Statstcs, 4(4), 33-355, 1998. Stata 9. Data Analyss and Statstcs Softare. College Staton. Texas 77845. Vuong Q.H., Lkelhood rato test for model selecton and non-nested hypotheses, Econometrcs, 57(), 307-333, 1989. Wang K., Yau K. K. W., Lee A. H., A zeronflated Posson mxed model to analyze dagnoss related groups th majorty of same day hosptal stays, Comput. Methods Programs Bomed., 68, 195-03, 00. Yau K. K. W, Lee A. H. Zero-nflated Posson regresson th random effects to evaluate an occupatonal njury preventon programme, Satatstcs n Medcne, 0, 907-90. 001. Yau K. K. W., Wang K., Lee A. H. Zeronflated negatve bnomal mxed regresson modelng of over-dspersed count data th extra zeros, Bometrcal Journal, 45,437-45. 003. Yüzüncü Yıl Ünverstes Fen Blmler Ensttüsü Dergs/ Journal of The Insttute of Natural & Appled Scences 8