Afyo Kocatepe Üverstes Fe ve Mühedslk Blmler Dergs Afyo Kocatepe Uversty Joural of Scece ad Egeerg AKÜ FEMÜBİD 7 (27) 234 (5-55) AKU J. Sc.Eg.7 (27) 234 (5-55) DOI:.5578/fmbd.6774 Gamma ve Webull Dağılımları Arasıda Kullback-Lebler Uzaklığıa Dayalı Ayrım Hayrsa Demrc Bçer, Ceker Bçer Kırıkkale Üverstes Fe Edebyat Fakültes İstatstk Bölümü, Kırıkkale, TÜRKİYE e-posta: hdbcer@hotmal.com, cbcer@kku.edu.tr Gelş Tarh: 4..26 ; Kabul Tarh: 3.8.27 Aahtar kelmeler Kullback-Lebler uzaklığı; E çok olablrlk test; Gamma dağılımı; Webull dağılımı; Doğru seçm olasılığı. Özet Gamma ve Webull dağılımları sağlık, güvelrlk, mühedslk vb. ortak uygulama alalarıa sahp ola dağılımlardır. Çoğu zama bu k dağılım br ver set ç bezer souç çıkarımlar sağlasa da (çakışsa da), ver set e y modelleyecek ola dağılımı seçlmes arzulaır. Bu çalışmada, Gamma ya da Webull dağılımlarıda herhag brde gözledğ varsayıla br ver set ç k dağılım arasıda seçm problem çözümü ç Kullback-Lebler uzaklıkları ora (RMKLD) yötem kullaılmıştır. Ayrıca yapıla smülasyo çalışmaları le kullaıla yötem farklı öreklem büyüklükler ve dağılımları farklı parametre değerler ç e çok olablrlk ora test le karşılaştırılmıştır. Elde edle blgler, RMKLD Gamma ve Webull dağılımlarıı ayrımı ç kullaılableceğ göstermektedr. DscrmatoBetwee Gamma adwebull Dstrbuto Based o Kullback-LeblerDvergece Keywords Kullback-Lebler dvergece; Maxmum lkelhood Rato test; Gamma dstrbuto; Webull dstrbuto; Probablty of correct selecto Abstract Gamma ad Webull are dstrbutos havg commo applcato areas such as relablty, lfetme, egeerg, etc. Although, these two dstrbutos provde smlar fereces for a data set (overlappg). It s desrable to be selected the dstrbuto whch wll gve the best model the data set. I ths study, Rato of Kullback Lebler dvergeces method (RMKLD) has bee used for the soluto of dscrmato betwee gamma ad webull dstrbutos for ay data set take from gamma or webull dstrbutos. I addto, wth smulato studes, used method has bee comparsed wth maxmum lkelhood estmato method for dfferet sample szes ad parameter values. Iformato obtaed dcates RMKLD test ca be used for the dscrmato betwee the Gamma ad Webull dstrbutos. Afyo Kocatepe Üverstes. Grş Gamma ve Webull dağılımları poztf ve çarpık verler aalz ç sıkça kullaıla dağılımlardır. Çoğu zama bu dağılımlar mühedslk, sağlık, yaşam blmler, fe blmler gb alalarda gözlee br ver set modellemede brbr yere kullaılablmektedr. Aslıda, bu dağılım modeller makul öreklem büyüklükler ç br bre çok yakı verler çerrler. Her e kadar bu dağılımlar br brler yerlere kullaılablseler de, model seçme bağlı olarak özellkle kuyruk olasılıkları yalış model seçmde öeml düzeyde etklemektedr. Bu edele, ver set modellemes aşamasıda araştırmacı tarafıda doğru veya doğruya e yakı model seçm arzu edlr. İstatstkte verle br ver set muhtemel k olasılık dağılımıda hags le modelleeceğ belrlemes problem oldukça esk br problemdr. Lteratürde bu problem üstesde geleblmek ç yapılmış çok sayıda çalışma ve farklı yaklaşım vardır. Gamma ve Webull dağılımları arasıdak
Gamma ve Webull Dağılımları Arasıda Kullback-Lebler Uzaklığıa Dayalı Ayırım, D. Bçer ve Bçer ayrım problem Mohd Saat vd. (28) tarafıda e çok olablrlk ora test ve Voug test le celemştr. Cox (96,962), Atkso (969,97), ve Dyer (973) br ver set ble k dağılımda hagsde geldğ belrleme üzere çalışmalar yapmışlardır. Dumoceaux ve Atle (973) Log-ormal ve Webull dağılımlarıı ayırt etmek ç e çok olablrlk ora test ele alıp krtk değerler elde etmşlerdr. Ba ve Eglehardt (98) Webull ve Gamma dağılımları ç doğru seçm olasılıklarıı yaptıkları smülasyo çalışması le elde etmşlerdr. Gupta ve Kudu (23) çalışmalarıda, Webull ve geelleştrlmş Üstel dağılımları ele almışlar ve bu k dağlım arasıdak ayrım problem e çok olablrlk ora yöteme göre tartışmıştır. Bromdeh (22) Webull ve Log-Normal dağılımları arasıdak seçm problem Kullback-Lebler uzaklığıa göre celemştr. Bromdeh ve Valzadeh (23) br ver set muhtemel k dağılımda hags le modelleeceğ belrleeblmes ç mumumlaştırılmışkullback-lebbler uzaklıkları oraı (RMKLD) yötem öermş ve çalışmalarıda Gamma ve Log-Normal dağılımlarıı ayırt etme problem ele alıp smülasyo çalışmasıa dayalı doğru seçm olasılıklarıı elde etmşlerdr. Bu çalışmada, Gamma ve Webull dağılımları arasıda ayırt etme problem Bromdeh ve Valzadeh (23) tarafıda öerle RMKLD yötem göz öüde buludurularak celemştr. Çalışmaı kc bölümüde Kullback-Lebler uzaklığı ve RMKLD yötem kısaca açıklamıştır. Ayrıca Gamma ve Webull dağılımları arasıdak Kullback-Lebler uzaklıkları elde edlmştr. Çalışmaı üçücü bölümüde se RMKLD yötem performasıı lteratürde sıkça kullaıla e çok olablrlk oraı yöteme göre karşılaştırmak stelmştr Bu amaç doğrultusuda RMKLD ve e çok olablrlk oraı yötemler ç smülasyo çalışmasıa dayalı doğru seçm olasılıkları verlmştr. Çalışmaı so bölümüde se elde edle blgler tartışılmıştır. 2.Kullback-Lebler uzaklığı ve RMKLD Kullback- Lebler uzaklığı lk olarak Kullback ve Lebler (95) tarafıda taımlamıştır. İstatstkte Kulback-Lebler uzaklığı (Kullback- Lebler blg kazacı, görel etrop) br X rasgele değşke ç söz kousu olablecek f ve g gb k dağılım arasıdak uzaklığı smetrk olmaya br ölçüsüdür. fve g dağılımı arasıdak Kullback-Lebler uzaklığı DKL ( f g ) le gösterlmek üzere, f ( X ) f ( x) DKL ( f g) E f l f ( x)l dx g( X ) () g( x) şeklde taımlaır (Bromdeh ve Valdezah 23). Burada E f., f foksyoua göre beklee değer fade etmektedr. () eştlğ le verle taımda D ( f g) E l f ( X ) E l g( X ) KL f f olduğu kolayca görüleblr. Böylece Kullback-Lebler uzaklığı k beklee değer farkıdır. İk farklı dağılım ç geelde D ( f g) D ( g f ) (2) olduğuda Kulback- KL KL Lebler uzaklığı br metrk değldr. KL KL D f g D g f olablmes acak ve acak f=g olması le mümküdür. Gamma 6.5,.4 ve Webull 3, 3 dağılımlarıı olasılık yoğuluk foksyoları grafkler Şekl. de verlmştr. Şekl 2. de se, bu k dağılımı Kullback-Lebler uzaklıklarıı hesabıda kullaıla alalargörülmektedr. Söz kousu ola k dağılımı olasılık yoğuluk foksyolarıı brbre çok yakı olmasıa rağme Kullback-Lebler uzaklıklarıı br bre eşt olmadığı ya farklı olduğu Şekl. ve Şekl 2. de görülmektedr. 5
Gamma ve Webull Dağılımları Arasıda Kullback-Lebler Uzaklığıa Dayalı Ayırım, D. Bçer ve Bçer DKL f g RMKLD l DKL g f (4) öermştr. (4) eştlğ le verle test statstğ ç br karar kuralı se Bromdeh ve Valzadeh (23) tarafıda RMKLD se H hpotez reddedlemez. (5) RMKLD se H hpotez reddedllr. olarak verlmştr. 2.. Gamma ve Webull dağılımları ç Kullback- Lebler uzaklıkları Şekl. Gamma 6.5,.4 vewebull 3,/ 3 olasılık yoğuluk foksyoları Şekl 2. Gamma 6.5,.4 vewebull 3,/ 3 dağılımlarıa at dağılımları arasıdak Kullback-Lebler uzaklıklarıı vere alalar. Bromdeh ve Valzadeh (23) yaptıkları çalışma le br X rasgele değşke muhtemel f ve g dağılımlarıda hags le modellemes gerektğ belrleyeblmek ç H : X ~ f x,. H : X ~ g x,. (3) hpotez göz öüe almış ve (3) le verle hpotez test edeblecek; Kullback-Lebler uzaklığıa dayalı br test statstğ olarak Gamma dağılımıa sahp br X rasgele değşke olasılık yoğuluk foksyou, x fga x;, x e ; x (6) eştlğ le verlr. Burada dağılımı şekl parametres se dağılımı ölçek parametresdr. X, X2,, X Gamma dağılımıda alıa br öreklem olmak üzere Gamma dağılımıı olablrlk foksyou, ;,, ;, L x x f x GA GA x e x (7) dır. ˆ, ˆ sırasıyla Gamma dağılımıı blmeye ve parametreler eçok olablrlk tahm edcler göstermek üzere, lşk ˆ x ˆ (8) ˆ ve ˆ arasıdak dır. Webull dağılımıa sahp br X rasgele değşke olasılık yoğuluk foksyou x g x;, x e, x (9) eştlğ le verlr. Burada br şekl parametres se dağılımı blmeye ölçek parametresdr. Varsayalım k, X, X2,, X Webull dağılımıda rasgele br öreklem olsu. Bu durumda Webull dağılımıı olablrlk foksyou 52
Gamma ve Webull Dağılımları Arasıda Kullback-Lebler Uzaklığıa Dayalı Ayırım, D. Bçer ve Bçer, ;,, ;, L x x f x x e x () dır ve ve parametreler eçok olablrlk tahm edcler ˆ ve ˆ arasıdak lşk ˆ ˆ () ˆ X olarak elde edlr. (4) le verle RMKLD test ç gerekl ola Gamma dağılımıı Webull dağılımıa ola Kullback-Lebler uzaklığı x x fga DKL fga g fga xl dx g f x l f x dx fga xl g xdx (2) GA GA 2l l l olarak hesaplaır. Burada. gamma foksyouu fade etmektedr. Ayrıca d olup Dgamma foksyou d olarak blr (Berardo, 976). Bezer şeklde Webull dağılımıda Gamma dağılımıa ola Kullback-Lebler uzaklığı x x g DKL g fga g xl dx f GA g x l g x dx g xl fga xdx (3) l l l l olarak buluur. (2) ve (3) eştlklerde bulua blmeye parametreler yere (8) ve () eştlkler çözümüde elde edle eçok olablrlk tahmler kullaılırsa ; ˆ, ˆ ; ˆ, ˆ ; ˆ, ˆ ; ˆ, ˆ DKL f x g x RMKLD l DKL g x f x (4) bçmde elde edlr ve (3) le verle hpotez ç RMKLD se ver set dağılımı Gamma dır, aks halde Webull dağılır olarak karar verlr. 3. Bulgular Bu kısımda Bromdeh ve Valdezah (23) tarafıda öerle ve (4) le verle test statstğ Gamma ve Webull dağılımlarıı ayıt etme probleme uygulaması durumuda yötem performasıı, (3) le verle hpotez test edeblecek T L l L GA ˆ, ˆ ˆ, ˆ (5) bçmde taımlaa eçok olablrlk oraı yötem(guptavekudu, 23) le karşılaştırmalı olarak ortaya koymak ç yapıla smülasyo çalışmaları üzerde durulacaktır. Eştlk (5) de verle ˆ, ˆ sırasıyla Gamma dağılımıı ve parametreler e çok olablrlk tahmler, ˆ, ˆ Webull dağılımı sırasıyla ve parametrelere at eçok olablrlk tahmler, L ˆ, ˆ GA L ˆ, ˆ ve sırasıyla (7) ve () eştlklerde verle Gamma ve Webull dağılımlarıa at olablrlk foksyolarıı tahmdr. Smülasyo çalışmasıda k durum göz öüe alımıştır. İlk durumda ver set dağılımı Gamma (, ) olarak belrlemştr. Gamma (, ) dağılımıda.5,,5 ve.5,,5 parametre değerler ç =2, 4, 6, 8, ve 2 brmlk rasgele öreklemler üretlmştr. defa tekrar edle smülasyo çalışması le elde edle doğru seçm olasılıkları Tablo de verlmştr. Yötemler dağılım seçm performasları Tablo e göre celedğde parametres.5 olarak seçldğ durumlarda RMKLD yötem daha üstü br ayrım performasıa sahp olduğu aşkar 53
Gamma ve Webull Dağılımları Arasıda Kullback-Lebler Uzaklığıa Dayalı Ayırım, D. Bçer ve Bçer olarak görülmektedr. olduğu durumlarda se her k yötem performaslarıda cdd derecede düşüşler gözlemştr. parametres 5 alıdığı durumda se yötemler doğru seçm performaslarıı gözlem sayısı le doğru oratılı olarak arttığı ve her k yötemde eredeyse eşt performaslara sahp oldukları gözlemştr. Tablo. Ver Gamma dağılımıda geldğde Kullback- Lebler uzaklıkları oraıa göre (RMKLD) ve ayrıca e çok olablrlk ora yöteme göre (T) doğru seçm olasılıkları α β Metod 2 4 6 8 2.5.5 RMKLD.86.899.945.963.982.994 T.654.72.745.762.786.858 RMKLD.833.98.956.955.974.999 T.654.7.733.745.789.88 5 RMKLD.828.94.937.959.968.997 T.65.68.734.754.776.863.5 RMKLD.485.493.53.493.454.499 T.56.5.482.489.478.53 RMKLD.47.488.463.56.464.498 T.493.49.55.493.489.53 5 RMKLD.483.486.47.452.49.52 T.53.493.53.454.5.459 5.5 RMKLD.626.7.778.85.852.925 T.66.79.794.824.869.928 RMKLD.69.74.77.789.844.945 T.647.749.786.82.853.95 5 RMKLD.68.728.77.86.842.933 T.643.752.793.825.853.934 İkc durumda se ver set dağılımı Webull (, ) olarak belrlemştr. Webull (, ) dağılımıda.5,,5 ve.5,,5 parametre değerler ç =2, 4, 6, 8, ve 2 brmlk alıa rasgele öreklemler le defa tekrar edle smülasyo çalışması gerçekleştrlmştr. Ayırma yötemler ç le elde edle doğru seçm olasılıkları Tablo 2 de verlmştr. Tablo 2 celedğde, parametreler küçük değerler ve gözlem sayısıı düşük olduğu durumlar ç RMKLD yötem daha yüksek doğru seçm olasılıklarıa sahp olurke parametre değerler daha büyük ve gözlem sayısıı yeterce büyük olduğu durumlarda e çok olablrlk ora yötem ve RMKLD yötem yaklaşık doğru seçm olasılıklarıa sahp oldukları görülmektedr. Tablo 2. Ver Webull dağılımıda geldğde Kullback- Lebler uzaklıkları oraıa göre (RMKLD) ve e çok olablrlk ora yöteme göre (T) doğru seçm olasılıkları Metod 2 4 6 8 2 2 RMKLD.698.754.7736.824.842.976 T.6534.762.7422.7882.82.8968 4 RMKLD.7224.7958.839.8746.988.9684 T.75.86.8492.8888.9238.9788 6 RMKLD.7238.82.8654.8966.94.977 T.7274.8266.8882.962.9368.9894.5 2 RMKLD.6956.7454.7876.868.8468.972 T.656.752.7538.7852.872.8974 4 RMKLD.7222.7944.856.8772.9.9688 T.738.7968.8644.895.968.978 6 RMKLD.7268.8238.8642.8928.99.9784 T.734.8366.8862.976.948.9896 2 2 RMKLD.6856.7494.78.898.8488.974 T.6486.732.7474.779.824.8998 4 RMKLD.722.866.854.886.998.974 T.75.88.864.896.9248.9792 6 RMKLD.7282.834.857.897.952.98 T.7288.8244.8776.9228.937.994 4. Tartışma ve Souç Bu çalışmada Gamma ve Webull dağılımları arasıda seçm problem RMKLD yöteme göre ele alımıştır. RMKLD yötem ç gerekl ola Gamma (, ) ve Webull (, ) dağılımları arasıdak Kullback-Lebler uzaklıkları elde edlmştr. Farklı öreklem büyüklükler ve farklı parametre değerlere göre yapıla smülasyo çalışması souçlarıa göre ver set dağılımı Gamma olduğu durumlarda parametreler küçük değerler ç RMKLD yötem daha y souçlar vermektedr. Dğer parametre değerler ç RMKLD yötem ve e çok olablrlk ora yötem le bezer souçlar üretmştr. Dolayısıyla Gamma ve Webull dağılımlarıı ayrımıda RMKLD statstğ kullaılması uygu görümektedr. Kayaklar Atkso, A. (969). A test of dscrmatg betwee models, Bometrka 56, 337-34. 54
Gamma ve Webull Dağılımları Arasıda Kullback-Lebler Uzaklığıa Dayalı Ayırım, D. Bçer ve Bçer Atkso, A. (97). A method for dscrmatg betwee models (wth dscussos), Joural of the Royal Statstcal Socety. Ser. B. 32, 323-353. Ba, L. J. ad Eglehardt, M. (98). Probablty of correct selecto of Webull versus gamma based o lkelhood rato, Commucatos Statstcs Seres A 9, 375-38. Mohd Saat, N. Z., Jema, A. A., & Al-Mashoor, S. H. (28). A Comparso of Webull ad Gamma Dstrbutos Applcato of Sleep Spea. Asa Joural of Mathematcs ad Statstcs, (3), 32-38. Berardo, J. M. (976). Algorthm As 3: Ps (Dgamma) fucto, Joural of the Royal Statstcal Socety Seres C 25, 35-37. Bromdeh, A. A. (22). Dscrmatg Betwee Webull ad Log-Normal Dstrbutos Based o Kullback- Lebler Dvergece. Ekoometr ve Istatstk Dergs, (6), 44. Bromdeh, A. A., ad Valzadeh, R. (23). Dscrmato betwee Gamma ad Log-Normal Dstrbutos by Rato of Mmzed Kullback-Lebler Dvergece. Paksta Joural of Statstcs ad Operato Research, 9(4). Cox, D. R. (96). Tests of separate famles of hypotheses, Proceedgs of the Fourth Berkeley Symposum Mathematcal Statstcs ad Probablty, Berkeley, Uversty of Calfora Pres, 5-23. Cox, D. R. (962). Further results o tests of separate famles of hypotheses, Joural of the Royal Statstcal Socety Ser. B 24, 46-424. Dumoceaux, R. ad Atle, C. E. (973). Dscrmatg betwee the log-ormal ad Webull dstrbuto, Techometrcs 5, 923-926. Dyer, A. R. (973). Dscrmato procedure for separate famles of hypotheses, Joural of the Amerca Statstcal Assocato 68, 97-974. Gupta, R. D. ad Kudu, D. K. (23). Dscrmatg betwee Webull ad Geeralzed expoetal dstrbutos, Computatoal Statstcs ad Data Aalyss 43, 79-96. Kullback, S., ad Lebler, R. A. (95). O formato ad suffcecy. The aals of mathematcal statstcs, 22(), 79-86. 55