Markov Zinciri Monte Carlo Yaklaşımı ve Aktüeryal Uygulamaları ŞİRZAT ÇETİNKAYA Aktüer Sistem Araştırma Geliştirme Bölümü AKTÜERLER DERNEĞİ 2.0.20080 2008 - İSTANBUL
Sunum Planı. Giriş 2. Bayesci Metodun Temelleri 3. Markov Zinciri Monte Carlo (MZMC) Yaklaşımı 3. Monte Carlo İntegrallemesi ve Markov Zinciri 3.2 Gibbs Örneklemesi 4. MZMC Yönteminin Aktüeryal Uygulamaları 4. Hasar Sıklığı İçin Hiyerarşik Poisson Modeli 4.2 Hasar Büyüklüğü Dağılımının Modellenmesi 4.3 Gruplandırılmış Hasar Büyüklüğü Dağılımının Modellenmesi 2.0.2008 2
. Giriş Markov Zinciri Monte Carlo (MZMC) yaklaşımı markov zinciri kullanarak Monte Carlo integrasyonunun yapıldığı bir yöntemdir. Çoğu zamanuygulamacılar ya da bayes yaklaşımı ile problemleri çözmeye çalışan kişiler yüksek boyutlu olasılık dağılımlarının model parameterelerini bulmak ya da tahmin yapmak için integrallemek isterler. Monte Carlo integrasyonunda dağılımdan örneklemler çekilir ve daha sonra bu örneklemlerin ortalamaları beklenen değerin yaklaşık değerini bulmak için kullanılır. MZMC yönteminde bu çekilişler markov zinciri sistematiğine uygun olarak çekilir. Zincirleri oluşturmanın değişik yolları vardır Gibbs (Geman and Geman, 984), Metropolis et al. (953) ve Hastings (970). 2.0.2008 3
2. Bayesci Metodun Temelleri Önsel dağılım, π( θ ), belirsiz θ parametrisi -bu parametre yeni veriye ait olasılık dağılımı ile birleştirilerek ş sonsal dağılımı ğ elde etmek için kullanılır - hakkında bilgileri gösterir. Model dağılımı, belirlenen parametrelere göre toplanan verilere ilişkin olasılık dağılımıdır. Olasılık yoğunluk fonksiyonu, f X Θ (x θ ) ile gösterilip, bazen olabilirlik fonksiyonu olarakta isimlendirilebilinir. x ( x,x,...,x ) T = 2 n, birbirlerinden bağımsız ve aynı dağılımlı iseler; f (x θ ) = f (x θ )... f (x θ ) X Θ X Θ X Θ n 2.0.2008 4
2. Bayesci Metodun Temelleri Birleşik dağılım, f (x, θ ) = f (x θ ) π( θ ) X, Θ X Θ olasılık yoğunluk fonksiyonuna sahiptir. x in marjinal dağılımı; ğ f X(x) = f X θ (x θ ) π( θ )dθ olasılık yoğunluk ğ fonksiyonuna sahiptir. Sonsal dağılım gözlenen değerler verildiğinde gözlenen değerlerin parametreleri üzerine koşullu olasılık dağılımıdır ve π ( Θ X θ x) ile gösterilir. Öngörü dağılımı x verildiğinde yeni gözlem ynin y nin koşullu olasılık dağılımıdır ve f Y X ( y x) ile gösterilir. 2.0.2008 5
2. Bayesci Metodun Temelleri π Θ X ( θ x) = f (x θ ) π( θ ) X Θ f (x θ ) π( θ )dθ X Θ 2.0.2008 6
2. Bayesci Metodun Temelleri D gözlenen veriler, teta model parametreleridir. P( D, θ ) = P( D θ )P( θ ) D gözlemi elde edildiğinde, Bayes teoremi D koşulu altında θ nın dağılımını bulmada kullanılabilir. P( θ )P( D θ ) P( θ D ) = P( θ )P( D θ )dθ Sonsal dağılıma ilişkin momentler, yüzdelikler vs. θ nın fonksiyonunun beklenen değerleri bulunabilir. f( θ ) fonksiyonunun sonsal beklenen değeri, E[ f( θ ) D] = f ( θ )P( θ )P(D θ )dθ P( θ )P( D θ )d θ 2.0.2008 7
3. Markov Zinciri Monte Carlo Yaklaşımı 3MonteCarloİntegrallemesi 3. ve Markov Zinciri Monte Carlo integrallemesinde, E[ f (X)] beklenen değerine π (.) dağılımından çekilen rasgele { X t,t =,...,n } değerleri çekilerek, n E[ f (X)] f (X t ) ile yaklaşılır. n t = n f f(x t ) n m t = m + Markov Zinciri; 2.0.2008 8
3. Markov Zinciri Monte Carlo Yaklaşımı 32Gibbs 3.2 Örneklemesi Algoritmanın adımları aşağıdaki gibidir: (0) θ ın verilmesi durumunda,. Çekiliş: θ ~ q( θ θ,..., θ ) 2. Çekiliş:... r. Çekiliş: ( ) (0 ) (0 ) 2 r θ ~ q( θ θ, θ,..., θ ) () () (0) (0) 2 2 3 r θ ~q( θ θ, θ,..., θ ) () () () () r r 2 r Ardından q( X θ ) dan X değeri çekilir. (Geman ve Geman (984)) 2.0.2008 9
The BUGS (Bayesian inference Using Gibbs Sampling) http://www.mrc-bsu.cam.ac.uk/bugs/ cam ac uk/bugs/ 2.0.2008 0
4Hasar 4. Sıklığı İçin Hiyerarşik Poisson Modeli Tablo : Poliçe ve hasar sayıları Grup Grup 2 Grup 3 YIL Poliçe Sayısı Hasar Sayısı Poliçe Sayısı Hasar Sayısı Poliçe Sayısı Hasar Sayısı 285 9 265 6?? 2 325 7 270 5 40 8 3 270 6 240 3 5 4 4 345 3 265 8 0 5 5?? 295? 25? (Scollnik (2000)) 2.0.2008
4Hasar 4. Sıklığı İçin Hiyerarşik Poisson Modeli X ij, hasar sayısını, X ij ~Pois( ij ) P ij ise kesilen poliçe sayısını göstersin, i =,2,3, j =,...,5. λ = P θ olsun. λ ve ij ij i θi ~ Gamma( αβ, ) α ~Gamma(5,5) β ~ Gamma( 25,) P ij ~Gamma(a,b i i ) a i ~Uniform( 0,00 ) b ~ Uniform(0,00 ) i 2.0.2008 2
4Hasar 4. Sıklığı İçin Hiyerarşik Poisson Modeli X, αθ,, β değişkenlerinin bileşik dağılımı, 4 4 4 3 f(x P θ ) f(x P θ ) f(x P θ ) f( θ α, β )f( α )f( β ) j j 2j 2j 2 3j 3j 3 j j= j= j= 2 j= Veri gözlendikten sonra sonsal dağılım, f ( θ, αβ, X ) göre f ( θ, αβ, X ) f( θαβ,,,x ) olarak yazılabilir. Yukarıda verilenlere göre örnek sonsal dağılım,, hesaplanabilir. Bayes teoremine 4 f ( θ α, β,x, θ, θ ) f(x j P jθ )f( θ α, β ) 2 3 j j j= 4 4 ~ Gamma( α + X, β + P ) j j = j = j 2.0.2008 3
4Hasar 4. Sıklığı İçin Hiyerarşik Poisson Modeli 3 f ( α β,x, θ ) f ( α )f ( θ α, β ) i= 3 f( β α,x, θ ) f( β )f( θi α, β ) i= i = f( θ X ) = f( θ X, αβ, )f( αβ, X)d βd α i αβ i n = n m (t) (t) f( θ i X, α, β ), i,2,3 t= m+ f(x X ) = f(x P θ )f( θ X )dθ i5 i5 i5 i i i θ i n (t) f (X i5 P i5θi ), i=,2,3 n m t= m + 2.0.2008 4
4Hasar 4. Sıklığı İçin Hiyerarşik Poisson Modeli Mean SD MC error 2.5% Median 97.5% Start Sample x[,5] 8.92 3.638 0.03265 3.0 9.0 7.0 0000 x[2,5] 6.378 2.856 0.02899 2.0 6.0 3.0 0000 x[3,] 5.676 2.878 0.02843.0 5.0 2.0 0000 x[3,5] 5.844 2.774 0.02898.0 6.0 2.0 0000 2.0.2008 5
4.2 Hasar Büyüklüğü Dağılımının Modellenmesi 2.0.2008 6
4.2 Hasar Büyüklüğü Dağılımının Modellenmesi. Rasgele, başlangıç değerleri seçilir, 2. i=0; 3. 500 iterasyon sonunda;, 2.0.2008 7
4.2 Hasar Büyüklüğü Dağılımının Modellenmesi 2.0.2008 8
4.2 Hasar Büyüklüğü Dağılımının Modellenmesi Marjinal dağılım-xğ Marjinal dağılım-tetağ 2.0.2008 9
4.3 Gruplandırılmış Hasar Büyüklüğü Dağılımının Modellenmesi X, hasar büyüklüğü, gruplandırılmış, Gruplar: (0,000], (000,2000], (2000,3000], (3000, ], Gruplara ilişkin sıklıklar: 2, 8, 3 ve 2 dir., Lambda=5000 2.0.2008 20
4.3 Gruplandırılmış Hasar Büyüklüğü Dağılımının Modellenmesi 2.0.2008 2
4.3 Gruplandırılmış Hasar Büyüklüğü Dağılımının Modellenmesi 0. iterasyondaki değeri alınmak üzere 000 farklı değeri Örneklem Ortalaması:4,5097 2.0.2008 22
Bazı Kaynaklar Gilks, W. R., Richardson, S., Spiegelhalter, lt D., 996, Markov Chain Monte Carlo In Practice, Chapman&Hall. Klugman, S., Panjer, H. H., Willmot G.E., 2004, Loss Models: From Data to Decisions, John Wiley & Sons, New York. Scollnik D.P.M., 2000, Actuarial Modeling with MCMC and BUGS: Additional Worked Examples, Actuarial Research Clearing House, 2000.2, 433-585. Scollnik, D.P.M., 200, Actuarial Modeling with MCMC and BUGS, North American Actuarial Journal, 5 (2), 96-24. 2.0.2008 23