ENÇOK OLABİLİRLİĞİN MONTE-CARLO SİMÜLASYONLARIYLA BİRLİKTE KULLANILMASIYLA GÜRÜLTÜLÜ VERİLERDEN SİNÜZOİTLERİN PARAMETRELERİNİN KESTİRİMİ

Benzer belgeler
altında ilerde ele alınacaktır.

Matris Cebiriyle Çoklu Regresyon Modeli

BÖLÜM 6 MERKEZDEN DAĞILMA ÖLÇÜLERİ

Hatalar Bilgisi ve İstatistik Ders Kodu: Kredi: 3 / ECTS: 5

İÇİNDEKİLER ÖN SÖZ...

İSTATİSTİKSEL DARALTICI (SHRINKAGE) MODEL VE UYGULAMALARI * A Statistical Shrinkage Model And Its Applications*

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Ders 9: Kitle Ortalaması ve Varyansı için Tahmin

Appendix C: İstatistiksel Çıkarsama

AST416 Astronomide Sayısal Çözümleme - II. 6. Monte Carlo

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

ARALIK TAHMİNİ (INTERVAL ESTIMATION):

QUANTILE REGRESYON * Quantile Regression

İçindekiler. Ön Söz... xiii

Fonksiyon Minimizasyonunda Simulated Annealing Yöntemi

BÖLÜM 12 STUDENT T DAĞILIMI

MAK 210 SAYISAL ANALİZ

Rastgele Süreçler. Rastgele süreç konsepti (Ensemble) Örnek Fonksiyonlar. deney. Zaman (sürekli veya kesikli) Ensemble.

Fonksiyon Optimizasyonunda Genetik Algoritmalar

Tesadüfi Değişken. w ( )

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

ortalama ve ˆ ˆ, j 0,1,..., k

SİMÜLASYON ÇEŞİTLERİ HAZIRLAYAN: ÖZLEM AYDIN

Örnek 4.1: Tablo 2 de verilen ham verilerin aritmetik ortalamasını hesaplayınız.

ÖRNEKLEME DAĞILIŞLARI VE TAHMİNLEYİCİLERİN ÖZELLİKLERİ

Genetik Algoritmalar. Bölüm 1. Optimizasyon. Yrd. Doç. Dr. Adem Tuncer E-posta:

TEMEL İSTATİSTİKİ KAVRAMLAR YRD. DOÇ. DR. İBRAHİM ÇÜTCÜ

RASGELE SÜREÇLER İ.Ü. ELEKTRİK ELEKTRONİK MÜHENDİSLİĞİ İLETİŞİM LABORATUVARI ARALIK, 2007

ĐST 474 Bayesci Đstatistik

2. REGRESYON ANALİZİNİN TEMEL KAVRAMLARI Tanım

SÜREKLİ OLASILIK DAĞILIŞLARI

İŞARET ve SİSTEMLER (SIGNALS and SYSTEMS) Dr. Akif AKGÜL oda no: 303 (T4 / EEM)

RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI. Yrd. Doç. Dr. Emre ATILGAN

Kazanımlar. Z puanları yerine T istatistiğini ne. zaman kullanacağını bilmek. t istatistiği ile hipotez test etmek

SIMÜLASYON DERS SORUMLUSU: DOÇ. DR. SAADETTIN ERHAN KESEN. Ders No:5 Rassal Değişken Üretimi

İstatistik ve Olasılık

Bir Normal Dağılım Ortalaması İçin Testler

2018 YILI BİRİNCİ SEVİYE AKTÜERLİK SINAVLARI İSTATİSTİK VE OLASILIK 29 NİSAN 2018

GENELLEŞTİRİLMİŞ KÜME ALGORİTMALARI Genelleştirilmiş küme günümüzde son derece popüler olan ve pek çok alanda uygulanabilir algoritmalar için

YANLILIK. Yanlılık örneklem istatistiği değerlerinin evren parametre değerinden herhangi bir sistematik sapması olarak tanımlanır.

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

Stokastik Süreçler. Bir stokastik süreç ya da rastgele süreç şöyle tanımlanabilir.

ERCİYES ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ SİVİL HAVACILIK ANABİLİM DALI YENİ DERS ÖNERİSİ/ DERS GÜNCELLEME

2. BASİT DOĞRUSAL REGRESYON 12

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

Jeodezide Yaklaşım Yöntemleri: Enterpolasyon ve Kollokasyon

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

KABLOSUZ İLETİŞİM

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Yapı Sistemlerinin Hesabı İçin. Matris Metotları. Prof.Dr. Engin ORAKDÖĞEN Doç.Dr. Ercan YÜKSEL Bahar Yarıyılı

OPTİMİZASYON TEKNİKLERİ. Kısıtsız Optimizasyon

Markov Zinciri Monte Carlo Yaklaşımı. Aktüeryal Uygulamaları

Matematik Ders Notları. Doç. Dr. Murat Donduran

İSTATİSTİK MHN3120 Malzeme Mühendisliği

OLASILIK ve KURAMSAL DAĞILIMLAR

MATEMATİK ÖĞRETMENLİK ALAN BİLGİSİ - DENEME SINAVI DENEME. Diğer sayfaya geçiniz.

Yapılan alan araştırması sonucunda aşağıdaki sonuçlar elde edilmiştir. ( ) ( ) ( ) ( )

İstatistiksel Yorumlama

Bekleme Hattı Teorisi

TANIMLAYICI İSTATİSTİKLER

ANADOLU ÜNİVERSİTESİ. ENM 317 Prof. Dr. Nihal ERGİNEL

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

EŞİTLİK KISITLI TÜREVLİ YÖNTEMLER

EME 3117 SİSTEM SIMÜLASYONU. Girdi Analizi. Özet İstatistikler ve Histogram (Minitab)(1) Örnek: Eczane İçin Servis Süreleri

İSTATİSTİKSEL TAHMİNLEME. Örneklem istatistiklerinden hareketle ana kütle parametreleri hakkında genelleme yapmaya istatistiksel tahminleme denir.

RÜZGAR ENERJİSİ KAYNAĞI VE BELİRSİZLİK

Ders 8: Verilerin Düzenlenmesi ve Analizi

rasgele değişkeninin olasılık yoğunluk fonksiyonu,

Rastgele Değişkenlerin Dağılımları. Mühendislikte İstatistik Yöntemler

RASTGELE SAYI ÜRETİMİ VE UYGULANAN TESTLER HAZIRLAYAN: ÖZLEM AYDIN

RİSK ANALİZİ VE AKTÜERYAL MODELLEME

IE 303T Sistem Benzetimi

YÖNEYLEM ARAŞTIRMASI - III

MAK 308 MAKİNA DİNAMİĞİ Bahar Dr. Nurdan Bilgin

Sağlık Kuruluşlarında Maliyet Yönetimi ve Güncel

Kinematik Modeller. Kesikli Hale Getirilmiş Sürekli Zaman Kinematik Modeller: Rastgele giriş yok ise hareketi zamanın bir polinomu karakterize eder.

ORTALAMA ÖLÇÜLERİ. Ünite 6. Öğr. Gör. Ali Onur CERRAH

Çoklu Bağlanım Çıkarsama Sorunu

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

Veriye Dayalı Karar Verme (Bölüm 2) Can Akkan

MONTE CARLO BENZETİMİ

BÖLÜM 13 HİPOTEZ TESTİ

İstatistik ve Olasılık

EME Sistem Simülasyonu. Giriş. Olasılık Dağılımı. Rassal Degiskenler

Elemanter fonksiyonlarla yaklaşım ve hata

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.

Ders 4: Rastgele Değişkenler ve Dağılımları

13. Olasılık Dağılımlar

Lineer Denklem Sistemleri Kısa Bilgiler ve Alıştırmalar

AKDENİZ ÜNİVERSİTESİ. Anten Parametrelerinin Temelleri. Samet YALÇIN

1-2 - * Bu Ders Notları tam olarak emin olmamakla birlikte yıllarına aiitir.tekrardan Sn.Hakan Paçal'a çoook tsk ederiz...

Kuyruk Teorisi Ders Notları: Bazı Kuyruk Modelleri

SÜREKLĠ OLASILIK DAĞILIMLARI

8.Konu Vektör uzayları, Alt Uzaylar

TERMODİNAMİĞİN BİRİNCİ YASASI

5. Elektriksel Büyüklüklerin Ölçülebilen Değerleri

İÇİNDEKİLER ÖNSÖZ Bölüm 1 KÜMELER Bölüm 2 SAYILAR

Parametrik Olmayan İstatistik. Prof. Dr. Cenk ÖZLER

Transkript:

Fen Bilimleri Enstitüsü Dergisi, 0 (008) 13-4 Marmara Üniversitesi ENÇOK OLABİLİRLİĞİN MONTE-CARLO SİMÜLASYONLARIYLA BİRLİKTE KULLANILMASIYLA GÜRÜLTÜLÜ VERİLERDEN SİNÜZOİTLERİN PARAMETRELERİNİN KESTİRİMİ DURSUN ÜSTÜNDAĞ * ve MEHMET CEVRİ Marmara Üniversitesi, Fen Edebiyat Fakültesi, Matematik Bölümü 347 Kadıköy, İstanbul, Türkiye. Alındığı Tarih: 1 Kasım 007 Kabul Tarihi: 13 Ekim 008 Özet. Bu makalede gürültülü verilerden sinyallerin parametrelerinin kestirimini düşünüyoruz. Bu amaç için, Monte-Carlo simülasyonları ile birlikte en çok olabilirlik prensibinin kullanımına dayanan etkili bir yöntemin uygulandığı bir Mathematica programı yazıldı ve Gauss dağılımlı gürültülerle bozulmuş sinüzoitlerin parametrelerinin kestirimi için kullanıldı. Anahtar Kelimeler: En Çok Olabilirlik, Monte-Carlo Simülasyonları, Parametre Kestirimleri, İstatiksel Çıkarım, Sahte sertleştirme. * E-posta: dustundag@marmara.edu.tr ve Faks: +90 (16) 347 8783

D. ÜSTÜNDAĞ ve M. CEVRİ ESTIMATING PARAMETERS OF SINUSOIDS FROM NOISY DATA USING MAXIMUM LIKELIHOOD TOGETHER WITH MONTE-CARLO SIMULATIONS Summary. We consider here estimating parameters of signals from noisy data. For this purpose, a Mathematica program, in which an effective method based on the principle of maximum likelihood together with Monte-Carlo simulations is incorporated, was written and used for estimating the parameters of sinusoids corrupted by the Gaussian random noise. Keywords: Maximum Likelihood, Monte-Carlo Simulations, Parameter Estimations, Statistical Inference, Simulated Annealing. GİRİŞ Veri biriktirmedeki esas gaye, fiziksel sistemle ilgili anlamlı bilgileri kazanmaktır. Ama birçok durumda istediğimiz nicelikler ölçtüklerimizden farklıdır. Eğer ölçtüğümüz veri, ölçmek istediğimiz niceliklere bağlıysa onlar hakkında az da olsa bilgi içerir. Bundan dolayı verilerden bu bilgiyi çıkarma bu makalede düşünülen problemdir. p vektörü, modellendirilen fiziksel sisteme ait parametreleri ve d vektörü de bu fiziksel sistemin çıktılarından oluşan verileri temsil etsin. Genel olarak fiziksel sistem, p parametre ve dt () sistem çıktıları arasında d ( t) = f ( t, p ) (1) doğrusal olmayan bir f fonksiyonu ile tanımlanır. Burada t zamanı temsil eder. Birçok denemelerde d i kesikli veri kümesi, { t1, t,..., tn} kesikli zamanlarda bir f ( t, p ) model fonksiyonundan örneklenir ve aynı zamanda rastlantısal gürültü içerir. Böylece model denklemin temel formu, genel olarak d = f( t, p ) + e( t ) ( i = 1,,3,..., N) () i i i formülü ile tanımlanır. Burada et ( i ) rastlantısal gürültüyü temsil eder. f (, t p ) 14

VERİLERDEN SİNÜZOİTLERİN PARAMETRELERİNİN KESTİRİMİ model fonksiyonunun farklı seçimi, farklı modellere karşılık gelir. Bretthorst [1] a göre en genel model, M ft (, p) = AjG j(,{ t ω}) (3) j = 1 formundadır. Burada (,{ ω}) G model fonksiyonu, { } j t ω parametrelerin ve t nin bir fonksiyonudur. Bu parametreler, frekansları, faz değişimlerini, bozulma oranlarını, sönme oranlarını veya herhangi bir fiziksel niteliği temsil ederler. j. modele karşı gelen genlikler A j ile gösterilir. Böylece p parametre vektörü, frekansların ve genliklerin bir { ω j, A j} ( j = 1,, 3,..., M) listesidir. Bu makalede amaç, d gözlemlerinden p parametrelerinin bir kümesinin istatistiksel çıkarımını yapmaktır. Bu problem, bilimin birçok alanlarında yaygındır [-4]. Bir çok sayısal yöntem bu probleme uygulanmıştır ve onların kapsamlı tarihi Bretthorst [1] ve diğer araştırmacılar [,3,6,10] tarafında verilmiştir. Bu makalede, ilk defa R.A. Fisher [7] tarafından geliştirilen en çok olabilirlik prensibini kullanarak gürültülü verilerden sadece model parametrelerinin kestirimini düşünüyoruz. Parametre değerlerindeki belirsizliklerin bir gösterimini elde etmek için Monte- Carlo simülasyonları ile en çok olabilirlik prensibi birleştirildi. Böylece, her bir parametrenin kestiriminin doğruluğu elde edildi. EN ÇOK OLABİLİRLİK YÖNTEMİ Varsayalım her bir veri noktasının ölçülen hata değeri, e = d f( t, p ) ( i = 1,,3,..., N) (4) i i i olsun. Giriş verilerinin bileşik olasılığı, N P( dp ) = P( ei ) (5) i= 1 15

D. ÜSTÜNDAĞ ve M. CEVRİ her bir gürültünün ayrı ayrı olasılıklarının çarpımına eşittir. Olabilirlik fonksiyonu, 1 1 T 1 P( d p) = exp( ( d f( t, p)) Γ ( d f( t, p ))) (6) N / ( π) det Γ şeklinde yazılır [1]. Burada gürültünün sıfır ortalamalı ve Γ kovaryans matrisli olduğu varsayılır. Eğer gürültü örneklemleri birbirinden bağımsızsa, Γ nin köşegen elemanları sıfır olmayan varyanslardan oluşur. Eğer bütün varyanslar σ ye eşitse, log-olabilirlik fonksiyonunun genel gösterimi, 1 T LogP [ ( dp)] = ( d ft (, p)) ( d ft (, p )) + sabit (7) σ elde edilir. Burada ftp (, ), bağımsız t değişkenine ve veri kümelerinden belirlemek için araştırdığımız sistemin özelliklerini temsil eden K elemanlı parametre kümesi p = { pj, j = 1,,3,..., K} ye bağlı model fonksiyonunu temsil eder. Şimdi, verilerimizin bu tip denemeler için en çok olabilecek sonuca yakın olacağını varsaymak mantıklıdır. En çok olabilirlik prensibi, veri kümelerimiz için Denklem (7) de verilen log-olabilirlik fonksiyonunu maksimize eden model parametrelerinin en iyi kestirimini ifade eder. Böylece, olabilirlik fonksiyonlarını maksimize eden parametreler için, Log[ P( dp)] = 0, ( j = 1,, 3,..., K) (8) pj denklem sistemini çözmemiz gerekir. Bu sonuçlar p = { p1, p,..., p K } ile gösterilir ve model parametrelerinin en çok olabilirlik kestiricisini [6,7,8,9,10] tanımlar. Bu oldukça genel formüldür. P( dp), örneklem olasılık yoğunluğun değişik türleri için de kullanılır ve Gauss dağılımlı olduğu varsayıldığı zaman, en yaygın durumda, Log[ P( dp) yi ] maksimize etmek, χ ( p ) yi minimize etmeye denk olur: 16

VERİLERDEN SİNÜZOİTLERİN PARAMETRELERİNİN KESTİRİMİ T ( ft (, )) ( ft (, )) χ (; pd ) = d p d p. (9) σ Burada χ ( p ), gözlemlerle model arasındaki farkın karelerinin toplamıyla ağırlıklandırılır. Takip eden bölümde, bu uygunsuzluk fonksiyonunun nasıl minimize edileceğini veya buna denk olarak olabilirlik fonksiyonunun nasıl maksimize edileceğini araştıracağız. SAYISAL YÖNTEM VE ÖRNEK Harmonik sinüzoidal sinyalleri düşünelim: M j1 ωj j ωj (10) j= 1 ft () = a cos( t) + a sin( t) Burada sinyallerin sayısı M nın bilindiği varsayılıyor. Gerçekte, model fonksiyonlarının kaç tane parametre içerdiğini ve veriler için en uygun olan modeli bilemeyiz. Diğer taraftan kestirmek istediğimiz bilinmeyen parametreler vektörü, {{ ω1, a11, a1},...,{ ω M, am1, am}} olarak düşünülür. Bu K parametreler toplu olarak, p R ( K = 3 M) vektörü ile ifade edilsin. Veri vektörü d R N nin elemanları, M d = a cos( ω t ) + a sin( ω t ) + e( t ), ( i = 1,,3..., N) (11) i j1 j i j j i i j= 1 veya buna denk olarak d = G({ ω}, t ) a + e( t ), ( i = 1,, 3,..., N) (1) i i i ile verilir. Burada a doğrusal parametreleri ve G ise (N M) boyutlu doğrusal olmayan { ω} parametrelerine bağlı bir matrisi gösterir. Böylece, Denklem (9) daki uygunsuzluk fonksiyonu, 17

D. ÜSTÜNDAĞ ve M. CEVRİ ( ({ ω}, t) ) ( ({ ω}, t) ) χ ({ ω}, ad ; ) = d G a d G a (13) σ olur. χ ({ ω}, ad ; ) nin a doğrusal parametresine göre türevi hesaplanabilir ve sıfıra eşitlenir. Bu aynı zamanda a için, d=ga (14) veya T -1 T a=(gg) ˆ G d (15) denklemlerine götürür. Doğrusal olmayan ω parametrelerinin temel bir seçimi için â doğrusal parametreleri hesaplandığı zaman χ ({ ω}, ad ˆ; ), T T T -1 T d d - d G(G G) G d χ ( ω) = (16) σ sadece doğrusal olmayan ω parametrelerinin bir fonksiyonu olur. Bu form, optimizasyon için daha uygundur. En çok olabilirlik kestirimlerini bulmak için, öncelikle kısıtlanan global optimumu bulmada birçok algoritma içeren ve Mathematica'da oluşturulmuş olan NMinimize denklem çözücüye başlangıç değerleri verilir. NMinimize fonksiyonu, türevlenemeyen veya sürekli olmayan ve yerel optimuma kolaylıkla takılmayan fonksiyonlarla uğraşmak için oldukça esnek bazı metotlar içerir. Bunlardan basit stokastik fonksiyon minimize edici olan "sahte sertleştirme" (simulated annealing) yöntemini seçtik. Bu yöntem, metal bir nesnenin yüksek sıcaklıkta ısıtıldığı ve ardından yavaşça soğutulduğu fiziksel sertleştirme işlemine benzer. İşlemde, daha düşük bir enerji durumunda metalin atomik yapısı göz önüne alınır. Böylece daha dayanıklı bir metal elde edilir. Optimizasyon terminolojisinde, sertleştirme yerel bir minimumdan kaçmaya ve daha iyi global minimuma bulmaya imkân sağlar. Başlangıçta, "NMinimize" fonksiyonu, ω parametreleri için rastlantısal başlangıç değerlerini seçer ve her adımda geçerli ω noktasının komşuluğunda yeni bir ω yeni noktasını üretir. O ana kadar bulunan en iyi nokta, ω en iyi olarak T 18

belirlenir. Eğer VERİLERDEN SİNÜZOİTLERİN PARAMETRELERİNİN KESTİRİMİ yeni χ ( ω ) χ ( ω ) ise ω yeni, ω en iyi ve ω ile yer 0 bi (, Δχ, χ ) en iyi değiştirir. Yoksa ω yeni, e Boltzmann üssü olarak tanımlanan bir fonksiyondur. fonksiyonunun değişimini; olasılıkla ω ile yer değiştirir. Burada b, Δ χ, i. adımda, amaç χ 0, önceki adımda amaç fonksiyonun değerini ve b ise, önceden varsayılan Δ χ log( i + 1) / 10 fonksiyonunu temsil eder. Her bir başlangıç noktası için adımlar maksimum sayıya ulaşana kadar tekrarlanır. Böylece metot, χ (ˆ) ω yi global minimum yapan bir ˆω noktasına yakınsatır veya art arda yapılan adım sayısı için aynı noktada kalır. ω nın kestirim değeri elde edildiğinde Denklem (15) den a doğrusal parametreleri tekrar hesaplanır. Bütün bunları yapmak için, sinüzoitlerin açısal frekanslarını, sonrasında ise genliklerini kestirme problemine bu işlemin nasıl uygulandığını gerçekleştiren Mathematica kodu yazıldı. Bu kodun performansını test etmek için, ft ( ) = cos(0.3 t) + sin(0.3) + 3 cos(0.5 t) + 0.01sin(0.5 t) (17) sinüzoidal sinyali düşünüldü. Gürültülü veri üretmek için ilk olarak model sinyalin N=64 örneklem değeri hesaplandı ve sonrasında, sıfır ortalamalı birim varyanslı Gauss dağılımdan rastlantısal olarak üretilen gürültü değerleri eklendi. Yazılan Mathematica kodu, bu veriler için iş istasyonunda koşturuldu ve yaklaşık olarak 7 saniye CPU zamanı harcandıktan sonra, Şekil 1 deki sonuçlar elde edildi. χ nin yüzeyi Şekil de gösterilmiştir. Burada minimize yapılan fonksiyonun topolojisi hakkında bir fikir elde edilir. Hatta bu temel örnekte görülür ki, χ, frekansların yüksek dereceden doğrusal olmayan bir fonksiyonudur ve pek çok yerel minimuma sahiptir. Bu durumda, eğer yanlış bir başlangıç notasından başlanılırsa minimumu kaçırma tehlikesi vardır. Minimumun araştırmasını içeren sayısal hesaplamaların maliyeti çok büyüktür ve sıklıkla optimal altı yöntemler kullanılır. İki minimum değerinde, χ = 8.35 bulunur. 19

D. ÜSTÜNDAĞ ve M. CEVRİ Sinyal 4-30 -0-10 10 0 30 - -4 Sinyal 4-30 -0-10 10 0 30 - -4 Zaman Zaman Gözlem Verileri Kestirilen Sinuzoit Şekil 1. İki frekanslı sinyalin kestirim işlemi. Her noktada gürültünün standart sapması σ = 1 olarak alınmıştır. Şekil. İki sinüzoidal uydurma problemi için χ fonksiyonunun yüzeyi 0

VERİLERDEN SİNÜZOİTLERİN PARAMETRELERİNİN KESTİRİMİ En çok olabilirlik kestiriminden gerçek parametre değerleri hakkında bir çıkarım yapabilmek için kestiricilerin varyansının kestirilmesi ve gerçek parametrelerden ne kadar uzaklaştığımızı gösteren bazı ölçüler gereklidir. Kestirimlerin doğruluk değerini ölçmek için, öncelikle geçerli d veri kümesinden ˆp hesaplanır ve bu ˆp 0 ile gösterilir. Daha sonra ˆp parametre değerleri, doğru değerler olarak varsayılır. Kestirilen ˆp 0 parametre kümesi doğru olmamasına rağmen, onun doğru olduğu sanal uzay düşünülür. Özellikle, sanal uzaydaki pˆi p ˆ0 nin olasılık dağılımının şeklinin, gerçek uzaydaki p i p ˆ0 'in olasılık dağılımının şekliyle aynı veya çok yakın olması beklenir. p 'nin mantıklı bir gösterimi ˆp 0 olabilsin diye sadece rastlantısal hataların denemelere katıldığı durum ve veri analizinin p' nin bir fonksiyonu olarak hızlıca değişmeyeceği varsayılır. Daha sonra, P( dpolasılık ) fonksiyonundan 1 3 d, d, d,..., yapay veri kümeleri inşa edilir. Her bir yapay veri d nmc kümesinden "Monte Carlo" parametreleri olarak adlandırılan pˆ, pˆ, pˆ,..., p ˆ değerlerini bulmak için kestirim işlemi uygulanır. Sonra, 1 3 n MC kestirim işleminin doğruluğunun gösterilmesi bakımından ˆp 0 pˆ, pˆ, pˆ,..., p ˆ dağılımının oluşturulmasına çalışılır. Bunu yapmak için, 1 3 n MC uygunluk probleminde Monte-Carlo simülasyonlarının [1] nasıl uygulanabileceğini gösteren Mathematica kodu yazıldı. Denklem (17) deki sinyal modeli ile ilişkili Monte-Carlo simülasyon ( n MC = 100) sonuçları Tablo 1 de özetlenmiştir. Burada, frekansın kestirim değerlerinin genliklere göre daha çok gerçek değerlerine yakın olduğu görülebilir. Beklenildiği gibi, CPU zaman tüketimi parametrelerin sayısı arttıkça artar. Diğer yandan uygunluğun kalitesi için 1

D. ÜSTÜNDAĞ ve M. CEVRİ χ N 1 di f ti indirgenen = N K i = 1 σ ( (, p)), (18) indirgenen ki-kare tarafından ölçülür. Burada K, serbestlik derecesini belirtir. Tablo 1. Monte-Carlo Simülasyonlarının Özeti Parametreler Kestirilen Değerler ω(1) 0.3013±0.0041 ω() 0.4978±0.005 a 1 (1) 1.1856±0.1397 a (1).10±0.1805 a 1 () 3.3104±0.1148 a () 0.0384±0.31 χ 5.509±3.975 Eğer model güvenilir ve belirsizlik ölçülerinin kestirimleri doğruysa, iyi bir uygunluk için χ indirgenen 1 olması beklenir. Fakat bu istatistik, sahip olduğu dağılımla bir rastlantı değişkenidir. Veri kümesi ne kadar büyük olursa bu dağılım da o kadar dar olacaktır. Monte-Carlo parametreleri oluşturulduğu zaman, minimumda χ indirgenen 0.91 elde edildi. Bu ise, modelin doğruluğunun göstergesinin bir ölçüsüdür. Son olarak, verilerdeki rastlantısal gürültü değerlerinin μ = 0 ve σ = 1 ile Gausslu normal dağılımdan oluşturulduğu varsayıldı. Şekil 3, verilerdeki

VERİLERDEN SİNÜZOİTLERİN PARAMETRELERİNİN KESTİRİMİ rastlantısal gürültünün gerçek ve kestirilen olasılık yoğunluğunu gösterir. Buradan da görülmektedir ki, kestirilen yoğunluk (süreksiz), gerçek yoğunluğa (sürekli) yakındır. Örneklemlerin sayısı arttıkça verilerin histogramı gerçek yoğunluğa daha da yakınlaşacaktır. Histogram, yoğunluğun parametrik olmayan bir kestiricisi olarak bilinir. Çünkü belirtilen parametrelere bağlı değildir. Şekil 3. Verideki gürültünün gerçek ve kestirim olasılıklarının karşılaştırılması SONUÇ Burada sunulan sonuçlar göstermektedir ki, çok fazla veri kümelerinin Monte Carlo simülasyonunu kullanan yukarıdaki metot, oldukça geneldir ve gürültü ile bozulan doğrusal olmayan modellerle çalışmamızı sağlar. Fakat çok sayıda yapay veri kümesini üretmek için, büyük bir CPU zaman harcanmasına gereksinim duyulur. Metot, ikiden daha fazla sinyal olduğu genişleyen durumlara da direk uygulanır. Sinüzoitlerin sayısı başlangıçta biliniyor kabul edilir. Fakat genelde bilinmez. Böylece, bu sayının kestirimi, sayısal algoritmanın geliştirilmesi ve farklı metotlarla karşılaştırılması ileriki çalışmalarımıza ışık tutacaktır. 3

D. ÜSTÜNDAĞ ve M. CEVRİ TEŞEKKÜR Bu çalışma, Marmara Üniversitesi tarafından desteklenen FEN-DKR 00407 008 numaralı "Bayes Model Seçimi ve Parametre Kestirimi" isimli projenin bir parçasıdır. REFERANSLAR [1] Bretthost, G. L.: Bayesian Spectrum Analysis and Parameter Estimation, Springer-Verlag, 1, (1997). [] Dou, L.; Hodgson, R.J.W.: Bayesian Inference and Gibbs Sampling in Spectral Analysis and Parameter Estimation: I, Inverse Problems, 11 (1995) 1069-1085. [3] Andrieu, C.; Doucet, A.: Joint Bayesian Model Selection and Estimation of Noisy Sinusoids via Reversible Jump MCMC, IEEE Transactions on Signal Processing, Vol: 47, No: 10 (1999) 667-676. [4] Capon, J.: Maximum-likelihood spectral estimation, Nonlinear Methods of Spectral Analysis, Springer-Verlag ( 1983). [5] Gelman, A.; Carlin, J.B.; Stern, H.S.; Rubin, D.B.: Bayesian Data Analysis, Chapman & Hall/CRC, (000). [6] Cevri, M.: Bayesian Parameter Estimation, Yüksek Lisans Tezi, Marmara Üniv. Fen Bilimleri Enstitüsü, İstanbul, Türkiye, (00). [7] Fisher, R.A.: Theory of Statistical Estimation, Proceedings of the Cambridge Philosophy Society, (195), 700-75. [8] Edwards, A.W.F.: Likelihood, Cambridge University Press, (197). [9] Press, W.H.; Flannery, B.P.; Teukolshy, S.A.; Vetterling, W.T.: Numerical Recipes in C: The Art of Computing, nd Ed.; Cambridge University Press, (1995). [10] Kelly, J.J.: Introduction to Data Analysis, Essential Mathematica for Students of Science, (1998) [11] Weillin, P.; Gayllord, R.; Kamin, S.: An Introduction to Programming with Mathematica, Cambridge University Press (005). [1] Tan, S.M.; Fox, C. ; Nicolls, G.K.: Physics 707 Inverse Problems (006). 4