Uludağ Ünverstes Mühendslk-Mmarlık Fakültes Dergs, Clt 17, Sayı 1, 2012 ARAŞTIRMA KENDİ KENDİNİ DÜZENLEYEN HARİTALAR YÖNTEMİYLE TÜRKÇE SESLİ HARFLERİN SINIFLANDIRILMASI VE TANINMASI Emrah YÜRÜKLÜ * Osman H. KOÇAL ** Özet: Lokal dnamk modelleme teknkler kullanılarak zaman serlern modellemek özellkle son yıllarda oldukça başarılı sonuçlar vermektedr. Kohonen n 1990 yılında sunduğu Kend Kendn Düzenleyen Hartalar yöntem le lokal dnamk modelleme teknğne farklı br bakış açısı kazandırılmıştır. Bu yöntem le, zaman serlernden türetlen lokal dnamk modeller, snyaln tüm dnamkler oldukça başarılı ve kolay br yöntemle göstereblmektedr. Zamanla bu teknk pek çok alanda kendne uygulama alanı bulmuş, gerek Kohonen, gerekse dğer uzmanlar tarafından pek çok farklı versyonu türetlmştr. Yapılan çalışmada SOM yöntem kısaca açıklanmış ve bu yöntem yardımıyla Türkçe sesl harfler çn sınıflandırma ve tanıma uygulaması yapılmış ve sonuçları tartışılmıştır. Anahtar Kelmeler: Kend Kendn Düzenleyen Hartalar, Lokal Dnamk Modelleme, Ses Tanıma. The Classfcaton and Recognton of Turksh Vowels wth Self-Organzng Maps Abstract: The easness of puttng the model nto practce, and makng sgnal or system dynamcs and structure observable has made dynamc modelng for tme seres very popular for the last years. By the years, new versons and approaches of dynamc modelng have been developed and appled to dfferent knd of sgnals and systems. Kohonen s suggeston was a new approach to local dynamc modelng whch he had offered n 1990. The new technque s name was Self Organzng Maps. The nnovaton of the new approach was ts needless of the memory for savng the hstory of tme seres. It was because the whole model s updated wth the new sample of tme seres. New versons of ths technque are ntroduced n a lot of dfferent knds of applcatons by the years. In ths work, Self Organzng Maps technque s appled to Turksh vowels and worked on the advantages of the technque. Key Words: Self-Organsng Maps, Local Dynamc Modellng, Speech Recognton. 1. GİRİŞ Sstem tanımlama ve zaman sers tahmnler, en esk mühendslk problemlernden brdr. Genel olarak tahmn yöntem yaklaşımlarında, sstemn zaman sersn üreten parametrelern arayışı üzerne yoğunlaşılmıştır. Geleneksel yaklaşım statstk ve lneer modeller üzerne kurulmuştur. Genel olarak tahmnler yapılırken zaman sersnn lneer br sstem tarafından üretlen snyal ve Beyaz Gauss Gürültüsünün (WGN) toplamından oluştuğu varsayılmıştır. Böylelkle lneer modellemenn hedef, zaman sersnn güç spektrumu le uyuşacak modeln parametrelern kestrm le sınırlanmıştır. 1990 lı yılların sonlarına doğru çnde dnamk modelleme adı verlen yen br perspektf ortaya çıkmıştır. Bu yen yaklaşımda, zaman serler, determnstk, otonomus (grşsz) ve dnamk sstemlern çıkışları olarak değerlendrlmştr. Zaman serlernn karmaşası, lneer durumdak gb dış kaynaklı rasgele uyarımların değl, dnamk sstemlern * TOFAŞ Türk Otomobl Fabrkası A.Ş., ArGe, Elk./Eln. Tasarım Yönetclğ, Bursa. ** Yalova Ünverstes, Mühendslk Fakültes, Blgsayar Mühendslğ Bölümü, Yalova. İletşm Yazarı: E. Yürüklü (emrah.yuruklu@tofas.com.tr)
Yürüklü, E. ve Koçal, O.H.: Kend Kendn Düzenleyen Hartalar Yöntemyle Türkçe Sesl Harflern yüksek dereceden ve nonlneer doğası le lşklendrlmştr. Bu yaklaşımda model sstem, nonlneer ya da zamanla değşen parametrelere sahp lneer br sstem olarak seçlmştr. Kend Kendn Düzenleyen Hartalar metodu, lk defa 1990 yılında Kohonen tarafından yayınlanan The Self-Organzng Map sml makale le tanınmıştır. Bu tarhten sonra da, başta Kohonen olmak üzere, brçok gelşm ve adaptasyonlar görmüş ve çeştl uygulamalarda kullanılmıştır. Brçok snrsel ağ uygulamalarında dğer metotlardan üstünlüğünü kanıtlamış ve üzernde en çok çalışılan yöntemlerden br olmuştur. Bu yen yöntemn en büyük avantajlarından brde zaman geçmş değerlern tutmak çn br hafızaya htyaç duymamasıdır. Çünkü sstem her yen gelen örnek le kendn tümden yenlemektedr. Büyük vertabanlarını dolaşmak (Kohonen 1995, Wang 1996), maknelern ve şlem süreçlernn durum dyagramlarını çıkartmak ve böylece snyaller modelleme, sınıflandırma ve karşılaştırma yapmak çn (Kohonen 1995, Prncpe ve ark. 1998, Wang 1996, Lapdot 2001), modellenen sstemn çıkışları hakkında geleceğe yönelk tahmnler yapmak ve böylece gürültü bastırmak çn (Prncpe ve ark. 1998, Wang 1996, Lapdot 2001) Kend Kendn Düzenleyen Hartalar kullanılarak brçok çalışmalar yapılmış ve başarılara mza atılmıştır. Günümüzde de Kend Kendn Düzenleyen Hartalar metodu üzernde halen çalışmalar devam etmekte yen versyonları ve farklı alanlar çn uygulamaları türetlmektedr. 2. KENDİ KENDİNİ DÜZENLEYEN HARİTALAR Kohonen, SOM (Kend Kendn Düzenleyen Hartalar) algortmasını lk olarak rasgele boyuttak br grş snyaln daha düşük (br ya da k) boyutlu ayrık gösterml topolojk komşular halnde temsl etmek amacıyla gelştrmştr. :X A gösterm, X grş uzayını, A ayrık çıkış uzayına dönüştüren SOM hartasını ( ) temsl etsn. SOM hartası, Kohonen n kend fadesyle Blgnn yapı yoğunluğuna yaklaşmak üzere, X grş snyal uzayına uydurulmuş, A, noktaların elastk ağı dır (Kohonen 1995). A uzayına at her olasılık elemanı ( A) br referans vektör (w ) le ndekslenr. SOM algortmasının yürütülmesnn sonunda bu olasılık elemanları x grş vektörünü temsl eden kümelere at hücreler olacaktırlar. x grş snyalne SOM algortmasının tepks hang hücrenn kazandığına karar verlmesyle başlar. notasyonu kazanan hücrey ve A se A uzayındak nokta sayısını belrtmek üzere, kazanan hücrenn belrlenmes şu krtere göre yapılmaktadır: mn dst( w x) =1,...A (1) Grş snyal olan x vektörü le A uzayındak tüm hücreler arasındak mesafe, Ökld Mesafes gb br uzaklık hesabıyla hesaplanır ve bu hesaplama sonucunda en yakın mesafedek w hücres yarışmayı kazanan hücre olur ( ) (Kohonen 1995). Bu bakış açısıyla, w referans vektörlernn ağırlık vektörlerne dönüştürülmes le SOM br vektör ncemleyc olarak ta görev yapablmektedr. SOM un amacının yüksek yoğunluklu blg olması sebebyle, A uzayındak hücrelern X uzayı le uyuşacak şeklde yakınsaması gerekmektedr. En yakın mesafedek uyum çn se uygun br öğrenme kuralı gerekmektedr. SOM algortmasının kullandığı eğtm ve w katsayılarını güncelleme algortmasının en genel hal, n şlem anındak örneğn nds olmak üzere, eştlk (2) te görülmektedr. w w ( n 1) ( n) [ x w w, ], dger (2)
Uludağ Ünverstes Mühendslk-Mmarlık Fakültes Dergs, Clt 17, Sayı 1, 2012 Burada görülen öğrenme kuralı Kohonen tarafından önerlen Yarışmacı Öğrenme Kuralının en genel haldr. (n) katsayısı öğrenme oranıdır ve sabt br sayı veya gelen örneğn ndsne göre değşen br katsayı şeklnde de olablmektedr. Kohonen öğrenme kuralı le dğer yarışmacı öğrenme kurallarının arasındak fark Kohonen öğrenmesnn ağırlık katsayılarını değştrme şekldr. Kohonen öğrenme kuralında kazanan hücre le brlkte dğer hücrelernde br kısmının veya hepsnn ağırlık katsayılarının güncellenmes bell br kurala bağlanablmektedr. 3. SES SİNYALLERİ İÇİN SOM HARİTALARININ OLUŞTURULMASI Bu güne kadar konuşmacı ve ses tanıma üzerne pek çok çalışma yapılmış ve günümüzde artık çok başarılı sonuçlar elde edlmektedr. Son yıllarda Türkçe sesler üzerne yapılan çalışmalarda belrgn br artış görülmektedr. Bu çalışmada Türkçe Sesl harflern SOM modellenmes yapılacak daha sonra konuşmacı ve sesl harf sınıflandırmaları yapılarak ses ve konuşmacı tanımada SOM Hartalarının başarımı araştırılmıştır. Çalışmada, ses ve konuşmacı tanıma şlemlernn genelde peryodğms br yapı sergleyen sesl harfler üzernde çalışılarak yapıldığı düşünülerek sesl harfler baz alınmıştır (Laptod 2001). Br snyaln SOM Hartasının çıkarılmasından önce SOM Algortması çn belrlenmes gereken bazı parametreler bulunmaktadır. Bunlar öncelkle snyaln kaç boyutlu uzaya gömüleceğ (faz uzayının gömme boyutu), faz uzayının geckme süres ve ayrıca SOM Algortmasının dğer başlangıç koşulları (hartadak hücre sayısı) ve güncelleme (öğrenme katsayısı ve güncelleme kuralı) parametrelerdr. Bu parametrelern her br modellenecek snyale göre değşklkler göstermektedr. Grş snyalne uygun parametrelern belrleneblmes çn çeştl yöntemler bulunmaktadır. Bu çalışmada; gömme boyutunun belrleneblmes çn Hatalı Komşuluklar Yöntem (Abarbanel 1996), geckme süresnn belrlenmes çn de Ortak Enformasyon Hesabı (Abarbanel 1996) kullanılmıştır. Deney set olarak beş erkek ve üçü bayan olmak üzere toplam sekz kşnn her brnn toplam sekz sessz harf on kez konuşmasından elde edlmş 640 adet ses kaydı kullanılmıştır. Ses kayıtları olabldğnce sessz ortamlarda 11025 Hz frekansında 8bt mono olarak PCM formatında kaydedlmştr. Her ses kaydının süres 600 ms belrlenmştr. Bu durumda her br ses kaydı 6614 örnekten oluşmaktadır. 3.1 Ses Dosyaları çn SOM Parametrelernn Seçm Hatalı Komşular Yöntem Yardımıyla tüm deney set üzernde yapılan çalışmada gömme boyutunun tüm deney setnn %88 nde üç, %12 snde de dört olarak hesaplandığı görülmüştür. Gözlem yapılablmes ve deney setnn büyük çoğunluğunun gömme boyutunun üç olarak hesaplanması sebebyle tüm deney set çn gömme boyutu üç olarak alınmıştır. Geckme süresnn seçmnde se her kayıt çn Ortak Enformasyon Yöntemyle hesaplanmış ve SOM Hartalarının oluşturulmasında da bu geckme süreler kullanılmıştır.
Yürüklü, E. ve Koçal, O.H.: Kend Kendn Düzenleyen Hartalar Yöntemyle Türkçe Sesl Harflern Şekl 1: Ses verler çn uygulanacak SOM Algortmasındak ağırlık hücrelernn başlangıç koşullarını teşkl eden üç boyutlu vektör uzayı Başlangıç koşulları olarak, SOM Hartasında 35 adet hücre eşt uzaklıklara yerleştrlerek şekl.1 de gösterlen vektör uzayı kullanılmıştır. SOM Algortmasının eştlk (2) de bahsedlen güncelleme kuralı olarak se eştlk (3) te gösterlen güncelleme kuralı kullanılmıştır. mc x w ( n 1).w (3) mc 1 mc 1 Burada x o andak verye at örnek vektörü, w kazanan.h ücrey, mc se. hücrenn o ana kadark toplam kazanma sayısını temsl etmektedr. Bu kural kullanılarak örnek sayısının artması le brlkte, son gelen örneklern, SOM Hartası üzerndek etksnn azalması hedeflenmştr. 3.2 Örnek Br Ses Snyalnn SOM Hartasının Oluşturulması Şekl.2 le br ses snyalnn SOM Hartasının oluşturulmasının zaman sersnden SOM Hartasına kadar adımları gösterlmştr. Şekl.2(a) modellenecek ses snyaln zaman sers şeklnde göstermdr. Şekl.2(b) se ses snyalnn 3 gömme boyutu ve 1 geckme süres le elde edlmş faz uzayının göstermdr. Şekl.2(c) üç boyutlu SOM Hartasının başlangıç durumudur. Şekl.2(d) se SOM Hartasının kaynak ses snyal le eğtlmes sonucu elde edlen SOM Hartasıdır. Burada SOM Hartasının (Şekl.2(d)) snyaln faz uzayı le benzerlğne dkkat edlmeldr. SOM algortması aslında snyaln faz uzayını ncemleyerek bütün faz uzayını bell sayıda vektör le temsl edlmesn sağlamaktadır. Faz uzayının boyutu ve geckme süres doğru seçlrse faz uzayının snyaln tüm dnamklern gösterebldğ, dolayısı le çerdğ kabul edlr (Abarbanel 1996). Böylelkle tüm dnamkler çeren br faz uzayı le modellenen br SOM Hartasının snyale at dnamkler çerme kapastesne sahp olduğunu söyleyeblrz.
Uludağ Ünverstes Mühendslk-Mmarlık Fakültes Dergs, Clt 17, Sayı 1, 2012 (a) (b) (c) (d) Şekl 2: Br Ses Snyalnn Zaman Sers (a) ve Faz Uzayı Gösterm (Gömme Boyutu=3, Geckme Süres=1)(b), ve SOM Hartasının Başlangıç (c) ve Eğtm Sonrası Durumu (d). 4. DENEYSEL SONUÇLAR Deney setmzde bulunan 640 adet ses snyalnn tümünün SOM Hartaları, Kısım 3.1 de belrtlen şartlar le oluşturulmuştur. Böylelkle 35x3 matrsten oluşan 640 adet SOM Hartası elde edlmştr. Bu vertabanındak, SOM Hartaları arasında kşler ya da sesler bazında br lşknn var olup olmadığının sorgulanması çn se KNN sınıflandırma yöntem kullanılmıştır. Bu sınıflandırma yapılırken KNN Yöntem çn K komşuluk sayısı 5 olarak seçlmştr. Tablo 1 le vertabanındak SOM Hartaları arasında kşler ve sesl harfler bazında yapılan sınıflandırma performansları yer almaktadır. Bu performans sonuçları le aynı seslere at ses kayıtlarından çıkartılan SOM hartalarının aralarında bell br benzerlk olduğunu söyleyeblrz. Fakat aynı kşlere at SOM hartalarının aralarındak benzerlk bu kadar belrgn değldr. Bu durum kşlere at dnamklern SOM hartası oluşturulurken br şeklde bastırılmasından kaynaklanmaktadır. Fakat SOM Hartaları sesl harfler le lgl dnamkler gayet y korumakta ve bu korunum sayesnde sesl harfler arasında br benzerlk görülmektedr. Tablo 1. Kşler Bazında ve Harfler Bazında Yapılan Sınıflandırma Performansları Kş Bay1 Bay2 Bay3 Bay4 Bay5 Bayan1 Bayan2 Bayan3 Ortalama Doğru Karar 80 67 55 75 83 85 54 64 70.4 Verme Oranı (%) Sesl Harf a e ı o ö u ü Ortalama Doğru Karar Verme Oranı (%) 98 88 95 100 85 86 91 94 92.1
Yürüklü, E. ve Koçal, O.H.: Kend Kendn Düzenleyen Hartalar Yöntemyle Türkçe Sesl Harflern 5. SONUÇ Yapılan çalışmada, lk defa Kohonen tarafından tanıtılmış Kend Kendn Düzenleyen Hartalar (SOM) yöntem kullanılarak Türkçe ses karakterlernn özellk hartaları çıkartılmıştır. Daha sonra çıkartılan özellk hartaları kend aralarında karşılaştırılmış ve benzer kşlern veya benzer seslere at ortak özellkler araştırılmıştır. Yapılan çalışmalar göstermştr k, SOM yöntem le elde edlen ses snyallerne at özellk hartalarında, farklı kşlere at aynı sesl harflern kayıtları arasında ortak bazı özellkler bulunmaktadır. Çalışmanın önem, konuşma tanıma şlemnn, konuşma snyalnn çersnde rasgele dyebleceğmz tavırlar gösteren sessz harfler yerne daha çok yarı-peryodk yapı gösteren sesl harfler üzernde çalışılarak yapıldığı düşünülürse daha y anlaşılacaktır. Dolayısıyla bu çalışmanın gelecek çalışması önce hece tanıma daha sonra da kelme tanıma olacaktır. Konuşma tanıma şlemn yüksek doğrulukla başarablen br sstem tasarlandığında se, böyle br sstemn kullanılableceğ alanlar sınırsızdır. Bu sstem le nsansız telefon operatörler, sesl komutlarla çalışan makneler, konuşulanı dkte eden konuşma-yazı operatörler gb büyük kolaylıkların yolu açılacaktır. Günümüzde böyle br sstem tasarlamak çn pek çok çalışmalar yapılmaktadır. Fakat ne yazık k bu çalışmaların büyük çoğunluğu İnglzce dlndedr. Yapılan bu çalışma le Türkçe dl çn böyle br sstem tasarımının ön adımları atılmıştır. Önerlen yöntem Türkçe dl çn gayet başarılı sonuçlar elde etmekte ve daha sonrak çalışmalar çn umut vaat etmektedr. KAYNAKLAR 1. Kohonen, T. (1995). Self-Organzng Maps. New York: Sprnger-Verlag. 2. Abarbanel, H.D.I. (1996). Analyss of Observed Chaotc Data. New York: Sprnger. 3. Wang, L. (1996). Local Dynamc Modelng wth Self-Organzng Feature Map, PhD Dssertaton, Unversty of Florda, Dvson of Electrcal and Computer Engneerng. 4. Lapdot, I. (2001). Unsupervsed Speaker Recognton, PhD Dssertaton, Ben-Guron Unversty of the Negev, Beer-Sheva. 5. Prncpe, J.C., Wang, L., Motter, M.A. (1998). Local Dynamc Modelng wth Self-Organzng Maps and Applcatons to Nonlneer System Identfcaton and Control, Proceedngs of the IEEE, Vol. 86. No. 11. Makale 19.03.2012 tarhnde alınmış ve 03.04.2012 tarhnde kabul edlmştr.