Doğan Can, Murat Saraçlar. Bebek, İstanbul. 9 Mart, 2009

Benzer belgeler
Türkçe için Konuşma Tanıma ve Derin Öğrenmeyle Dil Modelleme

Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi Pamukkale University Journal of Engineering Sciences

2.1 Bir Sınıfı Örneklerinden Öğrenme Vapnik-Chervonenkis (VC) Boyutu Olası Yaklaşık Doğru Öğrenme... 21

KAHKAHA TANIMA İÇİN RASSAL ORMANLAR

ÖZGEÇMİŞ. 7. Yayınlar 7.1 Uluslararası hakemli dergilerde yayınlanan makaleler (SCI,SSCI,Arts and Humanities)

MEH535 Örüntü Tanıma. Karar Teorisi

SINGLE-CHANNEL SPEECH-MUSIC SEPARATION USING NMF FOR AUTOMATIC SPEECH RECOGNITION

Türkçe de Ünlülerin Formant Analizi

Bilgisayarla Görüye Giriş

BÖLÜM 1: YAşAM ÇÖzÜMLEMEsİNE GİRİş... 1

Aşağı Link MC-CDMA Sistemlerinde Kullanılan PIC Alıcının EM-MAP Tabanlı Olarak İlklendirilmesi

SAĞLIK TEKNOLOJİ DEĞERLENDİRME (STD) İÇİN MODELLEME VE BENZETİM. Dr. Murat Günal

Ulusal Metroloji Enstitüsü GENEL METROLOJİ

Bilgisayarla Görüye Giriş

Türkçe de Ünlülerin FormantĐncelemesi

MIT OpenCourseWare Ekonomide İstatistiksel Yöntemlere Giriş Bahar 2009

Dinamik Zaman Bükmesi Yöntemiyle Hece Tabanlı Konuşma Tanıma Sistemi

Türkçe Ses Sentezi için Süre Modellenmesi

ERCİYES ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ SİVİL HAVACILIK ANABİLİM DALI YENİ DERS ÖNERİSİ/ DERS GÜNCELLEME

Boosting. Birol Yüceoğlu Migros T.A.Ş.

QUANTILE REGRESYON * Quantile Regression

MEH535 Örüntü Tanıma

Çabuk Yazılandırma Kılavuzu (Rapid Transcription Guide) v0.4

SÜREKLİ SAKLI MARKOV MODELLERİ İLE METİNDEN BAĞIMSIZ KONUŞMACI TANIMA PARAMETRELERİNİN İNCELENMESİ

ÖZGEÇMİŞ. Yrd. Doç. Dr. MURAT SARAÇLAR

KONUŞMA TANIMA TEORİSİ VE TEKNİKLERİ 1 SPEECH RECOGNITION THEORY AND TECHNIQUES

2. BASİT DOĞRUSAL REGRESYON 12

Bilgisayar ve Bilişim Bilimleri Fakültesi Sakarya Üniversitesi

Zahmetsiz örüntü tanıma: Nokta bulutlarının karşılaştırılması yoluyla veri-tabanlı ve parametresiz istatistiksel öğrenme

Veri Bilim - Yapay Öğrenme Yaz Okulu, 2017 Matematiksel Temeller ve Vaka Çalışmaları

ĐST 474 Bayesci Đstatistik

Kümeleme Algoritmaları. Tahir Emre KALAYCI

MAK 210 SAYISAL ANALİZ

Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Orjinal Adı: Pattern Recognition

İçindekiler vii Yazarların Ön Sözü xiii Çevirenin Ön Sözü xiv Teşekkürler xvi Semboller Listesi xvii. Ölçme, İstatistik ve Araştırma...

HTK ĐLE KONUŞMACIDAN BAĞIMSIZ TÜRKÇE KONUŞMA TANIMA SĐSTEMĐ OLUŞTURMA Nursel YALÇIN 1 Ömer Faruk BAY 2

KABLOSUZ İLETİŞİM

CEVAP ANAHTARI. Tempo Testi D 2-B 3-A 4-A 5-C 6-B 7-B 8-C 9-B 10-D 11-C 12-D 13-C 14-C

Operasyonel Risk Ölçümünde Modelleme ve Sınırları. Burak Saltoğlu Boğaziçi Üniversitesi ve Riskturk 3 Aralık 2013

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Bilgisayarla Görüye Giriş

JEODEZİK GPS AĞLARINDA DUYARLIK ve

DENGELEME HESABI-I DERS NOTLARI

YAZILIM ÜRÜN HATTINDA YETENEK MODELİNDEN ÜRÜN KONFİGÜRASYONUNUN OLUŞTURULMASI

İÇİNDEKİLER. BÖLÜM 1 Değişkenler ve Grafikler 1. BÖLÜM 2 Frekans Dağılımları 37

Okut. Yüksel YURTAY. İletişim : (264) Sayısal Analiz. Giriş.

Performance Analysis of MFCC Features On Emotion Recognition from Speech

İÇİNDEKİLER KISIM I SİSTEMATİK YAKLAŞIM

Büyük Veri ve Endüstri Mühendisliği

Ölçme ve Değerlendirmenin. Eğitim Sistemi Açısından. Ölçme ve Değerlendirme. TESOY-Hafta Yrd. Doç. Dr.

Veritabanı Tasarımı Ve Yönetimi. Varlık-İlişki Modeli

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı

TAŞINMAZ DEĞERLEMEDE İSTATİSTİKSEL ANALİZ

Beykent Üniversitesi Mühendislik ve Mimarlık Fakültesi Yazılım Mühendisliği. Movie Prediction

Uzaktan Algılama Uygulamaları

Rastgelelik, Rastgele Sinyaller ve Sistemler Rastgelelik Nedir?

NDEN BELİRLENEBİLME LME POTANSİYELİ UYDU GÖRÜNTÜLERİNDEN

YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT

Doç. Dr. Dilek ALTAŞ İSTATİSTİKSEL ANALİZ

3 KESİKLİ RASSAL DEĞİŞKENLER VE OLASILIK DAĞILIMLARI

Copyr i g ht 2015, SAS Ins titut e Inc. All rights res er ve d. ADRES DOĞRULAMA VE ZENGİNLEŞTİRME

Sahne Geçişlerinin Geometrik Tabanlı olarak Saptanması

DENİZ HARP OKULU ENDÜSTRİ MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

VERİ TABANI UYGULAMALARI

EVREN, ÖRNEK, TEMSİLİYET. Prof. Mustafa Necmi İlhan

Türkçe Dokümanlar Ġçin Yazar Tanıma

Fiziksel Sistemlerin Matematik Modeli. Prof. Neil A.Duffie University of Wisconsin-Madison ÇEVİRİ Doç. Dr. Hüseyin BULGURCU 2012

İSTANBUL RUMELİ ÜNİVERSİTESİ MESLEK YÜKSEKOKULU BİLGİSAYAR PROGRAMCILIĞI 1.SINIF 2.YARIYIL İNTERNET PROGRAMCILIĞI II DERS İZLENCESİ

T.C. MARDİN ARTUKLU ÜNİVERSİTESİ Uzaktan Öğretim Uygulama ve Araştırma Merkezi Müdürlüğü

PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Veri Madenciliği Yöntemleri Dr. Yalçın ÖZKAN -II-

SAYISAL ÇÖZÜMLEME Yrd. Doç. Dr. Adnan SONDAŞ Sayısal Çözümleme

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

FIRAT ÜNİVERSİTESİ TEKNOLOJİ FAKÜLTESİ Yazılım Mühendisliği Bölümü

Veriye Dayalı Karar Verme (Bölüm 2) Can Akkan

OLASILIK ve KURAMSAL DAĞILIMLAR

Bilişim Sistemleri. Modelleme, Analiz ve Tasarım. Yrd. Doç. Dr. Alper GÖKSU

IDE4DB Veritabanı Geliştirme Platformu Bitirme Projesi Sunumu

Karar Verme. Karar Verme ve Oyun Teorisi. Kararların Özellikleri. Karar Analizi

Ses Komut Tanıma ile Gezgin Araç Kontrolü

Kaynak: A. İŞLİER, TESİS PLANLAMASI, 1997

Bağıl Konum Belirleme. GPS ile Konum Belirleme

1.SINIF 1. DÖNEM DERS MÜFREDATI. (9) TEORİ/UYG. (SAAT) MATH 101 Matematik I Calculus I Zorunlu 4-6 PHYS 101 Fizik I Physics I Zorunlu ECE 101

BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ 2013/2014 BAHAR DÖNEMİ BÜTÜNLEME SINAV TAKVİMİ Lisansüstü Bilgisayar Müh. Bölümü

Yazılım Test Maliyet Fonksiyonlarının Otomatik Olarak Keşfedilmesi

BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ 2013/2014 BAHAR DÖNEMİ BÜTÜNLEME SINAV TAKVİMİ Lisansüstü Bilgisayar Müh. Bölümü

TOBB Ekonomi ve Teknoloji Üniversitesi İKT351 Ekonometri I, Ara Sınavı

ÜNİBİLGİ 26. Üniversitemizin yeni Kütüphane Otomasyon Programı olan e-libs in kullanımını tanıtacağız.

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı

Hafta 10 - Vektör Uzay Modelleri

T.C. SELÇUK ÜNİVERSİTESİ REKTÖRLÜĞÜ

Ankara Üniversitesi, SBF İstatistik 2 Ders Notları Prof. Dr. Onur Özsoy 1

EME 3117 SİSTEM SİMÜLASYONU. Üçgensel Dağılım. Sürekli Düzgün Dağılım. Sürekli Rassal Değişkenlerin Modellemesinde Kullanılan Dağılımlar

İSTATİSTİK. Bölüm 1 Giriş. Ankara Üniversitesi SBF İstatistik 1 Ders Notları Prof. Dr. Onur Özsoy 4/4/2018

Örüntü Tanıma (EE 448) Ders Detayları

Konuşma Terapisine Yönelik Otomatik Konuşma Tanıma Yöntemleri

Uzaktan Algılama Teknolojileri

KABLOSUZ İLETİŞİM

Yazılım Mimari Tasarımından Yazılım Geliştirme Çatısının Üretilmesinde Model Güdümlü Bir Yaklaşım

MONTAJ MODELLEME ( ASSEMBLY MODELING)

Transkript:

Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması Doğan Can, Murat Saraçlar Elektrik Elektronik Mühendisliği Bölümü Boğaziçi Üniversitesi Bebek, İstanbul 9 Mart, 2009

Bir Bakışta GDSKT - Dil Modeli GDSKT - Akustik Modeller Üretici Modellere karşılık Ayırıcı Modeller MLE MMIE MPE Veritabanları HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Deney Sonuçları D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 2/13

Geniş Dağarcıklı Sürekli Konuşma Tanıma - Dil Modeli Problem Tanımı ŝ = argmax p(a M s )p(s) s A : Akustik öznitelik vektörleri s : Sözcük dizisi p(s) : Dil modeli M s : s dizisine karşılık gelen akustik model D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 3/13

Geniş Dağarcıklı Sürekli Konuşma Tanıma - Dil Modeli Problem Tanımı ŝ = argmax p(a M s )p(s) s A : Akustik öznitelik vektörleri s : Sözcük dizisi p(s) : Dil modeli M s : s dizisine karşılık gelen akustik model N li Dil Modeli s = [w 1, w 2,..., w n ] : Sözcük dizisi p(s) = p(w 1, w 2,..., w n ) n k=1 p(w k w k N+1 k 1 ) D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 3/13

Geniş Dağarcıklı Sürekli Konuşma Tanıma - Akustik Modeller Üretici Modelleme Hedef : Kelime hata oranının dolaylı yoldan iyileştirilmesi Yöntem : Eğitim verisinin iyi modellenmesi (olabilirliğinin arttırılması) Eğitimde sadece referans kelime dizileri kullanılır Model varsayımları geçerli + sonsuz veri tarafsız, minimum sapmaya sahip modeller D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 4/13

Geniş Dağarcıklı Sürekli Konuşma Tanıma - Akustik Modeller Üretici Modelleme Hedef : Kelime hata oranının dolaylı yoldan iyileştirilmesi Yöntem : Eğitim verisinin iyi modellenmesi (olabilirliğinin arttırılması) Eğitimde sadece referans kelime dizileri kullanılır Model varsayımları geçerli + sonsuz veri tarafsız, minimum sapmaya sahip modeller Ayırıcı Modelleme Hedef : Kelime hata oranının ya da benzer bir ölçütün doğrudan iyileştirilmesi Yöntem : Modeller arası ayrımın arttırılması, eğitim verisinin iyi modellenmesinin yanı sıra hatalı hipotezlerin olabilirliğinin (tanıma hatalarının) azaltılması Egitimde hem referans hem de olası kelime dizileri kullanılır D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 4/13

Geniş Dağarcıklı Sürekli Konuşma Tanıma - MLE En Yüksek Olabilirlik Kestirimi (MLE) : Yöntem : Eğitim verisinin olabilirliğini arttırmak Tüm eğitim sözceleri eşit ağırlıklı D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 5/13

Geniş Dağarcıklı Sürekli Konuşma Tanıma - MLE En Yüksek Olabilirlik Kestirimi (MLE) : Yöntem : Eğitim verisinin olabilirliğini arttırmak Tüm eğitim sözceleri eşit ağırlıklı ML Kriteri : R F MLE (λ) = log p λ (A r M sr ) r=1 λ : Model parametreleri s r, r = 1,..., R : Referans sözcük dizisi A r, r = 1,..., R : Akustik özntielik vektörleri D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 5/13

Geniş Dağarcıklı Sürekli Konuşma Tanıma - MMIE En Yüksek Karşılıklı Bilgi Kestirimi (MMIE) : Yöntem : Eğitim verisinin sonsal olasılığını doğrudan arttırmak (Koşullu en yüksek olabilirlik (CML) kestirimi) D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 6/13

Geniş Dağarcıklı Sürekli Konuşma Tanıma - MMIE En Yüksek Karşılıklı Bilgi Kestirimi (MMIE) : Yöntem : Eğitim verisinin sonsal olasılığını doğrudan arttırmak (Koşullu en yüksek olabilirlik (CML) kestirimi) MMI Kriteri : F MMIE (λ) = R r=1 R r=1 log p λ(a r M sr )P (s r ) s p λ(a r M s )P (s) log p λ(a r M sr )P (s r ) p λ (A r M L ) L : Olası kelime dizilerini temsil eden tanıma örüsü D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 6/13

Geniş Dağarcıklı Sürekli Konuşma Tanıma - MPE En Düşük Sesbirimi Hatası (MPE) : Yöntem : Referans metinler ile olası kelime dizileri arasındaki Levenshtein uzaklıklarını en aza indirmek D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 7/13

Geniş Dağarcıklı Sürekli Konuşma Tanıma - MPE En Düşük Sesbirimi Hatası (MPE) : Yöntem : Referans metinler ile olası kelime dizileri arasındaki Levenshtein uzaklıklarını en aza indirmek MPE Kriteri : R F MP E (λ) = log p λ (s A r )D(s, s r ) s S r=1 D(s, s r ) : Ham ses doğruluğu ölçütü D(s, s r ) = s r daki sesbirim sayısı s deki hatalı sesbirim sayısı p λ (s A r ) : Sonsal olasılık p λ (s A r ) = p λ(a r M s )P (s) p λ (A r M L ) S : Bir eğitim sözcesine (s r ) karşılık gelen tüm olası kelime dizileri D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 7/13

Veritabanları [Arısoy et al., 2009] Boğaziçi Üniversitesi Türkçe Haber Bültenleri Akustik Veritabanı : 4 TV, 1 Radyo kanalından kaydedilen haber programları Eğitim : Mart 2007 - Mart 2008 Sınama : Mayıs 2008 Çeşitli koşullardaki veri miktarı (saat) Kısım f0 f1 f2 f3 f4 fx Toplam Eğitim 67.2 15.7 8.3 19.8 73.6 3.3 188 Sınama 0.9 0.1 0.1 0.7 1.4 0.1 3.3 (f0) temiz konuşma, (f1) doğal konuşma, (f2) telefon konuşması, (f3) arkaplan müziği, (f4) kötü akustik koşullar ve (f5) diğerleri D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 8/13

Veritabanları [Arısoy et al., 2009] Boğaziçi Üniversitesi Türkçe Haber Bültenleri Akustik Veritabanı : 4 TV, 1 Radyo kanalından kaydedilen haber programları Eğitim : Mart 2007 - Mart 2008 Sınama : Mayıs 2008 Çeşitli koşullardaki veri miktarı (saat) Kısım f0 f1 f2 f3 f4 fx Toplam Eğitim 67.2 15.7 8.3 19.8 73.6 3.3 188 Sınama 0.9 0.1 0.1 0.7 1.4 0.1 3.3 (f0) temiz konuşma, (f1) doğal konuşma, (f2) telefon konuşması, (f3) arkaplan müziği, (f4) kötü akustik koşullar ve (f5) diğerleri Boğaziçi Üniversitesi Türkçe Metin Veritabanları : Türkçe Haber Veri Tabanı (HVT) : Kullanılan akustik verinin referans metinleri, 1.3 M kelime Türkçe Genel Veri Tabanı (GVT) : Haber portallarından toplanmış metin derlemi, 182.3 M kelime D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 8/13

Veritabanları [Arısoy et al., 2009] Boğaziçi Üniversitesi Türkçe Haber Bültenleri Akustik Veritabanı : 4 TV, 1 Radyo kanalından kaydedilen haber programları Eğitim : Mart 2007 - Mart 2008 Sınama : Mayıs 2008 Çeşitli koşullardaki veri miktarı (saat) Kısım f0 f1 f2 f3 f4 fx Toplam Eğitim 67.2 15.7 8.3 19.8 73.6 3.3 188 Sınama 0.9 0.1 0.1 0.7 1.4 0.1 3.3 (f0) temiz konuşma, (f1) doğal konuşma, (f2) telefon konuşması, (f3) arkaplan müziği, (f4) kötü akustik koşullar ve (f5) diğerleri Boğaziçi Üniversitesi Türkçe Metin Veritabanları : Türkçe Haber Veri Tabanı (HVT) : Kullanılan akustik verinin referans metinleri, 1.3 M kelime Türkçe Genel Veri Tabanı (GVT) : Haber portallarından toplanmış metin derlemi, 182.3 M kelime B.Ü. veritabanları için Yrd. Doç. Murat Saraçlar ile temasa geçebilirsiniz. D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 8/13

HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Temel Akustik Model Eğitimi Aşamaları - HTK [Young et al., 2006]: 1. Öznitelikler : 10 milisaniye ile ötelenen 25 milisaniyelik her ses çerçevesi için 12 MFCC ve 1 enerji özniteliği, bunların birinci ve ikinci zaman türevleri D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 9/13

HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Temel Akustik Model Eğitimi Aşamaları - HTK [Young et al., 2006]: 1. Öznitelikler : 10 milisaniye ile ötelenen 25 milisaniyelik her ses çerçevesi için 12 MFCC ve 1 enerji özniteliği, bunların birinci ve ikinci zaman türevleri 2. 30 sesbirime (29 harf ve 1 sessizlik) ait her HMM durumunda tek Gauss bileşeni içeren akustik modeller (MLE) D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 9/13

HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Temel Akustik Model Eğitimi Aşamaları - HTK [Young et al., 2006]: 1. Öznitelikler : 10 milisaniye ile ötelenen 25 milisaniyelik her ses çerçevesi için 12 MFCC ve 1 enerji özniteliği, bunların birinci ve ikinci zaman türevleri 2. 30 sesbirime (29 harf ve 1 sessizlik) ait her HMM durumunda tek Gauss bileşeni içeren akustik modeller (MLE) 3. Bağlama dayalı model eğitimi için ses üçlülerinin Türkçe ses yapısına uyarlanmış karar ağaçları yardımıyla kümelenmesi D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 9/13

HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Temel Akustik Model Eğitimi Aşamaları - HTK [Young et al., 2006]: 1. Öznitelikler : 10 milisaniye ile ötelenen 25 milisaniyelik her ses çerçevesi için 12 MFCC ve 1 enerji özniteliği, bunların birinci ve ikinci zaman türevleri 2. 30 sesbirime (29 harf ve 1 sessizlik) ait her HMM durumunda tek Gauss bileşeni içeren akustik modeller (MLE) 3. Bağlama dayalı model eğitimi için ses üçlülerinin Türkçe ses yapısına uyarlanmış karar ağaçları yardımıyla kümelenmesi 4. Karar ağaçları ve eğitim esnasında toplanan istatistikler kullanılarak yapılan kümeleme sonucunda toplamda 13243 HMM durumu içeren 27871 üçlü sesbirim modeli D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 9/13

HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Temel Akustik Model Eğitimi Aşamaları - HTK [Young et al., 2006]: 1. Öznitelikler : 10 milisaniye ile ötelenen 25 milisaniyelik her ses çerçevesi için 12 MFCC ve 1 enerji özniteliği, bunların birinci ve ikinci zaman türevleri 2. 30 sesbirime (29 harf ve 1 sessizlik) ait her HMM durumunda tek Gauss bileşeni içeren akustik modeller (MLE) 3. Bağlama dayalı model eğitimi için ses üçlülerinin Türkçe ses yapısına uyarlanmış karar ağaçları yardımıyla kümelenmesi 4. Karar ağaçları ve eğitim esnasında toplanan istatistikler kullanılarak yapılan kümeleme sonucunda toplamda 13243 HMM durumu içeren 27871 üçlü sesbirim modeli 5. Her HMM durumundaki Gauss bileşenlerinin sayısının arttırılması Sessizlik modelinde : 1 2 4 7 10 15 21 Diğer modellerde : 1 2 3 4 6 8 11 6. Her bileşen arttırımın ardından ML eğitimi D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 9/13

HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Dil Modellerinin Oluşturulması - SRILM [Stolcke, 2002]: 1. GVT ve HVT nin birleştirilip, en sık geçen 50 bin kelimenin tanıma dağarcığı olarak seçilmesi D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 10/13

HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Dil Modellerinin Oluşturulması - SRILM [Stolcke, 2002]: 1. GVT ve HVT nin birleştirilip, en sık geçen 50 bin kelimenin tanıma dağarcığı olarak seçilmesi 2. Tanıma dağarcığı + HVT de geçip tanıma dağarcığında olmayan kelimeler ayırıcı eğitim dağarcığı D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 10/13

HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Dil Modellerinin Oluşturulması - SRILM [Stolcke, 2002]: 1. GVT ve HVT nin birleştirilip, en sık geçen 50 bin kelimenin tanıma dağarcığı olarak seçilmesi 2. Tanıma dağarcığı + HVT de geçip tanıma dağarcığında olmayan kelimeler ayırıcı eğitim dağarcığı 3. SRILM araçları ve Kneser-Ney yumuşatıcı model yöntemiyle Tanıma dağarcığı + GVT veri budama eşiği 5 10 8 olan üçlü dil modeli Tanıma dağarcığı + HVT budanmamış üçlü dil modeli Ayırıcı eğitim dağarcığı + GVT budanmamış tekli dil modeli Ayırıcı eğitim dağarcığı + HVT budanmamış tekli dil modeli D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 10/13

HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Dil Modellerinin Oluşturulması - SRILM [Stolcke, 2002]: 1. GVT ve HVT nin birleştirilip, en sık geçen 50 bin kelimenin tanıma dağarcığı olarak seçilmesi 2. Tanıma dağarcığı + HVT de geçip tanıma dağarcığında olmayan kelimeler ayırıcı eğitim dağarcığı 3. SRILM araçları ve Kneser-Ney yumuşatıcı model yöntemiyle Tanıma dağarcığı + GVT veri budama eşiği 5 10 8 olan üçlü dil modeli Tanıma dağarcığı + HVT budanmamış üçlü dil modeli Ayırıcı eğitim dağarcığı + GVT budanmamış tekli dil modeli Ayırıcı eğitim dağarcığı + HVT budanmamış tekli dil modeli 4. Bu modellerin eşit ağırlıklı doğrusal aradeğerlenmesi sonucu 1343711 üçlü, 3515826 ikili, 50002 tekli içeren tanıma dil modeli 105088 tekli içeren zayıf dil modeli D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 10/13

HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Ayırıcı Akustik Model Eğitimi Aşamaları - HTK: 1. Temel akustik modeller ve dil modeli ile tüm eğitim verisinin tanınması ve her sözce için en olası tanıma hipotezlerini içeren kelime örülerinin oluşturulması D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 11/13

HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Ayırıcı Akustik Model Eğitimi Aşamaları - HTK: 1. Temel akustik modeller ve dil modeli ile tüm eğitim verisinin tanınması ve her sözce için en olası tanıma hipotezlerini içeren kelime örülerinin oluşturulması 2. Kelime örülerinin zayıf dil modeli ile yeniden ağırlıklandırılarak farklı hipotezler arasındaki karmaşıklığın arttırılması D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 11/13

HTK/SRILM Tabanlı Türkçe GDSKT Sistemi Ayırıcı Akustik Model Eğitimi Aşamaları - HTK: 1. Temel akustik modeller ve dil modeli ile tüm eğitim verisinin tanınması ve her sözce için en olası tanıma hipotezlerini içeren kelime örülerinin oluşturulması 2. Kelime örülerinin zayıf dil modeli ile yeniden ağırlıklandırılarak farklı hipotezler arasındaki karmaşıklığın arttırılması 3. Yeniden ağırlıklandırılmış kelime örüleri kullanılarak, temel akustik modellerin iki farklı ayrım kıstasını (MMI ve MPE) eniyileyecek şekilde güncellenmesi D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 11/13

Deney Sonuçları 55 50 ML MMI MPE 45 40 KHO 35 30 25 20 0 1 2 3 4 5 6 7 8 9 10 GZÇ Farklı akustik modeller ile yapılan konuşma tanıma deney sonuçları: MLE : %25.8 (9.4xGZ) MMIE : %24.3 (9.9xGZ) MPE : %23.7 (8.0xGZ) D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 12/13

Referanslar Arısoy, E., Can, D., Parlak, S., Sak, H., and Saraçlar, M. (2009). Turkish broadcast news transcription and retrieval. IEEE Transactions on Audio, Speech and Language Processing. Stolcke, A. (2002). SRILM An extensible language modeling toolkit. In Proc. ICSLP, volume 2, pages 901 904, Denver. Young, S., Evermann, G., Gales, M., Hain, T., Kershaw, D., Liu, X., Moore, G., Odell, J., Ollason, D., Povey, D., Valtchev, V., and Woodland, P. (2006). The HTK book (for HTK version 3.4), Cambridge University Engineering Department. D. Can, M. Saraçlar, Boğaziçi Üniversitesi Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması 13/13