Türkçe Ses Sentezi için Süre Modellenmesi



Benzer belgeler
Biyo-Medikal Mühendisliği Enstitüsü. Bbatı Dilleri ve Edebiyatı Bölümü. Elektrik-Elektronik Mühendisliği Bölümü {sayliome,

Türkçe de Ünlülerin Formant Analizi

Türkçe de Ünlülerin FormantĐncelemesi

Ömer Şayi i ve Levent M. A ıslan Boğaziçi Üniversitesi

Doğan Can, Murat Saraçlar. Bebek, İstanbul. 9 Mart, 2009

Korelasyon, Korelasyon Türleri ve Regresyon

PROJE ADI: TEKRARLI PERMÜTASYONA BİNOM LA FARKLI BİR BAKIŞ

İÇİNDEKİLER ÖNSÖZ Bölüm 1 KÜMELER Bölüm 2 SAYILAR

Öğr. Elemanı: Dr. Mustafa Cumhur AKBULUT

MAK1010 MAKİNE MÜHENDİSLİĞİ BİLGİSAYAR UYGULAMALARI

SESBİLİM ÇALIŞMALARI. Prof. Dr. İclâl ERGENÇ

2.1 Gri Düzey Eş Oluşum Matrisi ( GLCM) Gri düzey eş oluşum matrisi Haralick tarafından öne sürülmüştür [1]. Đstatistiksel doku analizi yöntemidir.

Okut. Yüksel YURTAY. İletişim : (264) Sayısal Analiz. Giriş.

Ders Adı Kodu Yarıyılı T+U Saati Ulusal Kredisi AKTS. Güç Elektroniği I EEE

TOBB Ekonomi ve Teknoloji Üniversitesi İKT351 Ekonometri I, Dönem Sonu Sınavı

FORMÜLLER VE FONKSİYONLAR

Projenin Adı: İstatistik yardımıyla YGS ye hazırlık için soru çözme planlaması

MOCKUS HİDROGRAFI İLE HAVZA & TAŞKIN MODELLENMESİNE BİR ÖRNEK: KIZILCAHAMAM(ANKARA)

CEVAPLAR. n = n 1 + n 2 + n 3 + n 4 + n 5 + n 6 + n 7 = = 11 dir.

Tahminleme Yöntemleri-2

ORTAÖĞRETİME ÖĞRETMEN YETİŞTİRMEDE "MESLEK BİLGİSİ" BAKIMINDAN FEN-EDEBİYAT VE EĞİTİM FAKÜLTELERİNİN ETKİLİLİĞİ

YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT

İÇİNDEKİLER. ÖN SÖZ.v ÖZ GEÇMİŞ vii I. BÖLÜM İLK OKUMA VE YAZMA ÖĞRETİMİNİN TARİHSEL GELİŞİMİ 1

BIP116-H14-1 BTP104-H014-1

First Discoveries Seviyesi Kullanım Kılavuzu

Bilgisayar Destekli Eğitimin Gelişimi ve Kuramsal Dayanakları

Tek Değişkenli Optimizasyon OPTİMİZASYON. Gradient Tabanlı Yöntemler. Bisection (İkiye Bölme) Yöntemi

Doğu Anadolu Bölgesi'ndeki Bazı İllerin Hava Şartları ve Rüzgar Gücünün Modellenmesi

Yeni Sınav Sistemi. Yeni Sınav Sistemi (YGS-LYS) 1-YGS (YÜKSEKÖĞRETİME GEÇİŞ SINAVI) Sevgili Öğrenciler:

Fiziksel Veritabanı Modelleme

İSTATİSTİK EXCEL UYGULAMA

Algoritmalar. Arama Problemi ve Analizi. Bahar 2016 Doç. Dr. Suat Özdemir 1

VERİ TABANI I. Yrd.Doç.Dr. İlker ÜNAL. Teknik Bilimler Meslek Yüksekokulu

İÇİNDEKİLER 1: DİL VE DÜŞÜNCE ARASINDAKİ İLİŞKİ...

ANADOLU ÜNİVERSİTESİ. ENM317 Mühendislik İstatistiği İSTATİSTİKSEL TAHMİN Prof. Dr. Nihal ERGİNEL

KADIN VE TOPLUMSAL CİNSİYET ARAŞTIRMALARI DERGİSİ

EXCEL DE ARİTMETİKSEL İŞLEMLER

BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR

Siirt Üniversitesi Eğitim Fakültesi. Halil Coşkun ÇELİK

İçindekiler. İçindekiler... vii 1. BÖLÜM SES TEMELLİ CÜMLE YÖNTEMİ VE YAPILANDIRMACILIK. Yrd. Doç. Dr. Meral GÖZÜKÜÇÜK

Üst düzey dillerden biri ile yazılmış olan bir programı, makine diline çeviren programa derleyici denir. C++ da böyle bir derleyicidir.

Bu bölümde Coulomb yasasının bir sonucu olarak ortaya çıkan Gauss yasasının kullanılmasıyla simetrili yük dağılımlarının elektrik alanlarının çok

PARÇACIK SÜRÜ OPTİMİZASYONU BMÜ-579 METASEZGİSEL YÖNTEMLER YRD. DOÇ. DR. İLHAN AYDIN

Otomatik Düzelt. Otomatik düzelt penceresinin anlatılması. Otomatik Düzelt penceresine iki yoldan ulaşabiliriz.

AKARSULARDA KİRLENME KONTROLÜ İÇİN BİR DİNAMİK BENZETİM YAZILIMI

TEMEL EĞİTİMDEN ORTAÖĞRETİME GEÇİŞ ORTAK SINAV BAŞARISININ ÇEŞİTLİ DEĞİŞKENLER AÇISINDAN İNCELENMESİ

TÜRKÇE MODÜLÜ BİREYSEL EĞİTİM PLANI (TÜRKÇE DERSİ) (1.ÜNİTE) GÜZEL ÜLKEM TÜRKİYE

T. C. TRAKYA ÜNİVERSİTESİ SOSYAL BİLİMLER DERGİSİ YAYIN İLKELERİ

DİNAMİK - 2. Yrd. Doç. Dr. Mehmet Ali Dayıoğlu. Ankara Üniversitesi Ziraat Fakültesi. Tarım Makinaları ve Teknolojileri Mühendisliği Bölümü

GANTT ÇİZELGESİ PERT DİYAGRAMI

R ile Programlamaya Giriş ve Uygulamalar

FTR 331 Ergonomi. yrd. doç. dr. emin ulaş erdem

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

PROSTEEL 2015 STATİK RAPORU

TANIMLAYICI İSTATİSTİKLER

Ders Adı Kodu Yarıyılı T+U Saati Ulusal Kredisi AKTS. Veri Organizasyonu ve Yönetimi BIL

Deprem Merkezi Bulma Uygulamasının JDL İş Akışları ile Paralelleştirilmesi

6. DENEY Alternatif Akım Kaynağı ve Osiloskop Cihazlarının Kullanımı

Ders Adı : TÜRK DİLİ I: SES VE YAPI BİLGİSİ Ders No : Teorik : 2 Pratik : 0 Kredi : 2 ECTS : 3. Ders Bilgileri.

LYS ye başvurmak için geçmemiz gereken baraj puan kaçtır? Geçtiğimiz baraj puanına uygun LYS ye mi katılmamız gerekir?

İÇİNDEKİLER BİRİNCİ BÖLÜM BİLGİSAYARDA BELGE AÇMAK VE TEMEL İŞLEMLER YAPMAK

Genel olarak test istatistikleri. Merkezi Eğilim (Yığılma) Ölçüleri Dağılım (Yayılma) Ölçüleri. olmak üzere 2 grupta incelenebilir.


YÜZEYSULARI ÇALIŞMA GRUBU

İNTERNET TARAYICISI ÜZERİNDE ÇALIŞABİLEN ELEKTRİK TALEP TAHMİNİ ANALİZ PROGRAMI

Deney 1: Transistörlü Yükselteç

Sensör Birleştirme Eğitimi. Hızlı jet uçağa monte görev sistemlerinin geliştirilmiş operasyonel performansı vasıtasıyla avantaj sağlayın

İspanyol Alfabesi 27 harf ve 2 digraf, yani tek ses veren ikili harf kombinasyonundan oluşur.

Matris Cebiriyle Çoklu Regresyon Modeli

ÖRNEKLEME HATALARI EK C. A. Sinan Türkyılmaz

Deneysel Verilerin Değerlendirilmesi. Dersi Veren Öğretim Üyeleri: Yrd. Doç. Dr. Özge ANDİÇ ÇAKIR. Prof. Dr. Murat ELİBOL FİNAL SINAVI

BASEL II. RİSK AĞIRLIK FONKSİYONLARI (Beklenmeyen Kayıplar)

CEVAP ANAHTARI. Ünite 1 TAM SAYILAR VE RASYONEL SAYILARLA İŞLEMLER. TAM SAYILAR / Çarpma İşlemi. TAM SAYILAR / Bölme İşlemi

Tanım Akışkanların Statiği (Hidrostatik) Örnekler Kaldırma Kuvveti Örnek Eylemsizlik Momenti Eylemsizlik Yarıçapı

MADDESEL NOKTANIN EĞRİSEL HAREKETİ

1: DENEYLERİN TASARIMI VE ANALİZİ...

İmar Uygulaması. Uygulamanın Netmap Projesi Olduğunun Belirtilmesi

MICROSOFT OFFİCE WORD PROGRAMI DOSYA İŞLEMLERİ

Arayüz Nedir? Arayüz Çeşitleri Arayüz Tasarım Yöntemleri Arayüz Tasarım Hataları. Ömer Faruk MIZIKACI

BÖLÜM 13 HİPOTEZ TESTİ

11TA Veritabanı Organizasyonu Dersi MS ACCESS Ders Notları

Döner Sermaye İşletmesi İşleri İle İlgili Şube Müdürlüğü EK ÖDEME, SABİT EK ÖDEME, ASGARİ (TABAN) EK ÖDEME HESAPLAMA USULLERİ. 06/06/11 Eren ERCAN 1

ZAMAN SERİLERİNDE AYRIŞTIRMA YÖNTEMLERİ

PATENT ARAŞTIRMASI VE ÖNEMİ

TEST-8. Yandaki at resminin bir bölümü silinmiştir. Aşağıdaki şekillerden hangisi bu resmi tamamlar? A) B) C) D)

SON BEŞ YIL İÇİNDE YAPILAN LİSANS YERLEŞTİRME (LYS) SINAVLARI İLE ÖĞRETMENLİK ALAN BİLGİSİ (ÖABT) SINAVLARI ARASINDAKİ İLİŞKİNİN İNCELENMESİ

Dosya Sıkıştırma (File Compression) Kütük Organizasyonu 1

SÜRELİ YAYIN KAYITLARININ ENTEGRASYONU

1.1 Yapı Dinamiğine Giriş

BİYOLOJİ DERSLERİNDE VERİMLİLİK VE TEKNOLOJİ KULLANIMI

Bİ LGİ SAYARDA, JEODEZİ VE FOTOGRAMETRİ MESLEKİ TERİ MLERİ SÖ ZLÜĞ Ü


Veritabanı, Veri Madenciliği, Veri Ambarı, Veri Pazarı

TTB-HUV SUNUMU. Dr. RAİF KAYA




İM 205-İnşaat Mühendisleri için MATLAB. Irfan Turk Fatih Üniversitesi,

Transkript:

Türkçe Ses Sentezi için Süre Modellenmesi Ömer Şayli 1, Levent M. Arslan 1 ve A. Sumru Özsoy 2 Boğaziçi Üniversitesi, Bebek, 80815,İstanbul 1 Elektrik-Elektronik Mühendisliği Bölümü 2 Batı Dilleri ve Edebiyatı Bölümü {sayliome, arslanle, ozsoys}@boun.edu.tr Özetçe Bu çalışmada, Türkçe ses sentezi için harflerin (seslerin) sürelerini tahmin eden modeller oluşturuldu. Çalışmada modelleri çıkarmak için, yetişkin bir erkeğe ait, 16 khz ve 16-bit te örneklenmiş ve tamamı etiketlenmiş ses kayıtları kullanıldı. Öncelikle kullanılan ses kayıtlarının Türkçe nin ne kadarlık bir kısmını kapsadığı araştırıldı. Üçlü öbekler baz alındığında, kapsamanın %70 dan fazla olduğu görüldü. Harflerin sürelerine etki eden etmenler değişim (varyans) analizi ile bulundu. Seslerin sürelerini tahmin için, harflerin ortalama sürelerini kullanan model ile üçlü öbeklerin ortalama sürelerini kullanan modele ilaveten doğrusal bağlanım modeli denendi. Kayıtlar tüm harfler/modeller için işlendi ve yazıdan sese sentez için bahsedilen modellere dayalı süre tahmin ediciler bulundu. Denenen üç modelde, genel olarak üçlü öbeklerin ortalama sürelerini kullanan modelin en iyi performansı gösterdiği görüldü. Ortalama-süre tahminine dayalı model, basit olmakla beraber bazı harfler için iyi performans gösterdi. İstatistiksel olarak, doğrusal bağlanım modelinin bazı harflerin sürelerinin değişkenliklerinin %80 ninden fazlasını açıklayabildiği görüldü. 1. Giriş İnsan-makina arabağlarının önem kazanmaları ve popüler olmalarıyla son yıllarda çeşitli diller için ses sentezi üzerindeki çalışmalar oldukça büyük bir ivme kazanmıştır. Özellikle İngilizce ve bazı diğer diller için Fransızca, Almanca ve Çince gibi- oldukça başarılı ses sentez uygulamaları geliştirilmiştir. Dilimiz Türkçe için de yapılan başarılı ses sentez uygulamaları [1] bulunmaktadır. Bu uygulamalardaki en büyük eksiklik, henüz tam olarak doğal seslerin üretilememesidir. Prosodi özellikleri olan perde sıklığı, şiddet ayarı, vurgu, entonasyon ile ses süreleri sesin doğallığını etkileyen ve henüz tam olarak modellenememiş ses özellikleridir. Bu çalışmada Türkçe için ele aldığımız etmen Türkçede süre özelliğidir. Süre ile kastedilen, bitiştirmeli sentez sistemlerinde, bitiştirilen parçacıkların süreleridir. Seslerin süre özelliği, oldukça kompleks olup ne tamamen istatiksel etmenlere ne de tamamen grammer özelliklerine (kurallara) bağlıdır [4]. Aksine bunların etkileşimi oldukça karmaşık bir durum meydana getirmektedir. Bu çalışmada, ses süreleri istatistiksel yöntemlerle incelenmiş ve modeller çıkarılmıştır. 2. Kullanılan Veri Tabanı Süre modelleri çıkarılması için, 16 khz ve 16-bit te okunmuş ve etiketlenmiş 7898 (tek başına okunmuş) kelime ve 206 (toplam 1167 kelimeden oluşan) tümce kullanıldı [2]. Okunmuş kelimeler

ve tümcelerin Türkçe nin ne kadarını kapsadığı Türkçede en sık geçen üçlü öbeklerin oluşturduğu grup ele alınarak incelendi. Ü. Yapanel in [6] çalışmasında, yaklaşık iki milyon kelime kullanılarak Türkçe de en sık kullanılan üçlü öbekler bulunmuştur. Üçlü öbekleri bir örnekle açıklarsak, /Ali geldi/ tümcesindeki üçlü öbekler /ali/, /liz/, /izg/, /Zge/, /gel/, /eld/, /ldi/, /diz/ dir (Z boşluğu temsil etmekte). En sık geçen üçlü öbeklere göre, okunmuş kelimelerin Türkçe nin %82 sini, okunmuş tümcelerin ise Türkçe nin %76 sını kapsadığı bulundu. Bu veritabanı, bitiştirmeli ses sentezinde kullanılmak için etiketlendi. Dalga biçimlerinin etiketlenmesinde (her harf için sesin dalga biçiminde karşılık gelen kısmın işaretlenmesi) ses sentezi için uygunluk göz önünde bulunduruldu. Uygunluktan kastedilen, ses sentezinde kullanılan parçacıkların bir araya geldiklerinde dalga biçimlerinin uyuşmasıdır. Örneğin, patlamalı seslerde, dalga biçimde görünen yüksek şiddetli kısma ilaveten önceki düşük şiddetli bölüm de etikete dahil edilmektedir. 3. Harf Sürelerini Etkileyen Etmenlerin Bulunması Giriş kısmında da belirtildiği gibi, harf sürelerinini etkileyen bir çok etmen bulunmaktadır. Diğer bazı diller için yapılan çalışmalarda, harf sürelerini etkileyen temel etmenlerin şunlar olduğu bulunmuştur: harfin kimliği, harfin çevresindeki harflerin kimliği, harfin geçtiği kelimenin önemi (ne kadar yeni bilgi taşıdığı), harfin kelime ve tümce içindeki pozisyonu (baş, orta ve son gibi), konuşma hızı, vurgu ve entonasyon. Harf sürelerini etkileyen diğer bazı etmenler olmakla beraber, bunların etkileri bu etmenlere göre daha az ve belirsizdir. Amerikan ingilizcesinde, yukarıdaki etmenlerin ünlülerdeki süre değişiminin %94 ünü açıklayabildiği gösterilmiştir [5]. Bu olguladan hareketle, eldeki veritabanı her harf için aşağıdaki etmenleri bulmak üzere işlendi; 1) Sesin kelime içindeki pozisyonu (baş-orta-son olmak üzere 3 düzey) 2) Sesin tümce içindeki pozisyonu (baş-orta-son olmak üzere 3 düzey) ( için) 3) Sesten önceki ve sonraki ünsüz tipi (21+21 düzey) 4) Sesten önceki ve sonraki ünlü tipi (8+8 düzey) 5) Sesin içinde bulunduğu hece tipi (açık/kapalı olmak üzere 2 düzey) 6) Sesin içinde bulunduğu hece örüntüsü (10 düzey) 7) deki kelime sayısı (7 düzey) ( için) Elimizde şu an için yazıdan ve dalga biçiminden insan yardımı olmaksızın otomatik olarak konuşma hızı, vurgu ve entonasyon bilgisini bulabilecek araçlar olmadığından bu etmenler incelemeye dahil edilemedi. Yukarda bulunan etmenlerin harflerin sürelerini etkileyip etkilemediği değişinti (varyans) analizi yardımıyla araştırıldı. Bu analiz sonucu, 0.05 anlamlılık seviyesine göre tek-kelime nda tüm etmenlerin harf sürelerini etkilediği ortaya çıktı. nda ise, süreyi etkilemeyen etmen düzeyleri yalnızca ünlüler için ünlü harften önceki ve sonraki ünlüler olduğu görüldü [3]. 4. Süre Modelleme Eldeki veritabanının yeterince iyi kapsama sağladığı görüldükten ve harf sürelerini etkileyen etmenlerin bulunmasından sonra model çıkarma safhasına geçildi. Süre tahmini için denenen ilk model harflerin ortalama sürelerini kullanan modeldir. Veritabanı kullanılarak her harfin ortalama süresi bulunmuştur. Diğer ortalama süreye dayalı model, üçlü öbeklerin ortalama sürelerini kullanmaktadır. Üçlü öbeklerin ortalama sürelerini kullanan model, her ne kadar ortalama süre kullanıyor olsa da, üçlü öbeğin ortasındaki harf için komşu iki harfin bilgisini de kendiliğinden

içermektedir. Türkçe de en sık geçen 5000 üçlü öbeğin, veritabanı kullanılarak ortalama süreleri bulunmuştur. Ayrıca harf sürelerini tahmin için doğrusal bağlanım modeli uygulandı. bağlanım modelini, modeli çıkarılacak harfi ile temsil edersek, βˆ y = Xβ (1) T 1 T = (X X ) (X y ) (2) şeklinde göstermek mümkündür. Burada y vektörü harflerin süre değerlerini, X harfin vektörde geçen süreyi aldığı kelimedeki/tümcedeki etmen düzey değerlerini, β doğrusal bağlanım katsayı değerlerini, Sesin süresini etkilediği varsayılan ve βˆ veritabanıyla bulunan doğrusal bağlanım katsayı tahminlerini ifade etmektedir. X vektörüne kodlanan etmenler, harflerin sürelerine etki ettiği saptanan etmenlerdir. Fakat etmenlerin çarpım şeklinde etkileşimleri modele dahil edilmemiştir. Eldeki veritabanıyla, her harf için denklem (2) ile doğrusal bağlanım katsayı tahminleri elde edilmiştir. bağlanım modelinin verideki değişimin ne kadarını açıkladığı R 2 istatistik değeri ile bulunmaktadır. 5. Sonuçlar Uygulanan üç modeli kıyaslamak için ortalama hata yüzdeleri kullanıldı. Her harf için, ortalama hata yüzdesi denklem (3) e göre hesaplandı. Harfi, hesaplanan ortalama hata yüzdesini Y ile temsil edersek, ortalama hata yüzde bulma denklemi şu şekildedir; Gerçek Süre - Tahmin Y = Ortalama *100 (3) Gerçek Süre Ünlüler ve ünsüzler için hata yüzde hesapları, denenen üç model ve iki ortam için tablo 1, 2.1 ve 2.2 de belirtilmektedir. Ortalama hata yüzdeleri modeller için %10 ile %54 arasında değişmektedir. Harflerin ortalama süresini kullanan modelin ortalama hata yüzdesi ünlülerde %22 ile %50 arasında, ünsüzlerde ise %16 ile %54 arasındadır. Bu model oldukça basit olmakla beraber, hata yüzde performansı bazı harfler için iyidir (/ş/ için tümce nda %16). Basitliği diğer modellere göre avantaj oluşturmaktadır. Üçlü öbeklerin ortalama sürelerini kullanan modelin performansı diğer iki modeli çoğu yerde geçmektedir. Yalnızca tek kelime nda ünlülerin süre tahmininde doğrusal bağlanım modeli daha iyi sonuç vermektedir. Fakat şunu belirtmek gerekir ki, üçlü öbekler kullanılarak her harf için süre tahmini yapılamamaktadır, yalnızca veritabanında karşılığı olanlar için yapılmaktadır. Bu yüzden denklem (3) kullanılarak hata yüzdesi hesaplanırken, her veri kullanılmamıştır üçlü öbek modelinde. bağlanım modelinin ortalama hata yüzdesi üçlü öbek modeline yakındır ve her girilen yazı için süre tahmini yapılabilmektedir. Bu modelin karmaşıklığı da üçlü öbek modeline göre azdır çünkü süre tahmini için tek gereken yalnızca doğrusal bağlanım katsayı tahminlerinin veritabanında saklanmasıdır. Bu da üçlü öbekleri saklamak için gereken yere göre oldukça azdır. Tablo 4.1 ve 4.2 de seslerin süre değişimlerinin ne kadarının doğrusal bağlanım modeliyle açıklanabildiği R 2 istatistik değerleri verilerek belirtilmiştir. Pratik olarak, 0.75 in altındaki değerler için doğrusal bağlanım modelinin başarılı olduğu söylenemez. Çoğu harf için R 2 değeri bu değerin

altındadır. Denediğimiz doğrusal bağlanım modeli etmenlerin etkileşimini (çarpımları) içermemektedir. Bu etkileşimlerin de eklenmesi halinde doğrusal bağlanım modelinin başarısının artacağı düşünülmektedir. Tüm etmenler göz önüne alındığında, doğrusal bağlanım modeli her durum içim süre tahmini yapabilmesi ve hata yüzdesinin az olmasından dolayı en iyi model seçilebilir. Harflerin süre tahmini için halen yeni modeller geliştirilmeye çalışılmaktadır. Bu çalışmanın ilginç sonuçlarından biri de Türkçede ünlülerin ve ünsüzlerin özelliklerinin bulunmasında süre bilgisinin kullanılabileceğini gösterilmesi oldu [3]. Tablo 1. Ünlüler için elde edilen hata yüzdeleri Ortam Model a e ı i o ö u ü Harf ortalama 27.5 26.6 49.22 41.0 22.4 19.2 37.7 33.7 Üçlü öbek 17.5 16.2 19.0 18.9 15.8 12.9 17.9 16.9 Kelime 16.0 12.8 19.0 19.0 12.6 10.3 18.5 16.9 Ortamı Harf ortalama 25.1 22.8 45.5 37.7 22.7 22.0 35.4 29.0 Üçlü öbek 15.1 14.6 18.7 18.9 12.9 10.8 15.9 12.6 19.7 16.9 30.1 27.4 13.8 12.2 23.3 18.6 Tablo 2.1 Ünsüzler (b-k) için elde edilen hata yüzdeleri Ortam Model b c ç d f g ğ h j k Harf ortalama 37.5 26.1 29.9 40.8 38.9 31.6 34.7 49.9 39.0 52.7 Üçlü öbek 27.3 16.4 12.7 21.3 20.5 22.7 23.4 25.6 11.6 14.9 Kelime 32.3 17.2 14.0 24.5 25.3 25.2 27.0 31.8 14.5 22.2 Ortamı Harf ortalama 33.3 25.5 22.0 41.1 26.5 27.7 33.9 51.0-25.9 Üçlü öbek 24.5 11.6 11.2 20.8 12.5 19.6 20.0 22.1 0.0 18.2 31.8 20.3 11.7 26.7 10.3 19.7 18.7 39.7-21.0 Tablo 2.2 Ünsüzler (l-z) için elde edilen hata yüzdeleri Ortam Model l m n P r s ş t v y z Harf 29.7 29.3 53.2 41.5 53.6 20.1 20.6 38.0 30.1 28.5 42.9 kelime ortalama Üçlü öbek 18.7 15.2 16.0 16.8 19.7 13.1 10.5 16.4 19.0 19.6 16.3 20.8 16.3 17.0 20.2 21.6 15.0 10.4 19.3 20.4 20.0 19.2 Harf 27.5 25.4 44.0 27.4 49.0 17.3 15.9 25.8 25.0 31.0 33.8 ortalama Üçlü öbek 18.4 15.8 20.9 11.3 20.0 11.6 10.1 12.3 18.3 18.0 19.7 23.5 19.6 27.5 9.9 27.2 13.3 11.8 17.9 19.5 24.1 24.0

Tablo 3 Ünlüler için elde edilen R 2 değerleri a e ı i o ö u ü kelime 0.56 0.70 0.77 0.72 0.66 0.76 0.74 0.74 0.33 0.36 0.55 0.45 0.61 0.91 0.59 0.62 kelime Tablo 4.1 Ünsüzler (b-m) için elde edilen R 2 değerleri b c ç d f g ğ h j k l m 0.26 0.68 0.84 0.51 0.57 0.39 0.58 0.70 0.85 0.79 0.59 0.74 0.21 0.97 0.70 0.47 0.78 0.60 0.70 0.41-0.28 0.26 0.44 Tablo 4.2 Ünsüzler (n-z) için elde edilen R 2 değerleri n p r s ş t v y z kelime 0.79 0.73 0.80 0.48 0.73 0.75 0.65 0.62 0.65 0.51 0.80 0.72 0.34 0.54 0.47 0.33 0.50 0.61 6. Kaynakça [1] Arslan, L. M., Sürekli Konuşma Tanıma ve Konuşma Sentezi Uygulamalarında En Uygun Fonetik Dizgenin Otomatik Seçimi, S.İ.U. Konferansı, Bilkent, Ankara, Haziran, 1999. [2] GVZ Ses nolojileri Yazılım Hizmetleri A.Ş., www.gvz.com.tr [3] Şayli, Ö., Duration Modelling for Turkish Text-to-Speech Synthesis, Yüksek Lisans Tez Çalışması, Boğaziçi Üniversitesi. [4] Van Santen, J., ''Chapter 5: Timing'', Multilingual Text-to-Speech Synthesis: The Bell Labs Approach, Kluwer Academic Publishers, Richard Sproat, editör, s. 115-139, 1998. [5] Van Santen, J.P.H., Contextual Effects on Vowel Duration, Speech Communication, Cilt 11, s. 513-546, 1992. [6] Yapanel, Ü., Garbage Modeling Techniques for a Turkish Keyword Spotting System, Yüksek Lisans Tezi, Boğaziçi Üniversitesi, 2000.