BİLGİSAYAR DESTEKLİ BİR DİL PROGRAMI -Türkçe Konuşma - Tanıma Sistemi-



Benzer belgeler
Araştırma Notu 15/177

YAZILI YEREL BASININ ÇEVRE KİRLİLİĞİNE TEPKİSİ

BÖLÜM 7 BİLGİSAYAR UYGULAMALARI - 1

Türkiye Ekonomi Politikaları Araştırma Vakfı Değerlendirme Notu Sayfa1

KAHRAMANMARAŞ SÜTÇÜ İMAM ÜNİVERSİTESİ BİLİMSEL DERGİLER YÖNERGESİ BİRİNCİ BÖLÜM Amaç, Kapsam, Dayanak ve Tanımlar

BÜRO YÖNETİMİ VE SEKRETERLİK ALANI HIZLI KLAVYE KULLANIMI (F KLAVYE) MODÜLER PROGRAMI (YETERLİĞE DAYALI)

DEĞERLENDİRME NOTU: Mehmet Buğra AHLATCI Mevlana Kalkınma Ajansı, Araştırma Etüt ve Planlama Birimi Uzmanı, Sosyolog

Yedi Karat Kullanım Klavuzu. Yedi Karat nedir? Neden Karat?

SANAL DĠLĠN DĠLĠMĠZDE YOL AÇTIĞI YOZLAġMA HAZIRLAYAN: CoĢkun ZIRAPLI Ġsmail ÇEVĠK. DANIġMAN: Faik GÖKALP

ANKARA EMEKLİLİK A.Ş GELİR AMAÇLI ULUSLARARASI BORÇLANMA ARAÇLARI EMEKLİLİK YATIRIM FONU ÜÇÜNCÜ 3 AYLIK RAPOR

Özet Metin Ekonomik Büyümenin Anlaşılması: Makro Düzeyde, Sektör Düzeyinde ve Firma Düzeyinde Bir Bakış Açısı

GİYİM ÜRETİM TEKNOLOJİSİ ÇOCUK DIŞ GİYSİLERİ DİKİMİ (CEKET- MONT- MANTO) MODÜLER PROGRAMI (YETERLİĞE DAYALI)

-Bursa nın ciroları itibariyle büyük firmalarını belirlemek amacıyla düzenlenen bu çalışma onikinci kez gerçekleştirilmiştir.

ÖĞRENME FAALĠYETĠ GELĠġMĠġ ÖZELLĠKLER

BİT ini Kullanarak Bilgiye Ulaşma ve Biçimlendirme (web tarayıcıları, eklentiler, arama motorları, ansiklopediler, çevrimiçi kütüphaneler ve sanal

T.C. ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ MEKATRONİK MÜHENDİSLİĞİ BÖLÜMÜ MEKATRONİK LABORATUVARI 1. BASINÇ, AKIŞ ve SEVİYE KONTROL DENEYLERİ

Tablo 45 - Turizm İşletme Belgeli Tesislerde Konaklama ve Belediye Sayıları

1 OCAK 31 ARALIK 2009 ARASI ODAMIZ FUAR TEŞVİKLERİNİN ANALİZİ

Farklı Televizyon Yayın Ortamlarında Aynı Anda Farklı Reklam Yayını Bir Koltuğa İki Karpuz Sığar mı?

İSTANBUL KEMERBURGAZ ÜNİVERSİTESİ. ÇİFT ANADAL ve YANDAL PROGRAMI YÖNERGESİ

Dünyaya barış ve refah taşıyor, zorlukları azimle aşıyoruz

YÜKSEKÖĞRETİM KURUMLARI ENGELLİLER DANIŞMA VE KOORDİNASYON YÖNETMELİĞİ (1) BİRİNCİ BÖLÜM. Amaç, Kapsam, Dayanak ve Tanımlar

Deprem Yönetmeliklerindeki Burulma Düzensizliği Koşulları

Olasılık ve İstatistik Dersinin Öğretiminde Deney ve Simülasyon

AB ve Türkiye Telekomünikasyon Pazarları 2009 Yılı Durum Karşılaştırması

KAPLAMA TEKNİKLERİ DERS NOTLARI

a) Birim sorumluları: Merkez çalışmalarının programlanmasından ve uygulanmasından sorumlu öğretim elemanlarını,

TOBB ETÜ LİSANSÜSTÜ BURSLU ÖĞRENCİ YÖNERGESİ* (*) Tarih ve S sayılı Senato oturumunun 4 nolu Kararı ile Kabul edilmiştir.

TESİSAT TEKNOLOJİSİ VE İKLİMLENDİRME ÇELİK BORU TESİSATÇISI MODÜLER PROGRAMI (YETERLİĞE DAYALI)

MEVCUT OTOMATĐK KONTROL SĐSTEMLERĐNĐN BĐNA OTOMASYON SĐSTEMĐ ĐLE REVĐZYONU VE ENERJĐ TASARRUFU

İSTANBUL KEMERBURGAZ ÜNİVERSİTESİ BURS YÖNERGESİ. BİRİNCİ BÖLÜM Amaç, Kapsam, Dayanak ve Tanımlar

KİŞİSEL GELİŞİM VE EĞİTİM İŞ GÜVENLİĞİ VE İŞÇİ SAĞLIĞI MODÜLER PROGRAMI (YETERLİĞE DAYALI)

YÜKSEK HIZLI DEMİRYOLU YOLCULUKLARININ ÖZELLİKLERİ

TURKCELL TEKNOLOJ Z RVES KATILIMI

İSTANBUL TİCARET ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ BİLGİSAYAR SİSTEMLERİ LABORATUARI YÜZEY DOLDURMA TEKNİKLERİ

Topoloji değişik ağ teknolojilerinin yapısını ve çalışma şekillerini anlamada başlangıç noktasıdır.

Ek 1. Fen Maddelerini Anlama Testi (FEMAT) Sevgili öğrenciler,

KADININ STATÜSÜ GENEL MÜDÜRLÜĞÜ. Tarımda Kadınların Finansmana Erişimi Esra ÇADIR

BATI AKDENİZ KALKINMA AJANSI (BAKA) KALKINMA AJANSI DESTEKLERİ

MUŞ ALPARSLAN ÜNİVERSİTESİ UZAKTAN EĞİTİM UYGULAMA VE ARAŞTIRMA MERKEZİ YÖNETMELİĞİ

Milli Gelir Büyümesinin Perde Arkası

ANKARA EMEKLİLİK A.Ş GELİR AMAÇLI ULUSLARARASI BORÇLANMA ARAÇLARI EMEKLİLİK YATIRIM FONU 3 AYLIK RAPOR

MY16 Bulut PBX Benimseme Teklifi Hüküm ve Koşulları

EKONOMİ POLİTİKALARI GENEL BAŞKAN YARDIMCILIĞI Şubat 2014, No: 85

AMASYA ÜNĠVERSĠTESĠ AVRUPA KREDĠ TRANSFER SĠSTEMĠ (ECTS/AKTS) UYGULAMA YÖNERGESĠ. BĠRĠNCĠ BÖLÜM Amaç-Kapsam-Dayanak-Tanımlar

GALATA YATIRIM A.Ş. Halka Arz Fiyat Tespit Raporu DEĞERLENDİRME RAPORU SAN-EL MÜHENDİSLİK ELEKTRİK TAAHHÜT SANAYİ VE TİCARET A.Ş.

BİREYSEL SES EĞİTİMİ ALAN ÖĞRENCİLERİN GELENEKSEL MÜZİKLERİMİZİN DERSTEKİ KULLANIMINA İLİŞKİN GÖRÜŞ VE BEKLENTİLERİ

ELEKTRİK PİYASALARI 2015 YILI VERİLERİ PİYASA OPERASYONLARI DİREKTÖRLÜĞÜ

İSTANBUL KEMERBURGAZ ÜNİVERSİTESİ ÖNLİSANS VE LİSANS PROGRAMLARI ARASINDA YATAY GEÇİŞ YÖNERGESİ. BİRİNCİ BÖLÜM Amaç, Kapsam, Dayanak ve Tanımlar

Dönemi Piyasa Yapıcılığı Sözleşmesi

Duyucular (sensörler)

KURUYEMİŞ SEKTÖR RAPORU

Başbakanlık Mevzuatı Geliştirme ve Yayın Genel Müdürlüğü :18

POMPA ve KOMPRESÖRLER

25 Nisan 2016 (Saat 17:00 a kadar) Pazartesi de, postaya veya kargoya o gün verilmiş olan ya da online yapılan başvurular kabul edilecektir.

HÂKİMLER VE SAVCILAR YÜKSEK KURULU HUKUKİ MÜZAKERE TOPLANTILARI PROJE FİŞİ

Başbakanlık (Hazine Müsteşarlığı) tan:

Bölüm 11. Yönetim Stratejilerinin Uygulanmasında Kullanılan Teknikler İŞLETME BİRLEŞMELERİ. (Mergers)

GTİP 9401: Ağaç, Mantar, Kemik, Sert Kauçuk, Plastik vb. İşleme Makineleri

ÖNSÖZ. Sevgili MMKD üyeleri,

İngilizce İletişim Becerileri II (ENG 102) Ders Detayları

Sayın Bakanım, Sayın Rektörlerimiz ve Değerli Katılımcılar,

Mekatroniğe Giriş Dersi

KAVRAMLAR. Büyüme ve Gelişme. Büyüme. Büyüme ile Gelişme birbirlerinden farklı kavramlardır.

MADDE 3 (1) Bu Yönetmelik, 4/11/1981 tarihli ve 2547 sayılı Yükseköğretim Kanununun 14 ve 49 uncu maddelerine dayanılarak hazırlanmıştır.

ELLE SÜT SAĞIM FAALİYETİNİN KADINLARIN HAYATINDAKİ YERİ ARAŞTIRMA SONUÇLARI ANALİZ RAPORU

SÜREÇ YÖNETİMİ VE SÜREÇ İYİLEŞTİRME H.Ömer Gülseren > ogulseren@gmail.com

Sürdürülebilir sosyal güvenli in önündeki zorluklar

ÖLÇÜ TRANSFORMATÖRLERİNİN KALİBRASYONU VE DİKKAT EDİLMESİ GEREKEN HUSUSLAR

VEZNE PROGRAMINDA POSTA ÜCRETİ İLE İLGİLİ YAPILAN DÜZENLEMELER (Vezne Sürüm: )

ARCHİ DANIŞMANLIK VE GAYRİMENKUL DEĞERLEME A.Ş. KALİTE GÜVENCE SİSTEMİ, GÖZDEN GEÇİRME RAPORU. Sayfa 1 / 7

Yılları Arası Yatırım Teşvik Belgelerinin Analizi

ZAĞNOS VADİSİ KENTSEL DÖNÜŞÜM PROJESİ

SÜRE BİLİŞİM TEKNOLOJİLERİ ÜNİTE 1: : BİLGİ VE TEKNOLOJİ DERS SAATİ: 7

PATOLOJİ DERNEKLERİ FEDERASYONU ETİK YÖNERGE TASLAĞI. GEREKÇE: TTB UDEK kararı gereğince, Federasyon Yönetim

ÖZEL BÖLÜM I KOJENERASYON. TÜRKOTED İltekno Topkapı Endüstri ST ELEKTRİK-ENERJİ I NİSAN 2016

Bilgi Toplumu Stratejisi Eylem Planı 2. Değerlendirme Raporu. e-dtr İcra Kurulu 26. Toplantısı 26 Aralık 2008

PLASTİK TEKNİKERİ A-GÖREVLER

Koru1000. Koru1000. beklentilerinizin ötesinde!

KAMU İHALE KANUNUNA GÖRE İHALE EDİLEN PERSONEL ÇALIŞTIRILMASINA DAYALI HİZMET ALIMLARI KAPSAMINDA İSTİHDAM EDİLEN İŞÇİLERİN KIDEM TAZMİNATLARININ

Sound Bar. Başlangıç Kılavuzu HT-CT370

Yersel Lazer Tarayıcılar ile 3 Boyutlu Modelleme

KÜRESEL GELİŞMELER IŞIĞI ALTINDA TÜRKİYE VE KUZEY KIBRIS TÜRK CUMHURİYETİ EKONOMİSİ VE SERMAYE PİYASALARI PANELİ

Mikrodenetleyici Tabanlı, Otomatik Kontrollü Çöp Kamyonu Tasarımı

Veri Toplama Yöntemleri. Prof.Dr.Besti Üstün

DİKKAT! SORU KİTAPÇIĞINIZIN TÜRÜNÜ "A" OLARAK CEVAP KÂĞIDINA İŞARETLEMEYİ UNUTMAYINIZ. SAYISAL BÖLÜM SAYISAL-2 TESTİ

TEOG ÖZEL OKULLAR MODELİ İLE ÖĞRENCİ ALACAK ÖZEL OKULLARIN KAYIT TAKVİMİ 2016

PROJE ADI DOĞAL ÇEVRECĠ SEBZE-MEYVE KURUTMA SĠSTEMĠ. PROJE EKĠBĠ Süleyman SÖNMEZ Ercan AKÇAY Serkan DOĞAN. PROJE DANIġMANLARI

DÜNYA EKONOMİK FORUMU KÜRESEL CİNSİYET AYRIMI RAPORU, Hazırlayanlar. Ricardo Hausmann, Harvard Üniversitesi

GÖKTAŞ İNŞAAT TİCARET LİMİTED ŞİRKETİ 2012 YILI FAALİYET RAPORU

: 3218 Sayılı Serbest Bölgeler Kanunu Genel Tebliği (Seri No: 1) nde Değişiklik Yapılmasına Dair Tebliğ (Seri No: 3) yayımlandı.

DEMİRYOLUNUN GELİŞTİRİLMESİ İÇİN YENİ YAPILANMA SERBESTLEŞME TÜRKİYE DEMİRYOLU ALTYAPISI VE ARAÇLARI ZİRVESİ EKİM 2013 İSTANBUL TÜRKİYE

CEZAİ ŞARTIN TEK YANLI KARARLAŞTIRILAMAYACAĞI

Sıva altı montaj için Symaro sensörleri yenilikçi ve enerji verimli

2015 OCAK ÖZEL SEKTÖR DI BORCU

İngilizce Öğretmenlerinin Bilgisayar Beceri, Kullanım ve Pedagojik İçerik Bilgi Özdeğerlendirmeleri: e-inset NET. Betül Arap 1 Fidel Çakmak 2

6. ODA MERKEZ BÜRO İŞLEYİŞİ

ÇUKUROVA'DA OKALİPTÜS YETİŞTİRİCİLİĞİ VE İDARE SÜRELERİNİN HESAPLANMASI

T.C. ÇANAKKALE ONSEKİZ MART ÜNİVERSTESİ EĞİTİM BİLİMLERİ ENSTİTÜSÜ PROGRAMLARA BAŞVURU VE KABUL ESASLARI

ELEKTRONİK VE HABERLEŞME MÜHENDİSİ

Transkript:

BİLGİSAYAR DESTEKLİ BİR DİL PROGRAMI -Türkçe Konuşma - Tanıma Sistemi- Prof. Dr. Fatih KİRİŞÇİOĞLU Bilgisayarlı Dil Uzmanı Erkan KARABACAK Proje Sorumlusu Çetin ÇETİNTÜRK Tanımlar : Konuşma Tanıma : Dil Modeli : Gerçek Zamanlı Konuşma Tanıma : Kelime Kapasitesi : Bilgisayar yazılımı ile konuşmanın yazıya dönüştürülmesini ifâde eder. Dilin söz ve ek diziliş kurallarının bilgisayar yazılımı ile modellenmesini ifâde eder. Konuşmanın yazıya dönüştürülmesi işleminin süre olarak konuşmadan daha kısa olmasını ifâde eder. Konuşma tanıma sisteminin tanıyabileceği birbirinden farklı kelime sayısıdır. Ek alarak şekil değiştiren kelimeler farklı kelime sayılmaktadır. ÖZET İnsan için en doğal ve en kolay iletişim yöntemi konuşmadır. 21nci yüzyılın ileri teknolojili-akıllı cihazların çağı olacağını beklemekteyiz. Akıllı olmanın ve kolay kullanılabilir olmanın temel şartlarından birisi de konuşma tanıyabilmektir. Bu çağda yaşayan insanlar olarak bilgisayardan cep telefonuna, otomobile kadar pek çok cihazı konuşarak kullanabileceğimiz bir teknolojiye oldukça yaklaşmış durumdayız. Konuşma tanıma teknolojisi özellikle, 2000 li yıllarda yaygınlaşmaya başlayan İngilizce için uzun zamandır geliştirilmekte olan bir teknolojidir. Güzel Türkçemizin de bu konuda önde olması için özel bir yazılım firması tarafından uzun süredir bir araştırma projesi yürütülmektedir. Söz konusu proje çerçevesinde Dünyada ilk defa Türkçe için gerçek zamanlı ve yüksek kapasiteli bir konuşma tanıma sistemi geliştirilmiştir. Geliştirilmiş olan teknoloji Dünya üzerindeki benzer teknolojilere kıyasla önemli üstünlüklere sahiptir. Söz konusu sistem milyonlarca Türkçe kelimeyi (ek alarak şekil değiştiren kelime farklı kelime sayılmaktadır) gerçek zamanlı (konuşma süresinden daha kısa sürede) olarak tanıyabilmektedir. Sistemin sağlıklı olarak çalışabilmesi için Dünya nın en karmaşık dil modellerinden biri oluşturulmuştur. Bu çalışma sırasında internetten indirilen milyarlarca kelimeden oluşan elektronik metin veri tabanı otomatik yazılımlarla analiz edilmiş ve bu analiz sonucunda yapısal bir Türkçe dil modeli oluşturulmuştur.

Geliştirilen Türkçe konuşma tanıma teknolojisi ülkemiz ve Türkçe konuşan diğer ülkeler için çok önemlidir. Bu teknoloji hemen her iş kolunda performansın artmasını, maliyetlerin düşmesini, işlerin hızlandırılmasını sağlayacağı gibi kitap, tez, makale gibi eserlerin oluşturulmasını kolaylaştıracağından sanatın, bilim ve teknolojinin gelişmesine de katkıda bulunacaktır. KONUŞMA TANIMA Konuşma Tanıma süreci mikrofondan alınan sesin sayılara dönüştürülmesiyle başlar. Bir ses algılama algoritması, sayısallaştırılan sinyali inceleyerek konuşmanın nerede başladığını ve bittiğini tespit eder. Algılanan konuşma parçası tanımada kullanılacak parametrelerin hesaplanması için çeşitli Sayısal Sinyal İşleme (Digital Signal Processing) algoritmalarından geçirilir. Söz konusu parametreler, Dil modeli ile desteklenmiş, bir tür yapay zeka algoritması olan tanıma algoritması tarafından konuşma tanıma için kullanılır. Mikrofondan alınan ses ADC (Analog Dijital Dönüştürücü) ile sayılara dönüştürülür. Dijital ses verilerinden 15-20 ms aralıklarla tanımada kullanılacak parametreler çıkarılır. Akustik olarak algılanan sese en çok benzeyen kelimeler seçilir ve her birinin akustik olasılığı hesaplanır. Akustik olasılığı yüksek olan kök veya türetilmiş kelimelerden yeni kelimeler türetilir veya bir sonraki kelime için yeni kök kelimeler tanıma algoritmasına önerilir. Akustik değerlendirme sonucu seçilen kelimelerden hangilerinin gramer olarak uygun olduğu belirlenir, her birine bir gramer olasılığı atanır ve akustik değerlendirmenin yükünü azaltmak için sonraki kelimeler tahmin edilir. Döngünün sonunda en yüksek olasılığı olan dizi tanınan kelime dizisi olur.

Tanıma sürecinde kritik olan nokta tanınacak olan kelimenin önceden bilinmesinin zorunlu olmasıdır. Bilgisayar üzerindeki tanıma işlemleri gerçekte karşılaştırma işlemleri olup bu tür bilgisayar yazılımları önceden seçenek listesinde olmayan bir sonuca ulaşamazlar. Türkçe için zorluk bu noktadadır. TÜRKÇE Türkçe eklemeli yapısı nedeniyle çok üretken bir dildir. Sadece bir kök kelimeden yapım ve çekim ekleri kullanılarak milyonlarca yeni kelime türetmek mümkündür. Bu çeşitlilik dilimize çok büyük bir ifâde gücü kazandırır. Yapım ve çekim ekleri almış pek çok kelimeyi bir başka dile tercüme etmek için cümle kurmanız gerekmektedir. Aşağıdaki tabloda Türkçenin çok daha az sembolle çok daha fazla bilgi taşıdığı ayrıca bir kök kelimeden çok farklı anlamlarda yeni kelimeler üretebildiği açıkça görülmektedir. "al_" Kökünden Türetilmiş Kelimeler Alsam Aldıysan Alacaklı Almalıydım Alıcı Alabilirsem Almalıysanız Alıcısızlıkla Alıcılaşabilenlerdendi İngilizce Karşılığı I wish I take If you had taken Creditor I would have taken Buyer If I can take If you should take With having no buyer (client) He was one of those that was able to become buyer Dinleyici, kök kelimenin anlamını biliyorsa, Türkçe kurallara uygun türetilerek söylenen kelimeyi hayatında hiç duymamış dahi olsa anlar. Bu durum gerçekte çok sık karşılaşılan bir durumdur. Örnek: Bugün için arama motoru olan Google da zürriyetsizmiş kelimesini ararsanız yalnızca 1 defa bulunacaktır. Bir kelimenin internette oluşturulmuş tüm metinlerde yalnızca bir defa geçmesi bir istisna gibi görünebilir ancak aşağıda anlatılan çalışma bu durumun aslında çok sık rastlanılan bir gerçek olduğunu açıkça göstermektedir. Türetilmiş kelimelerin görülme sıklıklarını incelemek için toplam 640 Milyon kelimeden (Yaklaşık 6gb) oluşan bir Türkçe metin verisi incelenmiştir. Birbirinden farklı kelime sayısının 1,410,000 adet olduğu görülmüştür. Aşağıdaki grafiğe bakınız. Burada biraz önceki örnekte anlatılan durum açıkça görülmektedir. Birbirinden farklı 1,410,000 kelimenin 370,000 tanesi yalnızca 1 defa görülmüştür. İncelenen veri tabanında 2 defa tekrar eden kelime sayısı yaklaşık 170,000, 3

defa tekrar eden kelime sayısı yaklaşık 100bindir. Tekrar sayısı arttıkça kelime sayısı hızla azalmaktadır. 25 defa tekrar eden kelime sayısı 5bin iken 100 defa tekrar eden kelime sayısı sadece 885 dir. 400000 350000 300000 250000 200000 150000 100000 50000 0 1 5 15 25 Eğer türetilmiş kelimelerin hepsi günlük hayatta çok sık kullanılıyor olsaydı bunları metinlerden tespit etmek mümkün olabilirdi. Ancak görüldüğü gibi 640 milyon kelimeden oluşan bir veri tabanındaki birbirinden farklı 1,410,000 kelimenin yaklaşık %45 i 3 veya daha az sayıda görülmüştür. Görüldüğü gibi metin toplayarak kullanılabilecek kelimeleri tespit etmek mümkün değildir. Bu nedenle konuşma tanıma projesinde; Türkçe ek ekleme kurallarına uygun olarak kelime türeten bir dil modeli oluşturulmuştur. Tanıma algoritması yeterince hızlı ve doğru olduğu için kullanılmayan türetilmiş kelimeler bir sorun teşkil etmemektedir. Konuşma tanıma sisteminde kullanmak üzere Türkçe için geliştirdiğimiz dil modeli bir tane isim kökten 15 Milyon adet farklı yazılışta kelime türetebilmektedir. Sık kullandığımız kök kelime sayısının 25 bin civarında olduğunu düşünürseniz. Muhtemel türetilmiş kelime sayısının 200 Milyardan fazla olduğu ortaya çıkar. Geliştirilen dil modeli teorik olarak birbirinden farklı 300 milyar kelime sentezleyebilecek durumdadır. GELİŞTİRİLEN KONUŞMA TANIMA TEKNOLOJİSİ Konuşma tanıma sistemleri kelime kapasitelerine göre sınıflandırılırlar. Çünkü tanınan temel birim kelimedir. Kelime kapasitesi artırıldığında belirsizlik artacağı için doğru orantılı olarak hata yüzdesi de artar, ayrıca doğru orantılı olarak tanıma süresi ve işlemci yükü de artar. Dünya üzerindeki en büyük sistemlerin kapasitesi 100,000 kelime civarındadır. Bu bildiride anlatılan sistem gerçek zamanlı olarak 300 Milyar kelime tanıma kapasitesine sahiptir. Söz konusu sistem 3 milyon kat daha yüksek bir iş zorluğu ile karşı karşıya olmasına rağmen tanıma doğruluğu ve hızı yönünden diğer sistemlerden geri kalmayan bir performansa sahiptir.

Bu bildiride anlatılan proje 2001 yılında başlamış olup 2004 yılında Dünya üzerindeki bilinen konuşma tanıma teknolojisinin seviyesi yakalanmıştır. 2004 yılında ulaşılan kelime kapasitesi 100 bindir. 2004 den sonraki 4 yıl tamamen araştırma ve yeni teknolojiler geliştirme ile geçmiştir. Bu süreç içinde sistemin çalışmasını sağlayacak yeni algoritmalar ve modeller icat edilmiştir. Kaynaklar : Muharrem Ergin, Türk Dil Bilgisi, İstanbul 1983. Zeynep Korkmaz, Türkiye Türkçesi Grameri (Şekil Bilgisi), Ankara 2003. Türkçe Sözlük, Türk Dil Kurumu Yayınları :549, Ankara 2005. Yazım Kılavuzu, Türk Dil Kurumu Yayınları :859, Ankara 2005. Tuncer Gülensoy, Türkiye Türkçesindeki Türkçe Sözcüklerin Köken Bilgisi Sözlüğü, Türk Dil Kurumu Yayınları :911, Ankara 2007, 2 Cilt Tahsin Banguoğlu, Türkçenin Grameri (tıpkıbasım), Ankara 2007. Geniş Dağarcıklı Türkçe Konuşma Tanıma İçin Yeni Bir Kod Çözme Algoritması Onur Çilingir, Mübeccel Demirekler TREN- TURKISH SPEECH RECOGNITION PLATFORM Hasan Palaz, Alper Kanak, Yücel Bicil, Mehmet Uğur Doğan, Tuba İslam Türkçe Gazete Haberleri Dikte Sistemi Ebru Arısoy, Levent M. Arslan