- 1 8 Konuþmayý Yazýya Dökme El yazýnýn yerini alacak bir aygýt düþü XIX. yüzyýlý boyunca çok kiþiyi meþgul etmiþtir. Deðiþik tasarým örnekleri görülmekle beraber, daktilo dediðimiz aygýtýn satýlabilir biçimi 1870'lerde gerçekleþtirilebilmiþtir. Daktilo yaklaþýk bir yüzyýl boyunca, bireysel bilgisayarlarýn yaygýnlaþmaýna deðin, önemli katkýlarda bulunmuþtur. Birevsel bilgisayarlarýn 1985 yýlýndan sonraki hýzlý geliþimi, özellikle dizüstü bilgisayarlarýn yaygýnlaþmasý ve buna koþut olarak yazýcý tekniklerindeki geliþmeler, daktilonun saltanatýna son vermiþtir. Günümüzde, yazarlar, haberciler, bilim adamlarý yazýlarýný artýk bilgisayarda yazmaktadýr.
2 - Konuþmayý Yazýya Dökme Bilgisayarýn tuþ takýmý, doðal olarak daktilodan esinlenmiþtir. Tuþ takýmýndaki harflerin diziliþi de daktilonun ilk gerçekleþtirildiði dönemlerden kalmadýr. Ticari olarak üretilen ilk dönem daktilolarda, parmak vuruþu ile hareket eden ve ucunda harf kabartmasý olan kollar yazý kaðýdý önündeki karbon þerit üzerinden kaðýda vurmakta; böylece kaðýt üzerinde görünen harfi oluþturmaktaydý. Hýzlý yazmaya kalkýþýldýðýnda, bir öceki kol geri gelemeden, bir sonraki kol hareket etmekte, dolayýsýyla önceki kola arkadan vurmaktaydý. Bu teknik sorunu çözebilmek için, daktilo üreticilerinin bulduðu çözüm, insanlarý yavaþ yazmaya zorlayacak bir tuþ takýmý tasarýmý yapmaktýr. Bugün kullanýlan "QWERTY" düzenindeki tuþ takýmýndaki harflerin diziliþi, insanlarý yavaþ yazmaya zorlayan bir diziliþtir. Günümüde, yazý yazmayý yavaþlatmaya gerek olmamasýna karþýn eski alýþkanlýklar deðiþtirilemediðinden bazý ülkelerde hâlâ ayný tuþ takýmý diziliþi kullanýlmaktadýr. Ýnsanlarýn yazýlarýný hýzlý biçimde yazabilmeleri için bir çalýþma baþlatýldýðýnda, öncelikle dilin özelliðinin ortaya konmasý gerekir. Böyle bir araþtýrma Türkçe için yapýldýðýnda ortaya çýkan sonuçlar þöyledir: Türkçe metinlerde sýk kullanýlan harfler a, e, k, i, m, l, t ve r dir. Bu harflerin kullaným sýklýðý yaklaþýk deðer olarak Tablo-8.1'de verilmiþtir. Diðer harflerin kullaným sýklýðý birbirine yakýn olarak ölçülmüþtür. Tablo-8.1: Tükçede sýk kullanýlan harfler Harf Kullaným sýklýðý (%) a 17 e 10 k 9 i 9 m 7,3 l 6,6 t 6 r 6 Türkçede hece yapýlarý da belli olduðu düþünülürse, ünlü ve ünsüzlerin sýralanýþlarýnýn da kurallý olduðu söylenebilir. Bu deðerlendirmelerin sonucu olarak insan parmaklarýnýn kuvvetli olanlarýný, sýk kullanýlan harfler için ayýrmak ve bu harfleri tuþ takýmýnýn orta bölgesinde toplamak doðru bir yaklaþýmdýr. Ýþte bu bu bilimsel düþüncelerle 1943 yýlýnda baþlatýlan Türkçe F tuþ takýmý çalýmalarý 20 Ekim 1955 yýlýnda sonuçlanmýþtýr. Türkçe F tuþ takýmýnda, ünlüler solda ünsüzler sað tarafta kümelenmiþtir. Türkçe F tuþ takýmýnýn hýzlý yazmayý saðladýðý, daktilo hýz yarýþmalarýnda alýnan birinciliklerle kanýtlanmýþtýr.
8.1 Konuþmayý Anlama - 3 Ýnsanlarýn, günümüzdeki düþü, konuþtuðunu yazan aygýtý yapmaktýr. Bu düþü gerçekleme konusunda önemli çalýþmalarýn yapýldýðýna tanýk olunmaktadýr. Konuþmayý daðýda dökecek aygýt yazýcý olmakla beraber, metne dönüþtürücek aygýtýn bilgisayar olacaðý açýktýr. Þekil-8.1'den görüldüðü gibi, insan konuþmasý, mikrofon tarafýndan elektrik sinyallerine dönüþtürülmekte; ardýndan bu sinyaller bilgisayar tarafýndan yazýya dökülmektedir. Yazýyý kaðýt üzerinde görmek istediðimizde yazýcý kullanmaktayýz. 8.1 Konuþmayý Anlama Ýnsan konuþmasýný anlamak üzere gerçekleþtirilen dizgeye, "Konuþma Tanýma Dizgesi (KTD) adýný vermekteyiz. Bu dizge, bilgisayar dýþýnda bir donanýmla gerçekleþtirilebileceði gibi, bilgisayarýn içinde de gerçekleþtirilebilir. Þekil-8.2'de KTD'si ana hatlarý ile gösterilmþtir. gösterilmiþtir. Mikrofon aracýlýðý ile elektrik sinyaline dönüþtürülmiþ olan insan sesindeki bir sözcüðü, ilk olarak Konuþma Tanýma Dizgesine tanýtýlmalýdýr. Tanýtým aþamasýnda, mikrofondan gelen elektrik sinyali gürültüden ayýklanýr, genlik ayarlamasý yapýlýr ve sözcüklere ayrýlýr. Sözcüklere ayýrma iþleminde, veri tabanýnda bulunan eðitim verilerinden yararlanýlýr. Bu aþamada, ses sinyaline özgü temel bileþenler, örneðin sinyalin örüntüsü, enerjisi gibi özellikleri tanýnmaya çalýþýlýr. Tanýnma aþamasýný geçen ses sinyali, ardýndan modellenir ve sýnýflandýrýlýr. Sýnýflandýrmanýn ardýndan, ses sinyaline karþý düþen sözcüðün taranmasýna geçilir. Tarama aþamasýnda, dilin aküstik, sözcük ve dil modelleri göz önünde bulundurulur. Bu çalýþmalarýn sonuda, sözcüðün tam karþýlýðý bulunmaya çalýþýlýr. Konuþma tanýma dizgesinin iç yapýsý Þekil-8.1'de verilmiþtir. Konuþmayý tanýyýp yazýya aktaran dizgenin, hiç yanlýþsýz çalýþacaðý söylenemez. Bu tür dizgeler, bazý sözcükleri yanlýþ tanýmakta, dolayýsýyla yanlýþ karþýlýk sözcük üretmektedir. Bazý Þekil-8.1: Konuþma Tanýma Dizgesinin (KTD) ana yapýsý
4 - Konuþmayý Yazýya Dökme durumlarda, duyduklarý sözcükle hiç ilgisi olmayan sözcük türetmektedir. Ayný dizgeler çözümleyemedikleri sözcüklere karþýlýk bulmadan bu sözcüðü silmektedirler. (8-1) baðýntýsýnda bir konuþmayý tanýma dizgesinin baþarýmýnýn nasýl hesaplanacaðý gösterilmiþtir. H Y E S N (8-1) Bu baðýntýda H, dizgenin hata oranýný, Y, yanlýþ karþýlýk, E, yanlýþ ekleme, S, silinen ve N toplam sözcük sayýsýný göstermektedir. (8-1) baðýntýsý, aslýnda, dizgenin baþarýzýlýk deðerini vermektedir. Baþarýyý B ile gösterirsek; olacaðý açýktýr. B= 1- H (8-2) Konuþmayý yazýya dönüþtüren bir dizgenin baþarýmýndan söz edildiðinde, dizgenin yeteneklerini de tanýmlamak gerekir. Bazý KTD'ler belli konulardaki konuþmalar için tasarlanmýþ iken bazýlarý genel amaçlýdýrlar. Tablo-8.2'de bu tür dizgelerin özellikleri sýnýflandýrýlmýþ biçimde gösterilmiþtir. Þekil-8.2: Konuþma Tanýma Dizgesinin iç yapýsý
8.1 Konuþmayý Anlama - 5 Tablo-8.2:Konuþmayý Tanýma Dizgelerinin Sýnýflandýrýlmasý Yetenek Konuþma biçimi Konuþma türü Katýlým Sözlük Dil modeli Þaþýrtma Sinyal/gürültü oraný Dönüþtürücü Çalýþma koþullarý Tek tek sözcük söyleme Sürekli konuþma Konuþana baðýmlý ya da baðýmsýz 20 Sözcükten az ya da 50.000 sözcükten fazla Sonlu durum yaklaþýmý ya da içeriðe duyar yaklaþým 10 dan az ya da 200 den çok 10 db den küçük ya da 30 db den büyük Gürültüden arýndýrýlmýþ mikrofon ya da cep telefonu Þekil-8.3: