Türkçe için Konuşma Tanıma ve Derin Öğrenmeyle Dil Modelleme

Ebat: px
Şu sayfadan göstermeyi başlat:

Download "Türkçe için Konuşma Tanıma ve Derin Öğrenmeyle Dil Modelleme"

Transkript

1 Türkçe için Konuşma Tanıma ve Derin Öğrenmeyle Dil Modelleme Ebru Arısoy Elektrik-Elektronik Mühendisliği Bölümü MEF Üniversitesi 3 Temmuz 218

2 EBRU ARISOY 22 Boğaziçi Universitesi EE (BS) 24 Boğaziçi Universitesi EE (MS) 29 Boğaziçi Universitesi EE (PhD) IBM TJ Watson Research Center IBM Türkiye MEF Üniversitesi

3 Içerik Part 1: Otomatik Konuşma Tanıma (Genel Bilgi) Part 2: Türkçe Konuşma Tanıma Part 3: Derin Öğrenme ile Dil Modelleme

4 Otomatik Konuşma Tanıma Part I Otomatik Konuşma Tanıma (Genel Bilgi)

5 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Otomatik Konuşma Tanıma Amaç: Bir ses sinyaline karşılık gelen metinleri otomatik olarak belirlemek nice cat W ^ W mice cat W = {w 1 nice cat w n}, w i V: sabit ve sınırlı dağarcık Dağarcık Dışı Kelime (DDK) A = {a 1 a 2 a t}, a i A: sinyal işleme yöntemleri ile öznitelik çıkarımı P(A W )P(W ) Ŵ = argmax P(W A) = argmax P(A) W W = argmax P(A W )P(W ) W

6 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Otomatik Konuşma Tanıma Amaç: Bir ses sinyaline karşılık gelen metinleri otomatik olarak belirlemek nice cat W ^ W mice cat W = {w 1 nice cat w n}, w i V: sabit ve sınırlı dağarcık Dağarcık Dışı Kelime (DDK) A = {a 1 a 2 a t}, a i A: sinyal işleme yöntemleri ile öznitelik çıkarımı P(A W )P(W ) Ŵ = argmax P(W A) = argmax P(A) W W = argmax P(A W )P(W ) W

7 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Otomatik Konuşma Tanıma Amaç: Bir ses sinyaline karşılık gelen metinleri otomatik olarak belirlemek nice cat W Front-end A Decoder ^ W mice cat W = {w 1 nice cat w n}, w i V: sabit ve sınırlı dağarcık Dağarcık Dışı Kelime (DDK) A = {a 1 a 2 a t}, a i A: sinyal işleme yöntemleri ile öznitelik çıkarımı P(A W )P(W ) Ŵ = argmax P(W A) = argmax P(A) W W = argmax P(A W )P(W ) W

8 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Otomatik Konuşma Tanıma Amaç: Bir ses sinyaline karşılık gelen metinleri otomatik olarak belirlemek nice cat W Front-end A Decoder ^ W mice cat W = {w 1 nice cat w n}, w i V: sabit ve sınırlı dağarcık Dağarcık Dışı Kelime (DDK) A = {a 1 a 2 a t}, a i A: sinyal işleme yöntemleri ile öznitelik çıkarımı P(A W )P(W ) Ŵ = argmax P(W A) = argmax P(A) W W = argmax P(A W )P(W ) W

9 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Otomatik Konuşma Tanıma Amaç: Bir ses sinyaline karşılık gelen metinleri otomatik olarak belirlemek nice cat W Front-end A Decoder ^ W mice cat W = {w 1 nice cat w n}, w i V: sabit ve sınırlı dağarcık Dağarcık Dışı Kelime (DDK) A = {a 1 a 2 a t}, a i A: sinyal işleme yöntemleri ile öznitelik çıkarımı P(A W )P(W ) Ŵ = argmax P(W A) = argmax P(A) W W = argmax P(A W )P(W ) W

10 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Otomatik Konuşma Tanıma Amaç: Bir ses sinyaline karşılık gelen metinleri otomatik olarak belirlemek nice cat W HMM for phones ae1 ae2 ae3 lexicon cat: k ae t P(A W) Front-end A Decoder ^ W mice cat W = {w 1 nice cat w n}, w i V: sabit ve sınırlı dağarcık Dağarcık Dışı Kelime (DDK) A = {a 1 a 2 a t}, a i A: sinyal işleme yöntemleri ile öznitelik çıkarımı P(A W )P(W ) Ŵ = argmax P(W A) = argmax P(A) W W = argmax P(A W )P(W ) W

11 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Otomatik Konuşma Tanıma Amaç: Bir ses sinyaline karşılık gelen metinleri otomatik olarak belirlemek nice cat W HMM for phones ae1 ae2 ae3 lexicon cat: k ae t language model P(A W) P(W) Front-end A Decoder ^ W mice cat W = {w 1 nice cat w n}, w i V: sabit ve sınırlı dağarcık Dağarcık Dışı Kelime (DDK) A = {a 1 a 2 a t}, a i A: sinyal işleme yöntemleri ile öznitelik çıkarımı P(A W )P(W ) Ŵ = argmax P(W A) = argmax P(A) W W = argmax P(A W )P(W ) W

12 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Otomatik Konuşma Tanıma Amaç: Bir ses sinyaline karşılık gelen metinleri otomatik olarak belirlemek nice cat W HMM for phones ae1 ae2 ae3 lexicon cat: k ae t language model P(A W) P(W) Front-end A Decoder ^ W mice cat W = {w 1 nice cat w n}, w i V: sabit ve sınırlı dağarcık Dağarcık Dışı Kelime (DDK) A = {a 1 a 2 a t}, a i A: sinyal işleme yöntemleri ile öznitelik çıkarımı P(A W )P(W ) Ŵ = argmax P(W A) = argmax P(A) W W = argmax P(A W )P(W ) W

13 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Akustik Model Akustik Model: Akustik model olarak Saklı Markov Model (SMM) kullanılır Ses kayıtları ve bunlara karşılık gelen referans metinleri kullanılarak eğitilir start ae1 ae2 ae3 æ" için 3-durumlu SMM end start k1 k2 k3 ae1 ae2 ae3 t1 t2 t3 end cat: k æ t" kelimesi için SMM

14 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Akustik Model SMM deki durum çıktı olasılıkları için kullanılan modeller P(A/Q) A: Akustik öznitelik vektörü Q: Sesçik/durum etiketleri Gauss Karışım Modeli (GKM) P(A/Q) hesabı GKM ile yapılır Derin Sinir Ağları (DSA) P(Q/A) hesabı DSA ile yapılır P(A/Q) P(Q/A)/P(Q) SMM de P(A/Q) kullanılır

15 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Dil Modeli İstatistiksel Dil Modeli Bir dildeki her kelime dizilimine olasılık atar, P(W ) n li Dizilimli Dil Modeli W = {w 1 w N } = bu kedi çok sevimli P(W ) = P(bu kedi çok sevimli) = P(bu)P(kedi bu)p(çok bu kedi)p(sevimli bu kedi çok)

16 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Dil Modeli İstatistiksel Dil Modeli Bir dildeki her kelime dizilimine olasılık atar, P(W ) n li Dizilimli Dil Modeli W = {w 1 w N } = bu kedi çok sevimli P(W ) = P(bu kedi çok sevimli) = P(bu)P(kedi bu)p(çok bu kedi)p(sevimli bu kedi çok)

17 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Dil Modeli İstatistiksel Dil Modeli Bir dildeki her kelime dizilimine olasılık atar, P(W ) n li Dizilimli Dil Modeli W = {w 1 w N } = bu kedi çok sevimli P(W ) = P(bu kedi çok sevimli) = P(bu)P(kedi bu)p(çok bu kedi)p(sevimli bu kedi çok)

18 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Dil Modeli İstatistiksel Dil Modeli Bir dildeki her kelime dizilimine olasılık atar, P(W ) n li Dizilimli Dil Modeli W = {w 1 w N } = bu kedi çok sevimli P(W ) = P(bu kedi çok sevimli) = P(bu)P(kedi bu)p(çok bu kedi)p(sevimli }{{} bu kedi çok) }{{} tahmin geçmiş

19 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Dil Modeli İstatistiksel Dil Modeli Bir dildeki her kelime dizilimine olasılık atar, P(W ) n li Dizilimli Dil Modeli W = {w 1 w N } = bu kedi çok sevimli P(W ) = P(bu kedi çok sevimli) = P(bu)P(kedi bu)p(çok bu kedi)p(sevimli }{{} bu kedi çok) }{{} tahmin geçmiş Eğer n = 2 (2 li dizilim) P(W ) P(bu)P(kedi bu)p(çok kedi)p(sevimli çok)

20 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Dil Modeli İstatistiksel Dil Modeli Bir dildeki her kelime dizilimine olasılık atar, P(W ) n li Dizilimli Dil Modeli W = {w 1 w N } = bu kedi çok sevimli P(W ) = P(bu kedi çok sevimli) = P(bu)P(kedi bu)p(çok bu kedi)p(sevimli }{{} bu kedi çok) }{{} tahmin geçmiş Eğer n = 2 (2 li dizilim) P(W ) P(bu)P(kedi bu)p(çok kedi)p(sevimli çok ) }{{} geçmiş n-1 kelime

21 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Dil Modeli n li Dizilimli Dil Modeli Koşullu olasılıklar en büyük olabilirlik kestirimi ile metin verisi üzerinden öğrenilir P(w h) = P(w k w k n+1 w k 1 ) = C(w k n+1 w k 1 w k ) C(w k n+1 w k 1 ) 3 lü dizilim: P(çok bu kedi) = C(bu kedi çok) C(bu kedi) Veri tabanında geçmeyen n li dizilimlere küçük olasılık dağıtımları yapılır

22 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Dil Modeli İleribesleme Sinir Ağı Dil Modeli Sinir Ağları Dil Modeli Koşullu olasılıklar sinir ağları kullanılarak hesaplanır Kelimeler için sürekli uzay gösterimleri öğrenilir w j-n+1 w j-n Projection layer M c d o (n-1) x P b Hidden layer H V k Output layer P(w j =1 h j ) P(w j =i h j ) P(w j =N h j ) w j-1 1

23 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Dil Modeli Öznitelik Tabanlı Dil Modeli Dilbilimsel bilginin dil modelinde kullanılmasını kolaylaştırır Dilbilimsel bilgi öznitelik vektörüne dönüştürülüp dil modellinde kullanılır En büyük entropi dil modeli: Ayırıcı dil modeli: P(w h) = 1 Z (h) e i α i Φ i (w,h) F(W ) = i α i Φ i (W )

24 Otomatik Konuşma Tanıma Genel Bilgi Akustik Model Dil Modeli Dil Modeli Öznitelik Tabanlı Dil Modeli Dilbilimsel bilginin dil modelinde kullanılmasını kolaylaştırır Dilbilimsel bilgi öznitelik vektörüne dönüştürülüp dil modellinde kullanılır En büyük entropi dil modeli: Ayırıcı dil modeli: P(w h) = 1 Z (h) e i α i Φ i (w,h) F(W ) = i α i Φ i (W )

25 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Part II Türkçe Konuşma Tanıma

26 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe nin Dil Özellikleri Türkçe nin Konuşma Tanıma Açısından Zorlukları Türkçe nin Dil Özellikleri 1 Türkçe üretken biçimbilimsel yapıya sahip sondan eklemeli bir dildir bildiridekiler bildiri -de -ki -ler ruhsatlandırılamamasındaki ruhsat -lan -dır -ıl -ama -ma -sı -nda -ki 2 Türkçe serbest kelime dizilimine sahiptir Ben çocuğa kitabı verdim Çocuğa kitabı ben verdim Ben kitabı çocuğa verdim

27 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe nin Dil Özellikleri Türkçe nin Konuşma Tanıma Açısından Zorlukları Türkçe nin Konuşma Tanıma Açısından Zorlukları 1 Sondan eklemeli (üretken biçimbilimsel yapı) bildiridekiler bildiri -de -ki -ler *Şekil için Mathias Creutz a teşekkür ederiz 5 Unique words [1 words] Estonian (planned) Finnish (planned) Turkish (planned) Arabic (planned) Arabic (spontaneous) English (planned) English (spontaneous) Corpus size [1 words] Sondan eklemeli diller: Türkçe, Fince, Estonyaca, Macarca

28 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe nin Dil Özellikleri Türkçe nin Konuşma Tanıma Açısından Zorlukları Türkçe nin Konuşma Tanıma Açısından Zorlukları 1 Sondan eklemeli (üretken biçimbilimsel yapı) yüksek DDK oranı Her DDK 15 Kelime Hata Oranı (KHO) verir! *Şekil için Mathias Creutz a teşekkür ederiz 5 Unique words [1 words] Estonian (planned) Finnish (planned) Turkish (planned) Arabic (planned) Arabic (spontaneous) English (planned) English (spontaneous) Corpus size [1 words] Sondan eklemeli diller: Türkçe, Fince, Estonyaca, Macarca

29 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe nin Dil Özellikleri Türkçe nin Konuşma Tanıma Açısından Zorlukları Türkçe nin Konuşma Tanıma Açısından Zorlukları Unique words [1 words] 1 Sondan eklemeli (üretken biçimbilimsel yapı) yüksek DDK oranı Her DDK 15 Kelime Hata Oranı (KHO) verir! *Şekil için Mathias Creutz a teşekkür ederiz Estonian (planned) Finnish (planned) Turkish (planned) Arabic (planned) Arabic (spontaneous) English (planned) English (spontaneous) Corpus size [1 words] Türkçe: 5K %1 DDK oranı OOV rate (%) % 1% 1K 2K 6K 2K 5K Vocabulary size İngilizce: 6K %1 DDK oranı

30 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe nin Dil Özellikleri Türkçe nin Konuşma Tanıma Açısından Zorlukları Türkçe nin Konuşma Tanıma Açısından Zorlukları 2 Serbest kelime dizilimi Koşullu olasılıklar için gürbüz kestirimler yapılamaz Ben çocuğa kitabı verdim P(W ) P(ben)P(çocuğa ben) P(verdim kitabı) Çocuğa kitabı ben verdim Ben kitabı çocuğa verdim

31 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe nin Dil Özellikleri Türkçe nin Konuşma Tanıma Açısından Zorlukları Türkçe nin Konuşma Tanıma Açısından Zorlukları 2 Serbest kelime dizilimi Koşullu olasılıklar için gürbüz kestirimler yapılamaz Ben çocuğa kitabı verdim P(W ) P(ben)P(çocuğa ben) P(verdim kitabı) Çocuğa kitabı ben verdim P(W ) P(çocuğa)P(kitabı çocuğa) P(verdim ben) Ben kitabı çocuğa verdim P(W ) P(ben)P(kitabı ben) P(verdim çocuğa)

32 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe nin Dil Özellikleri Türkçe nin Konuşma Tanıma Açısından Zorlukları Türkçe nin Konuşma Tanıma Açısından Zorlukları Sondan eklemeli diller için önerilen çözüm: Kelimeler yerine kelime-altı birimlerin konuşma tanımada kullanılması Kelime-altı birimler: Anlamlı kelime bölütleri bildiridekiler bildiri -de -ki -ler Kelime-altı birimlerin konuşma tanıma açısından zorlukları hatalı ses değişimi: bildiri-de-ki-lar hatalı ek dizilimi: bildiri-ki-de-ler anlamlı olmayan dizilim: -ki-de-ler

33 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe nin Dil Özellikleri Türkçe nin Konuşma Tanıma Açısından Zorlukları Türkçe nin Konuşma Tanıma Açısından Zorlukları Sondan eklemeli diller için önerilen çözüm: Kelimeler yerine kelime-altı birimlerin konuşma tanımada kullanılması Kelime-altı birimler: Anlamlı kelime bölütleri bildiridekiler bildiri -de -ki -ler Kelime-altı birimlerin konuşma tanıma açısından zorlukları hatalı ses değişimi: bildiri-de-ki-lar hatalı ek dizilimi: bildiri-ki-de-ler anlamlı olmayan dizilim: -ki-de-ler

34 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe nin Dil Özellikleri Türkçe nin Konuşma Tanıma Açısından Zorlukları Türkçe nin Konuşma Tanıma Açısından Zorlukları Sondan eklemeli diller için önerilen çözüm: Kelimeler yerine kelime-altı birimlerin konuşma tanımada kullanılması Kelime-altı birimler: Anlamlı kelime bölütleri bildiridekiler bildiri -de -ki -ler Kelime-altı birimlerin konuşma tanıma açısından zorlukları hatalı ses değişimi: bildiri-de-ki-lar hatalı ek dizilimi: bildiri-ki-de-ler anlamlı olmayan dizilim: -ki-de-ler

35 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe nin Dil Özellikleri Türkçe nin Konuşma Tanıma Açısından Zorlukları Türkçe nin Konuşma Tanıma Açısından Zorlukları Sondan eklemeli diller için önerilen çözüm: Kelimeler yerine kelime-altı birimlerin konuşma tanımada kullanılması Kelime-altı birimler: Anlamlı kelime bölütleri bildiridekiler bildiri -de -ki -ler Kelime-altı birimlerin konuşma tanıma açısından zorlukları hatalı ses değişimi: bildiri-de-ki-lar hatalı ek dizilimi: bildiri-ki-de-ler anlamlı olmayan dizilim: -ki-de-ler

36 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe nin Dil Özellikleri Türkçe nin Konuşma Tanıma Açısından Zorlukları Türkçe nin Konuşma Tanıma Açısından Zorlukları Sondan eklemeli diller için önerilen çözüm: Kelimeler yerine kelime-altı birimlerin konuşma tanımada kullanılması Kelime-altı birimler: Anlamlı kelime bölütleri bildiridekiler bildiri -de -ki -ler Kelime-altı birimlerin konuşma tanıma açısından zorlukları hatalı ses değişimi: bildiri-de-ki-lar hatalı ek dizilimi: bildiri-ki-de-ler anlamlı olmayan dizilim: -ki-de-ler

37 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe nin Dil Özellikleri Türkçe nin Konuşma Tanıma Açısından Zorlukları Türkçe nin Konuşma Tanıma Açısından Zorlukları Sondan eklemeli diller için önerilen çözüm: Kelimeler yerine kelime-altı birimlerin konuşma tanımada kullanılması Kelime-altı birimler: Anlamlı kelime bölütleri bildiridekiler bildiri -de -ki -ler Kelime-altı birimlerin konuşma tanıma açısından zorlukları hatalı ses değişimi: bildiri-de-ki-lar hatalı ek dizilimi: bildiri-ki-de-ler anlamlı olmayan dizilim: -ki-de-ler

38 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Kelime-altı Birimler ile Konuşma Tanıma Motivasyon: Yöntem: Konuşma Tanımadaki DDK problemini çözmek 1 kelimeleri daha kısa ve anlamlı birimlere bölmek harfler: bildiridekiler b i l d i r i d e k i l e r heceler: bildiridekiler bil di ri de ki ler kök ve ekler: bildiridekiler de ki ler kök ve kök sonrası: bildiridekiler bildiri dekiler 2 kelime-altı birimleri sözlükte kullanmak (Akustik model aynı kalır!) bil: b i l 3 Kelime-altı birimler üzerinden dil modeli eğitmek 3 lü dizilim: P(ri bil di)

39 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Kelime-altı Birimler ile Konuşma Tanıma Motivasyon: Yöntem: Konuşma Tanımadaki DDK problemini çözmek 1 kelimeleri daha kısa ve anlamlı birimlere bölmek harfler: bildiridekiler b i l d i r i d e k i l e r heceler: bildiridekiler bil di ri de ki ler kök ve ekler: bildiridekiler de ki ler kök ve kök sonrası: bildiridekiler bildiri dekiler 2 kelime-altı birimleri sözlükte kullanmak (Akustik model aynı kalır!) bil: b i l 3 Kelime-altı birimler üzerinden dil modeli eğitmek 3 lü dizilim: P(ri bil di)

40 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Kelime-altı Birimler ile Konuşma Tanıma Motivasyon: Yöntem: Konuşma Tanımadaki DDK problemini çözmek 1 kelimeleri daha kısa ve anlamlı birimlere bölmek harfler: bildiridekiler b i l d i r i d e k i l e r heceler: bildiridekiler bil di ri de ki ler kök ve ekler: bildiridekiler de ki ler kök ve kök sonrası: bildiridekiler bildiri dekiler 2 kelime-altı birimleri sözlükte kullanmak (Akustik model aynı kalır!) bil: b i l 3 Kelime-altı birimler üzerinden dil modeli eğitmek 3 lü dizilim: P(ri bil di)

41 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Kelime-altı Birimler ile Konuşma Tanıma Motivasyon: Yöntem: Konuşma Tanımadaki DDK problemini çözmek 1 kelimeleri daha kısa ve anlamlı birimlere bölmek harfler: bildiridekiler b i l d i r i d e k i l e r heceler: bildiridekiler bil di ri de ki ler kök ve ekler: bildiridekiler bildiri de ki ler kök ve kök sonrası: bildiridekiler bildiri dekiler 2 kelime-altı birimleri sözlükte kullanmak (Akustik model aynı kalır!) bil: b i l 3 Kelime-altı birimler üzerinden dil modeli eğitmek 3 lü dizilim: P(ri bil di)

42 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Kelime-altı Birimler ile Konuşma Tanıma Motivasyon: Yöntem: Konuşma Tanımadaki DDK problemini çözmek 1 kelimeleri daha kısa ve anlamlı birimlere bölmek harfler: bildiridekiler b i l d i r i d e k i l e r heceler: bildiridekiler bil di ri de ki ler kök ve ekler: bildiridekiler bildiri de ki ler kök ve kök sonrası: bildiridekiler bildiri dekiler 2 kelime-altı birimleri sözlükte kullanmak (Akustik model aynı kalır!) bil: b i l 3 Kelime-altı birimler üzerinden dil modeli eğitmek 3 lü dizilim: P(ri bil di)

43 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Kelime-altı Birimler ile Konuşma Tanıma Motivasyon: Yöntem: Konuşma Tanımadaki DDK problemini çözmek 1 kelimeleri daha kısa ve anlamlı birimlere bölmek harfler: bildiridekiler b i l d i r i d e k i l e r heceler: bildiridekiler bil di ri de ki ler kök ve ekler: bildiridekiler bildiri de ki ler kök ve kök sonrası: bildiridekiler bildiri dekiler 2 kelime-altı birimleri sözlükte kullanmak (Akustik model aynı kalır!) bil: b i l 3 Kelime-altı birimler üzerinden dil modeli eğitmek 3 lü dizilim: P(ri bil di)

44 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Kelime-altı Birimler ile Konuşma Tanıma Motivasyon: Yöntem: Konuşma Tanımadaki DDK problemini çözmek 1 kelimeleri daha kısa ve anlamlı birimlere bölmek harfler: bildiridekiler b i l d i r i d e k i l e r heceler: bildiridekiler bil di ri de ki ler kök ve ekler: bildiridekiler bildiri de ki ler kök ve kök sonrası: bildiridekiler bildiri dekiler 2 kelime-altı birimleri sözlükte kullanmak (Akustik model aynı kalır!) bil: b i l 3 Kelime-altı birimler üzerinden dil modeli eğitmek 3 lü dizilim: P(ri bil di)

45 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Kelime-altı Birimler ile Konuşma Tanıma Motivasyon: Yöntem: Konuşma Tanımadaki DDK problemini çözmek 1 kelimeleri daha kısa ve anlamlı birimlere bölmek harfler: bildiridekiler b i l d i r i d e k i l e r heceler: bildiridekiler bil di ri de ki ler kök ve ekler: bildiridekiler bildiri de ki ler kök ve kök sonrası: bildiridekiler bildiri dekiler 2 kelime-altı birimleri sözlükte kullanmak (Akustik model aynı kalır!) bil: b i l start b1 b2 b3 i1 i2 i3 l1 l2 l3 end 3 Kelime-altı birimler üzerinden dil modeli eğitmek 3 lü dizilim: P(ri bil di)

46 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Kelime-altı Birimler ile Konuşma Tanıma Motivasyon: Yöntem: Konuşma Tanımadaki DDK problemini çözmek 1 kelimeleri daha kısa ve anlamlı birimlere bölmek harfler: bildiridekiler b i l d i r i d e k i l e r heceler: bildiridekiler bil di ri de ki ler kök ve ekler: bildiridekiler bildiri de ki ler kök ve kök sonrası: bildiridekiler bildiri dekiler 2 kelime-altı birimleri sözlükte kullanmak (Akustik model aynı kalır!) bil: b i l start b1 b2 b3 i1 i2 i3 l1 l2 l3 end 3 Kelime-altı birimler üzerinden dil modeli eğitmek 3 lü dizilim: P(ri bil di)

47 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Anlamlı Kelime-Altı Birimler Kelime-altı birimler bir dildeki kelimeleri üretebilmeli V harfler V heceler < V kök ve ekler < V kök ve kök sonrası V kelimeler dil modeli olasılıklarının hesabı açısından anlamlı birimler olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası fazladan (anlamsız) kelime üretmeye karşı dayanıklı olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası

48 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Anlamlı Kelime-Altı Birimler Kelime-altı birimler bir dildeki kelimeleri üretebilmeli V harfler V heceler < V kök ve ekler < V kök ve kök sonrası V kelimeler dil modeli olasılıklarının hesabı açısından anlamlı birimler olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası fazladan (anlamsız) kelime üretmeye karşı dayanıklı olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası

49 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Anlamlı Kelime-Altı Birimler Kelime-altı birimler bir dildeki kelimeleri üretebilmeli V harfler V heceler < V kök ve ekler < V kök ve kök sonrası V kelimeler dil modeli olasılıklarının hesabı açısından anlamlı birimler olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası fazladan (anlamsız) kelime üretmeye karşı dayanıklı olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası

50 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Anlamlı Kelime-Altı Birimler Kelime-altı birimler bir dildeki kelimeleri üretebilmeli V harfler V heceler < V kök ve ekler < V kök ve kök sonrası V kelimeler dil modeli olasılıklarının hesabı açısından anlamlı birimler olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası fazladan (anlamsız) kelime üretmeye karşı dayanıklı olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası

51 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Anlamlı Kelime-Altı Birimler Kelime-altı birimler bir dildeki kelimeleri üretebilmeli V harfler V heceler < V kök ve ekler < V kök ve kök sonrası V kelimeler dil modeli olasılıklarının hesabı açısından anlamlı birimler olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası fazladan (anlamsız) kelime üretmeye karşı dayanıklı olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası

52 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Anlamlı Kelime-Altı Birimler Kelime-altı birimler bir dildeki kelimeleri üretebilmeli V harfler V heceler < V kök ve ekler < V kök ve kök sonrası V kelimeler dil modeli olasılıklarının hesabı açısından anlamlı birimler olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası fazladan (anlamsız) kelime üretmeye karşı dayanıklı olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası

53 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Anlamlı Kelime-Altı Birimler Kelime-altı birimler bir dildeki kelimeleri üretebilmeli V harfler V heceler < V kök ve ekler < V kök ve kök sonrası V kelimeler dil modeli olasılıklarının hesabı açısından anlamlı birimler olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası fazladan (anlamsız) kelime üretmeye karşı dayanıklı olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası

54 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Anlamlı Kelime-Altı Birimler Kelime-altı birimler bir dildeki kelimeleri üretebilmeli V harfler V heceler < V kök ve ekler < V kök ve kök sonrası V kelimeler dil modeli olasılıklarının hesabı açısından anlamlı birimler olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası fazladan (anlamsız) kelime üretmeye karşı dayanıklı olmalı harfler < heceler < kök ve ekler < kök ve kök sonrası

55 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Anlamlı Kelime-Altı Birimler Dilbilgisel Birimler Kural tabanlı biçimbilimsel ayrıştırıcı kullanılarak elde edilir kök ve ekler, kök ve kök sonrası, İstatistiksel Birimler Metin verisinden eğitmensiz öğrenme ile elde edilir Linguistica, Morfessor 1, Paramor, kök ve ekler: bildiridekiler bildiri -de -ki -ler istatistiksel birimler: bildiridekiler bildir -ide -kiler Kelimelerin sürekli uzay gösterimi ile bölütleme de yapılmaktadır 2 1 Creutz M, Lagus K (25) Unsupervised morpheme segmentation and morphology induction from text corpora using Morfessor 1 Publications in Computer and Information Science Report A81, HUT, Helsinki, Finland 2 Üstün A, Can B Unsupervised Morphological Segmentation Using Neural Word Embeddings In Proceedings of SLSP 216, Pilsen, Czech Republic, 216

56 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Kelime-altı Birimler ile Konuşma Tanıma Anlamlı Kelime-Altı Birimler Anlamlı Kelime-Altı Birimler Dilbilgisel Birimler Kural tabanlı biçimbilimsel ayrıştırıcı kullanılarak elde edilir kök ve ekler, kök ve kök sonrası, İstatistiksel Birimler Metin verisinden eğitmensiz öğrenme ile elde edilir Linguistica, Morfessor 1, Paramor, kök ve ekler: bildiridekiler bildiri -de -ki -ler istatistiksel birimler: bildiridekiler bildir -ide -kiler Kelimelerin sürekli uzay gösterimi ile bölütleme de yapılmaktadır 2 1 Creutz M, Lagus K (25) Unsupervised morpheme segmentation and morphology induction from text corpora using Morfessor 1 Publications in Computer and Information Science Report A81, HUT, Helsinki, Finland 2 Üstün A, Can B Unsupervised Morphological Segmentation Using Neural Word Embeddings In Proceedings of SLSP 216, Pilsen, Czech Republic, 216

57 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe Konuşma Tanıma Sistemi Geliştirilmesi 1 Veri tabanı oluşturulması Akustik veri: Ses kayıtları ve referans metinleri Metin verisi: Örün sitelerinden toplanmış metinler 2 Akustik model eğitimi SMM-GKM ve DSA ile eğitim Yöntemler dilden bağımsızdır Türkçe için sözlükte (genelde) sesler için harfler kullanılır 3 Dil modeli eğitimi Türkçe için anlamlı kelime-altı birimlerinin araştırılması Ayırıcı dil modellerinin dilbilimsel ve istatistiksel özniteliklerle kullanılması Sinir Ağları (SA) dil modellerinin kullanılması

58 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe Konuşma Tanıma Sistemi Geliştirilmesi 1 Veri tabanı oluşturulması Akustik veri: Ses kayıtları ve referans metinleri Metin verisi: Örün sitelerinden toplanmış metinler 2 Akustik model eğitimi SMM-GKM ve DSA ile eğitim Yöntemler dilden bağımsızdır Türkçe için sözlükte (genelde) sesler için harfler kullanılır 3 Dil modeli eğitimi Türkçe için anlamlı kelime-altı birimlerinin araştırılması Ayırıcı dil modellerinin dilbilimsel ve istatistiksel özniteliklerle kullanılması Sinir Ağları (SA) dil modellerinin kullanılması

59 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe Veri tabanları Akustik Veri Tabanı = Ses Kayıtları + Referans Metinleri Mikrofon ile Toplanan Kayıtlar: GlobalPhone: Türkçe için 17 saat (ELRA ve Appen Butler Hill Pty Ltd) METU Microphone Speech: 1 saat (LDC - LDC26S33) Sabancı Üniversitesi nde toplanan akustik veri: 3 saat 3 Telefon Üzerinden Toplanan Kayıtlar: OrienTel Projesi: 17 konuşmacı (ELRA) IARPA Babel Turkish Language Pack: 213 saat (LDC - LDC216S1) SESTEK in topladığı çağrı merkezi konuşmaları: 1 saat 4 Haber Programı Kayıtları: 13 saat Türkçe programlar (LDC - LDC212S6) 3 Erdogan H, Büyük O, Oflazer K (25) Incorporating language constraints in sub-word based speech recognition In: Proceedings of ASRU, San Juan, PR, pp Haznedaroğlu A, Arslan LM, Büyük O, Eden M (21) Turkish LVCSR system for call center conversations In: Proceedings of SIU, Diyarbakır, Turkey, pp

60 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe Veri tabanları MetinVeritabanı 184 M kelimelik gazete haberleri metinleri 5 81 M kelimelik haber ve e-kitap metinleri 6 5 Sak H, Güngör T, Saraçlar M (211) Resources for Turkish morphological processing Language Resources and Evaluation 45(2): Erdogan H, Büyük O, Oflazer K (25) Incorporating language constraints in sub-word based speech recognition In: Proceedings of ASRU, San Juan, PR, pp 98 13

61 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe için Akustik Model Akustik model olarak Saklı Markov Model (SMM) kullanılmıştır SMM deki durum çıktı olasılıkları için GKM ve DSA denemiştir DSA Akustik Modeli Derin sinir ağı mimarileri Çok katmanlı ileribesleme Yinelemeli ve türevleri Zaman gecikmeli Amaç işlevleri Çapraz entropi Dizisel ayırıcı eğitim Örüsüz en büyük ortak bilgi

62 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe için Akustik Model - Sonuçlar Türkçe Haber Programları için GDSKT 7 Akustik Veri: 188 saat (eğitim), 3 saat (geliştirme), 3 saat (sınama) Metin Verisi: 1823 M kelime (haber metinleri) + 18 M kelime (referans metinler) Dil Modeli: 2 K dağarcık, 3 lü dizilim kelime Akustik Model Sınama KHO (%) SMM-GKM 183 Çok katmanlı ileribesleme (çapraz entropi) 1424 Çok katmanlı ileribesleme (dizisel ayırıcı eğitim) 1342 Zaman gecikmeli SA (çapraz entropi) 1245 Zaman gecikmeli SA (örüsüz en büyük ortak bilgi) Arısoy E, Saraçlar M (218) Turkish Broadcast News Transcription Revisited In: Proceedings of SIU 218, Çeşme, Türkiye

63 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe için Akustik Model - Sonuçlar Türkçe Haber Programları için GDSKT 7 Akustik Veri: 188 saat (eğitim), 3 saat (geliştirme), 3 saat (sınama) Metin Verisi: 1823 M kelime (haber metinleri) + 18 M kelime (referans metinler) Dil Modeli: 2 K dağarcık, 3 lü dizilim kelime Akustik Model Sınama KHO (%) SMM-GKM 183 Çok katmanlı ileribesleme (çapraz entropi) 1424 Çok katmanlı ileribesleme (dizisel ayırıcı eğitim) 1342 Zaman gecikmeli SA (çapraz entropi) 1245 Zaman gecikmeli SA (örüsüz en büyük ortak bilgi) Arısoy E, Saraçlar M (218) Turkish Broadcast News Transcription Revisited In: Proceedings of SIU 218, Çeşme, Türkiye

64 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe için Dil Modeli Kelime-altı Birimler /A/ yüzeysel gösterimde /a/ veya /e/ olabilir Sözlüksel Gösterim kelimeler: sunulacak bildiridekiler istatistiksel birimler: sunul -acak bildir -ide -kiler kök ve ekler (yüzeysel): sun -ul -acak bildiri -de -ki -ler (sözlüksel 8 ): kök ve kök sonrası (yüzeysel): sun -ul-acak bildiri -de-ki-ler (sözlüksel 8 ): /H/ yüzeysel gösterimde /ı/, /i/, /u/, veya /ü/ olabilir Farklı yüzeysel gösterimler için aynı sözlüksel gösterim Gürbüz dil modeli kestirimleri Ses değişimlerinin doğruluğu Fazladan (anlamsız) kelimeleri üretme hataları azalır 8 Arısoy E, Sak H, Saraçlar M (27) Language modeling for automatic Turkish broadcast news transcription In: Proceedings of INTERSPEECH, Antwerp, Belgium, pp

65 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe için Dil Modeli Kelime-altı Birimler /A/ yüzeysel gösterimde /a/ veya /e/ olabilir Sözlüksel Gösterim kelimeler: sunulacak bildiridekiler istatistiksel birimler: sunul -acak bildir -ide -kiler kök ve ekler (yüzeysel): sun -ul -acak bildiri -de -ki -ler (sözlüksel 8 ): kök ve kök sonrası (yüzeysel): sun -ul-acak bildiri -de-ki-ler (sözlüksel 8 ): /H/ yüzeysel gösterimde /ı/, /i/, /u/, veya /ü/ olabilir Farklı yüzeysel gösterimler için aynı sözlüksel gösterim Gürbüz dil modeli kestirimleri Ses değişimlerinin doğruluğu Fazladan (anlamsız) kelimeleri üretme hataları azalır 8 Arısoy E, Sak H, Saraçlar M (27) Language modeling for automatic Turkish broadcast news transcription In: Proceedings of INTERSPEECH, Antwerp, Belgium, pp

66 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe için Dil Modeli Kelime-altı Birimler kelimeler: sunulacak bildiridekiler istatistiksel birimler: sunul -acak bildir -ide -kiler kök ve ekler (yüzeysel): sun -ul -acak bildiri -de -ki -ler (sözlüksel 8 ): sun -Hl -AcAk bildiri -da -ki -lar kök ve kök sonrası (yüzeysel): sun -ul-acak bildiri -de-ki-ler (sözlüksel 8 ): sun -Hl-AcAk bildiri -da-ki-lar /A/ yüzeysel gösterimde /a/ veya /e/ olabilir Sözlüksel Gösterim /H/ yüzeysel gösterimde /ı/, /i/, /u/, veya /ü/ olabilir Farklı yüzeysel gösterimler için aynı sözlüksel gösterim Gürbüz dil modeli kestirimleri Ses değişimlerinin doğruluğu Fazladan (anlamsız) kelimeleri üretme hataları azalır 8 Arısoy E, Sak H, Saraçlar M (27) Language modeling for automatic Turkish broadcast news transcription In: Proceedings of INTERSPEECH, Antwerp, Belgium, pp

67 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe için Dil Modeli Kelime-altı Birimler kelimeler: sunulacak bildiridekiler istatistiksel birimler: sunul -acak bildir -ide -kiler kök ve ekler (yüzeysel): sun -ul -acak bildiri -de -ki -ler (sözlüksel 8 ): sun -Hl -AcAk bildiri -da -ki -lar kök ve kök sonrası (yüzeysel): sun -ul-acak bildiri -de-ki-ler (sözlüksel 8 ): sun -Hl-AcAk bildiri -da-ki-lar /A/ yüzeysel gösterimde /a/ veya /e/ olabilir Sözlüksel Gösterim /H/ yüzeysel gösterimde /ı/, /i/, /u/, veya /ü/ olabilir Farklı yüzeysel gösterimler için aynı sözlüksel gösterim Gürbüz dil modeli kestirimleri ev -lar ev -ler kitap -lar kitap -lar Ses değişimlerinin doğruluğu Fazladan (anlamsız) kelimeleri üretme hataları azalır 8 Arısoy E, Sak H, Saraçlar M (27) Language modeling for automatic Turkish broadcast news transcription In: Proceedings of INTERSPEECH, Antwerp, Belgium, pp

68 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe için Dil Modeli Kelime-altı Birimler kelimeler: sunulacak bildiridekiler istatistiksel birimler: sunul -acak bildir -ide -kiler kök ve ekler (yüzeysel): sun -ul -acak bildiri -de -ki -ler (sözlüksel 8 ): sun -Hl -AcAk bildiri -da -ki -lar kök ve kök sonrası (yüzeysel): sun -ul-acak bildiri -de-ki-ler (sözlüksel 8 ): sun -Hl-AcAk bildiri -da-ki-lar /A/ yüzeysel gösterimde /a/ veya /e/ olabilir Sözlüksel Gösterim /H/ yüzeysel gösterimde /ı/, /i/, /u/, veya /ü/ olabilir Farklı yüzeysel gösterimler için aynı sözlüksel gösterim Gürbüz dil modeli kestirimleri ev -lar ev -ler kitap -lar kitap -lar Ses değişimlerinin doğruluğu Fazladan (anlamsız) kelimeleri üretme hataları azalır ev -lar ev -ler ev -lar 8 Arısoy E, Sak H, Saraçlar M (27) Language modeling for automatic Turkish broadcast news transcription In: Proceedings of INTERSPEECH, Antwerp, Belgium, pp

69 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe için Dil Modeli Sonuçlar Türkçe Haber Programları için GDSKT 9 Akustik Veri: 188 saat (eğitim), 3 saat (geliştirme), 3 saat (sınama) Metin Verisi: 1823 M kelime (haber metinleri) + 18 M kelime (referans metinler) Akustik Model: SMM-GKM Dil Modeli Sınama KHO (%) Kelime 231 Kök ve kök sonrası (yüzeysel) 219 Kök ve ekler (sözlüksel) 218 İstatistiksel birimler 217 Kök ve kök sonrası (sözlüksel) Sak H, Saraçlar M, Güngör T (212) Morpholexical and discriminative language models for Turkish automatic speech recognition IEEE Transactions on Audio, Speech, and Language Processing 2(8):

70 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe için Dil Modeli Sonuçlar Türkçe Haber Programları için GDSKT 9 Akustik Veri: 188 saat (eğitim), 3 saat (geliştirme), 3 saat (sınama) Metin Verisi: 1823 M kelime (haber metinleri) + 18 M kelime (referans metinler) Akustik Model: SMM-GKM Dil Modeli Sınama KHO (%) Kelime 231 Kök ve kök sonrası (yüzeysel) 219 Kök ve ekler (sözlüksel) 218 İstatistiksel birimler 217 Kök ve kök sonrası (sözlüksel) Sak H, Saraçlar M, Güngör T (212) Morpholexical and discriminative language models for Turkish automatic speech recognition IEEE Transactions on Audio, Speech, and Language Processing 2(8):

71 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe için Dil Modeli - Sonuçlar Türkçe Haber Programları için GDSKT 1 Akustik Model Dil Modeli Sınama KHO (%) SMM-GKM 3 lü kelime 183 Zaman gecikmeli SA 3 lü kelime 192 Zaman gecikmeli SA 3 lü kök ve kök sonrası 112 Yüzeysel gösterim 1 Arısoy E, Saraçlar M (218) Turkish Broadcast News Transcription Revisited In: Proceedings of SIU 218, Çeşme, Türkiye

72 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe için Dil Modeli - Sonuçlar Türkçe Haber Programları için GDSKT 1 Akustik Model Dil Modeli Sınama KHO (%) SMM-GKM 3 lü kelime 183 Zaman gecikmeli SA 3 lü kelime 192 Zaman gecikmeli SA 3 lü kök ve kök sonrası 112 Yüzeysel gösterim 1 Arısoy E, Saraçlar M (218) Turkish Broadcast News Transcription Revisited In: Proceedings of SIU 218, Çeşme, Türkiye

73 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Üretici Dil Modeli - Ayırıcı Dil Modeli Üretici Dil Modeli: n-li dizilim klasik model Koşullu olasılıklar en büyük olabilirlik kestirimi ile hesaplanır Ayırıcı Dil Modeli: Üretici modeli tamamlayıcı bir yöntemdir Hata oranını en iyilemek için ses kayıtları ve onların referans metinleri ile eğitilir Avantajları: Model hem doğru hem de yanlış örneklerden öğrenir Farklı öznitelikler aynı modelde kolayca kullanılabilir biçimbilimsel, sözdizimsel, anlambilimsel,

74 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Ayırıcı Dil Modeli haberleri sundu cümlesinin ses sinyalinin konuşma tanıma çıktısı hangi/1 Örü Çıktısı 1 haberler/6 haberleri/3 evi/1 2 sundu/8 sorduk/2 3/1 En iyi N hipotez 1 haberler sundu 48 2 haberleri sundu 24 3 haberler sorduk 12 Φ(x, y): Öznitelik vektörü x: Konuşma y: Aday hipotez Φ k (x, y) = haberleri sundu" dizilimin y de kaç defa geçtiği ᾱ: Öznitelik parametreleri Ayırıcı eğitim ile öğrenilir F(x) = argmax y GEN(x) Φ(x, y) ᾱ GEN(x): x e karşılık gelen en iyi N hipotez

75 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Ayırıcı Dil Modeli haberleri sundu cümlesinin ses sinyalinin konuşma tanıma çıktısı hangi/1 Örü Çıktısı 1 haberler/6 haberleri/3 evi/1 2 sundu/8 sorduk/2 Φ(x, y): Öznitelik vektörü x: Konuşma y: Aday hipotez 3/1 En iyi N hipotez 1 haberler sundu 48 2 haberleri sundu 24 (Doğru) 3 haberler sorduk 12 Φ k (x, y) = haberleri sundu" dizilimin y de kaç defa geçtiği ᾱ: Öznitelik parametreleri Ayırıcı eğitim ile öğrenilir F(x) = argmax y GEN(x) Φ(x, y) ᾱ GEN(x): x e karşılık gelen en iyi N hipotez

76 Türkçe için Konuşma Tanıma ve Zorlukları Konuşta Tanıma için Kelima-altı Birimler Türkçe Konuşta Tanıma Sistemleri ve Veri Tabanları Türkçe Konuşma Tanıma Üzerine Çalışmalar Türkçe Ayırıcı Dil Modeli 11 Kullanılan öznitelikler: 1 Kelimelerin n li dizilimleri 2 Kelime-altı birimlerin n li dizilimleri Dilbilimsel: kelimelerin biçimbilimsel analizinden elde edilir İstatistiksel: kelimelerin istatistiksel yöntemlerle bölütlenmesinden elde edilir 3 Sözdizimsel öznitelikler: cümlelerin bağlılık analizinden elde edilir 11 Arısoy E, Saraçlar M, Roark B, Shafran I (212) Discriminative language modeling with linguistic and statistically derived features IEEE Transactions on Audio, Speech, and Language Processing 2(2):54 55

77 Derin Öğrenme ile Dil Modelleme Part III Derin Öğrenmeyle Dil Modelleme

78 Derin Öğrenme ile Dil Modelleme Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Klasik ile Sinir Ağı Dil Modellerinin Karşılaştırması Klasik n li Dizilimli Dil Modeli: Kelimeler ayrık birimlerdir Veri tabanında geçmeyen veya az geçen dizilimler için gürbüz kestirimler yapılamaz P(sevimli bu kedi çok) = C(bu kedi çok sevimli) C(bu kedi çok) = 25 P(sevimli bu köpek çok) = C(bu köpek çok sevimli) C(bu köpek çok) =

79 Derin Öğrenme ile Dil Modelleme Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Klasik ile Sinir Ağları Dil Modellerinin Karşılaştırması Sinir Ağları (SA) Dil Modeli Kelimler için sürekli uzay gösterimleri öğrenilir Anlamsal ve dilbilimsel olarak benzer kelimeler sürekli uzayda yakın yerlerde bulunurlar Olasılık kestirimleri sürekli uzayda SA kullanılarak yapılır SA dil modeli ile daha gürbüz kestirimler yapılabilmektedir P(sevimli bu kedi çok) P(sevimli bu köpek çok) SA Mimarileri: ileribesleme, yinelemeli, uzun kısa-süreli bellek

80 Derin Öğrenme ile Dil Modelleme İleribesleme Sinir Ağı (SA) Dil Modeli Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Olasılık kestirimleri kelimelerin sürekli uzay gösterimleri ile yapılır Giriş Katmanı İzdüşüm Katmanı Saklı Katman ( (n 1) P ) d j = tanh l=1 M jl c l + b j Çıktı Katmanı o i = H j=1 V ijd j + k i p i = exp(o i ) V r=1 exp(or ) = P(w j = i h j ) w j-n+1 w j-n+2 w j Projection layer M c d o (n-1) x P b Hidden layer H V k Output layer P(w j =1 h j ) P(w j =i h j ) P(w j =N h j ) 12 Bengio Y, Ducharme R, Vincent P, Jauvin C (23) A neural probabilistic language model Journal of Machine Learning Research 3: Schwenk H (27) Continuous space language models Computer Speech and Language 21(3):

81 Derin Öğrenme ile Dil Modelleme İleribesleme Sinir Ağı (SA) Dil Modeli Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Olasılık kestirimleri kelimelerin sürekli uzay gösterimleri ile yapılır Giriş Katmanı İzdüşüm Katmanı Saklı Katman ( (n 1) P ) d j = tanh l=1 M jl c l + b j Çıktı Katmanı o i = H j=1 V ijd j + k i p i = exp(o i ) V r=1 exp(or ) = P(w j = i h j ) w j-n+1 w j-n+2 w j Projection layer M c d o (n-1) x P b Hidden layer H V k Output layer P(w j =1 h j ) P(w j =i h j ) P(w j =N h j ) 12 Bengio Y, Ducharme R, Vincent P, Jauvin C (23) A neural probabilistic language model Journal of Machine Learning Research 3: Schwenk H (27) Continuous space language models Computer Speech and Language 21(3):

82 Derin Öğrenme ile Dil Modelleme İleribesleme Sinir Ağı (SA) Dil Modeli Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Olasılık kestirimleri kelimelerin sürekli uzay gösterimleri ile yapılır Giriş Katmanı İzdüşüm Katmanı Saklı Katman ( (n 1) P ) d j = tanh l=1 M jl c l + b j Çıktı Katmanı o i = H j=1 V ijd j + k i p i = exp(o i ) V r=1 exp(or ) = P(w j = i h j ) w j-n+1 w j-n+2 w j Projection layer M c d o (n-1) x P b Hidden layer H V k Output layer P(w j =1 h j ) P(w j =i h j ) P(w j =N h j ) 12 Bengio Y, Ducharme R, Vincent P, Jauvin C (23) A neural probabilistic language model Journal of Machine Learning Research 3: Schwenk H (27) Continuous space language models Computer Speech and Language 21(3):

83 Derin Öğrenme ile Dil Modelleme İleribesleme Sinir Ağı (SA) Dil Modeli Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Olasılık kestirimleri kelimelerin sürekli uzay gösterimleri ile yapılır Giriş Katmanı İzdüşüm Katmanı Saklı Katman ( (n 1) P ) d j = tanh l=1 M jl c l + b j Çıktı Katmanı o i = H j=1 V ijd j + k i p i = exp(o i ) V r=1 exp(or ) = P(w j = i h j ) w j-n+1 w j-n+2 w j Projection layer M c d o (n-1) x P b Hidden layer H V k Output layer P(w j =1 h j ) P(w j =i h j ) P(w j =N h j ) 12 Bengio Y, Ducharme R, Vincent P, Jauvin C (23) A neural probabilistic language model Journal of Machine Learning Research 3: Schwenk H (27) Continuous space language models Computer Speech and Language 21(3):

84 Derin Öğrenme ile Dil Modelleme İleribesleme Sinir Ağı (SA) Dil Modeli Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Olasılık kestirimleri kelimelerin sürekli uzay gösterimleri ile yapılır Giriş Katmanı İzdüşüm Katmanı Saklı Katman ( (n 1) P ) d j = tanh l=1 M jl c l + b j Çıktı Katmanı o i = H j=1 V ijd j + k i p i = exp(o i ) V r=1 exp(or ) = P(w j = i h j ) w j-n+1 w j-n+2 w j Projection layer M c d o (n-1) x P b Hidden layer H V k Output layer P(w j =1 h j ) P(w j =i h j ) P(w j =N h j ) 12 Bengio Y, Ducharme R, Vincent P, Jauvin C (23) A neural probabilistic language model Journal of Machine Learning Research 3: Schwenk H (27) Continuous space language models Computer Speech and Language 21(3):

85 Derin Öğrenme ile Dil Modelleme İleribesleme Sinir Ağı (SA) Dil Modeli Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları İleribesleme SA dil modeli hata geri yayılım algoritması is eğitilir Giriş Katmanı İzdüşüm Katmanı Saklı Katman ( (n 1) P ) d j = tanh l=1 M jl c l + b j Çıktı Katmanı o i = H j=1 V ijd j + k i p i = exp(o i ) V r=1 exp(or ) = P(w j = i h j ) w j-n+1 w j-n+2 w j Projection layer M c d o (n-1) x P b Hidden layer H V k Output layer P(w j =1 h j ) P(w j =i h j ) P(w j =N h j ) 12 Bengio Y, Ducharme R, Vincent P, Jauvin C (23) A neural probabilistic language model Journal of Machine Learning Research 3: Schwenk H (27) Continuous space language models Computer Speech and Language 21(3):

86 Derin Öğrenme ile Dil Modelleme İleribesleme Sinir Ağı (SA) Dil Modeli Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları ojection layer M c d o n-1) x P b Hidden layer H V k Output layer Önerilen Çözümler: P(w j =1 h j ) P(w j =i h j ) P(w j =N h j ) SA Dil Modelindeki Zorluklar: Çıktı katmanındaki hesaplama karmaşıklığı (H V ) p i = exp(o i ) V r=1 exp(or ) = P(w j = i h j ) H 3 5, V 6K 2K Daha küçük çıkış dağarcığı kullanmak: V o << V V o 2K Hiyerarşik bir çıkış katmanı tanımlamak: P(w h) = P(c(w) h)p(w h, c(w))

87 Derin Öğrenme ile Dil Modelleme Derin Sinir Ağı (DSA) Dil Modeli 14 DSA birden fazla doğrusal olmayan katmana sahiptir Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları w j-n+1 w j-n Projection layer c M b Hidden layers M 1 M k b 1 b k V k Output layer P(w j =1 h j ) P(w j =i h j ) o (n-1) x P P(w j =N h j ) w j Arısoy E, Sainath T, Kingsbury B, Ramabhadran B (212) Deep neural network language models In: Proceedings of NAACL-HLT Workshop, Montreal, Canada

88 Derin Öğrenme ile Dil Modelleme Derin Sinir Ağı (DSA) Dil Modeli 14 DSA birden fazla doğrusal olmayan katmana sahiptir Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları w j-n+1 w j-n Projection layer c M b Hidden layers M 1 M k b 1 b k V k Output layer P(w j =1 h j ) P(w j =i h j ) o (n-1) x P P(w j =N h j ) w j Arısoy E, Sainath T, Kingsbury B, Ramabhadran B (212) Deep neural network language models In: Proceedings of NAACL-HLT Workshop, Montreal, Canada

89 Derin Öğrenme ile Dil Modelleme Yinelemeli Sinir Ağı (SA) Dil Modeli 15! Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Input!layer! Olasılık kestirimleri yinelemeli SA ile yapılır Output! layer! Daha uzun geçmiş kelime kullanılarak koşullu olasılıklar hesaplanır wt)1! Projection! layer! P(wt=i wt)1,ht)2)! Zaman boyunca geri yayılım algoritması ile eğitim yapılır Recursive!! Hidden!layer! 15 Mikolov T, Karafiat M, Burget L, Cernocky J, Khudanpur S (21) Recurrent neutral network based language model In: Proceedings of INTERSPEECH, Japan, pp

90 Derin Öğrenme ile Dil Modelleme Yinelemeli Sinir Ağı (SA) Dil Modeli 15! Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Input!layer! Olasılık kestirimleri yinelemeli SA ile yapılır Output! layer! Daha uzun geçmiş kelime kullanılarak koşullu olasılıklar hesaplanır wt)1! Projection! layer! P(wt=i wt)1,ht)2)! Zaman boyunca geri yayılım algoritması ile eğitim yapılır Recursive!! Hidden!layer! 15 Mikolov T, Karafiat M, Burget L, Cernocky J, Khudanpur S (21) Recurrent neutral network based language model In: Proceedings of INTERSPEECH, Japan, pp

91 Derin Öğrenme ile Dil Modelleme Yinelemeli Sinir Ağı (SA) Dil Modeli 15! Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Input!layer! Olasılık kestirimleri yinelemeli SA ile yapılır Output! layer! Daha uzun geçmiş kelime kullanılarak koşullu olasılıklar hesaplanır wt)1! Projection! layer! P(wt=i wt)1,ht)2)! Zaman boyunca geri yayılım algoritması ile eğitim yapılır Recursive!! Hidden!layer! 15 Mikolov T, Karafiat M, Burget L, Cernocky J, Khudanpur S (21) Recurrent neutral network based language model In: Proceedings of INTERSPEECH, Japan, pp

92 Derin Öğrenme ile Dil Modelleme Yinelemeli Sinir Ağı (SA) Dil Modeli 15! Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Input!layer! Olasılık kestirimleri yinelemeli SA ile yapılır Output! layer! Daha uzun geçmiş kelime kullanılarak koşullu olasılıklar hesaplanır wt)1! Projection! layer! P(wt=i wt)1,ht)2)! Zaman boyunca geri yayılım algoritması ile eğitim yapılır Recursive!! Hidden!layer! cümle başından itibaren tüm bilgiyi içerir! 15 Mikolov T, Karafiat M, Burget L, Cernocky J, Khudanpur S (21) Recurrent neutral network based language model In: Proceedings of INTERSPEECH, Japan, pp

93 Derin Öğrenme ile Dil Modelleme Yinelemeli Sinir Ağı (SA) Dil Modeli 15! Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Input!layer! Olasılık kestirimleri yinelemeli SA ile yapılır Output! layer! Daha uzun geçmiş kelime kullanılarak koşullu olasılıklar hesaplanır wt)1! Projection! layer! P(wt=i wt)1,ht)2)! Zaman boyunca geri yayılım algoritması ile eğitim yapılır Recursive!! Hidden!layer! 15 Mikolov T, Karafiat M, Burget L, Cernocky J, Khudanpur S (21) Recurrent neutral network based language model In: Proceedings of INTERSPEECH, Japan, pp

94 Derin Öğrenme ile Dil Modelleme Yinelemeli Sinir Ağı (SA) Dil Modeli Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Yinelemeli SA modeli zaman boyunca hata geri yayılım algoritması ile eğitilir w(t) y(t) s(t) U V w(t-1) W w(t) y(t) U s(t) V U V W w(t-2) W s(t-1) U y(t-1) V s(t-1) W s(t-2) Figure 31: Simple recurrent neural network Şekiller Mikolov 212 den alınmıştır 16 V y(t-2) The network is trained by stochastic gradient descent using either usual backpropagation (BP) algorithm, or backpropagation through time (BPTT) [65] The network is s(t-3) represented by input, hidden and output layers and corresponding weight matrices - matrices U and W between the input and the hidden layer, and matrix V between the hidden and the output layer Output values in the layers are computed as follows: y(t-3) X sj(t) =f wi(t)uji + X! 16 Mikolov T (212) Statistical Language Figure 33: Example of batch mode training Red arrows indicate how the gradients are sl(t 1)wjl Models (31) Based on Neural Networks Ph D propagated thesis, Brno through University the unfolded recurrent of Technology neural network i l 1 X

95 Derin Öğrenme ile Dil Modelleme Çift Yönlü Yinelemeli Sinir Ağı (SA) Dil Modeli Zamanda açılmış tek yönlü yinelemeli SA Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Zamanda açılmış çift yönlü yinelemeli SA Output Output Output Output Hidden Hidden Forward States Hidden Hidden Hidden Backward States Hidden Input Input t-1 t h t = tanh(w xh x t + W hh h t 1 + b h ) y t = W hy h t + b y p(w t = i w t 1, h t 2 ) = exp(y i t ) N j=1 exp(y j t ) Input Input t-1 t ht F = tanh(wxhx F t + Whhh F t 1 F + bh F ) ht B = tanh(wxhx B t + Whhh B t+1 B + bh B ) y t = Whyh F t F + Whyh B t B + b y

96 Derin Ög renme ile Dil Modelleme Klasik Dil Modeli ile Sinir Ag ı Dil Modeli Kars ılas tırması Sinir Ag ı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ag ı Dil Modeli Çalıs maları Uzun Kısa-Sureli Bellik Sinir Ag ı (SA) Dil Modeli 17 Yinelemeli SA Dil Modelinin Kısıtları: Yinelemeli SA pratikte 5-1 zaman adımından bilgi kullanır Gradyan zaman içerisinde üstel olarak azalır Uzun Kısa-Süreli Bellik SA: Dog rusal hafıza deg is tirilir Asolmayan training criterionbirimler the cross entropy error is bloklarıyla used ing units The final unit is depicted in Fig 1, where we have included two modifications of the original LSTM unit proposed in [12] and [13] which is equivalent to maximum likelihood We also follow this approach It is generally advised to normalzaman içindeki bag ımlılıkları daha iyi modeller ize the input data of a neural network ([15]) which means that a linear transformation is applied so that the data have zero mean and unit variance When using 1-of-K coding, this is obviously not the case it sparseness = σ(w + W(which + Wci ct 1 + bi ) xi xt features hi ht 1 Giving up the of the input is usually exploited to speed up matrix computations, cf [16]), the = σ(w Whfclosed-form ht 1 + Wcf ct 1 + bf ) t + exist xf xthere data can easilyftbe normalized because solutions for the mean and variance of the 1-of-K encoded input ct = ct 1 + icounts t tanh(w xc xt + Whc ht 1 + bc ) features that depend only onftthe unigram of the words observed in the training data On the contrary we observed that ot considerably = σ(w convergence was slowed down normalization xo x t +byw ho ht 1 + Wco ct + bo ) It seems that it suffices when the input data in each dimension lie in the sameh[, range ot tanh(ct ) t 1] = As the input P features are highly correlated (e g, we have xi = 1 the i-th dimension of an input vari17 i6=j xi ) for Sundermeyer M, Schluter R, Ney H (212) LSTM Neural Networks for Language Modeling In: Proceedings of INTERSPEECH, Portland, OR, USA able x), applying a whitening transform to the features appears Figure 1: LSTM memory cell with gating units be more promising Because of thetanıma high dimensionality, EtoArısoy Türkçe Konus ma ve Derin Öthis g renmeyle Dil Modelleme

97 Derin Öğrenme ile Dil Modelleme Sinir Ağı Dil Modeli Sonuçlar Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları İngilizce Haber Programları için GDSKT 18 eğitim verisi: 35 M kelime Dil Modeli KHO (%) 4 lü kelime 13 + tek yönlü - yinelemeli çift yönlü - yinelemeli tek yönlü - uzun kısa-süreli bellek çift yönlü - uzun kısa-süreli bellek 124 P = 18, H = 3, eğitim verisi: 12 M kelime 18 Arısoy E, Sethy A, Ramabhadran B, Chen S (215) Bidirectional recurrent neural network language models for automatic speech recognition In: Proceedings of ICASSP, Brisbane, Australia, pp

98 Derin Öğrenme ile Dil Modelleme Sinir Ağı Dil Modeli Sonuçlar Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları İngilizce Haber Programları için GDSKT 18 eğitim verisi: 35 M kelime Dil Modeli KHO (%) 4 lü kelime 13 + tek yönlü - yinelemeli çift yönlü - yinelemeli tek yönlü - uzun kısa-süreli bellek çift yönlü - uzun kısa-süreli bellek 124 P = 18, H = 3, eğitim verisi: 12 M kelime 18 Arısoy E, Sethy A, Ramabhadran B, Chen S (215) Bidirectional recurrent neural network language models for automatic speech recognition In: Proceedings of ICASSP, Brisbane, Australia, pp

99 Derin Öğrenme ile Dil Modelleme Sürekli Uzay Gösterimleri Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Sürekli uzay gösterimleri doğal dil işleme uygulamaları için önemli bilgiler taşır 19 France Paris + Italy = Roma Table 8: Examples of the word pair relationships, using the best word vectors from Table 4 (Skipgram model trained on 783M words with 3 dimensionality) Relationship Example 1 Example 2 Example 3 France - Paris Italy: Rome Japan: Tokyo Florida: Tallahassee big - bigger small: larger cold: colder quick: quicker Miami - Florida Baltimore: Maryland Dallas: Texas Kona: Hawaii Einstein - scientist Messi: midfielder Mozart: violinist Picasso: painter Sarkozy - France Berlusconi: Italy Merkel: Germany Koizumi: Japan copper - Cu zinc: Zn gold: Au uranium: plutonium Berlusconi - Silvio Sarkozy: Nicolas Putin: Medvedev Obama: Barack Microsoft - Windows Google: Android IBM: Linux Apple: iphone Microsoft - Ballmer Google: Yahoo IBM: McNealy Apple: Jobs Japan - sushi Germany: bratwurst France: tapas USA: pizza 19 Mikolov T, et al (213) Distributed representations of words and phrases and their compositionality In: Proceedings of NIPS 213, pages assumes exact match, the results in Table 8 would score only about 6%) We believe that word vectors trained on even larger data setse with Arısoy larger dimensionality Türkçe Konuşma will perform Tanıma significantly ve Derin Öğrenmeyle better, Dil Modelleme

100 Derin Öğrenme ile Dil Modelleme Sürekli Uzay Gösterimleri Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları INPUT PROJECTION OUTPUT INPUT PROJECTION OUTPUT w(t-2) w(t-2) w(t-1) SUM w(t-1) w(t) w(t) w(t+1) w(t+1) w(t+2) w(t+2) CBOW Skip-gram Şekiller Mikolov 213 den alınmıştır 2 2 Mikolov T, et al (213) Figure Distributed 1: New representations model architectures of words The CBOW and phrases architecture and their predicts compositionality the current word In: Proceedings based on the of NIPS 213, pages context, and the Skip-gram predicts surrounding words given the current word

101 Derin Öğrenme ile Dil Modelleme Sürekli Uzay Gösterimleri Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Türkçe kök ve kök sonrası sürekli uzay vektörlerinin iki boyutta gösterimi (TSNE) +in +ların +lerinin +sinin +ın +lerin +larının +sının

102 Derin Öğrenme ile Dil Modelleme Sürekli Uzay Gösterimleri Klasik Dil Modeli ile Sinir Ağı Dil Modeli Karşılaştırması Sinir Ağı Dil Modelleri Sürekli Uzay Gösterimleri Türkçe Sinir Ağı Dil Modeli Çalışmaları Türkçe kök ve kök sonrası sürekli uzay vektörlerinin iki boyutta gösterimi (TSNE) +in +ların +lerinin +sinin +ın +lerin +larının +sının

Doğan Can, Murat Saraçlar. Bebek, İstanbul. 9 Mart, 2009

Doğan Can, Murat Saraçlar. Bebek, İstanbul. 9 Mart, 2009 Türkçe Haber Bültenlerinin Açık Kaynak Yazılımlar ile Yazılandırılması Doğan Can, Murat Saraçlar Elektrik Elektronik Mühendisliği Bölümü Boğaziçi Üniversitesi Bebek, İstanbul 9 Mart, 2009 Bir Bakışta GDSKT

Detaylı

ÖZGEÇMİŞ. 7. Yayınlar 7.1 Uluslararası hakemli dergilerde yayınlanan makaleler (SCI,SSCI,Arts and Humanities)

ÖZGEÇMİŞ. 7. Yayınlar 7.1 Uluslararası hakemli dergilerde yayınlanan makaleler (SCI,SSCI,Arts and Humanities) ÖZGEÇMİŞ 1. Adı Soyadı : Ebru Arısoy SARAÇLAR 2. Doğum Tarihi : 01.01.1979 3. Unvanı : Doktor 4. Öğrenim Durumu : Doktora Derece Alan Üniversite Yıl Lisans Elektrik-Elektronik Mühendisliği Boğaziçi Üniversitesi

Detaylı

Kelime Gösterimleri (Word Representation Word Embeddings)

Kelime Gösterimleri (Word Representation Word Embeddings) Kelime Gösterimleri (Word Representation Word Embeddings) Kelime, cümlede kullanımına göre farklı anlamlar kazanabilir Anlamsal bilginin çıkarılması metinlerin işlenmesinde önemlidir Kelimelerin işlenebilir

Detaylı

ÖZGEÇMİŞ. Yrd. Doç. Dr. MURAT SARAÇLAR

ÖZGEÇMİŞ. Yrd. Doç. Dr. MURAT SARAÇLAR ÖZGEÇMİŞ Yrd. Doç. Dr. MURAT SARAÇLAR TC Kimlik No / Pasaport No: 60520304774 Doğum Yılı: 1972 Yazışma Adresi : Telefon : 212-3596422 Faks : 212-2872465 e-posta : Boğaziçi Üniversitesi Elektrik-Elektronik

Detaylı

SÜREKLİ SAKLI MARKOV MODELLERİ İLE METİNDEN BAĞIMSIZ KONUŞMACI TANIMA PARAMETRELERİNİN İNCELENMESİ

SÜREKLİ SAKLI MARKOV MODELLERİ İLE METİNDEN BAĞIMSIZ KONUŞMACI TANIMA PARAMETRELERİNİN İNCELENMESİ Uludağ Üniversitesi Mühendislik-Mimarlık Fakültesi Dergisi, Cilt 12, Sayı 1, 2007 SÜREKLİ SAKLI MARKOV MODELLERİ İLE METİNDEN BAĞIMSIZ KONUŞMACI TANIMA PARAMETRELERİNİN İNCELENMESİ Cemal HANİLÇİ Figen

Detaylı

Doküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım

Doküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım Doküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım Yılmaz KAYA 1, Ömer Faruk ERTUĞRUL 2, Ramazan TEKİN 3 1 Siirt Üniversitesi, Bilgisayar Mühendisliği Bölümü 2 Batman Üniversitesi, Elektrik-Elektronik

Detaylı

Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi Pamukkale University Journal of Engineering Sciences

Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi Pamukkale University Journal of Engineering Sciences Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi Pamukkale University Journal of Engineering Sciences Mobil araçlarda Türkçe konuşma tanıma için yeni bir veri tabanı ve bu veri tabanı ile elde edilen

Detaylı

Çabuk Yazılandırma Kılavuzu (Rapid Transcription Guide) v0.4

Çabuk Yazılandırma Kılavuzu (Rapid Transcription Guide) v0.4 Çabuk Yazılandırma Kılavuzu (Rapid Transcription Guide) v0.4 Murat Saraçlar 1 Ekim 2006 Çabuk yazılandırma, Türkçe konuşma tanıma sistemleri için veri tabanı oluşturmayı amaçlamaktadır. Ana hedef konuşmanın

Detaylı

ÖZGEÇMİŞ. 1. Adı Soyadı : Olcay Taner Yıldız. 2. Doğum Tarihi : 15.05.1976. 3. Unvanı : Doç. Dr. 4. Öğrenim Durumu :

ÖZGEÇMİŞ. 1. Adı Soyadı : Olcay Taner Yıldız. 2. Doğum Tarihi : 15.05.1976. 3. Unvanı : Doç. Dr. 4. Öğrenim Durumu : ÖZGEÇMİŞ 1. Adı Soyadı : Olcay Taner Yıldız 2. Doğum Tarihi : 15.05.1976 3. Unvanı : Doç. Dr. 4. Öğrenim Durumu : Derece Alan Üniversite Yıl Lisans Bilgisayar Mühendisliği Boğaziçi Üniversitesi 1997 Y.

Detaylı

2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21

2.1 Bir Sınıfı Örneklerinden Öğrenme... 15 2.2 Vapnik-Chervonenkis (VC) Boyutu... 20 2.3 Olası Yaklaşık Doğru Öğrenme... 21 İçindekiler Önsöz İkinci Basım için Önsöz Türkçe Çeviri için Önsöz Gösterim xiii xv xvii xix 1 Giriş 1 1.1 Yapay Öğrenme Nedir?......................... 1 1.2 Yapay Öğrenme Uygulamalarına Örnekler...............

Detaylı

KAHKAHA TANIMA İÇİN RASSAL ORMANLAR

KAHKAHA TANIMA İÇİN RASSAL ORMANLAR KAHKAHA TANIMA İÇİN RASSAL ORMANLAR Heysem Kaya, A. Mehdi Erçetin, A. Ali Salah, S. Fikret Gürgen Bilgisayar Mühendisliği Bölümü Boğaziçi Üniversitesi / Istanbul Akademik Bilişim'14, Mersin, 05.02.2014

Detaylı

Türkçe Dokümanlar Ġçin Yazar Tanıma

Türkçe Dokümanlar Ġçin Yazar Tanıma Türkçe Dokümanlar Ġçin Yazar Tanıma Özcan KOLYĠĞĠT, Rıfat AġLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Matematik Bölümü Bölümü, Aydın okolyigit@gmail.com, rasliyan@adu.edu.tr, kgunel@adu.edu.tr Özet:

Detaylı

BİLECİK ÇEVRESİNDE DEPREM TEHLİKESİNİN SAKLI MARKOV MODELİ İLE TAHMİNİ

BİLECİK ÇEVRESİNDE DEPREM TEHLİKESİNİN SAKLI MARKOV MODELİ İLE TAHMİNİ ÖZET: BİLECİK ÇEVRESİNDE DEPREM TEHLİKESİNİN SAKLI MARKOV MODELİ İLE TAHMİNİ C.E. Can 1, G. Ergün 2 ve C. Gökçeoğlu 3 1 Araştırma Görevlisi, İstatistik Bölümü, Hacettepe Üniversitesi, Beytepe, Ankara 2

Detaylı

SINGLE-CHANNEL SPEECH-MUSIC SEPARATION USING NMF FOR AUTOMATIC SPEECH RECOGNITION

SINGLE-CHANNEL SPEECH-MUSIC SEPARATION USING NMF FOR AUTOMATIC SPEECH RECOGNITION KONUŞMA TANIMA İÇİN NOMA İLE TEK-KANALDA KONUŞMA-MÜZİK AYRIŞTIRMA SINGLE-CHANNEL SPEECH-MUSIC SEPARATION USING NMF FOR AUTOMATIC SPEECH RECOGNITION Cemil Demir 1,3, Mehmet Uğur Doğan 1, A. Taylan Cemgil

Detaylı

Hidden Markov Model. Forward Algoritması Viterbi Algoritması. Doç.Dr.Banu Diri. Rasgele Olmayan /Gerekirci Model

Hidden Markov Model. Forward Algoritması Viterbi Algoritması. Doç.Dr.Banu Diri. Rasgele Olmayan /Gerekirci Model Hidden Markov Model Forward Algoritması Viterbi Algoritması Doç.Dr.Banu Diri Rasgele Olmayan /Gerekirci Model Bir trafik lambası düşünelim; ışıkların sırasıyla red - red/amber - green - amber - red. Bu

Detaylı

DOKUZ EYLÜL ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ DEKANLIĞI DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CME 4410

DOKUZ EYLÜL ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ DEKANLIĞI DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CME 4410 Dersi Veren Birim: Bilgisayar Mühendisliği Dersin Türkçe Adı: ÖRÜNTÜ TANIMAYA GİRİŞ Dersin Orjinal Adı: INTRODUCTION TO PATTERN RECOGNITION Dersin Düzeyi:(Ön lisans, Lisans, Yüksek Lisans, Doktora) Lisans

Detaylı

Büyük Veri ve Endüstri Mühendisliği

Büyük Veri ve Endüstri Mühendisliği Büyük Veri ve Endüstri Mühendisliği Mustafa Gökçe Baydoğan Endüstri Mühendisliği Bölümü Boğaziçi Üniversitesi İstanbul Yöneylem Araştırması/Endüstri Mühendisliği Doktora Öğrencileri Kolokyumu 21-22 Nisan

Detaylı

Metin Sınıflandırma. Akış

Metin Sınıflandırma. Akış Metin Sınıflandırma Mehmet Fatih AMASYALI BLM 5212 Doğal Dil İşlemeye Giriş Ders Notları Akış Görev Eğiticili Eğiticisiz Öğrenme Metin Özellikleri Metin Kümeleme Özellik Belirleme Çok Boyutlu Verilerle

Detaylı

Elena Battini SÖNMEZ Önder ÖZBEK N. Özge ÖZBEK. 2 Şubat 2007

Elena Battini SÖNMEZ Önder ÖZBEK N. Özge ÖZBEK. 2 Şubat 2007 AVUÇ İZİ VE PARMAK İZİNE DAYALI BİR BİYOMETRİK TANIMA SİSTEMİ Elena Battini SÖNMEZ Önder ÖZBEK N. Özge ÖZBEK İstanbul Bilgi Üniversitesi Bilgisayar Bilimleri 2 Şubat 2007 Biyometrik Biyometrik, kişileri

Detaylı

Otomatik Diyet Gözetimi için Gıda İmgelerinin Anlamsal Bölütlemesi

Otomatik Diyet Gözetimi için Gıda İmgelerinin Anlamsal Bölütlemesi Otomatik Diyet Gözetimi için Gıda İmgelerinin Anlamsal Bölütlemesi Sinem Aslan 1,2, Gianluigi Ciocca 1, Raimondo Schettini 1 1 Department of Informatics, Systems and Communication, University of Milano-Bicocca,

Detaylı

Türkçe de Ünlülerin Formant Analizi

Türkçe de Ünlülerin Formant Analizi Türkçe de Ünlülerin Formant Analizi Oytun Türk*, Ömer Şayli**, A. Sumru Özsoy***, Levent M. Arslan* Boğaziçi Üniversitesi *Elektrik-Elektronik Mühendisliği Bölümü **Biyomedikal Mühendisliği Enstitüsü ***Batı

Detaylı

T.C. ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ EĞİTİM ÖĞRETİM YILI DERS KATALOĞU

T.C. ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ EĞİTİM ÖĞRETİM YILI DERS KATALOĞU T.C. ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ - EĞİTİM ÖĞRETİM YILI DERS KATALOĞU Ders Kodu Bim Kodu Ders Adı Türkçe Ders Adı İngilizce Dersin Dönemi T Snf Açıl.Dönem P

Detaylı

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data) M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Bu dersin sunumları, The Elements of Statistical Learning: Data

Detaylı

VERİ MADENCİLİĞİ Metin Madenciliği

VERİ MADENCİLİĞİ Metin Madenciliği VERİ MADENCİLİĞİ Metin Madenciliği Yrd. Doç. Dr. Şule Gündüz Öğüdücü 1 2 Metin için Veri Madenciliği Metin Madenciliğinde Sorunlar Metin madenciliği: Veri madenciliği teknikleri ile yazılı belgeler arasındaki

Detaylı

İstanbul Şehir Üniversitesi Bahar

İstanbul Şehir Üniversitesi Bahar BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr İstanbul Şehir Üniversitesi 2018 - Bahar İçindekiler

Detaylı

Sözlük Kullanarak Türkçe El yazısı Tanıma

Sözlük Kullanarak Türkçe El yazısı Tanıma Sözlük Kullanarak Türkçe El yazısı Tanıma Murat Şekerci 1 Rembiye Kandemir 2 1,2 Bilgisayar Mühendisliği Bölümü Mühendislik-Mimarlık Fakültesi Trakya Üniversitesi, 2250, Edirne 1 e-posta: muratsekerci@hotmail.com

Detaylı

IŞIK ÜNİVERSİTESİ BİLİMSEL ARAŞTIRMA PROJELERİ SONUÇ RAPORU

IŞIK ÜNİVERSİTESİ BİLİMSEL ARAŞTIRMA PROJELERİ SONUÇ RAPORU IŞIK ÜNİVERSİTESİ BİLİMSEL ARAŞTIRMA PROJELERİ SONUÇ RAPORU 10A303 ANLAMSAL TÜRKÇE ARAMA MOTORU Doç.Dr. Olcay Taner YILDIZ İÇİNDEKİLER 1. GENEL ÖZET 2. HARCAMALAR LİSTESİ 3. TEKNİK RAPOR 4. ÜRÜNLER LİSTESİ

Detaylı

DOÇ. DR. HAKAN GÜRKAN Işık Üniversitesi Mühendislik Fakültesi Elektrik-Elektronik Mühendisliği Bölümü hakan@isikun.edu.tr

DOÇ. DR. HAKAN GÜRKAN Işık Üniversitesi Mühendislik Fakültesi Elektrik-Elektronik Mühendisliği Bölümü hakan@isikun.edu.tr DOÇ. DR. HAKAN GÜRKAN Işık Üniversitesi Mühendislik Fakültesi Elektrik-Elektronik Mühendisliği Bölümü hakan@isikun.edu.tr 1. Adı Soyadı : Hakan Gürkan 2. Doğum Tarihi : 04.02.1973 3. Unvanı : Doçent 4.

Detaylı

http://www.tnc.org.tr

http://www.tnc.org.tr http://www.tnc.org.tr Yeşim Aksan, Mustafa Aksan, S. Ayşe Özel, Hakan Yılmazer, Umut U. Demirhan, Ümit Mersinli, Yasin Bektaş, Serap Altunay Mersin Üniversitesi, Çukurova Üniversitesi Türkçe Ulusal Derlemi

Detaylı

Derin Yapay Sinir Ağları ve Derin Öğrenme ye Kısa Bir Giriş

Derin Yapay Sinir Ağları ve Derin Öğrenme ye Kısa Bir Giriş Derin Yapay Sinir Ağları ve Derin Öğrenme ye Kısa Bir Giriş Dr. Öğr. Üyesi Emre Akbaş BMO Semineri 24 Kasım 2018 Bilgisayar Mühendisliği Orta Doğu Teknik Üniversitesi 1 Yanıtlamaya çalışacağımız sorular

Detaylı

Geliştirilmiş Fisher Ayraç Kriteri Kullanarak Hiperspektral Görüntülerde Sınıflandırma

Geliştirilmiş Fisher Ayraç Kriteri Kullanarak Hiperspektral Görüntülerde Sınıflandırma Geliştirilmiş Fisher Ayraç Kriteri Kullanarak Hiperspektral Görüntülerde Sınıflandırma Mustafa TEKE, Dr. Ufuk SAKARYA TÜBİTAK UZAY IEEE 21. Sinyal İşleme, İletişim ve Uygulamaları Kurultayı (SİU 2013),

Detaylı

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 2 ( yılı öncesinde birinci

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 2 ( yılı öncesinde birinci MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 2 (2016-17 yılı öncesinde birinci sınıfa başlayan öğrenciler için) BİRİNCİ YIL 1. Dönem CMPE113

Detaylı

BİLGİSAYAR DESTEKLİ BİR DİL PROGRAMI -Türkçe Konuşma - Tanıma Sistemi-

BİLGİSAYAR DESTEKLİ BİR DİL PROGRAMI -Türkçe Konuşma - Tanıma Sistemi- BİLGİSAYAR DESTEKLİ BİR DİL PROGRAMI -Türkçe Konuşma - Tanıma Sistemi- Prof. Dr. Fatih KİRİŞÇİOĞLU Bilgisayarlı Dil Uzmanı Erkan KARABACAK Proje Sorumlusu Çetin ÇETİNTÜRK Tanımlar : Konuşma Tanıma : Dil

Detaylı

Doğal Dil İşleme Nedir? Doğal Dil İşleme

Doğal Dil İşleme Nedir? Doğal Dil İşleme Doğal Dil İşleme Nedir? Mehmet Fatih AMASYALI Doğal Dil İşleme Tanım: İnsanların iletişim için kullandıkları dillerin çeşitli amaçlar için bilgisayarla işlenmesi 1 Dersin Amacı Doğal Dil işlemenin uygulama

Detaylı

Aşağı Link MC-CDMA Sistemlerinde Kullanılan PIC Alıcının EM-MAP Tabanlı Olarak İlklendirilmesi

Aşağı Link MC-CDMA Sistemlerinde Kullanılan PIC Alıcının EM-MAP Tabanlı Olarak İlklendirilmesi IEEE 15. Sinyal İşleme ve İletişim Uygulamaları Kurultayı - 2007 Aşağı Link MC-CDMA Sistemlerinde Kullanılan PIC Alıcının EM-MAP Tabanlı Olarak İlklendirilmesi Hakan Doğan 1,Erdal Panayırcı 2, Hakan Ali

Detaylı

Hafta 10 - Vektör Uzay Modelleri

Hafta 10 - Vektör Uzay Modelleri BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr İstanbul Şehir Üniversitesi 2018 - Bahar İçindekiler

Detaylı

Dinamik Zaman Bükmesi Yöntemiyle Hece Tabanlı Konuşma Tanıma Sistemi

Dinamik Zaman Bükmesi Yöntemiyle Hece Tabanlı Konuşma Tanıma Sistemi Akademik Bilişim 2008 Çanakkale Onsekiz Mart Üniversitesi, Çanakkale, 30 Ocak - 01 Şubat 2008 Dinamik Zaman Bükmesi Yöntemiyle Rıfat AŞLIYAN 1, Korhan GÜNEL 2, Tatyana YAKHNO 1 1 Dokuz Eylül Üniversitesi,

Detaylı

Türkçe de Ünlülerin FormantĐncelemesi

Türkçe de Ünlülerin FormantĐncelemesi Türk, O., Şayli, Ö., Özsoy, S., Arslan, L., Türkçede Ünlülerin Formant Frekans Đncelemesi, 18. Ulusal Dilbilim Kurultayı, Ankara Üniversitesi, 20-21 Mayıs 2004 (Sözel sunum) Türkçe de Ünlülerin FormantĐncelemesi

Detaylı

Uzaktan Algılama Teknolojileri

Uzaktan Algılama Teknolojileri Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk alp.erturk@kocaeli.edu.tr Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve

Detaylı

Otomatik Doküman Sınıflandırma

Otomatik Doküman Sınıflandırma Otomatik Doküman Sınıflandırma Rumeysa YILMAZ, Rıfat AŞLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi, Fen Edebiyat Fakültesi Matematik Bölümü, Aydın rumeysa2903@gmailcom, rasliyan@aduedutr, kgunel@aduedutr

Detaylı

Türkçe nin Bağlılık Ayrıştırması. Gülşen Cebiroğlu Eryiğit

Türkçe nin Bağlılık Ayrıştırması. Gülşen Cebiroğlu Eryiğit Türkçe nin Bağlılık Ayrıştırması Gülşen Cebiroğlu Eryiğit Bağlılık Ayrıştırması Doğal Dil İşleme ve Bölümleri Türkçe'nin Bağlılık Ayrıştırması @ 2007 Gülşen Cebiroğlu Eryiğit 2/45 Bağlılık Ayrıştırması

Detaylı

Konuşma Terapisine Yönelik Otomatik Konuşma Tanıma Yöntemleri

Konuşma Terapisine Yönelik Otomatik Konuşma Tanıma Yöntemleri Konuşma Terapisine Yönelik Otomatik Konuşma Tanıma Yöntemleri Oytun Türk Levent M. Arslan Elektrik-Elektronik Müh. Bölümü, Boğaziçi Üniversitesi, Bebek, İstanbul Sestek A.Ş., ARI-1 Teknopark Binası, İTÜ

Detaylı

Yer Sezimi ve Özet Bölüt Çizgeleri

Yer Sezimi ve Özet Bölüt Çizgeleri Akıllı Sistemler Laboratuarı Elektrik-Elektronik Mühendisliği, Boğaziçi Üniversitesi TORK 2015 Türkiye Robotbilim Konferansı Önceki Çalışmalar Bölge Bitişiklilik Çizgeleri Çizge Eşleme lar Önceki Çalışmalar

Detaylı

El Yazısı Tanıma Problemi için Bütünsel Parametre Kestirimi ve Bölütleme Algoritmaları

El Yazısı Tanıma Problemi için Bütünsel Parametre Kestirimi ve Bölütleme Algoritmaları El Yazısı Tanıma Problemi için Bütünsel Parametre Kestirimi ve Bölütleme Algoritmaları Nafiz Arıca, Fatoş T. Yarman-Vural Orta Doğu Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü Ankara, TÜRKİYE {nafiz,vural}@ceng.metu.edu.tr

Detaylı

YAPAY ZEKA VE DERİN ÖĞRENMENİN GÜNÜMÜZDEKİ UYGULAMA ALANLARI

YAPAY ZEKA VE DERİN ÖĞRENMENİN GÜNÜMÜZDEKİ UYGULAMA ALANLARI YAPAY ZEKA VE DERİN ÖĞRENMENİN GÜNÜMÜZDEKİ UYGULAMA ALANLARI DR. ÖĞR. ÜYESİ GÖKHAN ALTAN BİLGİSAYAR MÜH. BÖL. İSKENDERUN TEKNİK ÜNİVERSİTESİ KONUŞMA İÇERİĞİ Bilgisayar Bilimi Makine Öğrenmesi nedir? Makine

Detaylı

Koşullu Rastgele Alanlar ile Türkçe Haber Metinlerinin Etiketlenmesi (Labelling Turkish News Stories with Conditional Random Fields)

Koşullu Rastgele Alanlar ile Türkçe Haber Metinlerinin Etiketlenmesi (Labelling Turkish News Stories with Conditional Random Fields) Koşullu Rastgele Alanlar ile Türkçe Haber Metinlerinin Etiketlenmesi (Labelling Turkish News Stories with Conditional Random Fields) Seda KAZKILINÇ İTÜ Bilgisayar Mühendisliği Bölümü kazkilinc@itu.edu.tr

Detaylı

Otomatik Doküman Sınıflandırma

Otomatik Doküman Sınıflandırma Akademik Bilişim 12 - XIV Akademik Bilişim Konferansı Bildirileri Otomatik Doküman Sınıflandırma Adnan Menderes Üniversitesi, Fen Edebiyat Fakültesi Matematik Bölümü, Aydın rumeysa2903@gmailcom, rasliyan@aduedutr,

Detaylı

Kelebek Görüntülerin Sınıflandırılmasında Yeni Yerel İkili Örüntüler

Kelebek Görüntülerin Sınıflandırılmasında Yeni Yerel İkili Örüntüler Kelebek Görüntülerin Sınıflandırılmasında Yeni Yerel İkili Örüntüler Yılmaz KAYA 1, Lokman KAYCİ 2 1 Bilgisayar Mühendisliği Bölümü, Siirt Üniversitesi, 56100 Siirt 2 Biyoloji Bölümü, Siirt Üniversitesi,

Detaylı

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Ders 1- Yapay Zekâya Giriş. Erhan AKDOĞAN, Ph.D.

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Ders 1- Yapay Zekâya Giriş. Erhan AKDOĞAN, Ph.D. Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ Ders 1- Yapay Zekâya Giriş Erhan AKDOĞAN, Ph.D. Yapay Zekâ nedir?! İnsanın düşünme ve karar verme yeteneğini bilgisayarlar aracılığı ile taklit etmeye

Detaylı

Bilgisayar ve Bilişim Bilimleri Fakültesi Sakarya Üniversitesi

Bilgisayar ve Bilişim Bilimleri Fakültesi Sakarya Üniversitesi SAKLI MARKOV MODEL KULLANARAK TÜRKÇE KONUŞMAYI VE YAZIYI İŞARET DİLİNE ÇEVİRME Cemil Öz 1, Beyza Eken 2, Büşra Şahin 3, Esra Akbulut 4, Fatma Akbulut 5 1,2,3,4,5 Bilgisayar Mühendisliği Bölümü Bilgisayar

Detaylı

Dil Modelleri. Doç.Dr.Banu Diri

Dil Modelleri. Doç.Dr.Banu Diri Dil Modelleri Doç.Dr.Banu Diri Dilin modellenmesinin amacı Konuşma tanıma (Speech recognition) El yazısı tanıma (Handwriting recognition) İmla hatalarının düzeltilmesi (Spelling correction) Makine çeviri

Detaylı

Concept Learning. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ. Yapay Zeka - Kavram Öğrenme

Concept Learning. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ. Yapay Zeka - Kavram Öğrenme Concept Learning Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ 1 İÇERİK Öğrenme Metotları Kavram Öğrenme Nedir? Terminoloji Find-S Algoritması Candidate-Elimination Algoritması List-Then Elimination Algoritması

Detaylı

Yinelemeli ve Uyarlanır Ayrıt Saptayıcı Süzgeçleri

Yinelemeli ve Uyarlanır Ayrıt Saptayıcı Süzgeçleri Yinelemeli ve Uyarlanır Ayrıt Saptayıcı Süzgeçleri innur Kurt, Muhittin Gökmen İstanbul Teknik Üniversitesi ilgisayar Mühendisliği ölümü Maslak 8066, İstanbul {kurt,gokmen}@cs.itu.edu.tr Özetçe Görüntü

Detaylı

Geriye Yayılım ve Levenberg Marquardt Algoritmalarının YSA Eğitimlerindeki Başarımlarının Dinamik Sistemler Üzerindeki Başarımı. Mehmet Ali Çavuşlu

Geriye Yayılım ve Levenberg Marquardt Algoritmalarının YSA Eğitimlerindeki Başarımlarının Dinamik Sistemler Üzerindeki Başarımı. Mehmet Ali Çavuşlu Geriye Yayılım ve Levenberg Marquardt Algoritmalarının YSA Eğitimlerindeki Başarımlarının Dinamik Sistemler Üzerindeki Başarımı Mehmet Ali Çavuşlu Özet Yapay sinir ağlarının eğitiminde genellikle geriye

Detaylı

BİLECİK ŞEYH EDEBALİ ÜNİVERSİTESİ AKADEMİK ÖZGEÇMİŞ FORMU

BİLECİK ŞEYH EDEBALİ ÜNİVERSİTESİ AKADEMİK ÖZGEÇMİŞ FORMU BİLECİK ŞEYH EDEBALİ ÜNİVERSİTESİ AKADEMİK ÖZGEÇMİŞ FORMU KİŞİSEL BİLGİLER Adı Soyadı Tolga YÜKSEL Ünvanı Birimi Doğum Tarihi Yrd. Doç. Dr. Mühendislik Fakültesi/ Elektrik Elektronik Mühendisliği 23.10.1980

Detaylı

K En Yakın Komşu Methodu (KNearest Neighborhood)

K En Yakın Komşu Methodu (KNearest Neighborhood) K En Yakın Komşu Methodu (KNearest Neighborhood) K-NN algoritması, Thomas. M. Cover ve Peter. E. Hart tarafından önerilen, örnek veri noktasının bulunduğu sınıfın ve en yakın komşunun, k değerine göre

Detaylı

ANKARA ÜNİVERSİTESİ A ÖĞRENCİ İŞLERİ DAİRE BAŞKANLIĞI

ANKARA ÜNİVERSİTESİ A ÖĞRENCİ İŞLERİ DAİRE BAŞKANLIĞI PROGRAM ADI : BİLGİSAYAR MÜHENDİSLİĞİ (İNGİLİZCE) 1.SINIF /1.YARIYIL* 1 COM101 COMPUTER PROGRAMMING I - - 4 2 6 5 9 2 COM113 INTRODUCTION TO COMPUTER SCIENCE - - 3 0 3 3 5 3 PHY0101 PHYSICS I - - 3 0 3

Detaylı

Akıllı Ortamlarda Sensör Kontrolüne Etmen Tabanlı Bir Yaklaşım: Bir Jadex Uygulaması

Akıllı Ortamlarda Sensör Kontrolüne Etmen Tabanlı Bir Yaklaşım: Bir Jadex Uygulaması Akıllı Ortamlarda Sensör Kontrolüne Etmen Tabanlı Bir Yaklaşım: Bir Jadex Uygulaması Özlem Özgöbek ozlem.ozgobek@ege.edu.tr Ege Üniversitesi Bilgisayar Mühendisliği Bölümü İZMİR Sunum Planı - Giriş - Benzer

Detaylı

Sponsorlar için detaylı bilgi, ekte sunulan Sponsor Başvuru Dosyası nda yer almaktadır.

Sponsorlar için detaylı bilgi, ekte sunulan Sponsor Başvuru Dosyası nda yer almaktadır. TOK 2014 OTOMATİK KONTROL ULUSAL TOPLANTISI KOCAELİ ÜNİVERSİTESİ İZMİT Sayın Yetkili, Otomatik Kontrol Türk Milli Komitesi nin kararıyla Otomatik Kontrol Ulusal Toplantısı ve Sergisi 2014 (TOK 2014), Kocaeli

Detaylı

ÖZGEÇMİŞLERDEN VE İŞ İLANLARINDAN DOĞAL DİL İŞLEME YÖNTEMLERİ İLE BİLGİ ÇIKARIMI

ÖZGEÇMİŞLERDEN VE İŞ İLANLARINDAN DOĞAL DİL İŞLEME YÖNTEMLERİ İLE BİLGİ ÇIKARIMI ÖZGEÇMİŞLERDEN VE İŞ İLANLARINDAN DOĞAL DİL İŞLEME YÖNTEMLERİ İLE BİLGİ ÇIKARIMI Gülşen Bal Cem Gültunca Aşkın Karakaş Tunga Güngör Kariyer.net Kariyer.net Kariyer.net Boğaziçi Üniversitesi gulsenb@kariyer.net

Detaylı

Araştırma Geliştirme Ltd. Şti. - Firma Tanıtım Sunumu -

Araştırma Geliştirme Ltd. Şti. - Firma Tanıtım Sunumu - Araştırma Geliştirme Ltd. Şti. - Firma Tanıtım Sunumu - Şubat 2013 Hakkımızda Firma Profili Ekip Faaliyet Alanları Firma Profili Hakkımızda Bilim, Sanayi ve Teknoloji Bakanlığı nın 2012 Teknogirişim Sermaye

Detaylı

Veri Bilim - Yapay Öğrenme Yaz Okulu, 2017 Matematiksel Temeller ve Vaka Çalışmaları

Veri Bilim - Yapay Öğrenme Yaz Okulu, 2017 Matematiksel Temeller ve Vaka Çalışmaları Veri Bilim - Yapay Öğrenme Yaz Okulu, 2017 Matematiksel Temeller ve Vaka Çalışmaları Boğaziçi Üniversitesi, TETAM, Kandilli, İstanbul Konu ve Kapsam Bu yaz okulunda veri bilim ve yapay öğrenme alanında

Detaylı

Yazılım Mühendisliği Bölüm - 3 Planlama

Yazılım Mühendisliği Bölüm - 3 Planlama 1 Yazılım Mühendisliği Bölüm - 3 Planlama 2 3 4 Planlama 5 Yazılım geliştirme sürecinin ilk aşaması Başarılı bir proje geliştirebilmek için projenin tüm resminin çıkarılması işlemi Proje planlama aşamasında

Detaylı

Derin Öğrenme. M. Ali Akcayol Gazi Üniversitesi

Derin Öğrenme. M. Ali Akcayol Gazi Üniversitesi Derin Öğrenme M. Ali Akcayol Gazi Üniversitesi Giriş Yapay zeka nedir? Yapay sinir ağları nasıl çalışır? Derin öğrenme nedir? Derin öğrenme modelleri nelerdir? Derin öğrenme uygulama alanları nelerdir?

Detaylı

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI 10 Aralık 2011, Cumartesi Fen ve Mühendislik Alanlarındaki Çeşitli Araştırma Projelerinden Örneklemeler İçerik

Detaylı

Ö Z G E Ç M İ Ş. 1. Adı Soyadı: Mustafa GÖÇKEN. 2. Doğum Tarihi: 12 Haziran 1976. 3. Unvanı: Yrd. Doç. Dr. 4. Öğrenim Durumu: Ph.D.

Ö Z G E Ç M İ Ş. 1. Adı Soyadı: Mustafa GÖÇKEN. 2. Doğum Tarihi: 12 Haziran 1976. 3. Unvanı: Yrd. Doç. Dr. 4. Öğrenim Durumu: Ph.D. Ö Z G E Ç M İ Ş 1. Adı Soyadı: Mustafa GÖÇKEN 2. Doğum Tarihi: 12 Haziran 1976 3. Unvanı: Yrd. Doç. Dr. 4. Öğrenim Durumu: Ph.D. Derece Alan Üniversite Yıl Lisans Endüstri Mühendisliği Çukurova Üniversitesi

Detaylı

BCA605 Bilgisayar Oyunlarında Yapay Zeka

BCA605 Bilgisayar Oyunlarında Yapay Zeka BCA605 Bilgisayar Oyunlarında Yapay Zeka Ders 1 : Genel Tanıtım Zümra Kavafoğlu Hakkımda Araştırma Alanları Bilgisayar Grafiği ve Animasyonu Fizik-tabanlı Animasyon Karakter Animasyonu Bilgisayar Animasyonu

Detaylı

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi

K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi K-En Yakın Komşu Algoritması Parametrelerinin Sınıflandırma Performansı Üzerine Etkisinin İncelenmesi Erdal TAŞCI* Aytuğ ONAN** *Ege Üniversitesi Bilgisayar Mühendisliği Bölümü **Celal Bayar Üniversitesi

Detaylı

Lale AKARUN, Boğaziçi Üniversitesi.

Lale AKARUN, Boğaziçi Üniversitesi. Lale AKARUN, Boğaziçi Üniversitesi http://www.cmpe.boun.edu.tr/pilab Dr. Lale Akarun Dr. Albert Ali Salah Öğretim üyeleri: Alp Kındıroğlu Yunus Emre Kara Barış Evrim Demiröz Doğa Siyli Ufuk Can Biçici

Detaylı

Türkçe için Karşılaştırmalı bir Kelime Anlamı Belirginleştirme Uygulaması

Türkçe için Karşılaştırmalı bir Kelime Anlamı Belirginleştirme Uygulaması Türkçe için Karşılaştırmalı bir Kelime Anlamı Belirginleştirme Uygulaması Özet: Kelime anlamı belirginleştirme (KAB), bir kelimenin bulunduğu bağlamda hangi anlamı ile kullanıldığının otomatik olarak belirlenebilmesidir.

Detaylı

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması 1 Emre DANDIL Bilecik Ş. Edebali Üniversitesi emre.dandil@bilecik.edu.tr +90228 214 1613 Sunum İçeriği Özet Giriş

Detaylı

Wordnet ve Bilgisayar Ağ Terimleri Sözlüğünün Oluşturulması

Wordnet ve Bilgisayar Ağ Terimleri Sözlüğünün Oluşturulması Wordnet ve Bilgisayar Ağ Terimleri Sözlüğünün Oluşturulması Yeşim Aktaş 1, Ebru Yılmaz İnce 2, Abdülkadir Çakır 3, Akif Kutlu 4 1 Süleyman Demirel Üniversitesi, Bilgisayar Mühendisliği Bölümü, Isparta

Detaylı

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN kergun@balikesir.edu.tr Genel İçerik Veri Madenciliğine Giriş Veri Madenciliğinin Adımları Veri Madenciliği Yöntemleri Sınıflandırma

Detaylı

Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti

Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti BGM 565 - Siber Güvenlik için Makine Öğrenme Yöntemleri Bilgi Güvenliği Mühendisliği Yüksek Lisans Programı Dr. Ferhat Özgür Çatak ozgur.catak@tubitak.gov.tr

Detaylı

YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT

YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ Umut FIRAT ufirat@yahoo.com Öz: Depremler yeryüzünde en çok yıkıma neden olan doğal afetlerdir. Bu durum, depremlerin önceden tahmin edilmesi fikrini

Detaylı

İKTİSADİ VE İDARİ BİLİMLER FAKÜLTESİ İŞLETME BÖLÜMÜ BÖLÜM KODU: 0207

İKTİSADİ VE İDARİ BİLİMLER FAKÜLTESİ İŞLETME BÖLÜMÜ BÖLÜM KODU: 0207 İKTİSADİ VE İDARİ BİLİMLER FAKÜLTESİ İŞLETME BÖLÜMÜ BÖLÜM KODU: 0207 01.Yarıyıl Dersleri Ders Kodu Ders Adı İngilizce Ders Adı TE PR KR AKTS IKT105 İktisada Giriş Introduction to Economics 3 0 3 4 ISL101

Detaylı

Alman Dili Üzerinde Konuşmacı Cinsiyetinin Otomatik Olarak Belirlenmesi. Automatic Determination of the Speaker on the German Language

Alman Dili Üzerinde Konuşmacı Cinsiyetinin Otomatik Olarak Belirlenmesi. Automatic Determination of the Speaker on the German Language Alman Dili Üzerinde Konuşmacı Cinsiyetinin Otomatik Olarak Belirlenmesi Öz Çiğdem Bakır Yıldız Teknik Üniversitesi, Bilgisayar Mühendisliği Geliş Tarihi: 2016-04-05 Kabul Tarihi: 2016-07-09 Kişi tanıma

Detaylı

OTOMATİK VE İNTERAKTİF BÖLÜTLEME YÖNTEMLERİNİN KARŞILAŞTIRILMASI

OTOMATİK VE İNTERAKTİF BÖLÜTLEME YÖNTEMLERİNİN KARŞILAŞTIRILMASI OTOMATİK VE İNTERAKTİF BÖLÜTLEME YÖNTEMLERİNİN KARŞILAŞTIRILMASI Comparision of Automatic and Interactive Segmentatition Methods Serdar ALASU, Muhammed Fatih TALU İnönü Üniversitesi Bilgisayar Mühendisliği

Detaylı

Türkçe Metinler için Hece Tabanlı Konuşma Sentezleme Sistemi

Türkçe Metinler için Hece Tabanlı Konuşma Sentezleme Sistemi Akademik Bilişim 2008 Çanakkale Onsekiz Mart Üniversitesi, Çanakkale, 30 Ocak - 01 Şubat 2008 Türkçe Metinler için Hece Tabanlı Rıfat AŞLIYAN, Korhan GÜNEL Adnan Menderes Üniversitesi,Matematik Bölümü,

Detaylı

Öğrenciler analiz programları hakkında bilgi sahibi olurlar

Öğrenciler analiz programları hakkında bilgi sahibi olurlar Ders Öğretim Planı Dersin Kodu 0000 Dersin Seviyesi Lisans Dersin Adı Bilgisayar Destekli Tasarım ve İmalat Dersin Türü Yıl Yarıyıl AKTS Seçmeli Dersin Amacı İmalat amaçlı bir endüstriyel tasarımda, tasarım

Detaylı

Yüksek Mobiliteli OFDM Sistemleri için Ortak Veri Sezimleme ve Kanal Kestirimi

Yüksek Mobiliteli OFDM Sistemleri için Ortak Veri Sezimleme ve Kanal Kestirimi Yüksek Mobiliteli OFDM Sistemleri için Ortak Veri Sezimleme ve Kanal Kestirimi Erdal Panayırcı, Habib Şenol ve H. Vincent Poor Elektronik Mühendisliği Kadir Has Üniversitesi, İstanbul, Türkiye Elektrik

Detaylı

Ses Temelli Cümle Yöntemi. 1 Hazırlayan: Doç. Dr. Berrin Baydık

Ses Temelli Cümle Yöntemi. 1 Hazırlayan: Doç. Dr. Berrin Baydık Ses Temelli Cümle Yöntemi 1 Hazırlayan: Doç. Dr. Berrin Baydık Sesbilgisel okuma Sesbilgisel okuma ya da sesten giderek okuma bilinmeyen sözcüklerin okunması için okuyucunun harf ya da yazıbirimleri sesbirim

Detaylı

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 6001

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 6001 Dersi Veren Birim: Fen Bilimleri Enstitüsü Dersin Türkçe Adı: Yazılım Kalite Mühendisliği Dersin Orjinal Adı: Software Quality Engineering Dersin Düzeyi:(Ön lisans, Lisans, Yüksek Lisans, Doktora) Lisansüstü

Detaylı

İnşaat Mühendisliği Bölüm Başkanlığı na

İnşaat Mühendisliği Bölüm Başkanlığı na 15/05/2016 İnşaat Mühendisliği Bölüm Başkanlığı na İnşaat Mühendisliği Bölümü İngilizce ve Türkçe Lisans Programlarının Program Çıktıları hakkında 04-14 Mayıs 2016 tarihleri arasında sadece mezun durumunda

Detaylı

Yeşim AKSAN, Selma Ayşe ÖZEL, Yasin BEKTAŞ, Mustafa AKSAN, Umut Ufuk DEMİRHAN, Ümit MERSİNLİ, Hakan YILMAZER. Sunan : Yasin BEKTAŞ.

Yeşim AKSAN, Selma Ayşe ÖZEL, Yasin BEKTAŞ, Mustafa AKSAN, Umut Ufuk DEMİRHAN, Ümit MERSİNLİ, Hakan YILMAZER. Sunan : Yasin BEKTAŞ. Yeşim AKSAN, Selma Ayşe ÖZEL, Yasin BEKTAŞ, Mustafa AKSAN, Umut Ufuk DEMİRHAN, Ümit MERSİNLİ, Hakan YILMAZER Sunan : Yasin BEKTAŞ 5 Şubat 2014 1. Giriş 2. Alanyazın 3. Açık Kaynak / Ücretsiz Yazılımlarla

Detaylı

Bireysel Emeklilik Sisteminde Katılımcı Memnuniyetinin Artırılması. Mert C. Demir, Ph.D. Emeklilik Gözetim Merkezi

Bireysel Emeklilik Sisteminde Katılımcı Memnuniyetinin Artırılması. Mert C. Demir, Ph.D. Emeklilik Gözetim Merkezi Bireysel Emeklilik Sisteminde Katılımcı Memnuniyetinin Artırılması Mert C. Demir, Ph.D. Emeklilik Gözetim Merkezi Anahat Bireysel Emeklilik Sistemi, tanımı Bireysel Emeklilik Sistemi, bugünü Emeklilik

Detaylı

Çeşme Yarımadası İçin Rüzgar Bilgisi Analizi Ve

Çeşme Yarımadası İçin Rüzgar Bilgisi Analizi Ve Çeşme Yarımadası İçin Rüzgar Bilgisi Analizi Ve Rüzgar Hızı Öngörüsü 3. İzmir Rüzgar Sempozyumu 08-10 Ekim 2015, İzmir Oktay Karakuş, M.Sc. İzmir Yüksek Teknoloji Enstitüsü, İYTE Ercan E. Kuruoğlu, Ph.D.

Detaylı

Elbistan Meslek Yüksek Okulu Güz Yarıyılı

Elbistan Meslek Yüksek Okulu Güz Yarıyılı HAFTA III Bilgi iletişim sistemi : Bilgi iletişim sistemi, dağıtık sistem içerisinde düğümler arasındaki iletişimi desteklemekle yükümlüdür. İletişim sistemi, iletişim ağı ile bağlanmış herhangi bir düğümün,

Detaylı

Kolektif Öğrenme Metotları

Kolektif Öğrenme Metotları Kolektif Öğrenme Metotları Kolektif öğrenme algoritmalarına genel bakış 1-Bagging 2-Ardışık Topluluklarla Öğrenme (Boosting) 3-Rastsal Altuzaylar 4-Rastsal Ormanlar 5-Aşırı Rastsal Ormanlar 6-Rotasyon

Detaylı

HUNGAROLOJİ ANABİLİM DALI 2015-2016 EĞİTİM ÖĞRETİM ÖĞRETİM YILI GÜZ PROGRAMI

HUNGAROLOJİ ANABİLİM DALI 2015-2016 EĞİTİM ÖĞRETİM ÖĞRETİM YILI GÜZ PROGRAMI .SINIF / YARIYIL Temel Yabancı Dil (İngilizce) (English Language) YDİ/YDA/YDF Temel Yabancı Dil (Almanca) (German Language) 0 Temel Yabancı Dil (Fransızca) (French Language) TDİ 0 Türk Dili I (Turkish

Detaylı

KONUŞMA TANIMA TEORİSİ VE TEKNİKLERİ 1 SPEECH RECOGNITION THEORY AND TECHNIQUES

KONUŞMA TANIMA TEORİSİ VE TEKNİKLERİ 1 SPEECH RECOGNITION THEORY AND TECHNIQUES Mart 2008 Cilt:16 No:1 Kastamonu Eğitim Dergisi 249-266 KONUŞMA TANIMA TEORİSİ VE TEKNİKLERİ 1 Nursel YALÇIN Gazi Ü., Endüstriyel Sanatlar Eğitim Fakültesi, Bilgisayar Eğitimi Bölümü, Ankara. Özet Konuşma

Detaylı

DEÜ MÜHENDİSLİK FAKÜLTESİ FEN BİLİMLERİ DERGİSİ Cilt: 12 Sayı: 3 sh. 77-85 Ekim 2010 BİÇİMBİLİME DAYALI DOKÜMAN SIKIŞTIRMA

DEÜ MÜHENDİSLİK FAKÜLTESİ FEN BİLİMLERİ DERGİSİ Cilt: 12 Sayı: 3 sh. 77-85 Ekim 2010 BİÇİMBİLİME DAYALI DOKÜMAN SIKIŞTIRMA DEÜ MÜHENDİSLİK FAKÜLTESİ FEN BİLİMLERİ DERGİSİ Cilt: 12 Sayı: 3 sh. 77-85 Ekim 2010 BİÇİMBİLİME DAYALI DOKÜMAN SIKIŞTIRMA (MORPHOLOGY BASED TEXT COMPRESSION) Hayriye GÖKSU*, Banu DİRİ** ÖZET/ABSTRACT

Detaylı

TAM METİN YAZIM KURALLARI

TAM METİN YAZIM KURALLARI IMUCO 16 TAM METİN YAZIM KURALLARI Not: Bildirilerin yazımında APA6 stili kullanılacaktır. Aşağıda belirtilmeyen bir konu olursa mutlaka APA6 stili ile ilgili (www.apastyle.org) kısma bakınız. 1. Yazılar

Detaylı

Zeki Optimizasyon Teknikleri

Zeki Optimizasyon Teknikleri Zeki Optimizasyon Teknikleri Yapay Sinir Ağları (Artificial Neural Network) Doç.Dr. M. Ali Akcayol Yapay Sinir Ağları Biyolojik sinir sisteminden esinlenerek ortaya çıkmıştır. İnsan beyninin öğrenme, eski

Detaylı

Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme

Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme 1 Cem Rıfkı Aydın, 1 Ali Erkan, 1 Tunga Güngör, 2 Hidayet Takçı 1 Boğaziçi Üniversitesi, 2 Cumhuriyet Üniversitesi Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme AB 14 7 Şubat 2014

Detaylı

ANKARA ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ

ANKARA ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ ANKARA ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ SANAL ARTIRILMIŞ VE AKILLI TEKNOLOJİLER (SAAT) LABORATUVARI SAAT Laboratuvarı Koordinatör: Yrd. Doç. Dr. Gazi Erkan BOSTANCI SAAT

Detaylı

YAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ

YAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ YAPAY SİNİR AĞLARI Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ İÇERİK Sinir Hücreleri Yapay Sinir Ağları Yapısı Elemanları Çalışması Modelleri Yapılarına Göre Öğrenme Algoritmalarına Göre Avantaj ve

Detaylı

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining) Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Konular Denetimli Öğrenmenin Temelleri Karar Ağaçları Entropi ID3 Algoritması C4.5 Algoritması Twoing

Detaylı

Öğrencilere bilgisayar destekli titreşim analizi yeteğinin kazandırılması

Öğrencilere bilgisayar destekli titreşim analizi yeteğinin kazandırılması Ders Öğretim Planı Dersin Kodu 50700 4222007 Dersin Seviyesi Lisans Dersin Adı BİLGİSAYAR DESTEKLİ TİTREŞİM SİMÜLASYONU Dersin Türü Yıl Yarıyıl AKTS Seçmeli 4 8 3 Dersin Amacı Öğrencilere bilgisayar destekli

Detaylı

Markov Zinciri Monte Carlo Yaklaşımı. Aktüeryal Uygulamaları

Markov Zinciri Monte Carlo Yaklaşımı. Aktüeryal Uygulamaları Markov Zinciri Monte Carlo Yaklaşımı ve Aktüeryal Uygulamaları ŞİRZAT ÇETİNKAYA Aktüer Sistem Araştırma Geliştirme Bölümü AKTÜERLER DERNEĞİ 2.0.20080 2008 - İSTANBUL Sunum Planı. Giriş 2. Bayesci Metodun

Detaylı