Soru Cevaplama. Reyyan Yeniterzi. Özyeğin Üniversitesi Bilgisayar Mühendisliği Bölümü

Benzer belgeler
Kelime Gösterimleri (Word Representation Word Embeddings)

Bilgiye Erişim Sistemleri Information Retrieval (IR) Systems. M.Fatih AMASYALI BLM 5212 Doğal Dil İşlemeye Giriş Ders Notları

Hafta 10 - Vektör Uzay Modelleri

Büyük, Dağıtık, Veri Yoğunluklu Uygulamalarda Programlama Paradigmaları

VERİ MADENCİLİĞİ Metin Madenciliği

Metin Sınıflandırma. Akış

T.C. ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ EĞİTİM ÖĞRETİM YILI DERS KATALOĞU

Büyük Veri ve Endüstri Mühendisliği

BLM 4811 MESLEKİ TERMİNOLOJİ II Salı , D-109 Dr. Göksel Biricik

Derin Yapay Sinir Ağları ve Derin Öğrenme ye Kısa Bir Giriş

Veri ve Metin Madenciliği

Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma. Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu. Sunan : Esra Nergis Güven

DİZİN. Not: Koyu harfle yazılan sayfalar ilgili terimin yoğun olarak geçtiği sayfaları göstermektedir.

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

Veri ve Metin Madenciliği. Zehra

Web Madenciliği (Web Mining)

Bilgiye Erişim Sistemlerinde Veri Arama ve Eşleştirme

BİLGİ VE BELGE YÖNETİMİ BÖLÜMÜ LİSANS EĞİTİM BAHAR DÖNEMİ PROGRAMI

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 2 ( yılı öncesinde birinci

Manisa Celal Bayar Üniversitesi Yazılım Mühendisliği Bölümü YZM Veri Yapıları Dersi. Proje#2

MÜFREDAT DERS LİSTESİ

Elena Battini SÖNMEZ Önder ÖZBEK N. Özge ÖZBEK. 2 Şubat 2007

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 6003

YAPAY ZEKA (Artificial Intelligence)

Web Madenciliği (Web Mining)

FORMEL DİLLER VE SOYUT MAKİNALAR. Hafta 2

SE4SEE A Grid-Enabled Search Engine for

Türkçe için Karşılaştırmalı bir Kelime Anlamı Belirginleştirme Uygulaması

Bilgisayar Sistemleri ilk ortaya çıktığında...

SORU CEVAPLAMA ÜZERİNE BİR ARAŞTIRMA

Cambridge International Examinations Cambridge International General Certificate of Secondary Education

Doküman dili tanıma için ikili örüntüler tabanlı yeni bir yaklaşım

Marketing plan for your startup

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN

A New Approach for Named Entity Recognition

ALGORİTMA VE PROGRAMLAMA I DERS NOTU#8

UNIT 1 HELLO! Quiz I'm from Greece. I'm. Where are you from? Boşluğa uygun olan hangisidir? A) German. B) Greek I'm from. C) Turkish D) English

NATURAL LANGUAGE PROCESSING

Course Information. Course name Code Term T+P Hours National Credit ECTS

Doğan Can, Murat Saraçlar. Bebek, İstanbul. 9 Mart, 2009

YAPAY ZEKA VE DERİN ÖĞRENMENİN GÜNÜMÜZDEKİ UYGULAMA ALANLARI

Zeki Optimizasyon Teknikleri

ÖZGEÇMİŞ. 1. Adı Soyadı : Olcay Taner Yıldız. 2. Doğum Tarihi : Unvanı : Doç. Dr. 4. Öğrenim Durumu :

BCA605 Bilgisayar Oyunlarında Yapay Zeka

Digital Design HDL. Dr. Cahit Karakuş, February-2018

Muhammet Fatih AKBAŞ, Enis KARAARSLAN, Cengiz GÜNGÖR

K U L L A N I M B İLGİLERİ

Web Madenciliği (Web Mining)

Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme

Semantik Bilgi Yönetimi

Pamukkale Üniversitesi Mühendislik Bilimleri Dergisi Pamukkale University Journal of Engineering Sciences

Sosyal Ağlar ve Kütüphaneler. Tuba Akbaytürk Çanak

BİLECİK ŞEYH EDEBALİ ÜNİVERSİTESİ AKADEMİK ÖZGEÇMİŞ FORMU

Örüntü Tanıma (EE 448) Ders Detayları

DERS BİLGİLERİ Haftalık Dersin Adı Kodu Yıl Yarıyıl TUL Saati Kredi AKTS

YZM 5257 YAPAY ZEKA VE UZMAN SİSTEMLER DERS#6: GENETİK ALGORİTMALAR

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir

İstanbul Şehir Üniversitesi Bahar

Metin Sınıflandırmada Benzerlik Hesaplama Tekniklerinin Değerlendirilmesi. Evaluation of Similarity Measurement Techniques for Text Classification

Cambridge International Examinations Cambridge International General Certificate of Secondary Education

ANKARA ÜNİVERSİTESİ A ÖĞRENCİ İŞLERİ DAİRE BAŞKANLIĞI

Öğrenim Kazanımları Bu programı başarı ile tamamlayan öğrenci;

İnsan beyni, birbiri ile karmaşık ilişkiler içinde bulunan nöron hücreleri kitlesidir. Tüm aktivitelerimizi kontrol eder, yaradılışın en görkemli ve

SAKARYA ÜNİVERSİTESİ EĞİTİM FAKÜLTESİ DÖRDÜNCÜ SINIF ÖĞRENCİLERİNİN ÖĞRETMENLİK MESLEĞİNE KARŞI TUTUMLARI

MATEMATİK BÖLÜMÜ BÖLÜM KODU:3201

AES (Advanced Encryption Standard)

Programlama Nedir? Bir bilgisayar bilimcisi gibi düşünmek ve programlama ne demektir?

Öğrenim Kazanımları Bu programı başarı ile tamamlayan öğrenci;

1 ANADAL ELEKTRİK ELEKTRONİK MÜHENDİSLİĞİ, İKİNCİ DAL BİLGİSAYAR MÜHENDİSLİĞİ ÇAP PROGRAMI

YÖNETİM BİLİŞİM SİSTEMLERİ BÖLÜMÜ YENİ DERS MÜFREDATI (1) FAKÜLTESİ: İŞLETME FAKÜLTESİ / BUSINESS SCHOOL

Kablosuz Sensör Ağlar ve Eniyileme. Tahir Emre KALAYCI. 21 Mart 2008

ÖZGEÇMİŞ. Derece Alan Üniversite Yıl

Otomatik Doküman Sınıflandırma

Marketing plan for your startup

Semantik Ağ ve Üst Veri Sistemleri İçin Yeni Nesil Veri Tabanı Yönetim Modeli: NoSQL. R. Orçun Madran Atılım Üniversitesi.

Veritabanı Yönetim Sistemleri, 2. basım Zehra ALAKOÇ BURMA, 2009, Seçkin Yayıncılık

Doğal Dil Đşleme (DDĐ) Natural Language Processing (NLP)

EĞİTİM-ÖĞRETİM YILI MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ (İNGİLİZCE) BÖLÜMÜ DERS PROGRAMINDA YAPILAN DEĞİŞİKLİKLER

Ö Z G E Ç M İ Ş. 1. Adı Soyadı: Mustafa GÖÇKEN. 2. Doğum Tarihi: 12 Haziran Unvanı: Yrd. Doç. Dr. 4. Öğrenim Durumu: Ph.D.

Doğal Dil İşleme Nedir? Doğal Dil İşleme

Turquaz. Açık kodlu muhasebe yazılımı Turquaz Proje Grubu

... ROBOTİK VE KODLAMA EĞİTİMİ ÇERÇEVESİNDE ÖĞRETİM YILI BİLİŞİM TEKNOLOJİLERİ DERSİ ÜNİTELENDİRİLMİŞ YILLIK DERS PLANI

ÖZGEÇMİŞ. 1. Adı Soyadı : Kamile ŞANLI KULA İletişim Bilgileri : Ahi Evran Üniversitesi, Fen Edebiyat Fakültesi, Adres Matematik Bölümü, KIRŞEHİR

Algoritmalar. Arama Problemi ve Analizi. Bahar 2016 Doç. Dr. Suat Özdemir 1

2.1 Bir Sınıfı Örneklerinden Öğrenme Vapnik-Chervonenkis (VC) Boyutu Olası Yaklaşık Doğru Öğrenme... 21

Hidden Markov Model. Forward Algoritması Viterbi Algoritması. Doç.Dr.Banu Diri. Rasgele Olmayan /Gerekirci Model

ÖZGEÇMİŞ. Derece Alan Üniversite Yıl Lisans Bilgisayar Mühendisliği Atılım Üniversitesi

Mühendislik Eğitimi ve 21. Yüzyıl

Fonksiyonu. Yakup KUTLU ve Apdullah YAYIK. Proceedings/Bildiriler Kitabı

Available online at

IMPORTANT ANNOUNCEMENT ON 2015 SUMMER SCHOOL

2 ANADAL ELEKTRİK ELEKTRONİK MÜHENDİSLİĞİ, İKİNCİ DAL BİLGİSAYAR MÜHENDİSLİĞİ YANDAL PROGRAMI

COĞRAFİ BİLGİ SİSTEMLERİ İLERİ SEVİYE EĞİTİMLERİ ARCGIS SCHEMATİCS EĞİTİMİ

Zeki Optimizasyon Teknikleri

Yönetim Bilişim Sistemleri (Karma) - 1. yarıyıl Hukukun Temelleri Fundamentals of Law TR

Türkçe nin Bağlılık Ayrıştırması. Gülşen Cebiroğlu Eryiğit

Web Madenciliği (Web Mining)

KİNETİK MODEL PARAMETRELERİNİN BELİRLENMESİNDE KULLANILAN OPTİMİZASYON TEKNİKLERİNİN KIYASLANMASI

Bilgisayar Mimarisi ve Organizasyonu Giriş

Transkript:

Soru Cevaplama Reyyan Yeniterzi Özyeğin Üniversitesi Bilgisayar Mühendisliği Bölümü

Özgeçmiş Lisans & Yüksek Lisans Yüksek Lisans & Doktora İş Deneyimi 2

Araştırma Alanları Doğal Dil İşleme - Natural Language Processing (NLP) Bilgi Alımı ve Çıkarımı - Information Retrieval (IR) & Extraction (IE) Metin Madenciği - Text Mining (TM) Arama Motorları - Search Engines (SE) Makine Öğrenmesi - Machine Learning (ML) Sosyal Medya ve Ağ Analizi - Social Media & Network Analysis Big Text Data IR + SE Small Relevant Data NLP + TM + IE Knowledge 3

Soru Cevaplama Question Answering (QA) Question Answer 4

Soru Cevaplama Question Answer 5 Bu sunumda kullanılan tüm kaynaklar sunumun sonunda listelenmiştir.

Bir çok işlemsel göreve QA olarak bakabiliriz. Konuşma İşleme İşlemşel Biyoloji Doğal Dil İşleme Soru Cevaplama (QA) Dizi Etiketleme (Varlık Tanıma (NER), Sözcük Etiketleme (POS)) Makine Çevirisi Metin Sınıflandırma (Duygu Analizi) 6

7 Soru Cevaplama AI-complete bir problemdir!

Soru Çeşitleri Kısa Gerçekçi Sorular Basit gerçeklerle cevaplanabilir sorular Kimya alanında 2015 Nobel Ödülünü kim kazandı? Kolombiya-İngiltere maçının skoru neydi? Türk milli futbol takımı antrenörü kaç yaşındadır? 8

Kısa Gerçekçi Sorular Basit gerçeklerle cevaplanabilir sorular Karmaşık (Anlatımsal) Sorular Bir açıklama gerektirir Soru Çeşitleri Almanya nın 2018 Dünya Kupasından erken çıkışının nedenleri nelerdir? 20 yaşındayım. Nobel ödülünü kazanmak için önümüzdeki 30-40 yılda ne yapmalıyım? 9

Kısa Gerçekçi Sorular Basit gerçeklerle cevaplanabilir sorular Karmaşık (Anlatımsal) Sorular Bir açıklama gerektirir Soru Çeşitleri 10

Bilgi Tabanlı (Knowledge Base) Soru Cevaplama Yapısal Veri Soru Cevaplama Yaklaşımları 11

Bilgi Tabanlı Soru Cevaplama Yapısal Veri Soru Cevaplama Yaklaşımları İlk Soru Cevaplama Sistemi Baseball: An Automatic Question-Answerer (Green et al. 1961) Where did each team play on July 7? 12

Bilgi Tabanlı SC What is the capital city of Turkey? Semantic Parsing capital_city(turkey,?x) Knowledge Base Ankara 13

Bilgi Tabanlı SC What is the capital city of Turkey? Semantic Parsing capital_city(turkey,?x) Wikidata Knowledge Graph FreeBase OpenStreetMap Knowledge Relational Base DB Ankara 14

Bilgi Tabanlı SC What is the capital city of Turkey? Semantic Parsing capital_city(turkey,?x) Metinten ilişki çıkarımı Kural Tabanlı (Reg Exps) Denetimli MÖ Yarı Denetimli MÖ Denetimsiz MÖ Knowledge Base Ankara 15

Bilgi Tabanlı Soru Cevaplama Yapısal Veri Soru Cevaplama Yaklaşımları Bilgi Çıkarımı (IR) Tabanlı Soru Cevaplama Yapısal Olmayan Veri 16

When was the Turkish Republic founded? IR-Based QA Answer Type Selection Question Processing Query Formulation Retrieval Document Retrieval Document Index Answer Processing Relevant Documents Oct 29, 1923 Candidate Ranking Answer Extraction Passage Retrieval 17 Passages

18 Text REtrieval Conference (TREC)... büyük metin koleksiyonlarından bilgi edinme araştırmasını teşvik etmek

TREC QA TREC QA 1999 2007 TREC Live QA 2015 2017 Gerçek kullanıcıların Yahoo Answers sitesine gönderdikleri en yeni soruları yanıtlayan "canlı" soru yanıtlama 19

Bilgi Tabanlı Soru Cevaplama Yapısal Veri Soru Cevaplama Yaklaşımları Bilgi Çıkarımı Tabanlı Soru Cevaplama Yapısal Olmayan Veri Melez Soru Cevaplama Yapısal ve Yapısal OlmayanVeri IBM Watson & DeepQA 20

22

23

24 Jeopardy! (Türkiye de Riziko)

25 Jeopardy!

Jeopardy! 26 What are Greece and Iran?

Jeopardy! Farklı soru tipleri: BEFORE & AFTER The Jerry Maguire star who automatically maintains your vehicle s speed. 27

Jeopardy! Farklı soru tipleri: BEFORE & AFTER The Jerry Maguire star who automatically maintains your vehicle s speed. Tom Cruise control 28

Deep Blue vs. Jeopardy! Satranç Sonlu ve iyi tanımlanmış arama alanı Sınırlı sayıda hamle ve durum Jeopardy! Doğal dili anlamak büyük bir mücadeledir Aynı şeyi ifade etmenin sonsuz sayıda yolu Belirsizdir, içeriğe bağlıdır 29

Jeopardy! Yüksek bulma Yüksek güven Yüksek hız Ortalama 3 saniye cevaplama süresi 30

Başlangıç Sistemleri PIQUANT IBM OpenEphyra Carnegie Mellon University 31

Kazananlar Başlangıç Performansı Ken Jennings, arka arkaya 74 oyun kazandı 2007 Başlangıç Sistemi 32

Başlangıç Sistemleri PIQUANT IBM OpenEphyra Carnegie Mellon University (CMU) Bunları uyarlama girişimleri başarısız oldu! Diğer yayınlanmış araştırmaları çoğaltmak da zor Hızlı geliştirme için yol yok 33

34 DeepQA Mimarisi

DeepQA Mimarisi Kitlesel Paralel Olasılıksal Kanıta Dayalı Mimari Birçok algoritma (> 100) ve birçok hipotez Varsayım: Bileşenlerin hiçbiri soruyu tam olarak anlamadı Question Multiple Interpretations 100s sources 100s Possible Answers 1000 s of Pieces of Evidence 100,000 s scores from many simultaneous Text Analysis Algorithms 35... Answer & Confidence

DeepQA Mimarisi Cevap Türü: 20.000 Jeopardy soru örneğinde 2500 cevap tipi En sık görülen 15 soru tipi: o, ülke, şehir, adam, film, devlet, o, yazar, grup, burada, şirket, başkan, sermaye, yıldız, roman Soru ayrıştırma 36

DeepQA Mimarisi Dışarıya kapalı bir sistem İnternette web araması yapamaz hatta internete bağlantı dahi yok Başka sistem veya insanla etkileşim yok 37

DeepQA Mimarisi Tutturma (Recall) >>> Bulma (Precision) Primary Search (Birincil Arama): Mümkün olduğunca potansiyel olarak yanıt içeren içeriğin bulunması 38

DeepQA Mimarisi Kanıtların Çekilmesi Ek kanıt bulmak için aday cevap ve soruların birlikte kullanılması Puanlama: Birçok farklı yaklaşım (> 50) geçiş kaynağı güvenilirliği coğrafi konum zamansal ilişkiler taksonomik sınıflandırma diğerleri... 39

DeepQA Mimarisi Yanıtların Birleştirilmesi: Bazı adayların farklı yazımları olabilir. Bunların birleştirilmesi J.F.K ve John F. Kennedy Güven Tahmini ve Sıralaması: Makine Öğrenme modelleri Farklı soru türleri farklı ağırlık 40

41 DeepQA Mimarisi

42 Performans Değişimi

Şampiyonlarla Yarışma 14 Ocak 2011 43

Alt Görevlerin Performansı Alınacak Mesajlar Mükemmel olmayan NLP hala kullanışlıdır! Hala iyileştirme yapılması gereken yerler var! 44

Derin Öğrenme Yaklaşımları

Taslak Kelime Kodlamaları (Word Embeddings) Evrişimsel Sinir Ağları (CNN) 46

Word2Vec 47 Mikolov, Tomas, et al. "Efficient estimation of word representations in vector space." (2013).

48 Kelime Kodlamaları (Word Embeddings)

49 Kelime Kodlamaları (Word Embeddings)

Doğal Dil İşlemede CNN Uygulaması Yoon Kim. Convolutional Neural Networks for Sentence Classification. EMNLP 2014. 50

Taslak Kelime Kodlamaları (Word Embeddings) Evrişimsel Sinir Ağları (CNN) Deep learning for answer sentence selection (2014) 51

Yanıt Cümle Seçimi Görev: Girdi: Soru ve Aday Cevap Cümleleri Çıktı: Belirlenen yanıt içeren cümleler (İkili değerlendirme: 0 veya 1) Varsayım: Yanıt içeren cümleler sorulara çok benzer Önceki Yaklaşımlar: Sözdizimsel bilgilere ve el yapımı semantik kaynaklara (WordNet gibi) dayalı benzerlik 52

Yanıt Cümle Seçimi Soru (q) ve cevapları (a) d boyutunda vector olarak modelle Benzerlik Ölçüsü: Generatif yaklaşım: M bir dxd dönüşüm matrisi a verildiğinde, dönüşüm matrisini kullanarak alakalı bir soru üretin q = Ma Üretilen q ve orjinal q vektörleri arasındaki benzerliği ölçün Sigmoid: Benzerlik puanını olasılıklara dönüştürür Eğitim hedefi: Çapraz entropiyi en aza indirir 53

q ve a vektörlerin oluşturulması Yanıt Cümle Seçimi CNN ile Bigram modeli: Önceden Eğitilmiş Semantik Kelime Temsilleri Bir CNN katmanı (bigramları birleştirmek için) Ortalama (Toplam) Havuzlama katmanı (bigram özniteliklerini birleştirmek için) Cümle vektörü 54

Yanıt Cümle Seçimi Önceden eğitilmiş kelime kodlama vektörlerinden kaynaklanan bir zayıflık Kardinal sayılar ve varlık isimleri Çözüm: Ek Öznitellikler F1: Soru ve cevapda geçen ortak kelime sayısı F2: i.d.f ağırlıklı F1 Son Model: Lojistik regresyon applied to (1) dağılımsal benzerlik modeli (2) F1 ve (3) F2 ye uygulanmıştır. 55

Yanıt Cümle Seçimi Yüksek sonuçlar Diğer dillere kolaylıkla uygulanabilir Herhangi bir dile ait özel kaynak gerektirmez 56

Taslak Kelime Kodlamaları (Word Embeddings) Evrişimsel Sinir Ağları (CNN) Deep learning for answer sentence selection (2014) Tekrarlayan Sinir Ağları (RNN) 57

Tekrarlayan Sinir Ağları (RNN) 58 http://colah.github.io

Tekrarlayan Sinir Ağları (RNN) the clouds are in the sky 59 http://colah.github.io

Tekrarlayan Sinir Ağları (RNN) I grew up in France I speak fluent French. 60 http://colah.github.io

Uzun Kısa Süreli Bellek Ağları (LSTM) 61 http://colah.github.io

Uzun Kısa Süreli Bellek Ağları (LSTM) Hücre Durumu (Cell State) Bu hücrelerden bazı bilgiler çıkarılabilir veya eklenebilir. Bu da kapılarla (gates) mümkündür Unutma (Forget gate) Girdi (Input gate) Çıktı (Output gate) 62 http://colah.github.io

63 Makine Çevirisinden Bir Örnek

64 Makine Çevirisinden Bir Örnek

65 Makine Çevirisinden Bir Örnek

Makine Çevirisi 66 http://www.wildml.com

Dikkat (Attention) Mekanizması Her bir çıktı terim üretimi sırasında girdinin farklı bölümlerine dikkat etmek ağırlıklar 67 http://www.wildml.com

Dikkat (Attention) Mekanizması 68 http://www.wildml.com

Taslak Kelime Kodlamaları (Word Embeddings) Evrişimsel Sinir Ağları (CNN) Deep learning for answer sentence selection (2014) Tekrarlayan Sinir Ağları (RNN) Teaching machines to read and comprehend (2015 NIPS) Ask me anything: Dynamic memory networks for natural language processing (2016 ICML) 69

70 Okuduğunu Anlama

71 Derin LSTM Okuyucu

72 Dikkatli Okuyucu (The Attentive Reader)

73 Dikkatli Okuyucudan dikkat ısı haritaları

Taslak Kelime Kodlamaları (Word Embeddings) Evrişimsel Sinir Ağları (CNN) Deep learning for answer sentence selection (2014) Tekrarlayan Sinir Ağları (RNN) Teaching machines to read and comprehend (2015 NIPS) Ask me anything: Dynamic memory networks for natural language processing (2016 ICML) 74

Herhangi bir QA Görevi için Genel Mimari Dinamik Bellek Ağları (DMN) Görev: Okuduğunu Anlama Bir giriş metni ve bir soru ele alındığında, gerekli geçişli akıl yürütmeleri gerçekleştirmek ve soruyu cevaplamak 75

76 Dynamic Memory Network

Semantik Bellek Modülü Kelime kodlamaları hem girdi metin hem de soru metni için kullanılır. 77

Tekrarlayan Sinir Ağları Metin Giriş Modülü Giriş dizisi tek cümle ise, modül RNN içindeki tüm saklı durumları çıkarır (# çıktı gösterimi = # kelime) Giriş dizisi bir cümle listesiyse, modül sadece her cümlenin sonundaki gizli durumları çıkarır (# çıktı gösterimi = # cümle) 78

Tekrarlayan Sinir Ağları Soru Modülü Modül, son gizli durumunu epizodik bellek modülüne girdi olarak verir. 79

80 Dynamic Memory Network (DMN)

81 Bir cümle, soru ya da hafıza ile ilgili ise, kapılar aktive edilir

82

Cevap Modülü Tekrarlayan Sinir Ağları Göreve bağlı olarak, bu modül ya en sonda yada her bir girdi için tetiklenir. 83

84 Dynamic Memory Network (DMN)

Deneyler Aşağıdaki görevlere uygulandı: Soru Cevaplama Duygu Analizi (Metin Sınıflandırması) Sözcük Etiketleme (Sıralı Etiketleme) Elde edilen en yüksek performans! 85

Analizler Epizodik Bellek Modülünde Geçiş Sayısı Analizi 86

87 Analizler

Uçtan uca eğitim sistemi Dynamic Memory Networks QA görevi olarak görerek çok görevli öğrenme Tüm bu görevler için tek bir mimari Hiperparametreler değişebilir Giriş metnini tam olarak anlayabilmek için görev daha da zorlaştıkça daha fazla geçiş gerekli hale gelmekte 88

Kaynaklar Bilgi Tabanlı ve Bilgi Çıkarımı Tabanlı Sistemler Jurafsky, Dan, and James H. Martin. Speech and language processing. Vol. 3. London: Pearson, 2014. TREC Proceedings CS224: Deep Learning for NLP (Stanford) Oxford Deep NLP (University of Oxford + DeepMind) IBM Watson Ferrucci, David, et al. "Building Watson: An overview of the DeepQA project." AI magazine 31.3 (2010): 59-79. IBM Journal of Research and Development 56.3.4 (2012) Ferrucci, David A. "Introduction to This is Watson." 89

Kaynaklar Derin Öğrenme Yu, Lei, et al. "Deep learning for answer sentence selection." arxiv preprint arxiv:1412.1632 (2014). Hermann, Karl Moritz, et al. "Teaching machines to read and comprehend." NIPS 2015. Kumar, Ankit, et al. "Ask me anything: Dynamic memory networks for natural language processing." ICML 2016. 90

Erişilebilir Faydalı Dersler Machine Learning (Coursera) Deep Learning Specialization (Coursera) Neural Networks for Machine Learning (Coursera) CS230: Deep Learning (Stanford) CS231: CNN for Visual Recognition (Stanford) CS224: Deep Learning for NLP (Stanford) Oxford Deep NLP (University of Oxford + DeepMind) 91

92