Dilbilgisi ve Diller



Benzer belgeler
BAĞLAMDAN BAĞIMSIZ VE BAĞLAMDAN BAĞIMSIZ OLMAYAN DİLLER (CONTEXT-FREE AND NON-CONTEXT-FREE LANGUAGES)

Context-Free Grammars and Languages

FORMEL DİLLER VE SOYUT MAKİNALAR. Hafta 3

YZM Biçimsel Diller ve Otomata Teorisi. Ders#06

BAĞLAMDAN BAĞIMSIZ (CONTEXT-FREE) GRAMERLER (CFG) VE DİLLER (CFL)

FORMEL DİLLER VE SOYUT MAKİNALAR. Hafta 1

Otomata Teorisi (BİL 2114)

Derleyici Kuramı (Compiler Theory)

Syntax Analysis. 4/5/2004 Formal Diller 4.1

Manisa Celal Bayar Üniversitesi Yazılım Mühendisliği Bölümü YZM Biçimsel Diller ve Otomata Teorisi. Final Sınavı Soruları A KİTAPÇIĞI

Sözdizimsel Analiz (Syntactic Analysis)

Formal Diller Ve Otomat Teorisi

Chomsky Hiyerarşisi. Düzenli Diller ve Đfadeler 03/09/2014. Doç.Dr.Banu Diri

FORMEL DİLLER VE SOYUT MAKİNALAR. Hafta 2

,$( -./(,$( 0$0$ (,$(

Manisa Celal Bayar Üniversitesi Yazılım Mühendisliği Bölümü YZM Biçimsel Diller ve Otomata Teorisi. Final Sınavı Örnek Soruları A0 KİTAPÇIĞI

Semantik (Semantics): ifadelerin, deyimlerin, ve program birimlerinin anlamı Sentaks ve semantik bir dilin tanımı sağlar

! " # $ % & '( ) *' ' +, -. /) /) 0 # /) %, %, 1 2

! " # $ % & '( ) *' ' +, -. /.,

DERS NOTLARI. Yard. Doç. Dr. Namık AKÇAY İstanbul Üniversitesi Fen Fakültesi

BLM210 HAFTA 2 FORMAL METHODS OF SYNTAX DESCRIPTION (SÖZDİZİM TARİFİNİN BİÇİMSEL YÖNTEMLERİ)

BBM Discrete Structures: Final Exam Date: , Time: 15:00-17:00

Matematik Mühendisliği - Mesleki İngilizce

YÖNEYLEM ARAŞTIRMASI-2 -Markov Zincirleri-

HESAP. (kesiklik var; süreklilik örnekleniyor) Hesap sürecinin zaman ekseninde geçtiği durumlar

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN

mikroc Dili ile Mikrodenetleyici Programlama Ders Notları

8. HOMOMORFİZMALAR VE İZOMORFİZMALAR

! " # $ % & '( ) *' ' +, $ $ - $ (. $- $ ( / $ % / $ 0 -( 1( $ (2- -(

Uzaktan Eğitim Uygulama ve Araştırma Merkezi

Otomata Teorisi (BİL 2114)

ANA SINIF TÜRETİLEN BİRİNCİ SINIF TÜRETİLEN İKİNCİ SINIF

BM312 Ders Notları 2014

Bilgisayar Mimarisi. Veri (DATA) Veri nedir? Veri bazı fiziksel niceliklerin ham ifadesidir. Bilgi verinin belli bir yapıdaki şeklidir.

Otomata Teorisi (BİL 2114)



Otomata Teorisi (BİL 2114)

Projenin Adı: Matrisler ile Diskriminant Analizi Yaparak Sayı Tanımlama. Giriş ve Projenin Amacı:

Bölüm 3. Sentaks ve semantik tarifi ISBN

Fıstıkçı Şahap d t c ç

Temel Kavramlar 1 Doğal sayılar: N = {0, 1, 2, 3,.,n, n+1,..} kümesinin her bir elamanına doğal sayı denir ve N ile gösterilir.

İÇİNDEKİLER. Önsöz...2. Önermeler ve İspat Yöntemleri...3. Küme Teorisi Bağıntı Fonksiyon İşlem...48

YZM 2116 Veri Yapıları

Uygulamalı Yapay Zeka. Dr. Uğur YÜZGEÇ Ders 2: Prolog Giriş

Regular Expression vs. Context-Free Grammars. Ambiguity. NFA to CFG. Neden RE ler kullanilir?

Sevdiğiniz editörü açın, Notepad, vi, pico vb. Daha sonra da aşağıdaki kodu yazın:

Değişkenler. Geçerli değişken isimleri : baslamazamani, ad_soyad, x5 Geçersiz değişken isimleri : 3x, while

A Y I K BOYA SOBA SOBA =? RORO MAYO MAS A A YÖS / TÖBT

BASICS OF ENGLISH SENTENCE STRUCTURE

Önermeler mantığındaki biçimsel kanıtlar

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veri Modelleri

MONTAJ MODELLEME ( ASSEMBLY MODELING)

8.Konu Sonlu ve sonsuz kümeler, Doğal sayılar

Adım Adım SPSS. 1- Data Girişi ve Düzenlemesi 2- Hızlı Menü. Y. Doç. Dr. İbrahim Turan Nisan 2011

Bu durumda ya cozum yoktur veya sonsuz cozum vardir. KIsaca cozum tek degildir. Veya cozumler birbirine lineer bagimlidir.

ELN1001 BİLGİSAYAR PROGRAMLAMA I

Otomata Teorisi (BİL 2114)

Ağaç (Tree) Veri Modeli

İÜ AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ. Süreç İyileştirme Standardı

"IF CLAUSE KALIPLARI"

VERİ TABANI I. Yrd.Doç.Dr. İlker ÜNAL. Teknik Bilimler Meslek Yüksekokulu

1 $/ " {ww R : w {a, b} * } ## S asa, S bsb S e#(3 * 5 $(6 )# (2 #$,(- (25 #5

Araştırma Modelleri Prof. Dr. Mustafa Ergün AKÜ - Eğitim Fakültesi

Yaz okulunda (2014 3) açılacak olan (Calculus of Fun. of Sev. Var.) dersine kayıtlar aşağıdaki kurallara göre yapılacaktır:

1. Superlative lerden sonra gelen fiil infinitive olur. ( the latest species to join the

Öğr. Gör. Cansu AYVAZ GÜVEN VERİTABANI-II. Değişken Tanımlama Ve Akış Kontrol Deyimleri

Visual Basic 6.0. Anadolu Üniversitesi Endüstri Mühendisliği Bölümü. Değişkenler ve Veri tipleri. Ders Notları

CHAPTER 7: DISTRIBUTION OF SAMPLE STATISTICS. Sampling from a Population

16. Kesit ve Cephe Aracı

Virtualmin'e Yeni Web Sitesi Host Etmek - Domain Eklemek

3. BÖLÜM MATRİSLER 1

BİYOİSTATİSTİK Olasılıkta Temel Kavramlar Yrd. Doç. Dr. Aslı SUNER KARAKÜLAH

while(), do-while(), for() M.İLKUÇAR 2010 MAKU-MYO

Üst Düzey Programlama

İngilizce konu anlatımlarının devamı burada Tıkla! Spot On 8 Ders Kitabı Tüm Kelimeleri. How do we spell the Present Continuous Tense?

BMT 206 Ayrık Matematik. Yük. Müh. Köksal GÜNDOĞDU 1

Bilgisayar Bilimlerinde Hesaplama Kuramı

İçerik: Graflar. Tanım. Gösterim. Dolaşma Algoritmaları. Yönlü ve yönsüz graflar Ağırlıklı graflar. Komşuluk Matrisi Komşuluk Listesi

Algoritmalar ve Programlama. Algoritma

Java da Soyutlama ( Abstraction ) ve Çok-biçimlilik ( Polymorphism )

Lesson 33: Interrogative forms of be going to, be + verb~ing for expressing near future

FINITE AUTOMATA. Mart 2006 Ankara Üniversitesi Bilgisayar Mühendisliği 1

Properties of Regular Languages. Mart 2006 Ankara Üniversitesi Bilgisayar Mühendisliği - TY 1

ORACLE DA KÜRSÖRLER. Gerekli sistem değişkenleri

Bil 2114 Otomata Teorisi Çalışma Soruları ve Cevapları III (Hafta 7,8,9)

a, ı ı o, u u e, i i ö, ü ü şu that (something relatively nearby) şu ekmek o that (something further away) o dondurma

Önemli noktalar. Paradigma Nesnelere Giriş Mesajlar / Ara bağlantılar Bilgi Gizleme (Information Hiding ) Sınıflar(Classes) Kalıtım/Inheritance

BSM 101 Bilgisayar Mühendisliğine Giriş

TEMEL STRING İŞLEMLERİ

Bölüm 2 Varlık-İlişki Veri Modeli: Araçlar ve Teknikler. Fundamentals, Design, and Implementation, 9/e

Barkod Referans Kılavuzu

BM312 Ders Notları

BÖLÜM III: Şebeke Modelleri. Şebeke Kavramları. Şebeke Kavramları. Şebeke Kavramları. Yönlü Şebeke (Directed Network) Dal / ok

D-Link DSL 500G için ayarları

IE 303T Sistem Benzetimi DERS 4 : O L A S I L I K T E K R A R

Formüller ÜNİTE 5. Bu üniteyi çalıştıktan sonra; Formüller Menüsü İşlev Kitapçığı Tanımlı Adlar Formül Denetleme Hesaplama

idea rsbasic KOMUTLARI

İki Rastgele Değişken

DGridSim Gerçek Zamanlı Veri Grid Simülatörü. Gerçek-Zamanlı Veri Dağıtımı Dokümanı v

Transkript:

Dilbilgisi ve Diller Doç.Dr.Banu Diri 1. Her biçimsel dil belirli bir alfabe üzerinde tanımlanır. 2. Alfabe sonlu sayıda simgelerden oluşan bir kümedir. 3. Alfabedeki simgelerin arka arkaya getirilmesi ile dizgiler (string) oluşturulur. 4. Biçimsel dil, bir alfabedeki simgelerden oluşturulan dizgilerin bir kümesidir. Bu kümeyi E ile gösterirsek, bu alfabe üzerinde tanımlanan her dil E nin bir alt kümesidir. E deki her dizgi dilin tümcelerini (sentence) oluşturur. 5. Bir alfabe üzerinde tanımlanan biçimsel bir dil, bu alfabedeki simgelerden oluşan dizgileri geçerli ve geçersiz diye ikiye ayırır. Dilde yer alan ve tümceleri oluşturan dizgiler geçerli tersi ise geçersiz dir. Slide 1 1

6. Biçimsel dil açısından dizgi, tümce ve sözcük terimleri birbirlerinin yerine kullanılabilir. Tümce dilde yer alan dizgi veya sözcükleri anlatmak için kullanılır. Buna göre, bir alfabe ve bu alfabe üzerinde tanımlı bir dil düşünüldüğünde, alfabedeki simgelerden oluşturulan ve dilde yer alan geçerli dizgiler dilin tümcelerini oluşturmaktadır. 7. Dilin hangi tümcelerden oluştuğunu gösteren kurallar bütünü ise dilbilgisi (grammar) olarak adlandırılır. Slide 2 Biçimsel dilbilgisi ve dillerin incelenmesinde, değişik harf grupları değişik alanlarda kullanılır. Harf Grubu Örnekler Kullanım alanları Latin alfabesinin başındaki büyük harer Latin alfabesinin başındaki küçük harer ve rakamlar Latin alfabesinin sonundaki büyük harer Latin alfabesinin sonundaki küçük harer Yunan alfabesinin başındaki küçük harer A,B,C,... a,b,c,...,0,1,2 U,V,W,Y,... u,v,w,y,... Sözdizim değişkenleri Uç simgeler Sözdizim değişkeni ya da uç simgeler Uç simge dizgileri (sözcükler) α, β, γ,... Tümcesel yapılar Slide 3 2

Chomsky Hiyerarşisi 0 1 2 3 Karmaşıklık Özyinelemeli Sayılabilir Diller (Recursively Enumerable) Bağlama Bağımlı Diller (Context - Sensitive) Bağlamdan Bağımsız Diller (Context-Free) Düzenli Diller (Regular) Slide 4 Sırasıyla; Dilbilgisi ve Dilin Biçimsel Tanımı Dilbilgisi ve Dillerin Sınıandırılması tür-0, tür-1, tür-2, tür-3 Sağ-doğrusal ve Sol-doğrusal Dilbilgisi Bağlamdan-Bağımsız Dilbilgisi (Contex Free Grammar-CFG) Türetme/Ayrıştırma Ağacı Chomsky Normal Biçimi Yukarıdan-aşağıya Ayrıştırma (Top-down parsing) Aşağıdan-yukarıya Ayrıştırma (Bottom-up parsing) Slide 5 3

Yukarıdan-Aşağıya Ayrıştırma (Top-Down Parsing, Left-to-Right, Depth-First) Slide 6 Slide 7 4

Slide 8 Slide 9 5

Slide 10 Noun meal Slide 11 6

Aşağıdan-Yukarı Ayrıştırma (Bottom-Up Parsing) S VP Slide 12 S -> Aux NP VP S -> NP VP NP -> Det Nominal NP -> NP PP A ight from Indianapolis to Houston on TWA Slide 13 7

ight Slide 14 ight ight Slide 15 8

Slide 16 Slide 17 9

Örnek Bir cümle isim veya fiil grubundan oluşur., isim grubu isim ve/veya sıfat, fiil grubu da isim grubu ve/veya fiil den oluşur. Bu gramerde Küçük çocuk kırmızı top aldı cümlesinin çözümü C ĐG FG : (cümle isim ve fiil grubundan oluşur) ĐG S Đ : (isim grubu sıfat+isim) FG ĐG F : (fiil grubu isim grubu + fiil) S küçük kırmızı Đ çocuk top F aldı Slide 18 C ĐG FG S Đ ĐG F küçük çocuk kırmızı top aldı Slide 19 10

Chomsky Normal Form (CNF) is one of the most basic Normal Forms. In CNF each production has the form A BC A α where A, B, C V (i.e., nonterminals) and α Σ (i.e., a terminal) This can be done by simple substitution. Consider the following S ba S ab A baa A as A a B abb B bs B b Replace terminals with NEW Nonterminals Plus a rule to generate the Terminal C a D b Note these are already in standard form. Terminals should now only appear in rules in CNF. Rewriting the rules yields: S DA S CB A DAA A CS A a B CBB B DS B b C a D b Slide 21 11

Only the following rules are a problem: A DAA B CBB These can be rewritten as follows: A ZA Z DA B KB K CB Now we have rules in CFN. SO WHAT? For grammars in Chomsky Normal Form the parse tree is always a binary tree. We can talk about the relationship between: 1) the depth of the parse tree and 2) the length of its yield. Slide 22 If a parse tree for a word w is generated by a CNF and the parse tree has a path length of at most i, then the length of w is at most 2 i-1. w x y z A parse tree of depth 3 with a yield of at most 2 3-1. Slide 23 12

Genişletilmiş Geçiş Ağları GGA Augmented Network Transition Grammer- ATN Biçimsel dillerin, doğal dilleri tam olarak ifade edemediği durumlarda Genişletilmiş Geçiş Ağları tercih edilir. GGA, cümlelerin sözdizimsel analizinde kullanılır. GGA sonlu makinelere benzeyen durum ve bu durumlar arası geçiş kurallarından oluşmaktadır. Üç bileşenden oluşur: En az bir başlangıç ve son durumu olan sonlu sayıdaki durumlar kümesi Belli bir metindeki mümkün olan harerden oluşan küme Sonlu sayıdaki bir durumdan geçişler kümesi diğer bir duruma geçişi sağlayan Slide 24 Geçiş ağlarında bir durumdan diğer bir duruma geçmek için gerekli harf okunur ve bu harf geçilecek olan duruma geçmek için gereken hare karşılaştırılır. Uygun olması durumunda geçilir. Geçiş ağlarında doğru bir yol, bir başlangıç durumundan başlayıp, son duruma ulaşan geçişler sağlandığında tamamlanır. Geçişlerdeki harerin birbirine eklenmesiyle oluşan metin, ağın kabul etmesi için verilen metinle aynı ise, bu metin ağ tarafından kabul edilmiş demektir. Slide 25 13

Genişletilmiş Geçiş Ağı örneği q 1 abb aa q 2 ε q 3 a q 4/s b Bu ağda tanınabilecek birkaç metin örneği: abba, abbaaabba, abbaab, b Fakat abbab, baab yi tanıyamaz. Slide 26 Dilin grameri, durumlara karşı düşen yönlü graar şeklinde ifade edilir. Bağlarda ise, çoğalmakta olan durumlar arasındaki geçişleri tanımlayan etiket sınıarı bulunmaktadır. Bu etiketler özel kelimeler, kelime kategorileri veya cümlenin önemli parçalarını tanıyan diğer ağlara yönlendirme gibi değerler almaktadır. GGA, dil tanımında belirtilen cümle birimlerini, hiyerarşik yapı içerisinde yukarıdan aşağıya doğru çözümlemeye çalışır. Slide 27 14

Basit bir Türkçe sözdizimi kural kümesinin GGA yapısı Ali camı kırdı cümlesi morfolojik analiz sonucunda Ali cam + ı kır + dı Q 4/s özne nesne yüklem cümle Q 1 Q 2 Q 3/s özne isim Q 5/s nesne isim nesne_eki Q 6 Q 7/s fiil zaman_eki yüklem Q 8 Q 9/s Slide 28 Bir sözdizimi kural kümesinin GGA biçiminde ifade edilmesin yararı, cümle birimlerinin bir kez tanımlandıktan sonra sonsuz kez kullanılıyor olmasıdır. Bir sıfat tamlaması bir kez tanımlanıp birçok yerde kullanılabilir. GGA da döngüler bulunabilir. Bu özellik ile dilin kabul ettiği cümle yapıları sayısı sonsuza kadar artırabilir. yırtık kırmızı büyük top sıfat S isim Q Slide 29 15