Kelime (Text) İşleme Algoritmaları



Benzer belgeler
0;09 0; : işleminin sonucu kaçtır? A) ;36 0; a = 0,39 b = 9,9 c = 1,8 d = 3,7.

Mustafa YAĞCI, Parabolün Tepe Noktası

Seyyar (Gezgin) Satıcı Problemi. Ders 13

Algoritma Geliştirme ve Veri Yapıları 4 Algoritma ve Yazılımın Şekilsel Gösterimi. Mustafa Kemal Üniversitesi

BİREYSEL YARIŞMA SORULARI. IV. BAHATTİN TATIŞ MATEMATİK YARIŞMASI Bu test 30 sorudan oluşmaktadır. 2 D) a = olduğuna göre, a

TEOG. Tam Sayılar ve Mutlak Değer ÇÖZÜM ÖRNEK ÇÖZÜM ÖRNEK TAMSAYILAR MUTLAK DEĞER

2005 ÖSS BASIN KOPYASI SAYISAL BÖLÜM BU BÖLÜMDE CEVAPLAYACAĞINIZ TOPLAM SORU SAYISI 90 DIR. Matematiksel İlişkilerden Yararlanma Gücü,

İntegral Uygulamaları

RASYONEL SAYILAR KESİR ÇEŞİTLERİ Basit Kesir. olduğuna göre, a, b tamsayı ve b 0 olmak üzere, a şeklindeki ifadelere

LOGARİTMA Test -1. olduğuna göre, x kaçtır? olduğuna göre, x aşağıdakilerden hangisidir? A) 3 B) 9 C) 16 D) 64 E) 81.

İÇİNDEKİLER ORAN VE ORANTI KESİR PROBLEMLERİ HAVUZ VE İŞ PROBLEMLERİ

2009 Soruları. c

ÇOKGENLER Çokgenler çokgen Dışbükey (Konveks) ve İçbükey (Konkav) Çokgenler dış- bükey (konveks) çokgen içbükey (konkav) çokgen

ÜÇGENDE AÇI-KENAR BAĞINTILARI

DENEY 2 Wheatstone Köprüsü

Metropol Yayınları YÖS 2009 Metropol Publications

Yerel Topluluklar ve Yönetimler Arasında Sınır-Ötesi Đşbirliği Avrupa Çerçeve Sözleşmesine Ek Protokol

SAYILARIN ÇÖZÜMLENMESĐ ve BASAMAK KAVRAMI

BOYUT ANALİZİ- (DIMENSIONAL ANALYSIS)

B - GERĐLĐM TRAFOLARI:

Anadolu Üniversitesi Mühendislik Fakültesi Endüstri Mühendisliği Bölümü. Doç. Dr. Nil ARAS ENM411 Tesis Planlaması Güz Dönemi

İÇİNDEKİLER. Ön Söz...2. Matris Cebiri...3. Elementer İşlemler Determinantlar Lineer Denklem Sistemleri Vektör Uzayları...

ÜNİTE - 7 POLİNOMLAR

MATEMATİK TESTİ. 5. a, b birer gerçek sayı ve a + b < 3tür. Bu sayıların sayı doğrusunda gösterilişi aşağıdakilerden hangisindeki gibi olabilir?

Sunum ve Sistematik. Bu başlıklar altında uygulamalar yaparak öğrenciye yorum, analiz, sentez yetisinin geliştirilmesi hedeflenmiştir.

LOJİK DEVRELERDE SORUNLAR ve GİDERİLMESİ

1. Değişkenler ve Eğriler: Matematiksel Hatırlatma

Lisans Yerleştirme Sınavı 1 (Lys 1) / 16 Haziran Matematik Sorularının Çözümleri. sayısının 2 sayı tabanında yazılışı =?

ARABA BENZERİ GEZGİN ROBOTUN OTOMATİK PARK ETMESİ İÇİN BİR YÖNTEM

63032 / ELEKTRONİK SICAKLIK KONTROL CİHAZI KULLANIM KILAVUZU

c) Bire bir fonksiyon: eğer fonksiyonun görüntü kümesindeki her elemanının tanım kümesinde yalnız bir karşılığı varsa bu fonksiyonlara denir.

LYS Matemat k Deneme Sınavı

LYS LİMİT VE SÜREKLİLİK KONU ÖZETLİ ÇÖZÜMLÜ SORU BANKASI

Cebirsel ifadeler ve Özdeslik Föyü

Örnek...1 : a, b ve c birbirlerinden farklı birer rakamdır. a.b+9.b c en çok kaçtır?

VEKTÖRLER ÜNİTE 5. ÜNİTE 5. ÜNİTE 5. ÜNİTE 5. ÜNİT

1981 ÜYS Soruları. 1. Bir top kumaşın önce i, sonra da kalanın ü. satılıyor. Geriye 26 m kumaş kaldığına göre, kumaşın tümü kaç metredir?

Komisyon DGS TAMAMI ÇÖZÜMLÜ 10 DENEME SINAVI ISBN Kitapta yer alan bölümlerin tüm sorumluluğu yazarına aittir.

Düzlemde eğrisel hareket, parçacığın tek bir düzlem içerisinde eğrisel bir yörünge boyunca yaptığı harekettir. Belirli bir koordinat sisteminde

BSD Lİ DİK İŞLEME MERKEZİNDE PARÇA PROGRAMINA GÖRE ZAMAN ANALİZİ

sayısından en az kaç çıkarmalıyız ki kalan sayı 6,9,12 ve 15 ile kalansız bölünebilsin? ()

RASYONEL SAYILAR. ÖRNEK: a<0<b<c koşulunu sağlayan a, b, c reel sayıları. tan ımsız. belirsiz. basit kesir

Ü ş ş ö ş ş ş ş ş ö ş ö ö ş ş ö ş ö ö ö ö ş ö ş ş ö ş ş ş ö ş ş ş ş Ç ş Ç ş ş Ö ö ö ş ş ş ö ş ş ö ö ö ö ö ş ö ş ş ş ş ş ş ş ş ş ö ş

LYS Matemat k Deneme Sınavı

G E O M E T R İ. Dar Açılı Üçgen. denir. < 90, < 90, < 90 = lik açının karşısındaki kenara hipotenüs denir. > 90

Örnek...1 : İNTEGRAL İNTEGRAL İLE ALAN HESABI UYARI 2 UYARI 3 ALAN HESABI UYARI 1 A 2 A 1. f (x )dx. = a. w w w. m a t b a z.

İnşaat Sektörüne Özgü İş Güvenliği Yönetim Sisteminin Aksiyomatik Tasarım İlkeleriyle Oluşturulması

BASİT HARMONİK HAREKETTE DEĞİŞEN SAYISAL VERİLERİN İNCELENMESİ

SAYISAL ÇÖZÜMLEME. Sayısal Çözümleme

İÇİNDEKİLER SAYISAL YETENEK SÖZEL YETENEK

FINITE AUTOMATA. Recognizer. Finite Automata (FA)

KIVIRMA İŞLEMİNİN ŞEKİL ve BOYUTLARI

DENEY 3: EŞDEĞER DİRENÇ, VOLTAJ VE AKIM ÖLÇÜMÜ

TEST 17-1 KONU KÜRESEL AYNALAR. Çözümlerİ ÇÖZÜMLERİ 6. K Çukur aynada cisim merkezin dışında ise görüntü

Trigonometri - I. Isınma Hareketleri. 1 Aşağıda verilenleri inceleyiniz. 2 Uygun eşleştirmeleri yapınız. 3 Uygun eşleştirmeleri yapınız.

( ) ( ) ( ) Üslü Sayılar (32) 2. ( ) ( 2 (2) 3. ( ) ( ) 3 4. ( 4 9 ) eşitliğini sağlayan a değeri kaçtır? (0) 0,6 0,4 : 4,9 =?

A, A, A ) vektör bileşenleri

DENKLEM ve EŞİTSİZLİKLER

Yarım Toplayıcı (Half Adder): İki adet birer bitlik sayıyı toplayan bir devredir. a: Birinci Sayı a b c s. a b. s c.

İŞ ETKİ ÇİZGİSİ TEOREMİ. Balıkesir Üniversitesi Mühendislik Mimarlık Fakültesi İnşaat Müh. Bölümü Balıkesir, TÜRKİYE THEOREM OF WORK INFLUENCE LINE

1990 ÖYS 1. 7 A) 91 B) 84 C) 72 D) 60 E) 52 A) 52 B) 54 C) 55 D) 56 E) 57

ORAN ORANTI. Örnek...1 : Örnek...4 : Örnek...2 : Örnek...5 : a 1 2 =2b+1 3 =3c 4. Örnek...6 : Bir karışımda bulunan a, b ve c maddeleri arasında

TOPRAKLAMA BAĞLANTI SİSTEMLERİ

ambalajından çıkarın ve parçalarını kontrol edin Telefon Hattı Kablosu Basit Kullanım Kılavuzu Güvenlik İle İlgili ve Yasal Hususlar kitapçığı

YILLAR ÖSS-YGS /LYS /1 0/1 ÇÖZÜM: 1) xοy A ise ο işlemi A da kapalıdır.

MATEMATİK 2 TESTİ (Mat 2)

TRAFİK SAYIMLARI, BÖLGE NÜFUSLARI VE BÖLGELER ARASI UZAKLIKLARI KULLANARAK BAŞLANGIÇ-SON MATRİSİ TAHMİNİ

Formal Diller Ve Otomat Teorisi

ORAN ve ORANTI-1 ORAN-ORANTI KAVRAMI. 1. = olduğuna göre, aşağıdaki ifadelerin. + c c sisteminin çözümüne. 3. olduğuna göre, nin değeri

9. log1656 x, log2 y ve log3 z

DENEY 2 OHM YASASI UYGULAMASI

çizilen doğru boyunca birim vektörü göstermektedir. q kaynak yükünün konum vektörü r ve Q deneme E( r) = 1 q

11. BÖLÜM. Paralelkenar ve Eşkenar Dörtgen A. PARALELKENAR B. PARALELKENARIN ÖZEL LİKLERİ ÇÖZÜM ÖRNEK ÇÖZÜM ÖRNEK

T.C. NİĞDE ÜNİVERSİTESİ BEDEN EĞİTİMİ VE SPOR YÜKSEKOKULU SPOR YÖNETİCİLİĞİ BÖLÜMÜ DERS İÇERİKLERİ

Ağaç (Tree) Veri Modeli

(, ) ( ) [ ] [ ] ve [ ] [ ] ( ) ( ) ÜÇGENLERDE TRİGONOMETRİK ÖZELLİKLER. A. Kosinüs Teoremi: Herhangi bir ABC

4- SAYISAL İNTEGRAL. c ϵ R olmak üzere F(x) fonksiyonunun türevi f(x) ise ( F (x) = f(x) ); denir. f(x) fonksiyonu [a,b] R için sürekli ise;

HİPERBOL. Merkezi O noktası olan hiperbole merkezil hiperbol denir. F ve F' noktalarına hiperbolün odakları denir.

Harita Dik Koordinat Sistemi

ORAN ORANTI ORAN ORANTI ORANTININ ÖZELLİKLERİ ÖRNEK - 1 TANIM. x ve y tamsayıdır. x y

DERS 3. Matrislerde İşlemler, Ters Matris

1983 ÖYS A) 410 B) 400 C) 380 D) 370 E) işleminin sonucu kaçtır. 7. a, b, c birer pozitif tam sayıdır. a= 2 A) 9 B) 3 C) 2 E) 8 D) 4

Ağaçlar (Trees) Ağaçlar (Trees)

LYS Matemat k Deneme Sınavı

Mobil Test Sonuç Sistemi. Nasıl Kullanılır?

Örnek...2 : Örnek...3 : Örnek...1 : Örnek...4 : a 3 DÜZGÜN ALTIGEN DÜZGÜN ALTIGEN TANIM VE ÖZELLİKLERİ. ABCDEF düzgün

1988 ÖYS. 1. Toplamları 242 olan gerçel iki sayıdan büyüğü küçüğüne bölündüğünde bölüm 4, kalan 22 dir. Küçük sayı kaçtır?

ESKİŞEHİR OSMANGAZİ ÜNİVERSİTESİ

Matrisler Elementer Satır İşlemleri Gauss Eliminasyon

ÜÇGENDE ALAN. Alan(ABC)= 1 2. (taban x yükseklik)

FRENLER FRENLERİN SINIFLANDIRILMASI

Tek ve Çift Fonksiyonlar. Özel Tanýmlý Fonksiyonlar. Bir Fonksiyonun En Geniþ Taným Kümesi. 1. Parçalý Fonksiyonlar. 2. Mutlak Deðer Fonksiyonu

DOĞRUDA AÇILAR. Temel Kavramlar ve Doğruda Açılar. Açı Ölçü Birimleri. Açı Türleri. çözüm. kavrama sorusu

Basınç Elemanları Elastik ve inelastik burkulma Etkili Boy. Bölüm 4. Yrd. Doç. Dr. Muharrem Aktaş 2009-Bahar

EasyMP Multi PC Projection Kullanım Kılavuzu

Cebir Notları Mustafa YAĞCI, Eşitsizlikler

Terimler: Sabit Terim: Katsayılar: ÖR: 3x 2-4x cebirsel ifadesine göre aşağıdaki. Terimler: Sabit Terim: Katsayılar: Terimler: Sabit Terim:

Komisyon. ALES EŞİT AĞRILIK ve SAYISAL ADAYLARA TAMAMI ÇÖZÜMLÜ 10 DENEME ISBN

LYS 1 / MATEMATİK DENEME ÇÖZÜMLERİ

2010 Ağustos. MİLLER ve KİRİŞLER. 06a. Özet. M. Güven KUTAY

Transkript:

Kelime (Text) İşleme Algoritmlrı Doç.Dr.Bnu Diri Trie Ağcı Sonek Ağcı (Suffix Tree) Longest Common String (LCS) Minimum Edit Distnce 1

Ağçlrın Bğlı Ypısı Düğüm (node), çeşitli ilgiler ile ifde edilen ir nesnedir. Her ir ğlntı (edge) için, irer ğlntı ilgisi tutulur. Nesne/Değer (Element) An düğüm (Prent node) Çocuk düğümlerin listesi Metin ğçlrı (TRIE) Trie ğcının ismi retrievl kelimesininin [3..6] oluşmktdır. rsındki hrflerinden Bir ğcın üzerinde ir metin (string, sözlük,...) kodlnmk isteniyors TRIE ğçlrı tercih edilir. İgili metni veren ğcın üzerinde izleneilir tek ir yol vrdır. Kök düğüm her zmn oş ir metni (string) ifde eder. Her düğüm kendisinden sonr gelen hrfi işret eder. Boş metin hngi hrf ile devm ederse, o hrfe it dl tkip edilir ve gelinen düğüm o n kdr geçilmiş oln dllrdki hrflerin irleştirilmiş hlidir. Bir düğümden ir hrf tşıyn sdece ir dl çıkilir. Metin ğçlrının en önemli vntjı, ir metni rrken metinin oyutu kdr işlem gerektirmesidir. Ağçt ne kdr ilgi ulunduğunun önemi yoktur. Hfızyı verimli kullnırlr. Trie ğcının en derin noktsı, ğç üzerindeki en uzun metin kdrdır. 2

String kümesinin TRIE üzerinde gösterilimi { eef d fe fg c } e e d f c f e g Sıkıştırılmış TRIE e e d f c eef d f c f e g e g 3

4

Suffix Tree Suffix Tree (Sonek Ağcı) kelime işleme lgoritmlrındndır DNA dosylrı gigyte seviyesinde yer kpldıklrındn DNA nlizinin elle ypılmsı mümkün değildir. Htt, DNA dosylrının ilgisyr yrdımıyl işlenmesi de çok uzun sürmektedir. Biyolojik veriler, rm motorlrı, derleyici tsrımı, işletim sistemi, veri tnı, vs... kullnılır. 5

Suffix Trees Sustring ulm prolemidir... Verilen text m uzunluğund ir string (S) S için hrcnn zmn O(m) Bulunmsı istenen string Q olup, n uzunluğund olsun Q nun S içerisinde rnmsı için hrcnn zmn O(n) Suffix Tree ler kullnılrk u prolemi çözeiliriz. Suffix Tree nin Tnımı m uzunluğundki ir S string için T suffix tree şğıdki özelliklere shiptir: Köklü ir ğçtır ve yönlüdür 1 ile m rsınd etiketlenmiş m yprğı vrdır Ağçtki her ir dl S string nin ir lt stringini oluşturur Kökten, i. yprğ kdr etiketlenmiş ir yol üzerindeki kenrlr irleştirileilir Kök olmyn her r düğümün en z 2 yprğı vrdır Bir düğümden çıkn kenrlr frklı krkterler ile şlr 6

S= S string inin suffix tree si, S nin ütün suffix lerini sıkıştırılmış ir trie de tutsun. semolü ilgili suffix in sonunu göstersin. { } Suffix Tree nin oluşturulmsı En geniş suffix suffix inin eklenmesi 7

8 suffix inin eklenmesi suffix inin eklenmesi suffix in eklenmesi

Herir yprğı etiketleyerek nerden erişeceğimizi iliriz. 1 4 3 2 5 Longest Common Susequence A susequence of string S, is set of chrcters tht pper in left -toright order, ut not necessrily consecutively. Exmple ACTTGCG ACT, ATTC, T, ACTTGC re ll susequences. TTA is not suequence A common suequence of two strings is susequence tht ppers in oth strings. A longest common suequence is common susequence of mximl length. Exmple S1 = AAACCGTGAGTTATTCGTTCTAGAA S2 = CACCCCTAAGGTACCTTTGGTTC S1 = AAACCGTGAGTTATTCGTTCTAGAA S2 = CACCCCTAAGGTACCTTTGGTTC LCS is ACCTAGTACTTTG 9

X m=7 ACTTGCG Y n=6 ATTCGG LCS ATTGG A T T C G G 0 1 2 3 4 5 6 0 0 0 0 0 0 0 0 A 1 0 1 1 1 1 1 1 C 2 0 1 1 1 2 2 2 T 3 0 1 2 2 2 2 2 T 4 0 1 2 3 3 3 3 G 5 0 1 2 3 3 4 4 C 6 0 1 2 3 4 4 4 G 7 0 1 2 3 4 5 5 10

Longest Common Sustring (of two strings) s 1 # s 2 # 5 4 # # 4 3 3 # 2 1 2 1 Longest Common Suffix Örnek :"ABAB" ve "BABA" A B A B 0 0 0 0 0 B 0 0 1 0 1 A 0 1 0 2 0 B 0 0 2 0 3 A 0 1 0 3 0 function LCSustr(S[1..m], T[1..n]) L := rry(1..m, 1..n) z := 0 ret := {} for i := 1..m for j := 1..n if S[i] = T[j] if i = 1 or j = 1 L[i,j] := 1 else L[i,j] := L[i-1,j-1] + 1 if L[i,j] > z z := L[i,j] ret := {} if L[i,j] = z ret := ret {S[i-z+1..z]} return ret Dinmik Progrmlm kodu 11

12

13

14

15

16

17

18

19