Anlamsal Bilgi Yönetiminde Üst Veri Sistemlerinin ve Ontolojilerin Kullanımı Yaşar Tonta Hacettepe Üniversitesi Bilgi ve Belge Yönetimi Bölümü tonta@hacettepe.edu.tr yunus.hacettepe.edu.tr/~tonta/ 1
Plan Durum saptaması Bibliyografik denetim FRBR, RDA Anlamsal Web Bağlı Veriler Sorgu Sistemleri Sonuç 2
Durum saptaması Web Hızlı bilgi artışı Dijital yerliler Sosyal ağlar Kullanıcılar tarafından üretilen üst veriler Kişiselleştirme 3
Kütüphane kataloğu: Fiyatı yüksek vasat ürün (Lloyd Sokvitne) Kullanıcılarımız basitlik ve anında ödül bekliyor ve bizi kütüphaneleri Amazon, Google, ve itunes standartlarına göre yargılıyorlar. Bizim mevcut sistemlerimiz bunların yanında soluk kalıyor (University of California, 2005, s. 7). Beyond the OPAC: Future Directions for Web-Based Catalogues Canberra: AustralianCommitteeon Cataloging, 18 September 2006.(http://www.nla.gov.au/lis/stndrds/grps/acoc/papers2006.html) 4
Düzenin Üç Düzeni 1. Nesnelerin kendilerinin düzenlenmesi 2. Nesnelerin üst verilerinin düzenlenmesi 3. Bit lerin düzenlenmesi 5
Üst Veri Yapay Yapıcı İşlem yapılabilir Kaynak: Coyle, K. (2010 January). Library Data in a Modern Context. Library Technology Reports, 46(1): 1-13. http://alatechsource.metapress.com/content/p3022442071g7655/fulltext.pdf 6
FRBR Kavramsal Modeli Varlık-İlişki Veri Modeline dayanır Kullanıcı görevleri Bul Belirle Seç Sağla İlişkilendir Diğer olası görevler: Telif hakları Koruma BBY220 7
FRBR 1. Grup Varlıklar 8
Örnek İnce Memed 9
Kataloğun işlevleri (Cutter, Rules for a Dictionary Catalog, 1876) Bilinen bir kitabın yazarına, eseradına ve konusuna göre bulunmasını sağlamak Bir kütüphanenin, bir yazarın belirli bir konudaki, belirli bir yazın türünde sahip olduğu kitapları göstermek Bir kitabın seçiminde yardımcı olmak Basımı açısından (bibliyografik olarak) Özelliği açısından (yazınsal/konusal) BBY220 10
FRBR 2. Grup Varlıklar 11
FRBR 3. Grup Varlıklar 12
MARC ta FRBR Varlıkları ve İlişkileri Kaynak: C. Oliver, Introducing RDA. Chicago: ALA, 2010. http://www.alastore.ala.org/pdf/9780838998908_excerpt.pdf 13
RDA: Resource Description and Access Kullanıcı gereksinimlerinin yanıtlanması Maliyet etkinliği Esneklik Süreklilik Kaynak: C. Oliver, Introducing RDA. Chicago: ALA, 2010. http://www.alastore.ala.org/pdf/9780838998908_excerpt.pdf 14
AACR2 - RDA Kaynak: http://www.loc.gov/catdir/cpso/rdatest/rdaexamples.html 15
Anlamsal Web, 2001 Anlamsal Web ayrı bir Web değil ama şimdikinin bir uzantısıdır. Anlamsal Web bilgiye iyi tanımlanmış anlam verilerek bilgisayarlarla insanların daha iyi işbirliği yaparak çalışmasını sağlar. - Tim Berners-Lee, James Hendler and Ora Lassila; Scientific American, May 2001 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 16
Anlamsal Web Mimarisi Tim Berners-Lee Kaynak: http://www.w3c.org/2000/talks/1206-xml2k-tbl/ BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 17
DBpedia 18
Dbpedia İstatistikleri Kaynak: Christian Bizer, Jens Lehmann, Georgi Kobilarov, Sören Auer, Christian Becker, Richard Cyganiak, Sebastian Hellmann: A Crystallization Point for the Web of Data. Journal of Web Semantics: Science, Services and Agents on the World Wide Web, Issue 7, Pages 154 16 19
Türkçe DBpedia Henüz Yok 20
Wikipedia: Akasya Durağı 21
DBPedia: Akasya Durağı 22
Kongre Kütüphanesi Bağlı Veri Hizmeti 23
VIAF 24
Anlamsal Bilgi Yönetimi Mevcut bilgilerin %20 si yapısal, %80 i yapısal olmayan metin halinde Mevcut bilgilerin tanımları sınırlı Makinece işlenebilir tanımlar gerekli (ör., RDF, OWL, XML) BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 25
Ontoloji Aracılığıyla Bilgi Bütünleştirmesi Kaynak: Warren ve Davies, 2007, s. 182 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 26
Metindeki Varlıkların Bilgi Tabanındakilerle Karşılaştırılması Kaynak: Warren ve Davis, 2007 27
Shirky: Abartılı Ontoloji Kaynak: www.shirky.com/writings/ontology_overrated.html 28
Sadece Bağlantılar Kaynak: www.shirky.com/writings/ontology_overrated.html 29
Veri kalitesi ve yorum sorunları Veri kalitesiyle ilgili semantik farklılıklar Yorum sorunları (metrik sistem, yıl - son 12 ay, takvim yılı, mali yıl ) Kaynak: Madnick ve Zhu, 2006, s. 462, 466 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 30
Bağlı Veri 31
Bağlı Veri Kütüphaneler İçin Niçin Önemli? Kütüphane kaynakları Web de daha kolay bulunur Kütüphane üst verilerine dayanan daha yaratıcı uygulamalar geliştirilebilir Etkin kataloglama ve yenilik fırsatları sunar Kaynak: http://lodlam.net/2012/08/09/linked-data-for-libraries-video-from-oclc/ 32
Sözcüklerin kullanımı ACCIDENT event incident situation problem difficulty unfortunate situation the subject of your last letter what happened last week was Mr. A: We all know why we are here. BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 33
Zadeh ye Göre Arama Motorları Yetersiz İki değerli mantıkla işliyor, Çıkarsama yapamıyorlar Kaynak: Zadeh, 2005, 2006) 34
Soru Yanıt Sistemlerine Dönüşüm Dünya bilgisi İlgililik (istatistiksel/anlamsal) q: Vera nın yaşı kaçtır? p: Vera, Irene ile yaşıttır r: Irene 65 yaşındadır Algılama temelli bilgiden çıkarsama yapma İki değerli mantık ve olasılık geçerli değil Esas sorun doğal dil anlama sorunu Kaynak: Zadeh, 2005, 2006) 35
Sorunlar Sorgu oluşturma Eş anlamlı sözcükler ( çöp teorisi ) Anlam yokluğu Telekom şirketi Türkiye Nebi Fışkın Müdür 10 Mayıstaki toplantısında İstanbul da yerleşik Mobilfon yönetim kurulu Nebi Fışkın ı CEO olarak atadı Bağlam yokluğu Kullanıcının hangi bağlamda bilgi aradığı COntext INterchange (COIN) Sonuçların sunulması Kullanıcılar ilk ekrandan sonrasına bakmıyorlar Kaynak: Warren ve Davies, 2007, s. 179-181 BThaber Platform Bilgi ve Doküman Yönetimi, 30 Mart 2010, İTÜ Süleyman Demirel Kongre Merkezi, İstanbul 36
Swanson ın Yetersizlik Ön Kabulleri Yanıt bulunmadıkça soru kesin olarak oluşturulamaz Makine arama isteklerini uygun arama terimlerine çevirecek şekilde programlanamaz Makineler anlamı tanıyamaz Ya ustaca yapılmış ilgililik değerlendirmelerine ya da çok etkili mekanik süreçlere sahip olabilirsiniz, ama ikisine birden sahip olamazsınız Kaynak: Swanson, 1988 37
Sonuç FRBR ve RDA geliştirilmeli Kütüphane verileri web in bir parçası olmalı Kütüphanelerde geliştirilen ontolojiler web e aktarılmalı Kütüphaneler bağlı açık veri modeline geçmeye özendirilmeli 38
Anlamsal Bilgi Yönetiminde Üst Veri Sistemlerinin ve Ontolojilerin Kullanımı Yaşar Tonta Hacettepe Üniversitesi Bilgi ve Belge Yönetimi Bölümü tonta@hacettepe.edu.tr yunus.hacettepe.edu.tr/~tonta/ 39