BBY 106 BİLGİNİN ORGANİZASYONU II YÖNELTME DİLLERİ Arş. Gör. Tolga ÇAKMAK tcakmak@hacettepe.edu.tr
İndeks kitap sonu indeksler Süreli yayın indeksleri (basılı) Veritabanları Kütüphane katalogları
Katalog ve İndeksler tarihsel süreçte ele alındığında alfabeler kadar eski olduğunu söylemek mümkündür. Kil tabletler Ağaç kabukları Parşömen İpek
İndeksleme, kataloglama ve sınıflama ile aynı şey midir? İndeksleme? Genel anlamda materyale erişim için gerekli başlıkların seçilip, bu başlıklar arasındaki ilişkinin oluşturulduğu, bibliyografik veritabanının oluşturulmasını amaç edinen işlemler. Kütüphanelerde kataloglama ile yürütülen entelektüel işlemler indeksleme işlemleri kapsamındadır.
Kataloglama? Bilgi kaynaklarının bibliyografik kayıtlarının ve erişim ögelerinin belirlenmesi ile ilgili işlemler bütünü. Kütüphane gibi ticari endişe taşımayan kuruluşlarda yürütülen işlemlerdir.
Sınıflama? Materyallerin belli bir sınıflama şemasına (sistemine) dayanılarak konularına göre raflardaki yerlerinin belirlenmesi işlemidir. Konuları kategorilendirmek (Genel anlamda). Hiyerarşi söz konusudur. Bilginin organizasyonu kapsamında sınıflama bilgi kaynağının sistem hiyerarşisinde uygun yerinin belirlenmesi işlemidir.
Yeni sınıflama sistemleri ve kataloglama tekniklerindeki gelişmeler indeksleme uygulamalarına bağlı olarak gelişim göstermektedir.
DİLE DAYALI İNDEKSLEME DİLLERİ (SÖZCÜKLERE DAYALI KONU ERİŞİMİ) DENETİMLİ DİLLER Kütüphaneler yüzyıllardır koleksiyonlarına çeşitli unsurlar aracılığıyla erişim sağlamaya çalışıyorlar. Bu unsurlar; -Yazar adı - Eser adı - Konu
Konu Erişimi: En genel anlamıyla eserlerin (yapıtların) içeriğini ve kapsamını yansıtan sözcükler veya sözcük gruplarının kullanılarak erişimin sağlanmasıdır.
Kütüphanelerde kaynaklara konu yönüyle erişim için çeşitli araçlar kullanılır. Bu araçlar daha önceden belirli bir düzene göre oluşturulduklarından diğer konu erişim unsurlarına göre farklılık gösterirler. Bu türdeki araçlara Denetimli Diller (Controlled Vocabularies) denir.
Aynı anlama gelen terimlerden bir tanesi belirlenerek liste içinde yalnızca o terimin karşılığında bir açıklama yapılırken diğer eş anlamlı olan veya aynı anlama sahip terimlerden kullanılan terime yönlendirmeler yapılır.
Kütüphane kataloglarında çoğunlukla denetimli diller kullanılmaktadır. DENETİMLİ DİL ÖRNEKLERİ - Konu Başlığı Listeleri - Thesaurus (Thesauri)
Konu Başlığı Listesi Subject Heading List Konu indekslerinde kullanılacak konu başlıklarının listesi, Konular arasında ilişkilendirmenin de yapıldığı sözcük veya sözcük gruplarından oluşan bir listedir. ÖRNEK: LCSH Library of Congress Subject Headings Konu alanları daha önceden belirlenmiştir. Bu nedenle Denetimli Dil örneğidir.
Konu alanları önceden belirlenmiş ve kaynaklara erişim buradaki düzenlemelere göre kesin ve net olarak belirlenir. ÖRNEK: Bronchi - Dieseases - - France Bronchi Diseases - France Ancak elektronik ortamda doğal dilde erişim kullanılmaktadır.
THESAURUS (Thesauri) Özel terimlerden oluşan otorite liste. Bu otomsayona dayalı bilgi erişim sistemleriyle kullanılan bir listedir. Konu başlıkları listelerine çok benzer. En yaygın örnekleri, elektronik veritabanlarında kullanılmaktadır.
THESAURUS VE HİYERARŞİK İLİŞKİLENDİRMELER Yapı olarak geniş kapsamlı konular altında daha dar kapsamdaki konular yer alır. Bu yapısı ile hiyerarşik bir düzen gösterirler. Ayrıca kavramlar altında Scope Note adı verilen terimle ilgili kısa açıklamalar da yer alabilir.
THESAURUS VE HİYERARŞİK İLİŞKİLENDİRMELER Literatürü değerlendirdiğimizde konu Başlıkları (Subject Headings) ile Thesaurus (thesauri) kavramlarının birbirinin yerine kullanıldığı görülmektedir. Buna rağmen bu iki kavram birbirinin aynı değildir.
Thesaurus 1974 yılından itibaren yöneltme dilinde standartlar geliştirilir. Terimlerden oluşur. Genel bir terim tek bir kavramı ifade eder. Konular ve terimler birbirleriyle ilişkilidir. Hiyerarşiyi gösteren kurallar vardır. Alt konu başlıkları yoktur. Subject Headings Geliştirilmiş bir standart bulunmamaktadır. Kaynaklara konu olabilecek başlıklardan oluşur. Tek bir kavram olabileceği gibi terimlerin birleşiminden oluşabilir. Konular birbirleriyle ilişkilendirilmiştir Yöneltmeler dışında herhangi hiyerarşik yapılanma yoktur. Alt konu başlığı çok kullanılır
THESAURUS ÖRNEKLERİ Elektronik ortamda ve basılı olarak yer alan thesauruslar özellik olarak birbirlerinden farklı düzenlemelere ve sembollere sahiptir.
Thesaurus of Physicological Index Terms Terimlerin Thesaurus a eklendiği tarihleri de belirtir. Kullanılan yöneltmeler; UF Used For B Broader Term N Narrower Term SN Scope Note R Related Term
Thesaurus of Physicological Index Terms Communication Skills 1973 PN 3724 SC10540 SNIndividual ability or competency in any type of communication. Limited to human populations. UF Communicative Competence B Ability 1967 N Language Proficiency 1988 Rhetoric R Communication 1967 Communication disorders 1982
Thesaurus of ERIC Descriptors Genel olarak thesaurus yapısını yansıtan bir düzene sahiptir. Descriptor??? Bir indekste veya veritabanında taranabilen her bir ögedir.
Thesaurus of ERIC Descriptors Terimlerin ekleniş tarihlerine, ek olarak terimlerin kullanım sıklıklarını da içerir. USE: Use UF: Used For BT: BroaderTerm RT: RelatedTerm NT: NarrowerTerm SN: Scope Note
Thesaurus of ERIC Descriptors Dress Design USE Clothing Design Drill Presses USE Machine Tools Drinking May 1974 Postings: 2,154 GC: 210 SN Consumption of alcoholic beverages UF Alcohol Consumption Alcohol use NT Alcohol Abuse BT Behavior RT Alcohol Education
Inspec Thesaurus UF : Hiyerarşide kullanılmayan terimi gösterir. Yöneltmeyi yapan terimi işaret eder. NT : Hiyerarşide terimden bir aşama ya da daha özel kapsamdaki bir terimi işaret eder. BT : TT : Hiyerarşide terimden bir aşama daha üstte ya da daha genel kapsamda bulunan terimi işaret eder. Hiyerarşide en genel terimleri gösterir.
Inspec Thesaurus RT : CC : Terimler arasındaki kavramsal ilişkileri işaret eder. INSPEC veritabanında Sınıflama kodlarını içerir. DI : Terimin INSPEC veritabanına girdiği tarihi içerir.
Inspec Thesaurus dynamic braking USE braking dynamic nuclear polarisation UF dynamic nuclear polarization solid effect NT overhauser effect BT magnetic double resonance TT resonance RT nuclear polarisation CC A0758 A3335D A7670E DI January 1977
Art & Architecture Thesaurus Burada hiyerarşik yapı tam ve net olarak ifade edilir. Facet bir yapı bu thesaurus için kullanılmaktadır. FACET??? Konu altında yapılan kategorilendirmeler
Örnek: İnsan Yaş Eğitim Kullandığı Dil Etnik Köken Yaş Çocuklar Gençler Yetişkinler
Art & Architecture Thesaurus Facet olarak 7 alt bölümleme ile terimleri sıralar. Bu bölümlerde, - Terimin Genel olarak ifade ettiği kavram - Fiziksel Özellikleri - Stili veya dönemi -. -. -. -.
AAT (ÖRNEK) Furnishings and Equipment Furnishings.furnishings.< furnishings by form or function> furniture < furniture by location or context>..outdoor furniture
OTOMATİK İNDEKSLEME YÖNTEMLERİ İndeksçiler; yıllarca bilgi merkezlerindeki kaynaklara erişim için çalıştılar ancak bu çalışmalar dönemin olanakları göz önüne alındığında zaman alıcı ve yüksek maliyet getiren bir çalışma olarak görülmüştür. Ayrıca bu çalışmalarda indeksçi faktöründen kaynaklanan sorunlarda yaşanmıştır. Örneğin yapılan indekslemelerde tutarsızlıklar ortaya çıkmıştır.
Teknolojik gelişmeler beraberinde İndeksleme işlemlerinde bilgisayarların kullanımını da getirdi. Bilgisayarların ve yazılımların indeksleme işlemlerinde kullanılmasıyla birlikte otomatik indeksleme yöntemleri ortaya çıkmıştır.
Otomatik İndeksleme Yöntemleri Otomatik indeksleme sistemleri bilgi merkezleri ve bilgi bilimlerinde bazı faydalar getirmiştir. Maliyet açısından ekonomiklik Zaman açısından kayıtların kısa sürede indekslenmesi (Bilgi Merkezi açısından) Zaman açısından kayıtlara kısa sürede erişim (Kullanıcılar açısından) İndeksleme işlemlerinde tutarlılık
OTOMATİK İNDEKSLEME (Automatic Indexing) Otomatik İndeksleme??? İndeksleme işlemlerinde (özellikle konuya karar vermede) en aza indirildiği ve makinece gerçekleştirilen indeksleme işlemleridir.
BİLGİSAYARA DAYALI İNDEKSLEME COMPUTER BASED INDEXING Otomatik indekslemeye benzer olarak eserlerin çeşitli özellikleri (title, full text ) dikkate alınarak oluşturulan yalnızca bilgisayarların kullanılmasıyla gerçekleştirilen indeksleme işlemleridir.
ANAHTAR SÖZCÜK İNDEKSLEMELERİ Bilgisayar alanındaki gelişmeler ve teknolojik yenilikler bilgi kaynaklara erişimde kullanılan araçlar kadar yöntemlerin de değişmesine ve gelişmesine neden olmuştur. Bu gelişmelerin en büyük örneklerini kaynaklara keyword yani anahtar sözcüklerin kullanılmasıyla erişimin sağlanması olarak göstermek mümkündür.
KWIC and KWOC Indexing KWIC à KeyWord In Context Indexing 1958 Hans Peter Luhn à IBM Mühendisi Teknik ve Bilimsel Makalelerin başlık (Title) kısımları konu ile ilgili en önemli terimleri içermektedir. Yazdığı bir program ile makalelerin başlıklarında geçen tüm kelimeleri tek tek alfabetik bir düzene koymuştur.
Ancak burada anahtar sözcükler eseradından bağımsız bir şekilde yer almazlar. Bu nedenle bu tür indekslemeye Keyword in context indexing adı verilmektedir. Ortak bazı ekler için stop list adı verilen bir liste ile A, an, the, of for gibi ekleri göz ardı edecek bir yapı kullanılır.
KWIC indekslemeye ek olarak KWOC indeksleme sistemleri de geliştirilmiştir. KWOC à KeyWord Out of Context Indexing Bu sistemlerde makale başlığından alınan anahtar kelimeler başlıktan ayrı olarak alfabetik bir sıralamaya girer.
KWIC ve KWOC İndekslemenin Sınırlılıkları 1. Title olarak yer alan kavramlardan başka diğer kavramlar da metin içinde yer alabilir ve KWIC, KWOC indeksler de yalnızca eseradını dikkate aldığından erişimde sorunlara neden olabilir. 2. Benzer kavramlar, eş anlamlılar ve aynı başlıktan çekilmiş terimler arasında konu başlığı listelerinde olduğu gibi see, see also gibi yönlendirmeler yer almaz. 3. Bazı başlıklar eserin içeriğinden tamamen farklı olabilir.
KELİME ÇIKARIMI Otomatik olarak yapılan indekslemelerde, KWIC ve KWOC indekslemelerde metine ve eseradına bağlı kalınması erişim açısından sorunlara neden olmaktadır. Kullanıcıların aramalarında ifade etmek istediği kavramlar farklı olabilir. Bu nedenle bilgisayara dayalı indeksleme sistemlerinde potansiyel olarak indeks terimlerine yakın olabilecek kavramlar da dikkate alınmaya başlamıştır. Bu durum için * işareti ile potansiyel olarak ilgili olacak anahtar sözcüklerin taranmasını sağlamak üzere kullanılmıştır.
Örneğin; Compression kavramı için arama yapan kullanıcılar için press olarak da arama yapılarak erişim sağlanabilmektedir. Böylece indeks terimi ile ilişkili olabilecek diğer kavramlar da dikkate alınır. COMPRESS COMPRESSION IMPRESSION SUPPRESSION PRESS PRESSER
Ancak bu durumda erişim ile ilgili sorunu ortadan kaldırmamak ile birlikte bazı sorunları da ortaya çıkarmaktadır. Potansiyel kavramları da dikkate alan bir indeksleme sisteminde istenmeyen sonuçların ortaya çıkmasına neden olur. Örneğin press ile ilgili bir tarama yapan kullanıcı sonuç ekranında pressure ile ilgili sonuçları da bulmaktadır.
Boolean Mantığının Kullanımı; Kullanıcıların aradıkları bilgilere daha net olarak erişmesi için aramada yer alacak terimler arasındaki ilişkilerin belirlenmesiyle daha uygun sonuçlara ulaşılması düşünülmektedir.
Örnek olarak hem öğretmen hem de öğrencilerle ilgili makalelere ya da kaynaklara erişmek istiyoruz. Boolean işleçlerini kullanarak, aramayı sınırlandırmak ve daha çok ilgili sonuçlara ulaşmak mümkündür. Bunun için boolean işleçleri ile öğretmen ile öğrenci terimleri arasında ilişkilendirme yapılır.
Terim Sıklığı Yöntemleri Bu tür indeksleme yöntemlerinde makalede veya yayında geçen terimlerin kullanılma sıklığı dikkate alınarak ağırlıklandırılır ve bu ağırlıklandırmaya göre indeks terimleri oluşturulur. Peki farklı uzunluklardaki dosyaların indekslenmesi nasıl olacak?
Dil Bilimsel Yöntemler Bu tür yöntemler hem semantik hem de sentaktik uygulamaları içerir. Tarama sözcüğünün dil bilimsel olarak kontrolünü içerir. En önemli örneklerini günümüzde en çok kullanılan arama motoru olan Google da görmek mümkündür. Google arama motorunda karşımıza çıkan Bunu mu demek istediniz?: ifadesi dil bilimsel indeksleme yöntemlerinin kullanıldığını göstermektedir.
Ontolojiler (Ontologies) Tanımlanmış bir konu alanından belirlenen özel terimlerin, terimler arası ilişkileri de gösteren sunum dili. Belli bir konunun seçilen özel terimlerinin ve bu terimler arasındaki ilişkinin kurulduğu biçimsel sunum. Yapay zeka alanında kullanılan bir terim.
Thesauri ve Konu Başlıkları Listelerine (Subject Heading Lists) benzer şekilde eş anlamlılar gibi çeşitli kelime setlerinin düzenlenmesinde kullanılırlar. Ayrıca konu başlıkları ve thesaurilerde olduğu gibi kelimeler arasındaki hiyerarşik ilişkileri de gösterirler. Hiyerarşi ile kelime setleri arasındaki geniş kapsam, dar kapsam ve ilişkili kelimeler gibi düzenlemeler yapılır.
Ontolojilerde Thesauri ve Konu Başlıkları listelerinden farklı olarak isimlerin, fiillerin, ek-fiillerin ve sıfatların da analizleri yer alır. Bütün Ontolojiler dil bilim ile ilgili değillerdir. Bazıları kategorize etme ve sınıflama ile ilgili bilgiler de içerir. Bu sınıflama ve kategorize etme işlemleri belirli bir alanla sınırlı olmaktadır.
BBY 106 BİLGİNİN ORGANİZASYONU II Arş. Gör. Tolga ÇAKMAK tcakmak@hacettepe.edu.tr