Türkçe Arama Motorlarında Performans Değerlendirme

Benzer belgeler
sayıda soru için hiçbir ilgili belgeye erişemediklerinden soru başına erişilen ortalama ilgili belge sayıları düşüktür (1,5). Arama motorlarının

Türkçe arama motorları en sık aranan sözcüklerin ne kadarını kapsamaktadır? Arama motorlarının kapsama oranları arasında fark var mıdır?

Sorgular Arabul Arama Netbul Superonline

DİZİN. Not: Koyu harfle yazılan sayfalar ilgili terimin yoğun olarak geçtiği sayfaları göstermektedir.

Bilgi Erişim Performans Ölçüleri

Dizin / Index. Dizin, Cilt / Index to Volume 9, 2008 (t) tanıtım yazısı / review (ç) çeviren / translator. Argan, Metin

Bilgi Erişim Sistemleri II

Bilgi Erişim Sorunu. Yaşar Tonta. Hacettepe Üniversitesi yunus.hacettepe.edu.tr/~tonta/ BBY163 Bilgi Yönetimi Kavramları

Bilimsel Yayınlarda Kaynak Gösterme, Tablo ve Şekil Oluşturma Kuralları. İpek Şencan #TKForum

Bilgi Merkezi Web Siteleri

Hakemli Makale 1995 DEN GÜNÜMÜZE HACETTEPE. Abstract

Performance Evaluation of Image Search Engines Based on the Number of Query Words

KURUMSAL WEB SAYFA STANDARTLARI

Semantik Bilgi Yönetimi

Türkçe Arama Motorlarında Performans Değerlendirme

Web Uygulama Güvenliği Kontrol Listesi 2010

DergiPark ve Açık Erişim Yaklaşımları

Bütünleşik Elektronik Bilgi Hizmetleri

1 GİRİŞ. dili ile tanımlanmış ve URI (Universal Resource Indicator) adresine sahip Internet kaynağı olarak dar anlamıyla tanımlanmıştır.

Bilimsel Bilgiye Erişim

Mesleki Bir Tartışma Listesi Olarak KUTUP-L nin İçerik Analizi

(Bilgisayar ağlarının birbirine bağlanarak büyük bir ağ oluşturmasıdır)

Görme Engelliler için Web Sayfalarında Erişilebilirliğin Sağlanması

1 Temel Kavramlar. Veritabanı 1

NEDEN AÇIK ERİŞİM? 3, Mart 2014 Yükseköğretim Kurulu Başkanlığı BİLKENT ANKARA

Web Sayfasında Google Analitik Kullanımı ve Kullanıcı Davranışlarının Belirlenmesi: İstanbul Ticaret Üniversitesi Kütüphane Web Sayfası.

Ölçümleme Verisi Nasıl Kullanılacak?

Türkiye de E-Devlet Uygulamaları Kapsamında Kamu Kurumlarına Ait Web Sayfalarının Değerlendirilmesi

SEO ALANLARINA YAZILMASI GEREKENLER

Türkiye de internet kullanım trendleri

Non-Parametrik İstatistiksel Yöntemler

Bilgi Teknolojilerinin Mühendislerin Bilimsel İletişim. im Davranış. Değişen Dünyada Bilgi Yönetimi Sempozyumu Ekim 2007 Ankara

Web Sitesi/Sayfası/Dokümanı

Türkiye de Güvenli İnternet ve Uygulamaları

EGE ÜNİVERSİTESİ TIP FAKÜLTESİ UZMANLIK EĞİTİMİ TEZ YAZIM KURALLARI

TÜBİTAK Türkiye Dergileri Ulusal Ev Sahipliği

Değişen Dünyada Bilgi Yönetimi Sempozyumu, Ekim 2007, Ankara. En İyi Öğrenci Bildirisi Birincilik Ödülü. **

Sosyal Ağlar ve Çevrimiçi Kütüphane Katalogları: OPAC 2.0

(TDB Merkez Yönetim Kurulunun Şubat 2009 Tarihli Toplantısında Kabul Edilmiştir.)

Kaynak Gösterme ve APA 6

Okullar ve Üniversiteler için Dijital Kütüphane

Ders Adı Kodu Yarıyılı T+U Saati Ulusal Kredisi AKTS. Sosyolojiye Giriş I SSG

TIP SÜRELİ YAYINCILIĞINDA BİR ELEKTRONİK DERGİ : KBB-Forum (

DR. RAMAZAN DEMİR TÜRK TELEKOM 9 MART 2010 CONRAD HOTEL

23. BASKI. Alıştırmalar için örnek data dosyaları te.

Hacettepe Üniversitesinde Bilgi ve Belge Yönetimi Eğitimi

Örneklemden elde edilen parametreler üzerinden kitle parametreleri tahmin edilmek istenmektedir.

Bilgisayar Mühendisliği

BÖLÜM I ARAŞTIRMANIN DOĞASI

AKADEMİK YILI. Ders Öğretim Elemanı ve Ders Yardımcısı

ATATÜRK ÜNİVERSİTESİ E-DERGİ PORTALI ( Kasım BİNİCİ *

URAP TÜRKİYE SIRALAMASI BASIN BİLDİRİSİ 15 HAZİRAN 2016

Kaynak Gösterme ve APA 6. BBY 463 Akademik Yazma Becerileri ( Güz)

İnternet bağlantısı. Geçerli var mı? yüzde Evet ,5 75,2 Hayır ,9 24,8 Toplam ,3 100,0 Cevapsız 32 3,7 Toplam ,0

YAYIN POLİTİKASI İLKELERİ

Öğretmen Adaylarının Eğitim Teknolojisi Standartları Açısından Öz-Yeterlik Durumlarının Çeşitli Değişkenlere Göre İncelenmesi

ÇÖZÜM ÖNEMLİ DUYURU MALİ

2013 YGS-LYS TABAN PUANLARI KİTAPÇIĞI ( NET DAĞILIMI)

URAP TÜRKİYE SIRALAMASI BASIN BİLDİRİSİ 26 EKİM 2015

Ders Adı Kodu Yarıyılı T+U Saati Ulusal Kredisi AKTS. Veri Organizasyonu ve Yönetimi BIL

TB Akıllı Malzemeler, Biyobenzetim GEBZE TEKNİK ÜNİVERSİTESİ. SO Anayasa Hukuku GALATASARAY ÜNİVERSİTESİ

evt

SPOR BİLİMLERİ FAKÜLTESİ ÖĞRENCİLERİNİN BİLGİ OKUR- YAZARLIĞI DÜZEYLERİNİN BELİRLENMESİ

ORTAOKUL ÖĞRENCİLERİNİN BEDEN EĞİTİMİ VE SPOR DERSİNE İLİŞKİN DEĞERLERİNİN İNCELENMESİ

Uluslararası Sıralamalarda Sağlık Üniversitelerinin Yeri ve Önemi

Webometrics (İspanya, Cybermetrics Laboratuvarı) NTU (HEEACT) (Tayvan, National Taiwan Üniversitesi)

TEMEL BİLGİ TEKNOLOJİLERİ KULLANIMI. Bilgisayar I ve Bilgi İletişim Teknolojileri Dersi Öğr.Gör. Günay TEMUR

Prof. Dr. Özkan ÜNVER Prof. Dr. Hamza GAMGAM Doç. Dr. Bülent ALTUNKAYNAK SPSS UYGULAMALI TEMEL İSTATİSTİK YÖNTEMLER

TÜRKİYE ÜNİVERSİTELERİNİN AKADEMİK PERFORMANS SIRALAMASI ve ERCİYES ÜNİVERSİTESİ NİN DURUMU

ONDOKUZ MAYIS ÜNİVERSİTESİ. VERİ TOPLAMA ve ANALİZ BİRİMİ. Bilgi İşlem Daire Başkanlığı Anket Sonuçları

ŞEKİLLER DİZİNİ AKADEMİK/ İDARİ BİRİM EŞLEŞTİRİLMESİ AKADEMİK /İDARİ BÖLÜM EŞLEŞTİRİLMESİ BİNA EŞLEŞTİRME...

Bilgi Çağında Kütüphane

Prof.Dr.Celalettin VATANSEV Prof.Dr. Ayşe Saide ŞAHİN Prof.Dr. Faruk AKSOY Prof.Dr. Nizamettin DALKILIÇ Doç.Dr. Mehmet ÖZDEMİR

PERSONELİN GÖREV YAPACAĞI ŞEHİR İSTİHDAM EDİLECEK PERSONEL SAYISI * ARANAN ÖZEL KOŞULLAR BİRİMİ İLAN NUMARASI REFERANS KODU HİZMET GRUBU BÖLÜMÜ

Bilişim Teknolojileri Temelleri Dijital Dünyada Yaşamak

TB ABDULLAH GÜL ÜNİVERSİTESİ Yenilenebilir Enerji Kaynakları / Teknolojileri (Güneş Enerjisi, Rüzgar Enerjisi, Jeotermal, Hidrogüç)

TC BİLECİK ŞEYH EDEBALİ ÜNİVERSİTESİ SÖĞÜT MESLEK YÜKSEKOKULU HALKLA İLİŞKİLER VE TANITIM (N.Ö.) EĞİTİM YILI DERS PLANI

Prof.Dr.Ahmet ÖZKAĞNICI Prof.Dr. Saim AÇIKGÖZOĞLU Prof.Dr. V.Meltem ENERGİN Prof.Dr. Mehmet KOÇ Doç.Dr. Mehmet ÖZDEMİR

Course Content for Freshmen

Prof.Dr.Ahmet ÖZKAĞNICI Prof.Dr. Saim AÇIKGÖZOĞLU Prof.Dr. V.Meltem ENERGİN Prof.Dr. Mehmet KOÇ Doç.Dr. Mehmet ÖZDEMİR

ÇEVRİM İÇİ VERİ TABANLARININ SEÇİMİ VE KULLANIMINDA KÜTÜPHANECİLERİN ROLÜ

İÇİNDEKİLER. Önsöz... iii İçindekiler... v

Ali Haydar Doğu, Ercüment Yılmaz

Obstrüktif Uyku Apne Sendromu Hastalarında Sürekli Pozitif Havayolu Basıncı Tedavisi Sonrası Kaybolan veya Yeni Ortaya Çıkan Uykuda Periyodik Bacak

Erkan EMİRZADE ** ve Yıltan BİTİRİM ***

Ülkemizdeki Üniversite Web Sayfalarının Siber Güvenlik Açısından Hızlı Bir Değerlendirmesi

Türkiye İçin Bilgi Ekonomisi Analizi. Oytun MEÇİK Araştırma Görevlisi T.C. Uşak Üniversitesi İİBF - İktisat Bölümü

KÜTÜPHANE ve DOKÜMANTASYON DAİRE BAŞKANLIĞI İŞ AKIŞ SÜREÇLERİ

Ders Adı Kodu Yarıyılı T+U Saati Ulusal Kredisi AKTS. Hukuka Giriş HUK

Türkiye de Çalışan Çevirmenlerin İnternet Kullanım Alışkanlıkları

2013 YGS-LYS TABAN PUANLARI KİTAPÇIĞI ( NET DAĞILIMI)

Internet Nedir? Devlet Kurumları. Internet Servis Sağlayıcılar. Lokal Ağ. Eğitim Kurumları. Kişisel Bilgisayar. Dizüstü Bilgisayar.

Ders Adı Kodu Yarıyılı T+U Saati Ulusal Kredisi AKTS

İÇİNDEKİLER. YAZARLAR HAKKINDA... v. RESİMLER LİSTESİ...xv. 1.1.Bulut Bilişim Kavramının Analizi...1 BÖLÜM 1: TEMELLER...1

TS EN ISO EŞLEŞTİRME LİSTESİ

Doktor Web Tasarım ile sıfır hatada Dünya standartlarında web kalite politikasına uygun web sitesi oluşturabileceksiniz

2010 Faaliyetlerimiz & TÜBİTAK EKUAL Değerlendirme

HACETTEPE ÜNİVERSİTESİ BİLGİ VE BELGE YÖNETİMİ BÖLÜMÜ TÜRKÇE İKTİSAT BÖLÜMÜ İÇİN ÇİFT ANADAL DERS PROGRAMI

ONDOKUZ MAYIS ÜNİVERSİTESİ. VERİ TOPLAMA ve ANALİZ BİRİMİ. Sağlık Kültür Daire Başkanlığı Anket Sonuçları

KÜTÜPHANE VE DOKÜMANTASYON DAİRE BAŞKANLIĞI

Transkript:

Türkçe Arama Motorlarında Performans Değerlendirme Yıltan Bitirim Doğu Akdeniz Üniversitesi (yiltan( yiltan.bitirim@.bitirim@emu.edu.tr) Hayri Sever Massachusetts Üniversitesi (sever@cs cs.umass.edu) Yaşar Tonta Hacettepe Üniversitesi (tonta@hacettepe hacettepe.edu..edu.tr)

Plan Giriş Araştırmanın amacı Bilgi erişim sistemleri Arama motorları Yöntem ve tasarım Bulgular ve yorum Öneriler

Giriş Internet: yarım milyar kullanıcı, 120M sunucu bilgisayar Web: 3TB yer tutan en az 1 milyar belge Arama motorları:yüzey web in %16 sını, derin web in onbinde üçünü kapsıyor

Yüzey web 1,5 milyar belge Derin Web 550 milyar belge Kaynak: BrightPlanet, 2001.

Amaç Türkçe arama motorlarının bilgi erişim performanslarını ölçmek

Bilgi Erişim Sistemleri

Arama Motorları Klasik bilgi erişim sistemlerinden farklı Veri tabanları büyük ve dinamik Dizinleme örümcekler aracılığıyla Belge kalitesi düşük Belgelerin %30 u ikileniyor Kullanıcılar çok çeşitli Sorular çoğunlukla tek sözcükten oluşuyor

Araştırma Soruları Türkçe arama motorlarının duyarlık, normalize sıralama, kapsama, yenilik ve ölü bağlantı oranlarının birbirinden farklı olup olmadığı Arama motorları hangi tür sorularda daha başarılı Arama motorları üst veri alanlarından yararlanıyor mu Türkçe karakter sorunu Gövdeleme sorunu

Arama Motorları Arabul Arama Netbul Superonline

Sorular Çeşitli türde 17 soru En sık aranan sorular mp3 oyun sex erotik porno Üst verilerle ilgili iki deney

1. internet ve etik 2. barok müzik 3. prozac 4. arama motorları 5. baris manco'nun mp3'leri 6. barış manço'nun mp3'leri 7. dpt 8. uzaylı 9. uzaylılar 17 Soru 10. demirel ve sezer 11. demirel veya sezer 12. demirel veya sezer ve tema 13. uzay 14. evren 15. uzay veya evren 16. atatürk ve fikriye hanım 17. ömer izgi

Ölçümler Ölü bağlantı oranı Adreslere erişilebilirlik oranı Duyarlık oranı Erişilen ilgili belgelerin erişilen tüm belgelere oranı Normalize sıralama oranı İlgili belgelere ilk sıralarda erişilebilme oranı Kapsama oranı İlgili belgeleri kapsama oranı Yenilik oranı Erişilen tekil ilgili belgelerin oranı

Soruların Formülasyonu

İlgililik Değerlendirmeleri ilgili ölü bağlantı ilgisiz

Veri Analizi Arama motorlarının duyarlık, normalize sıralama, kapsama, yenilik, ölü bağlantı oranları arasında fark var mı? İstatistik testler Kruskal-Wallis (H) testi Mann-Whitney (U) testi Korelasyon (r) testi

Ölü Bağlantı Oranları Ort. her 6 adresten 1 i ölü 1,4 5,1 0,7 2,8 Soru başına ortalama ölü bağlantı sayısı

Güncellik: Arabul

Güncellik: Arabul (21 Nisan 2004)

Güncellik: Arama

Güncellik: Arama

Güncellik: Netbul

Güncellik: Netbul??

Güncellik: Superonline

Güncellik: Superonline

Güncellik: Superonline

Erişilen İlgili Belge Sayıları Erişilen toplam belge sayısı 971 Ortalama her 6 belgeden 5 i ilgisiz

Ort. Duyarlık Değerleri %28 %40 %20 %15 %11 %27 %25 %24 %21 %21 %19 %16 %16 %14 %16 %15 %13 %10 %12 %9

Ort. Normalize Sıralama Değerleri %58 %54 %50 %52 %54 %37 %33 %37 %39 %32 %31 %39 %34 %30 %20 %21 %16 %22 %19 %21

Sorulara Göre Arama Motorlarının Ort. Duyarlık ve Ort. Normalize Sıralama Değerleri

Türkçe Karakter Sorunu

En Sık Aranan Beş Soru İçin Kapsama Oranları

Arama Motorlarının Türkiye Adresli Belgeleri Kapsama Oranları ( oyun ) 80 "oyun" Arabul Arama Netbul Superonline Kapsama Yüzdesi (%) 70 60 50 40 30 20 10 0 50 100 150 200 250 300 350 400 450 500 550 600 Öbek sayısı 650 700 750 800 850 900 950 1000

En Sık Aranan Beş Soru İçin Yenilik Oranları Akademik Bilişim 02

En Sık Aranan Beş Soru İçin Türkiye Adresli Yeni Belge Bulma Oranları

Arama Motorlarının Üst Veri Alanlarından Yararlanması I

Arama Motorlarının Üst Veri Alanlarından Yararlanması II

Öneriler Dizinler daha sık güncelleştirilmeli İlgili belgelere erişememe nedenleri araştırılmalı İlgili belgeler daha üst sıralarda gösterilmeli Türkçe karakter sorunu çözülmeli Gövdeleme algoritması kullanılmalı Daha fazla Türkiye adresli belge dizinlenmeli Üst veri alanlarından yararlanılmalı

Türkçe Arama Motorlarında Performans Değerlendirme Yaşar Tonta Hacettepe Üniversitesi (tonta@hacettepe hacettepe.edu..edu.tr) Yıltan Bitirim Doğu Akdeniz Üniversitesi (yiltan( yiltan.bitirim@.bitirim@emu.edu.tr) Hayri Sever Massachusetts Üniversitesi (sever@cs cs.umass.edu)