Performance Evaluation of Image Search Engines Based on the Number of Query Words



Benzer belgeler
Erkan EMİRZADE ** ve Yıltan BİTİRİM ***

Resim Arama Motorlarının Sorgu Sözcük Sayısına Göre Performans De erlendirmeleri

sayıda soru için hiçbir ilgili belgeye erişemediklerinden soru başına erişilen ortalama ilgili belge sayıları düşüktür (1,5). Arama motorlarının

Türkçe Arama Motorlarında Performans Değerlendirme

DİZİN. Not: Koyu harfle yazılan sayfalar ilgili terimin yoğun olarak geçtiği sayfaları göstermektedir.

Sorgular Arabul Arama Netbul Superonline

Dizin / Index. Dizin, Cilt / Index to Volume 9, 2008 (t) tanıtım yazısı / review (ç) çeviren / translator. Argan, Metin

Yarının Dünyasında Google İnternette Bir Dönüşüm Google lizasyon

Temel ve Uygulamalı Araştırmalar için Araştırma Süreci

Bilimsel ve Teknik Dokümantasyon. Yrd. Doç.Dr. Özlem Bayram

Webometrics (İspanya, Cybermetrics Laboratuvarı) NTU (HEEACT) (Tayvan, National Taiwan Üniversitesi)

2017 YILI MAVİ BAYRAK ÇEVRE EĞİTİM VE BİLİNÇLENDİRME ETKİNLİKLERİ DOSYASI

VT Sistem Gerçeklemesi. Ders Notları- #8

Üniversite Sıralama (Ranking) Sistemleri

Semantik Bilgi Yönetimi

YENİ NESİL KÜTÜPHANECİLER

Osmanlı Tarihi ile ilgili Sorgularda Web Arama Motorlarının Türkçe Sonuç Kalitesinin Ölçeklendirilmesi Denemesi

Algoritmalar. Arama Problemi ve Analizi. Bahar 2016 Doç. Dr. Suat Özdemir 1

WEB ARAÇLARI VE UZAKTAN EĞİTİM CEIT357-4.HAFTA

VERİ MADENCİLİĞİ (Web Madenciliği)

Aramanın Anatomisi 1

Web Madenciliği (Web Mining)

KANITA DAYALI TIP BİLGİ OKURYAZARLIĞI ELEŞTİREL OKUMA

Doğal Dil İşleme Nedir? Doğal Dil İşleme

adjust, ülkelerin Apple App Store ve Google Play' deki en popüler sosyal ağ uygulamalarını açıklıyor

Temel ve Uygulamalı Araştırmalar için Araştırma Süreci

ÜNİVERSİTE SIRALAMALARINDA TÜRK ÜNİVERSİTELERİNİN 2011 YILI DURUM RAPORU

Koçluk Oturumu/Seansı Canlandırma

Web Application Penetration Test Report

VT Gerçeklenmesi Ders Notları- #6

SEO ALANLARINA YAZILMASI GEREKENLER

Google da Etkin Arama Yöntemleri. Eğitim Teknolojileri Destek Birimi

İş Zekâsı Sistemi Projesi

İnternet Destekli Temel Bilgisayar Bilimleri Dersinde Anket Uygulaması

Türkçe arama motorları en sık aranan sözcüklerin ne kadarını kapsamaktadır? Arama motorlarının kapsama oranları arasında fark var mıdır?

Yazılım Mühendisliği 1

ELEKTRİK ENERJİ SİSTEMLERİNDE OLUŞAN HARMONİKLERİN FİLTRELENMESİNİN BİLGİSAYAR DESTEKLİ MODELLENMESİ VE SİMÜLASYONU

SINIR TENORUNUN EKONOMİK BAKIR MİKTARI TAHMİN HASTASINA ETKİSİ

Elsevier ClinicalKey Smarter Search for Faster Answers

Türkiye de internet kullanım trendleri

ALIŞTIRMA-UYGULAMA YAZILIMLARI

HERKES İÇİN BİLGİ ATATÜRK ÜNİVERSİTESİ AÇIK ARŞİVİ. Coşkun POLAT

Ulusal Yeterlilikler Çerçevesine Dayalı AKTS Uygulamaları. Prof. Dr. Oğuz ESEN

T.C. BAŞBAKANLIK DEVLET PLANLAMA TEŞKİLATI Avrupa Birliği Eğitim ve Gençlik Programları Merkezi Başkanlığı

Dr. Yeşim BULCA : Hacettepe Üniversitesi Spor Bilimleri Fakültesi

13 Aralık Đlgili Versiyon/lar : ETA:SQL, ETA:V.8-SQL. Đlgili Modül/ler : Raporlar. Kullanıcı Tanımlı Raporlar Bölümünden Yapabildiklerimiz

Şirket Politikamız : Kalite Politikamız :

Uzm. Filiz MENGÜÇ TÜBİTAK ULAKBİM DergiPark Grubu TÜBİTAK

ANKARA ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ

MD Consult Core Collection & Journal Consult Dergileri Kullanım Kılavuzu

Microsoft Office Access Ders İçeriği 25 Saat. Access Temel 10 saat

Dünya çapında 60 dan fazla ülkede kullanılan Westlaw International;

Arama motoru: kuş gribinin etkileri

YouTube SEO Kılavuzu. Video İzlenme Oranlarını Artırmak ve Sıralamayı Yükseltmek İçin Etkili İpuçları

KORELASYON VE REGRESYON ANALİZİ. Doç. Dr. Bahar TAŞDELEN

DOSYA ORGANİZASYONU. Sıralı erişimli dosya organizasyonu yöntemleri ÖZLEM AYDIN TRAKYA ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

1: Anlatım, 2: Soru-Cevap, 3: Lab, 4: Örnek vaka incelemesi

KAPSAM 5 farklı yayınc ncıdan, Genel fizik Astronomi Jeofizik Nükleer ve Plazma fizik Mühendislik konularında, nda, 15 adet dergiye tam metin olarak e

MAM ENERJİ ENSTİTÜSÜ ANKARA

.. ROBOTİK VE KODLAMA EĞİTİMİ ÇERÇEVESİNDE ÖĞRETİM YILI BİLİŞİM TEKNOLOJİLERİ DERSİ ÜNİTELENDİRİLMİŞ YILLIK DERS PLANI

Kullanıcılar için EGEE ve TR-Grid araçları

Sonuçlar. Anket Hızlı İstatistikler Anket 'Çocuk Gelişimi Programı Program Çıktıları Kazanım Anketi'

Performans değerlendirmenin belli aşamaları vardır. Bu aşamalar:

Wi-Fi Direct Rehberi. Wi-Fi Direct ile Kolay Kurulum. Sorun Giderme. Appendix

VT Gerçeklenmesi Ders Notları- #3

VT Gerçeklenmesi Ders Notları-

İSTANBUL TEKNİK ÜNİVERSİTESİ ELEKTRİK-ELEKTRONİK FAKÜLTESİ. AKILLI FİYAT ARAMA MOTORU TiLQi.NET

ÖZÜRLÜ SAĞLIK KURUL RAPORU WEB TAKİP SİSTEMİ KULLANIM KILAVUZU İzmir İl Sağlık Müdürlüğü

MESLEK YÜKSEKOKULLARINA SINAVLI VE SINAVSIZ GEÇİŞ SİSTEMİ İLE YERLEŞEN ÖĞRENCİLERİN PERFORMANSLARININ KARŞILAŞTIRILMASI

Bilgi Erişim Performans Ölçüleri

ALGORİTMA ANALİZİ. Cumhuriyet Üniversitesi Bilgisayar Mühendisliği Bölümü

SEO Nedir? SEO = Pazarlama + Strateji

Büyük, Dağıtık, Veri Yoğunluklu Uygulamalarda Programlama Paradigmaları

Veri Tabanı Yönetim Sistemleri Bölüm - 7

Bilimsel Bilgiye Erişim

YZM Algoritma ve Programlama I Manisa Celal Bayar Üniversitesi, Yazılım Mühendisliği. Proje#1

HAKKIMIZDA ABOUT US. operating at production of cosmetic products like hair care products,personal care products and deodorant&perfume.

% 83 % 10 % 4 % 2 % 1. Görme. İşitme. Koklama. Dokunma. Tatma

Sunucu Bilgisayarlarda Kullanılan CISC ve RISC İşlemcilerin Performans Karşılaştırımı

BİLİMSEL BİLGİYE ERİŞİM

TUREK 2015 RES lerde Üretim Tahminleri ve Elektrik Satışı. Fatih Yazıtaş

Metal matkap ucu setleri

2) Lineer olmayan denklem çözümlerini bilir 1,2,4 1

(Bilgisayar ağlarının birbirine bağlanarak büyük bir ağ oluşturmasıdır)

Fortune 100 Türkiye Firmalarının SEO İncelemesi

The International New Issues In SOcial Sciences

İÇİNDEKİLER GİRİŞ... 1

5.1. Temalar, Kenar Boşlukları, Yönlendirme, Boyutlar, Yazdırma Alanı, Arka Plan

DHMİ Genel Müdürlüğü Mekansal Bilgi Sistemi Tabanlı Görsel Destekli Envanter Takip Sistemi

Ölçümleme Verisi Nasıl Kullanılacak?

TEMEL EĞİTİMDEN ORTAÖĞRETİME GEÇİŞ ORTAK SINAV BAŞARISININ ÇEŞİTLİ DEĞİŞKENLER AÇISINDAN İNCELENMESİ

ANKOS ONLINE İŞLEMLER (ERM)

Dijital Yerliler ve Özelleşmiş Dijital. Kullanıcıları Üzerine Bir Çalışma

5 den 8 e. İTÜ Öğrenci Bilgi Sistemi Güncellemesi Banner 5 den Banner 8 e. yenilikler, değişiklikler...

VERİ MADENCİLİĞİ Metin Madenciliği

EĞİTİM-ÖĞRETİM YILI ÖZEL BAHÇELİEVLER ANASINIFI İNGİLİZCE DERSİ ÜNİTELENDİRİLMİŞ YILLIK DERS PLANI

My EBSCOhost Kullanım Kılavuzu. support.ebsco.com

Organik SEO: Google da İlk Sayfada Çıkmak İçin 10 SEO Tekniği

Teknik Özellikler Technical Specifications

Bilgisayar programlamanın üç temel mantık yapısından biridir. Diğer ikisi ise Seçilim(Selection) ve Döngü(Loop, Iteration)dür.

Transkript:

Resim Arama Motorlarının Sorgu Sözcük Sayısına Göre Performans Değerlendirmeleri Performance Evaluation of Image Search Engines Based on the Number of Query Words Erkan Emirzade Yakın Doğu Üniversitesi Bilgisayar Mühendisliği Bölümü, Lefkoşa, KKTC. erkan_emirzade@analiz-systems.com Yıltan Bitirim Doğu Akdeniz Üniversitesi Bilgisayar Mühendisliği Bölümü, Mağusa, KKTC. yiltan.bitirim@emu.edu.tr

İçerik Giriş Yöntem Bulgular ve Yorum Sonuç İleriki Çalışmalar ve Öneriler

Giriş Bilgi çağında bilgiye hızlı erişmek daha çok önem kazanmıştır. Internet, insanların ilk başvuru kaynağı olmayı şimdiden başarmıştır. Yeni kayıt ortamı olan Internet hızlı gelişimini sürdürürken, bilgiye erişimde kullanılan arama motorları da kendilerini sürekli geliştirmeye devam etmektedir. Internet büyüdükçe üzerinde saklanan resimler de artmaktadır Bu artışla birlikte ilgili resimlere erişim daha karmaşık bir hal almıştır. Bu çalışmada, duyarlılık ve normalize sıralama ölçütleri kullanılarak farklı kesme noktaları (ilk 10 ve ilk 20) için sorgu sözcük sayısındaki değişimin seçilen popüler resim arama motorları (Google, Yahoo ve MSN) üzerindeki etkisi araştırılmıştır.

Yöntem Artan sorgu sözcük sayısının resim arama motorları üzerindeki etkisini ölçmek için öncelikle üç popüler resim arama motoru seçilmiştir. Google (www.google.com) Yahoo (www.yahoo.com) MSN (www.msn.com) Wordtracker (http://www.wordtracker.com) - Haziran 2006

Tablo 1. Sorgu listesi S. no. Bir sözcüklü sorgular S. no. İki sözcüklü sorgular S. no. Üç sözcüklü sorgular S. no. Dört sözcüklü sorgular 1 car 11 50 cent 21 valentine day cards 31 halloween costumes for kids 2 map 12 britney spears 22 white roller skate 32 ray ban metal sunglasses 3 game 13 star wars 23 martin luther king 33 calvin klein deodorant perfume 4 tattoo 14 crazy frog 24 equipment travel bag 34 wood made musical instruments 5 flower 15 halloween costume 25 wild animal rescue 35 lord of the rings 6 beach 16 funny picture 26 wireless ethernet bridge 36 rosewood hand made furniture 7 simpsons 17 city map 27 bottled drinking water 37 remote control hobby toys 8 amazon 18 hard job 28 antic wall clocks 38 silver watch with leather 9 wallpaper 19 cat scan 29 white sleeveless shirt 39 hydro electric power plant 10 cat 20 football shoes 30 pink rose bouquet 40 pink high heeled shoes

Yöntem Her sorgu seçilmiş resim arama motoru üzerinde tek tek ve bağımsız olarak çalıştırılmıştır. Bütün sorguların araştırılması yaklaşık bir haftada bitirilmiştir. Internet kullanıcılarının %80 i arama motoru sonuçlarının sadece ilk 20 ögesine (ilk iki sayfasına) bakmaktadır. (Jansen & Spink, 2003) ilgili ya da ilgisiz Duyarlılık ve normalize sıralama değerleri kesme noktası 10 ve kesme noktası 20 için teker teker hesaplanmıştır.

Yöntem Duyarlılık = Erişilen ilgili öge sayısı / Erişilen toplam öge sayısı Normalize Sıralama Snorm (Δ) = 1 2 1 + S S S + + max Δ : Erişim çıktısı sıralaması; S+: Erişim çıktısında ilgili ögelerin ilgisiz ögelerin önünde yer aldığı öge çiftleri sayısı; S-: Erişim çıktısında ilgisiz ögelerin ilgili ögelerin önünde yer aldığı öge çiftleri sayısı; S+max : Mümkün olan en fazla S+.

Bulgular ve Yorumlar

Tablo 2. Sorgu grupları için erişilen ilgili resim öge sayıları Bir sözcüklü sorgu grubu İki sözcüklü sorgu grubu Üç sözcüklü sorgu grubu Dört sözcüklü sorgu grubu Sorgu no G Y M Sorgu no G Y M Sorgu no G Y M Sorgu no G Y M S1 13 17 14 S11 19 19 20 S21 20 13 15 S31 14 4 11 S2 17 17 20 S12 20 20 20 S22 11 5 5 S32 19 12 15 S3 17 4 9 S13 18 18 15 S23 15 18 15 S33 16 16 20 S4 13 20 16 S14 20 20 19 S24 19 18 14 S34 9 4 0 S5 16 19 17 S15 15 15 9 S25 5 2 3 S35 13 17 9 S6 15 16 18 S16 10 11 8 S26 17 17 15 S36 11 19 0 S7 13 18 18 S17 19 19 19 S27 12 5 11 S37 12 5 3 S8 4 3 3 S18 7 5 3 S28 20 14 14 S38 17 13 19 S9 17 20 20 S19 12 12 12 S29 15 12 11 S39 11 5 5 S10 18 19 19 S20 17 17 8 S30 19 16 15 S40 13 1 6 Ort. (%) 72 77 77 Ort. (%) 78 78 67 Ort. (%) 77 60 59 Ort. (%) 68 48 44 Not: G: Google; Y: Yahoo, M: MSN.

Şekil 1. Resim arama motorlarının ortalama duyarlılık oranları a) Google Duyarlılık 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Kesme Noktası 10 Kesme Noktası 20 1 2 3 4 Sorgu Sözcük Sayısı Şekil 2. Resim arama motorlarının ortalama normalize sıralama değerleri: 0,8 a) Google Normalize Sıralama 0,7 0,6 0,5 0,4 0,3 0,2 0,1 Kesme Noktası 10 Kesme Noktası 20 0 1 2 3 4 Sorgu Sözcük Sayısı

Şekil 1. Resim arama motorlarının ortalama duyarlılık oranları b) Yahoo Duyarlılık 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 1 2 3 4 Kesme Noktası 10 Kesme Noktası 20 Sorgu Sözcük Sayısı Şekil 2. Resim arama motorlarının ortalama normalize sıralama değerleri: b) Yahoo Normalize Sıralama 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 1 2 3 4 Kesme Noktası 10 Kesme Noktası 20 Sorgu Sözcük Sayısı

Şekil 1. Resim arama motorlarının ortalama duyarlılık oranları c) Msn Duyarlılık 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 1 2 3 4 Kesme Noktası 10 Kesme Noktası 20 Sorgu Sözcük Sayısı Şekil 2. Resim arama motorlarının ortalama normalize sıralama değerleri: c) Msn Normalize Sıralama 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 1 2 3 4 Kesme Noktası 10 Kesme Noktası 20 Sorgu Sözcük Sayısı

Sonuç Google, Yahoo ve MSN resim arama motorlarında sorgularda yer alan sözcük sayısı arttıkça arama motorlarının duyarlılık performansları genelde düşmektedir Duyarlılık oranları kesme noktası 10 iken genelde daha yüksektir. Başka bir deyişle, erişilen resim sayısı arttıkça duyarlılık oranları da düşmektedir. Benzeri bir durum normalize sıralama oranları için de geçerlidir. Sorgu sözcük sayısı arttıkça arama motorlarının normalize sıralama performansları düşmektedir. Arama motorlarının kesme noktası 10 daki normalize sıralama oranları kesme noktası 20 dekilerden genelde daha yüksektir. Başka bir deyişle, erişilen resim sayısı arttıkça ilgili resimleri daha üst sıralarda gösterebilme başarısı düşmektedir.

Sonuç Metin türü veri tabanlarında sorgu sözcük sayısı arttıkça bilgi erişim performansı artarken, resim içeren veri tabanlarında bunun tam tersi bir sonuç elde edilmesi dikkat çekicidir. Bu sonuçlar resim arama motorlarının geliştirilmesi gerektiğini göstermektedir.

İleriki Çalışmalar ve Öneriler İleriki çalışmamızda, sorgu sayısı artırılacak, kesme noktaları dörde (5, 10, 15 ve 20) çıkarılacak ve değişik bilgi erişim sistemlerinin performansları arasında anlamlı derecede fark olup olmadığını test etmek için derinlemesine istatistiksel analizler yapılacaktır. Böylece, sorgu sözcük sayısı arttıkça resim arama motorlarının bilgi erişim performanslarının düşmesindeki etkenler daha ayrıntılı olarak incelenebilecektir. Resim arama motorlarının bilgi erişim performansını artırmak için resimleri tanımlamada daha kapsamlı üstverilerin (metadata) ve resim ontolojilerinin kullanılması (image ontologies) ve görüntü tanıma algoritmaları ile makine öğreniminin geliştirilmesi gerekmektedir.

Resim Arama Motorlarının Sorgu Sözcük Sayısına Göre Performans Değerlendirmeleri Performance Evaluation of Image Search Engines Based on the Number of Query Words Erkan Emirzade Yakın Doğu Üniversitesi Bilgisayar Mühendisliği Bölümü, Lefkoşa, KKTC. erkan_emirzade@analiz-systems.com Yıltan Bitirim Doğu Akdeniz Üniversitesi Bilgisayar Mühendisliği Bölümü, Mağusa, KKTC. yiltan.bitirim@emu.edu.tr