SEARCH ENGINE PERFORMANCE EVALUATION A THESIS SUBMITTED TO THE GRADUATE SCHOOL OF APPLIED SCIENCES OF NEAR EAST UNIVERSITY KEZBAN ALPAN



Benzer belgeler
Near East University. Graduate School of Educational Sciences. Department of English Language Teaching

THE ROLE OF GENDER AND LANGUAGE LEARNING STRATEGIES IN LEARNING ENGLISH

daha çok göz önünde bulundurulabilir. Öğrencilerin dile karşı daha olumlu bir tutum geliştirmeleri ve daha homojen gruplar ile dersler yürütülebilir.

A UNIFIED APPROACH IN GPS ACCURACY DETERMINATION STUDIES

THE IMPACT OF AUTONOMOUS LEARNING ON GRADUATE STUDENTS PROFICIENCY LEVEL IN FOREIGN LANGUAGE LEARNING ABSTRACT

THE DESIGN AND USE OF CONTINUOUS GNSS REFERENCE NETWORKS. by Özgür Avcı B.S., Istanbul Technical University, 2003

T.C. SÜLEYMAN DEMİREL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ ISPARTA İLİ KİRAZ İHRACATININ ANALİZİ


Yüz Tanımaya Dayalı Uygulamalar. (Özet)

ANKARA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ DÖNEM PROJESİ TAŞINMAZ DEĞERLEMEDE HEDONİK REGRESYON ÇÖZÜMLEMESİ. Duygu ÖZÇALIK

NEAR EAST UNIVERSITY GRADUATE SCHOOL OF EDUCATIONAL SCIENCES DEPARTMENT OF ENGLISH LANGUAGE TEACHING

DETERMINATION OF VELOCITY FIELD AND STRAIN ACCUMULATION OF DENSIFICATION NETWORK IN MARMARA REGION

Teknoloji Servisleri; (Technology Services)

TÜRKiYE'DEKi ÖZEL SAGLIK VE SPOR MERKEZLERiNDE ÇALIŞAN PERSONELiN

NEAR EAST UNIVERSITY GRADUATE SCHOOL OF SOCIAL SCIENCES APPLIED (CLINICAL) PSYCHOLOGY MASTER PROGRAM MASTER THESIS

İTÜ DERS KATALOG FORMU (COURSE CATALOGUE FORM)

Educational On-line Programmes for Teachers and Students

Grade 8 / SBS PRACTICE TEST Test Number 9 SBS PRACTICE TEST 9

Proceedings/Bildiriler Kitabı I. G G. kurumlardan ve devletten hizmet beklentileri de September /Eylül 2013 Ankara / TURKEY

BASKETBOL OYUNCULARININ DURUMLUK VE SÜREKLİ KAYGI DÜZEYLERİNİN BELİRLENMESİ

Turkish Vessel Monitoring System. Turkish VMS

( ) ARASI KONUSUNU TÜRK TARİHİNDEN ALAN TİYATROLAR

Virtualmin'e Yeni Web Sitesi Host Etmek - Domain Eklemek

ANALYSIS OF THE RELATIONSHIP BETWEEN LIFE SATISFACTION AND VALUE PREFERENCES OF THE INSTRUCTORS

PRELIMINARY REPORT. 19/09/2012 KAHRAMANMARAŞ PAZARCIK EARTHQUAKE (SOUTHEAST TURKEY) Ml=5.1.

MEVLANA DEĞİŞİM PROGRAMI PROTOKOLÜ

T.C. İSTANBUL AYDIN ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ BİREYSEL DEĞERLER İLE GİRİŞİMCİLİK EĞİLİMİ İLİŞKİSİ: İSTANBUL İLİNDE BİR ARAŞTIRMA

YEDİTEPE ÜNİVERSİTESİ MÜHENDİSLİK VE MİMARLIK FAKÜLTESİ

First Stage of an Automated Content-Based Citation Analysis Study: Detection of Citation Sentences

ACCURACY OF GPS PRECISE POINT POSITIONING (PPP)

WEEK 11 CME323 NUMERIC ANALYSIS. Lect. Yasin ORTAKCI.

U.D.E.K. Üniversite Düzeyinde Etkisi. M Hëna e Plotë Bedër Universitesi. ÖZET

KANSER HASTALARINDA ANKSİYETE VE DEPRESYON BELİRTİLERİNİN DEĞERLENDİRİLMESİ UZMANLIK TEZİ. Dr. Levent ŞAHİN

MEVLANA DEĞİŞİM PROGRAMI PROTOKOLÜ

Hukuk ve Hukukçular için İngilizce/ English for Law and Lawyers

Lisansüstü Eğitim, Öğretim ve Araştırma Enstitüsü Institute of Graduate Studies and Research

AN ASSESSMENT OF THE DYNAMIC PROPERTIES OF ADAPAZARI SOILS BY CYCLIC DIRECT SIMPLE SHEAR TESTS

YEDİTEPE ÜNİVERSİTESİ MÜHENDİSLİK VE MİMARLIK FAKÜLTESİ

LİSANSÜSTÜ EĞİTİM, ÖĞRETİM VE ARAŞTIRMA ENSTİTÜSÜ INSTITUTE OF GRADUATE STUDIES AND RESEARCH

Argumentative Essay Nasıl Yazılır?

Immigration Studying. Studying - University. Stating that you want to enroll. Stating that you want to apply for a course.

AKTS Başvurumuz. Bologna Süreci Uzmanlarının Değerlendirmesi

.. ÜNİVERSİTESİ UNIVERSITY ÖĞRENCİ NİHAİ RAPORU STUDENT FINAL REPORT

ALANYA HALK EĞİTİMİ MERKEZİ BAĞIMSIZ YAŞAM İÇİN YENİ YAKLAŞIMLAR ADLI GRUNDTVIG PROJEMİZ İN DÖNEM SONU BİLGİLENDİRME TOPLANTISI

BAYAN DİN GÖREVLİSİNİN İMAJI VE MESLEĞİNİ TEMSİL GÜCÜ -Çorum Örneği-

TEST OF THE CAPITAL ASSET PRICING MODEL INTURKEY

IDENTITY MANAGEMENT FOR EXTERNAL USERS

İTÜ DERS KATALOG FORMU (COURSE CATALOGUE FORM)

TOBB ETÜ Co-Op with Erasmus Placement Program

THE EUROPEAN NEIGHBOURHOOD POLICY: AN EFFECTIVE FOREIGN POLICY TOOL FOR THE EUROPEAN UNION?

Sınavında sık yapılan temel hatalar:

Dersin Kodu Dersin Adı Dersin Türü Yıl Yarıyıl AKTS MAKİNA PROJESİ II Zorunlu 4 7 4

CmpE 320 Spring 2008 Project #2 Evaluation Criteria

Mekatronik Mühendisliği Yüksek Lisans Programı İlkeleri

DETERMINING THE CURRENT AND FUTURE OPINIONS OF THE STUDENTS IN SECONDARY EDUCATION ON NANOBIOTECHNOLOGY *

Anlatım, Tartışma, Soru-Yanıt, Literatür İncelemesi, Beyin Fırtınası

Unlike analytical solutions, numerical methods have an error range. In addition to this

T.C. Hitit Üniversitesi. Sosyal Bilimler Enstitüsü. İşletme Anabilim Dalı

İNGİLİZCE GRAMER SIMPLE PAST TENSE TO BE (OLMAK FİİLİNİN GEÇMİŞ ZAMANI) GRAMER ANLATIMI ALIŞTIRMA. SIMPLE PAST (to be)

KKTC YAKIN DOĞU ÜNİVERSİTESİ SAĞLIK BİLİMLERİ ENSTİTÜSÜ

ENG ACADEMIC YEAR SPRING SEMESTER FRESHMAN PROGRAM EXEMPTION EXAM

MEVLANA DEĞİŞİM PROGRAMI PROTOKOLÜ

Lisansüstü Eğitim, Öğretim ve Araştırma Enstitüsü Institute of Graduate Studies and Research

ABSTRACT $WWLWXGHV 7RZDUGV )DPLO\ 3ODQQLQJ RI :RPHQ $QG $IIHFWLQJ )DFWRUV

HEARTS PROJESİ YAYGINLAŞTIRMA RAPORU

IEEE Online Mühendislikte Günümüz Araştırmacılarının Temel Bilgi Kaynağı. UASL Eğitim Programı. 10 Mayıs, 2006

Inventory of LCPs in Turkey LCP Database explained and explored

ÖZET Amaç: Yöntem: Bulgular: Sonuçlar: Anahtar Kelimeler: ABSTRACT Rational Drug Usage Behavior of University Students Objective: Method: Results:

Özgeçmiş (CV/Resume) Hazırlanması

BİLİŞİM TEKNOLOJİLERİ ALANI THE INFORMATION TECHNOLOGIES DEPARTMENT

Özgeçmiş (CV/Resume) Hazırlanması

Lisansüstü Eğitim, Öğretim ve Araştırma Enstitüsü Institute of Graduate Studies and Research

Yaz okulunda (2014 3) açılacak olan (Calculus of Fun. of Sev. Var.) dersine kayıtlar aşağıdaki kurallara göre yapılacaktır:

TEŞEKKÜR. Her zaman içtenliğiyle çalışmama ışık tutan ve desteğini esirgemeyen sevgili arkadaşım Sedat Yüce ye çok teşekkür ederim.

MEVLANA DEĞİŞİM PROGRAMI PROTOKOLÜ

MEVLANA DEĞİŞİM PROGRAMI PROTOKOLÜ

All documents should be presented with an official English or Turkish translation (if the original language is not English or Turkish).

Determinants of Education-Job Mismatch among University Graduates

HAZIRLAYANLAR: K. ALBAYRAK, E. CİĞEROĞLU, M. İ. GÖKLER

Lisansüstü Eğitim, Öğretim ve Araştırma Enstitüsü Institute of Graduate Studies and Research

ÖD: Öğrenci Değişimi SE: Student Exchange

2015/2016 ERASMUS+ APPLICATION RESULTS 2015/2016 ERASMUS+ BAŞVURU SONUÇLARI

TOEFL ibt LISTENING STRATEGIES & PRACTICE DR. HİKMET ŞAHİNER

The University of Jordan. Accreditation & Quality Assurance Center. COURSE Syllabus

by Karin Şeşetyan BS. In C.E., Boğaziçi University, 1994

B a n. Quarterly Statistics by Banks, Employees and Branches in Banking System. Report Code: DE13 July 2018

MEVLANA DEĞİŞİM PROGRAMI PROTOKOLÜ

DOKUZ EYLUL UNIVERSITY FACULTY OF ENGINEERING OFFICE OF THE DEAN COURSE / MODULE / BLOCK DETAILS ACADEMIC YEAR / SEMESTER. Course Code: MMM 4027

DOKUZ EYLUL UNIVERSITY FACULTY OF ENGINEERING OFFICE OF THE DEAN COURSE / MODULE / BLOCK DETAILS ACADEMIC YEAR / SEMESTER. Course Code: END 3933

Implementing Benchmarking in School Improvement

DEĞERLENDİRME SİSTEMİ

HACETTEPE ÜNivERSiTESi SPOR BiLiMLERi VE TEKNOLOJiSi YÜKSEK OKULU'NA GiRişTE YAPILAN

KUZEY KIBRIS TÜRK CUMHURİYETİ NDE İŞ SAĞLIĞI VE GÜVENLİĞİ İLE İLGİLİ DURUM TESPİTİ

Dersin Türü (Course Type) Zorunlu (Compulsory)[Χ] Seçmeli (Elective) [ ]

KIRGIZ CUMHURİYETİ JEOLOJİ VE MADENCİLİK DEVLET AJANSI NIN ALMALYK LİNYİT KÖMÜR HAVZALARINA İŞLETME LİSANSININ VERİLMESİ İHALESİ HK BİLGİ NOTU

KAMU PERSONELÝ SEÇME SINAVI PUANLARI ÝLE LÝSANS DÝPLOMA NOTU ARASINDAKÝ ÝLÝÞKÝLERÝN ÇEÞÝTLÝ DEÐÝÞKENLERE GÖRE ÝNCELENMESÝ *

ÖRNEKTİR - SAMPLE. RCSummer Ön Kayıt Formu Örneği - Sample Pre-Registration Form

BAŞVURU ŞİFRE EDİNME EKRANI/APPLICATION PASSWORD ACQUISITION SCREEN

TEZSİZ YÜKSEK LİSANS PROJE ONAY FORMU

Transkript:

(Sırt) K.ALPAN NEU, 2010 SEARCH ENGINE PERFORMANCE EVALUATION A THESIS SUBMITTED TO THE GRADUATE SCHOOL OF APPLIED SCIENCES OF NEAR EAST UNIVERSITY by KEZBAN ALPAN IN PARTIAL FULFILLMENT OF THE REQUIREMENTS FOR THE DEGREE OF MASTER OF SCIENCE IN COMPUTER INFORMATION SYSTEMS NICOSIA 2010

SEARCH ENGINE PERFORMANCE EVALUATION A THESIS SUBMITTED TO THE GRADUATE SCHOOL OF APPLIED SCIENCES OF NEAR EAST UNIVERSITY by KEZBAN ALPAN In Partial Fulfillment of the Requirements for the Degree of Master of Science in Computer Information Systems NICOSIA 2010

I hereby declare that all information in this document has been obtained and presented in accordance with academic rules and ethical conduct. I also declare that, as required by these rules and conduct, I have fully cited and referenced all material and results that are not original to this work. Name, Last name: Kezban Alpan Signature: Date:

ABSTRACT The value, price and importance of information is increasing day by day in the information age that we are living in with internet becoming the major information resource for people. Because internet has become such a phenomenon, the number of documents has also increased rapidly. This situation makes finding information on the internet without the use of a web search engine impossible. Today, search engines are profitable sectors and engine owners are in great competition with each other to be the most popular. There are many web search engines which work with complex algorithms; however, the main topic of concern is which search engine can bring the greatest solution in the shortest time period. It is from this aspect that this study focused on the evaluation of 5 popular search engines. Additionally, the study includes research on search engine preferences of university students. Performance evaluation tests have been conducted in two different aspects. For the first aspects, 10 queries have been prepared related to favourite search queries of 2009, and another 10 questions have been prepared in relation to information technology and information systems for the second aspect. This query was searched through the use of selected search engines and the first 5 pages which cover 50 answers have been checked. Results have been categorized as relevant, irrelevant and broken link. At the end of the research, precision and currency values has been calculated according to sums and averages. In relation to search engine preferences of university students, a questionnaire was prepared and applied on 300 hundred students who were selected randomly from 15 different faculties. At the end of the research, results indicated that Google is the most widely used search engine by students, but results of performance evaluation test indicate Bing as the best search engine which gives the highest precision and lowest currency. The results of this study add empirical data to the relevant field and are expected to help computer science students, experts, instructors, and everyone else who wants to reach information via the internet. Keywords: Search engine performance evaluation, Google, Yahoo, Bing, search engines, information retrieval systems

ÖZ Yaşamakta olduğumuz bilgi çağında bilginin değeri, fiyatı ve önemi gün geçtikçe artarken, internet de insanların başlıca bilgi kaynağı haline gelmiştir. İnternetin fenomen haline gelmesi barındırdığı döküman sayısının her geçen gün daha hızlı bir şekilde artmasına neden olmaktadır. Bu durum internet üzerinden bilgi arayışını arama motorları olmadan imkansız hale getirmektedir. İnternetin olmazsa olmazı arama motorları başlıca bir sektör ve ticari kazanç kaynağı halini alırken, arama motoru sahibi kuruluşlar da kendilerini geliştirmek ve internette popüler olmak adına amansız bir rekabet içine girmiş bulunmaktadırlar. Esas sorun hangi arama motorunun en doğru bilgi veya bilgileri en kısa süre içerisinde sağlayabileceğidir. Bu noktadan hareketle çalışma sektördeki en popüler beş arama motorunun performans değerlendirmesini içermektedir. Ayrıca üniversite öğrencilerinin hangi arama motorunu tercih ettiklerini ve tercih nedenlerini belirlemek amacını güden bir araştırma da bu çalışmada yer almıştır. Arama motorları performans değerlendirme testi iki farklı yönde yapılmıştır. İlk test için 2009 un en çok aranan terimleri yazar tarafından derlenerek on adet farklı sorgu cümlesi oluşturulmuş ve bu sorgu cümleleri tek tek arama motorlarında aranmıştır. İkinci test içinse Bilgi Teknolojisi ve Bilgi Sistemleri hakkında belirlenen on sorgu cümlesi ile arama motorları teste tabi tutulmuştur. Veri elde etmek için her bir arama sonucundan ilk beş sayfa yani ilk 50 link baz alınmış ve çağrılan sonuçlar ilgili, ilgisiz veya kırık link olarak sınıflandırılmıştır. Öğrenciler arasında yapılacak olan çalışma için veri toplamak amacı ile anket oluşturulmuş ve bu anket 15 faklı fakülteden rastgele seçilen toplam 300 öğrenci üzerinde uygulanmıştır. Performans değerlendirme testi verileri toplam ve avaraj olarak değerlendirerek arama motorlarının duyarlılık ve yenilik oranları hesaplanarak en iyi performansı gösteren arama motoru belirlenmiştir. Öğrenciler üzerinde yapılan anket çalışması ise SPSS programı ile değerlendirilerek, öğrencilerin arama motoru kullanım frekansları ve nedenleri belirlenmiştir. Elde edilen bulgulara göre öğrencilerin büyük çoğunluğu arama motoru olarak Google kullanmaktadır fakat performans değerlendirme testi sonuçları Google ı üçüncü sıraya iterken en iyi performans gösteren aramam motoru olarak Bing i belirlemiştir.yapılan çalışmanın bilgisayar bilimleri öğrencilerine, eğitmenlerine, uzamanlarına ve internet üzerinden bilgi edinme ihtiyacı olan kişi veya kişilere yardımcı olması umulmaktadır. Anahtar Kelimeler: Arama motoru performans değerlendirme, Google, Yahoo, Bing, arama motorları, Bilgi erişim sistemleri

To my parents

ACKNOWLEDGEMENTS I would like to thank to our Dean Prof.Dr. Aykut POLATOĞLU and Vice Dean and chairperson of Business Administration Department Assist.Prof.Dr. Şerife EYÜPOĞLU for their support and invaluable help through this thesis. I would like to thank to chairperson of Computer Information Systems Department Assist.Prof.Dr. Yalçın AKÇALI for his substantial support and help. I would like to sincerely thank to my advisor Assist.Prof.Dr.Nadire ÇAVUŞ for her great support and encouragement. Also I would like to thank to Assist.Prof.Dr. Mustafa MENEKAY. More than being a teacher, he is the one who supported me during my master degree education and made me to walk through my dreams. I would like to especially thank to my parents and my brother for their endless support during all my life. Also I would like to thank to someone special who was always beside me with his great support. Finally I would like to thank my entire student friend who applied to research for this thesis.

TABLE OF CONTENTS PLAGIARISM... vi ABSTRACT... vii ÖZ... viii DEDICATION... ix ACKNOWLEDGMENTS... x TABLE OF CONTENTS... xi LIST OF TABLES... xv LIST OF FIGURES... xvi LIST OF ABBREVIATIONS... xvii CHAPTER I 1. INTRODUCTION... 1 1.1 The problem... 3 1.2 The purpose of the study... 5 1.3 The significance of the study... 6 1.4 Limitations of the study... 6 1.5 Structure of the study... 7 1.6 Summary... 7 CHAPTER II 2. REVIEW OF LITERATURE... 8 2.1 Summary... 12 CHAPTER III 3. CONCEPTUAL FRAMEWORK... 13 3.1 Information retrieval systems... 13 3.1.1 Database... 15 3.1.2 Terms... 15

3.1.3 Documents... 16 3.1.4 Queries... 18 3.1.5 User interface... 19 3.1.6 Retrieval rules... 19 3.2 Search engines technology... 23 3.2.1 Architecture... 24 3.2.1 Indexing... 25 3.2.3 Presentation of documents... 26 3.2.4 Efficiency... 27 3.2.5 Ranking and retrieval function... 28 3.3 Evaluated search engines... 30 3.3.1 Google... 30 3.3.2 Yahoo!... 30 3.3.3 Bing... 31 3.3.4 Ask... 31 3.3.5 AOLSearch... 32 3.3 Summary... 32 CHAPTER IV 4. METHODOLOGY... 33 4.1 Research model... 33 4.2 Students... 33 4.3 Data collection... 35 4.4 Data analysis... 36 4.5 Duration and resources... 37 4.6 Application... 37 4.7 Summary... 39 CHAPTER V 5. RESULTS... 40 5.1 SE usage of students... 40 5.2 Differences between SEs... 42 5.3 Students criterions for SE prefers... 43 5.4 Students opinions about SEs... 44

5.5 Other prefers of students request for SEs... 45 5.6 Findings and interpretations of search engine performance evaluation test... 47 5.6.1 Precision and currency ratios for top search queries of 2009... 48 5.6.2 Precision and currency ratios for IT and IS queries... 50 5.6.3 Precision and currency ratios for general test results... 51 5.8 Summary... 54 CHAPTER VI 6. CONCLUSION, DISCUSSIONS AND RECOMMENDATIONS... 55 6.1 Conclusion and discussions... 55 6.2 Recommendations... 57 REFERENCES... 58 APPENDICES A. Performance test results for favourite queries of 2009... 68 B. Performance test results for IT and IS queries... 69

LIST OF TABLES Table 3.1: Summary of retrieval rules... 20 Table 3.2: Presentation of search results... 27 Table 4.1: Faculty and department details of students... 34 Table 4.2: Time schedule... 37 Table 5.1: SE usage frequencies of students... 40 Table 5.2: One-sample t-test for SE usage frequencies among students... 42 Table 5.3: Precision ratios for top search queries of 2009... 48 Table 5.4: Dead link ratios for top search queries of 2009... 49 Table 5.5: Precision ratios for IT and IS queries... 50 Table 5.6: Dead link ratios for IT and IS queries... 51 Table 5.7: General results for precision ratios... 52 Table 5.8: General results for currency ratios... 53

LIST OF FIGURES Figure 3.1: Traditional IR system... 14 Figure 3.2: Vector space IR system mode... 21 Figure 3.3: High level architecture of a standard web crawler... 25 Figure 5.1: Favorite SEs of students in numbers... 41 Figure 5.2: Important criterions for SE prefering... 43 Figure 5.3: General opinions for SEs... 44 Figure 5.4: User s request for homepage... 45 Figure 5.5: General information or quatation prefers of users... 46 Figure 5.6: Percentage for users when leave search... 47

LIST OF ABBREVIATIONS AOL ARPANET DARPA e-commerce e-mail FTP IR IS IT KWIC NEU SD SE SEO TRNC URL Veronica web WWW American Online Advanced Research Project Agency Network Defense Advanced Research Project Agency Electronic commerce Electronic mail File transfer protocol Information retrieval Information systems Information technology Key-Word-In-Context Near East University Standard deviation Search engine Search engine optimization Turkish Republic of Northern Cyprus Uniform resource loctor Very Easy Oriented Net-Wide Index to Computerized Archives World Wide Web World Wide Web