Anahtar Kelimeler:text mining, machine learning, data mining, data science

Benzer belgeler
Çok fazla bilgiden gizli kalmış örüntüleri ortaya çıkarma sürecine Veri Madenciliği denir.

Müşteri Memnuniyeti Ölçümü ve Gizli Müşteri Dünyasında Yeni Neler Var?

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

Data Science Boot Camp

Makine Öğrenmesi İle Duygu Analizinde Veri Seti Performansı

Yönetim Bilişim Sistemleri (Karma) - 1. yarıyıl Hukukun Temelleri Fundamentals of Law TR

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

VERİ MADENCİLİĞİNİN GÖREVLERİ

AKILLI TATIL PLANLAMA SISTEMI

T.C. ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ EĞİTİM ÖĞRETİM YILI DERS KATALOĞU

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

Web Madenciliği (Web Mining)

YÖNETİM BİLİŞİM SİSTEMLERİ BÖLÜMÜ YENİ DERS MÜFREDATI (1) FAKÜLTESİ: İŞLETME FAKÜLTESİ / BUSINESS SCHOOL

Veri Madenciliği Yöntemleri ile Twitter Üzerinden Girişimcilik Analizi

YBS Ansiklopedi. Müşteri Memnuniyetinin İncelenmesi(Investigation of Customer Satisfaction) Tuğçe AKIN. 1. Giriş

Hipotez Kurma. Prof. Dr. Cemal YÜKSELEN Ġstanbul Arel Üniversitesi. 4. Pazarlama Araştırmaları Eğitim Semineri Ekim 2010

İstatistik Dersi Çalışma Soruları Arasınav(Matematik Müh. Bölümü-2014)

Metin Madenciliği Yöntemleri ile Twitter Duygu Analizi (Twitter Sentiment Analysis using Text Mining Methods)

Web Server Sunucu Loglarının K-Komşu Algoritması ile İ ncelenmesi

Veri Madenciliği Yaklaşımı ile Mesleki Yönlendirme Sistemi

Web Madenciliği (Web Mining)

Bu Çalışma. Tarafından Hazırlanmıştır

Hatırlatma: Özet Gönderimleri için Son Haftalar

BSM 532 KABLOSUZ AĞLARIN MODELLEMESİ VE ANALİZİ OPNET MODELER

Yazılım Mühendisliği 1

4- Turbo Pascal Bilgisayar Programlamada Kullanılan Şart Yapıları

Web Madenciliği (Web Mining)

POWER BI. Power BI Bileşenleri: Power BI'daki İş Akışı

4. Bölüm Programlamaya Giriş

Büyük, Dağıtık, Veri Yoğunluklu Uygulamalarda Programlama Paradigmaları

AST416 Astronomide Sayısal Çözümleme - II. 6. Monte Carlo

Konular. VERİ MADENCİLİĞİ Giriş. Problem Tanımı. Veri Madenciliği: Tarihçe. Veri Madenciliği Nedir? Bilgi Keşfi

İngilizce Öğretmen Adaylarının Öğretmenlik Mesleğine İlişkin Tutumları 1. İngilizce Öğretmen Adaylarının Öğretmenlik Mesleğine İlişkin Tutumları

Veri ve Metin Madenciliği

Veri ve Metin Madenciliği. Zehra

Üniversiteyi Kazanan Öğrencilerin Temel Bilgi Teknolojilerini Kullanabilme Düzeylerinin Bölgesel Analizi

DERS SEÇİM KILAVUZU. Sınıf Dönemi Kodu Adı Sınıf Dönemi Kodu Adı. Nesne Yönelimli Programlama. Yazılım Tasarımı ve Mimarisi

Balon & Banka Teslim tarihi: 17 Kasım 2008

Satış, pazarlama, iletişim ve müşteri deneyimleriniz için yaratıcı çözümler sunmaktayız.

VERİ MADENCİLİĞİ (Web Madenciliği)

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, Nisan 2009, ODTÜ, Ankara

Misyonumuz. Vizyonumuz

TEMEL BİLGİSAYAR BİLİMLERİ. Programcılık, problem çözme ve algoritma oluşturma

ODTÜ KÜTÜPHANESİ YENİ WEB SAYFASININ TASARIMI VE KULLANILABİLİRLİK ÇALIŞMASI

Öğretim planındaki AKTS Ulusal Kredi

daha çok göz önünde bulundurulabilir. Öğrencilerin dile karşı daha olumlu bir tutum geliştirmeleri ve daha homojen gruplar ile dersler yürütülebilir.

İstanbul Otellerinin 360 Derece Değerlendirmesi

KABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN

Metin Madenciliğinde Yazar Tanıma (Author Recognition in Text Mining)

VERI TABANLARıNDA BILGI KEŞFI

4.Sınıf Okulistik Sınavı Konu-Kazanım Tablosu

SİSTEM VE YAZILIM. o Bilgisayar sistemleri donanım, yazılım ve bunları işletmek üzere gerekli işlemlerden oluşur.

Örnek 02: Amaç: Şekil Wizard yardımıyla yeni proje açılması.

GÜZ YY. - MKT103 - GÖRSEL PROGRAMLAMA DERSİ - ARA SINAVI

YAZILIM MODELLEME VE TASARIM

Endüstri Mühendisliği - 1. yarıyıl. Academic and Social Orientation Fizik I Physics I TR

Metin Sınıflandırma. Akış

Önsöz. İçindekiler Algoritma Algoritma Nasıl Hazırlanır? Yazılımda Algoritma Mantığı Nedir? 1.2. Algoritma Örnekleri ve Sorular

BİLGİSAYAR MÜHENDİSLİĞİ DOKTORA DERS PROGRAMI (Lisanstan gelenler için)

Sosyal Web te Yeni Eğilimler: Kurumlar İçin Dışa Dönük Sosyal Yazılımlar

NESNEYE YÖNELİK PROGRAMLAMA Unified Modelling Language (UML) Bütünleşik Modelleme Dili

BİLGİSAYAR VE ENFORMASYON BİLİMLERİ YÜKSEK LİSANS DERS PROGRAMI (Tezli Program)

YAPAY ZEKA (Artificial Intelligence)

InnGenius. InnGenius Ana Ekran...2. Rezervasyon İşlemleri...4. Grup Rezervasyon İşlemleri...8. Housekeeping...10

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 1 ( yılı ve sonrasında birinci

BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ 2013/2014 BAHAR DÖNEMİ BÜTÜNLEME SINAV TAKVİMİ Lisansüstü Bilgisayar Müh. Bölümü

BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ 2013/2014 BAHAR DÖNEMİ BÜTÜNLEME SINAV TAKVİMİ Lisansüstü Bilgisayar Müh. Bölümü

Google ile Yeniden Pazarlama.

Sözlük Kullanarak Türkçe için Kavram Madenciliği Metotları Geliştirme

2. Klasik Kümeler-Bulanık Kümeler

VERİ KAYNAKLARI. Bilgi sisteminin öğelerinden biride veri

ODTÜ Kütüphanesi Yeni Web Sayfasının Tasarımı ve Kullanılabilirlik Çalışması

WEB USABILITY. Ruşen Yürek. Web Kullanılabilirliği ; İçerik Hakkında. Kullanıcı Merkezli Tasarım(UCD) FreeDownloadPowerPoint.

BLM 4811 MESLEKİ TERMİNOLOJİ II Salı , D-109 Dr. Göksel Biricik

1.1 Metodolojiyi Gerçeklemek Üzere Geliştirilen Altyapı

Yapay Sinir Ağları ile Web İçeriklerini Sınıflandırma. Yazarlar: Esra Nergis Güven, Hakan Onur ve Şeref Sağıroğlu. Sunan : Esra Nergis Güven

Zeki Gülen Marmara Üniversitesi Sosyal Bilimler Enstitüsü, Gazetecilik Ana Bilim Dalı, Bilişim

Büyük Veri ve Endüstri Mühendisliği

SPSS (Statistical Package for Social Sciences)

İŞLETMELERDE KURUMSAL İMAJ VE OLUŞUMUNDAKİ ANA ETKENLER

IIZ1104 İŞLETME Zorunlu

BÜYÜK VERI UYGULAMALARı DERS 7. Doç. Dr. Yuriy Mishchenko

Yard. Doç. Dr. İrfan DELİ. Matematik

Doç.Dr. ABDULLAH TANRISEVDİ

Tüketici Davranışları

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN

Compendex Üzerinde Temel Arama

ÖZGEÇMİŞ. Derece Alan Üniversite Yıl

Bölüm 2 Varlık-İlişki Veri Modeli: Araçlar ve Teknikler. Fundamentals, Design, and Implementation, 9/e

Türkçe Dokümanlar Ġçin Yazar Tanıma

İşletme Sonuçları Elde Etmek için Daha İyi Bir Çağrı Merkezi Deneyimi Sunma

Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği Bölümü. 13 Kasım 2010

Deniz Turizminde E-Ticaret ve Sosyal Medya Pazarlamaları. Barış Bozkurt

Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan. blog.mustafabaydogan.

Veri Madenciliği Yöntemleriyle İGDAŞ Çağrı Merkezi Veri Analizi VE Kalite Fonksiyon Yayılımı Yöntemiyle Süreç İyileştirme Çalışması

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 2 ( yılı öncesinde birinci

ÖZGEÇMİŞ. Çiçek, A., Hastanelerde Verimlilik, Erciyes Üniversitesi, Sosyal Bilimler Enstitüsü, 1995.

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

Yazılım Mühendisliği Bölüm - 3 Planlama. Cengiz GÖK

Büyük Veri de Türkiye den Uygulama Örnekleri Dr. Güven Fidan

Transkript:

YBS Ansiklopedi www.ybsansiklopedi.com Cilt 5, Sayı 2, Temmuz 2018 Otel İncelemesi (Hotel Review) Didem ŞENUSTA 1 1. Yaşar Üniversitesi, Bilgisayar Mühendisliği Bölümü Özet Sürekli gelişen teknoloji ve internetin ortaklaşa dünyasında sosyal ağlar, seyahat bilgilerini paylaşmak için en popüler platform haline gelmiştir. Tripadvisor, booking gibi otel rezervasyonu web siteleri, müşterinin karar verme sürecine yardımcı olmak için otel yorumlarını ve puanlamaları kullanır. Bu makale de otel hakkında yapılan yorumlar ve puanlamalar incelenmiştir. Ayrıca metin madenciliği (text mining) kullanılarak, olumlu ve olumsuz kelimeler ayrıştırılıp bu kelimelerin temelini incelemeyi amaçlamaktadır. Bir metin madenciliği yaklaşımı takip edilerek, 2 kategoriye ayrılmış müşteriler tarafından yapılan yorumlar karşılaştırılacak ve buna bağlı olarak her otelin puan ortalamaları alınacaktır. Duygu analizi yöntemiyle, text madenciliğinde ayrıştırılmış kelimeler kullanılarak negatif ve pozitif yorumlar ayrılacak ve diğer işlemlerle birlikte tüketiciye en uygun otel sunulacaktır. 1.000 otel misafirinin online yorumları Amerika nın farklı şehirleri için kaggle.com dan toplanmıştır. Anahtar Kelimeler:text mining, machine learning, data mining, data science Abstract Social networks have become the most popular platform for sharing travel information in the world of everevolving technology and the Internet. Tripadvisor uses hotel booking websites such as booking websites, hotel reviews and ratings to help the client's decision-making process. In this article, reviews and ratings about the hotel are examined. In addition, by using text mining, positive and negative words are searched and the basis of these words is examined. By following a text mining approach, comments made by 2 categorized customers will be compared and the average score of each hotel will be taken accordingly. By means of emotion analysis, negative and positive interpretations will be made using the separated words in text mining and the most suitable hotel will be presented with the other operations. Online comments of 1,000 hotel guests are collected from Kaggle.com for different cities in the United States. Keywords:text mining, machine learning, data mining, data science, hotel review 1. Giriş Günümüzde teknolojinin ilerlemesiyle birlikte içeriğinden anlamlı sonuçlar çıkarmak ve gerektiğinde kullanmak üzere pek çok veri toplanmaktadır. Bu verileri şekiller, grafikler, metinler gibi malzemeler oluşturmaktadır ve bilgisayarlarla elektronik ortamlara taşınmış bulunmaktadır.

2 Elektronik ortamlara taşınmış dijital verilerin hacmindeki artış beraberinde yeni sorun alanları da yaratmıştır. Bunların başlıcaları; karmaşık verileri, yeni tür verileri, dağılmış verileri işlemek ve yeni yöntem geliştirmek; verilerin kullanımı ve güvenliğiyle ilgili modeller geliştirmek olarak sıralanabilir. Teknolojinin her geçen gün artan bir ivmeyle ilerlemesiyle birlikte, bu verilerin depolanması, işlenmesi, kullanıcının ihtiyaçlarını karşılıyor olması ve sorunsuz bir şekilde çalışması beklenmektedir. Bilimsel yöntemlerle mevcut durum analizi yaparak sistemlerin güçlü-zayıf, olumlu-olumsuz, negatif-pozitif yönlerinin belirlenmesi toplanan veriler sayesinde sağlanabilmektedir. Böylelikle elde edilen veriler sayesinde sistemin durumu incelenebilir, iyileştirilmesi veya güncellenmesi gereken kısımlar netleştirilebilir. Büyük veri denilince akla ilk olarak Veri Madenciliği gelmektedir. Veri Madenciliği, büyük verilerden örüntü ve ilişki keşfederek, istenilen işe yardımcı olacak anlamlı ve yararlı bağlantı ve kuralların bilgisayar programlarının aracılığıyla aranması ve analizidir. [1] Veri madenciliğinin yoğun şekilde kullanıldığı alanlardan biriside turizm sektörü olmuştur. Günümüzde seyahat planlama ve rezervasyon en önemli ticari kullanımlarından biri haline gelmiştir. Bir seyahatin planlanmasında seyahat deneyimleriyle ilgili yorum, rapor ve verilen puanlamalar bilgi kaynağı olarak artan bir rol oynamaktadır. Bu aşamada bilgi türü ile ilgili bir sorun ortaya çıkmaktadır. Çevrimiçi otel rezervasyonları için kullanılan web sitelerinde müşterinin bir otel hakkında bilgi edinebilmesi için yorumlar ve puanlamalar büyük önem taşımaktadır. Fakat bu yorumlar pozitif veya negatif olarak ayrıştırılmış, puanlamalar ise ortalaması alınmış halde müşteriye sunulmamaktadır. Bu çalışmada, bu eksikliğin giderilmesi için kullanıcıların yorumları üzerinde metin madenciliği (text mining) ve duygu analizi (sentimental analysis) yöntemleri ile otellere verdikleri puanların ortalamalarına bakılarak oteller arasında kıyaslama yapılması ve tüketiciye en uygun oteli pazarlama amacı güdülmüştür. 2. Veri, metin madenciliği ve duygu analizi Veri madenciliği çok geniş bir kavramdır ve içinde birden fazla metotları barındırmaktadır. Veri madenciliği, veriler arasındaki ilişkiyi ortaya çıkarırken birçok dalı birlikte kullanır ve daha çok görsel olarak bir programlama ara yüzü üzerinden yapılan bir süreçtir. [2] İstatiksel, matematiksel algoritmalar gibi algoritmalar veri madenciliği algoritmaları içindedir. Veri madenciliği yapısal bir veriyi analiz edebilirken, metin madenciliği veri madenciliğinde kullanılmak üzere verileri yapısal hale dönüştürmektedir. Tek bir veri madenciliği modeli yoktur, birbirleriyle bağlantı halinde olan modellemelerin birleşimi vardır. Şekil 1 de gösterildiği gibi veri madenciliği ve kullanım alanları birbirleri ile bağlantılıdır. [3]

3 Şekil 1. Veri madenciliği ilgili alanları 2.1. Metin Madenciliği Veriler farklı şekillerde bulunabilir. Bunların kullanılmasında da farklı metotlar uygulanabilir. Bir verideki anlam ortaya çıkarılmak isteniyorsa metin madenciliği yöntemi uygulanmaktadır. Metin madenciliği, metinlerin sınıflandırılması ve konu çıkarılması, sınıf taneciklerinin üretilmesi, duygusal analiz, metin özetleme, varlık-ilişki modellemesi gibi çalışmaları hedefler. [4] Natural Language Processing (NLP) yani dilbilimsel yollar olarak ifade edilen terim aslında metin madenciliğinin temelidir. NLP ile bir metin içerisinden istenilen ifade, koşullara uygun çıkarılabilmekte, metin içerisindeki terimler sınıflandırılıp, bir sınıfa atanmaktadır. Metin ve veri madenciliği arasındaki ilişki Şekil 2 de tanımlanmıştır; Şekil 2. Süreçler arasındaki ilişki

4 Metin madenciliği uygulamaları iki ana sınıfta incelenebilir: Metnin anlaşılması/özetlenmesi: İşlenecek metinden uygulanabilir ve anlamlı bilginin çıkarılmasıdır. Böylelikle metnin ifade etmek istediği anahtar içerik anlaşılabilecektir. Metin ile modelleme: Anahtar içerik anlaşıldıktan sonra elde edilen içerik ile diğer bilgiler kullanılarak bir modelleme oluşturulur. 2.2. Duygu Analizi Duygu analizi metodu da bir metin işleme işlemi olup verilen metinin duygusal olarak ifade etmek istediği sınıfı belirlemeyi amaçlar. Duygu analizinin ilk çalışmaları olumlu (positive), olumsuz (negative) ve nötr olarak sınıflandırılmıştır ve bu duygusal kutupsallık (sentimental polarity) olarak geçmektedir. [5] Metinlerdeki ruh hali, kanaat ve daha karmaşık duyguların çıkarılması üzerinde de çalışılmaktadır. Şekil 3'de bir duygu analizi yönteminin bir ürün üzerindeki basamakları sınıflandırılmıştır. Şekil 3. Ürün yorumlarındaki DA süreci 3. Veriler Bu çalışmada, kaggle.com üzerinden 1,000 farklı otelin veri kümesi alınmıştır. Bu veri kümeleri otel konumu, ad, derecelendirme, yorumlar, kullanıcı adı gibi ögeler içeren 20 farklı kolondan oluşmaktadır. Bu veriler ile otel değerlendirmelerinin karşılaştırılması ve duygu puanlaması yapılabilmektedir. Veri setinde, otel hakkında yapılan yorumlardaki anahtar kelimeler metin madenciliği yöntemi kullanılarak derecelendirilmeyle ilişki kurulmasına olanak sağlamaktadır. Knime üzerinde farklı şehirlerdeki oteller hakkında yapılan yorumlamalar alınmış, duygu analizine yardımcı olacak şekilde olumlu ve olumsuz kelimeler çıkartılmıştır. Metin madenciliği yönteminden faydanılarak, veriler eğitim ve test olarak ikiye bölünmüş ve makine öğrenmesi algoritması olan sınıflandırma yöntemleri denenerek istatiksel veriler tablolaştırılmıştır. Veriler Şekil 4 te gösterilmiştir.

5 Şekil 4. Veriler 4. Kullanılan Programlar 5.1 Knime Çalışmada, veri bilimi aşamaları için Knime kullanılmıştır. Knime, veri analizi (ETL) ve modelleme için temel veri ön işleme düğümlerinin kod yazılmadan görselleştirme ara yüzü olarak kullanılmasını sağlayan bir programdır. Projede CRISP-DM metodolojisi kullanılarak ilerleme kaydedilmiştir. Otel puanlamalarının ortalaması alınmış, yorumlar üzerinde metin madenciliği uygulanarak yorumlar kelimelere bölünmüş v en son potizif ve negatif olarak kategorilendirilerek ortalama ile birleştirilmiştir. Bu çalışmanın veri toplama aşamasındaki Knime görseli şekil 5 teki gibidir. Şekil 5. Knime modellemesi

6 5.2 Analiz ve Karşılaştırma Knime de yer alan istatiksel veriler bu çalışma kapsamında kullanılmıştır. Kolonlara ait kullanım sıklığı, unutulan değerlerin kontrolü, integer değere sahip olan kolonların standart sapmaları ve ortalamaları projenin ilerlemesi açısından büyük önem taşımaktadır. Bu verilerin yardımıyla hangi kolonlar üzerinde çalışılması gerektiği kararlaştırılmıştır. Şekil 6 da kategorilendirilmiş istatistikler mevcuttur.

7

8 Şekil 6. Kategorilendirilmiş istatistikler

9 5.3 Python Python, nesne yönelimli, yorumlamalı, birimsel ve etkileşimli yüksek seviyeli bir programlama dilidir. Knime üzerinden modellemesi yapılan projenin her bir adımı Python da kodlanmıştır. Pandas, numpy ve matplotlib kütüphaneleri kurularak kodlanmaya başlanmıştır. Ardından hangi kolon kullanılacaksa kolon filtreleme kodu yazılmış ve ardından yorumlar ele alınmış ve küçük-büyük harf, varsa Türkçe karakterler silinmiştir. Kelimeler olumlu-olumsuz ayrıştırılmıştır. Sınıflandırma yapmak için eğitim ve test olarak 2 ye ayrılmıştır. Birkaç sınıflandırma yöntemi (Logistic Regression, Decision Tree) denenerek en iyi sonuç veren yöntem ele alınarak kodlama yapılmıştır. 5. Sonuç Bu çalışma, çevrimiçi web sitesinde belirtilen otellerin kullanıcı yorumlarının ve puanlamalarının analizi ile özetlenmesine odaklanmaktadır. İnceleme özeti, kullanıcılara kararsız kaldıkları veya seçtikleri oteller arasından en iyi seçimin hangisi olacağı hakkında daha iyi bir seçim sağlar. Çalışma ayrıca müşteriye otellerin puanlamalarını yorumlarla birlikte göstererek karşılaştırma olanağı sağladığından kararsızlığı ortadan kaldırmayı ve seçilen bölgedeki en iyi otelin pazarlamasının yapılmasını hedeflemiştir. Teknolojinin günümüzde giderek önem kazanması ile beraber popüler bir konu haline gelmiş veri madenciliği genel olarak anlatılmış ve teknolojinin ilerlemesiyle birlikte gelişen turizm sektörü ele alınmıştır. 1,000 adet farklı otelin kullanıcılarına ait yorumları Knime platformu üzerinde metin madenciliği algoritması kullanılarak sentezlenmiş ve yine veri madenciliğinde çok popüler bir algoritma olan duygu analizi algoritması ile birlikte otellere ait kullanıcılar tarafından yapılan yorumlar pozitif ve negatif olarak gruplandırılmıştır. Otellere ait puanlamaların ortalaması alınarak birleştirilmiş ve tüketiciye en uygun otelin reklamının yapılabilmesi için Python ortamı kullanılarak kodlanmıştır. Kaynakça Metin madenciliği ve duygu analizi yönteminin çok daha başarılı sonuçlar verdiği görülmüştür. [1] SAVAŞ, S., TOPALOĞLU, N., YILMAZ, M.,(2011), Veri Madenciliği ve Türkiye deki Uygulama Örnekleri, İstanbul Ticaret Üniversitesi Fen Bilimleri Dergisi, 11(21), 1-23. [2] DOLGUN, M. Ö., ÖZDEMİR, G. T., OĞUZ, D.,(2009), Veri madenciliği nde yapısal olmayan verinin analizi: Metin ve web madenciliği, İstatistikçiler Dergisi, 2(2009), 48-58. [3] Albayrak, M. (2017). The use of data mining in scientific research. International Journal of Social Sciences and Education Research, 3(2), 751-760. [4] ŞEKER, E., Ş.(2014), Metin Madenciliği(Text Mining), 25 Temmuz 2018 tarihinde Bilgisayar Kavramları: http://bilgisayarkavramlari.sadievrenseker.com/2014/06/15/metin-madenciligi-text-mining/ adresinden alındı. [5] ŞEKER, E., Ş.,(2016), Duygu Analizi(Sentimental Analaysis), YBS Ansiklopedi, 3(3), 22-36.