Web Madenciliği (Web Mining)



Benzer belgeler
VERİ MADENCİLİĞİ (Web Madenciliği)

Dünyanın bilgisine açılan pencere... Ya da sadece yeni çağın eğlencesi...

Dünyanın bilgisine açılan pencere... Ya da sadece yeni çağın eğlencesi...

(Bilgisayar ağlarının birbirine bağlanarak büyük bir ağ oluşturmasıdır)

DİZİN. Not: Koyu harfle yazılan sayfalar ilgili terimin yoğun olarak geçtiği sayfaları göstermektedir.

Veritabanı Dersi. Teoriden Pratiğe. Çağıltay N.E., Tokdemir G. Veritabanı Sistemleri Dersi -Bölüm XXV: Web'den Erişim Çağıltay, N., Tokdemir, G.

Internet: Tarihçe ve Kavramlar

Internet Nedir? Devlet Kurumları. Internet Servis Sağlayıcılar. Lokal Ağ. Eğitim Kurumları. Kişisel Bilgisayar. Dizüstü Bilgisayar.

TBF 110 BİLGİSAYARDA VERİ İŞLEME ve UYGULAMALARI Ha9a- 2 - İnternet

Html temelleri. Ders 4

BTP 207 İNTERNET PROGRAMCILIĞI I. Ders 1

Bilgi ve iletişim NETWORK, I NTERNET

BMT 202 Web Tasarımı Bahar Dönemi. Yük. Müh. Köksal GÜNDOĞDU 1

Mobil Cihazlardan Web Servis Sunumu

Bilimsel ve Teknik Dokümantasyon. Yrd. Doç.Dr. Özlem Bayram

Web Tasarımının Temelleri

BİH 605 Bilgi Teknolojisi Bahar Dönemi 2015

İnternet ve İnternet Tarayıcıları BİLGİ VE İLETİŞİM TEKNOLOJİSİ DERS NOTU - 2

E-Posta Hesapları ve Anında Mesajlaşma Yazılımları

BÖLÜM 7. Telekomünikasyon, İnternet ve, Kablosuz Teknoloji. Doç. Dr. Serkan ADA

Internet ve World Wide Web

İnternet Nasıl Çalışıyor?

MODÜL 1 BÖLÜM 3 İNTERNET VE E-POSTA BİLGİSAYAR KULLANMA. Şükrü BAKIR Bilişim Teknolojileri Öğretmeni

Programın Adı: Eğitim ve Öğretim Yöntemleri Proje/Alan Çalışması. Diğer Toplam Kredi AKTS Kredisi

İNTERNET VE BİLGİ AĞLARININ KULLANIMI

İNTERNET HAFTA 02 TEMEL BİLGİ TEKNOLOJİSİ KULLANIMI. Öğr. Gör. GÜLTEKİN BÜYÜKŞENGÜR. SAPANCA Meslek Yüksekokulu

1.PROGRAMLAMAYA GİRİŞ

Büyük Veri Analitiği (Big Data Analytics)

TS EN ISO EŞLEŞTİRME LİSTESİ

Bilgisayar Programalamaya Giriş

Atabey Meslek Yüksek Okulu Web Tasarımının Temelleri

WEB TASARIMININ TEMELLERİ

AĞ TEMELLERİ 4.HAFTA CELAL BAYAR ÜNİVERSİTESİ AKHİSAR MESLEK YÜKSEKOKULU

Bilgi Merkezi Web Siteleri

İnternet Nedir? 1. İnternet Teknolojileri. İçerik. İnternet Nedir? 2. Ders 1

İnternet Teknolojileri. Ders 1

İNTERNET PROGRAMLAMA II. Tanımlar

İSMET AKTAR ANADOLU TEKNİK LİSESİ BİLİŞİM TEKNOLOJİLERİ ALANI WEB PROGRAMCILIĞI DALI


WEB TASARIMINDA TEMEL KAVRAMLAR

Web Madenciliği Teknikleri

WEB TASARIMININ TEMELLERİ

Beyhan KARPUZ, Uzman Kütüphaneci Karadeniz Teknik Üniversitesi 2016

WEB TASARIMININ TEMELLERİ

Web Madenciliği (Web Mining)

Türkiye Barolar Birliği internet sitesi

Veritabanı Uygulamaları Tasarımı

ÖRÜN (WEB) GÜVENLİĞİ. Hazırlayan: Arda Balkanay

AJAX nedir? AJAX nasıl çalışır? AJAX. Tahir Emre KALAYCI. Sunucu Yazılım Teknolojileri

WEB TASARIM. Öğr.Gör. Ruhsar KAVASOĞLU

CELAL BAYAR ÜNİVERSİTESİ KÜTÜPHANE VERİTABANLARINA ÜNİVERSİTE DIŞINDAN ERİŞİM

BLM 183 Bilgi Teknolojileri ve Uygulamaları

HTML (Hyper Text Markup Language)

MOBİL İLETİŞİM CİHAZLARI İLE EV OTOMASYON SİSTEMLERİ (EOS)

2000 li yıllardan itibaren teknolojinin hızlı gelişiminden belki de en büyük payı alan akıllı telefon ve tabletler gibi kablosuz iletişim olanağı

MATRİKS E-BROKER ELEKTRONİK İŞLEM PLATFORMU MATRİKS TRADER VE JAVA MATRİKS ENTEGRASYONLARI

PHP 1. Hafta 1. Sunum

BioAffix Ones Technology nin tescilli markasıdır.

Elektronik Dergi ve Veri Tabanlarına Kampus Dışından Erişim

Kütüphane Web Sitesi Nedir? Bina x Web sitesi

VERİ MADENCİLİĞİNE BAKIŞ

My EBSCOhost Kullanım Kılavuzu. support.ebsco.com

Script. Statik Sayfa. Dinamik Sayfa. Dinamik Web Sitelerinin Avantajları. İçerik Yönetim Sistemi. PHP Nedir? Avantajları.

Web Sayfasında Google Analitik Kullanımı ve Kullanıcı Davranışlarının Belirlenmesi: İstanbul Ticaret Üniversitesi Kütüphane Web Sayfası.

VPN NEDIR? NASıL KULLANıLıR?

YENİ BİLGİ MODELLEME VE PROGRAMLAMA FELSEFESİYLE SEMANTIC WEB

DEVLET KURUMLARINDA WEB ERİŞİLEBİLİRLİĞİ

İnternet ve ağ kavramlarını tanımlamak. İnternet in nasıl çalıştığını açıklamak. Elektronik posta ve sohbet kavramlarını açıklamak.

Veri Tabanı Yönetim Sistemleri Bölüm - 3

İNTERNET VE BİLGİSAYAR AĞLARI

Birbirine bağlı milyarlarca bilgisayar sisteminin oluşturduğu, dünya çapında bir iletişim ağıdır.

E-Bülten. Bilgi Merkezi Araç Çubuğu nu (Toolbar) yükleyebilirsiniz. Bilgi Merkezi Araç Çubuğu nun Avantajları

Internet te Pazarlama

4.41. WEB DE GENÇ TEKNİK: AJAX. Fırat Üniversitesi Fen Bilimler Enstitüsü, Elazığ. Fırat Üniversitesi Teknik Eğitim Fakültesi,

Bozok Üniversitesi Mühendislik Fakültesi - Bilgisayar Mühendisliği. Yrd. Doç. Dr. Ahmet Sertol KÖKSAL

İnönü Üniversitesi Kütüphanesi Müzik Veritabanları

Veri Tabanı-I 1.Hafta

Öğr. Gör. Serkan AKSU 1

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi

K.A.ALPER YAZOĞLU ORTAOKULU 6.SINIFLAR BİLİŞİM TEKNOLOJİLERİ VE YAZILIM DERSİ ÇALIŞMA KÂĞIDI

Mustafa SANGÜL - Bilişim Teknolojileri Öğretmeni Bilişim Teknolojileri ve Yazılım Araştırma, Bilgiyi Yapılandırma ve İşbirlikli Çalışma

VERİ TABANI YÖNETİM SİSTEMLERİ

EkoPC Bilişim Hizmetleri San. ve Tic. Ltd. Güvenli İnternet Kullanımı

Yazılım Destek Hizmeti

VERİ TABANI SİSTEMLERİ

SEAT on-line HSO KULLANICI EL KİTABI SÜRÜMÜ

Bilgi Sistemlerinde Merkezi Kayıt Yönetimi ve Olay İlişkilendirme

Bilgi ve iletişim teknolojileri

Internet te Pazarlama

UZAKTAN EĞİTİM MERKEZİ

ELEKTRONİK NÜSHA. BASILMIŞ HALİ KONTROLSUZ KOPYADIR

Internet te Pazarlama

VERI TABANLARıNDA BILGI KEŞFI

WEB ARAÇLARI VE UZAKTAN EĞİTİM CEIT357-4.HAFTA

Akdeniz Üniversitesi

AĞ HİZMETLERİ. Öğr.Gör.Volkan ALTINTAŞ. Version 4.0

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

BİLGİSAYAR 4 MOLEKÜLER BİYOLOJİ VE GENETİK BÖLÜMÜ 1. DERS İNTERNET, TCP/IP, İNTERNETTE MESAJ VE BİLGİ AKTARIMI YARD. DOÇ. DR.

Internet te Pazarlama

Transkript:

Web Madenciliği (Web Mining) Hazırlayan: M. Ali Akcayol Gazi Üniversitesi Bilgisayar Mühendisliği Bölümü Genel bilgiler Değerlendirme Arasınav : 25% Ödevler : 15% Final Projesi : 30% Final Sınavı : 30% Ders kaynakları Web Data Mining: Exploring Hyperlinks, Contents, and Usage Data, Bing Liu, Springer, 2011. Mining the Web: Discovering Knowledge from Hypertext Data, Soumen Chakrabarti, Morgan Kaufmann, 2002. e-posta : akcayol@gazi.edu.tr web : http://w3.gazi.edu.tr/~akcayol 2 1

Genel bilgiler Araştırma ödevleri Haftalık konu ile ilgili bir makale incelenerek detaylı rapor hazırlanacaktır. İncelenen makalede ilgili yöntemin/algoritmanın/yaklaşımın kullanılmasının gerekçeleri, elde edilen sonuçları değerlendirilecektir. İncelenen makale son 5 yılda yayınlanmış olacaktır. Makale SCI-E tarafından taranan bir dergide yayınlanmış olacaktır. SCI-E tarafından tarandığını gösterir bilgi ödeve eklenecektir. Hazırlanan rapora makalenin tam metni de eklenecektir. 3 Genel bilgiler Final Projeleri Bir yöntemin/algoritmanın bir alan uygulamasını içerecektir. Geliştirilecek uygulamada hazır araç, fonksiyon veya kütüphane kullanılmayacaktır. Hazırlanan projenin tüm dokümanları CD ile ve raporu çıktı ile teslim edilecektir. 4 2

Genel bilgiler Ders içeriği 1. Veri madenciliği ve Web madenciliği 2. İlişkilendirme kuralları 3. Sıralı örüntüler 4. Denetimli öğrenme 5. Denetimsiz öğrenme 6. Bilgi erişimi 7. Web arama 8. Bağlantı analizi 9. Web crawling 5 Konular Pre-processing 6 3

İnternet Günümüzde World Wide Web (Kısaca Web) hayatımızın her alanında yoğun bir şekilde kullanılmaktadır. En büyük ve yaygın kullanılan bilgi kaynağı olup arama ve bilgiye erişim son derece hızlı ve kolay şekilde yapılabilmektedir. Web üzerinde milyarlarca doküman (Web sayfası) bulunmakta ve milyonlarca kişi sürekli yeni dokümanlar eklemektedir. Web veriye erişimi ve hızlı aramayı sağlamakla birlikte arkadaşlarımızla bilgi paylaşımını da sağlamaktadır. arkadaşlarımızla sesli görüntülü görüşme için de kullanılmaktadır. Bu açıdan İnternet in sanal bir topluluk olduğu söylenebilir. 7 İnternet günümüzde alışveriş şeklini de değiştirmiştir. Mağazaya giderek alışveriş yapmak yerine bilgisayar başında ürünleri almakta ve ödemelerini yapmaktayız. Bankacılık, rezervasyon, ödeme başta olmak üzere tüm işlemler elektronik olarak yapılabilmektedir. Bu hem maliyet hem de konfor yönünden daha çok tercih edilmektedir. yaşam kalitesini ve iş yapış şeklimizi de değiştirmiştir. 8 4

Konular Pre-processing 9 World Wide Web Web, kullanıcıların bir bilgisayardan diğer bilgisayarda bulunan veriye ulaşmasını sağlayan İnternet tabanlı bilgisayar ağıdır. Web standart istemci-sunucu (client-server) modelini kullanmaktadır. Bu modelde kullanıcılar kendi bilgisayarlarındaki program ile uzaktaki bilgisayar bağlanırlar. Web üzerinde gezinti için tarayıcı (browser) denilen programlar kullanılır. Browser lar uzaktaki bilgisayardan istekte bulunurlar ve HTML (HyperText Markup Language) biçiminde gelen bilgiyi yorumlayarak istemci taraftaki kullanıcının ekranında görüntülerler. Web üzerinde gezinti yapılırken dokümanlar arasındaki bağlantılar (hyperlink) kullanılır. Bu şekilde oluşturulan dokümanlar hypertext olarak adlandırılırlar. 10 5

Konular Pre-processing 11 Web in Oluşumu Web 1989 yılında Tim Berners-Lee tarafından bulunmuştur. World Wide Web terimini ilk kullanan ve ilk istemci programını yazan kendisidir. Tim Berners-Lee Information Management: A Proposal adlı bir öneriyi çalışmakta olduğu CERN laboratuarında 1989 yılında sunmuştur. Bu önerisinde hiyerarşik doküman yapısının avantajlarını ve dezavantajlarını ortaya koymuştur. Önerilen doküman yapısıyla bağlantılar (hypertext) aracılığıyla dokümanlar arasında geçiş yapılabilmektedir. Bu öneri dağıtık hypertext sistem olarak adlandırılmıştır ve günümüz Web mimarisinin temelini oluşturmaktadır. 12 6

Web in Oluşumu Başlangıçta destek bulamamış olsa da 1990 yılında Tim-Berners Lee tarafından tekrar önerilmiştir. Aynı yıl desteklenen proje ile günümüz Web mimarisi geliştirilmeye başlanmıştır. İstemci ve sunucu arasında geliştirilen protokol ile iletişim sağlanmıştır. Bu çalışmayla HyperText Trasfer Protocol (HTTP), HyperText Markup Language (HTML) ve Universal Resource Locator (URL) tanımlanmıştır. 13 Konular Pre-processing 14 7

Web Tarayıcılar Mosaic ve Netscape Browser lar Web in önemli gelişmelerinden birisi de 1993 yılında mosaic tarayıcının geliştirilmesidir. Mosaic grafik arayüze sahiptir ve Unix işletim sistemi için geliştirilmiştir. Kısa süre sonra mosaic tarayıcının Windows ve Macintosh versiyonları geliştirilmiştir. 1994 yılının ortalarında Netscape tarayıcı geliştirilmiştir. Microsoft tarafından geliştirilen Internet Explorer tarayıcı 1995 yılında geliştirilmiştir. Web in popüler ve başarılı olmasında en önemli aşamalardan birisi Mosaic tarayıcının geliştirilmesidir. 15 Konular Pre-processing 16 8

Internet Web Arama Motorları Internet, Web in iletişim ağını sağlar. Internet e ilişkin çalışmalar ARPA(Advanced Research Projects Agency) tarafından desteklenmiştir. İlk ARPANET bağlantısı 4 node ile 1969 yılında yapılmıştır. 1972 yılında ise 40 node ile bağlantı yapılmıştır. 1973 yılında Vinton Cerf ve Bob Kahn tarafından TCP/IP (Transmission Control Protocol / Internet Protocol) protokolünün ilk versiyonu geliştirilmiştir. Geliştirilen TCP/IP protokol yığını ile birbirinden uzakta farklı ağlar içinde yer alan bilgisayarlar birbirine bağlanmıştır. 1982 yılında TCP/IP protokolünü kullanan Internet doğmuştur. 17 Web Arama Motorları Search Engines Bilginin Dünya üzerinde dağıtık ve çok büyük boyutlarda bulunmasından dolayı bilgiyi bulmak ve erişmek daha önemli hale gelmeye başladı. Çok büyük bir alanda ve dağıtık bulunan bilginin bulunması için arama motorları geliştirilmeye başlanmıştır. Excite arama motoru 1993 yılında 6 Stanford Üniversitesi öğrencisi tarafından geliştirilmiştir. 1994 yılında EINET Galaxy geliştirilmiştir ve 1994 yılında Yahoo! geliştirilmiştir. Yahoo! diğer alternatiflerine göre favoriler listesi ve öneriler dizini sunmaktaydı. Ardından Lycos, Infoseek, Alta Vista, Inktomi, Ask Jeeves, Northernlight gibi arama motorları geliştirilmiştir. 18 9

Konular Web in Oluşumu Web Tarayıcılar Web Arama Motorları Pre-processing 19 W3C (The World Wide Web Consortium) W3C, 1994 yılında MIT ve CERN tarafından oluşturulmuş ve Web teki geliştirilmeleri düzenlemesi amaçlanmıştır. W3C nin temel amacı Web in gelişimi için standartları belirlemek ve WWW ürünlerinin birbirleriyle sorunsuz çalışmasını sağlamaktır. 1995-2001 yılları arasında Web çok büyük bir gelişme göstermiştir. Çok sayıda uygulama Web üzerinde geliştirilmiş ve her geçen gün uygulama sayısı artmaktadır. 20 10

Konular Web in Oluşumu Web Tarayıcılar Web Arama Motorları Pre-processing 21 Web Veri Madenciliği Son on yılda Web in gelişimi sonucunda Dünya nın en büyük veri kaynağı ortaya çıkmıştır. Web kendine özgü çok sayıda karakteristik özelliğe sahiptir ve çok büyük veri üzerinde veri madenciliği önemli ve zor bir iş haline gelmiştir. Web üzerindeki veri miktarı çok büyüktür ve gün geçtikçe hızla artmaktadır. Aranan her türlü bilgi Web üzerinde bulunabilmektedir. Web üzerinde yapılandırılmış tablolar, yapılandırılmış Web sayfaları, düz metinler ve multimedia dosyaları gibi çok farklı dosyalar bulunmaktadır. Web üzerindeki veri heterojendir. 22 11

Web Veri Madenciliği Aynı bilgiye sahip Web sayfaları çok farklı biçimlerde ve içeriğe sahip şekilde Web üzerinde bulunabilmektedir. Bu farklılık Web sayfalarındaki bilgilerin entegrasyonunu çok zor hale getirmektedir. Web üzerindeki bilginin çok önemli bir kısmı bağlantılara sahiptir. Hyperlink ler aynı site üzerindeki Web sayfaları arasında veya çok farklı sitelerdeki Web sayfaları arasında olabilmektedir. Hyperlink ler Web sayfaları için çok önemlidir. Çok sayıda Web sayfası tarafından link verilen sayfalar otorite sayfalar olarak gösterilir ve çok sayıda kişinin güvenini sağladığı düşünülür. 23 Konular Pre-processing 24 12

Web Üzerindeki Verilerin Özellikleri Web üzerindeki bilgi gürültüye sahiptir. Gürültü iki farklı kaynaktan dolayı oluşmaktadır. Bunlardan birincisi, Web sayfası gezinti linkleri, reklamlar, copyright bilgileri, privacy bilgileri, v.b. gibi çok farklı türde veriye sahiptir. İyi bir Web bilgisi analizi için gürültüleri ortadan kaldırmak gereklidir. İkincisi, Web üzerindeki bilginin kalite kontrolü bulunmamaktadır ve herhangi birisi istediği bilgiyi bir link üzerindeki Web sayfasına yazabilir. Web üzerindeki verinin büyük bir kısmı düşük kalitede, hatalı ve eksiktir. Web üzerinde ticari uygulamalar bulunmaktadır ve insanlar çok sayıda farklı işlemlerini bu siteleri kullanarak gerçekleştirmektedir. 25 Web Üzerindeki Verilerin Özellikleri Web üzerindeki bilgi dinamiktir ve sürekli değişmektedir. Değişiklikleri anlık izlemek bazı uygulamalar için çok önemlidir. Web sanal bir topluluktur. Web sadece insanlar arasında veri iletişimini değil insanlar arasındaki etkileşimi de sağlamaktadır. Yukarıdaki özelliklerin hepsi Web üzerindeki bilginin elde edilmesi için kullanılacak madencilik (mining) için hem fırsatları hem de zorlukları beraberinde getirmektedir. Web madenciliği, veri madenciliğinin tüm tekniklerinin uygulaması değildir. Çok zengin ve farklı özelliklere sahip veriyi bulundurmasından dolayı Web madenciliği kendine özgü algoritmaları da geliştirmiştir. 26 13

Konular Pre-processing Web Kullanım Madenciliği 27 Veri Madenciliği veritabanlarında bilgi keşfi (knowledge discovery in databases (KDD)) olarak adlandırılmaktadır. Veritabanlarından faydalı örüntülerin keşfedilmesinde kullanılmaktadır. makine öğrenmesi, istatistik, veritabanları, yapay zeka, bilgi çıkarımı gibi alanlarından oluşan multi disipliner yapıya sahiptir. denetimli öğrenme (sınıflandırma), denetimsiz öğrenme (öbekleme), ilişkisel kural madenciliği, sıralı örüntü madenciliği gibi işlevlere sahiptir. 28 14

Veri Madenciliği veri analisti (veri madencisi) tarafından uygulama alanının anlaşılması ile başlar ve aşağıdaki üç ana aşamayla gerçekleştirilir: Pre-processing: Veri başlangıçta veri madenciliği için uygun yapıda değildir. Öncelikle gürültünün ve standart dışı verinin temizlenmesi gereklidir. Çok büyük boyutlardaki verilerde tutarsız ve ilgisiz olanların çıkartılması gereklidir. : İşlenmiş olan verinin bir örüntü veya bilgi elde edilmesi için veri madenciliği algoritmalarıyla değerlendirilmesi yapılır. : Çoğu uygulamada elde edilen örüntü kullanılabilir ve faydalı değildir. Bu aşamada ilgili uygulama için kullanılabilir ve faydalı olanlar seçilir. Yukarıdaki işlemler genellikle tekrarlı bir şekilde uygulanır. İstenilen seviyede iyi bilgiye ulaşmak için yukarıdaki işlemler iteratif bir şekilde gerçekleştirilir. 29 Konular Pre-processing (Ön işleme) 30 15

Web Madenciliği Web madenciliği kullanılabilir bilgiyi Web bağlantılarından, sayfa içeriklerinden ve kullanılan veriden elde eder. Web madenciliği çok sayıda veri madenciliği tekniğini kullanır ancak sahip olduğu verinin heterojen olması, yarı yapılandırılmış ve yapılandırılmamış veriye sahip olmasından dolayı sadece veri madenciliği uygulaması olarak görmek doğru değildir. Çok sayıda veri madenciliği yöntemi son on yılda geliştirilmiştir. Web mining üç türde ele alınmaktadır. Bunlar; yöntemleridir. 31 Konular Web in Oluşumu Web Tarayıcılar Web Arama Motorları Pre-processing (Ön işleme) 32 16

Web yapısı madenciliği faydalı ve kullanılabilir bilgiyi Web sayfalarında bulunan bağlantılardan çıkarır. Bağlantılar kullanılarak hangi sayfanın daha önemli olduğu gibi bilgileri çıkarabiliriz. Ayrıca aynı ortak ilgilere sahip olan kullanıcıları belirleyebiliriz. Klasik veri madenciliğinde bu tür bilgiler bulunmaz. 33 Konular Pre-processing (Ön işleme) 34 17

Web içerik madenciliği nde faydalı ve kullanılabilir bilgiler web sayfalarının içeriğinden elde edilir. Örneğin web sayfaları içeriklerine göre sınıflandırılabilir. Bu özellikleri klasik veri madenciliğinde de kullanılmaktadır. Web sayfalarında kullanıcıların forum bilgilerine, müşteri görüşlerine dayanarak çıkarımlar yapılabilmektedir. 35 Konular Pre-processing (Ön işleme) 36 18

Web kullanım madenciliği kullanıcıların Web sayfalarına erişim bilgilerini kullanır. Kullanıcıların tıklama bilgileri, sayfalarda gezinme bilgileri, sayfalar üzerindeki etkileşim bilgileri gibi veriler kullanılır. Yukarıdaki işlerin yanı sıra Web üzerindeki verilerin zengin ve çok çeşitli oluşu Web madenciliğinde çok farklı uygulama alanları oluşturmaktadır. Web madenciliği süreci ile veri madenciliği süreci birbirine benzemektedir. Sadece veri toplama aşaması farklıdır. Klasik veri madenciliğinde veriler bir veri ambarında tutulur. Web madenciliğinde ise veriler dağıtık bulunan Web üzerinde bulunur ve toplanması çok önemli bir iştir. Veriler elde edildikten sonra ön işleme, Web veri madenciliği ve postprocessing işlemleri gerçekleştirilir. 37 Ödev hakkında bir araştırma ödevi hazırlayınız. 38 19