VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

Benzer belgeler
VERİ MADENCİLİĞİ F A T M A İ L H A N

Veri Madenciliği. Bölüm 1. Giriş. Doç. Dr. Suat Özdemir. w3.gazi.edu.tr/~suatozdemir

VERİ MADENCİLİĞİNE BAKIŞ

Bölüm 1. Giriş. Öğretim üyesi: Doç. Dr. Suat Özdemir E-posta: Websayfası:

BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR

Veri Tabanı, Veri Ambarı, Veri Madenciliği. Veri Madenciliği Uygulama Alanları

VERI TABANLARıNDA BILGI KEŞFI

Veri Ambarından Veri Madenciliğine

Konular. VERİ MADENCİLİĞİ Giriş. Problem Tanımı. Veri Madenciliği: Tarihçe. Veri Madenciliği Nedir? Bilgi Keşfi

İleri Veri Madenciliği (COMPE 506) Ders Detayları

Veritabanı Yönetimi Bilgisayarların. Keşfi Hedefler. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi

VERİ MADENCİLİĞİNİN GÖREVLERİ

Birliktelik Kuralları Analizi. Yard. Doç. Dr. Derya BİRANT Prof. Dr. Alp KUT

Bilgisayar Mühendisliği Yüksek Lisans Programı

Veri Ambarları ve Veri Madenciliği (ISE 350) Ders Detayları

Veritabanı, Veri Madenciliği, Veri Ambarı, Veri Pazarı

Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Bir Veri Seti Üzerinden Karşılaştırılması

Bilgisayar Mühendisliği Yüksek Lisans Programı

Mobil Uygulama Geliştirmeye Giriş (ISE 407) Ders Detayları

Yapı Kredi Bankası Ar-Ge Çalışmaları Araştırma, Vizyon ve Uygulama. Eğitmen: Onur AĞIN

Adnan Menderes Üniversitesi FAKÜLTESİ SÖKE İŞLETME. BÖLÜMLER ULUSLARARASI TİCARET ve İŞLETMECİLİK YÖNETİM BİLİŞİM SİSTEMLERİ

Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan. blog.mustafabaydogan.

Öğr.Gör.İnan ÜNAL Tunceli Üniversitesi Bilgisayar Mühendisliği Bölümü

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, Nisan 2009, ODTÜ, Ankara

Veri Madenciliği Yaklaşımı ile Mesleki Yönlendirme Sistemi

Mobil Uygulama Geliştirmeye Giriş (ISE 407) Ders Detayları

İSTANBUL TEKNİK ÜNİVERSİTESİ ELEKTRİK-ELEKTRONİK FAKÜLTESİ. AKILLI FİYAT ARAMA MOTORU TiLQi.NET

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı

Nesnelerin İnternetinde Veri Analizi

BİLGİYİ YÖNETME. Mustafa Çetinkaya

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 1 ( yılı ve sonrasında birinci

VERİ TABANI YÖNETİM SİSTEMLERİ

Microsoft SQL Server 2008 Oracle Mysql (Ücretsiz) (Uygulamalarımızda bunu kullanacağız) Access

PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Veri Madenciliği Yöntemleri Dr. Yalçın ÖZKAN -II-

2. SÜREKLİ DENETİME İLİŞKİN GENEL BİLGİLER

LOGO İş Zekası çözümü ile kurumsal raporlama ve analizler. Cem Yılmaz Genel Müdür LOGOBI Yazılım

SUBA. SUBA CRM. Bulut Teknoloji ile İşinizi Zirveye Taşıyın! SMART TECHNOLOGY SOLUTIONS

Veritabanı Uygulamaları Tasarımı

VERİ TABANI SİSTEMLERİ

VERİ TABANI UYGULAMALARI

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Ders 1- Yapay Zekâya Giriş. Erhan AKDOĞAN, Ph.D.

GENCAY KARAMAN. DBA & Data Mining/Business Intelligence Specialist

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı

SAĞLIK BİLGİ SİSTEMLERİNİN TARİHSEL GELİŞİMİ

VERİ MADENCİLİĞİ Kavram ve Algoritmaları

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 5072

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı

Başlıca Ürün-Bilgi Sistemleri

Posta Arşivi. Kullanım ve Yardım Rehberi

Büyük Veri ve Endüstri Mühendisliği

KABA KÜME TEORİSİ (Rough Set Theory) Dr. Sedat TELÇEKEN

Mesleki Terminoloji II Veri Madenciliği

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

APRIORI ALGORİTMASI İLE ÖĞRENCİ BAŞARISI ANALİZİ

TIGER PLUS FİYAT LİSTESİ 1 Aralık 2010 tarihinden itibaren geçerlidir.

Veri Tabanı-I 1.Hafta

BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

İleri Yapay Zeka (COMPE 568) Ders Detayları

COĞRAFİ BİLGİ SİSTEMLERİ

K En Yakın Komşu Methodu (KNearest Neighborhood)

Semantik Bilgi Yönetimi

2 Temel Kavramlar (Devam) Veritabanı 1

DR. RAMAZAN DEMİR TÜRK TELEKOM 9 MART 2010 CONRAD HOTEL

NESNEYE YÖNELİK ÇÖZÜMLEME SÜRECİ

İGABİS. İGDAŞ Altyapı Bilgi Sistemi

Veri ve Metin Madenciliği

Veri ve Metin Madenciliği. Zehra

bilişim ltd İş Zekâsı Sistemi

1. Oracle Data Miner 11g Release 2 Kurulumu Aşamaları

Büyük Verinin Büyük Güvenlik İhtiyacı. Yavuz S. Selim Yüksel Bilişim Teknolojileri ve Siber Güvenlik Derneği Yönetim Kurulu Başkanı

Proje Adı : MATLAB Real-Time Windows Target toolbox kullanımı ve ilişkili bir uygulama geliştirilmesi

Apriori Algoritması ile Teknik Seçmeli Ders Seçim Analizi

Yaz.Müh.Ders Notları #4 1

Natura 2000 VERI TABANı (GÖREV 2)

İş Zekâsı Sistemi Projesi

MAPINFO PRO TEMEL VE İLERİ SEVİYE EĞİTİM İÇERİĞİ

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

Açık Kaynak Kodlu Veri Madenciliği Yazılımlarının Karşılaştırılması

DERS PROFİLİ. Kuram+PÇ+Lab (saat/hafta) Dersin Adı Kodu Yarıyıl Dönem. Birebir Satış ve Satış Yönetimi MAN526 I I Dersin Dili.

Q-Biz İş Zekası Versiyon Yenilikleri

Doğal Hesaplama (COMPE 564) Ders Detayları

SİSTEM ANALİZİ ÖĞR. GÖR. MUSTAFA ÇETİNKAYA DERS 2 > GÜNÜMÜZ İŞLETMELERİNDE ENFORMASYON SİSTEMLERİ

YÖNETİM BİLİŞİM SİSTEMLERİ BÖLÜMÜ YENİ DERS MÜFREDATI (1) FAKÜLTESİ: İŞLETME FAKÜLTESİ / BUSINESS SCHOOL

Olasılık ve İstatistik nedir? Bilgisayar Mühendisliğindeki yeri

1- KAYIT FORMU 2- ALIŞVERİŞ SEPETİ

MIKROSAY YAZILIM ve BİLGİSAYAR SAN. TİC. A.Ş

BEDEN EĞİTİMİ I: Haftalık ders 1 saattir (T-0 ) (U-l) (K-0).

EĞĠTĠM-ÖĞRETĠM PLANI

Dijital pazarlama bir satış yöntemi değil; ulaşılan sonuçları sayesinde satış artışı sağlayan, bir ilişkilendirme ve iletişim sürecidir.

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: CSE 6003

EĞĠTĠM-ÖĞRETĠM PLANI

Biz Kimiz? Ekibimizi yakından tanıyın: adresgezgini.com/ekibimiz

Yönetim Bilişim Sistemleri (Karma) - 1. yarıyıl Hukukun Temelleri Fundamentals of Law TR

Ders Adı : Nesne Tabanlı Programlama-I Ders No : Teorik : 3 Pratik : 1 Kredi : 3.5 ECTS : 4. Ders Bilgileri.

DSİ kapsamında oluşturulan dağınık durumdaki verilerinin düzenlenmesi, yeniden tasarlanarak tek bir coğrafi veri tabanı ortamında toplanması,

8 Haziran 2007 TBD İstanbul Bilişim Kongresi

EĞĠTĠM-ÖĞRETĠM PLANI

Mobil Güvenlik ve Denetim

Transkript:

Veri Madenciliği, örüntü tanıma, istatistik ve matematiksel yöntemlerin kullanımıyla devasa miktardaki güncel ya da geçmiş veri içerisinden ilgi çekici ( önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı ) bilginin gelecekteki eğilimleri kestirmek ya da sonraki aşamalarda analiz etmek üzere etkin şekilde çıkarılması sürecidir.

NİN AMACI NE YAPMAK İSTEMİYORUZ? Büyük miktardaki veri içinde arama yapmak (Veri tabanı yönetim sistemleri bu işi yapıyor) Telefon rehberinde arama yapmak VERİ MADENCİLİĞİNİN AMACI Aradığımız veri mevcutsa bu veriden çıkarabileceğimiz sonuçlarını anlamak Telefon rehberindeki isimlere göre, hangi bölgemizde hangi isimlerin daha yaygın olduğunu bulmak

VERİ TABANI VERİ MADENCİLİĞİ SORGULAMA SORGULAMA - Tanımlı - Tam tanımlı değil - SQL - Yaygın sorgulama dili VERİ yok - Canlı veri VERİ - Dinamik - Üzerinde işlem ÇIKTI yapılmayan veri -Belirli - Statik -Verinin bir alt kümesi ÇIKTI -Belirli değil -Verinin bir alt kümesi değil

NEDEN VERİ MADENCİLİĞİ Bilgisayarların ucuzlayıp aynı zamanda çok güçlü hale gelmeleri Teknolojinin gelişimi ile bilgisayar ortamında ve veri tabanlarında tutulan veri miktarının da artması Yeni veri toplama yolları - Otomatik veri toplama aletleri, veri tabanı sistemleri, bilgisayar kullanımının artması Büyük veri kaynakları - İş dünyası : Web, e-ticaret, alışveriş, hisse senetleri - Bilim dünyası : uzaktan algılama ve izleme, similasyonlar - Toplum : Haberler, dijital kameralar, youtube, facebook

Veri madenciliği tanımı ile birlikte bilinmesi gereken kavramlar : Veri yığınları : Soyut ve ilk bakışta anlaşılmayan veri türüdür. Veri Ambarı : Sınırı belirli olmayan ve ilişkisiz birçok verinin bulunduğu veri tabanlarıdır.

Anlamsız veriler arasında BİLGİ keşfi için 1. Veri temizleme (gürültülü ve tutarsız verileri çıkarmak) 2. Veri bütünleştirme (birçok veri kaynağını birleştirebilmek) 3. Veri seçme (yapılacak olan analizle ilgili olan verileri belirlemek ) 4. Veri dönüşümü (verinin veri madenciliği tekniğinden kullanılabilecek hale dönüşümünü gerçekleştirmek) 5. Veri madenciliği (veri örüntülerini yakalayabilmek için akıllı metotları uygulamak) 6. Örüntü değerlendirme (bâzı ölçümlere göre elde edilmiş bilgiyi temsil eden ilginç örüntüleri tanımlamak) 7. Bilgi sunumu (mâdenciliği yapılmış olan elde edilmiş bilginin kullanıcıya sunumunu gerçekleştirmek).

Veri Madenciliği Sistemi Veritabanı, veri ambarı ve diğer depolama teknikleri Veritabanı ya da Veri Ambarı Sunucusu Bilgi Tabanı Veri Madenciliği Motoru Örüntü Değerlendirme Kullanıcı Arayüzü

1 Veri Seçimi Veri seçimi, veri madenciliği aşamalarında en fazla zaman alan kısımlardan biridir. Bu aşamada bilgi sistemlerinde oluşan bilgi iyi analiz edilmelidir ve problemle ilişkilendirilmelidir. Analizi yapan kişinin veri kalitesini ölçmesi açısından bu aşama önemlidir. Büyük miktardaki verilerin tek bir veri tabanı veya veri ambarında birleştirilmesi veri madenciliği uygulaması için gereklidir. Veri seçimi aşaması filtreleme olarak da isimlendirilebilir. 2 Ön İşleme Ön işleme aşaması veri madenciliğinin başarısı için önemlidir. Bu aşamada veri, sonraki aşamalarda kullanılabilmesi için elverişli hale getirilir. Ön işleme aşamasının başarısı sonuçtaki başarıyı doğrudan etkiler. Başarılı bir ön işleme aşamasıyla kesin ve net sonuçlara ulaşmak mümkündür.

3 İndirgeme Veri üzerinden faydalı ve doğru sonuç elde etmek için kullanılacak verinin indirgenmesi gerekir. Eldeki verinin büyük bir kısmı, her ne kadar ön işleme aşamasından geçmiş olsa bile sonraki aşamalarda kullanılabilecek durumda değildir. Dolayısıyla kullanılabilecek duruma indirgenmesi gerekir. 4 Veri Madenciliği Veri madenciliği çalışmasının tam olarak kullanıldığı aşamadır. Veri bu aşamaya gelince doğru ve kullanılabilir haldedir. Çalışmanın amacına göre bu aşamada veri madenciliği yöntemlerinden biri veya birkaçı uygulanır. Gerektiği durumlarda farklı yöntemler birleştirilerek kullanılabilir.

5 Yorumlama ve Doğrulama Veri üzerinde veri madenciliği uygulandıktan sonra alınan sonuçlar yorumlanır ve çalışmanın doğru sonuca ulaşıp ulaşmadığı araştırılır. Bu aşamada genellikle farklı yöntemler uygulanmışsa onların karşılaştırması yapılır. Elde edilen sonuçlar yapılmış olan diğer çalışmaların sonuçlarıyla karşılaştırılıp doğrulanır.

Uygulama alanları Pazarlama - Müşterilerin satın alma örüntülerinin belirlenmesi, - Müşterilerin demografik özellikleri arasındaki bağlantıların bulunması, - Posta kampanyalarında cevap verme oranının artırılması, - Mevcut müşterilerin elde tutulması, yeni müşterilerin kazanılması, - Pazar sepeti analizi (Market Basket Analysis) - Müşteri ilişkileri yönetimi (Customer Relationship Management) - Müşteri değerlendirme (Customer Value Analysis) - Satış tahmini (Sales Forecasting).

Uygulama alanları Bankacılık - Farklı finansal göstergeler arasında gizli korelasyonların bulunması, - - Kredi kartı dolandırıcılıklarının tespiti, - - Kredi kartı harcamalarına göre müşteri gruplarının belirlenmesi, - Kredi taleplerinin değerlendirilmesi. Sigortacılık Yeni poliçe talep edecek müşterilerin tahmin edilmesi, - Sigorta dolandırıcılıklarının tespiti, - Riskli müşteri örüntülerinin belirlenmesi.

Veri Madenciliği süreci için sıkça kullanılan yazılımlar şunlardır: WEKA RapidMiner (YALE) R Orange, KNIME Tanagra

Neden WEKA makine öğrenmesi algoritmaları vardır veri setine doğrudan uygulanabilir kendi Java kodu içerisinden çağırılabilir veri işleme, sınıflandırma, regresyon, kümeleme, ilişki kuralları ve görüntüleme araçları içerir yeni makine öğrenmesi şemaları geliştirmek için uygun yapıdadır

KAYNAKLAR Pang-Ning Tan, Michael Steinbach, Vipin Kumar (2005). Introduction to Data Mining. Addison Wesley, ISBN: VERİ MADENCİLİĞİ DR. TUĞRUL TAŞCI David J. Hand, Heikki Mannila, and Padhraic Smyth (2001). Principles of Data Mining. MIT Press. ISBN X.

SONUÇ Veri madenciliği, makina öğrenmesi ve yapay zeka birbiri yerine kullanılmakla birlikte, aslında farklı amaçları olan fakat ortak araçları kullanabilen bilimsel disiplinlerdir.

BEYZA YILDIRIM 201420404038