VERI TABANLARıNDA BILGI KEŞFI

Benzer belgeler
BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR

VERİ MADENCİLİĞİNE BAKIŞ

Konular. VERİ MADENCİLİĞİ Giriş. Problem Tanımı. Veri Madenciliği: Tarihçe. Veri Madenciliği Nedir? Bilgi Keşfi

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

Nesnelerin İnternetinde Veri Analizi

1. Oracle Data Miner 11g Release 2 Kurulumu Aşamaları

VERİ KAYNAKLARI. Bilgi sisteminin öğelerinden biride veri

Veri Ambarları. Erdem Alparslan

Veritabanı, Veri Madenciliği, Veri Ambarı, Veri Pazarı

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

VERİ MADENCİLİĞİ F A T M A İ L H A N

Birliktelik Kuralları Analizi. Yard. Doç. Dr. Derya BİRANT Prof. Dr. Alp KUT

Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan. blog.mustafabaydogan.

Mesleki Terminoloji II Veri Madenciliği

Veri Madenciliği. Bölüm 1. Giriş. Doç. Dr. Suat Özdemir. w3.gazi.edu.tr/~suatozdemir

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN

Bölüm 1. Giriş. Öğretim üyesi: Doç. Dr. Suat Özdemir E-posta: Websayfası:

Yönetim Bilgi Sistemleri. Maliye Bakanlığı Strateji Geliştirme Başkanlığı Yönetim Bilgi Sistemleri Dairesi

Öğr.Gör.İnan ÜNAL Tunceli Üniversitesi Bilgisayar Mühendisliği Bölümü

LOGO İş Zekası çözümü ile kurumsal raporlama ve analizler. Cem Yılmaz Genel Müdür LOGOBI Yazılım

SUNUM PLANI. Karar Verme SüreciS VERİ İĞİNE DAYALI İĞİ. ve ÖRNEK UYGULAMALAR İĞİ. SORUNLAR ve III. HİPOTETH IV. UYGULAMA ÖRNEKLERİ LMİ KAYNAKLAR

Veri Tabanı Yönetim Sistemleri Bölüm - 7

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veritabanı Sistemleri

Veritabanı Uygulamaları Tasarımı

HAM VERİNİN NİTELİKLİ BİLGİYE DÖNÜŞTÜRÜLME SÜRECİ

2 Temel Kavramlar (Devam) Veritabanı 1

VERİ MADENCİLİĞİ UYGULAMA ALANLARI. Application Fields of Data Mining. Abdullah BAYKAL 1. D.Ü.Ziya Gökalp Eğitim Fakültesi Dergisi 7, (2006)

İş Zekası için Dört-Katmanlı Veri Modellemesi Gerçekleştirimi. Harun Gökçe EG Yazılım, TOBB ETÜ

HASTANE OTOMASYONU VERİ TABANI YÖNETİM SİSTEMLERİ TEMEL VERİTABANI KAVRAMLARI

Veritabanı ve Yönetim Sistemleri

Veritabanı Yönetimi Bilgisayarların. Keşfi Hedefler. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi

APRIORI ALGORİTMASI İLE ÖĞRENCİ BAŞARISI ANALİZİ

Başlıca Ürün-Bilgi Sistemleri

Veri Madenciliği Yaklaşımı ile Mesleki Yönlendirme Sistemi

ÜRETİMDE SONLU KAPASİTE ÇİZELGELEME VE YAZILIMIN ÖNEMİ! Üretim ve Planlama Direktörü

Web Madenciliği (Web Mining)

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi

VERİ TABANI SİSTEMLERİ

VERİ MADENCİLİĞİ (Data Mining) (Veri Madenciliğine Giriş) Yrd.Doç.Dr. Kadriye ERGÜN

HAM VERİNİN NİTELİKLİ BİLGİYE DÖNÜŞTÜRÜLME SÜRECİ

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

araştırma alanı Öğrenme Bellek Algı Heyecanlar PSİKOLOJİNİN ALANLARI Doç.Dr. Halil EKŞİ

UZAKTAN EĞİTİM MERKEZİ

1 Temel Kavramlar. Veritabanı 1

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı

VERİTABANI ORGANİZASYONU

Veri Tabanı, Veri Ambarı, Veri Madenciliği. Veri Madenciliği Uygulama Alanları

UYGULAMALI TEKNOLOJİ TİCARİLEŞTİRME PROGRAMI NEDİR? PROGRAMA KİMLER KATILMALI? Uygulamalı Teknoloji Ticarileştirme Programı (UTTP)

Cochrane Library. Trusted evidence. Informed decisions. Better health.

Veri ve Metin Madenciliği

Veri ve Metin Madenciliği. Zehra

PAPATYA YAYINCILIK EĞİTİM Bilgisayar Sis. San. ve Tic. A.Ş. Veri Madenciliği Yöntemleri Dr. Yalçın ÖZKAN -II-

BİLGİYİ YÖNETME. Mustafa Çetinkaya

VERİ TABANI YÖNETİM SİSTEMLERİ

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

İLİŞKİSEL VERİTABANI. İlişkisel veritabanlarının ortak özelliği verilerin tablolar aracılığı ile tutulmasıdır.

Yazılım Mühendisliği Bölüm - 3 Planlama

VERİ TABANI YÖNETİM SİSTEMLERİ Melih BÖLÜKBAŞI

Yapı Kredi Bankası Ar-Ge Çalışmaları Araştırma, Vizyon ve Uygulama. Eğitmen: Onur AĞIN

1 BILGI TEKNOLOJILERI VE YÖNETIM

Büyük Veri ve Endüstri Mühendisliği

Veri Madenciliği: Tıp ve Sağlık Hizmetlerinde Kullanımı ve Uygulamaları. Data Mining: Using and Applications in Medicine and Healthcare

SİSTEM ANALİZİ VE TASARIMI. Sistem Analizi -Bilgi Sistemleri-

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı

VERİ MADENCİLİĞİ (Birliktelik Kuralları) Yrd.Doç.Dr. Kadriye ERGÜN

FEN FAKÜLTESİ TARİHÇEMİZ AMACIMIZ

ARAŞTIRMACI DENETÇİ YARDIMCISI

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veri Modelleri

Akdeniz Üniversitesi Mühendislik Fakültesi Bilgisayar Mühendisliği Bölüm Tanıtımı

Web Madenciliği (Web Mining)

Küme Yönetim Rehberi Notları. Sanayi Geliştirme Merkezi SANGEM

3. UYGULAMA - ORTAK ATIF ANALİZİ İLE BENZERLİK TAHMİNİ. Fırat Üniversitesi-Elazığ

İnternet Programcılığı

KANITA DAYALI UYGULAMA SÜRECİ

bitık MOBİL TİCARET UYGULAMASI ABDULLAH ÇİÇEKCİ

Veri Madenciliği Projelerinin Yaşam Döngüsü - 1

Alanya Alaaddin Keykubat UniversityInternational Relations Office

COĞRAFİ BİLGİ SİSTEMLERİ İLERİ SEVİYE EĞİTİMLERİ BUILDING GEODATABASE EĞİTİMİ

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN

MÜŞTERİ İLİŞKİLERİ YÖNETİMİ (PZL208U)

BÜYÜK ÖLÇEKLİ VERİ TABANLARINDA BİLGİ KEŞFİ

Plena Genel Seslendirme ve Acil Anons Sistemi Güvenliğe giden hızlı yol

BTP 209 SİSTEM ANALİZİ VE TASARIMI

VERİ MADENCİLİĞİ Metin Madenciliği

SİSTEM ANALİZİ ÖĞR. GÖR. MUSTAFA ÇETİNKAYA DERS 2 > GÜNÜMÜZ İŞLETMELERİNDE ENFORMASYON SİSTEMLERİ

COĞRAFİ BİLGİ SİSTEMLERİ İLERİ SEVİYE EĞİTİMLERİ BUILDING GEODATABASE EĞİTİMİ

TÜRKİYE HALK SAĞLIĞI KURUMU Strateji Geliştirme Daire Başkanlığı ULUSAL KAZA YARALANMA VERİTABANI (UKAY)

Apriori Algoritması. Konu İçeriği. Giriş. Tarihçesi. Apriori Nedir? Örnekler. Algoritma. Açıklama. Weka İle Kullanımı. Kaynakça.

Sistem Geliştirme Yaşam Döngüsü (The Systems Development Life Cycle) (SDLC)

CEN 416 DATA MINING DERSİ PROJESİ ÖĞRENCİLER AHMET AKAN MEHMET BAKAN

Yıldız Teknik Üniversitesi Bilgi Sistemi AutoCAD Map İle Gerçekleştirilen Bir Uygulama

I. Dünya Savaşı öncesi dağıtım ve satış yönlü

Yazılım Mühendisliği Bölüm - 3 Planlama. Cengiz GÖK

Semantik Ağ ve Üst Veri Sistemleri İçin Yeni Nesil Veri Tabanı Yönetim Modeli: NoSQL. R. Orçun Madran Atılım Üniversitesi.

Aracı Kurumlar ve Müşterileri İçin Portföye Canlı Bağlantı ve Eşzamanlı Emir Takip Sistemi APIC

2 İlişkisel Veritabanı Tasarımı ve Normalizasyon. Veritabanı 1

BİLGİSAYAR VE ENFORMASYON BİLİMLERİ YÜKSEK LİSANS DERS PROGRAMI (Tezli Program)

SAĞLIK BİLGİ SİSTEMLERİNİN TARİHSEL GELİŞİMİ

Transkript:

1 VERİ MADENCİLİĞİ

VERI TABANLARıNDA BILGI KEŞFI Veri Tabanlarında Bilgi Keşfi, veriden faydalı bilginin keşfedilmesi sürecinin tamamına atıfta bulunmakta ve veri madenciliği bu sürecin bir adımına karşılık gelmektedir. 2

VERI TABANLARıNDA BILGI KEŞFI VTBK, verinin nasıl depolanıp erişileceğinden, algoritmaların devasa veri setlerine nasıl ölçeklenebileceğine ve hala etkin olarak çalışmalarına, sonuçların nasıl yorumlanabileceği ve görselleştirilebileceğine ve bütün insan-makine interaksiyonunun kullanışlı olarak nasıl modellenip, desteklenebileceğine olmak üzere veriden bilginin keşfinin tüm süreçleri üzerine odaklanır 3

VERI TABANLARıNDA BILGI KEŞFI 4

BILGI KEŞFININ AŞAMALARı Uygulama alanını inceleme : Konuyla ilgili bilgi ve uygulama amaçları Amaca uygun veri kümesi oluşturma: Veri seçme Veri ayıklama ve önişleme : işlemin %70 lik bölümünü oluşturur Veri azaltma ve veri dönüşümü : incelemede gerekli boyutları (özellikleri) seçme, boyutlar arası ilişkiyi belirleme, boyut azaltma, Veri madenciliği tekniği seçme Sınıflandırma, eğri uydurma, bağıntı kuralları, demetleme Veri madenciliği algoritmasını seçme Model değerlendirme ve bilgi sunumu Bulunan bilginin yorumlanması 5

VERİ MADENCİLİĞİ NEDİR? 6

VERİ MADENCİLİĞİ NEDİR? Net bir tanımı olmamakla birlikte var olan tanımlar da çok büyük farklılık içermiyor. Aktif araştırma alanlarından biri olan veri tabanlarında bilgi keşfi (vtbk) disiplini, çok büyük hacimli verileri tam ya da yarı otomatik bir biçimde analiz eden yeni kuşak araç ve tekniklerin üretilmesi ile ilgilenen son yılların gözde araştırma konularından biridir. Veri madenciliği, önceden bilinmeyen, veri içinde gizli, anlamlı ve yararlı örüntülerin büyük ölçekli veritabanlarından otomatik biçimde elde edilmesini sağlayan vtbk süreci içinde bir adımdır. Veri madenciliği büyük miktarda veri içinden gelecekle ilgili tahmin yapmamızı sağlayacak bağıntı ve kuralların bilgisayar programları kullanarak aranmasıdır. Veri madenciliği, büyük hacimli veri yığınları içerisinden karar alabilmek için potansiyel olarak faydalı olabilecek uygulanabilir ve anlamlı bilgilerin çıkarılmasına verilen addır. Veri madenciliği geniş anlamda veri analiz teknikleri bütünüdür ve tek başına bir çözüm değildir. Mevcut problemleri çözmek, kritik kararları almak veya geleceğe yönelik tahminleri yapmak için gerekli olan bilgileri elde etmeye yarayan bir araçtır. Ortaya çıkarılması hedeflenen bilgiler; üstü kapalı çok net olmayan önceden bilinmeyen, daha önce keşfedilmemiş ancak potansiyel olarak kullanışlı anlamlı ve kritik bilgilerdir. Varlığıyla bulunduğu yerde bir anlam ifade eden verilerin bir disiplin altında toplanarak belirli bir teknik veya teknikler kullanılarak işlenmesiyle artıklarından arındırılması sonucunda anlamlı bilgileri gün yüzüne çıkaran ve geleceğe yön verebilmemizi sağlayan ve bu sonuçlara matematiksel ve istatistiksel yöntemlerle mutlaklık kazandıran bir süreçtir 7

VERİ MADENCİLİĞİ NEDİR? En temel ifadesiyle büyük veri kümelerinde bulunan ve insan algısının çok uzun zaman ve klasik yöntemlerle çok fazla çaba gerektirerek fark edebileceği faydalı veri paternlerinin bu kümelerden ayıklanmasıdır. Veri madenciliği, pek çok analiz aracı kullanımıyla veri içerisinde örüntü ve ilişkileri keşfederek, bunları geçerli tahminler yapmak için kullanan bir süreçtir. Veri madenciliği, en basit tanımıyla, veri tabanlarındaki ilişkili örüntüleri OTOMATİK olarak belirlemektir. Veri madenciliği veri kümesi içerisinde keşfedilmemiş örüntüleri bulmayı hedefleyen tekniklerdir. En temel özelliklerinden biri araştırmacının analizi yönlendirmesinden ziyade verinin analizi ve analisti yönlendirmesidir. 8

VERİ MADENCİLİĞİ NEDİR? Veri madenciliği henüz gelişmekte olan bir alan olduğu için pek çok farklı tanım yapmak mümkündür. Buna karşın, Veri madenciliğinin tek hedefi düşük düzeyde enformasyon sağlayan veriden, yüksek düzeyde kıymetli bilgiyi açığa çıkarmaktır. 9

VERI MADENCILIĞIN YAPıSı 10

VERİ MADENCİLİĞİ CEVAPLAYABİLECEĞİ SORULAR NELERDİR? 11

VERİ MADENCİLİĞİ CEVAPLAYABİLECEĞİ SORULAR Bilinmeyen bilgiyi ortaya çıkarmak için çalışır Bu sene potansiyel en iyi 10 müşterimiz kimler olacaktır sorusuna cevap arar Gelecek 5 sene şirketimiz hangi alanda büyümeli/büyüyebilir Bu hastanın hastalığı ne olabilir Kanseri erken teşhis edebilir miyim 12

VERI MADENCILIĞININ KULLANıM ALANLARı Finans Sektörü Haberleşme Sektörü Sağlık Sektörü Devlet Uygulamaları Büyük hacimde veri olan her yerde veri madenciliği kullanılabilir. 13

VERI MADENCILIĞININ TARIHÇESI 14

VERI MADENCILIĞININ TARIHÇESI 1950 ler İlk bilgisayarlar (Sayımlar için bilgisayarlar kullanılıyor) 1960 lar Veri kolleksiyonları Veritabanı yaratımı (Hiyerarşik ve ağ modelleri) 15

VERI MADENCILIĞININ TARIHÇESI 1970 ler İlişkisel veri modeli İlişkisel VTYS uygulamaları 1980 ler İlişkisel VTYS yaygınlaşıyor Uygulamaya yönelik VTYS (Mekansal, Bilimsel, Mühendislik, vs.) 16

VERI MADENCILIĞININ TARIHÇESI 1990 lar Günlük işlemlerden derlenen büyük miktarda verinin nasıl değerlendirilebileceği sorgulanmaya başlıyor. Bu noktada bahsedilmesi gereken birkaç önemli olay sözkonusu: 1989, KDD (IJCAI)-89 Veri Tabanlarında Bilgi Keşfi Çalışma Grubu toplantısı 1991, KDD (IJCAI)-89 un sonuç bildirgesi sayılabilecek Knowledge Discovery in Real Databases: A Report on the IJCAI-89 Workshop makalenin KDD ile ilgili temel tanım ve kavramları ortaya koyması 17

VERI MADENCILIĞININ TARIHÇESI 1992, Veri Madenciliği konusunda ilk yazılımın geliştirilmesi 1995, 1. Uluslararası Bilgi Keşfi ve Veri Madenciliği Konferansı nın (KDD-95) açılış konuşması 18

2000 ler Veri Ambarları, Veri Madenciliği yaygınlaşıyor. (Son 10 yılda veri depolama ünitelerinin fiyatlarında sürekli bir düşüş var.) 19

VERİ AMBARININ TANIMI Veri Ambarları, Veri Madenciliği ile eşanlı olarak anılan ve Veri Madenciliği sürecinin gerçekleştirildiği veriyi sağlayan özel bir veri tabanıdır. Tanım olarak Veri Ambarı, pekçok farklı kaynaktan ve genellikle de farklı yapıda verinin depolandığı ve hepsinin de aynı birleşik çatı altında kullanılmasının ümit edildiği yapılardır. Ayrıca, Veri Ambarı pek çok farklı kaynaktan elde edilen, farklı formatta veriyi aynı çatı altında analiz etme imkanı tanır. Veri ambarcılığı ise veri ambarını kurma ve kullanma sürecine denmektedir 20

Bir veri ambarı çoklu kaynaklardan (farklı veritabanlarından) gelen dataların toplanmasıyla oluşur. Buradan gelen datalar önce bazı aşamalardan geçer: - data cleaning - data integration - data transformation - data loading - data refreshing (periyodik olarak) Bir çok yerde şubesi olan bir şirketiniz olduğunu düşünün. Bu şirketin İstanbul, İzmir, Ankara şubelerinin veritabanları yukarıdaki aşamalardan geçer ve veri ambarı oluşturulur. 21

VERİ AMBARI MİMARİSİ 22

VERİ AMBARININ ÖZELLİKLERİ Kurumun operasyonel veri tabanından ayrı olarak yapılandırılmış bir karar destek veritabanıdır. Konsolide edilmiş, tarihi verileri sağlayarak bilgi işlemeyi destekler. Bir veri ambarı, yöneticilerin karar verme sürecine destek olmak üzere verinin Konuya yönelik Entegre Zamana bağlı değişen (zamana endeksli) Değişmez halini sunmaktadır. 23

VERI MADENCILIĞI ÖRNEK 24

SONUÇ Bir veri madenciliği çalışması için öncelikle çok miktarda kaliteli veri gerekir. Amaç bu veri içinde saklı, gelecekle ilgili tahmin yapmakta kullanılabilecek kural ve bağıntıların çıkarılmasıdır. Böyle bir çalışmanın başarılı olması için uygulama konusundaki uzmanların veri tabanları ve veri madenciliği konusundaki uzmanlarla beraber çalışması gerekir. Çalışma uzun sürebilir; zaman ve sabır gerekir. 25