Veri Madenciliği Projelerinin Yaşam Döngüsü - 1



Benzer belgeler
VERİ KAYNAKLARI. Bilgi sisteminin öğelerinden biride veri

LOGO İş Zekası çözümü ile kurumsal raporlama ve analizler. Cem Yılmaz Genel Müdür LOGOBI Yazılım

VERİ MADENCİLİĞİNE BAKIŞ

1. Oracle Data Miner 11g Release 2 Kurulumu Aşamaları

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

İş Analitiği'ne Netezza ile Yüksek Performans Katın

TARBİL Kapsamında Uydu ve Yersel Veri Tespit, Kayıtçı İşlem Yönetim Sistemi Geliştirilmesi

Planla, Tahmin Et, Yönet IBM Perakende Planlama Çözümleri

Veritabanı Yönetimi Bilgisayarların. Keşfi Hedefler. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi

ArcGIS ile Su Yönetimi Eğitimi

VERI TABANLARıNDA BILGI KEŞFI

Başlıca Ürün-Bilgi Sistemleri

SPSS & AKILLI KURUMLAR. Dr. Tülin GÜZEL ÖZDEMİR SPSS Türkiye Genel Müdür tguzel@spss.com.tr

1 Temmuz 2014 Netsis Standard 2 1 Temmuz 2014

Kepware Veritabanı Ürünleri. Teknolojiye Genel Bir Bakış

İşletmenize sınırsız fırsatlar sunar

İş Zekâsı Sistemi Projesi

Veritabanı, Veri Madenciliği, Veri Ambarı, Veri Pazarı

Giriş Düzeyinde Örnek Bir Veri Madenciliği Projesi-1

Veri Ambarından Veri Madenciliğine

BİLİŞİM SİSTEMLERİNİN PRENSİPLERİ

VERİ TABANI UYGULAMALARI

BİLGİYİ YÖNETME. Mustafa Çetinkaya

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veritabanı Sistemleri

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

VARLIK YÖNETİMİ ÇÖZÜMÜ AKILLI. KOLAY. ENTEGRE

COĞRAFİ BİLGİ SİSTEMLERİ ArcGIS SERVER A GİRİŞ EĞİTİMİ

T.C. MALTEPE ÜNĠVERSĠTESĠ MÜHENDĠSLĠK FAKÜLTESĠ ENDÜSTRĠ MÜHENDĠSLĠĞĠ BÖLÜMÜ LĠSANS PROGRAMI Güz Yarıyılı

YÖNETİM BİLGİ SİSTEMLERİ İŞLETME ZEKASININ TEMELLERİ VERİTABANI VE BİLGİ YÖNETİMİ

2-Veritabanı Yönetim Sistemleri/ Temel Kavramlar

Mesleki Terminoloji II Veri Madenciliği

VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN

IceWarp kurulumu. IceWarp Server kurmanız için yapmamız gereken adımlar şunlardır:

AKADEMEDYA YAZILIM BİLGİSAYAR EĞİTİM VE DANIŞMANLIK TİC. SAN. LTD. ŞTİ Kocaeli Üniversitesi Yeniköy Teknopark Yerleşkesi Başiskele / Kocaeli Tel Faks

MS SQL SIKÇA SORULAN SORULAR

Bölüm 1: Veritabanı Yönetim Sistemlerine Giriş

bilişim ltd İş Zekâsı Sistemi

Gökay Çiçek İş Geliştirme Müdürü

PARALEL VERİ MADENCİLİĞİ ALGORİTMALARI. BAŞARIM 09, Nisan 2009, ODTÜ, Ankara

Veri Tabanı Yönetim Sistemleri Bölüm - 3

SİSTEM ANALİZİ VE TASARIMI. Sistem Analizi -Bilgi Sistemleri-

MIKROSAY YAZILIM ve BİLGİSAYAR SAN. TİC. A.Ş

Orhan ŞEN. Cybersoft Enformasyon Teknolojileri Ltd. Şti. Gebze Yüksek Teknoloji Enstitüsü

İş Zekası için Dört-Katmanlı Veri Modellemesi Gerçekleştirimi. Harun Gökçe EG Yazılım, TOBB ETÜ

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) İş Kuralları ve Veri Modelleri

Bilgiyi Keşfedin! Özelleştirme, Eklenti ve Veri Entegrasyonu Kurumsal Seviyede Yönetim ve Performans

VERİ MADENCİLİĞİ (Karar Ağaçları ile Sınıflandırma) Yrd.Doç.Dr. Kadriye ERGÜN

GENCAY KARAMAN. DBA & Data Mining/Business Intelligence Specialist

Veritabanı. Ders 2 VERİTABANI

Değerlendirme Soruları 140. Şerit Kullanımı 124 Şerit Sekmeleri 124 Şeridi Gizleme 125 Eklentiler 125

TÜRK TELEKOM COĞRAFİ BİLGİ SİSTEMLERİ PROJESİ (TTCBS)

Veri Ambarları. Erdem Alparslan

Web Madenciliği (Web Mining)

Veritabanı Tasarımı. Introduction to the Oracle Academy

JetMail (Toplu Mail) Platformu Genel Teklifi

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veri Modelleri

Uzaktan Algılama Uygulamaları

iş zekası business intelligence- harita- performans göstergeleri - balanced scorecard 7 boyut da görsel tasarım LOGOBI İş Zekası Platformu

İGABİS. İGDAŞ Altyapı Bilgi Sistemi

İŞ ZEKASI (BI * ) Veriniz geleceğe ışık tutsun İşinizi geleceğe göre planlayın

Yıldız Teknik Üniversitesi Bilgi Sistemi AutoCAD Map İle Gerçekleştirilen Bir Uygulama

1 Temmuz 2014 Netsis Standard 2 1 Temmuz 2014

ÜNİTE NESNE TABANLI PROGRAMLAMA I. Uzm. Orhan ÇELİKER VERİTABANI SORGULARI İÇİNDEKİLER HEDEFLER

Karar Destek Sistemleri

TIGER PLUS FİYAT LİSTESİ 1 Aralık 2010 tarihinden itibaren geçerlidir.

Bütçelemenin En Kolay Hali!

Trafik Yoğunluk Harita Görüntülerinin Görüntü İşleme Yöntemleriyle İşlenmesi

Sabit Kıymet Yönetimi

Veritabanı Tasarımı Ve Yönetimi. Varlık-İlişki Modeli

DMP. IAB Türkiye Programatik Çalışma Grubu. Tarafından Hazırlanmıştır

worksforce Saha Satış Otomasyon Çözümü

BAŞAK ÇOBAN MERVE SARITAŞ AZİME AKÇAÖZ BÜŞRA AYDEMİR

Hazırlayan: EMRAH HAS

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN

TeamBase5 BELEDİYE İLETİŞİM MERKEZİ SIEMENS

12 Mayıs s 2009, Salı

AVĐVASA da Veri Madenciliği Reşat Fırat ERSĐN Stratejik Planlama ve ĐşGeliştirme Birim Yöneticisi

Şeffaf İnsan Kaynakları. Aktif personel. Etkin yönetici

Nebim Winner - İş Zekası Halojen Kurumsal Sürüm

HAM VERİNİN NİTELİKLİ BİLGİYE DÖNÜŞTÜRÜLME SÜRECİ

Satış ve Pazarlama Süreçlerinizde Müşteri Verisinin Rolü Nedir? Her hakkı saklıdır

OBEE (Call Statistic Reporter)

CRM in Telekom Platformunda Uygulanması. Hazırlayanlar: Zuhal Vargün Danışman: Prof.Dr. Levent Toker

Natura 2000 VERI TABANı (GÖREV 2)

MasterFi. İş Analitiği Çözümleri. Müşteri portföy analizlerinde yeni bir devir!

Street Smart Marketing

BÖLÜM 2. Bilişim Sistemleri, İş Süreçleri ve İşbirliği. Doç. Dr. Serkan ADA

NEDEN DOĞULİNE. Detaylı Analiz. Doğru Planlama. Hedef Kitleye Uygunluk. Doğru İçerik Stratejisi. 7/24 Destek. Deneyimli Ekip

BIM 312 Database Management Systems. Veritabanı Kavramına Giriş

T.C GAZİOSMANPAŞA ÜNİVERSİTESİ

DruzOnline Otomasyon Programı Kurulum Bilgileri

Olasılık ve İstatistik nedir? Bilgisayar Mühendisliğindeki yeri

Öğr. Gör. Serkan AKSU 1

8 Haziran 2007 TBD İstanbul Bilişim Kongresi

Mio Tool. Mio Tool Kullanım Klavuzu, Nisan 15, 2017 V 1.0 1

Algoritma Geliştirme ve Veri Yapıları 9 Ağaç Veri Modeli ve Uygulaması. Mustafa Kemal Üniversitesi

Demetleme Yönteminin Y 3-Katmanlı Mimari Yapı ile Gerçeklenmesi. eklenmesi. KalacakYer.com

Veritabanı Yönetim Sistemleri, 2. basım Zehra ALAKOÇ BURMA, 2009, Seçkin Yayıncılık

Bilgi Servisleri (IS)

Transkript:

Veri Madenciliği Projelerinin Yaşam Döngüsü - 1 Özet : Bu makalemizde Veri Madenciliği projelerinin yaşam döngüsünü inceleyeceğiz.veri Madenciliği projelerinde takip edilmesi gereken başlıca adımları ve bu adımlarda yapılması gereken temel işlemlere ışık tutacağız. Makale : Veri Madenciliği Projelerinin yaşam döngüsü sırasıyla şu aşamalardan oluşmaktadır. 1) Data nın Toplanması : Veri Madenciliği projeleri için ilk adımımız genellikle data nın toplanmasıdır.veri Madenciliğinde kullanacağımız dataları, Database,Datamart yada Datawarehouse umuzdan data analizi için toplamımız gerekmektedir. Data yı toplayacağımız kaynaklar yada kullanabileceğimiz data çeşitleri ise şunlardan oluşabilir.(bunlara bağlı olarak data yı alacağımız yere göre de Veri Madenciliği imkanları değişiklik göstermektedir.) a) İlişkisel Veri Tabanları :RDMS (Relational Database Management System) olarak adlandırılan Veri Tabanı,temel veri işlemlerinin yapıldığı (DML) yerdir.bu tip veritabanlarında Normal Formların kurallarına göre tasarlanmıştır. İlişkisel Veri Tabanları için Entity-Relationship (ER) veri modeli tasarlanmıştır ve bu model, tablolar arasındaki ilişkileri gösterir.(ilişkisel Veri Tabanları hepimizin günlük hayatımızda kullandığımız MS- SQL Server, Oracle,DB2,MySql gibi sistemlerdir ) b) Veri Ambarları : Veri Ambarları; RDMS gibi farklı kaynaklardan bilgilerin toplandığı ortak bir alandır. Veri Ambarlarında,RDMS sistemlerin tersi bir şekilde sadece işimize yaracak özet bilgiler tutulur.(örneğin satışların bölgelere yada aylara göre özeti gibi) Veri Ambarları genellikle çok boyutlu database yapıları gibi modellenir ve her boyut bir attribute dür, her hücre ise bir toplamdır (toplam satış miktarı gibi).gerçekte Veri Ambarları nın fiziksel yapısı ilişkisel data alanları yada çok boyutlu veri küpleri (Data Cube) şeklinde olabilir.

c) İşlemsel Veri Tabanları (Transactional Databases) : Herbir kayıdın bir hareketi(transaction) gösterdiği dosyalardır.transactional dosyalarda herbir kayıt bir ID ile ifade edilir ve aynı ID değerine sahip transactionda yapılan işlemler sıralanır. Transactional Databaselerde T100 numaralı işlemde satın alınan ürünler hangisidir? gibi soruların cevabı bulunabilir.birliktelik (Association ) ilişkilerinde sıkça kullanılacak dataları içermektedir. d) Uzaysal Veritabanları (Spatial Database) : Uzaysal veritabanlarına harita veritabanları ve uydu görüntüleri örnek olarak verilebilir.orman ve Ekolojik planlamada,telefon ve elektrik kablolarının döşenmesi gibi kamu hizmetlerinin kullanımda bu tip data kullanılmaktadır. e) Metin Veritabanları ve Multimedya Veritabanları : Metin veritabanları uzun cümleler ve paragraflardan oluşan,içerisinde uyarı mesajları,buglar raporları gibi metinsel ifadeler içeren veritabanlarıdır.metin verileri üzerine yapay zeka algoritmaları da kullanılarak müşterilerden gelen talep ve istekler üzerine CRM projeleri geliştirilebilir. Multimedya veritabanları ise görüntü,ses,video verisi gibi verilerden oluşmaktadır.ses ve görüntü tanıma temelli projelerde kullanılacak verilerdir. f) İnternet (The World Wide Web) : Kullanıcıların internetde bırakmış oldukları verilerdir diyebiliriz.şöyle ki kullanıcıların bir alışveriş sitesinde tıkladığı linkleri analiz ederek doğru reklam politikaları izlenebilir. 2) Data nın Temizlenmesi ve Yeniden Yapılandırılması (Cleaning and Transformation) : Veri Madenciliği projelerinin 2.aşaması olan Data nın Temizlenmesi ve yeniden yapılandırılması (data cleaning and transformation) aşaması yoğun bir şekilde,veri kaynağıyla ilgili işlemleri içermektedir. Data nın temizlenmesinden kasıt; gürültülerin (yanlış yada aşırı uç değerlere sahip verilere gürültülü veri denir.örneğin doğum tarihinin 1200 olması gibi). Data nın temizlenmesi ve yeniden yapılandırılmasında uygulanan yöntemler ise şunlardır. a) Data Tipinin Transformasyonu:Basit olarak veri tipinin türünün yeniden yapılandırılmasıdır.bazı Veri Madenciliği algoritmaları sadece integer (sayısal) tiplerdeki verilerle hızlı bir şekilde çalışırken,kimisi de mantıksal verilerle(boolean) hızlı bir şekilde çalışmaktadır.

b) Sürekli Kolonların Transformasyonu : Bu yeniden yapılandırma türünde; sürekli veriler Normalizasyon işleminden geçirilmektedir.örneğin 500 TL ile 20000 TL arasında değişen maaş verilerini 4 gruba bölmüş olalım (500-1000,1000-5000,5000-10000,10000-20000 gibi). Yapay Sinir Ağları benzeri algoritmalar bu verileri kabul etmeyecektir.işte eldeki bu gibi verileri 0.0-1.0 gibi aralıklara indirme işlemine Normalizasyon denmektedir.(normalizasyon işlemi için çeşitli yöntemler vardır.bunlar;min-maks normalizasyonu,sıfır ortalama normalizasyonu,ondalıklı normalizasyondur.) c) Gruplama :Gruplama işlemiyle,aslında ayrı gibi görünen bölümlerin ortak bir paydada birleştirilmesi söz konusudur.örneğin;bilgisayarmühendisliği,elektrik Mühendisliği,Endüstri Mühendisliği,Eczacılık,Doktorluk gibi ayrılmış meslek gruplarımız olsun.bu meslek grupları yeniden yapılandırılarak Mühendislik,Eczacılık,Doktorluk gibi daha düzgün bir sınıflandırmaya hazır hale getirilebilir.bu uygulama,bize zamandan kazanç olarak geri dönecektir. d) Kümeleme : Kümeleme ise ; bir başka verinin yeniden yapılandırma sürecidir.örneğin bir GSM operatörü müşterilerini aylık konuşma verilerine göre segmente etmeye çalışıyor olsun.çözüm olarak çok fazla detaylı bilgiden sıyrılabilmek amacıyla,toplam görüşme sayılarına göre kümeleme yapılmalıdır.(kümeleme aslında bir veri madenciliği modelidir.) e) Kayıp Verilerin İşlenmesi : Verilerin yeniden yapılandırılması aşamasında bir diğer önemli konu ise kayıp yada Null değerlerin ne olacağı sorusudur.iki farklı OLTP sisteminin birleştirilmesi sonucunda kayıp değerler ortaya çıkabileceği gibi bilgi giriş elemanları yada müşteriler tarafından bilerek yada bilmeyerek yanlış veya boş değerler(null Values) oluşabilmektedir. Gerçekleştirilecek projenin ve kayıp,yanlış olan verilerin durumuna göre farklı çözümler bulunabilir. i)kayıp verilerin bulunduğu kayıdı, veri kümesinden çıkarmak yada bu gibi kayıtları iptal etmek.(eğer kayıp verinin miktarı toplam verinin içinde küçük bir değerse) ii) Kayıp verileri elle teker teker doldurmak (Kullanılan Veritabanı küçükse ve gerçek hayatta kayıp verilere ulaşmak kolay ve zaman problemimiz yoksa) iii) Tüm kayıp verilere aynı bilgiyi vermek.örneğin doğum tarihi bilgisini vermemiş müşterilerimiz varsa bunlar için DTY(doğum tarihi yok) şeklinde bir veri girişi yapılabilir.ama buradan çok farklı bir sonuç ortaya çıkıp;doğum tarihini vermemiş olan kişilerin bir ortak özelliği olduğu ve aynı davranışı sergiledikleri, tahmin edilemeyen bir satış fırsatını ortaya çıktığı durumlar da olabilir.(örneğin doğum tarihini yazmayan kişilerin bakım ürünlerini daha çok satın alması gibi) iv)kayıp olan verilere tüm verilerin ortalama değerinin verilmesi. v)regresyon yöntemi kullanılarak, diğer değişkenlerin yardımıyla kayıp olan verilerin tahmin edilmesi.

f) Uç Verilerin Ortadan Kaldırılması : Bazı durumlarda aşırı uç veriler(ortalama değerlere göre çok düşük yada çok yüksek değerlere sahip veriler ) projenin başarı oranının düşmesine neden olabilir.eğer bu veriler oran olarak kayıda değer bir sayıda değilse,yok sayılabilir.(hassasiyeti etkileyecek seviyedelerse faydadan çok zarar da oluşabilir.) Bunlar dışında da birçok veri temizleme ve verileri yeniden yapılandırma tekniği mevcutdur.sql Server Integration Services(SSIS)yardımıyla,bu makalede saymış olduğum teknikler uygulanabilmektedir. Bu makalemizde Veri Madenciliği yaşam döngüsünün ilk 2 aşaması hakkında (Data nın toplanması ve Temizlenmesi,Yeniden Düzenlenmesi) bilgiler vermeye çalıştım.bir sonra ki bağlantılı makalemde,sonraki aşamalar hakkında detaylı bilgiler sunmaya devam edeceğim. Başka bir İş Zekası makalesinde görüşmek dileğiyle... Bilgehan GÜRÜNLÜ www.gurunlu.com bilgehan@gurunlu.com Kaynaklar : Data Mining with Sql Server 2005. Data Mining:Concepts and Techniques. Kavram ve Algoritmalarıyla Veri Madenciliği (G.Silahtaroğlu)

Veri Madenciliği Projelerinin Yaşam Döngüsü - 2 Özet : Bir önceki makalemizde Veri Madenciliği Projelerinin yaşam döngüsünün ilk 2 adımı olan Data nın toplanması ve Data nın temizlenip,yeniden yapılandırılması aşamalarını detaylıca incelemiştik.bu makalemizde ise;model Oluşturma,Modelin Keşifi (Doğrulanması,değerlendirilmesi),Raporlama,Tahmin(Skorlama),Uygulamalarla Entegrasyonu ve en son olarak da Modelin yönetilmesi aşamalarını inceleyeceğiz. Makale : İlk 2 aşamamızı bir önceki makalemizde anlatmıştık,şimdi kaldığımız yeren itibaren (3.aşamadan itibaren) incelemeye devam ediyoruz. 3) Model Oluşturma (Model Building) : Veriler temizlendikten ve değişkenler yeniden düzenlendikten sonra sıra geldi Veri Madenciliği Modelimizi oluşturmaya.veri Madenciliği projemizde modelimizi oluştururken hedeflerimizin neler olduğunu ve hangi tip verilerle nasıl bir veri madenciliği görevini gerçekleştireceğimizi asla unutmamalıyız.projemizin;bir sınıflandırma(classification) mı? Birliktelik(Association,Market Basket Analyse) mi? yoksa bir segmentasyon projesi mi olacağı gerçeğinden yola çıkarak modelimizi oluşturmalıyız.model oluştururken iş analistlerimizle beraber ortak kararlar almak zorundayız.örneğin telekom sektörü için bir proje gerçekleştiriyorsak;ilgili uzmanlık yetkinliklerine sahip,bölüm yöneticilerini de proje ekibine dahil etmek akıllıca olacaktır. Model oluşturmak veri madenciliği için çok önemli bir aşamadır.bu aşamada öncelikle hangi tip veriyle,hangi tip veri madenciliği görevini gerçekleneceği çok iyi anlaşılmalı ve buna uygun algoritmalar seçilmelidir.bazı durumlarda,modelin eğitilmesi öncesinde,hangi algoritmanın elimizdeki data için uygun olduğu bilinmeyebilir.bu gibi durumlarda attribute ların ilişkileri incelenerek hangi alogitmanın kullanılacağına karar verilebilir.örneğin input attributelar ve tahmin edilecek(class attribute) arasında liner bir ilişki mevcutsa karar ağaçları (Decision Tree,classification algorithm) kullanılması yerinde olacaktır.bir başka örnek için attribute lar arasında ilişki karmaşık ise yapay sinir ağı algoritmaları kullanılmalıdır. Modelimizin oluşturulmasında kullanacağınız algoritmanın projeniz için doğru algoritma olup olmadığını ;farklı algoritmaları lift chart gibi toollarda kullanarak görebilirsiniz.(bir sonra ki adımda lift chart dan bahsedeceğim). 4) Modelin Keşfi (Model Assessment) : Bir önceki adımımızda (Modelin Oluşturulması) farklı algoritmalara ve parametrelere göre modelimizi oluşturmaya çalıştık.peki seçmiş olduğumuz algoritmanın bizim projemiz için en doğru algoritma olduğuna nasıl karar vereceğiz.işte bu noktada karşılaştırma yapmak amacıyla bazı toollar karşımıza çıkıyor. Bu toollar arasında en sık kullanılan Lift Chart adlı tooldur.lift Chart ile değerlerin tahmin edilmesi için model eğitilmekte ve dataset test edilmektedir.lift Chart değerlerin tahmin edilmesi ve olasılıklarının hesaplanması esasına dayanarak,grafiksel olarak modeli bize göstermektedir.

Modelin keşfi aşamasında sadece toolları kullanıp sonucun doğru olup olmadığını teknik insanların tek başlarına karar vermesi uygun değildir.bu aşamada çıkan örnek sonuçlar projenin yapıldığı departmanın uzmanlarıyla tartışılıp,sonucun doğruluğuna karar verilmelidir. Bazı durumlarda model yararlı desenler (patterns) içermeyebilir.bunun temelde 2 tane nedeni vardır.birincisi data,tamamen rastgele seçilmiştir ki birçok durumda gerçek datasetler zengin bilgiler içerir.ikinci sebep ise kurulan modelde;değişkenlerin kullanım için en uygunlarından seçilmiş olmamasıdır.bu durumla daha sık karşılaşılır,çözüm olarak data temizleme ve yeniden yapılandırma aşaması daha anlamlı değişkenler için tekrar edilir. Veri Madenciliği birçok aşamadan oluşan bir döngü şeklinde yapıya sahip olduğundan dolayı bazı aşamalara geri dönüşler yapılabilir. 5) Raporlama: Raporlama; veri madenciliği sonuçlarını gösterebilmek için en etkili kanaldır.bazı veri madenciliği projelerinin amacı pazarlama çalışmaları için raporlar sunmak olabilir.hemen hemen bütün veri madenciliği toolları kullanıcısına metinsel ve grafiksel rapor çıktıları alabilme imkanını sunar.(desenlerle ilgili yada tahminlerle ilgili olarak.) 6)Tahminleme(Prediction,Scoring): Bazı veri madenciliği projelerinin süresinin neredeyse yarısı desenlerin bulunmasıyla geçmektedir.daha sonrasında bulunan model kullanılarak tahminleme yapılır.(tahminleme;prediction,veri madenciliği terminolojisinde scoring olarak da geçer).tahminleme yapabilmemiz için eğitilmiş bir model ve kurgulanmak için hazır bir senaryoya ihtiyaç vardır. Bankaların müşterilerine kredi vermek için yaptığı inceleme senaryosunu düşündüğümüzde,kredi riski üzerine eğitilmiş bir model vardır.bankaya hergün binlerce kredi talebi

gelmektedir ve bu talepler risk değerlendirme modeline göre tahminler yürütülerek,potansiyel risk oluşturan başvuruları belirlenmektedir. 7)Uygulamanın Entegrasyonu : İş uygulamalarında ki gömülü veri madenciliği entegrasyonları yapılan tüm işlerin ve çalışmaların zeka kısmını oluşturmakla birlikte analiz döngüsünün de son basamağıdır.gartner a göre ;önümüzdeki yıllarda daha fazla iş uygulamasının içerisinde,gömülü veri madenciliği bileşenlerini görebileceğiz ve bu tür iş uygulamaları bizim için ayrı bir değere sahip olacaktır. Örneğin,CRM (Customer Relationship Management,Müşteri İlşikileri Yönetimi) müşterileri segmente etmek için Veri Madenciliği özelliklerinden faydalanmaktadır.son zamanlarda işletmelere yeni bir soluk getiren ERP (Enterprise Resource Planning,Kurumsal Kaynak Planlama) uygulamaları ise üretim tahminleri için Veri Madenciliği özelliklerinden yararlanmaktadır. Bir kitap alışveriş sitesini düşündüğümüzde müşterilerine gerçek zamanlı olarak kitap tavsiyelerinde bulunabiliyorsa bu, Veri Madenciliğinin bir maharetidir.iş uygulamalarının bu tip gerçek zamanlı tahminlerde bulunması,veri Madenciliği projelerinin önemli bir aşaması olan Entegrasyon aşamasının sonunda gerçekleşmektedir 8)Modelin Yönetimi: Buraya kadar ki aşamalarda modelimizi oluşturduk,tahminlerimizi yaptık,crm ve ERP benzeri yapılarımızla entegrasyonu sağladık.ama her madencilik modeli bir yaşam döngüsüne sahiptir ve bazen statik bir şekilde çalışabilir, ve sık aralıklarla tekrardan eğitilmeye ihtiyaç duymayabilir.fakat veri nin sıkça değiştiği durumlarda tekrar eğitilmeye ihitiyaç duymaktadır.örneğin online kitap mağazasına hergün yeni kitaplar ürün listesine dahil edilmektedir.gelen her kitap içinde,hergün yeniden bir ilişki kurulması gerekmektedir.bu süreçte madencilik modelleri sınırlıdır ve yeni versiyon sıklıkla bir model oluşturmaktadır.eninde sonunda bu modelin doğruluğu test edilmesi ve yeni versiyonun oluşturulması otomatik işlemlerle tamamlanmış olmalıdır. Veri Tabanlarında(RDMS) olduğu gibi madencilik modelleri için de en önemli yönetim konularının başında güvenlik konuları gelmektedir.madencilik modelleri desenler içermektedir ve bu değişik sayıdaki desenin okuma,yazma,tahmin gibi haklarını farklı kullanıcı profilleri için korunmak zorundadır.madencilik modeline erişecek sınırlı sayıdaki kullanıcıların,hakları proje yöneticisi tarafından gerektiğinde verilmeli yada görevlendirmeler bittiğinde geri alınmalıdır. Bu iki makalemizde;veri Madenciliği Projelerinin yaşam döngüsü nün basamakları ve bu basamakların içerikleri hakkında yeterince bilgi sahibi olduğumuzu düşünüyorum. Başka bir İş Zekası makalesinde görüşmek dileğiyle... Bilgehan GÜRÜNLÜ www.gurunlu.com bilgehan@gurunlu.com Kaynaklar : Data Mining with Sql Server 2005.