Veri Ambarları. Erdem Alparslan

Benzer belgeler
SMY 535, Veri Madenciliği 2

Veritabanı, Veri Madenciliği, Veri Ambarı, Veri Pazarı

İş Zekası ve Veri Ambarı Sistemleri. Nergiz Ercil Çağıltay

VERI TABANLARıNDA BILGI KEŞFI

Veri Ambarları ve Veri Madenciliği (ISE 350) Ders Detayları

İş Zekâsı Sistemi Projesi

bilişim ltd İş Zekâsı Sistemi

ELIF KIOTZEOGLOU RESUL MURAD MERT PACOLARI

VERİ TABANI SİSTEMLERİ

Maltepe Üniversitesi Endüstri Mühendisliği Bölümü Veri Tabanı Yönetimi (END 210)

Veri Tabanı Yönetim Sistemleri Bölüm - 3

Bilgisayar Mühendisliğine Giriş. Yrd.Doç.Dr.Hacer KARACAN

Veritabanı Yönetimi Bilgisayarların. Keşfi Hedefler. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi

VERİ KAYNAKLARI. Bilgi sisteminin öğelerinden biride veri

İş Zekası. Hafta 3 Veri ambarları. Yrd. Doç. Dr. H. İbrahim CEBECİ

Veritabanı Tasarımı. İlişkisel Veritabanı Kavramlarına Giriş

1 Temel Kavramlar. Veritabanı 1

Maltepe Üniversitesi Bilgisayar Mühendisliği Bölümü Veri Tabanı ve Yönetimi (BİL 301)

İş Zekası için Dört-Katmanlı Veri Modellemesi Gerçekleştirimi. Harun Gökçe EG Yazılım, TOBB ETÜ

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veri Modelleri

BAŞKENT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ HASTANE BİLGİ YÖNETİM SİSTEMLERİNDE İŞ ZEKASI UYGULAMASI MUSTAFA KAAN GÖZCÜ

İş Analitiği'ne Netezza ile Yüksek Performans Katın

LOGO İş Zekası çözümü ile kurumsal raporlama ve analizler. Cem Yılmaz Genel Müdür LOGOBI Yazılım

Veritabanı Yönetim Sistemleri, 2. basım Zehra ALAKOÇ BURMA, 2009, Seçkin Yayıncılık

VERİ TABANI YÖNETİM SİSTEMLERİ

Mühendislikte Veri Tabanları Dersi Uygulamaları (MS-Access)

VERİ TABANI YÖNETİM SİSTEMLERİ

UZAKTAN EĞİTİM MERKEZİ

Veri Tabanı-I 1.Hafta

MIS 325T Servis Stratejisi ve Tasarımı Hafta 7:

Bütünleşik Örnek Olay Çalışması: Bandon Grup Şirketi. Bölüm 1 Kurumsal Kaynak Planlaması Sistemlerine Giriş 1

1. Medisoft ile ETS arasındaki bütünle ik yapı : hatasız ve hızlı ETS hastane otomasyonu için neden çok önemlidir :

Bir Taşla Çok Kuş SAP İş Analitikleri Baştan Sona Paket Çözüm. Muzaffer YÖNTEM / Ülke Yöneticisi 9 Aralık 2014, Salı

Bilgi Servisleri (IS)

NoSql ve MongoDB. Saygın Topatan

İnternet Programcılığı

2 Temel Kavramlar (Devam) Veritabanı 1

Bulut ta Raporlama Bulut ta Kurumsal Performans Yönetimi kurumunuz için uygun mu?

BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi

Kepware Veritabanı Ürünleri. Teknolojiye Genel Bir Bakış

BIM 312 Database Management Systems. Veritabanı Kavramına Giriş

1 BILGI TEKNOLOJILERI VE YÖNETIM

İş Zekası Sistemi Veriyi Stratejik Bilgiye Dönüştürür

İç Mimari için BIM 1. bölüm

DITA ile Uygulama Belgeleri Hazırlamak


VERİ TABANI YÖNETİMİ. Yrd.Doç.Dr. Füsun BALIK ŞANLI YTÜ

İlişkisel Veri Tabanları I

Swing ve JDBC ile Database Erişimi

OPERASYONEL ÜSTÜNLÜK VE TÜKETİCİ YAKINLAŞMASINI SAĞLAMAK ve KURUMSAL UYGULAMALAR

SİSTEM ANALİZİ VE TASARIMI. Sistem Analizi -Bilgi Sistemleri-

MİLLİ SAVUNMA ÜNİVERSİTESİ KARA HARP OKULU DEKANLIĞI BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ DERS TANITIM BİLGİLERİ

Dava Yönetİm Paketİ. İnnova Hukuk Yönetim Sistemi. Uçtan uca dava yönetimi. İnnova teknolojisiyle hukuki süreçlerinizi hızla sonuca ulaştırın.

RotamNet Ticari Programı Kısa Tanıtım Dökümanı

END3061 SİSTEM ANALİZİ VE MÜHENDİSLİĞİ

BİLGİYİ YÖNETME. Mustafa Çetinkaya

DENİZ HARP OKULU BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) İş Kuralları ve Veri Modelleri

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veritabanı Sistemleri

1 Temel Kavramlar. Veritabanı 1

Sistem Geliştirme Yaşam Döngüsü (The Systems Development Life Cycle) (SDLC)

YÖNETİM BİLİŞİM SİSTEMLERİ

Business Intelligence and Analytics Principles and Practices: Charting the Course to BI and Analytic Success

Veritabanı Uygulamaları Tasarımı

MİKRO V15 İLE GELEN BAZI YENİLİKLER

Veritabanı. Ders 2 VERİTABANI

Web tabanlı altyapı sayesinde her cihazdan erişilebilir ve düzenlenebilir dokümanlar oluşturulup anında paylaşılabilir.

BELSİS-EBYS ELEKTRONİK BELGE YÖNETİM SİSTEMİ

Veri Ambarı (Data Warehouse)

BAYİ YÖNETİM ÇÖZÜMÜ A K I L L I. K O L A Y. E NTEGRE

Bütçelemenin En Kolay Hali!

Proje Çevresi ve Bileşenleri

TCMB Deneyim Raporu. Kurumsal Java Uygulama Platformu. Sacit Uluırmak. Türkiye Cumhuriyet Merkez Bankası Sistem Araştırma ve Planlama Müdürlüğü

Bölüm 2 Varlık-İlişki Veri Modeli: Araçlar ve Teknikler. Fundamentals, Design, and Implementation, 9/e

Fiziksel Veritabanı Modelleme

Copyright 2012 EMC Corporation. All rights reserved.

Yedek Nasıl Alınır? "Veri Tabanı Yedekleme ve Geri Alma" butonunu tıklayınca aşağıdaki gibi bir ekran açılacaktır.

Bilişim Sistemleri. Modelleme, Analiz ve Tasarım. Yrd. Doç. Dr. Alper GÖKSU

Bilgi ve İletişim Teknolojileri (JFM 102) Ders 7. LINUX OS (Sistem Yapısı) BİLGİ & İLETİŞİM TEKNOLOJİLERİ. LINUX Yapısı

VERİ TABANI YÖNETİM SİSTEMLERİ Melih BÖLÜKBAŞI

EMC Veri Yedekleme ve Arşivleme Çözümleriyle Oyunun Kurallarını Değiştirin

CEO - Yönetim Raporlama Sistemi

1. VERİ TABANI ARAÇLARI

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

Genel Kavramlar. Bilgisayar ortamında işlenebilecek durumda bulunan kayıtlar. Birbiri ile ilişkili veriler topluluğu ve veriler arası ilişkiler

VERİTABANI ORGANİZASYONU

Kısaca. Müşteri İlişkileri Yönetimi. Nedir? İçerik. Elde tutma. Doğru müşteri Genel Tanıtım

SYNCGUIDE. Çok Kanallı Ürün Bilgi Yönetimi. SYNCGUIDE, GDSN uyumlu veri senkronizasyonu ve ürün bilgisi yönetim sistemidir.

Veri ve Dosya Yapıları. Kütük Organizasyonu 1

IBM Big Data. Emre Uzuncakara Big Data Sales IBM Corporation

Ahmet YAŞAR Sigortayeri Sigorta ve Reasürans Brokerliği - Genel Müdür

VERİ TABANI UYGULAMALARI

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 1 ( yılı ve sonrasında birinci

HAM VERİNİN NİTELİKLİ BİLGİYE DÖNÜŞTÜRÜLME SÜRECİ

Coğrafi Bilgi Sistemlerine Giriş. Ünite 5 - Veri Tabanı Yönetim Sistemleri

9.DERS Yazılım Geliştirme Modelleri

Kredi Limit Optimizasyonu:

SİSTEM ANALİZİ ÖĞR. GÖR. MUSTAFA ÇETİNKAYA DERS 2 > GÜNÜMÜZ İŞLETMELERİNDE ENFORMASYON SİSTEMLERİ

Transkript:

Veri Ambarları Erdem Alparslan

İçerik Veri Ambarı nedir? Data Mart OLTP ve Veri Ambarı arasındaki farklar Veri Ambarının Yararları Veri Ambarı Mimarileri Ana Kavramlar Araçlar ve Teknolojiler

Veri Ambarı Nedir? Veri ambarı basitce, farklı kaynaklardan toplanmış, son kullanıcının anlayabileceği ve ticari içeriklerde kullanabileceği hale getirilmiş tek, tam ve tutarlı veri kaydıdır. -- Barry Devlin, IBM

Veri Ambarı bir Konu tabanlı, Entegre, Çeşitli zamanlarda, Veri Ambarı Nedir? (Alternatif Bakış Açısı) Geçici olmayan(kalıcı), özelliklere sahip veri topluluğunun, organizasyonel karar verme de önceliklik olarak kullanılmasıdır. -- W.H. Inmon, Building the Data Warehouse, 1992

Veri Ambarı Nedir? (Alternatif Bakış Açısı) Konu Tabanalı : Veri Ambarı işletmenin/yatırımın temel konusu etrafında kurulmuştur.. temel uygulama alanlarından daha ziyade.. Bu uygulama-tabanlı veri den ziyade karardestek datasının saklanmasında yansımıştır. Entegre : Kaynak veri, şirket çapında kullanılan farklı uygulamalardan gelir. Kaynak veri kullanımı çok kez tutarsızdır.. Entegre edilmiş veri kaynağı, kullanıcılara birleşik veri görünümü sağlayacak şekilde tutarlı hale getirilmelidir. Çeşitli Zamanlarda : Veri ambarındaki kaynak veri sadece bazı zaman dilimlerinde yada bazı anlarda doğru ve geçerlidir. Kalıcı : Veri gerçek zamanlı güncellenmez ama OS den alındığında düzenli bir forma uygun olarak yenidir. Yeni veri her zaman veri tabanına yerine koymak yerine ek olarak eklenir. Veri tabanı bu veriyi emer ve önceki veri ile entegre eder.

Veri Ambar(cılığı) Tanımları Veri Ambarı Karar destek için özellikle dizayn edilmiş konu tabanlı veri deposudur. Karar verme sistemini kullanan sadece yazma hakkına sahip analitik veritabanıdır. Çoklu kullanıcı grupları tarafından Ad-Hoc bulmaya ve veri tabanında hiyerarşik yapının aşağı seviyelerinde yer alan veriye ulaşma analizine izin veren, bağlantılı kaynak sistemlerden gelen detaylı verinin merkezi depolanmasıdır. Veri Ambarcılığı bir işlemdir, bir ürün değil. Bir kısmın belirli ve detaylı bir görünümü yada bütün ticari amaçlar için farklı kaynaklardan gelen verilerin birleştirilmesi ve yönetilmesine yönelik bir tekniktir.

Veri Ambarı şu soruların cevaplarını cevaplamaya yardımcı olur : Bu yeni ürün/hizmeti hangi kullanıcı satın almaya daha yatkındır? En karlı müşterilerim ve ellerindeki ürünler nelerdir? En çok ve en az karlı ürünler hangileridir? Müşterilerimiz ileride hangi ürün yada servisleri isteyecekler? Harcanabilir gelir nedir ve hangi ürünler bundan yararlanabilir? Önümüzdeki 6 ay içerisinde hangi müşteriler kötü kredi risk inde olur? Piyasa segmentlerimiz arasında rekabet nasıl gidiyor? Hangi müşteriler rekabet piyasasına daha yatkın duruyor?

Data Marts Bağımsız Datamart özel bir kullanıcı grubu tarafından analiz edilmiş işlem ve eylemsel datanın özel ve dağınık bir alt kümesidir. Avantajı : Uygulaması kolay, yüksek yatırım getirisi(roi Return on investment) Dezavantajı : Ahengi sonradan çok zor sağlanan data island ların çoğalması Bağımlı Datamart belirli bir amaç için seçilmiş yatırımsal veri ambarı(enterprise datawarehouse) un bir alt kümesidir. (Örn : Pazarlama, Finans v.b) Avantajı : Single version of the truth Dezavantajı : Uygulama süresinin uzunluğu Datamartlar İlişkisel yada OLAP modelleri kullanılarak uygulanabilir. Ayrıca flat file ların bir koleksiyonudur. (Örn : Data Mining Data Marts)

Veri Ambarı Mimarisi 1 Veri kaynak sistemlerden, veri tabanlarından ve dosyalardan ayrıştırılabilir. Ayrıştırılmış veri, veri ambarına yüklenmeden önce entegre edilir ve dönüştürülür. Veri ambarı ayrı, karar destek için özellikle yaratılmış ayrı ve read-only bir veri tabanıdır. Kullanıcı veriye front-end bir araç yada uygulama ile erişir.

Veri Ambarı Mimarisi 2 Dağınık Mimari. Veri direkt olarak İlgili Veri Ambarına yüklenir. (Bağımsız Data Mart)

Veri Ambarcılığı Mimarisi 3 Daha iyi bir seçenek : Kurumsal Veri Ambarını, Konu alanı ile ilgili veri ambarları besler (Bağımlı DataMartlar)

The Corporate Information Factory Bill Inmon un Yaklaşımı

The Multidimensional Architecture [Çok Boyutlu Mimari] (Kimball un Yaklaşımı)

Inmon v.s Kimball

Inmon un Yaklaşımı Avantajları : İyi yapılandırılmış, tanımlanmış Uygulama bağımsız, ilgi alanı tabanlı veri modeli Data martları yaratmak, veri ambarı yaratmaktan daha basit Hedef model bilindiğinden, depolama alanının iyi yapılandırılması olası Dezavantajları : Veri Ambarını sorgulamak zor(3nf veri tabanı), sorgulara tepki süresi uzun, Yapılandırma süresi uzun, İleride tam modeli nasıl bileceksin? Aşamalı/adım adım yapılandırmak zor,

Kimball ın Yaklaşımı Avantajları : Son kullanıcı tabanlı, kullanıcı dostu, çok boyutlu veri modelleri Aşamalı/Adım adım yaratılması daha kolay ve daha hızlı Ayrı Data Martları sorgulamak daha kolay Sorgulara tepki süresi kısa Dezavantajları : Daha az yapısal, daha az tanımlı Sonraki Data Mart ların yaratılması kolay değil(3. den sonra) Depolama alanı büyümeye başladıkca, yönetmek zorlaşır Data Mart lar arası sorguları yaratmak zordur

Modern BI Ortamı

Alternatif Modern B.I. Mimarisi

OS vs DW vs DM

Veri Ambarı İçin Kullanılan Modelleme Teknikleri Veritabanı tasarımında kullanılan E-R modeli iki boyutlu olup, tüm varlıklara eşitmiş gözü ile bakılır. Veri ambarları için çok boyutlu perspektifi gerçekleyebilecek yeni modelleme teknikleri keşfedilmiştir: Yıldız (Star) Kar Tanesi (Snowflake) Karma (Mixed)

Yıldız (Star) Modeli Gerçek tablosu, temel iş ölçümlerini içeren niteliklerden oluşur. Bir gerçek tablo, o tabloya ait spesifik nitelikler ve boyut tablolarıyla ilişkili yabancı anahtarları içermektedir. Boyut tablosu, gerçek tablosunda saklanılan veriyi indeksler ve organize eden niteliklerden oluşmaktadır. Boyut tablosu, boyutu tanımlayan nitelikleri içermektedir.

Kar Tanesi (Snowflake) Modeli Kar tanesi modeli, yıldız modelinin geliştirilmiş halidir. Gerçek tablolarının her bir boyut tablosu başka boyut tablolarına da sahiptir. Boyut tabloları, bir çok niteliğe sahip olduklarında, normalize edilmeleri gereklidir. Yıldız modeli normalize edilmiş boyut tablolarını desteklemediğinden, bu durumda kar tanesi modeli tercih edilmelidir.

Kar Tanesi Modelinin Avantajları ve Dezavantajları Avantajları: Tüm tekrarlanılan veriler kaldırıldığından, saklama alanı korunmuş olur. Büyük normalize edilmemiş tablolar yerine, Join ler için normalize edilmiş daha küçük tablolar kullanılır. Dezavantajları: Sorgu sonucunda Join edilmesi gereken tabloların sayısının belirlenmesindeki zorluk Belirli bir sorguda kullanılacak tabloyu belirlemedeki zorluk

Karma (Mixed) Modeli Bazı veritabanı dizaynlarında, boyut tabloları veri hacminde çok geniş farklılıklar gösterir. Böyle durumlarda tüm tasarımda ne yıldız ne de kar tanesi modeli kullanılamaz. Her iki modelin bir kombinasyonuna ihtiyaç duyulur. Bu kombinasyon modeline karma model denilmektedir.

Sorusu Olan?