Yapısal Olmayan Verinin Potansiyelini Açığa Çıkarın



Benzer belgeler
Büyük Veri Analizi. Göksel Okay Kıdemli Sistem Mühendisi

Büyük ve Hızlı Veri ile Değer Yaratmak

Büyük Veri de Türkiye den Uygulama Örnekleri Dr. Güven Fidan

BULUT BİLİŞİM VE BÜYÜK VERİ ARAŞTIRMA LABORATUVARI. Ekim 2017

BÜYÜK VERİ. Abdulkadir ŞAN Proje Yöneticisi 7/1/2014 VERİ SİSTEMLERİ. Anayurt Güvenliği Md. Yrd. Metin Madenciliği ve Kaynaştırma Sistemleri

Yeni Nesil Arşiv Altyapı Çözümleri

Ahmet Demirhan. 07 Haziran İstanbul

EMC Forum Yazılım Temelli Veri Depolama Moro Hekim Sistem Mühendisi

1 Milyon Kullanıcıya Nasıl Hizmet Veriyoruz? CloudLMS Teknik Alt Yapı ve Mimarimiz

VERİ TABANI UYGULAMALARI

Büyük Veri. Yrd. Doç. Dr. Özgür Yılmazel Gökhan Çapan Anadolu Üniversitesi

LOGO İş Zekası çözümü ile kurumsal raporlama ve analizler. Cem Yılmaz Genel Müdür LOGOBI Yazılım

IBM Güvenlik Sistemleri Yeni Nesil Güvenlik Bilgisi Toplama ve Olay Yönetimi

Veritabanı. Ders 2 VERİTABANI

Veri Tabanı-I 1.Hafta

Bilgiyi Keşfedin! Özelleştirme, Eklenti ve Veri Entegrasyonu Kurumsal Seviyede Yönetim ve Performans

Ağ Altyapısını Bulut a Taşıma

bilişim ltd İş Zekâsı Sistemi

MİLLİ SAVUNMA ÜNİVERSİTESİ KARA HARP OKULU DEKANLIĞI BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ DERS TANITIM BİLGİLERİ

Bir Taşla Çok Kuş SAP İş Analitikleri Baştan Sona Paket Çözüm. Muzaffer YÖNTEM / Ülke Yöneticisi 9 Aralık 2014, Salı

Data Science Boot Camp

WINDESKPORTA. sıgnum. Müşteri Hizmetleri İletişim Merkezi. Uygulama Çözümü. windesk.com.tr

WINDESKCONCENTO. sıgnum. Kurumsal İş Süreçleri Uygulamaları. windesk.com.tr

Kurumsal Proje ve Portföy Yönetimine Microsoft Bakışı. Atalay Aktaş Ürün Pazarlama Müdürü Microsoft Türkiye

Copyright 2012 EMC Corporation. All rights reserved.

Copyright 2012 EMC Corporation. All rights reserved.

Microsoft SQL Server Sorgulama

Veritabanı Uygulamaları Tasarımı

Advanced Oracle SQL Tuning

IBM Servis Yönetimi Stratejisi. Çağlar Uluğbay Ürün Yöneticisi Tivoli IBM Türk Limited Şirketi

Copyright 2012 EMC Corporation. All rights reserved.

Veritabanı Yönetim Sistemleri (Veritabanı Kavramı) Veritabanı Sistemleri

HP Yazılım Zirvesi - İstanbul 20 May Wyndham Grand Levent Erdem Alaşehir / Finansbank Güvenlik Olay Korelasyonunda Büyük Veri Kullanımı

3. Analytic Workspace Manager ile Oracle OLAP Küpü Tasarımı

İÇİNDEKİLER. YAZARLAR HAKKINDA... v. RESİMLER LİSTESİ...xv. 1.1.Bulut Bilişim Kavramının Analizi...1 BÖLÜM 1: TEMELLER...1

Kurumsal Masaüstü ve Sunucularda Pardus

İçerik. Apache Hadoop Project

SAP BusinessObjects EIM

İş Zekası ve Veri Ambarı Sistemleri. Nergiz Ercil Çağıltay

Swing ve JDBC ile Database Erişimi

Windows Server 2012: Sanallaştırmanın ötesine geçin. Oğuz Pastırmacı IT Pro Teknolojileri Yöneticisi Microsoft Türkiye

Veri Yönetiminde Son Nokta. Sedat Zencirci, Teknoloji Satış Danışmanlığı Direktörü, Orta Asya ve Türkiye

HP Yazılım Zirvesi - İstanbul 20 May Wyndham Grand Levent Pınar Uğurlu Kirazcı Bulut Tabanlı Servis Masası

windesk.com.tr BT Servis Masası Uygulaması İç ve dış paydaş / müşterilere sunulan Hizmetler için ITIL uyumlu iş sürekliliği artışı sağlanır.

VERİ TABANI YÖNETİM SİSTEMLERİ

OpenAIRE Avrupa İçin Açık Bilimsel İletişim ve Bilimsel Bilgi Altyapısı: Son Gelişmeler

CEO - Yönetim Raporlama Sistemi

Dell EqualLogic PS6010XV Depolama Dizisi

S.O.S Günışığı Lojistik Saha Operasyon Sistemi

NoSql ve MongoDB. Saygın Topatan

Büyük Veri nin Gücünden Faydalanın

TIGER ENTERPRISE FİYAT LİSTESİ 23 Eylül 2010 tarihinden itibaren geçerlidir.

AKADEMEDYA YAZILIM BİLGİSAYAR EĞİTİM VE DANIŞMANLIK TİC. SAN. LTD. ŞTİ Kocaeli Üniversitesi Yeniköy Teknopark Yerleşkesi Başiskele / Kocaeli Tel Faks

Mesleki Terminoloji YTÜ Bilgisayar Mühendisliği Muhammet Küçük YTÜ Bilgisayar Mühendisliği 93 Mezunu

TIGER ENTERPRISE FİYAT LİSTESİ

TIGER ENTERPRISE FİYAT LİSTESİ 1 Aralık 2010 tarihinden itibaren geçerlidir.

Atılım Üniversitesi Bilgi & Đletişim Teknolojileri Müdürlüğü Sistem Yönetim Uzman Yardımcısı Görev Tanımı

SERVER TANFER. Yazılım Ürünleri Satış Müdürü IBM Türk

SİGORTACILIKTA PERFORMANS: WEBLOGIC COHERENCE, EXADATA

TIGER PLUS FİYAT LİSTESİ 15 Mart 2012 tarihinden itibaren geçerlidir.

MOODLE UZAKTAN ÖĞRETİM SİSTEMİ

Veritabanı Yönetimi Bilgisayarların. Keşfi Hedefler. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi. Veritabanı, Veri ve Bilgi

Tom PROBERT MapInfo Pro Global Üretim Müdürü. Büyük Veri ve (potansiyel) etkiler

"Bilişimde Devrime Devam"

Semantik Ağ ve Üst Veri Sistemleri İçin Yeni Nesil Veri Tabanı Yönetim Modeli: NoSQL. R. Orçun Madran Atılım Üniversitesi.

İSTANBUL RUMELİ ÜNİVERSİTESİ MESLEK YÜKSEKOKULU BİLGİSAYAR PROGRAMCILIĞI 1.SINIF 2.YARIYIL İNTERNET PROGRAMCILIĞI II DERS İZLENCESİ

IBM Big Data. Emre Uzuncakara Big Data Sales IBM Corporation

Akıllı Kontrolde Teknoloji Devi SCADA YAZILIMI. Supervisory Control and Data Acquisition. ViewPLUS. Açık, Esnek, Ölçeklenebilir.

Atılım Üniversitesi Bilgi & Đletişim Teknolojileri Müdürlüğü Sistem Yönetim Uzmanı Görev Tanımı

Woom Woom dünyasına hoşgeldiniz.

StruxureWare TM Data Center Expert. Veri Merkezi Altyapı Yönetimi (DCIM) Yazılımı.

TOBB ETU HADOOP - IBM BigInsights Cluster Erişim ve Kullanımı

TeamBase5 BELEDİYE İLETİŞİM MERKEZİ SIEMENS

İş Analitiği'ne Netezza ile Yüksek Performans Katın

TIGER PLUS FİYAT LİSTESİ 1 Aralık 2010 tarihinden itibaren geçerlidir.

DSİ kapsamında oluşturulan dağınık durumdaki verilerinin düzenlenmesi, yeniden tasarlanarak tek bir coğrafi veri tabanı ortamında toplanması,

PostgreSQL Ekosistemi Geliştirme

TIGER PLUS FİYAT LİSTESİ 08 Nisan 2013 tarihinden itibaren geçerlidir.

Esnek ve Yönetilebilir Depolama Sistemleri. Arda Açıl Depolama Sistemleri Ürün Yöneticisi

Tansel ZENGİNLER IBM Veri Yönetimi Çözüm Mimarı Telefon: E-posta:

Php Programlama Dili MySQL Uygulamaları

Ders Kodu Yarıyıl T+U Saat Kredi AKTS. Programlama Dilleri

IBM Netezza High Capacity Appliance

Büyük veriye genel bakış, mimari ve çözümler

Kurumsal Mimari Transformasyon Yaklaşımıyla KVKK Yükümlülüklerini Fırsata Çevirmek

GEOVISION GROUP ÇÖZÜMLERİ

Veri Tabanı Yönetim Sistemleri Bölüm - 3

NoSQL. Buğra Çakır. 23 Mart 13 Cumartesi

Compiere Açık kodlu ERP + CRM yazılımı. Hüseyin Ergün Önsel Armağan Serkan Demir

Pardus Vizyonu. Prof. Dr. Abdullah ÇAVUŞOĞLU

Dell IT Bütünleşik altyapılar ile kendi transformasyonumuzu nasıl yaptık? GLOBAL SPONSORS

Veri Sermayenizi Sınır Tanımadan Değere Dönüştürmek için Isilon ve ECS!

Business Intelligence and Analytics Principles and Practices: Charting the Course to BI and Analytic Success

Kullanıcılar için EGEE ve TR-Grid araçları

Kepware Veritabanı Ürünleri. Teknolojiye Genel Bir Bakış

Büyük, Dağıtık, Veri Yoğunluklu Uygulamalarda Programlama Paradigmaları

Google Web Toolkit ile Öğretim Elemanı Otomasyon Sistemi

SOCIAL SCIENCES STUDIES JOURNAL SSSjournal (ISSN: )

Üst Düzey Programlama

İNTERNET PROGRAMLAMA 2 A S P. N E T. Marmara Teknik Bilimler MYO / Hafta 5 Veri Tabanı İşlemleri

Transkript:

Yapısal Olmayan Verinin Potansiyelini Açığa Çıkarın Alp Taşdemir 1

Geleneksel Kurumsal Analitik İşleme 2

Temel Paradigma Kayması Internet çağı ve patlayan veri artışı Oluşan eğilimleri ve fırsatları belirlemek için kurumların yeni veri kaynaklarını değerlendirmesi Geleneksel veri tabanı araçlarının yetersiz kalması 3

Hadoop: Büyük Veri Platformu Esnek Ölçeklenebilir Ucuz Hataya dayanıklı Yapısal olmayan verinin kavranması Çabuk benimsenen 4

Hadoop ile Analitik İşleme 5

Ekonomik Şartlar Oyunun Kuralını Değişitiriyor $80.000 $60.000 $40.000 Büyük Veri Platform Maliyeti /TB Büyük Veri RDBMS maliyetleri sonunda Hadoop maliyetleri ile örtüşecek $20.000 $- 2008 2009 2010 2011 2012 2013 Big Data DB Hadoop 6

Hadoop Üzerine Bahislerimiz 1. HDFS yeni nesil veri altyapıları için veri yüzeyi olacak 2. HDFS üzerinde ve onunla entegre, kurumsal ölçekte bir çok servis oluşacak 3. Kapasite sağlanmasındaki esneklik bu veri altyapısının kritik özelliklerinden olacak 7

Pivotal ve Hadoop 8

Veri Akışının Soğurulması Akış Servisleri Veri Toplama Platformu Veri Yönetimi Servisleri Pivotal Veri Çatısı Analitik Sorgulama Operasyonel Zeka Bellek içi DB Run-Time Uygulamalar Bellek içi nesneler HDFS Kurumsal Veri Ambarı RDBMS Kayıt sistemi olarak servise devam Geleneksel BI/Raporlama Data Veri Görüntüleme Visualization Uyumluluk ve finansal raporlama 9

Esnek Kullanıma Alma Modeli Kullanıma Alım Özel Bulut Veri Merkezi Açık Bulut 10

PIVOTAL HD Dünyadaki En Güçlü Hadoop Sürümü 11

Pivotal HD Nedir? Dünyadaki ilk gerçek SQL işleyen kurumsal ölçekteki Hadoop dağıtımı 100% Apache Hadoop tabanlı bir platform VMware ve Isilon teknolojileri ile sanallaştırma ve bulut ortamlarına hazır Hem yazılım hem de entegre cihaz şeklinde sunulmakta 12

Pivotal HD Mimarisi: Apache Kaynak Yönetimi & İş Akışı Yarn Zookeeper HBase Sqoop HDFS Pig, Hive, Mahout Map Reduce Flume Apache 13

Pivotal HD Mimarisi: Enterprise Pivotal HD Enterprise Kaynak Yönetimi ve İş Akışı Yarn Zookeeper HBase Hadoop Sanallaştırma (HVE) HDFS Pig, Hive, Mahout Map Reduce Komuta Merkezi Sqoop Veri Yükleyici Flume Apache Pivotal HD Enterprise 14

Veri Yükleyici Mimarisi Akımlar Dışarı çek Veri Yükleyici İçeri al Bağdaştırıcılar Web GUI ve CLI Flume Dosyalar Veri Kaynağı Kayıdı İş Yönetimi Veri Hedefi Kayıdı HDFS HDFS NFS HTTP FTP Kopyalama Stratejisi Optimizasyonu Veri İşleme Veri Kopyalama Local REST APIs.. 15

Komuta Merkezi ile Cluster Yönetimi Kullanıma Alma Ayarlama Analiz İzleme Yönetim 16

Pivotal HD Mimarisi: HAWQ HAWQ İleri Veritabanı Servisleri Pivotal HD Enterprise Kaynak Yönetimi ve İş Akışı Yarn Zookeeper HBase Genişleme Yapısı ANSI SQL + Analitik Katalog Servisleri Dinamik Hat Oluşturma HDFS Sorgu İyileştirici Hadoop Sanallaştırma (HVE) Pig, Hive, Mahout Map Reduce Komuta Merkezi Sqoop Veri Yükleyicisi Flume Apache Pivotal HD Enterprise HAWQ 17

HAWQ: Hadoop için Gerçek SQL Motoru Ölçek ve Performans Hataya Dayanıklılık İşlem Desteği Veri Yönetimi ve Analizi 18

Hadoop Üstünde Greenplum Veritabanından Faydalanmak HAWQ Kaynak Yönetimi Sorgulama Motoru Planlayıcı İyileştirici Çalıştırıcı İşlem Yöneticisi Katalog Servisleri GPXF Genişleme Yapısı HDFS 19

GPXF: Genişleme Yapısı GPXF Genişleme Yapısı Diğer veri kaynakları için özel bağdaştırıcı oluşturulmasına olanak sağlar HDFS HBase Hive 20

HAWQ Nasıl Çalışır: Sorgunun Sunulması İstemciler SELECT beer, price FROM Bars b, Sells s WHERE b.name = s.bar AND b.city = San Francisco JDBC/ODBC SQL Konsolu HAWQ Ana Sorgu Ayrıştırıcı Sorgu İyileştirici HDFS İsim Sorgu İşleyici Sorgu İşleyici Sorgu İşleyici... HDFS Veri HDFS Veri HDFS Veri 21

HAWQ Nasıl Çalışır: Sorgu İyileştirici İstemciler Ayrıştırma Ağacı JDBC/ODBC SQL Konsolu HAWQ Ana Sorgu Ayrıştırıcı Sorgu İyileştirici HDFS İsim Metadata Maliyet Modeli Kaynaklar Sorgu İşleyici Sorgu İşleyici Sorgu İşleyici... HDFS Veri HDFS Veri HDFS Veri 22

HAWQ Sorgu Planı İstemciler Motion Gather Project s.beer, s.price JDBC/ODBC SQL Konsolu HAWQ Ana Sorgu Ayrıştırıcı Sorgu İyileştirici HDFS İsim s Scan Sells HashJoin b.name = s.bar Motion Redist(b.name) Filter b.city = 'San Francisco' b Scan Bars Sorgu İşleyici Sorgu İşleyici Sorgu İşleyici... HDFS Veri HDFS Veri HDFS Veri 23

s b s b Sorgu Planı larına İletilir İstemciler JDBC/ODBC SQL Konsolu HAWQ Ana Sorgu Ayrıştırıcı Sorgu İyileştirici HDFS İsim s Scan Sells Motion Gather Project s.beer, s.price HashJoin b.name = s.bar Motion Redist(b.name) Filter b.city = 'San Francisco' b Scan Bars Motion Gather Project s.beer, s.price HashJoin b.name = s.bar Motion Motion Redist(b.name) Redist(b.name) Scan Sorgu İşleyici Scan Sorgu İşleyici Sells Filter b.city = 'San Francisco' Sells Filter b.city = 'San Francisco' Sorgu İşleyici Scan Bars Motion Gather Project s.beer, s.price HashJoin b.name = s.bar Scan Bars... HDFS Veri HDFS Veri HDFS Veri 24

HAWQ Dinamik Hat Oluşturur İstemciler JDBC/ODBC SQL Konsolu HAWQ Ana Sorgu Ayrıştırıcı Sorgu İyileştirici HDFS İsim Dinamik Hat Oluşturma Sorgu İşleyici Sorgu İşleyici Sorgu İşleyici... HDFS Veri Suncu HDFS Veri HDFS Veri 25

Toparlanmış Veri Ana ve İstemcilere Aktarılır İstemciler JDBC/ODBC SQL Konsolu HAWQ Ana Sorgu Ayrıştırıcı Sorgu İyileştirme HDFS İsim su Sorgu İşleyici Sorgu İşleyici Sorgu İşleyici... HDFS Veri HDFS Veri HDFS Veri 26

HAWQ Kullanıma Alma Modeli Ana lar ve İsim ları Sorgu planlama ve sevk... ODBC/JDBC Driver... Dinamik Hat Oluşturma Parça ları ve Veri ları Sorgu işleme ve veri depolama...... HDFS Harici Kaynaklar Yükleme, veri akışı, vs. 27

HAWQ Skorları Kullanıcı zekası 4.2 198 Satış analizi 8.7 161 Tıklama analizi 2.0 415 Veri araştırma 2.7 1,285 BI detaylandırma 2.8 1,815 47X 19X 208X 476X 648X 28

HAWQ: Büyük Verinin Temeli Pivotal Veri Çatısı Veri Akışının Soğurulması Akış Servisleri Veri Toplama Platformu Veri Yönetimi Servisleri Analitik Sorgulama Operasyonel Zeka Bellek içi DB Run-Time Uygulamalar Bellek içi nesneler HDFS 29