Büyük Veri ve Endüstri Mühendisliği

Benzer belgeler
Veri Madenciliği. Yrd. Doç. Dr. Mustafa Gökçe Baydoğan. blog.mustafabaydogan.

Örüntü Tanıma (EE 448) Ders Detayları

Kümeleme Algoritmaları. Tahir Emre KALAYCI

T.C. SELÇUK ÜNİVERSİTESİ REKTÖRLÜĞÜ

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

VERİ MADENCİLİĞİNE BAKIŞ

Alanya Alaaddin Keykubat UniversityInternational Relations Office

Uzaktan Algılama Uygulamaları

BÜYÜK VERI UYGULAMALARı DERS 3. Doç. Dr. Yuriy Mishchenko

DERS SEÇİM KILAVUZU. Sınıf Dönemi Kodu Adı Sınıf Dönemi Kodu Adı. Nesne Yönelimli Programlama. Yazılım Tasarımı ve Mimarisi

Veri Bilim - Yapay Öğrenme Yaz Okulu, 2017 Matematiksel Temeller ve Vaka Çalışmaları

VERİ MADENCİLİĞİ önemsiz olmayan, gizli, önceden bilinmeyen, potansiyel olarak kullanışlı

Mesleki Terminoloji II Veri Madenciliği

İleri Örüntü Tanıma Teknikleri Ve Uygulamaları İçerik

VERİ MADENCİLİĞİ (Kümeleme) Yrd.Doç.Dr. Kadriye ERGÜN

MATLAB A GİRİŞ. EE-346 Hafta-1 Dr. Ayşe DEMİRHAN

Dijital Dönüşüm Adımları

2017 MÜFREDATI MÜHENDİSLİK FAKÜLTESİ / ENDÜSTRİ MÜHENDİSLİĞİ EĞİTİM PLANI. Ders Kodu Ders Adı (Türkçe) Müf.No T P K AKTS Tip Op.

SELÇUK ÜNİVERSİTESİ SEYDİŞEHİR MESLEK YÜKSEKOKULU BİLGİSAYAR TEKNOLOJİLERİ BÖLÜMÜ BİLGİSAYAR PROGRAMCILIĞI PROGRAMI DERS DAĞILIM ÇİZELGESİ (2010)

Tarih Saat Modül Adı Öğretim Üyesi. 01/05/2018 Salı 3 Bilgisayar Bilimlerine Giriş Doç. Dr. Hacer Karacan

Google Görüntülü Reklam Ağı.Hedefleme

Seo Eğitimi (300 Sattlik Eğitim) Seo. Genel Amaçları. Seo da Kullanılan Terimler. Nedir? Nasıl Çalışır? Nasıl Olmalıdır?

GALATASARAY ÜNİVERSİTESİ

Büyük boyutun laneti (Curse of Dimensionality)

Uzaktan Algılama Teknolojileri

İNÖNÜ ÜNİVERSİTESİ MALATYA MESLEK YÜKSEKOKULU DERS TANITIM FORMU. Kredisi AKTS Eğitim Dili Tipi: Zorunlu/ Saat

Altan ÇOLAK Hoşgeldiniz

GALATASARAY ÜNİVERSİTESİ

İNÖNÜ ÜNİVERSİTESİ MALATYA MESLEK YÜKSEKOKULU DERS TANITIM FORMU. Kredisi AKTS Eğitim Dili Tipi: Zorunlu/ Saat

İNÖNÜ ÜNİVERSİTESİ MALATYA MESLEK YÜKSEKOKULU DERS TANITIM FORMU. Kredisi AKTS Eğitim Dili Tipi: Zorunlu/ Saat

Biz Kimiz? Ekibimizi yakından tanıyın: adresgezgini.com/ekibimiz

HALKLA İLİŞKİLER VE TANITIM PROGRAMI DERS İÇERİKLERİ

Örüntü Tanıma (COMPE 467) Ders Detayları

Bilkent Üniversitesi Bilgisayar Mühendisliği Bölümü. Bilgisayar Mühendisliği

Hafta 01 - Giriş. BGM Siber Güvenlik için Makine Öğrenme Yöntemleri. Yüksek Lisans Programı. Dr. Ferhat Özgür Çatak

İÇİNDEKİLER ÖN SÖZ...

MÜHENDİSLİK VE TEKNOLOJİ FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ 2016/2017 ÖĞRETİM YILI 1. YARIYIL FİNAL SINAVI PROGRAMI 1. SINIF

İŞLETME ANABİLİM DALI ORTAK DOKTORA PROGRAMI DERS İÇERİKLERİ. Dersin Adı Kod Yarıyıl T+U AKTS. Dersin Adı Kod Yarıyıl T+U AKTS

DERS BİLGİLERİ. Uygulamalı İşletme İstatistiği BBA 282 Bahar

Yapı Kredi Bankası Ar-Ge Çalışmaları Araştırma, Vizyon ve Uygulama. Eğitmen: Onur AĞIN

D.Saati AKTS Zorunlu Ders (Z) Meslek Dersi (M) Seçmeli Ders (S) TOPLAM

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

Akademik İngilizce II (ENG102) Ders Detayları

Web Madenciliği (Web Mining)

Web Madenciliği (Web Mining)

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D.

DERS BİLGİ FORMU. Zorunlu Ders X. Haftalık Ders Saati Okul Eğitimi Süresi

Kesikli Programlama (IE 506) Ders Detayları

BİLGİSAYAR MÜHENDİSLİĞİ DOKTORA PROGRAM BİLGİLERİ

2) Lineer olmayan denklem çözümlerini bilir 1,2,4 1

R ile Programlamaya Giriş ve Uygulamalar

Doğrusal Programlama (IE 502) Ders Detayları

Olasılık ve İstatistik II (IE 202) Ders Detayları

GOOGLE AdWords REKLAMLARI

Ders Kodu Dersin Adı Dersin Ġntibak Durumu

TrueView ile Video için Google AdWords.

Smart Commerce Proje Teklifi

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Ders 1- Yapay Zekâya Giriş. Erhan AKDOĞAN, Ph.D.

MÜHENDİSLİK FAKÜLTESİ / ENSTİTÜSÜ / YÜKSEKOKULU BİLİŞİM SİSTEMLERİ MÜHENDİSLİĞİ BÖLÜMÜ /ABD LİSANS PROGRAMI - 1 ( yılı ve sonrasında birinci

Büyük Veri de Türkiye den Uygulama Örnekleri Dr. Güven Fidan

Olasılık ve İstatistik nedir? Bilgisayar Mühendisliğindeki yeri

SENİ TÜRKİYE NİN BANKASINA BEKLİYORUZ. UZMAN YARDIMCISI ALIM SINAVI 13 EKİM 2018

1. YIL 1. DÖNEM DERS KODU DERS ADI T+U+L KREDİ AKTS. Atatürk İlkeleri ve İnkılap Tarihi I

Veri Madenciliği - Giriş. Erdem Alparslan

YouTube SEO Kılavuzu. Video İzlenme Oranlarını Artırmak ve Sıralamayı Yükseltmek İçin Etkili İpuçları

Akademik Dünyada Özgür Yazılım. Akademik Dünyada. Onur Tolga Şehitoğlu

EĞĠTĠM-ÖĞRETĠM PLANI

EĞĠTĠM-ÖĞRETĠM PLANI

YÖNEYLEM ARAŞTIRMASI - I

YAPAY ZEKA VE DERİN ÖĞRENMENİN GÜNÜMÜZDEKİ UYGULAMA ALANLARI

Destekçi Vektör Makineleri. Destekçi Vektör Makineleri(Support Vector Machines)

Çok fazla bilgiden gizli kalmış örüntüleri ortaya çıkarma sürecine Veri Madenciliği denir.

Biz Kimiz? Ekibimizi yakından tanıyın: adresgezgini.com/ekibimiz

MOODLE UZAKTAN ÖĞRETİM SİSTEMİ

«Pek çok küçük şey, doğru reklamla devleşmiştir.» Mark Twain

K En Yakın Komşu Methodu (KNearest Neighborhood)

Olasılık ve İstatistik (IE 220) Ders Detayları

Akdeniz Üniversitesi

DENİZ HARP OKULU ENDÜSTRİ MÜHENDİSLİĞİ BÖLÜM BAŞKANLIĞI DERS TANITIM BİLGİLERİ

MPS. Multi-service Platform System Powered by QIHAN

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN

EĞĠTĠM-ÖĞRETĠM PLANI

Metin Madenciliği Yöntemleri ile Twitter Duygu Analizi (Twitter Sentiment Analysis using Text Mining Methods)

R ILE ENERJI MODELLEMESI

T.C. YALOVA ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ. Tüm Ders Kodları Havuzu

Dijital pazarlama bir satış yöntemi değil; ulaşılan sonuçları sayesinde satış artışı sağlayan, bir ilişkilendirme ve iletişim sürecidir.

Ekonometri II (ECON 302T) Ders Detayları

Yapay Sinir Ağları ve Yüksek Enerji Fiziği Uygulamaları

2017 MÜFREDATI MÜHENDİSLİK FAKÜLTESİ / HARİTA MÜHENDİSLİĞİ EĞİTİM PLANI. Ders Kodu Ders Adı (Türkçe) Müf.No T P K AKTS Tip Op.

Maliye Anabilim Dalı- Tezli Yüksek Lisans (Sak.Üni.Ort) Programı Ders İçerikleri

VERİ MADENCİLİĞİNİN GÖREVLERİ

Sayısal Yöntemler (COMPE 350) Ders Detayları

TOBB EKONOMİ VE TEKNOLOJİ ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ I. SINIF EĞİTİM - ÖĞRETİM PROGRAMI

Endüstri Mühendisliği Tezli Yüksek Lisans Dersler Tablosu

Ders Adı Kodu Yarıyılı T+U Saati Ulusal Kredisi AKTS

Harmanlanmış Bilgisayar Dersinde Öğrencilerin Sınav Günü İnternet Hareketliliği

Şube Sayısı. Şube Sayısı T P K AKTS T P K AKTS. 2 MTK 302 Kısmi Diferansiyel

KPSS LİSANS DA UYGULANAN TESTLERİN KAPSAMLARI

Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti

BÜYÜK VERI UYGULAMALARı DERS 4. Doç. Dr. Yuriy Mishchenko

Transkript:

Büyük Veri ve Endüstri Mühendisliği Mustafa Gökçe Baydoğan Endüstri Mühendisliği Bölümü Boğaziçi Üniversitesi İstanbul Yöneylem Araştırması/Endüstri Mühendisliği Doktora Öğrencileri Kolokyumu 21-22 Nisan 2016

Başlıklar Veri / Veri Madenciliği Klasik Veri Analizi ve Veri Madenciliği Büyük Veri ve Potansiyel Araştırma Konuları Tavsiyeler 2

Veri / Veri Madenciliği Büyük hacimli verilerden üstü kapalı (implicit), çok net olmayan (non-trivial), önceden bilinmeyen ancak potansiyel olarak kullanışlı örüntülerin (pattern) veya bilginin çıkarılmasıdır. Örnek: Twitter verisi kullanarak kamuoyu yoklama 3

Kayıt zamanı atılan tweetlerin incelenmesi 2014 yılı Bahar döneminde Boğaziçi Üniversitesi kayıt döneminde ne oldu? Analizler R istatistik dili kullanarak yapıldı. #boun içeren tweetleri al ve önişlemeye tabi tut Linkleri at Küçük harfe çevir Noktalama işaretlerini at... 4

Kayıt zamanı atılan tweetlerin incelenmesi Kelime Bulutu 5

Kayıt zamanı atılan tweetlerin incelenmesi İçerik anlama? Kümeleme (clustering) kullanarak hangi kelimeler birlikte gözüktü D2 Document 1 Document2 I 1 1 Like 1 0 Hate 0 1 Databases 1 1 1 1 D1 6

Veri madenciliği Ne yaptık? Kayıt haftası öğrenciler rahatsız (kota, izin vb. sebepler) Kümeleme #boun içeren tweetler Temizlik (link at, küçük harfe çevir, vb) Sayısal olarak ifade et (döküman-terim matrisi) 7

Klasik Veri Analizi ve Veri Madenciliği Hipotez ortaya atarak veri toplama Araçlar ANOVA F testleri, t testleri vb. 8

Klasik Veri Analizi ve Veri Madenciliği Süreç veri üretiyor, başlangıçta belirli bir hipotez yok (bir fikir olsa da) 9

Klasik Veri Madenciliği Problemleri Gözetimsiz (Unsupervised) Öğrenme Amaç veriyi anlamak Kümeleme Kural çıkarma (sıralı, sırasız) Görselleştirme Gözetimli (Supervised) Öğrenme Amaç tahmin yapmak Regresyon (sürekli bir sonucu tahmin etme) Sınıflandırma (kesikli bir sonucu tahmin etme) 10

Büyük Veri Popüler bir buzzword ama çok yeni bir kavram değil Temel amaç: Algoritmik karmaşıklığı düşük algoritmalar geliştirmek (hafıza ve işlemci gereksinimleri açısından) 11

Büyük Veri ve Uygulamalar Farklı kaynaklardan gelen bilgiyi birleştirmek Örnek: İnternetten öde ve izle talebinin tahmini Bahis istatistikleri Süper lig istatistikleri İzlenme sayıları Google Trends Hava durumu 12

Büyük Veri ve Uygulamalar Öde ve izle talebi BJK - TS BJK - GS FB - TS FB - GS FB - BJK GS - TS GS - BJK TS - FB GS - FB BJK - FB TS - GS BJK - TS BJK - GS FB - TS FB - GS FB - BJK GS - TS GS - BJK TS - FB GS - FB BJK - FB TS - GS 13

Büyük Veri ve Uygulamalar Talep tahmini Klasik regresyon problemi ama Varsayımsal sorunlar Kirli veri Çoklu eşdoğrusallık (Multicollinearity) Lineer olmayan ilişkiler Etkileşim etkileri... Potansiyel çözümler ve araştırma alanları Cezalı (Penalized) regresyon yaklaşımları Değişken sayısı azaltma 14

Büyük Veri ve Uygulamalar Talep tahmini Cezalı (Penalized) regresyon 15

Büyük Veri ve Uygulamalar Algoritmik ticaret Bitcoin piyasası (Bitcoin ve Ethereum) https://poloniex.com/exchange#btc_eth API var Geçmiş veri ışığında, kural tabanlı algoritmalar? 16

Büyük Veri ve Uygulamalar Alışveriş sitelerinde kullanıcı tercihlerini anlama (Clickstream Verisi) Bir kategorideki ürünler (örneğin laptop) Özellikleri Fiyat Renk İşlemci... Kriterler Her kullanıcının (ya da bir kullanıcı kümesinin) fayda fonksiyonunu modelleme Sitede gezinti bilgisi tercih konusunda fikir verir mi? Büyük veri? Promosyon Hava durumu Reklam Kredi kartı kampanyaları... 17

Büyük Veri ve Uygulamalar Google reklamlarında anahtar kelimlere verilen teklif miktarı optimizasyonu 18

Büyük Veri ve Uygulamalar Google reklamlarında anahtar kelimlere verilen teklif miktarı optimizasyonu Büyük veri Deney tasarımı ile veri toplama Sezonsallık (saatlik, günlük ve benzeri) Talep tahmini Pekiştirmeli Öğrenme (Reinforcement learning) 19

Büyük Veri ve Uygulamalar Öznitelik öğrenme (Feature/Representation Learning) Görüntü uzayda bir vektör ile ifade edilir 20

Büyük Veri ve Uygulamalar Görüntü işleme ve veri küçültme Elimizdeki görüntüleri kullanarak jenerik görüntüler bulabilir miyiz? Jenerik görüntülerin doğrusal bir kombinasyonu ile asıl görüntüye dönebilir miyiz? (Encoding ve Decoding) 21

Büyük Veri ve Uygulamalar Kereste yamukluk tahmini Kurutma öncesi yaş odun görüntüleri Yamukluğa sebep olan alanların tespiti Bow Crook Kurutma sonrası ölçümler yapılır 22

Büyük Veri ve Uygulamalar Kereste yamukluk tahmini 200 k 200 400 400 600 n X 600 800 800 1000 1000 1200 1200 50 100 150 200 250 50 100 150 200 250 23

Büyük Veri ve Uygulamalar Görüntü işleme Hareket algılama (motion recognition) Video t adet zaman üzerinde değişen görüntü Çok değişkenli bir zaman serisi Doğrusal olmayan ve korelasyonu yüksek Hareket modellenebilir mi? 24

Tavsiyeler Kod yazma, yeni bir dil öğrenme Uygulama motivasyonu Parelel algoritmalar Parametresi az, basit algoritmalar Derin öğrenme (deep learning) 25

Teşekkürler Sorular ve Yorumlar e-posta mustafa.baydogan@boun.edu.tr web www.mustafabaydogan.com 26