Makine Öğrenmesi 11. hafta



Benzer belgeler
Makine Öğrenmesi 2. hafta

Hafta 09 -Topluluk Yöntemleri - Boyut Azaltma - Anomali Tespiti

Büyük boyutun laneti (Curse of Dimensionality)

Uzaktan Algılama Teknolojileri

Geliştirilmiş Fisher Ayraç Kriteri Kullanarak Hiperspektral Görüntülerde Sınıflandırma

KARAR TEORİSİ. Özlem AYDIN. Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü

Uzaktan Algılama Teknolojileri

Kredi Onayı İçin Bir Sınıflandırma Algoritması Önerisi A Classification Algorithm Advice for Credit Approval

MEH535 Örüntü Tanıma. 6. Boyut Azaltımı (Dimensionality Reduction)

DAĞILMA YADA DEĞİ KENLİK ÖLÇÜLERİ (MEASURE OF DISPERSION) Prof.Dr.A.KARACABEY Doç.Dr.F.GÖKGÖZ

VERİ MADENCİLİĞİ (Veri Ön İşleme-2) Yrd.Doç.Dr. Kadriye ERGÜN

ÇOK DEĞĐŞKENLĐ ĐSTATĐSTĐKLERĐN ARAŞTIRMALARDA KULLANIMI

Temelleri. Doç.Dr.Ali Argun Karacabey

ÖZET...V ABSTRACT...VII TEŞEKKÜR... IX ŞEKİLLER DİZİNİ... XIV SÖZLÜK... XIX

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

Motivasyon Matrislerde Satır İşlemleri Eşelon Matris ve Uygulaması Satırca İndirgenmiş Eşelon Matris ve Uygulaması Matris Tersi ve Uygulaması Gauss

DOĞRUSAL PROGRAMLAMADA DUALİTE (DUALITY)

Görüntü İyileştirme Teknikleri. Hafta-8

DERS BİLGİ FORMU. Zorunlu Ders X. Haftalık Ders Saati Okul Eğitimi Süresi

Makine Öğrenmesi 3. hafta

Web Madenciliği (Web Mining)

Örüntü Tanıma (EE 448) Ders Detayları

BİLGİSAYAR PROGRAMLAMA DERSİ

UA Teknikleri Kullanılarak Taşkın Alanlarının Belirlenmesi ve Bölgesel Taşkın Frekans Analizinin Batı Karadeniz Bölgesinde Uygulanması

Uzaktan Algılama Teknolojileri

YÖNEYLEM ARAŞTIRMASI - III

İnce Antenler. Hertz Dipolü

Akış YILDIZ TEKNİK ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

x 2i + A)( 1 yj 2 + B) u (v + B), y 1

Koşullu Öngörümleme. Bu nedenle koşullu öngörümleme gerçekleştirilmelidir.

Appendix B: Olasılık ve Dağılım Teorisi

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

BKİ farkı Standart Sapması (kg/m 2 ) A B BKİ farkı Ortalaması (kg/m 2 )

YTÜ İktisat Bölümü EKONOMETRİ I Ders Notları

Bilgisayarla Görüye Giriş

Bilgisayarla Görüye Giriş

KONU: BARAJLARDA SİSMİK TEHLİKENİN TAYİNİ - Olasılıksal ve deterministik hesaplar sonrası baraj tasarımında kulanılacak sismik tehlike seviyeleri

FAKTÖR ANALİZİ VAHİDE NİLAY KIRTAK

Matematik I: Analiz und Lineer Cebir I Sömestr Ders Saati D 2 U 2 L 1 AKTS 6 Lisans/ Yüksek Lisans Lisans Dersin Kodu MAT 106 Sömestr 2

Lineer Cebir II (MATH232) Ders Detayları

TRB2 BÖLGESİ'NDE BULUNAN İLÇELERİN SOSYO-EKONOMİK GELİŞMİŞLİK SIRALAMASI

DOKUZ EYLÜL ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ DEKANLIĞI DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: MAT 1009

MAK 210 SAYISAL ANALİZ

Portföy Yönetimi. Yatırım Kumar Adil Oyun

Yatırım Kumar Adil Oyun

Yatırım Kumar Adil Oyun

Konya İlinde Kaliteli Kaba Yem Üretimini Etkileyen Ekonomik Faktörlerin İstatistiksel Analizi

UBE Machine Learning. Kaya Oguz

DOKUZ EYLÜL ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ DEKANLIĞI DERS/MODÜL/BLOK TANITIM FORMU MATEMATİK I. Dersin Kodu: MAT 1009

Mühendislikte İstatistiksel Yöntemler

Ders Adı Kodu Yarıyılı T+U Saati Ulusal Kredisi AKTS

Bu bölümde; Çok ölçütlü karar verme yöntemlerinden biri olan TOPSİS yöntemi anlatılacaktır.

İstatistik ve Olasılık

METASEZGİSEL YÖNTEMLER

Açıklayıcı faktör analizi (EFA, Exploratory Factor Analysis)

EK -13: NİCEL ANALİZLERDE KULLANILAN YÖNTEMLER NACE REV Lİ KODDA İMALAT SANAYİ FAALİYETLERİNİN TEKNOLOJİ SINIFLAMASI,EUROSTAT

Uzaktan Algılama Uygulamaları

Lineer Cebir (MATH275) Ders Detayları

VERİ MADENCİLİĞİ (Veri Önişleme-1) Yrd.Doç.Dr. Kadriye ERGÜN

Cebir 1. MIT Açık Ders Malzemeleri

HATA BULMA YÖNTEMLERİNİN YANLIŞ ALARM ORANLARI FALSE ALARM RATES OF FAULT DETECTION METHODS

OYUN TEORİSİ. Özlem AYDIN. Trakya Üniversitesi Bilgisayar Mühendisliği Bölümü

İletken Düzlemler Üstüne Yerleştirilmiş Antenler

Medde İstatistikleri, Test İstatiskleri

Türkiye Halk Sağlığı Kurumu Çalışan Sağlığı ve Bilimsel Kapasitenin Güçlendirilmesi Projesi

yöneylem araştırması Nedensellik üzerine diyaloglar I

SAYISAL KARARLILIK. Zaman Uzayı Sonlu Farklar Yöntemi

Dinamik. Fatih ALİBEYOĞLU -10-

Matris Analizi (MATH333) Ders Detayları

Kompleks Analiz (MATH 346) Ders Detayları

3.2. DP Modellerinin Simpleks Yöntem ile Çözümü Primal Simpleks Yöntem

Işıma Şiddeti (Radiation Intensity)

Suya atılan küçük bir taşın su yüzeyinde oluşturduğu hareketler dalga hareketine örnek olarak verilebilir. Su yüzeyinde oluşan dalgalar suyun alt

REGRESYON ANALİZİ VE UYGULAMA. Yrd. Doç. Dr. Hidayet Takcı

BETON KARIŞIM HESABI (TS 802)

İŞLETME RİSK YÖNETİMİ. Yrd. Doç. Dr. Tülay Korkusuz Polat 1/51

b) Aşağıda verilen tanımlamalardan herhangi 5 adeti yazılabilir. Aritmetik Ortalama: Geometrik Ortalama:

SAYISAL TASARIM. Ege Üniversitesi Ege MYO Mekatronik Programı

Yrd. Doç. Dr. Fatih TOSUNOĞLU Erzurum Teknik Üniversitesi Mühendislik Fakültesi İnşaat Mühendisliği Bölümü

Peyzaj Mimarlığı çalışmalarında bitkisel materyalinin kullanımında, tasarım ilkeleri ile birlikte bitkilerin denrolojik özelliklerinin

Doğrusal Programlamada Grafik Çözüm

Lineer Cebir (MATH 275) Ders Detayları

ENM 5210 İSTATİSTİK VE YAZILIMLA UYGULAMALARI. Ders 2 Merkezi Eğilim Ölçüleri

MEKÂN ENVANTERİ OLUŞTURMA, MEKÂN ANALİZİ VE DERS PROGRAMI OLUŞTURMA İŞLEMLERİ

Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü. Bilgisayarla Görme. Final

PSK 510 Research Methods and Advanced Statistics

EĞĠTĠMDE ÖLÇME VE DEĞERLENDĠRME BÖLÜM V Test ve Madde Ġstatistikleri

ÜÇ ÇUBUK MEKANİZMASI

Türkiye deki İş Kazalarının Box-Jenkins Tekniği ile İncelenmesi. Doç. Dr. Arzu ALTIN YAVUZ Ar. Gör. Barış ERGÜL Ar. Gör. Ebru GÜNDOĞAN AŞIK

LYS TESTLERİNE YÖNELİK ALAN STRATEJİLERİ

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Makine Öğrenmesi. Erhan AKDOĞAN, Ph.D.

Makine Öğrenmesine Giriş (Machine Learning ML)

SINIF DEĞERLENDĠRME TEKNĠKLERĠ. Prof.Dr. Ġnayet AYDIN

Bir antenin birim katı açıdan yaydığı güçtür. U=Işıma şiddeti [W/sr] P or =Işıma yoğunluğu [ W/m 2 ]

Prof.Dr. ÜNAL ERKAN MUMCUOĞLU.

DOKUZ EYLÜL ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ DEKANLIĞI DERS/MODÜL/BLOK TANITIM FORMU. Dersin Kodu: MAT 1009

VERİ YAPILARI. Yrd. Doç. Dr. Murat GÖK Bilgisayar Mühendisliği Bölümü YALOVA ÜNİVERSİTESİ HASH TABLOLARI.

Gerilme Dönüşümleri (Stress Transformation)

3.2. Raster Veriler. Satırlar. Sütunlar. Piksel/hücre büyüklüğü

Transkript:

Makine Öğrenmesi 11. hafta Özellik Çıkartma-Seçme Boyut Azaltma PCA LDA 1 Özellik Çıkartma Herhangi bir problemin makine öğrenmesi yöntemleriyle çözülebilmesi için sistemin uygun şekilde temsil edilmesi gerekir. Çözülmesi istenen problem, makine öğrenmesi yöntemlerine doğrudan verilebilecek niteliklere her zaman sahip olmayabilir. Özellikle zaman serileri ve görüntüler gibi işaretlerden uygun özelliklerin çıkartılması gerekir. 2 1

Özellik Çıkartma Zaman serilerine odaklanan bilim dalı işaret işleme ve fotograf-video gibi görüntülerle uğraşan bilim dalı ise görüntü işleme adıyla anılır. Örüntü tanıma adlı alan ise zaman serileri ve görüntüleri de içeren her tür işaretten özellik çıkartmayı amaçlar. 3 Özellik Çıkartma 4 2

Özellik Çıkartma Aşağıdaki EKG işaretine doktorların genel yaklaşımı kalp atış hızı ve EKG işaretindeki her özel dalganın süresini hesaplayarak yapılır. 5 Özellik Seçme Literatürde önerilmiş birçok özellik çıkartma yöntemi vardır. Fakat bir probleme ait veride ne kadar çok nitelik varsa makine öğrenmesi yöntemlerinin maliyeti de o kadar artar. Bu istenmeyen bir durumdur. Bu yüzden eldeki problemi en uygun şekilde temsil etmek üzere minimum sayıda özellikten yararlanmak gerekir. 6 3

Özellik Seçme Bilinen onlarca özellik çıkartma yönteminden hangilerinin seçilmesi gerektiği üzerine yapılmış yine birçok çalışma vardır. Bu çalışmalar, muhtemel özellik çıkartma yöntemleri içerisinde uygun olanları en kısa sürede bulmayı amaçlar. Örneğin 5 özelliği çıkartılmış bir problemde sınıflandırma için en yararlı olan niteliklerin bulunması istenirse deneme yanılmayla 31 alt küme üzerinde sınıflandırma yapılması gerekecek ve bu çalışma çok uzun sürecektir. 7 Boyut Azaltma Özellik seçme için boyut azaltma yöntemlerinden de yararlanılabilir. Boyut azaltmada temel amaç eldeki verinin gereksiz olan niteliklerinin belirlenerek veriden atılmasıdır. Bunun için önerilmiş yöntemlerden en çok bilinen ve kullanılan PCA (Principle Components Analysis) ve LDA (Linear Discriminant Analysis) yöntemleridir. 8 4

PCA (Principle Components Analysis) PCA ile bulunan Temel Bileşenler düzlemi 9 Temel Bileşenler Analizi - PCA PCA yönteminde verinin özellik vektörleri arasındaki ilişkiyi temsil eden kovaryans matrisinin eigen-vektör ve eigen-değer çarpımına eşit olduğunu varsayılır. Buradan bulunan eigen-vektörleri yeni temel bileşenler olarak kabul edilir ve verinin yeni bileşenleri hesaplanır. PCA, boyut azaltma için kullanılıyorsa sapma değeri az olan boyut silinir ve gerekiyorsa veri kendi boyutuna geri dönüştürülür. 10 5

Temel Bileşenler Analizi - PCA PCA 1. aşama 11 Temel Bileşenler Analizi - PCA PCA 2. aşama 12 6

Temel Bileşenler Analizi - PCA PCA 3. aşama Boyut azaltma ile hedeflenen, verideki özellik sayısını indirgemek ise bu aşamada geri dönüşüm yapılmaz. Temel bileşenlerdeki gereksiz özelliğin silinmesi yeterlidir. 13 MATLAB Uygulaması >edit PCA_ornek.m Hazırlanmış olan farklı datasetler yüklenerek Temel Bileşenler Analizi deneyi yapılmaktadır. Bu kodlardan yararlanılarak Matlab üzerinde farklı örnekler yapılmalıdır. 14 7

Doğrusal Ayırma Analizi - LDA LDA (Linear Discriminant Analysis), veri içerisinde bulunan farklı sınıflara ait grupların doğrusal ayrılabilirliğini maksimize ederek boyut azaltması yapan bir yöntemdir. Her grup içerisindeki varyansı minimum ve grupların ortalamalarını birbirlerinden maksimum düzeyde uzak tutar. 15 max Doğrusal Ayırma Analizi - LDA ' µ σ ' 2 1 1 ' µ σ 2 ' 2 2 16 8

PCA ve LDA PCA LDA 17 MATLAB Uygulaması >edit LDA_ornek.m Hazırlanmış olan farklı datasetler yüklenerek Doğrusal Ayırma Analizi deneyi yapılmaktadır. Bu kodlardan yararlanılarak Matlab üzerinde farklı örnekler yapılmalıdır. 18 9

ÖDEV Boyut azaltmada kullanılan bir diğer yöntem olan ICA (Independent Component Analysis) ile uygulama detaylarını araştırınız. 19 10