Büyük boyutun laneti (Curse of Dimensionality)

Benzer belgeler
Erasmus Programı Genel Değerlendirme

Zorunlu Bağışıklama mı, İsteğe Bağlı Bağışıklama mı? Ülkelerin Deneyimleri

ESCMID ve Türkiye İlişkileri

Erasmus Programı ve Uluslararasılaşma

KA-1 : Öğrenme Hareketliliği

DÜNYA İTHALATÇILAR LİSTESİ

MALİ MEVZUAT SİRKÜLERİ NO : 2015 / 67

Erasmus Koordinatörler Toplantısı. Fen Fakültesi Cemil Bilsel Konferans Salonu

ERASMUS+ PROGRAMI ERASMUS STAJ HAREKETLİLİĞİ BİLGİLENDİRME SEMİNERİ

İzleme - göstergeler. AB Eşleştirme Projesi, Ankara 5. Ders Haftası. Carin Lindqvist-Virtanen Genel Müdür Yardımcısı Sigorta Bölümü

Türkiye de mobil telefon hizmeti ve vergilendirme. Gabriel Solomon. İstanbul, 9 Mayıs 2012

SAY 211 SAĞLIK EKONOMİSİ

TÜRK STANDARDI TURKISH STANDARD

2013 Steinbeis Partner for innovation Technology.Transfer.Application.

Metrekarenin Evrimi ve Yönetimi

Bakım, Onarım ve Yenileme (MRO) Kılavuzları. Yeni ürünler

MALİ MEVZUAT SİRKÜLERİ NO : 2016 / 36

İndirim Marketlerinin Sa/ş ve Kârlılık Modeli

BĐLGĐ de Erasmus değişim programı uygulamaları ve uluslararasılaşma

DIŞ PAZAR ARAŞTIRMASI

TMMOB İNŞAAT MÜHENDİSLERİODASI ANKARA ŞUBESİ

ERASMUS+ PROGRAMI ERASMUS STAJ HAREKETLİLİĞİ BİLGİLENDİRME SEMİNERİ

NEC Direktifi kapsamında Raporlama, Durum Raporu

MİLLİ DNA VERİ BANKASI ÇALIŞMALARI ve ADLİ DNA ANALİZLERİNDE YENİ NESİL

Erasmus Programı Tanıtımı ve Genel Değerlendirme

ELSA Izmir. Deniz Hatemi Berivan Aras Ataberk Ozcan Selmin Ş ahin Ecem Kumsal Ba ş yurt Nadıde Nur Karakozak Barlascan Alphan

MALĐ MEVZUAT SĐRKÜLERĐ NO : 2010 / 31

METAL MOBİLYA PAZAR ARAŞTIRMASI

İndirim Marketlerinin Satış ve Kârlılık Modeli

Türkiye nin CERN e Ortak Üyeliği

Yüksek performanslı karbür matkaplar

Ertun ALTEKİN Genel Müdür GEFCO Gümrük Ltd. Şti.

İHRACAT-İTHALAT

MALĐ MEVZUAT SĐRKÜLERĐ NO : 2012 / 50

2013 YILI İTHALAT HARİTASI

AB HUKUKUNDA KARAR ALMA SÜRECİ. Haluk Günuğur Türkiye Avrupa Birliği Derneği

İÇERİK. Yrd. Doç. Dr.A. Can BAKKALCI 2

Shark Serisi Malzemeye özel uygulama kılavuzları. Yeni Ürünler 2018

Sosyal İşler Ve Sağlık Bakanlığı nın Yapısı Ve Sorumlulukları

2015 DE BİSİKLET VE ALGISI

DÜNYADA VE ÜLKEMİZDE KAMU ALIMLARININ YERLİ ÜRETİMİN VE YERLİ İSTEKLİNİN DESTEKLENMESİNDE ROLÜ

Boğaziçi Üniversitesi İnşaat Mühendisliği Bölümü

Tarihine Kadar Verilmesi Gereken Beyannamelerin Verilme ve Son Ödeme Tarihleri Olarak Yeniden BelirlenmiĢtir.

Türkiye de İklim Değişikliği Politikalarının Tanıtılması - LIFE05-TCY/TR/000164

PETROL ÜRÜNLERİ VE DOĞAL GAZIN VERGİLENDİRİLMESİ, FİYAT TEŞEKKÜLÜ VE TARİHSEL GELİŞİMİ VE ÖNERİLER

Atradius Kredi Sigortaları Sunumu

MALĐ MEVZUAT SĐRKÜLERĐ NO : 2013 / 08

AB 7. Çerçeve Programı. Marie Curie AraĢtırma Programları ve Bursları

MALİ MEVZUAT SİRKÜLERİ NO : 2013 / 73

Avrupa: bir ve bölünmemiş? Avrupa da Ekonomik Modeller

Erasmus+ Genel Bilgilendirme Toplantısı İletişim Fakültesi-Konferans Salonu Doç.Dr. Sevinç HATİPOĞLU Erasmus Kurum Koordinatörü

MALĐ MEVZUAT SĐRKÜLERĐ NO : 2010 / 35

Medya Paylaşım Toplantıları 15

Kentlere ve belediyelere verilen en büyük Avrupa ödülü AVRUPA ÖDÜLÜ

Türkiye de Bankacılık Sektörü Aralık

Çevrimsel Araştırma İçin Bir Alt Yapı Gerekliliği: TUCRIN

Türkiye de İklim Değişikliği Politikalarının Tanıtılması - LIFE05-TCY/TR/000164

MALİ MEVZUAT SİRKÜLERİ NO: 2017 / 20

MALĐ MEVZUAT SĐRKÜLERĐ NO : 2011 / 44

221TE4L 231TE4L. TR Duyuru ve önemli bilgi 2. 5 Sorun Giderme 34. Türkçe

Araştırma Notu 17/205

Türkiye Ekonomisinde Büyüme ve Rekabet Politikası

YZM 3217 YAPAY ZEKA DERS#10: KÜMELEME

İçecek ve Gıda Sektörü için Güvenli Taşıma Çözümleri

MALĐ MEVZUAT SĐRKÜLERĐ NO : 2010 / 32

Erasmus Hareketlilikleri Tanıtım Sunumu

2 Creavit 2014 Faaliyet Raporu Creavit 2014 Faaliyet Raporu 3

MALİ MEVZUAT SİRKÜLERİ NO : 2013 / 66

HACETTEPE ÜNİVERSİTESİ

İhracat-İthalat

Proje Uygulaması, Hibe Yönetimi ve Raporlama

Şişe ve Teneke Endüstrisi Güvenli Taşıma Çözümleri

MALİ MEVZUAT SİRKÜLERİ NO : 2010 / 49

6. Mühendislik ve Teknoloji Sempozyumu

Türkiye de Kadınların Sağlığı

FP7-PEOPLE-2008-IIF. Kontratların imzalanması ve projenin başlaması: Mart 2009 Çağrı Bütçesi: 25 Milyon

Sağlık Hizmeti Modelleri, Karşılaştırmalar

Türkiye de Adalet Harcamaları ve Uluslararası Karşılaş9rmalar

Erasmus İstatistikleri ve Genel Değerlendirme

MALİ MEVZUAT SİRKÜLERİ NO : 2013 / 80

In Car Video IVSC Kullanma ve Montaj K lavuzu.

MALİ MEVZUAT SİRKÜLERİ NO : 2011 / 48

MALĠ MEVZUAT SĠRKÜLERĠ NO : 2011 / 08

MALİ MEVZUAT SİRKÜLERİ NO: 2017 / 35

TÜRKİYE DE KADıN EMEĞİ VE İSTİHDAMıNıN MEVCUT DURUMU

PROGRAMLARI. H. Burak TİFTİK EUREKA Proje Sorumlusu

İhracat-İthalat

Uzaktan Algılama Teknolojileri

Erasmus+ Programı Tanıtımı

MALİ MEVZUAT SİRKÜLERİ NO : 2010 / 46

MALĠ MEVZUAT SĠRKÜLERĠ NO: 2017 / 8

Avrupa da Tedaviye Erişim ve Erişimi Engelleyen Unsurlar

MALİ MEVZUAT SİRKÜLERİ NO : 2011 / 53

MALĐ MEVZUAT SĐRKÜLERĐ NO : 2012 / 70

Avrupa Anayasa Mahkemeleri Konferansı

PASSPORT VERİTABANI AKADEMİK ARAŞTIRMA İÇİN ANA SAYFANIZ. Mert Kaymakcı İş ve Müşteri Geliştirme Müdürü

MALĠ MEVZUAT SĠRKÜLERĠ NO : 2011 / 15

MALİ MEVZUAT SİRKÜLERİ NO : 2010 / 24

Nederman Talaşlı İmalat Konsepti. Temiz Hava Temiz Çalışma ortamı Temiz Soğutucu Sıvıları Temiz Çevre ve Geri Dönüşüm

LİNİK ARAŞTIRMALARDA NEREDEYİZ? Dr. Ecz. Nihan BURUL BOZKURT Daire Başkanı 9 Mayıs 2018

Transkript:

Büyük boyutun laneti (Curse of Dimensionality) p Veri boyutu arttıkça örnekler (noktalar) uzay içinde çok fazla dağınık hale gelir. p Noktaların yoğunluğu ya da aralarındaki uzaklık bir çok problem için çok önemlidir. Veri boyutu büyüdükçe yoğunluk ve uzaklık bilgisi anlamsızlaşır ve bu algoritmaların performansını etkiler. Rastgele 500 nokta üretelim Birbirine en uzak ve en yakın noktalar arası uzaklıkları ele alalım 1

Veri Küçültme p Amaç: n Zaman ve hafıza gereksinimlerini azaltmak n Kolay görselleştirme n Alakasız öznitelikleri atmak ya da gürültü azaltmak p Yöntemler n Temel Bileşen Analizi p Principle Component Analysis (PCA) n Çok Boyutlu Ölçekleme p Multidimensional scaling (MDS) n Diğerleri: eğiticili yöntemler 2

Temel Bileşen Analizi p TBA tanımlayıcı bir yöntemdir n En eski yöntemlerden biridir p Amaç n Büyük sayıda değişkenle ifade edilen örneklerin daha küçük uzayda temsili p Veri küçültme n Toplam varyansı en iyi açıklayan değişkenlerin tespiti p Yorumlama p TBA sonuçları diğer algoritmalara girdi olabilir n regresyon n kümeleme n Sınıflandırma ve diğerleri 3

Temel Bileşen Analizi p k n A n X Öyle bir dönüşüm yapalım ki verideki varyansı en iyi şekilde saklayabilelim 4

Temel Bileşen Analizi p Varyansın en yüksek olduğu birbirine dik eksenleri bulmak n PC1 yönü verinin daha çok değiştiği yönlerden biri 5

Temel Bileşen Analizi p Geometrik yorum İyi Daha İyi 6

Temel Bileşen Analizi p Gaus dağılım geometrisi n Çok değişkenli Normal dağılım eliptik dağılımlara bir örnek oluşturur. n Elipslerin temel eksenlerinin (principal axes) yönleri kovaryans matrisinin, Σ, eigen vektörleridir. 7

Temel Bileşen Analizi p R kodları 8

Bir uygulama Genes mirror geography within Europe http://www.nature.com/nature/journal/v456/n7218/full/nature07331.html The PC axes are rotated to emphasize the similarity to the geographic map of Europe. AL, Albania; AT, Austria; BA, Bosnia- Herzegovina; BE, Belgium; BG, Bulgaria; CH, Switzerland; CY, Cyprus; CZ, Czech Republic; DE, Germany; DK, Denmark; ES, Spain; FI, Finland; FR, France; GB, United Kingdom; GR, Greece; HR, Croatia; HU, Hungary; IE, Ireland; IT, Italy; KS, Kosovo; LV, Latvia; MK, Macedonia; NO, Norway; NL, Netherlands; PL, Poland; PT, Portugal; RO, Romania; RS, Serbia and 9

Temel Bileşen Analizi p Avantajları n Çok basittir, parametresi neredeyse yoktur p Kaç bileşen tutulacağı dışında n Veriyi aralarında korelasyon bulunmaya daha küçük sayıda öznitelik ile ifade eder p Veri sıkıştırma p Dezavantajları n Numerik veri ve Normal (Gaus) dağılım n Değişkenler arası ilişkilerin doğrusal (lineer) olduğunu varsayar n Eğer ilişkiler doğrusal değilse p Bulunan temel eksenler anlamsızdır. Kernel PCA denen yöntemler ile doğrusal olmayan TBA yapılabilir. 10

Çok Boyutlu Ölçekleme (MDS) p MDS ve kümeleme analizi alakalıdır. n n Genellikle parametrik olmayan, altında model barındırmayan, tanımlayıcı bir yöntemdir. ~ doğrusal olmayan temel bileşen analizi de denebilir p Veriyi daha küçük bir uzayda öyle bir şekilde ifade edelim ki asıl uzaydaki benzerlik bilgisi en iyi şekilde korunsun. n Çoğunlukla görselleştirme için kullanılır. p Tukey: A picture is worth a thousand words 11

Çok Boyutlu Ölçekleme p Örnek çıktı Common Space Anket sonucu her kişi şehirleri sıralar. 0.75 0.50 Berlin London Paris Sıralama cinsinden benzerlikler hesaplanır (Londra Atina ya kıyasla Berlin e daha çok benzer). Yorum: Trend olması Dimension 2 0.25 0.00-0.25-0.50-0.75 Stockholm Bruxelles Amsterdam Madrid -0.5 0.0 0.5 Dimension 1 İklim olarak düşünülebilir Rome Athens Eğer bulunan yeni boyutlar yorumlanabiliyorsa, algılanan farklılıklar tespit edilebilir. 12

Çok Boyutlu Ölçekleme p Fransız şehirleri arası tren zamanları p Bu bilgi ile Fransa haritası üzerinde şehirler işaretlenebilir mi? 13

Çok Boyutlu Ölçekleme p Cevap: Evet Gerçek Harita MDS Harita 14

Çok Boyutlu Ölçekleme p R kodları 15