Uzaktan Algılama Teknolojileri Ders 11 Hiperspektral Görüntülerde Kümeleme ve Sınıflandırma Alp Ertürk alp.erturk@kocaeli.edu.tr
Sınıflandırma Sınıflandırma işleminin amacı, her piksel vektörüne bir ve yalnız bir etiket atamak ve piksel vektörünü etiketin temsil ettiği sınıf ile ilişkilendirmektedir.
Sınıflandırma Hiperspektral verilerin yüksek spektral çözünürlüğü sayesinde multispektral sistemlere göre daha başarılı sınıflandırma yapılabilmektedir. Uzamsal çözünürlük ne kadar yüksek olursa, uzamsal bilgiyi de sınıflandırma işlemine dahil ederek, sınıflandırma başarımı o kadar artırılabilir.
Sınıflandırma Sınıflandırma işlemi eğitimli ve eğitimsiz olarak ikiye ayrılabilir Eğitimli sınıflandırmada eğitim kümesi kullanılarak sınıflandırıcı test öncesi sınıfları ve örnekleri öğrenir. Bu aşamada sınıflandırıcıda model, parametre vb. ayarlar yapılır. Daha sonra eğitilmiş olan sınıflandırıcı veriye uygulanır. Eğitimsiz sınıflandırmada ise sınıf sayısı veya sınıfların bilgisi bulunmamaktadır. Eğitimsiz sınıflandırma sıklıkla kümeleme olarak da adlandırılmaktadır.
Sınıflandırma Sınıflandırma işlemi için etiketlenmiş (sınıfı bilinen) gözlem kümesi (piksel vektörleri) bulunmalıdır. Sınıflandırmada başarım, etiketi olan (sınıfı bilinen) pikseller arasında ne kadarının etiketinin doğru tespit edildiğine göre hesaplanır. Bu işlem için, öncesinde etiketi bilinen piksel vektörlerinden bir kısmı eğitim verisi olarak alınır ve sınıflandırıcının eğitimi (parametre model belirlenmesi vb.) için kullanılır Etiketli piksellerin geri kalanı test verisi olarak alınır ve sınıflandırıcının başarımı bu test verisi üzerinde hesaplanır
Sınıflandırma
Sınıflandırma Sınıflandırma için çok sayıda yaklaşım bulunmaktadır Paralelkenar sınıflandırıcı yaklaşımı her sınıf için, sınıf ortalaması ve standart sapmasına bağlı olarak çok-boyutlu kutular oluşturur En küçük mesafe sınıflandırıcı yaklaşımı, her pikseli, ortalaması en yakın olan sınıfa atar En büyük olabilirlik sınıflandırıcı yaklaşımı, pikselin bir sınıfa atanma olasılığını değişinti ve kovaryans tabanlı hesaplayarak belirler
Sınıflandırma
Sınıflandırma Ayırtaç sınıflandırıcı yaklaşımları, sınıflandırma başarımını en yüksek (veya sınıflandırma hatasını en düşük) tutan ayırtaç fonksiyonunu bulmayı amaçlar Farklı ayırtaç yapıları mümkündür: en yakın komşu (nearest neighbor), karar ağaçları (decision trees), doğrusal ve doğrusal olmayan fonksiyonlar,...
K-En Yakın Komşu (k-nearest Neighbor knn) Temel bir sınıflandırma yaklaşımıdır K sayısı kullanıcı tarafından belirlenir, genellikle tek sayı alınır Etiketli veriler arasında eğitim kümesi ve test kümes,oluşturulduktan sonra, test kümesindeki her test edilen piksel için, eğitim kümesinden uzayda kendisine en yakın k adet piksel belirlenir Test edilen pikselin etiketi, k adet eğitim pikselinin etiketleri arasında en sık tekrarlanan etiket olarak atanır
K-En Yakın Komşu (k-nearest Neighbor knn) K komşu arasında etiket sayılarında eşitlik olması durumunda eşit durumdaki etiketlerden birisi rastgele olarak atanabilir K = 1 durumuna en yakın komşu yaklaşımı adı verilir
K-En Yakın Komşu (k-nearest Neighbor knn) Etiketli veri noktaları
K-En Yakın Komşu (k-nearest Neighbor knn) NN sınıflandırma sonucu
K-En Yakın Komşu (k-nearest Neighbor knn) 5-NN sınıflandırma sonucu
Sınıflandırma Bu tür klasik sınıflandırıcı yaklaşımlarının hiperspektral veriler için en büyük sakıncası Hughes etkisidir Boyutluluk laneti (curse of dimensionality) olarak da adlandırılan Hughes etkisi, verinin boyutu arttıkça daha çok eğitim verisi gerektiğini belirtmektedir Ancak hiperspektral veriler genel olarak boyutlarına göre yetersiz eğitim verisine sahiptir Hughes etkisine en gürbüz yaklaşımlar çekirdek tabanlı yaklaşımlardır: örneğin destek vektör makineleri (support vector machines SVM)
Sınıflandırma: SVM Aşağıda iki boyutlu uzayda gösterilen veri noktaları için kırmızı ve mavi olmak üzere iki etiket atanmıştır. Bu iki sınıfı birbirinden ayıran doğrusal ayırtaç nasıl olmalıdır?
Sınıflandırma: SVM Aşağıda iki boyutlu uzayda gösterilen veri noktaları için kırmızı ve mavi olmak üzere iki etiket atanmıştır. Bu iki sınıfı birbirinden ayıran doğrusal ayırtaç nasıl olmalıdır?
Sınıflandırma: SVM Aşağıda iki boyutlu uzayda gösterilen veri noktaları için kırmızı ve mavi olmak üzere iki etiket atanmıştır. Bu iki sınıfı birbirinden ayıran doğrusal ayırtaç nasıl olmalıdır?
Sınıflandırma: SVM Sonsuz sayıda doğrusal ayırtaç mümkündür
Sınıflandırma: SVM En iyi çözüm, sınıflar arası aralığı (mesafeyi) en büyükleyecek sınır. Bu amaçla, iki sınıftan veri noktalarına ulaşmadan önce mümkün olan en geniş aralık seçilir
Sınıflandırma: SVM Sınıflandırıcının bu aralığını belirleyen eğitim piksellerine destek vektörleri adı verilir
Sınıflandırma: SVM Veri doğrusal olarak ayrılamaz durumda ise yumuşak (soft) aralık sınıflandırması ile gürültü veya aykırı değerlere izin veren bir sınıflandırıcı elde edilebilir
Sınıflandırma: SVM Ancak verinin doğrusal olarak ayrılamazlığı arttıkça bu yaklaşım kullanılamaz hale gelmektedir. Bu durumda, veri daha büyük boyutlu bir uzaya eşlenerek sınıflar ayrışır hale getirilebilir
Sınıflandırma: SVM Bu yaklaşıma çekirdek numarası (kernel trick) adı verilmektedir.
Sınıflandırma: SVM Destek vektör makineleri sıklıkla çekirdek yapısı ile birlikte kullanılır. Farklı çekirdek yapıları mümkündür. Örneğin RBF veya polynomial çekirdek
Sınıflandırma: SVM SVM, hiperspektral görüntü sınıflandırmada en sık kullanım bulan yaklaşımdır MATLAB da kullanmak üzere hazır libsvm yazılımı (kodları) paylaşımdadır
Sınıflandırma: SVM
Sınıflandırma: SVM
Kümeleme Görüntü kümeleme, görüntünün kendi içinde benzer, birbirlerine göre farklı yapıda parçalara ayrılmasıdır Görüntü kümeleme için piksel ışıklılık değerleri, spektral değerler, doku yapısı vb. birçok farklı özellik kullanılabilir Görüntü kümeleme sonucunda kümeler: Tüm görüntüyü kaplamalıdır Örtüşmemelidir Kendi içlerinde homojen olmalıdır
Kümeleme
Kümeleme
K-Ortalamalar Kümeleme Temel kümeleme yaklaşımlarından birisidir Eğitim verisi veya sınıf bilgisi gerekmez Kullanıcı tarafından görüntünün kaç kümeye ayrılacağı (k) belirtilir Yaklaşımın başlangıcı rastgele yapıda olduğundan dolayı yöntemin her çalışmasında çok farklı bir sonuç elde edilebilir
K-Ortalamalar Kümeleme Algoritma: Uzayda dağılmış veri noktaları üzerinden k adet nokta rastgele olarak seçilir ve bu noktalar ilk küme merkezleri olarak alınır Her nokta, kendisine en yakın merkezli kümeye atanır Küme merkezleri kendilerine atanan noktaların ortalamaları olarak güncellenir İşlem, küme merkezleri değişmez hale gelene kadar, veya yineleme sayısı maksimum sayıya ulaşana kadar devam eder
K-Ortalamalar Kümeleme Küme merkezleri ilk aşamada rastgele seçildiğinden dolayı yaklaşımın çıktısı her çalışmada değişmektedir. Yine aynı sebepten, yöntemin yerel (en iyi olmayan) çözümlere takılması mümkündür
K-Ortalamalar Kümeleme
K-Ortalamalar Kümeleme
K-Ortalamalar Kümeleme
K-Ortalamalar Kümeleme
K-Ortalamalar Kümeleme
K-Ortalamalar Kümeleme
Sorular?????