Yüz Tanıma Nedir? Đnsan ve Bilgisayarda Yüz Tanıma Boğ Algısal Zeka Laboratuvarı Bilgisayar Mühendisliği Bölümü Albert Ali Salah http://www.ericmyer.com/green/stereotypes.htm# Yüz Tanıma Nedir? Sorular Đki temel yüz tanıma problemi vardır. Birincisinde bir yüz imgesi görüyoruz, bu imgenin kime ait olduğunu bulmaya çalışıyoruz. Bilgisayar tarafından bakasak, veritabanımızda birtakım yüzler var, bunlardan hangisini görüyoruz, bunu seçmeye çalışıyoruz. Đnsanlarda da tanıdık yüzlerin bir şekilde beyinde saklandığını düşünebiliriz. Đkinci senaryo kimlik doğrulama senaryosu. Yine bilgisayar ortamında örneklersek, kişi geliyor, ben Veli yim diyor. Biz de elimizdeki veritabanında Veli nin imgesini buluyoruz, ve karşılaştırıyoruz. Eğer bu yüz yeteri kadar benziyorsa, kimlik testini geçiyor. Bu problemlerin ikisi de zor, ama ikinci biraz daha kolay, çünkü sadece kimlik doğrulamak için sadece Veli amcanın veritabanındaki imgelerine bakacağız, oysa ilk senaryoda bütün imgelere bakmamız lazım. Bilgisayarlarla yüz tanıma nasıl gerçekleşir? Đnsanlarda yüz tanıma nasıl gerçekleşir? Yüz tanıma doğuştan gelen bir yeti midir, ne kadarı öğrenilir? Bilgisayar, insanda yüz tanıma ile ilgili hipotezlere nasıl katkı sağlayabilir? Kim Ne Đstiyor? Mühendisler: Daha iyi bilgisayar modelleri yapmak Psikologlar: Đnsan beynini anlamak Bilişsel Bilimciler: Biyolojik ve bilgisayar sistemleri arasında anlamlı ilişkiler kurmak Polis: Teröristleri yakalamak Parantez: Yapay Öğrenme Yapay öğrenmede iki sınıfın örneklerini ayırmak için matematiksel bir model kullanılır. Karışık modellerin daha çok parametresi vardır. Öğrenme işlemi, eğitim kümesine göre parametre değerlerini bulmaktan ibarettir. 1
Öznitelikler Yüz Tanıma vs Nesne Tanıma Yüz tanıma diğer nesnelerin tanınmasından farklı mıdır? fmri ölçümleri: yüze özgü bölgeler Prosopagnosia: sadece yüz tanıma problemli Agnosia: yüz tanıma sağlam, nesne tanıma problemli Prosopamnesia: yeni yüzlerin öğrenilmesi problemli Capgras sendromu: tanıdık yüzler tanınıyor, ama tanıdık gelmiyor Beyinde bir yüz tanıma modülü var mı? Bruce, V., A. Young, In the eye of the beholder: The science of face perception Mooney yüzleri Parça mı, bütün mü? Mooney yüzleri birer yüz olarak algılandığında Fusiform Girus ta aktivite başlar. Bu sırada görüntü değişmemiştir, sadece algı değişmiştir. Yüz tanıma bütünseldir, parçaların oluşturduğu bütünün bilgisi parçalardan gelen bilgiden daha önemlidir. Ters çevrilmiş yüzlerle yapılan deneyler bunu destekliyor. Andrews, T.J., D. Schluppeck, NeuroImage, vol.21, pp.91-98, 2004 Parça mı, bütün mü? Ters çevrilmiş yüzlerde tanıma çok zorlaşır. Ters çevrilmiş diğer nesneler bu kadar etkilenmezler. Đki nokta ve bir çizgi bile yüz olarak algılanabilir Thatcher Đllüzyonu Göz ve ağzın ters çevirilmesinin korkutucu bir görüntüsü vardır. Ters çevrilmiş yüzlerde bu etki fark edilmez, çünkü bütünsel bilgi kaybolur ve parçalar tek başlarına dönmeden etkilenmezler. Thompson, Perception, vol.9, pp.483-484, 1980 2
Analitik ve Bütünsel Bilgi Parçalardan da tanıma mümkündür. Parçaları tanınamaz hale gelene kadar bulanıklaştırmak, sonra aynı dönüşümü tüm yüze uygulamak bize bütünsel bilginin tek başına katkısını gösterir. Uzmanlaşma Yüz tanıma özel bir sistem değildir, uzmanlaşmanın sonucudur diyen uzmanlar da var. Yapılan deney: Denekler üç boyutlu, yüzlere benzeyen, Greeble denen yaratıkları tanıyacak şekilde uzmanlaşıyorlar. Greeble uzmanları için Greeble görüntüleri, yüz görüntülerine benzer beyin aktivitesine yol açıyor. Greeble lar fmri Deneyleri Gauthier, I., M.J. Tarr, Vision Research vol.37, pp.1673-1682, 1997 Gauthier, I., M.J. Tarr, Vision Research vol.37, pp.1673-1682, 1997 Gelişim Psikolojisi Aşamalı öğrenme Çocuğun yüz tanıma algoritması zaman içinde değişir Önce belirgin öznitelikler öğrenilir Büyüdükçe bütünsel algı ön plana çıkar Uzmanlaşma gerçekleşir Beyin karmaşık problemleri aşamalı çözer Bunun için iki önemli mekanizma vardır: Hafıza Seçici dikkat Meltzoff, A.N., N.K. Moore, Science, vol.198, pp.75-78, 1977 3
Seçici Dikkat Bilgisayarda Yüz Tanıma Biyolojik Temelli Modeller Biyolojik temelli dönüşümler Gabor filtreleri DCT dönüşümü Örneğe dayalı tanıma Özyüz modeli ve yüz uzayı Bütünsel ve yapısal bilgiye dayalı tanıma Elastik çizge modeli Işıklandırma ve pozdan arındırma Yarbus, A.L.,Eye Movement and Vision, 1976 Gabor Filtreleri Özyüz Tekniği Değişik yönde filtreler (F:1 O:0,2,4,6) Turk ve Pentland ın önerdiği bu teknikte yüzlerin bir altuzaya projeksiyonu yapılır. Resimde değişik sırayla özyüz, Fischer ve Laplace altuzayını geren vektörler görülüyor. Değişik frekanslarda filtreler (F:2,3,4 O:4) Yüz Uzayına Đzdüşüm Elastik Çizge Modeli Yüzdeki noktalar bir çizge modeliyle ilişkilendirilir, öznitelikler ve bağlantılar öğrenilir. Wiskott, L., J.-M Fellous, N. Krüger, C. von der Malsburg, 1997 4
Çizgede Öznitelikler Biçim Değiştiren Modeller Biçim değiştiren modellerle tek bir yüz imgesinden (1) üç boyutlu şekil (2) çıkartılabilir. Standart yüz renklendirmesine ilaven imgenin yüzeyi kullanılarak model güncellenir (4). Sonra modelin parametrelerini değiştirerek şişmanlık (3), zayıflık (5), endişe (6) ve gülümseme (7) gibi değişiklikler elde edilebilir. http://www.mpi-sb.mpg.de/~blanz/ Sonuçlar Kaynakça 1 "Yüz tanıma algoritmaları ve sistemleri tasarlayanlar psikofiziksel ve nörofizyolojik bulgulardan haberdar olmalı, ama sadece pratik anlamda işe yarayacak olanları modellerinde kullanmalıdırlar." (Chellappa et al.) Bilgisayar modelleri biyolojik savları destekleyebilir, veya yanlışlayabilir. Beyin araştırmalarına göre: Karmaşık bir sistemi ortaya koyup yüz tanıma problemini bir anda çözmeye çalışmak yerine, doğru ara gösterimler seçmek ve sistemi aşamalı olarak eğitmek daha sağlıklı bir yaklaşımdır. Bütünsel ve öznitelik tabanlı sistemlerin yüz tanımada birlikte çalışması daha gürbüz (robust) çözümler üretecektir. Birçok problemde olduğu gibi sorunun çözümü büyük ölçüde gösterime dayanmaktadır. Bu açıdan bakıldığında duruş-temelli modeller diğer alternatiflerden daha iyi görünmektedir. Yüz tanıma için atık üç boyutlu imgeler, infrared imgeleri gibi yeni gösterimler de kullanılmaktadır. Andrews, T.J., D. Schluppeck, 'Neural responses to Mooney images reveal a modular representation of faces in human visual cortex,' NeuroImage, vol.21, pp.91-98, 2004. Bruce, V., A. Young, In the eye of the beholder: The science of face perception, Oxford University Press, New York, 1998. Chellappa, R., C.L. Wilson, S. Sirohey, 'Human and machine recognition of faces: a survey,' Proceedings of the IEEE, vol.83, no.5, 1995. Elman, J.L., E.A. Bates, M.H. Johnson, A. Karmiloff-Smith, D. Parisi, K. Plunkett, Rethinking innateness: A connectionist perspective on development, Cambridge, MA: MIT Press, 1996. Fodor J.A., The Modularity of Mind, MIT Press, Cambridge, MA, 1983. Gauthier, I., M.J. Tarr, 'Becoming a 'Greeble expert': Exploring the face recognition mechanism,' Vision Research vol.37, pp.1673-1682, 1997. Karmiloff-Smith, A., Beyond modularity: A developmental perspective on cognitive science, Cambridge MA: MIT Press, 1992. Meltzoff, A.N., N.K. Moore, 'Imitation of facial and manual gestures by human neonates,' Science, vol.198, pp.75-78, 1977. Kaynakça 2 Ramasubramanian, D., Y.V. Venkatesh, 'Encoding and recognition of faces based on the human visual model and DCT,' Pattern Recognition, vol.34, pp.2447-2458, 2001. Tanaka, J.W. and M.J. Farah, 'Parts and wholes in face recognition,' Quarterly Journal of Experimental Psychology: Human Experimental Psychology vol.46a, 225-245, 1993. Thompson, P., 'Margaret Thatcher - A new illusion,' Perception, vol.9, pp.483-484, 1980. Turk, M., A. Pentland, 'Eigenfaces for recognition,' Journal of Cognitive Neuroscience, vol.3, no.1, pp.71-86, 1991. Wallraven, C., A. Schwaninger, H.H. Bülthoff, 'Learning from humans: computational modeling of face recognition,' Proceedings of ECVW, 2004. Wiskott, L., J.-M Fellous, N. Krüger, C. von der Malsburg, 'Face recognition by elastic bunch graph matching,' IEEE Transactions on Pattern Analysis and Machine Intelligence, vol.19, no.7, pp.775-779, 1997. 5