Kelebek görüntülerin sınıflandırılması için bir içerik bazlı görüntü erişim sistemi Yılmaz KAYA a ; Lokman KAYCİ b a Bilgisaar Mühendisliği Bölümü, Siirt Üniversitesi, 5600 Siirt e-posta: ilmazkaa977@gmail.com b Bioloji Bölümü, Siirt Üniversitesi, 5600 Siirt e-posta: lokmankaci@mnet.com Özet Kelebekler kendi aralarında sınıflandırılırken öncelikle kelebeklere ait kanat, baş, anten gibi dış morfolojik özelliklerine göre sınıflandırılır. Dış morfolojik özelliklerine göre sınıflandırmanın gerçekleştirilemediği durumlarda teşhis için genital özelliklerin incelenmesi gerekir. Kelebeklerin genital apılarının incelenmesi farklı kimasal maddeler ve öntemler ugulanarak sağlanabilir. Bu işlemler ancak belli malietlerle gerçekleştirilebilir. Arıca genital preparatların hazırlanması belli aşamalar gerektirdiği için zaman alıcıdır. Bu çalışmada kelebek teşhisi için klasik teşhis öntemlerine alternatif web tabanlı bir içerik tabanlı görüntü erişim (İTGE) görü sistemi önerilmiştir. Çalışmada Papilinidae, Pieridae ailelerinin 38 kelebek türüne ait 380 görüntü kullanılmıştır. Kelebeklerin karşılaştırılması için apısal benzerlik indeks metodu (structural similarit inde measurement (SSIM)) kullanıldı. Elde edilen sonuçlara göre önerilen öntemin kelebek görüntülerin sınıflandırılmasında önemli başarı gösterdiği saptanmıştır. Anahtar Kelimeler: kelebek sınıflandırma, apısal benzerlik ölçütü, bilgisaarla görü, örüntü tanıma Baş azar. E-Posta: ilmazkaa977@gmail.com (Yılmaz Kaa).
-Giriş Kelebek ve güveler takımı, sahip olduğu 70.000 den fazla türüle böcekler arasındaki en zengin takımlardan biridir. Türkie, 5000 den çok Lepidopter türü ile bölgenin zengin ülkeleri arasında saılır []. Kelebeklerde kanat şekilleri, desen ve renkler son derece büük farklılıklar gösterir. Öle ki, bu özellikler ilk bakışta çoğu defa türlerin arımında önemli rol onarlar. Türler içinde sınırlı kaldığı sürece bu tip özellikler taksonomik karakterler olarak kullanılırken, bazen birbirine dıştan çok benzeen türlerin arımında, bilhassa birein dış genital organlarının apısal özelliklerinin incelenmesine ihtiaç duulur []. Bilgi miktarındaki hızlı artışa paralel olarak bilgi erişimle ilgili sorunlar da artmakta ve çeşitlenmektedir. Büük miktarlardaki bilgi ığınları içinde kullanıcıların istenilen bilgie erişmesi zorlaşmaktadır []. Günümüzde metinsel erişimle ilgili problemleri bile tam anlamıla çözülmemişken, karşımıza görsel bilgie erişimdeki sorunlar çıkmaktadır. Saısal görüntü miktarındaki artış ve kullanıcıların deneimlerindeki sınırlamalar, görsel bilgi erişim sistemlerinin sorunlarını artırmaktadır. Son ıllarda WWW üzerinden bilgie erişilmekte. Bilgi ığınları arasında doğru bilgie ulaşılmaa çalışılmaktadır. Görsel bilgiler ile görüntülerin sorgulanması içerik tabanlı görüntü erişimi (İTGE, content-based image retrieval =CBIR) olarak isimlendirilir [3]. İTGE, bir görüntünün büük görüntü ığınları içerisinde bilgisaar görü teknolojileri ile sorgulanmasıdır. İTGE sistemler, iki görüntü arasındaki renk, desen, doku gibi özellikleri karşılaştırarak görüntüleri bir benzerlik ölçütü ile aırmaktadır[4]. Bu çalışmanı amacı, kelebek kanatlarındaki doku, desen apılarını kullanarak kelebekleri otomatik sınıflandıran bir bilgisaar görü sistemi geliştirmektir. Desen, bir görüntüde piksel ton uzasal değişimini belirten ve farklı alanlarda saısal görüntülerin sınıflandırılmasında kullanılabilen apılardır [5]. Kelebek kanat desenleri farklı türlerde farklı renk, parlaklık, desende olabilir. Dolaısıla bilgisaar görüsü öntemlerinde kanat desenleri matematiksel olarak ifade edilebilirler. Benzerlik öntemleri dokusal özellikler işleen öntemlere göre daha basit, hızlı ve insan görme sistemine (Human Vision Sstem=HVS) daha akın olduklarından [6] dolaı kelebeklerin karşılaştırılması için apısal benzerlik indeksi (YBİ, Structural Similarit Inde Measurement, SSIM) kullanılmıştır. YBİ, iki görüntüe ait parlaklık, kontrast, ve apı özelliklerini karşılaştırarak iki görüntü arasında bir benzerlik indeksi oluşturmaktadır [7]. YBİ, Wang ve arkadaşları tarafından önerilmiş olup bir çok problemde başarılı bir şekilde kullanılmıştır [8]. Çalışmada 38 farklı türe ait 380 kelebek
görüntüsü kullanılmıştır. Elde edilen sonuçlara göre geliştirilen İTGE sisteminin kelebek türünün tespitinde önemli başarı sağladığı görülmüştür.. Veri Seti Çalışma ile ilgili inceleme materali Van, Erek Dağı nda toplanmıştır. Kelebekler arazide tül atrap kullanılarak akalanmıştır. Etil asetat içeren kavanozlarda öldürüldükten sonra önceden hazırlanmış özel zarflarının içerisine gerekli toplama bilgilerini içeren etiketile birlikte konmuştur. Örnekler standart müze materali şeklinde hazırlanmak üzere germe tahtalarında gerilerek kurutulmuştur. Dış morfolojik özelliklere bağlı olarak apılan teşhislerde, baş ve göğüs üzerindeki organ ve ekstremitelerin morfolojik özelliklerinin anı sıra kanatların alt ve üst üzlerindeki renk ve desenler dikkate alınmıştır. Türlerin teşhisinde çeşitli el kitapları, revizon çalışmaları ve karşılaştırma materalleri kullanılmıştır. Teşhiste kullanılan aınlar alfabetik sıraa göre şu azarlara aittir: [9,0,,]. Çalışmada kullanılan türlerin doku tanıma öntemine göre teşhis edilmesi için her türe ait digital Nikon profesonel makine ile çekilmiş üksek çözünürlüklü 0 ar fotoğraf kullanılmıştır. Bu çalışmada Papilinidae, Pieridae kelebek ailelerinin Şekil de gösterilen 38 türü kullanılmıştır. Şekil : Örnek kelebek görüntüleri
3. Yapısal Benzerlik Indeksi Ölçütü (Structural Similarit Inde Measurement) Bu öntem, iki görüntüe ait parlaklık, kontrast ve apı denilen 3 özniteliğin karşılaştırılmasına daanmaktadır [8]. Bu öntemde parlaklık (luminance) (L), kontrast (contrast) (c), ve apı (structure) (s) özellikleri birbirinden bağımsız olarak elde edilmektedir. ve birer görüntü olmak üzere YBİ ölçütü aşağıdaki eşitlik ile elde edilmektedir. SSIM ( ) f ( l( ), c( ), s( )) () burada l ( ) parlaklık karşılaştırma fonksionu olup eşitlik ile elde edilmektedir.[8]; l( ) c c () burada, ( KL ) c, K küçük bir sabit değer ( K ) ve L ise piksel dağılım ölçütüdür. c ( ), kontrast karşılaştırma fonksionu: c( ) c c, (3) burada, ( KL ) c, K küçük bir sabit değer ( K )ve L ise piksel dağılım ölçütüdür. s ( ), apı karşılaştırma fonksionu; c3 s( ) c3 (4) Son olarak YBİ ölçütü aşağıdaki eşitlik ile elde edilmektedir [3]: YBİ( ) [ l( ). c( ). s( ) ] (5) burada, 0, 0 ve 0 Eğer ve c c 3, ise; ( c)( c) YBİ( ) ( c )( c ) (6) dir. Burada, karşılaştırılan görüntüler,, ve oğunluk ortalaması, standart sapmasını ve ortak varansı belirtmektedir. tahmin edilen görüntüe ait piksel
N i N i (7) N ( i ) N i (8) ve N ( )( (9) N i i i ) 4. Geliştirilen ITGE Sistemi Bu çalışmada geliştirilecek İTGE sistemine ait diagram şekil te gösterilmiştir. Sistemin çalışma aşamaları aşağıdaki basamaklarda özetlenmiştir. Şekil : Kelebek teşhisi için İTGE sistemi Kelebek teşhisi için geliştirilen ITGE sistem aşamaları: ) İnternet kullanıcısı web üzerinden geliştirilen şekil de gösterilen web safasına giriş apar.
Şekil 3: Teşhis edilecek kelebek görüntüsünün seçimi. ) Kullanıcı teşhis edilecek görüntüü web safasına ükledikten sonra ilgili alanın belirlenmesi için kırpma işlemi gerçekleştirilir (Şekil 4). Kırpma işlemi, görüntü üzerindeki gereksiz alanların atılması için performans açısından önem arz etmektedir. Şekil 4: İlgilenilen alanın belirleme aşamasına örnek. 3) Kelebek görüntüsünden gereksiz alanlar atıldıktan sonra Benzer Kelebek Görüntülerini Ara düğmesi tıklanarak arama işlemi başlatılır. Geliştirilen İTGE sistemi sorgulanan görüntüsünün benzediği en ii 0 kelebek görüntüsünü göstermektedir (Şekil 5).
Şekil 5: Sorgu görüntüsüne benzeen görüntülerin listesi. 5. Sonuçlar Bu çalışmada apısal benzerlik metodu kullanılarak bir ITGE sistemi geliştirilmiştir. Yapısal benzerlik metodu iki görüntünün parlaklık, kontrast ve apı bileşenlerine bağlıdır. Çalışmada 38 farklı kelebek türüne ait 380 görüntü kullanıldı. Rastgele seçilen görüntülerin benzerlik gösterdiği görüntülerin listesi Tablo de verilmiştir. Benzerlik ölçütü değerleri histogramlar şeklinde gösterilmektedir. Tablo : Rastgele seçilen kelebek görüntülerin benzerlik gösterdiği görüntüler Dene No Sorgulanan Görüntü Benzer görüntü ve SSIM değeri Benzerlik Histogramı E 0,86 0,858 0,853 0,85 0,849 Anthocharis damone E 0,739 0,735 0,77 0,75 0,698 Aporia crataegi E3 0,97 0,94 0,896 0,896 0,887
Colias crocea E4 0,849 0,835 0,86 0,80 0,730 Euchloe penia E5 0,8 0,788 0,777 0,773 0,768 Pontia callidice E6 0,88 0,8 0,8 0,808 0,807 Pieris krueperi E7 0,84 0,769 0,760 0,738 0,738 Pontia edusa E8 0,86 0,86 0,857 0,86 0,87 Papilio machaon E9 E0 Chazara bischoffi 0,70 0,70 0,69 0,550 0,553 0,655 0,65 0,55 0,548 0,539 Pseudochazara beroe Yanlış sınıflandırılan görüntüler 0 adet rastgele seçilen kelebek görüntüleri için denemeler gerçekleştirildi. Tablo de görüldüğü gibi sorgulanan görüntülerin veri tabanında bulunan görüntüler ile benzerlik değerleri 0,655 ve 0,97 arasında değişmiştir. Histogramlara bakıldığında sorgulanan kelebek görüntülerin benzerlik gösterdiği görüntüler arasında benzerlik ölçütünün üksek
çıktığı, benzerlik göstermedikleri görüntüler ile aralarında benzerlik ölçütünün düşük çıktığı görülmektedir. E4, E5, E7, E9, ve E0 deneleri için anlış kelebekler de sorgulanmıştır. Ancak tüm denelerde ilk listelenen kelebekler doğru görüntüler olduğu görülmektedir. 6. Tartışma Görüntü bazlı arama ugulamaları günümüzde önem kazanan hizmetler olmaktadır. Günümüzde iki aklaşım söz konusu, birincisi görüntüe ait metinsel meta bilgilere daanan öntemler iken, diğer görüntü içeriğini değerlendiren öntemlerdir. Görüntülere ait görsel özelliklerin kullanılarak arama işlemleri gerçekleştiren sistemlere içerik tabanlı görüntü erişimi (İTGE) sistemler olarak isimlendirilmektedir. Bu çalışmada, kelebek teşhisi için YBİ benzerlik öntemi kullanılarak bir İTGE sistemi geliştirildi. Kelebek görüntülerin kanat desenleri, renkleri ilk etapta kelebek teşhisi için kullanılmaktadır. Ancak her zaman bu öntem başarılı olamamaktadır. Bu üzden klasik öntemlere alternatif öntemlere ihtiaç duulmaktadır. Literatüre bakıldığında bilgisaar destekli öntemlerin eterince kullanılmadığı görülmektedir. Bu çalışmada otomatik tanıma işlemi gerçekleştiren bir bilgisaar görü sistemi önerilmiştir. Çalışmada apılan 0 farklı denede sonuçların başarılı olduğu saptanmıştır. Sonuç olarak YBİ öntemi kullanılarak geliştirilen İTGE sistemi kelebek görüntülerin teşhisinde önemli başarı sağladığı ve benzer ugulamalar için kullanılabileceği öngörülmektedir. Teşekkür Bu çalışma, Siirt Üniversitesi Bilimsel araştırma Projeleri Başkanlığı (SÜBAPB) tarafından desteklenmiştir. Proje no: 03-SİÜMÜH-M. References []. L. Kaci, Erek Dağı (Van) Papilionoidea ve Hesperioidea Ekolojisi ve Faunası Üzerine Araştırmalar (Lepidoptera), Priamus Supplement, Vol. 6,pp. -47, 007. []. X. R. Marcela, H.B. Pedro, J.T. Caetano, M.A. Paulo, A.R. Natalia, J.M. Traina, Supporting content-based image retrieval and computer-aided diagnosis sstems with association rule-based techniques, Data & Knowledge Engineering, Vol. 68, pp. 370 38, 009.
[3]. K. Yuan, Z. Tian, J. Zou, Y. Bai, Q. You, Brain CT image database building for computer-aided diagnosis using content-based image retrieval, Information Processing and Management, Vol. 47, pp. 76 85, 0. [4]. Y. Liu, D. Zhang, G. Lu, W. Ma, A surve of content-based image retrieval with high-level semantics, Pattern Recognition, Vol. 40, pp. 6 8, 007. [5]. W. Y. Ma, B.S. Manjunath, A teture thesaurus for browsing large aerial photographs, Journal of the American Societ for Information Science, Vol. 49(7), pp. 633-648, 998. [6]. J. R. Bach, A visual information management sstem for the interactive retrieval of faces, IEEE Transactions on Knowledge and Data Engineering, Vol. 5(4), pp. 69-68, 999. [7]. L. Chaofeng, C. B. Alan, Content-partitioned structural similarit inde for image qualit assessment, Signal Processing,Image Communication, Vol. 5, pp. 57 56, 00. [8]. Z. Wang, A.C. Bovik, H.R. Sheikh, E.P. Simoncelli, Image Qualit Assessment: From Error Visibilit to Structural Similarit, IEEE Transactions On Image Processing, Vol. 3(4), pp. 600-6, 004. [9]. F. Carbonell, C ontribution a la connaissance du genre Agrodiaetus Hübner (8), position tainomique d'agrodiaetus anticarmon Koçak, 983 (Lepidoptera, Lcaenidae) Linneana Belgica, Vol. 6 (7),pp. 63-65, 998. [0]. H. Paul, G. Ran, The Promise of DNA Barcoding for Taonom, Sstmtc. Biolg, Vol. 54 (5), pp. 85-859, 005. []. P.Skala, New taa of the genus Hponephele MUSCHAMP, 95 from Iran and Turke (Lepidoptera, Nmphalidae), Linneana Belgica, Vol. 9 (), pp. 4-50, 003. []. T. Tolman, Butterflies of Britain and Europe. Harper Collins Publishers, London. 30 (997). [3]. Z. Wang, A.C. Bovik, A universal image qualit inde, IEEE Signal Processing Letters, Vol. 9, pp. 8 84, 00.