A NEW APPROACH FOR IMAGE CLASSIFICATION: CONVOLUTIONAL NEURAL NETWORK. Emine Cengil* 1, Ahmet Çınar 2

Benzer belgeler
YAPAY ZEKA VE DERİN ÖĞRENMENİN GÜNÜMÜZDEKİ UYGULAMA ALANLARI

Derin Yapay Sinir Ağları ve Derin Öğrenme ye Kısa Bir Giriş

Uzaktan Algılama Teknolojileri

Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü. Şekil Tanıma Final Projesi. Selçuk BAŞAK

Geriye Yayılım ve Levenberg Marquardt Algoritmalarının YSA Eğitimlerindeki Başarımlarının Dinamik Sistemler Üzerindeki Başarımı. Mehmet Ali Çavuşlu

Otomatik Diyet Gözetimi için Gıda İmgelerinin Anlamsal Bölütlemesi

YAPAY SİNİR AĞLARI. Araş. Gör. Nesibe YALÇIN BİLECİK ÜNİVERSİTESİ

Türkçe Dokümanlar Ġçin Yazar Tanıma

2.1 Bir Sınıfı Örneklerinden Öğrenme Vapnik-Chervonenkis (VC) Boyutu Olası Yaklaşık Doğru Öğrenme... 21

Yapay Sinir Ağları. (Artificial Neural Networks) DOÇ. DR. ERSAN KABALCI

127 - Twoing Algoritması ile Sınıflandırma Kalp Hastalığı Uygulaması MEHMET AKİF ERSOY ÜNİVERSİTESİ İLHAN UYSAL MEHMET BİLEN SAMİ ULUKUŞ

Kablosuz Sensör Ağlar ve Eniyileme. Tahir Emre KALAYCI. 21 Mart 2008

Yapay Sinir Ağları ve Yüksek Enerji Fiziği Uygulamaları

Zeki Optimizasyon Teknikleri

Karaciğerde Oluşan Hastalıkların Tespitinde Makine Öğrenmesi Yöntemlerinin Kullanılması

İlk Yapay Sinir Ağları. Dr. Hidayet Takçı

BAŞKENT ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ BENZER SÜREÇLERDE ÜRETİLEN ÜRÜNLER İÇİN YAPAY ZEKA İLE ZAMAN TAHMİNİ SONER ŞÜKRÜ ALTIN

Yüz Tanımaya Dayalı Uygulamalar. (Özet)

Örüntü Tanıma (EE 448) Ders Detayları

Esnek Hesaplamaya Giriş

Sinirsel Benzetim ve NSL. İlker Kalaycı 06, 2008

Çekişmeli Üretici Ağlar Kullanarak Dış Mekan Görüntülerinin Geçici Niteliklerini Düzenleme

YAPAY AÇIKLIKLI RADAR GÖRÜNTÜLERİNDE YAPAY SİNİR AĞLARI İLE HEDEF TANIMLAMA

BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ

ve Sonrası Girişli Öğrenciler için Uygulanacak Ders Program

MÜFREDAT DERS LİSTESİ

WEB SAYFALARINA İLİŞKİN YAPAY SİNİR AĞLARI İLE SINIFLANDIRMA YÖNTEMİ

T.C. ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ EĞİTİM ÖĞRETİM YILI DERS KATALOĞU

Elbistan Meslek Yüksek Okulu Güz Yarıyılı

Web Madenciliği (Web Mining)

Mekatronik Mühendisliği Uygulamalarında Yapay Zekâ. Ders 1- Yapay Zekâya Giriş. Erhan AKDOĞAN, Ph.D.

İSTANBUL TİCARET ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ BİLGİSAYAR SİSTEMLERİ LABORATUARI

T.C. KIRIKKALE ÜNİVERSİTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ YAPAY SİNİR AĞLARI. Doç.Dr. Necaattin BARIŞÇI FİNAL PROJESİ

YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT

K En Yakın Komşu Methodu (KNearest Neighborhood)

Şifrebilimde Yapay Sinir Ağları

Büyük Veri İçin İstatistiksel Öğrenme (Statistical Learning for Big Data)

Eğitim seti (training set) sınıflandırma modelinin elde edileceği kayıtları içerir

YZM ALGORİTMA ANALİZİ VE TASARIM DERS#9: AÇGÖZLÜ ALGORİTMALAR

Akıllı Sistemler ve Uygulamaları Dergisi, Cilt: 1, Sayı: 1, Sayfa ,

ÇİMENTO BASMA DAYANIMI TAHMİNİ İÇİN YAPAY SİNİR AĞI MODELİ

Uzaktan Algılama Uygulamaları

QUANTILE REGRESYON * Quantile Regression

Yapay Sinir Ağlarına Giriş. Dr. Hidayet Takçı

ISSN : Isparta-Turkey YAPAY SĠNĠR AĞLARI (YSA) YÖNTEMĠ ĠLE GLOBAL RADYASYON TAHMĠNĠ

YAPAY SĠNĠR AĞLARININ EKONOMĠK TAHMĠNLERDE KULLANILMASI

İstanbul Şehir Üniversitesi Bahar

CBS ve Coğrafi Hesaplama

ÖZET...V ABSTRACT...VII TEŞEKKÜR... IX ŞEKİLLER DİZİNİ... XIV SÖZLÜK... XIX

Web Madenciliği (Web Mining)

ÖZGEÇMİŞ. 1. Adı Soyadı : Olcay Taner Yıldız. 2. Doğum Tarihi : Unvanı : Doç. Dr. 4. Öğrenim Durumu :

POSITION DETERMINATION BY USING IMAGE PROCESSING METHOD IN INVERTED PENDULUM

Büyük, Dağıtık, Veri Yoğunluklu Uygulamalarda Programlama Paradigmaları

Derin Öğrenme. M. Ali Akcayol Gazi Üniversitesi

Tedarik Zinciri Yönetiminde Yapay Zeka Teknikler

MİKROŞERİT HAT ENDÜKTANS BÜYÜKLÜĞÜNÜN BİLGİ TABANLI YAPAY SİNİR AĞLARI ile MODELLENMESİ

Düzce Üniversitesi Bilim ve Teknoloji Dergisi

08225 AĞ TEMELLERĠ. Elbistan Meslek Yüksek Okulu GÜZ Yarıyılı. Öğr. Gör. Murat KEÇECĠOĞLU. 20 EKi Salı, Çarşamba

YAPAY SİNİR AĞLARI YÖNTEMİ İLE PAFTALARININ SAYISALLAŞTIRILMASI ARTIFICIAL NEURAL NETWORKS METHOD FOR MAP DIGITIZATION

Kolektif Öğrenme Metotları

Bilgisayar Mühendisliği. Bilgisayar Mühendisliğine Giriş 1

DERİN ÖĞRENME SONGÜL TORANOĞLU

Algoritma Geliştirme ve Veri Yapıları 2 Veri Modelleri. Mustafa Kemal Üniversitesi

daha çok göz önünde bulundurulabilir. Öğrencilerin dile karşı daha olumlu bir tutum geliştirmeleri ve daha homojen gruplar ile dersler yürütülebilir.

EĞİTİM-ÖĞRETİM YILI MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ (İNGİLİZCE) BÖLÜMÜ DERS PROGRAMINDA YAPILAN DEĞİŞİKLİKLER

BSM 532 KABLOSUZ AĞLARIN MODELLEMESİ VE ANALİZİ OPNET MODELER

TMMOB Harita ve Kadastro Mühendisleri Odası Ulusal Coğrafi Bilgi Sistemleri Kongresi 30 Ekim 02 Kasım 2007, KTÜ, Trabzon

Derin Öğrenme Algoritmalarında Model Testleri: Derin Testler

OSPF PROTOKOLÜNÜ KULLANAN ROUTER LARIN MALİYET BİLGİSİNİN BULANIK MANTIKLA BELİRLENMESİ

VERİ MADENCİLİĞİ (Sınıflandırma Yöntemleri) Yrd.Doç.Dr. Kadriye ERGÜN

COĞRAFİ BİLGİ SİSTEMLERİ İLERİ SEVİYE EĞİTİMLERİ ARCGIS SCHEMATİCS EĞİTİMİ

Bulanık Mantık Tabanlı Uçak Modeli Tespiti

Bilgisayar Mühendisliği Bölümü Lisans Ders Programı / Computer Engineering Undergraduate Curriculum

Doç.Dr.Erkan ÜLKER, Selçuk Üniversitesi Mühendislik F, Bilgisayar Mühendisliği Bölümü

Dijital Görüntü İşleme Teknikleri

PSM 11 PEM YAKIT HÜCRELERİNİN YAPAY SİNİR AĞLARI İLE MODELLENMESİ

DERİN ÖĞRENME YRD.DOÇ.DR. KADRİYE ERGÜN İREM TÜRKMEN

Otomatik Doküman Sınıflandırma

İş Zekası. Hafta 6 Kestirimci Modelleme Teknikleri. Yrd. Doç. Dr. H. İbrahim CEBECİ

VERİ MADENCİLİĞİ VE SOSYAL AĞ ANALİZİ ARAŞTIRMA LABORATUVARI

DOKUZ EYLÜL ÜNİVERSİTESİ FEN BİLİMLERİ ENSTİTÜSÜ MÜDÜRLÜĞÜ DERS/MODÜL/BLOK TANITIM FORMU. Dersin Orjinal Adı: Pattern Recognition

YOĞUN GÖRÜNTÜ EŞLEME ALGORİTMALARI İLE ÜRETİLEN YÜKSEK ÇÖZÜNÜRLÜKLÜ SAYISAL YÜZEY MODELİ ÜRETİMİNDE KALİTE DEĞERLENDİRME VE DOĞRULUK ANALİZİ

BİYOMETRİK İRİS SINIFLANDIRMA SİSTEMLERİ

ÇATI DÖŞEMESİNDE MEYDANA GELEN YOĞUŞMA VE BUHARLAŞMA KÜTLELERİNİN YAPAY SİNİR AĞLARI İLE TAHMİN EDİLMESİ

Dr. Ergün AKGÜN Kimdir?

BLM 4811 MESLEKİ TERMİNOLOJİ II Salı , D-109 Dr. Göksel Biricik

KAHKAHA TANIMA İÇİN RASSAL ORMANLAR

AMAÇ Araçlardaki Kamera Sistemleri

KOCAELİ ÜNİVERSİTESİ ELEKTRONİK VE HABERLEŞME MÜHENDİSLİĞİ BÖLÜMÜ 2018/2019 GYY BİTİRME ÇALIŞMASI ÖNERİ FORMU. (Doç.Dr. M.

BIL684 Nöron Ağları Dönem Projesi

VERİ YAPILARI VE PROGRAMLAMA

Doç. Dr. Cüneyt BAYILMIŞ

Ders Adı : Nesne Tabanlı Programlama-I Ders No : Teorik : 3 Pratik : 1 Kredi : 3.5 ECTS : 4. Ders Bilgileri.

2011 Third International Conference on Intelligent Human-Machine Systems and Cybernetics

Kümeler arası. Küme içi. uzaklıklar. maksimize edilir. minimize edilir

OpenZeka MARC. Mini Otonom Araç Yarışması

Bilişim Sistemleri. Modelleme, Analiz ve Tasarım. Yrd. Doç. Dr. Alper GÖKSU

Otomatik Doküman Sınıflandırma

Transkript:

EJT Vol 6, Number 2, 2016 European Journal of Technic A NEW APPROACH FOR IMAGE CLASSIFICATION: CONVOLUTIONAL NEURAL NETWORK Emine Cengil* 1, Ahmet Çınar 2 1,2 Computer Engineering Department, Firat University, Elazig 23119, Turkey * ecengil@firat.edu.tr Received: 1 November 2016; Accepted: 23 December 2016 In this work, it has been made image classification process using deep learning that often used with high accuracy rate and low working time about solving problems that belong to machine learning issues such as image processing, signal processing, natural language processing and speech recognition in recent years. Different eight images have been selected from CIFAR-100 dataset. This images are bus, tractor, train, dinosaurs, elephant, butterfly, chair and television. 800 and 40 images for each class in total were respectively used for training and test processes. In work, convolutional neural networks which is a specialized structure of deep learning was used. CNN works by removing hidden attributes thanks to its layered structure. Increasing the number of hidden layer makes a positive impact up to a point. After, it adversely affects performance due to reduce finding speed because of the increase of parameter. We used a Alex- Net like structure which has 7 layers in our study. It is found many open source software that accepts CNN as input Caffe that is one of them has been preferred because of compatible with languages such as C++, Python, matlab etc. and applicable to most environments. Method which is recommended shows success of CNN about classification. Also, studies that are made using deep learning techniques have been showed in work. If deep learning improves in this way it will continue to be mentioned in the academic and scientific world, so it will meet expectations. Key words: Convolutional Neural Network, image classification, caffe, CIFAR-100. 96

GÖRÜNTÜ SINIFLANDIRMA İÇİN YENİ BİR YAKLAŞIM: EVRİŞİMSEL SİNİR AĞLARI ÖZET: Bu çalışmada, görüntü işleme, sinyal işleme, doğal dil işleme ve konuşma tanıma gibi makine öğrenmesi konularındaki problemlerin çözümünde son yıllarda büyük doğruluk oranı ve hız ile kendinden çokça söz ettiren derin öğrenme kullanılarak görüntü sınıflandırma işlemi yapılmıştır. CIFAR-100 veri kümesinden seçilen 8 farklı görüntü seçilmiştir. Bu görüntüler; otobüs, traktör, tren, dinozor, fil, kelebek, sandalye, televizyondur. Her sınıf için toplamda eğitim ve test işlemleri için sırasıyla 800 ve 40 adet görüntü kullanıldı. Çalışmada, derin öğrenmenin özelleşmiş bir yapısı olan evrişimsel sinir ağları(cnn) kullanıldı. CNN, katmanlı yapısıyla gizli öznitelikleri çıkararak işlem yapmaktadır. Gizli katman sayısının artışıbir noktaya kadar olumlu etki yaparken sonrasında parametre artışından dolayı bulma hızını düşürdüğü için performansa olumsuz yönde etki etmektedir. Biz çalışmamızda 7 katmanlı AlexNet benzeri bir yapı kullandık. CNN yi girdi olarak kabul eden birçok açık kaynak yazılım bulunmaktadır. Bunlardan birisi olan caffe, c++, python ve matlab gibi dillerle uyumlu olması ve çoğu ortamda uygulanabilmesinden dolayı tercih edilmiştir. Önerilen yöntem, sınıflandırma konusunda evrişimsel sinir ağlarının başarısını göstermektedir. Çalışmada ayrıca, derin öğrenme teknikleri kullanılarak yapılmış var olan çalışmalar gösterilmiştir. Bu hızla giderse derin öğrenme akademik ve bilim dünyasında, problemleri çözmedeki başarısıyla adından söz ettirmeye devam edecek ve beklentileri karşılayacaktır. Anahtar sözcükler: Evrişimsel sinir ağları, görüntü sınıflandırma, caffe, CIFAR-100. 1.Giriş Son zamanlarda akıllı makineler yapabilme fikrinin büyüsüyle başlamış olan yapay zekâ uygulamalarının hızlı ve neredeyse hatasız çözümler getiren tekniği olan derin öğrenme oldukça yaygın bir şekilde kullanılmaktadır. Geçmişte olasılık ve istatistik ile başlamış olan makine öğrenmesi bazı süreçlerden geçerek önemli ilerlemeler kaydetmiştir. Günümüzde en gelişmiş tekniği ise defalarca yapılan çalışmalarda başarısını ispatlamış olan derin öğrenmedir. 1950li yıllarda yapay zekâ ile uğraşan akademik çevreler bilgisayar görmesi için iki yöntem ortaya attı. Yapay Sinir Ağları ve Karar Ağaçları. Yapay sinir ağları insan beyninin çalışma mekanizmasından esinlenilerek ortaya atılmış bir yöntemdir ve sinir hücrelerinin çalışma şekli simule edilerek katmanlı ağ yapısı oluşturulmuştur. Bu yapı 1980li yılların sonundan 2000li yılların başına kadar geçen sürede büyük başarılar sağladı [1]. Derin öğrenmenin temelini yapay sinir ağları oluşturmaktadır. Yapay sinir ağının geliştirilerek beynin daha iyi modellenmesini sağlayan mimariler sunmaktadır.1980lerde donanım kısıtlarının yoğun matris işlemlerine izin vermemesinden dolayı derin öğrenme uygulamaya dönüştürülememiştir. 80 lerin sonlarında Hinton Ve Lecun un önerdiği geri yayma algoritması [2], bilim çevrelerinde 97

büyük yankı uyandırmamasına rağmen Kanada İleri Araştırma Enstitüsü nün dikkatini çekmiş ve enstitüye bağlı Üniversitelerin araştırma grupları belki de bu sayede derin öğrenme konusunda referans alınan gruplar olmuşlardır [3]. Literatürde ve uygulamada derin öğrenme tekniği kullanılarak birçok çalışma yapılmış ve başarılı sonuçlar elde edilmiştir. Derin öğrenmenin özelleşmiş bir mimarisi olan evrişimsel sinir ağları (Convolutional Neural Network )özellikle görüntü işlemede oldukça başarılıdır. S. Zhou ve diğ.[4] derin ağlar ile görüntü sınıflandırma problemine işaret eden, evrişim derin ağlar denen yarı-denetimli bir öğrenme algoritmasını geliştirmişlerdir. Öncelikle evrişimsel sınırlı boltzman makinelerini kullanarak birkaç gizli katman inşa edilmiştir. Bunlar etkili şekilde görüntünün bilgisini soyutlar ve azaltabilir. İkinci olarak yine kısıtlı boltzman makineleri kullanarak hızlıca görüntünün bilgisi ayrılabilir. Son olarak bir exponansiyel kayıp fonksiyonu ile denetimli tabanlı eğim-iniş tarafından derin öğrenme mimarisi ince ayarlanmıştır. Evrişim derin ağlar(cdn) nesnelerin bilgisini soyutlayabilir ve boyutunu azaltabilir. Ayrıca CDN soyutlama ve sınıflandırma işlemi, farklı adımlarda aynı parametrenin optimizasyonu için aynı derin mimariyi kullanır, öğrenme yeteneğini etkili şekilde geliştirebilir. Standart iki veri setinde birkaç uygulama yapılmış ve görülmüştür ki CDN, yarı-denetimli sınıflandırıcılar ve var olan öğrenme teknikleriyle rakiptir. H. Özcan[5], düşük çözünürlükte yüz imgelerinden kimlik tespiti ve düşük çözünürlüklü imgelerin görüntü iyileştirmesini derin öğrenme uygulamaları ile yapmıştır. İlk olarak çok düşük çözünürlüklü yüz imgeleri yığıt otomatik kodlayıcılar ve derin inanç ağlarında işleme sokularak saklı öznitelikler elde edilmiş ve destek vektör makineleriyle sınıflandırma yapılmıştır. Özellikle yığıt otomatik kodlayıcılardan çıkarılan özniteliklerin yüz tanımada başarılı oldukları görülmüştür. İkinci aşamada, yüz imgeleri iyileştirilme maksadıyla yığıt otomatik kodlayıcılarla eğitilen imge yamalarının birleştirilmesine dayalı çözünürlük yükseltme algoritması önerilmiştir. Sonraki adımda çözünürlüğü yükseltilen yüz imgelerinin Gürbüz Boltzman Makineleri ile veritabanındaki yüz imgeleriyle eşleştirilmesi gerçekleştirilmiştir. Bu amaçla öğrenme tabanlı bir süper çözünürlük yöntemi geliştirilmiştir. Önerilen yöntemde, derin yapay sinir ağlarının bir türevi olan yığıt otomatik kodlayıcılar ile Gürbüz Boltzman Makineleri kullanılmıştır. Derin öğrenme yöntemlerinin kullanılmasındaki amaç bu modellerin veri içerisindeki saklı öznitelikleri bulmadaki başarısıdır. A.I.Kukharenko ve A.S.Konushin[6], bir kişinin görüntüsünden birkaç özelliğin aynı anda çıkarımını sağlayan bir model tanımlamıştır. Modelde, birkaç olasılıksal çıktı ve yaygın giriş katmanları ile derin evrişimsel ağların bir formu önerilmiştir. Bu sinir ağı yüksek doğrulukta bir evrişimsel sinir ağına sahiptir ve görünümde bir özelliği çıkarmak için gereken sürede aynı anda bir dizi özellik elde edebilmiştir. Bu ağ 13233 fotoğraf içeren LWF veri kümesiyle eğitilmiştir. Kişinin görünüm özellikleri olarak cinsiyet, bir bıyık ve bir sakal özellikleri kullanılmıştır. Her bir özellik için doğru tanıma oranı %91.5 ten az olmamıştır. Bu oran LWF veri kümesi için en iyi sonuçlardan biridir. Bu model, önemli işletim zamanı artışı olmadan, insan görünümünün daha fazla sayıda özellikleri aynı anda tanıması için kullanılabilmiştir. Y.Hu ve diğ. [7] Evrişimsel Sinir Ağları kullanarak hareketsiz görüntüden yoğun kalabalık sayma çalışması yapmıştır. Kamu güvenliği için büyük kalabalık dağılımlarını hesaplama veya yoğunluk tahmin etme son zamanlarda ilgi çekicidir. Bu konuyla ilgili var olan uygulamalar ön tanımlı özelliklere dayanır. Dahası bunların çoğu kısıtlıdır. Bu kısıtlardan ilki; birey sayısı onlarca olduğunda uygulanabilinmesi fakat kalabalık sayısı yüzlerce veya binlerce olduğunda, kalabalığın hesabından çok yoğunluk tahmini yapabilinmesidir. Diğeri; genelde videolarda bir zamansal diziye bağlıdır ve durağan cisimlere uygulanamazlar. Bu çalışmada bu problemlere gönderme yapılmıştır. Tek görüntüde bir orta veya yüksek seviye kalabalık mevcudunda sunulan kişilerin sayısını tahmin için bir derin evrişimsel ağ yaklaşımını kullanarak inceleme yapmışlardır. İlk olarak kalabalık özelliği çıkarmak için bir CNN yapısı kullanmışlardır. Sonra kalabalık sayma ve kalabalık yoğunluğu gibi iki 98

denetleyici sinyal, belirli sayıyı tahmin ve kalabalık özellikleri öğrenmek için kullanıldı. Yaklaşımlarını 45.000 açıklamalı insanla ve her biri 58 ile 2201 aralığında kafa sayısıyla 107 kalabalık görüntüsü içeren bir veri kümesinde test etmişlerdir. Önerilen yaklaşımın etkisi, kapsamlı deneylerde birden fazla değerlendirme kriterleriyle sayma performansı hesaplanarak kanıtlanmıştır. Çalışma geliştirilerek güvenlik yönetimi ve video izlemede daha iyi sonuçlar verebilmektedir. Görüntü sınıflandırma konusunda CNN kullanmış birçok çalışma bulunmaktadır. Bunlardan birisi olan A. Krizhevsky ve diğ. [8] derin evrişimsel ağlar ile ImageNet sınıflandırması yapmışlardır. 1.2 milyon adet yüksek kararlılıkta nesneyi 1000 farklı sınıfa ayıran derin evrişimsel sinir ağı eğitilmiştir. Öğrenmeyi hızlandırmak için doymamış nöronlar ve evrişimsel operasyonun çok etkili bir GPU uygulaması kullanılmıştır. Tam-bağlantılı katmanlarda uygun bir değere indirmek için çok etkili olduğu ispatlanmış yeni gelişmiş hazır dropout metodu kullanılmıştır. Yaklaşımın diğerlerinden iyi olduğunu kanıtlamak için daha geniş veri kümesi, daha güçlü öğrenme modelleri ve daha iyi teknikler kullanılmış. Sonuçta sınıflandırma işlemi çok az hata oranı(0.15) ile yapıldı ve evrişimsel sinir ağının sınıflandırmadaki başarısı görülmüştür. ImageNet2012 de Krizhevsky ve diğ. nin derin öğrenme tekniğiyle birinci olmasının ardından, derin öğrenmenin görüntü sınıflandırmadaki başarısı görülmüş ve ertesi yıl ImageNet2013 de, birçok katılımcı derin öğrenme tekniğini kullanmış ve aynı şekilde başarı elde etmişlerdir. Öyle ki ilk 20ye girenlerin hepsi de derin öğrenme tekniğini kullanmışlardır (2013). Bu makalenin yapısı aşağıdaki gibidir. Bölüm 2 de derin öğrenme mimarilerinin en çok kullanılanlarından bahsedilmiştir. Bölüm 3 te önerilen yöntem sunulmuştur. Son kısım olan bölüm 4 te, çalışmanın amacı özetlenmiş ve gelecekte konunun geliştirilmesinin gerekliliği vurgulanmıştır. 2.Derin Öğrenme Mimarileri Derin öğrenme algoritmaları, yapay sinir ağları kökenlidir. Yapay sinir ağlarında gizli katman sayısının beşi geçtiği durumlarda karmaşa artar ve durum iyileştirilemez. Derin öğrenme mimarileri çok katmanlıdır ve birçok parametre içerirler. En çok kullanılan mimariler; Otomatik kodlayıcılar, Kısıtlı Boltzman Makineleri ve evrişimsel sinir ağlarıdır [5]. Bu bölümde once sinir ağı mimarilerinden bahsedilecek, akabinde derin öğrenme mimarilerine değinilecektir. 2.1.Algılayıcılar Algılayıcılar, ilk sinir ağı mimarisi olup üç katmana sahiptir. Bu katmanlardan ilkindeki ağırlıklar değiştirilebilirken diğer iki katmandaki ağırlıklar değiştirilemez. X 1 W 1 X 2 W2 y X 3 W 3 W n X n Şekil 1. Algılayıcı Yapısı 99

Girdiler, ağırlık değerleri, toplam fonksiyonu, aktivasyon fonksiyonu ve çıktı olmak üzere beş birimden oluşan basit bir algılayıcı yapısı Şekil 1 de gösterilmiştir. Ağırlıklar, ağ modelinin hafızasını oluştururlar. Problemde amaç en uygun ağırlığı bulmaktır. En uygun ağırlık bulunduğunda problem çözülmüş olur. Girdiler, ağırlık değerleriyle çarpılır. Elde edilen değerler toplanarak tek bir değer elde edilir. Sonucun aktivasyon fonksiyonundan geçirilmesiyle çıktı elde edilir [10]. Rossenblaff in çıkış noktası retinanın fiziksel yapısını kabaca modellemektir. Ağdaki elemanlar birleştirilmemiş toplam fonksiyonuna ve eşik fonksiyona sahiptir. İlk katmandaki ağırlıklar rastgele olarak seçilir ve ikinci katmana tamamen bağlıdır. İki ve üçüncü katmandaki ağırlıklar birinci katmana göre, üçüncü katmandaki ağırlıklar da ikinci katmana göre ayarlanır. İkinci katmandaki ağırlıklar üçüncü katmanla rastgele olarak değiştirilebilen ağırlıklarla bağlıdır [11]. Algılayıcılara örneklerin öğretilmesi düzlem üzerinde lineer doğrunun konumunun değiştirilmesiyle olur. Doğrusal olmayan sınıfları tanımlamada ise başarısızdır. Bu yüzden yeni mimarilere ihtiyaç duyulmuştur [12]. 2.2.Kısıtlı Boltzman Makineleri Kısıtlı Boltzman Makineleri, Markov tesadüfi alanlarının özel bir çeşididir. Görünen ve gizli olmak üzere iki katmandan oluşmaktadır. Boltzman makineleri de iki katmandan oluşur ve katmandaki birimlerin kendi içinde de bağlantıları vardır. Bu da karmaşayı arttırır. Katman içi bağlantıların kaldırılmasıyla oluşan basitleştirilmiş yapı Kısıtlı Boltzman Makineleridir. Kısıtlı Boltzman Makineleri koşullu iki yönlü çizgelerdir [11]. s1 s2 Saklı Katman g1 g2 g3 Görünür Katman Şekil 2. Kısıtlı Boltzman Makinesi Ağının Bağlantı Yapısı Şekil 2 de görüldüğü gibi Kısıtlı Boltzman Makineleri (KBM) yapısında katmandaki düğümlerin kendi aralarında bağlantısı yoktur. Yani, görünür katmandaki düğümler arasında herhangi bir bağlantı bulunmadığı gibi saklı katmandaki birimler arasında da herhangi bir bağlantı bulunmamaktadır. Görünür düğümler ve saklı düğümler birbirleriyle çift yönlü bağlantı yapmaktadır. Her bağlantının bir ağırlık değeri vardır. KBM problemin türüne göre denetimli veya denetimsiz yollarla eğitilebilir. 2.3.Otomatik Kodlayıcılar Otomatik kodlayıcılar, etiketlenmemiş verinin aynı şekilde çıktı olarak elde edilmesini hedefleyen sinir ağı mimarisidir. Burada girdi verisi alınarak gizli katmanda birim sayısının arttırılıp azaltılmasıyla saklı öznitelikler çıkartılır [5]. 100

Şekil 3. Otomatik Kodlayıcı Diyagramı Şekil 3 de gizli katmanda 3, giriş ve çıkış katmanlarında 4 düğüm bulunmaktadır. Saklı katmandaki nöron sayısının az olduğu durumlar olduğu gibi çok olduğu durumlar da vardır. Otomatik kodlayıcılar parametre güncellemesini yapay sinir ağlarındaki yöntemlerle yaparlar. Farklı olarak bu mimaride çıktı katmanındaki hatanın belirlenmesinde gözetimli öğrenmede kullanılan etiket yerine giriş katmanı verisi kullanılarak hata hesaplanır [5]. 2.4.Evrişimsel Sinir Ağları Bir diğer derin öğrenme mimarisi olan Evrişim Sinir Ağları, özellikle ayrım yapmak maksadıyla kullanılmaktadır. Biyolojiden ilham alınarak üretilen çok katmanlı algılayıcıların bir türevidirler [13]. Evrişimsel sinir ağları, eğitilebilen birçok katmandan oluşmaktadır. Her katmanın kendi içinde öznitelik havuzlama katmanı, filtre banka katmanı ve doğrusal olmayan katman olmak üzere üç katmanı vardır. Filtre banka katmanında değişik öznitelik çıkarılması işine yarayan birçok çekirdek bulunmaktadır. Havuzlama katmanında, elde edilen her öznitelik haritası ayrı ayrı ele alınır. Her harita komşu değerinin ortalaması veya maksimum değerinin elde edilmesini sağlamaktadır [5]. (A1)-4 Özellik Haritası (E1)-4 Özellik Haritası (A2)-6 Özellik Haritası (E2)-6 Özellik Haritası Giriş katmanı Evrişim Katmanı Alt-Örnekleme Katmanı Evrişim Katmanı Alt-Örnekleme Katmanı Tam-Bağlantılı MLP Şekil 4: Bir Evrişimsel katmanın Grafiksel Tasviri Şekil 4 te bir evrişimsel ağın yapısı gösterilmiştir. Ağda, iki evrişim katmanı, evrişim katmanlarını takip eden iki alt örnekleme katmanı ve en üst katmanda tam- bağlantılı katman bulunmaktadır. Bu yapıda resim parçalara ayrılır. Her parçaya filtre uygulanır. Filtre işleminden sonra resimde küçülme olur. Bu işlem sonucunda elde edilen pikseller anlamlandırılarak problem çözülmeye çalışılır [14]. 101

3.Yöntem Bu çalışmada, derin öğrenme kullanılan çalışmalarda sıklıkla tercih edilen caffe[15] açık kaynak yazılımından faydalanılmıştır. Derin öğrenme konusunda kullanılan birçok toolbox bulunmaktadır. Mathconvnet, Convnet, Torch bunlardan bazılarıdır. Bu yazılımlar da başarılıdırlar fakat, sadece bazı ortamlarda kullanılabilirler. Caffe nin ise c++, matlab, python gibi farklı dillerde yazılmış versiyonları bulunmaktadır. Yöntemimizi diğer ortamlarda da uygulayabilmek için caffe toolboxı tercih ettik. Eğitim için şekil 4.deki ağ kullanılmıştır. Şekil 5. yöntemin akış diyagramını göstermektedir. İlk adım, görüntülerin seçimidir. Bu adımda, CIFAR-100 veri kümesinden otobüs, traktör, tren, dinozor, fil, kelebek, sandalye ve televizyon olmak üzere 8 görüntü seçtik. Bu sınıfları seçmemizin sebebi ayırt edilebilir özelliklerinin sinir ağınca algılanabilecek olmasıdır. Eğitim için kullanılan görüntü sayısı arttıkça sistemin doğru sınıflandırma oranı artmaktadır fakat süreyi olumsuz etkilediğinden sayı az tutulmuştur. İkinci adım olan ön işlemede alınan görüntüler 128x128 e yeniden boyutlandırıldıktan sonra siyah-beyaz renge dönüştürüldü. Bu işlemi yapmamızın sebebi ağın bütün görüntüleri aynı renk ve boyutta alabilmesidir. Bu adımlardan sonra ağ eğitimi işlemi gerçekleştirildi ve ardından eğitilen ağ, sınıflandırma işlemini yapabildi. Görüntü 8 tane sınıftan hangisine yakınsa o sınıfa dâhil edilmiş oldu. Görüntülerin Alınması Ön İşlem Ağ Eğitimi Sınıflandırma 4.Sonuç ve Öneriler Şekil 5. Yöntemin Akış Diyagramı Bu çalışmada, son yıllarda katmanlı yapısıyla gizli öz nitelikleri çıkartarak işlem yapan ve görüntü işleme, doğal dil işleme, sinyal işleme gibi konularda başarılı sonuçlar elde eden makine öğrenme tekniği olan derin öğrenme konusundan bahsedilmiştir. Bu konu temel alınarak yapılan literatürdeki çalışmalardan özellikle görüntü işleme konusuyla ilgili olanlar incelenmiş ve yapay sinir ağı tabanlı, katmanlı yapıya sahip derin öğrenme tekniğinin çeşitli problemler için özelleşmiş mimarilerinden en çok kullanılanlardan birisi olan evrişimsel sinir ağları ile görüntü sınıflandırma işlemi gerçekleştirilmiştir. Az sayıda görüntüyü sınıflandırmak için kullandığımız algoritma, başarılı sonuçlar elde etmiştir. Eğitim süreci yaklaşık olarak 9 saat sürmüştür. Görüntü sayısını arttırmak doğru sonuçlar bulmak açısından olumlu sonuç vermektedir. Fakat veri arttıkça eğitim süresi de artış göstermektedir. Bu da verimliliği düşürür. Bahsi geçen hız probleminin üstesinden gelinmek için gpu programlama teknikleri kullanılması gerekmektedir. 102

Kaynaklar [1] Doğan, G., Yapay Sinir Ağları Kullanılarak Türkiye deki Özel Bir Sigorta Şirketinde Portföy Değerlendirmesi, Master thesis, Hacettepe University, Ankara, Turkey, 2010. [2] LeCun, Y., Touretzky, D., Hinton, G. and Sejnow8ski T.,(1988). A theoretical framework for Back-Propagation.in Proceedings of the 1988 Connectionist Models Summer School, Pittsburgh, 1988, pp. 21-28. [3] Hacıoğlu, C., Derinlikli Öğrenme Kullanılarak Konuşmadan Uykululuk/Uykusuzluk Tespiti, Master thesis, İstanbul Technical University, Istanbul, Turkey, 2014. [4] Zhou, S., Chen, Q., Whang, X., (2013). Convolutional Deep Networks for Visual Data Classification. Neural Process Lett, 38:17-27. [5] Özcan, H., (2014). Çok Düşük Çözünürlüklü Yüz İmgelerinde Derin Öğrenme Uygulamaları. Yüksek Lisans Tezi, Deniz Harp Okulu, Bilgisayar Müh. Bölümü. [6] Kukharenko, A., I. and Konushin, A., S., (2015). Simultaneus Classification of Several Features of a Person s Appearance Using a Convolutional Neural Network. Patern Recognition and Image Analysis. [7] Hu, Y., Chang, H., Nian, F., Wang, Y., and Li, T., (2016). Dense crowd counting from still image with convolutional neural networks. J.Vis.Commun. Image R. 38:530-539. [8] Krizhevsky, A., Sutskever, I. and Hinton, G. E., (2012). ImageNet Classification with Deep Convolutional Neural Networks. Advances in Neural Information Processing Systems. [9] Wang, X., (2013). Deep Learning in Object Detection, Segmentation, and Recognition. The Chinese University of Hong Kong, Department of electronic engineering. [10] Karaatlı, M. A. Yapay Sinir Ağları Yöntemi İle Tahmin. Yüksek Lisans Tezi, Süleyman Demirel Üniversitesi, İşletme Bölümü. [11] Gurney, K.(1997).An Introduction to Neural Networks, [12] Joyas, R., (1996). Neural Networks. Chapter4, Springer-Verlag, Berlin. [13] Açarçiçek A. H., (2015). Derinlikli Öğrenme ile Konuşmacı Duygu Durumunun Sınıflandırılması Lisans Tezi, İstanbul Teknik Üniversitesi, Elektronik ve Haberleşme Müh. Bölümü. [14] Bengio, Y., Goodfellow, I. and Courville, (2016). A., An MIT Press Book, Chapter 9,Convolutional Networks. [15]Yangqing, J. ve diğ. (2014).Caffe: Convolutional architecture for fast feature embedding. Proceedings of the 22nd ACM international conference on Multimedia. ACM. 103