TÜRK İŞARET DİLİ TANIMA SİSTEMİ ( TURKISH SIGN LANGUAGE RECOGNITION SYSTEM )



Benzer belgeler
RENK BİLEŞENLERİ YARDIMIYLA HAREKETLİ HEDEFLERİN GERÇEK ZAMANLI TESPİTİ

İRİSTEN KİMLİK TANIMA SİSTEMİ

AMAÇ Araçlardaki Kamera Sistemleri

LED IŞIK KAYNAKLARININ RENK SICAKLIĞININ GÖRÜNTÜ İŞLEME TEKNİKLERİ KULLANILARAK BELİRLENMESİ. İsmail Serkan Üncü, İsmail Taşcı

EGE ÜNİVERSİTESİ Bilgisayar Mühendisliği. Dr. Kemal YILMAZ, Prof. Dr. Aylin KANTARCI, Prof. Dr. Cezmi AKKIN

Bölüm 7 Renkli Görüntü İşleme

Dijital (Sayısal) Fotogrametri

CCD KAMERA KULLANARAK SAYISAL GÖRÜNTÜ İŞLEME YOLUYLA GERÇEK ZAMANLI GÜVENLİK UYGULAMASI

Sahne Geçişlerinin Geometrik Tabanlı olarak Saptanması

BİYOMETRİK İRİS SINIFLANDIRMA SİSTEMLERİ

Dijital Görüntü İşleme Teknikleri

Türkçe Dokümanlar Ġçin Yazar Tanıma

POSITION DETERMINATION BY USING IMAGE PROCESSING METHOD IN INVERTED PENDULUM

Yrd. Doç. Dr. Caner ÖZCAN

CAEeda TM OM6 KANADI MODELLEME. EDA Tasarım Analiz Mühendislik

5 İki Boyutlu Algılayıcılar

Trafik Yoğunluk Harita Görüntülerinin Görüntü İşleme Yöntemleriyle İşlenmesi

Programlama Dilleri II. Bilgisayar ve Öğretim Teknolojileri Öğretmenliği

GÖRÜNTÜ TABANLI ALGILAMA İLE QUADROTORUN HAREKETLİ BİR CİSMİ TAKİBİ

Bu makalede, rulman üretim hattının son

Dijital (Sayısal) Fotogrametri

3.2. Raster Veriler. Satırlar. Sütunlar. Piksel/hücre büyüklüğü

ECDL ImageMaker Müfredat

Görüntü İşleme. Dijital Görüntü Tanımları. Dijital görüntü ise sayısal değerlerden oluşur.

T.C. ERCİYES ÜNİVERSİTESİ MÜHENDİSLİK FAKÜLTESİ BİLGİSAYAR MÜHENDİSLİĞİ BÖLÜMÜ EĞİTİM ÖĞRETİM YILI DERS KATALOĞU

Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü. Bilgisayarla Görme. Final

4. Bölüm Programlamaya Giriş

Digital Görüntü Temelleri Görüntü Oluşumu

Bilgisayarla Fotogrametrik Görme

Popülasyon Ortalamasının Tahmin Edilmesi

GÖRÜNTÜ İŞLEME HAFTA 2 SAYISAL GÖRÜNTÜ TEMELLERİ

KOCAELİ ÜNİVERSİTESİ ELEKTRONİK VE HABERLEŞME MÜHENDİSLİĞİ BÖLÜMÜ 2018/2019 GYY BİTİRME ÇALIŞMASI ÖNERİ FORMU. (Doç.Dr. M.

Bilgisayarla Görme (EE 430) Ders Detayları

Görüntü İşleme. K.Sinan YILDIRIM Cenk İNCE Tahir Emre KALAYCI. Ege Üniversitesi Bilgisayar Mühendisliği Bölümü 2003

Yıldız Teknik Üniversitesi Fen Bilimleri Enstitüsü Bilgisayar Mühendisliği Bölümü. Bilgisayarla Görme. Proje

Hafta 1 Sayısal Görüntü İşlemeye Giriş ve Temel Adımlar

technologies LED Ekranlar

DSİ kapsamında oluşturulan dağınık durumdaki verilerinin düzenlenmesi, yeniden tasarlanarak tek bir coğrafi veri tabanı ortamında toplanması,

ANALOG VİDEO TEMELLERİ

Dijital (Sayısal) Fotogrametri

Web kameranın genel özellikleri

Round-Chamfer / Yrd. Doç. Dr. Mehmet FIRAT- Yrd. Doç. Dr. Murat ÖZSOY

Çözümleri İÇERİK YÖNETİM SİSTEMLERİ. İSBAK A.Ş., İstanbul Büyükşehir Belediyesi iştirakidir.

Bir Tek Nöron Kullanılarak Resimler Đçerisinde Göz Kısmının Bulunması

Canon XEED SX60. Özellikler

ULUSAL COĞRAFİ BILGİ SISTEMLERİ KONGRESİ 30 Ekim 02 Kasım 2007, KTÜ, Trabzon

Android Studio TextView ve EditText Öğr.Gör. Utku SOBUTAY

Doğan Can, Murat Saraçlar. Bebek, İstanbul. 9 Mart, 2009

Dijital Panoramik Görüntülemede HD Teknolojisi. Süper Hızlı Dijital Panoramik X-ray Cihazı. Thinking ahead. Focused on life.

Görüntü Bağdaştırıcıları

Gerçek Zamanlı Harekete Duyarlı Bir Görüntü Tanıma Sistemi

KAHKAHA TANIMA İÇİN RASSAL ORMANLAR

Uzaktan Algılama Uygulamaları

SmartMesh. Cephe Tipi Mega Görüntü Sistemleri

GÖRÜNTÜSÜ ALINAN BİR NESNENİN REFERANS BİR NESNE YARDIMIYLA BOYUTLARININ, ALANININ VE AÇISININ HESAPLANMASI ÖZET ABSTRACT

Bilgisayarla Görüye Giriş

9 HAZIRAN Trimble MX7 360 Görüntülü Mobil Haritalama Sistemi

YAPAY SİNİR AĞI KULLANARAK DEPREM EĞİLİMİNİN KESTİRİMİ. Umut FIRAT

LOGO KULLANIM KILAVUZU.

SIRMA Bilgisayar Eğitim Danışmanlık San. ve Tic. Ltd. Şti Plaka Tanıma - Plaka Okuma Sistemi

Üç Boyutlu Grafik Teknolojilerinin Mobil Öğrenme Alanı ile Bütünleştirilmesi

Veri toplama- Yersel Yöntemler Donanım

Dijital Kameralar (Airborne Digital Cameras)

PROJEM İSTANBUL ARAŞTIRMA PROJESİ BİLGİSAYARLI GÖRÜ VE SINIFLANDIRMA TEKNİKLERİYLE ARAZİ KULLANIMININ OTOMATİK OLARAK BULUNMASI


Gama ışını görüntüleme: X ışını görüntüleme:

YOĞUN GÖRÜNTÜ EŞLEME ALGORİTMALARI İLE ÜRETİLEN YÜKSEK ÇÖZÜNÜRLÜKLÜ SAYISAL YÜZEY MODELİ ÜRETİMİNDE KALİTE DEĞERLENDİRME VE DOĞRULUK ANALİZİ

KUZEY KIBRIS TÜRK CUMHURİYETİ NİN ALTI YERLEŞİM YERİNİN ELEKTROMANYETİK KİRLİLİK HARİTALARININ HAZIRLANMASI RAPORU. Hazırlayanlar:

Yinelemeli ve Uyarlanır Ayrıt Saptayıcı Süzgeçleri

UZAY TEKNOLOJİLERİ ARAŞTIRMA ENSTİTÜSÜ

LOGO KULLANIM KILAVUZU.

Sözlük Kullanarak Türkçe El yazısı Tanıma

Görüntü İyileştirme Teknikleri. Hafta-8

Mobil Cihazlarda Online Görüntü İşleme Yazılımının Geliştirilmesi

GörüntüĐşlemede Yeni Bir Soluk, OpenCV

MİCROSOFT EXCEL PROGRAMI DERS NOTLARI

6. Sınıf Fen ve Teknoloji

T.C NAMIK KEMAL ÜNİVERSİTESİ ÇORLU MÜHENDİSLİK FAKÜLTESİ YÜZ TANIMA SİSTEMİ BİLGİSAYAR MÜHENDİSLİĞİ DANIŞMAN: YRD.DOÇ.DR.

Mobil Cihazlarda Online Görüntü İşleme Yazılımının Geliştirilmesi

Yrd. Doç. Dr. Aycan M. MARANGOZ. BEÜ MÜHENDİSLİK FAKÜLTESİ GEOMATİK MÜHENDİSLİĞİ BÖLÜMÜ JDF329 FOTOGRAMETRİ I DERSi NOTLARI

Şirketin Tanıtımı Huger

Bazı Gömülü Sistemlerde OpenCV ile Performans Analizi

Görüntü İşlemeye Giriş Introduction to Image Processing. Doç. Dr. Aybars UĞUR

İnsan Yüzü Resimlerinin Sorgulamaya Uygun ve Bölgelendirmeye Dayalı Kodlanması

TEKNİK RESİM 6. Kesit Görünüşler

HAREKET HAREKET KUVVET İLİŞKİSİ

TASARIMIN TEMEL İLKELERİ

HAVADAN LAZER TARAMA ve SAYISAL GÖRÜNTÜ VERİLERİNDEN BİNA TESPİTİ VE ÇATILARIN 3 BOYUTLU MODELLENMESİ

İnsan Bilgisayar Etkileşimi (IBE) nedir? İnsan Bilgisayar Etkileşimi Araştırma ve Uygulama Labaratuvarı

Lale AKARUN, Boğaziçi Üniversitesi.

Yrd. Doç. Dr. Saygın ABDİKAN Öğretim Yılı Bahar Dönemi

LOGO KULLANIM KILAVUZU.

YTÜ Makine Mühendisliği Bölümü Mekanik Anabilim Dalı Genel Laboratuvar Dersi Eğilme Deneyi Çalışma Notu

8. SINIF YARIYIL ÇALIŞMA TESTİ TEST 1 ( ) TEKRAR EDEN YANSIYAN ve DÖNEN ŞEKİLLER HİSTOGRAM STANDART SAPMA

Yüz Tanımaya Dayalı Uygulamalar. (Özet)

Çıkış Birimleri. Çıkış Birimleri. Giriş Birimleri. İşlem Birimi. Bellek Birimleri

Veritabanı Tasarımı Ve Yönetimi. Varlık-İlişki Modeli

Bölüm 1 Sayısal Görüntü İşlemeye Giriş ve Temel Adımlar

Görüntü İşleme Teknikleri Kullanılarak Bir Ortamın İnsan Yoğunluğunun Hesaplanması

Transkript:

TÜRK İŞARET DİLİ TANIMA SİSTEMİ ( TURKISH SIGN LANGUAGE RECOGNITION SYSTEM ) Şekil 1 İşaret dili tanıma örnek ekran görüntüsü Türk İşaret Dili Tanıma projesi 2005 2006 yılının 2. döneminde Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği 4. sınıf öğrencileri Behzat Bükün ve Ali Ekinci tarafından bitirme projesi olarak gerçekleştirilmiştir.

Giriş Son yıllarda işaret dili tanıma ile ilgili projeler araştırma grupları tarafından büyük bir ilgi görmüştür. Bu durum insan-bilgisayar etkileşimini ön plana çıkaran alanlardaki potansiyel çalışmalara da hız vermiş olup işaret dili tanıma gibi sistemlerin hayata geçirilmesini sağlamıştır. İşaret dili, el hareketlerinin ve yüz mimiklerinin kullanılmasıyla oluşan görsel bir dildir. Ancak sık kullanılan kelimeler için hareketler var iken, özel isimler ile bir hareket karşılığı olmayan kelimeler için harf harf heceleme yapılır. Bu çalışmada amaç harf harf hecelemeden oluşan işaretlerin bilgisayar tarafından tanınması hedeflenmiştir. Bu proje kapsamında yapılan çalışmalar iki aşamadan oluşmaktadır. Birincisi, her ülkenin işaret dili farklı olduğu için işaret dili tanıma sistemlerinin geliştirilmesi her ülkenin kendi öz kaynaklarına bağlı olması ve bu kapsamda Türk İşaret Dili ile ilgili bir hareket veritabanı olmadığından, öncelikle bu aşama gerçekleştirilmiştir. Böylece ellerin alacağı değişik pozisyonlara göre Türk Dili alfabesinde bulunan 29 harften oluşacak bir işaret dili alfabesi veritabanı oluşturulmuştur. İkinci aşama ise birinci aşamayı takip ederek Türk alfabesindeki harflere karşılık gelen işaret dili hareketlerini tanıyabilen, yani tercüme edebilen bir sistem tasarlanmıştır. Tanıma işleminde maksimum korelasyon ve öznitelik vektörü kullanılarak elde edilen sonuçlar gruplandırılarak k en yakın komşu algoritmasıyla en iyi sonuç elde edilmiştir. Kullanılan bu tekniklerle birlikte 203 test videosundan sadece 5 yanlış sonuç çıktığından, sistemin başarısı %97.54 olarak ölçülmüştür. Görüntü tabanlı işaret dili tanıma sistemlerinin bir çoğunda eldiven giyilerek işlemler yapılmaktadır. Ancak bu tür sistemlerin ticari veya pratiklik boyutu yok gibidir. Bu proje kapsamında yapılan yoğun çalışmalar sonucu eldiven giyme olayı elimine edilmiştir ve bazı koşullarla birlikte pratiklik boyutu yüksek olan bir sistem geliştirilmiştir. Sistemin kısaca işleyişinden bahsetmek gerekirse şu şekilde özetlenebilir: Sistem bir bilgisayar yazılımı ve bilgisayara bağlı bir web kamerasından oluşmaktadır. Kamera önünde hareketi yapan kişinin herhangi bir eldiven veya bir başka donanım kullanmasına gerek kalmadan kamera karşısında duran kişinin yaptığı hareket, video şeklinde kaydedilmekte ve belirli bir zaman aralığında kaydedilen hareket videosundan kişinin eli ten renginden ayırt edilmektedir. Bu şekilde eli ten renginden ayıt edilen kişinin yaptığı hareket, kişiden bağımsız olarak oluşturulmuş veritabanındaki hareketlerden hangisine en yakın olduğu bulunarak yapılan işaretin yazı diline dökülmesi sağlanmaktadır. Geliştirilen sistem banka, postane, hastane gibi ortamlarda işitme engelli insanların çevre ile iletişimini kolaylaştırmayı hedeflemektedir. Sistemin tasarlanmasında, Microsoft Visual Studio platformu ve C++ programlama dili kullanılmıştır. Görüntü işleme için ise Intel firmasının geliştirdiği OpenCV (Open Source Computer Vision) kütüphanesi kullanılmıştır. 2

Kullanılan Sistemin Yapısı Sistemde görüntü yakalama aygıtı olarak Philips PCVC 840K model kamera kullanılmıştır. 1/3 VGA CCD alıcısı olan kamera saniyede 60 çerçeve oranına sahiptir ve 1 lüksten daha düşük ortamlara kadar görüntü alımı sağlanabilmektedir. Proje kapsamında görüntü almak için kameranın özellikleri sistemin işleyişini iyileştirmek için değiştirilmiştir. İlgili kameradan saniyede 15 çerçeve oranı ile 3 saniyelik görüntüler alınmıştır. Yapılan hareketlerin çözünürlüğü ise 320x240 tır. Ancak ortamın ışık miktarını düzenlemek için de donanım ile birlikte verilen yazılımda çeşitli ayar değişiklikleri yapılmıştır. Durağan Hareketin Bulunması Kaydedilmiş hareket videosundan işareti anlatacak en uygun imgenin bulunması sistemde tanıma işleminin ilk adımıdır. Hareket videosu içerisinde yer alan imgeler arasındaki mesafeler art arda hesaplanarak bu değerlerin en az değiştiği aralık temel imgeyi vermektedir. Temel imge hareketin durağan olduğu durumdur. İmgeler arasındaki mesafe ölçümü ise Manhattan (City Block) uzaklığı yöntemi ile gerçekleştirilmiştir. Video içerisindeki her imge üç renk bilgisine (R: Kırmızı, G: Yeşil, B: Mavi ) sahip olduğu için her bir renk bilgisine ait mesafe ölçümü ayrı ayrı yapılarak toplanır. R = R t+1 R t G = G t+1 G t B = B t+1 B t D City = ( R + G + B ) Şekil 2 de temel çerçevenin bulunması işlemi şekillendirilmiştir. Şekil 2 Temel çerçevenin seçilmesi Ten Rengini Tanıma Sistemi tasarlamanın önemli adımlarından biri de ortam özelliklerinin iyi belirlenmiş olmasına bağlıdır. Bu aşama elde edilen verinin sağlıklı bir şekilde sayısal ortama aktarılması için kritiktir. Örneğin ışık kaynağının farklı olduğu durumlar ile görüntü almak için kullanılan kameranın özellikleri de sistemin işleyişini değiştirebilme önemine sahiptir. Ten rengi tonları lineer olmayan bir şekilde parlaklığa bağlı olduğundan, ten rengi tanımada YC b C r renk düzlemi kullanılmıştır. Y değeri imgenin parlaklık değerini, C b imgenin mavi renklilik değerini, C r ise imgenin kırmızı renklilik değerini belirlemektedir. YC b C r renk düzleminde renk bileşenleri ten rengi ile örtüşebilmektedir. Bu bağlamda belirli değerler arasında bulunan pikseller ten rengi olarak belirlenmiştir. Hareket videosundan alınan temel 3

imge normalde üç renk bilgisine sahiptir. Bunlar RGB renk düzlemi olarak R: Kırmızı, G: Yeşil ve B: Mavi renk bilgileridir. Dolayısıyla imgenin YC b C r renk düzlemine dönüştürülmesi gerekir. Y = 0.299R + 0.587G + 0.114B C r = R Y C b = B Y Ten rengi olabilecek piksel değer aralıkları şu şekildedir: 135 < C r < 180 85 < C b < 135 Y > 80 Şekil 3 El bölgesinin bulunması (Z harfi) (parazitli) Şekil 3 te örnek bir hareket videosu üzerinden seçilen imgedeki el bölgesi gösterilmektedir. Ancak Şekil 3 te el bölgesinin bulunduğu imgede sağ üst köşede bazı parazitlerin olduğu görülebilmektedir. Bu parazitlerin temizlenmesi için Gauss filtresinden faydalanılarak bu parazitlerin ten olma olasılıkları tekrar değerlendirilmektedir. Şekil 4 te yapılan bu işlemlerin sonucu gösterilmektedir. Şekil 4 El bölgesinin bulunması (parazitsiz) 4

Geometrik Özelliklerin Belirlenmesi Kamera karşısında hareketi yapan kişi bazen aynı hareket için biçim değiştirebilmektedir. Bu durumda yapılan hareketlerin yönden bağımsız olması gerekir. Bunun için şekle ait bazı geometrik özelliklerin belirlenmesi gerekir. Şöyle ki yapılan her hareket bir şekil olarak değerlendirilirse o şekilden geçen en uzun eksenin koordinat sisteminde dikey eksen veya yatay eksen ile yaptığı açı bulunursa ve bu eksenlerden herhangi birisine bulunan açı kadar döndürülürse yapılan hareketler yönden bağımsız olmuş olur. Bu durum Şekil 5 te ifade edilmiştir. Şekil 5 Şekilden geçen en uzun eksen çizgisi Ayrıca yapılan hareketlerin kameraya olan uzaklık mesafeleri de önemli olduğundan uzaklıktan da bağımsız olması gerekir. Bunun için döndürülmüş şekil için bir ölçeklendirme yapılmalıdır. Normalde 320x240 çözünürlükte alınan görüntüler ölçeklendirme ile 30x30 boyutlarına indirgenmiştir. Şekil 6 da Z harfi için yapılmış bir harekete ait el bölgesinin bulunmasından sonra yapılan işlemler gösterilmiştir. Şekil 6 El bölgesi için yapılan işlemler 5

Veritabanı Tasarımı Hareket videolarına ait temel imgelerin en son ölçeklendirilmesinden sonra elde edilen 30x30 boyutundaki imgelerden veritabanı oluşturulmuştur. Proje kapsamında 4 ayrı kişiden Türk İşaret Dili ne ait 29 harf için kayıtlar alınmıştır. Alınan bu görüntülerin bir kısmı eğitim seti bir kısmı ise test seti olarak değerlendirilmiştir. Eğitim setine ait görüntüler veritabanı olarak değerlendirilmiştir. Alınan bu görüntülere ait sayısal değerler Tablo 1 de görülebilir. Tablo 1Hareket videolarına ait sayısal değerler 1. Kişi 2. Kişi 3. Kişi 4. Kişi Toplam Toplam Genel Eğitim Test Eğitim Test Eğitim Test Test Eğitim Test Toplam Harf A 4 2 4 2 2 2 1 10 7 17 Harf B 4 2 4 2 2 2 1 10 7 17 Harf C 4 2 4 2 2 2 1 10 7 17... Harf Y 4 2 4 2 2 2 1 10 7 17 Harf Z 4 2 4 2 2 2 1 10 7 17 Toplam 290 203 493 Sonuç olarak 3 kişiden alınan aynı işarete ait 4 er hareket veritabanını oluşturmuştur. 4.kişiden alınan hareketler eğitim setine dahil edilmeyerek sistemin kişiden bağımsız olup olmadığını ölçmek için test seti olarak değerlendirilmiştir. Bu ölçüm sonucunda hareketleri eğitim setinde olmayan bir kişinin yaptığı 29 hareketin 27 si sistem tarafından tanınmıştır. Dolayısıyla sistemin kişiden bağımsız olarak başarısı %93,10 olarak ölçülmüştür. Şekil 7 de veritabanında yer alan eğitim setine ait her işaretten bir hareket bulunmaktadır ve bu hareketlere ait yapılan işlemlerden sonra elde edilen ölçeklendirilmiş imgeler de Şekil 8 de görülebilir. Şekil 7 29 harfe ait hareket görüntüleri 6

Şekil 8 Hareketlerin ön işlemlerden sonraki son durumları Tanıma İşlemleri Tanıma işlemleri için iki yöntem izlenmiştir ve bu yöntemler birbirinden bağımsız olarak değerlendirilmiştir. Bu yöntemlerden ilki Maksimum Korelasyon tekniğidir. Maksimum korelasyon tekniğinde karşılaştırılacak iki imge üst üste oturtularak birbirine denk düşen piksellerin korelasyon değeri olarak alınır. Test imgesi, eğitim setindeki tüm imgelerle karşılaştırılarak korelasyon değeri en yüksek olan 3 imge bulunur. Tanıma işleminde kullanılan bir diğer yöntem ise imgelerin Öznitelik değerlerinin analiz edilmesidir. Veritabanı oluşturma aşamasında her bir imgeye ait öznitelik vektörü çıkarılır ve bu öz nitelik vektörü tanıma işleminde kullanılır. Bir imgeye ait öznitelik vektörü şu bilgilerden oluşmaktadır: Alan (area), Merkez noktası (center point), Çevre uzunluğu (perimeter), Yuvarlaklık bilgisi (circulartiy), Ortalama radyal uzaklık ( mean radial distance) Radyal uzaklığın standart sapma miktarı (standard deviation of radial distance) Alan, merkez noktası ve çevre uzunluğu imgedeki nesnenin şekil içerisindeki konumu ile ilgili bilgileri vermektedir. Diğer özelllikler ise nesneye ait şekil bilgisi hakkında fikir vermektedir. Eğitim setindeki imgelere ait öznitelik vektörleri bulunarak normalize edilir. Test imgesine ait öznitelik değerlerinin eğitim setindeki imgelere ait öznitelik vektörlerine olan uzaklık mesafeleri Manhattan uzaklığı yöntemi ile bulunur. Bu değerler her bir öznitelik derğerinin sahip olduğu minimum ve maksimum değerler ile normalize edildikten sonra bulunuan sonuçlardan değeri minimum olan ik üç imge tanıma işlemi için değerlendirilir. 7

Sonuç olararak, tanıma işleminde maksimum korelasyon ve öznitelik vektörü kullanılarak elde edilen sonuçlar gruplandırılarak k en yakın komşu algoritmasıyla en iyi sonuç elde edilmiştir. Şekil 9 da bu işlemlerin nasıl yapıldığı görülmektedir. Şekil 9 Tanıma işlemi Deneysel Tanıma Sonuçları Tasarlanan sistem Türk Dili İşaretlerinden 29 harfi kişiden bağımsız, yönden bağımsız ve mesafeden bağımsız olarak tanımayı hedeflemiştir. Tablo 1 de verilen 203 test videosuna ait başarı oranı %97,54 olarak ölçülmüştür (198 test videosu DOĞRU, 5 test videosu YANLIŞ). Sistemdeki yüksek başarı, yapılan ön işlemlerin iyi yapılmış olmasına bağlıdır. Bu kapsamda sistemde yapılan döndürme ve ölçeklendirme işlemleri de sistemin başarısını arttırmıştır. Şöyleki 60x60 ölçekleme ile 174 test videosundan sadece 5 tanesi yanlış tanındığından sistemin başarısı %97,13, 30x30 ölçekleme ile 174 test videosundan sadece 3 tanesi yanlış tanındığından sistemin başarısı %98,28 olarak ölçülmüştür. 30x30 luk ölçekleme yapılmadan önce projede şöyle bir iyileştirme daha yapılmıştır. Ölçeklendirme aşamasında ilgi alanı içerisinde olmayan siyah bölgeler temizlenerek karşılaştırma dışı bırakılmıştır. Sistem tanıma zamanı da maksimum korelasyon ve öznitelik vektörü için ayrı ayrı uygulanmıştır. Maksimum korelasyon için geçen toplam zaman yaklaşık olarak ~125ms ile ~160ms arasında değişirken, öznitelik değerlerinin analizi için geçen zaman çok daha az ve yaklaşık olarak ~0ms ile ~20ms arasında değişiklik göstermektedir. Bazı test videoları için geçen toplam zaman yani hem maksimum korelasyon hem de öznitelik vektör analizi için geçen toplam süre Tablo 2 de verilmektedir. 8

Tablo 2 Bazı test videoları için tanıma zamanları Test Videosu a2 b2 f4 k3 z4 Toplam Tanıma Zamanı ~266ms ~250ms ~172ms ~203ms ~125ms Sistemin başarısını düşüren en büyük neden S ve Ş harflerinin birbirine şekil olarak çok yakın olmasıdır. Bu harfler için maksimum korelasyon iyi sonuç verirken öznitelik vektörlerinin analizi iyi sonuç verememektedir. Çünkü bu harflerin şekil bilgileri birbirine çok benzemektedir. Şekil 9 da bu harflere ait örnek gösterimler yer almaktadır. Şekil 10 Örnek 'S' ve 'Ş' harflerinin gösterimi Sonuç Bu proje ile Türk İşaret Dili için kullanılan işaretler harf tabanlı olarak bilgisayar ortamına aktarılmış ve gerekli işlemlerden geçirilerek tanıma işlemi gerçekleştirilmiştir. Bununla birlikte harfleri temsil eden hareketler için yeni bir veri tabanı oluşturulmuştur ve bu veritabanının gelecekte yapılması muhtemel projelerde de kullanılması planlanmaktadır. Sistemin başarısı gözönüne alıdığında % 98.28 lik başarı ile geçmişte yapılmış uluslararası işaret dili tanıma sistemlerine oranla daha başarılı olduğu dikkat çekmektedir. Ayrıca hareketlerin mesafeden, yönden ve kişilerin ten renginden bağımsız olması ise sistemin bir başka önemli özelliğidir. Bu projenin çok sayıda Türk İşaret Dili hareketi içermesi ve aynı işaretin farklı kişilerce tekrarlanması sonucu oluşturulan veritabanı hem araştırmacıların işlemlerini kolaylaştıracağı hem de bu tür sistemlere olan ilginin daha da artacağı ümit edilmektedir. Sağır ve dilsiz alfabesini kullanan insanların aralarındaki iletişimin daha güçlü olması ve bu kişilerin topluma kazandırılması bu projenin getirebileceği yararların başında gelmektedir. Ayrıca işaret dili tanıma sistemlerinin popüler olması ve bu projenin insanları gelecekte bu konu ile ilgili daha güçlü sistemler geliştirilmesine teşvik edeceği düşünülmektedir. Son olarak bu tür projeler ile insan-bilgisayar etkileşiminin güçlendirilmesi ile işitme engelli bireylerin sosyal olarak toplumda kendi yerinin olduğunu ve iletişimin sağlanamaması için herhangi bir engel bulunmadığının altı çizilmelidir. 9

Kaynaklar [1] Sazonov, V., Vezhnevets, V., and Andreeva, A. A survey on pixel based skin color detection techniques. In Proceedings of Graphicon (2003), pp. 85 92. [2] Chai, D., and Bouzerdom, A. A bayesian approach to skin colour classification. In IEEE Region Ten Conference (2000). [3] Goh, P., Recognition of Auslan Finger-spelling using Hidden Markov Models, (2005), pp. 18-19 [4] Computer Vision and Image Processing: A Practical Approach Using CVIPtools - S. E Umbaugh, Prentice Hall PTR, Upper Saddle, NJ, 1998, pp. 135-136 [5] Di Gesu V. and Starovoitov V. Distance-based functions for image comparison, Pattern Recognition Letters, Vol. 20, No. 2, pages 207-214, 1999. [6] Umbaugh, Ph.D. S.E., (1999), "Computer Vision and Image Processing", Prentice-Hall [7] http://astronomy.swin.edu.au/~pbourke/colour/colourspace [8] http://homepages.inf.ed.ac.uk/rbf/hipr2/gsmooth.htm [9] http://www.mathworks.com/access/helpdesk/help/toolbox/images/f18-35678.html [10]http://zone.ni.com/devzone/conceptd.nsf/webmain/8CA8DE2E8881C1AB8625682E0079 CE74 [11]http://www.cs.bilkent.edu.tr/~duygulu/Courses/CS554/Spring2006/Notes/BinaryImageAn alysis.pdf 10