Arox Bilişim e Hoşgeldiniz
TÜBİTAK-TEYDEB 1507-KOBİ Ar-Ge Başlangıç Destek Programı Proje Numarası : 7130671 Proje Adı : Çok Fonksiyonlu Yazıcılarda İşlem Gören Belgelerin Bilgi Güvenliğinin Sağlanması ve Doğal Dil İşleme Yöntemleri ile Özetlenmesi, Denetlenmesi ve Arşivlenmesi
AROX HAKKINDA 2009 dan beri; Mobil Uygulama Dijital Pazarlama İstanbul ve Ankara da 35 çalışan 80 in üzerinde kurumsal proje Web, ios, Android, Windows Phone, Blackberry 2.250.000 den fazla indirme 1.250.000 tekil kullanıcı Türkiyedeki en büyük mobil uygulama geliştiricilerinden
Proje Tanıtımı : Çok Fonksiyonlu Cihazlar pek çok noktada hayatı kolaylaştırmış; fakat gizliliğin son derece önemli olduğu büyük firma ve kamu kurumlarında "bilgi güvenliği" problemini de beraberinde getirmiştir. Piyasada bu amaçla sunulan güncel çözümlerin pek çok konuda yeterli gelmediği bilinmektedir. Arox olarak bu proje kapsamında geliştirmeyi hedeflediğimiz yazılım ile; Kullanıcıların güvenli bir şekilde sisteme girişi Taranan, yazdırılan yada kopyalanan belgelerin optik karakter tanıma yöntemi ile metne dönüştürülmesi Doğal dil işleme yöntemleri ile metin özetinin çıkartılması ve arşivlenmesi Türkçe Arama Motoru ile özet içerisinde işlemin tehlikeli olup olmadığının belirlenmesi, Sakıncalı işlemlerin önlenmesi, rapor edilmesi Geçmiş belgeler içinde konuya bağlı olarak arama yapılabilmesi sağlanacaktır.
Projenin Amacı : Müşteri gereksinimleri doğrultusunda çok fonksiyonlu yazıcılar için; Kullanıcının en kısa sürede yazıcı üzerindeki işlemini tamamlaması Yapılan işlerin güvenli bir şekilde kullanıcı ve grup bazlı kayıt altına alınması Maliyet hesabı, yetkilendirme, istatistik ve raporlama gibi imkanlar sunulması Belge üzerinde bilgi güvenliğinin sağlanması Metin üzerinde denetimlerin yapılması
Projenin Hedefi : Gizliliğin ve bilgi güvenliğinin son derece önemli olduğu, işlenen belge üzerinde güvenlik denetimlerinin istendiği; Kamu Sektör Kuruluşları Askeri alanlar, Elçilik, Konsolosluk gibi hassas yerler Özel Sektör Kuruluşları Büyük çaplı bilgi güvenliğinin önemli olduğu tüm alanlar
Projenin Yenilikçi Yönü : Projenin dünya pazarında yeni bir platform ürün olacağı öngörülmektedir. Türkçe Metin Özetleme fonksiyonu ile de firmamıza yeni bir teknolojik alan oluşturacaktır. Kullanıcı ve Grup bazlı sisteme giriş ve kullanım yetkilendirme Belgelerin kurum içerisinde takip edilmesini kolaylaştırarak veri güvenliğini sağlama Maliyet planlama özelliğine sahip bir platform doğal dil işleme yöntemleri kullanılarak geliştirilecektir.
Pazar Potansiyeli Sadece Ankara'daki kamu kurumlarında bile yaklaşık 4.000 cihaz Ülkemiz piyasasında sadece müşterimiz olan firmalarla birlikte yaklaşık 20.000 cihaz Yurt dışında da benzer ihtiyaçların söz konusu olduğu ve geliştirilecek proje ile ortaya konacak çıktının dünya çapında bir ilk olacağı düşünüldüğünde, uluslararası pazar potansiyelinin yüksek olmasını beklemekteyiz.
Ekonomik Getiriye İlişkin Tahminler Pazara çıkış süresi (ay) : 20 Satış hasılatında beklenen artış (%) : 15 Pazar payında beklenen artış (%) : 10 Kara geçiş noktası: Projenin ilk müşteriye yazılım çözümünün kurulumunu takip eden 10 ay içinde kara geçeceği öngörülmektedir.
Ekonomik ve Ulusal Kazanımlar : Dünyada çok fonksiyonlu cihazlara yönelik tüm ihtiyaçlara cevap verecek yenilikçi bir platform geliştiren ilk firma olacağı düşünülmektedir. Tanınırlık ve rekabetçiliğimizi artıracak Kendi içimizde ve grup şirketlerimizde kullanımı maliyet kazancı, iş ortaklarımıza pazarlanması ise kar sağlayacaktır. DDİ ile özetleme konusunda yapılacak Ar-Ge çalışmaları hem firmamız hem de ülkemiz bilgi birikimine katkıda bulunacaktır. Gizliliğin yüksek olduğu alanlarda başta veri güvenliği olmak üzere pek çok ihtiyacı karşılayacak çıktı ile maliyet ve iş gücü kaybının önüne geçilecek
Proje İşlem Akışı : İşlem Onayı ve Cihaz Bilgisi İşlem İsteği Sunucu Kart Okuyucu İstemci Pin Bilgi Güvenliği Çok Fonksiyonlu Yazıcı Arama Motoru Veri tabanı Türkçe Metin Özeti DDİ Algoritmaları Türkçe Metin Özeti, Arşivleme ve Arama Motoru OKT Sistemi
DDİ İşlem Akışı : Düzeltilmiş Türkçe Metin OKT Sistemi Türkçe Metin Türkçe Kelime Düzeltme *Zemberek Türkçe Arama Motoru *Lucene Veri tabanı Türkçe Metin Özeti Türkçe Özet Çıkartma *Zemberek *opennlp *sharpnlp *Projenin ihtiyaç duyduğu DDİ çözümler için yeni DDİ algoritmaları veya mevcuda eklentileri Proje DDİ konusundaki Danışmanı aracılığı ile geliştirilmesi planlanmaktadır.
Mevcut Çözümlerdeki İşlem Akışı : İşlem Onayı ve Cihaz Bilgisi İşlem İsteği Sunucu İstemci Kart Okuyucu Çok Fonksiyonlu Yazıcı Sadece bilgi güvenliği sağlanıyor. Belge resim olarak saklandığından veri tabanında çok yer kaplıyor Türkçe Metin Özetleme ve Arama işlemleri yapılamıyor
Projenin Başarım Ölçütü : Arama Motoru 5san Veri tabanı 1san Türkçe Metin Özeti DDİ Algoritmaları 10san Tarama ve OKT Sistemi 4san 20sn Belgelerin taranması aşamasından denetlenip karar verme aşamasına kadar geçen sürenin sayfa başına maksimum 1 dk olması planlanmaktadır. (Bu süre seçilen yazıcı işlem hızına, seçilen sunucu hızına, OKT ile metnin elde edilme hızına ve DDİ ile özet çıkartma ve denetlenme hızına bağlı olarak değişecektir.)
Kullanılacak Donanım ve Malzemeler : Xerox 5865 Çok Fonksiyonlu Yazıcı - Siyah Beyaz Xerox 7845 Çok Fonksiyonlu Yazıcı Renkli OCR (Tesseract, ABBYY FineReader, OmniPage) Temassız Kart Okuyucular (Indala, Mifare, HID, iclass) Test Sunucu (Intel Xeon E5 İşlemci, 32GB RAM) Test İstemci (Intel Xeon E3 İşlemci, 4GB RAM) Equitrac Office Suite Server Router Siyah-Beyaz ve Renkli Kartuş ve Kağıt
Çok Fonksiyonlu Yazıcılar : Genişletilebilir Arayüz Platformu/ Extensible Interface Platform - EIP Çok fonksiyonlu yazıcılardaki dokunmatik ekran sayesinde kullanıcılar yazıcı üzerindeki işlemlerini gerçekleştirir ve sonuçlarını takip edebilirler. EIP, dokunmatik ekran üzerinde isteğe bağlı olarak partner ve müşteriler için ihtiyaca yönelik değiştirilebilir arayüz imkanı sunar. Dokunmatik ekran üzerindeki arayüz aslında bir web sayfasıdır. Bu web arayüz aracılığı ile cihaz üzerinde işlem gerçekleştirmek için EIP SDK üzerinde gelen API ler kullanılmaktadır. Bu API ler cihaz üzerinde gerekli olan tüm fonksiyonlara erişimi sağlar. Proje kapsamında kullanıcılar için planlanan tüm işlemleri yapmasına olanak veren arayüzler tasarlanacaktır. Cihaz IP üzerinden bir ağa bağlanabilir ağ üzerinden istenen veri transferini sağlayabilir.
Çok Fonksiyonlu Yazıcılar : Servisler ve API ler Yukarıda Javascript Web Servisleri verilmektedir. SDK API leri ile arayüz ihtiyacına göre istenen servise erişim sağlanmaktadır.
Proje Geliştirme Aşamaları : Windows Yazdırma Portu Sürücüsünün geliştirilmesi Temassız Kart Okuyucuların entegrasyon modüllerinin geliştirilmesi Web Tabanlı Yönetim Arayüzünün Geliştirilmesi Maliyet Yönetimi ve Yazdırma İzinleri Modülünün Geliştirilmesi Yazıcılardan Geçecek Tüm Belgeleri Depolayacak Veri Depolama Sisteminin Geliştirilmesi Belgelere Optik Karakter Tanıma İşlemi Yapacak Uygulamanın Geliştirilmesi Optik Karakter Tanıma İşlemindeki Hataları En Aza İndirgeyecek Yazım Düzeltme Modülünün Geliştirilmesi Belgeleri Özetleyecek Doğal Dil İşleme Modülünün Geliştirilmesi Özetler Üstünde Çalışacak Türkçe Destekli Tam Metin Arama Motorunun Geliştirilmesi
Organizasyon Şeması : İBRAHİM AKÇAY Proje Yürütücüsü SERRA YILMAZ Analiz, Yazılım Geliştirme İRFAN ÖMÜR Yazılım Geliştirme BATUHAN SENCER KARADUMAN Yazılım Geliştirme ZEKERİYA PEHLİVAN Analiz, Tasarım ve Test MURAT ŞİŞMAN Analiz, Tasarım ve Test
Proje İş Paketleri ve Süreleri : 1. Ön Analiz ve Literatür Çalışmaları Tarih : 03.06.13-31.07.13 2. Tasarım ve Kavramsal Doğrulama Çalışmaları Tarih : 01.08.13-31.10.13 3. Geliştirme Çalışmaları Tarih : 01.11.13-29.08.14 4. Uygulama ve Entegrasyon Çalışmaları Tarih : 01.09.14-28.11.14 İş Paketleri Süre (iş günü) 1 43 2 66 3 216 4 65 Toplam 390
Proje Planı ve İş Paketleri :
Proje Planı : 1. İş Paketi Literatür Analizi ve Akademik Çalışmaların Taranması (20 gün) Temassız Kart Okuyucu sistemlerin araştırılması Aşağıda araştırma sonunda elde edilen proje kapsamında yer alan test yazıcıları ile uyumlu kart okuyucu sistemleri verilmektedir. 1. HID Indala Proximity, 125 khz 2. Mifare 13,56Mhz 3. HID Proximity, 125 khz 4. HID iclass : 13.56 MHz temassız okuma / yazma teknolojisi ile çok yönlü uygulamaları destekler. Geliştirilmiş şifreleme ve karşılıklı kimlik doğrulama sayesinde güvenliği arttırılmıştır. http://www.equitrac.com/card_readers.html Mifare Kart : - İçinde bir mikroçip ve mini bir yazılım yüklenmiş akıllı kartlardır. - Mikroişlemci kart içine gömülü olarak yerleştiğinden sudan ve dış ortamlardan etkilenmez. - Bilgiler sistem haricinde kötü amaçlı kişilerce kopyalanamaz. - Pasif kart özelliğine sahip olduğundan herhangi bir manyetik dalga üretmez ve yaymaz. - Okuma uzaklığı okuyucuya bağlı olmakla beraber 10 cm ile 20 cm arasında değişir. - Mifare Kart Teknik Özellikleri: 13,56Mhz, Bilgi Yazılabilir(1K,2K,4K) Proximity Kart: - 125 Khz frekansa sahip temas olmaksızın kullanılabilen kartlardır. - Proxy kart olarak da bilinen proximity kartları 0-10 cm mesafe aralığında etkili - Kart fiyatlarının yüksek olamaması ve uzun ömrüyle personel sayısı yüksek işletmelerde kullanımını cazip hale getirmektedir. Temassız kartlar kategorisinde yer alır. - Proximity Kart Teknik Özellikleri: 125Khz
Proje İş Planı : Literatür Analizi ve Akademik Çalışmaların Taranması (20 gün) Optik Karakter Tanıma sistemlerinin araştırılması Genel olarak OKT sistemleri incelendi. Proje kapsamında geliştirilecek olan modüller için.net platformu tercih edildiğinden yapılan araştırmada OKT sisteminin.net ortamında çalıştırılabilir olması arandı. Tesseract Open Source (C ve C++ kütüphanesi) ABBYY FineReader - $4900 (.NET kütüphanesi) OmniPage - $4895 (.NET kütüphanesi) ABCocr ($1490) (.NET geliştiriciler için bir çözüm sunmak amacı ile geliştirilmiştir. Temelde Tesseract motorunu kullanıyor) LEADTOOLS ($1995) (C/C++, C#, VB.NET, Java ve Web geliştiricileri için) Doğal Dil İşleme ile metin özetleme konusundaki çalışmaların araştırılması Doğal dil işleme konusunda yapılan çalışmalar ve kütüphaneler araştırıldı. Yapılan bu çalışma projede yer alacak DDİ konusunda deneyimli Danışman aracılığı ile Türkçe Metin özeti çıkartma ve arama motorunun geliştirilmesi planlanmakta. Zemberek : https://code.google.com/p/zemberek/ Apache OpenNLP : http://opennlp.apache.org/ SharpNLP (OpenNLP kullanıyor) (.NET kütüphanesi) : http://sharpnlp.codeplex.com/ Botego : http://www.botego.com/ ScalaNLP : http://www.scalanlp.org/ Stanford CoreNLP : http://nlp.stanford.edu/software/corenlp.shtml Grok : http://grok.sourceforge.net/ Türkçe destekli tam metin arama konusundaki çalışmaların araştırılması Lucene
Proje İş Planı : Gereksinimlerin Belirlenmesi (22 gün) Müşteri gereksinimlerinin belirlenmesi Kullanıcının en kısa sürede yazıcı üzerindeki işlemini tamamlaması Yapılan işlerin güvenli bir şekilde kullanıcı ve grup bazlı kayıt altına alınması Maliyet hesabı, yetkilendirme, istatistik ve raporlama gibi imkanlar sunulması Belge üzerinde bilgi güvenliğinin sağlanması Metin üzerinde denetimlerin yapılması Çok Fonksiyonlu Yazıcı gereksinimlerinin belirlenmesi Çok fonksiyonlu yazıcılar için sunulan EIP platformunun araştırılması yapıldı. EIP SDK nın sunduğu cihaz üzerinde işlem yapmaya imkan veren API lerin incelenmesi yapıldı. Yazıcı ile uyumlu kart okuyucu sistemlerin araştırılması yapıldı. Çıktı gereksinimlerinin belirlenmesi Projenin sunduğu bilgi güvenliği ve işlenen belge üzerinde denetim imkanının istenen zamanda yönetim seviyesinde incelenmesi, raporlanması, detaylandırılması ve yeni denetimlere izin vermesi için ihtiyaç belirlendi. Bu gereksinimlerin müşteri bazlı değişim göstereceği öngürüldü. Başarı Kriterlerinin belirlenmesi Kullanıcının çok fonksiyonlu yazıcı üzerinde gerçekleştireceği işlemi en kısa sürede tamamlanması hedeflenmektedir. Bu yüzden sistem kullanıcının yazıcı üzerinde harcadığı süreyi minimum seviyelerde tutması gerekir. Bunun için belgenin tarama işleminden itibaren tüm aşamaların en fazla 1dk içerisinde bitirilmesi hedeflenmektedir. Proje Yöntemlerinin belirlenmesi Müşteri gereksinimleri göz önünde bulundurularak çok fonksiyonlu yazıcı gereksinimlerinin imkan verdiği sınırlarda proje işlem akışını sağlayan sistemin tasarımı tamamlandı. Planlanan sistem için ihtiyaç duyulan donanım ve yazılım paketleri için detaylı araştırma tamamlandı.
Türkçe Doğal Dil İşleme Projeleri : Kemik Doğal Dil İşleme Grubu Fatih Üniversitesi Bilgisayar Mühendisliği Doğal Dil İşleme Grubu İTÜ DDİ Çalışma Takımı Dokuz Eylül Üniversitesi Doğal Dil İşleme Araştırma Grubu Sabancı Üniversitesi Human Language And Speech Technologies Laboratory ODTÜ Enformatik Enstitüsü Türkçe Derlem Oluşturma Projesi Zemberek Zemberek, açık kaynak kodlu Türkçe Doğal dil işleme kütüphanesidir. Tamamen Java ile geliştirilen kütüphane, yazım denetimi, hatalı kelimeler için öneri, heceleme, deascifier, hatalı kodlama temizleme gibi işlevlere sahiptir. Tüm Türk dilleri için bir DDİ altyapısı oluşturulması için gerekli mimari değişiklikler yapılmıştır. Zemberek kütüphanesinin.net sürümünü oluşturmak üzere NZemberek projesi devam etmektedir. Şu anda 0.1a sürümü mevcuttur. Proje kapsamında DDİ için Zemberek projesi kullanılabilir olarak gözüküyor.
Türkçe Metin Arama Araçları : Proje kapsamında amaç mevcut veya yeni geliştirilecek yazılımları kullanarak Türkçe için uygun, ticari olarak kullanılabilir bir arama sistemi gerçekleştirmektir. Türkçe Arama Motorundan Beklentiler; Hızlı indeksleme ve sorguya cevap verme süresi Ölçeklenebilir tepki zamanının indeks boyutuna göre değişimi (binlerce, milyonlarca doküman üzerinde arama yapabilme) Anlamlı sonuçlar indislemede var olan sonuçların eksiksiz ve doğru sıralamada kullanıcıya sunulması. Lucene : Arama motorunun altyapısı Apache Foundation tarafından geliştirilmekte olan ve yine bir Apache Foundation kütüphanesi olan Lucene temelli bir arama motoru mimarisi olan Nutch planlanmaktadır. Projeye en önemli katkısı Lucene yapısı bünyesinde gerçeklenen ve Türkçe içerikli sayfaları tarama ve indisleme imkanı veren bir ara modülün gerçeklenmesi planlanmaktadır.
Türkçe DDİ ile ilgili Akademik Çalışmalar : 1. TÜRKÇE METİNLERDEKİ YAZIM YANLIŞLARINA YÖNELİK OTOMATİK DÜZELTME MODELİ Ünal ÇAKIROĞLU, Özcan ÖZYURT Karadeniz Teknik Ünv. 2. ANLAMSAL TÜRKÇE ARAMA MOTORU Doç.Dr. Olcay Taner YILDIZ Işık Ünv. 2012 3. DOĞAL DİL İŞLEME İLE TÜRKÇE YAZIM HATALARININ DENETLENMESİ Aynur DELİBAŞ İstanbul Teknik Ünv. 2008 4. TÜMEVARIMLI MANTIK PROGRAMLAMA İLE TÜRKÇE İÇİN KELİME ANLAMI BELİRGİNLEŞTİRME UYGULAMASI Özlem Aydın, Yılmaz Kılıçaslan Trakya Ünv. 5. ANLAM BELİRSİZLİĞİ İÇEREN TÜRKÇE SÖZCÜKLERİN HESAPLAMALI DİLBİLİM UYGULAMALARIYLA BELİRGİNLEŞTİRMESİ Zeynep Altan Zeynep Orhan Fatih Ünv. / Maltepe Ünv. 6. BİLGİSAYAR ORTAMINDA BİÇİMSEL ONTOLOJİ OLUŞTURULMASI Yelda FIRAT, Yılmaz Kılıçaslan, Özlem Uçar 2013 7. METİNLERİN OKUNABİLİRLİĞİNİN ÖLÇÜLMESİ ÜZERİNE BİR YAZILIM KÜTÜPHANESİ VE TÜRKÇE İÇİN YENİ BİR OKUNABİLİRLİK ÖLÇÜTÜ Burak BEZİRCİ, Asım Egemen YILMAZ 2010 8. TÜRKÇE METİN BELGELERİ İÇİN DAMGALAMA H. Mesut MERAL, Bülent SANKUR, A. Sumru ÖZSOY Boğaziçi Üniversitesi 9. TÜRKÇE DOĞAL DİL İŞLEME Kemal Oflazer, H. Cem Bozşahin ODTÜ 10. Türkçe Metin Arama Sistemleri ve Veritabanlarının Karşılaştırılması Özgür Yılmazel 2009 11. BİLGİSAYAR DESTEKLİ TÜRKÇE TABANLI MEDYA İÇERİK ÇÖZÜMLEME Aykut ARIKAN 2009
Teşekkürler
Ekler
İş Paketleri 2a : Kavramsal Doğrulama Çalışmaları (66 gün) Temassız Kart Okuyucuların belirlenmesi Optik Karakter Tanıma sisteminin belirlenmesi Optik Karakter Tanıma sisteminden kaynaklanan hataların ortadan kaldırılma yöntemlerinin belirlenmesi Metin özetleme amacıyla kullanılabilecek doğal dil işleme yöntemlerinin incelenmesi Yüksek başarımlı, Türkçe destekli bir tam metin arama motoru oluşturmak için uygun doğal dil işleme algoritmalarının belirlenmesi
İş Paketleri 2b : Tasarım Mimarisinin Belirlenmesi ve Oluşturulması Kullanıcı ve Grup altyapısının tasarlanması Web tabanlı 'Yönetim Arayüzü'nün tasarlanması Veri depolama sisteminin tasarlanması Yazım düzeltme modülünün tasarlanması Türkçe metin özetleme modülünün tasarlanması Tam metin arama motorunun tasarlanması Tasarım dokümanlarının oluşturulması
İş Paketleri 3 : Geliştirme Çalışmaları Windows Yazdırma Portu Sürücüsünün Geliştirilmesi Temassız Kart Okuyucuların entegrasyon modüllerinin geliştirilmesi Web Tabanlı Yönetim Arayüzünün Geliştirilmesi Maliyet Yönetimi ve Yazdırma İzinleri Modülünün Geliştirilmesi Yazıcılardan Geçecek Tüm Belgeleri Depolayacak Veri Depolama Sisteminin Geliştirilmesi Belgelere Optik Karakter Tanıma İşlemi Yapacak Uygulamanın Geliştirilmesi Optik Karakter Tanıma İşlemindeki Hataları En Aza İndirgeyecek Yazım Düzeltme Modülünün Geliştirilmesi Belgeleri Özetleyecek Doğal Dil İşleme Modülünün Geliştirilmesi Özetler Üstünde Çalışacak Türkçe Destekli Tam Metin Arama Motorunun Geliştirilmesi
İş Paketleri 4 : Uygulama ve Entegrasyon Çalışmaları Performansa Yönelik Test Case ve Senaryolarının Oluşturulması Fonksiyon Testi Stres Testi Hata Ayıklama Testleri Çok Amaçlı Yazıcı Sistemlerine Entegrasyon Entegrasyon Testleri Pilot Uygulama Çalışmaları Proje Kapanış
İş Paketleri 1 : (Mevcut İş Paketi) Ön Analiz ve Literatür Çalışmaları (43 gün) Proje açılışı (1 gün) Literatür Analizi ve Akademik Çalışmaların Taranması (20 gün) Temassız Kart Okuyucu sistemlerin araştırılması Optik Karakter Tanıma sistemlerinin araştırılması Doğal Dil İşleme ile metin özetleme konusundaki çalışmaların taranması Türkçe destekli tam metin arama konusundaki çalışmaların taranması Gereksinimlerin Belirlenmesi (22 gün) Müşteri gereksinimlerinin belirlenmesi Çok Fonksiyonlu Yazıcı gereksinimlerinin belirlenmesi Çıktı gereksinimlerinin belirlenmesi Başarı Kriterlerinin Belirlenmesi Proje Yöntemlerinin Belirlenmesi
Proje İş Planı : İş Paketi : 1-1. Geliştirilebilir Arayüz Platformunun Ön Analiz ve Literatür Çalışmaları (01.06.2013-31.07.2013) Adı Soyadı İş Paketindeki Görevi Firmadaki Ünvanı Adam/Ay Oranı Ay SERRA YILMAZ (01.06.2013-31.07.2013) Gereksinimlerin ve proje başarı kriterlerinin belirlenmesi, literatür ve akademik çalışmaların gerçekleştirilmesi, proje yöntemlerinin belirlenmesi Toplam Adam-Ay SATIŞ VE PAZARLAMA MÜDÜRÜ 0,90 2 1,80 İBRAHİM AKÇAY (01.06.2013-31.07.2013) İRFAN ÖMÜR (01.06.2013-31.07.2013) Proje açılışı, projenin mali, idari ve teknik yönetimi, toplantı ve raporların düzenlenmesi, gereksinimlerin ve proje başarı kriterlerinin belirlenmesi, literatür ve akademik çalışmaların tamamlanması Doğal Dil İşleme ile metin özetleme ve Türkçe destekli tam metin arama konusundaki akademik çalışmaların taranması, hedefe uygun Doğal Dil İşleme yöntemlerinin araştırılması KIDEMLİ YAZILIM MÜHENDİSİ 0,20 2 0,40 YAZILIM MÜHENDİSİ 0,60 2 1,20 BATUHAN SENCER KARADUMAN (01.06.2013-31.07.2013) MURAT ŞİŞMAN (01.06.2013-31.07.2013) ZEKERİYA PEHLİVAN (01.06.2013-31.07.2013) Temassız kart okuyucu sistemleri ile optik karakter tanıma sistemlerinin araştırılması, çok fonksiyonlu yazıcı ve çıktı gereksinimlerinin belirlenmesi Yazıcılarda işlem gören belgelerin arşivlenmesi üzerine literatür çalışmalarının gerçekleştirilmesi, hedefe uygun Doğal Dil İşleme yöntemlerinin araştırılması Uygulama ihtiyaçlarının belirlenmesi, müşteri gereksinim analizlerinin gerçekleştirilmesi, başarı kriterlerinin belirlenmesi YAZILIM MÜHENDİSİ 0,60 2 1,20 YAZILIM GELİŞTİRME 0,40 2 0,80 TASARIMCI 0,40 2 0,80 GENEL TOPLAM 6,20
Proje İş Planı : Ön Analiz ve Literatür Çalışmaları (03.06.13-31.07.13 43 gün) Proje Açılış (1 gün) Literatür Analizi ve Akademik Çalışmaların Taranması (20 gün) Temassız Kart Okuyucu sistemlerin araştırılması Optik Karakter Tanıma sistemlerinin araştırılması Doğal Dil İşleme ile metin özetleme konusundaki çalışmaların araştırılması Türkçe destekli tam metin arama konusundaki çalışmaların araştırılması Gereksinimlerin Belirlenmesi (22 gün) Müşteri gereksinimlerinin belirlenmesi Çok Fonksiyonlu Yazıcı gereksinimlerinin belirlenmesi Çıktı gereksinimlerinin belirlenmesi Başarı Kriterlerinin belirlenmesi Proje Yöntemlerinin belirlenmesi
Proje DDİ Danışmanlığı için Akademisyen listesi : Doç. Dr. Tunga GÜNGÖR Boğaziçi Üniversitesi Yrd. Doç. Dr. Arzuhan ÖZGÜR Boğaziçi Üniversitesi Doç. Dr. Murat SARAÇLAR Boğaziçi Üniversitesi Yrd. Doç. Dr. M. Fatih AMASYALI Yıldız Teknik Üniversitesi Doç. Dr. Yılmaz KILIÇASLAN Trakya Üniversitesi
Doğal Dil İşlemenin Evreleri Bölümleme (Tokenization) : Bir metnin incelenebilmesi için öncelikle cümlelere ayrılmış olması gerekir. Bu cümleler ve cümle içindeki kelimelerin çözümlemesi yapıldıktan sonra anlamlı sonuçlar çıkarılabilir. Cümlelere ayırma işlemi metin için konuşmaların, kısaltmaların ve noktalama işaretlerinin geçmesi sebebiyle zorlaşabilir. Metinde ' Ali çabuk buraya gel! dedi. ' cümlesini ayırabilmek için noktalama işaretlerinin kontrolünün yapılması gerekecektir. Biçimbirimsel (Morphological) Çözümleme : Sözcüklerin yapısının, ek ve köklerinin incelenmesidir. Türkçe ve Fince gibi sondan eklemeli dillerde daha çok araştırılması gereken bir konudur. Çekim soneklerini çok olması ve yapım eklerinin üretken olması karşımıza engel olarak çıkmaktadır. Örneğin koyun kelimesi hangi anlamlara gelebileceğini inceleyelim: koyun(kök): bir tür hayvan (isim) koy(kök) un (iyelik eki): sana ait olan koy(isim) koy(kök) un (emir kipi eki): koymak fiilinin emir kipi (fiil) koyu(kök) n (iyelik eki): sana ait olan koyu rengi Cümlede hangi kelimenin kullanılmak istendiğinin bulunması sondan eklemeli dillerde bu sebeple zordur. Sözdizimsel (Syntaxial) Çözümleme : Cümleyi oluşturan öğelerin hiyerarşik yapı kurallarına uyumunu inceleyerek hangi öbeğe ait olduğunun analizini yapmaktır. Türkçe en genelde özne, nesne ve yüklemden oluşur. Bunun yanında cümlenin anlamını kuvvetlendiren zarf, edat, bağlaçlar da vardır. Anlamsal (Semantical) Çözümleme : Doğal dil işlemenin son aşamasıdır. İlk dört analiz yapıldıktan sonra cümlenin ne anlama geldiğini çıkarmak için yapılan analizlerdir.
SNMP (Simple Network Management Protocol) Ağ cihazlarının yönetimini ve izlenmesini kolaylaştıran bir uygulama katmanı protokolüdür. Bu protokol sayesinde ağdaki hemen her türlü cihaz izlenebilir hatta yapılandırmaları değiştirilebilir. SNMP TCP/IP protokol kümesinin bir bileşenidir ve bir uygulama katmanı protokolü, veri tabanı şeması, veri nesneleri gibi standartlar barındırır. Proje kapsamında SNMP kullanarak ağ üzerinden çok fonksiyonlu cihaz servislerinin aktif/pasif yapma kontrolü sağlanmış olacaktır. SNMP nin üç temel bileşeni vardır. Bunlar: NMS (Network Management System): Yönetici tarafında çalışan SNMP yazılımıdır. Agent: Yönetilen cihaz tarafında çalışan yazılımdır. MIB (Management Information Base): Her cihazın yerelinde bulunan, cihazdaki agent tarafından erişim sağlanan ve cihazla ilgili bilgileri bulunduran bir veri tabanıdır. Management Information Base - MIB kavramı: MIB kavramı bir ağaç yapısına benzetilebilir. Ulaşılmak istenen değeri tutan değişkene OID (Object IDentifier) adı verilir. Bu değişkenler ağacın dallarının en uç noktasında olup bir cihazla ilgili tek bir değeri tutabileceği gibi kendisinden sonra gelen bütün alt dalları ifade etmek için de kullanılabilirler. Kökten ağaç dalına uzanan bu hiyerarşi birbirlerinden nokta ile ayrılmış sayı dizileriyle ifade edilir. Örneğin: 1.3.6.1.2.1.1.5.0 1 : ISO (International Standart Organization) 3 : Org (organization) 6 : Dod (Department of defense) 1 : Internet 2 : Mgmt (Network management entries) 1: mib-2 1 : system 5 : sysname 0 : Dalın sonundaki ilk girdiyi belirtir. 1.3.6.1.2.1.1.5 değişkeninin anlamı sysname dir. Buradaki ilk girdi de sysname.0 olarak adlandırılır. Yani komutta 1.3.6.1.2.1.1.5.0 yerine sysname.0 yazılırsa da aynı işlevi görür. Değişkenin başındaki ilk dört sayı, yani 1.3.6.1 standarttır. Bu noktadan sonra ulaşmak istediğimiz bilgiye göre alt dallara ilerlenir. Örneğin 1.3.6.1.2.1.1 dalı sistemle ilgili sistem adı, sistem tanımı, sistemin ayakta olduğu süre gibi değerleri tutar. Bunun alt dalı olan 1.3.6.1.2.1.1.5.0 değişkeni bunlardan biridir (sistem adı).
Web servisler için MIB değerleri : Registration web service enable/disable Setting MIB ID Value 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.1 Integer: enable/true(1),disable/false(2) Default: enable/true(1) Session web service enable/disable 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.2 Integer: enable/true(1),disable/false(2) Default: enable/true(1) Device Configuration web service enable/disable Access Config web service enable/disable 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.3 Integer: enable/true(1),disable/false(2) Default: enable/true(1) 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.4 Integer: enable/true(1),disable/false(2) Default: enable/true(1) Scan web service enable/disable 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.5 Integer: enable/true(1),disable/false(2) Default: enable/true(1) Xerox Secure Access - enable/disable 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.9 Integer: enable/true(1),disable/false(2) Default: enable/true(1) UI configuration web service enable/disable EIP Proxy configuration web service enable/disable Digital Certificate Management web service enable/disable 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.10 Integer: enable/true(1),disable/false(2) Default: enable/true(1) 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.11 Integer: enable/true(1),disable/false(2) Default: enable/true(1) 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.12 Integer: enable/true(1),disable/false(2) Default: enable/true(1) Mass Storage web service 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.17 Integer: enable/true(1),disable/false(2) Default: enable/true(1) enable/disable Card Reader web service 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.18 Integer: enable/true(1),disable/false(2) Default: enable/true(1) enable/disable Copy web service enable/disable 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.19 Integer: enable/true(1),disable/false(2) Default: enable/true(1) Job Management web service enable/disable 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.20 Integer: enable/true(1),disable/false(2) Default: enable/true(1) Job Limits web service enable/disable 1.3.6.1.4.1.253.8.74.6.2.1.7.31.101.143.21 Integer: enable/true(1),disable/false(2) Default: enable/true(1)