Resim 1. 1 kb lık dört yazı dosyası

Benzer belgeler

BİLİŞİM TEKNOLOJİLERİ YÜKSEK LİSANS

2. HTML Temel Etiketleri

Dosya Yönetimi. Dosya, Klasör ve Sürücüler. Ahmet SOYARSLAN biltek.info

TASARIMIN TEMEL İLKELERİ

Bilgisayar donanım ve yazılım olmak üzere iki bölümden oluşur. Bilgisayarın çalışabilmesi için, ikisi de gereklidir.

Bilgisayarın Yapıtaşları

DOSYALARI DÜZENLEMEK

Merkezi İşlem. Birimi

TEBEOS Kullanıcılarımızın Dikkatine

İnsan zekâsının çalışması sonucu ortaya çıkan düşünce ürünü, İletişim?

OKUL HABER EKLEME MODÜLÜ TANITIM DOSYASI. Okul haberlerinizi ilçemiz web sitesinde yayınlayabilmek için aşağıdaki adımları uygulamanız gerekmektedir.

Adım 1) Photoshop ekranının üst bölümünde bulunan Window seçeneğinden Animation u seçiyoruz. Ve alt kısımda uzun bir kutucuk açıldığını göreceksiniz.

2- Kontrol Sil En Öne Getir En Arkaya Gönder Resim Özellikler: Genel Özellikler...

STOKLARDA RESĐM KULLANIMI

INFONAV HARİTA GÜNCELLEME

Foobar2000. Bu yazının hiçbir hakkı mahfuz değildir. Istediğiniz gibi kulanabilirsiniz. Foobar Mart

YGS / Temel Matematik Soru ve Çözümleri

LMS PC aracı ACS420. LMS parametre ayarlarının yapılması için PC yazılımı. Kurlum ve çalıştırma talimatları

Ecat 8. Hakbim Bilgi İşlem A.Ş. Versiyon

Anneye En Güzel Hediye Olarak Ne Alınması Gerekir?

BİL Bilişim Teknolojileri. PowerPoint

TecCom TecLocal Programı Kurulum ve Yapılandırma Rehberi

İçindekiler. Giriş Kanuni Uyarılar IRISCompressor Yüklemesi ve Kurulumu Sistem Gereksinimleri Kurulum Etkinleştirme...

HESAP DOĞRULAMA KOŞULLARI

KULLANICI KULLANIM KILAVUZU

MacOSX'de Mail.app (Apple Mail) istemcisinde html imza ayarlamak

AKÇATARLA ORTAOKULU BİLİŞİM TEKNOLOJİLERİ SINAVI ÇALIŞMA KÂĞIDI

Bilgisayar. Bilgisayarın Özellikleri. Giriş İşleme Çıkış. Bilgisayar Nedir? Bilgisayarın Çalışma Prensibi

BENZERLİK BOYUTU. 1 = lim log 2. log olduğunu görmüştük.

Yedek Nasıl Alınır? "Veri Tabanı Yedekleme ve Geri Alma" butonunu tıklayınca aşağıdaki gibi bir ekran açılacaktır.

Kingston Technology Özelleştirme Programı

Basit Kılavuzu Eliberato bir Kitap Yayıncılık Eylül 'den fazla dile çevrildi

SMART Board EĞİTİMLERİ(sürüm:10) 3. Aşama

Kütüphane Kullanıcıları için İçeriğin Zenginleştirilmesi II

DOSYA-KLASÖR VE DOSYA UZANTILARI Batıkent Ortaokulu,Ders Notları,2016

Free Download Manager Kullanarak Internetten Download

Web tabanlı altyapı sayesinde her cihazdan erişilebilir ve düzenlenebilir dokümanlar oluşturulup anında paylaşılabilir.

Teknik Resim Çıkartılması

SMART Board EĞİTİMLERİ(sürüm:10) 1. Aşama


Dijital (Sayısal) Fotogrametri

Eğitsel Oyun Projesi Raporu. SCRATCH(BOWLING RENKSA) ELİF SÜER

Sayfa Gönderme Bilgi Notları :

Kontrol: Gökhan BİRBİL

Kurulum ve Başlangıç Kılavuzu. DataPage için

ÖZEL EFDAL ERENKÖY ANAOKULU ARI GRUBU EKİM AYI BÜLTENİ

3. SINIF PYP VELİ BÜLTENİ (10 Eylül - 19 Ekim 2018 )

Windows Live Movie Maker

IV. Ünite A. BAŞLANGIÇ B. TEMEL İŞLEMLER C. FORMÜLLER VE FONKSİYONLAR D. BİÇİMLEME E. İLERİ ÖZELLİKLER ELEKTRONİK TABLOLAMA

Web Tarayıcıları ve Arama Motorları

JAL IN İNTERNET TEN İNDİRİLMESİ VE KURULMASI

ÖDENEK TAKİP MODÜLÜ KULLANIM KLAVUZU

MİCROSOFT OFFİCE POWER POİNT SORULARI

Çoklu Ortam Uygulamaları. FATİH Projesi PARDUS Temel Eğitim Kursu

Yeni Schmersal online katalog. Hızlı başlangıç rehberi ve bir bakışta yeni işlevler

Temel Bilgi Teknolojileri II

Altan ÇOLAK Hoşgeldiniz

MİCROSOFT OFFİCE POWER POİNT SORULARI. 1) Power Point e yeni slayt hangi kısayol tuşu ile eklenir? a) Ctrl+N b) Ctrl+M c) Ctrl+C d) Ctrl+E

Web Sitesi/Sayfası/Dokümanı

Görsel Programlama DERS 03. Görsel Programlama - Ders03/ 1

Bilgisayar Programlama

İçindekiler. Giriş Kanuni Uyarılar IRISCompressor Yüklemesi ve Kurulumu Sistem Gereksinimleri Kurulum Etkinleştirme...

Murat ÖZBEK

Doküman Yönetimi ve Arşivleme

1.4. BİT Nİ KULLANMA ve YÖNETME

Şimdi Okullu Olduk İlkokul 1. Sınıf

Dosyalama olarak: HTML, PDF, DOC ve XLS dosya türlerini kullanabilirsiniz. Kütüphane Modülü açıldığında Vet.Asistanı Kütüphanesi ekrana gelmektedir.

Profilinizi Nasıl Güncellersiniz?


Adım Adım Windows 2000 Server Kurulumu 11 Cuma, 08 Eylül :32 - Son Güncelleme Cumartesi, 12 Eylül :45

Yenilikler. İcra Modülü

Bazı MSDOS komutları BAZI DOS KOMUTLARI


Uzaktan Eğitim Uygulama ve Araştırma Merkezi

1. Excel Dönüşümü : 2. Rapor Master Tanımları :

GİB Portal deki Faturaları efinans Portal e Taşıma

SİZİN WEB SİTENİZ BİR TANEDİR!

İ.Ü. AÇIK VE UZAKTAN EĞİTİM FAKÜLTESİ Ses ve Görüntü Hizmetleri Arşivleme Standardı

İnsanoğlu, Merak ve İllüzyon

2.SINIFLAR PYP VELİ BÜLTENİ

Mantıksal çıkarım yapmak. 9 ve üzeri

11 SÜRÜM İLE EKLENEN ÖZELLİKLER/DEĞİŞİKLİKLER ( V7 (B1554) )

Harita güncelleme direktifleri

SCRATCH KONU ANLATIM KAĞIDI BAY KODLAMA (baykodlama.blogspot.com)

BİLGİSAYAR PROGRAMLAMA DERSİ

Finale de Türk Sanat Müziği ve Türk Halk Müziği donanımlarını kullanarak nota yazabilirsiniz.

Veritabanı Yönetim Sistemleri I HAFTA 1

Hızlı Başlangıç Kılavuzu

Öğrencinin Adı Soyadı : ETKİNLİK 1 : Düz Aynada Görüntü Konulu Karikatür

Windows 7 - IIS 7.5 üzerine PHP ve MySQL kurulumu

/pirireisokullari MAYIS 2017 MİNİK RESSAMLAR SİHİRLİ BOYA

Ders Tanıtım Sunumu. Database Managegement II. Elbistan Meslek Yüksek Okulu Güz Yarıyılı. Öğr. Gör. Murat KEÇECĠOĞLU

Üçüncü Uluslararası Matematik ve Fen Araştırması (TIMSS) Nedir? Neyi Sorgular? Örnek Geometri Soruları ve Etkinlikler

Teknoloji ile Tanışalım

12 Photocopiable for classroom use only Computer Science Unplugged (

BİLGİSAYAR PROGRAMLAMA DERSİ

TEAMCENTER Rapid Start ile KOBİ lerin PLM e geçişi hızlanıyor (Sesli Anlatımlı Sunum Videomuz İçin Tıklayın)

Transkript:

Benzer ve Aynı Dosyalar Herkes tek ve biriciktir, diğer herkes gibi bu değilse de buna oldukça benzer bir laftı ve bu yazı için güzel bir giriş cümlesiydi, ben de gerekeni yaptım. Bilgisayarımızda aynı dosyaların isteğimiz dışında bulunmasından (edebi versiyonu için at koşturmasından ) rahatsızlık duyarız (duyuyorsunuz değil mi). Bu dosyalar yazılar, resimler, sesler ve videolar olabilir. Aynı dosyaların canımızı sıkma derecesi bizim için anlamlı olup olmadığı ile yakından ilgilidir. Örneğin C:\Program Files\Common Files\Microsoft Shared\OFFICE12\Office Setup Controller\OSETUP.DLL dosyasının C:\MSOCache\All Users\{90120000-0030-0000-0000-0000000FF1CE}-C\osetup.dll veya herhangi başka bir yerdeki osetup.dll ile aynı olması bizi pek bir ilgilendirmez. Anlamlı dosyalarımız içinde ise aynı dosyalara asla katlanamayız, arşivciliğe aykırıdır çünkü. Aynı dosyaları bulmak için yardımcı olan birçok program olmasına rağmen, işimize yarayacak benzer dosyaları bulucu programlar pek yoktur. Kısıtlı sayıdaki programlar ise yalnızca tek bir alana yoğunlaşmaktadır. Aynılık ve benzerlik kavramlarını örnekler üzerinde inceleyelim ilk önce: Resim 1. 1 kb lık dört yazı dosyası Resim 1 deki dosyalar aynı olabilir, çünkü boyutları aynı. Ama bir dosyayı sadece dış görünüşüyle tanıyamayız, içindekileri de görerek onu gerçekten tanırız. Resim 2. Aynı içerikli dört yazı dosyası Resim 2 deki dosyalar için artık aynı olabilir şüpheciliğinden, bu dosyalar aynıdır kesinliğine geçebilir miyiz? Çoğunlukla dikkatli bakmayız ve yanlış fikirlerle gereksiz zaman harcarız. Bilgisayarda hiçbir ama kalmayana kadar emin olabiliriz, denemeye devam edelim.

Resim 3. Daha içeriden bir kesit Dışı bir olsa bile içi farklı gördüğünüz gibi. Bir yazı dosyasını bile farklı kod standartlarıyla kaydettiğimizde yalnızca kendine benzer olduğu için, aynı veya benzer içerikli dosyaların bulunması normal programlama teknikleriyle (veya programlarla) oldukça zordur. Resim 4. İşin sihri Örneğin Dubicate File Finder isimli program bu dört tane dosyanın aynı olmadığı üzerine yemin ediyor, ya ona inanacaksınız ve mutlu bir şekilde yaşamınıza devam edeceksiniz ya da beni takibe devam edin.

Resim 5. Birebir aynı dosyaları bulan program Aynı dosyalar üzerinde hain deneylerimi şiddetle sürdürdüm. Bu sefer Reasonable NoClone isimli programı kullandım. Kullanıcıya daha fazla seçenek sunduğu için (yalnızca binary karşılaştırma yerine, aynı boyutlu dosyaları da bulma özeliği gib) 2.txt ve 3.txt nin aynı olduğunu bulabildi. Resim 6. Boyutları aynı dosyaları da bulabilen program

İlk önce kısa bir mazeret yazısıyla giriş yapayım bu paragrafa; internet erişimim kısıtlı imkanlar dâhilinde olduğundan inceleme yapabildiğim programlar ve veriler küçük bir kümeyi kapsar durumda kaldı ama yazının ileriki sürümlerinde (yalana bak!) araştırmayı daha da genişletebilirim. Çünkü eminim ki bir yerlerde bir pdf ile doc un içeriğini karşılaştırabileceğimiz programlar mevcut, aramaya inanmamız kâfi. İncelediğim programlar: Reasonable NoClone Dubicate File Finder EF Duplicate MP3 Finder Dup Detector VisiPics Resim 7. Ağıma düşürdüğüm programlar İçeriğe göre arama hakkında hazırladığım lafları sunmadan önce birkaç resim daha göstermek istiyorum sizlere konunun daha iyi anlaşılmasına katkısı olacağını düşünerek. 1.bmp nin içeriği: Resim 8. 2x2 lik bir resim BMF 6 ( Ä Ä ÿ ÿÿ ÿÿ 1.gif in içeriği: GIF89a _ _ _ ÀÀÀÿ ÿ_ÿÿ ÿÿ_ÿ_ÿÿÿÿÿ 3 f Ì ÿ_3 33_3f_3 _3Ì_3ÿ_f f3_ff_f _fì_fÿ_ 3_ f_ _ Ì_ ÿ_ì Ì3_Ìf_Ì _ÌÌ_Ìÿ_ÿ ÿ3_ÿf_ÿ _ÿì_ÿÿ3 3_33_f3_ 3_Ì3_ÿ33_33333f33 33Ì33ÿ3f_3f33ff3f 3fÌ3fÿ3 _3 33 f3 3 Ì3 ÿ3ì_3ì33ìf3ì 3ÌÌ3Ìÿ3ÿ_3ÿ33ÿf3ÿ 3ÿÌ3ÿÿf f_3f_ff_ f_ìf_ÿf3_f33f3 ff3 f3ìf3ÿff_ff3fffff ffìffÿf _f 3f ff f Ìf ÿfì_fì3fìffì fììfìÿfÿ_fÿ3fÿffÿ fÿìfÿÿ _3 _f _ _Ì _ÿ 3_ 33 3f 3 3Ì 3ÿ f_ f3 ff f fì fÿ _ 3 f Ì ÿ Ì_ Ì3 Ìf Ì ÌÌ Ìÿ ÿ_ ÿ3 ÿf ÿ ÿì ÿÿì Ì_3Ì_fÌ_ Ì_ÌÌ_ÿÌ3_Ì33Ì3fÌ3 Ì3ÌÌ3 ÿìf_ìf3ìffìf ÌfÌÌfÿÌ _Ì 3Ì fì Ì ÌÌ ÿìì_ìì3ììfìì ÌÌÌÌÌÿÌÿ_Ìÿ3ÌÿfÌÿ ÌÿÌÌÿÿÿ ÿ_3ÿ_fÿ_ ÿ_ìÿ_ÿÿ3_ÿ33ÿ3fÿ3 ÿ3ìÿ3ÿÿf_ÿf3ÿffÿf ÿfìÿfÿÿ _ÿ 3ÿ fÿ ÿ Ìÿ ÿÿì_ÿì 3ÿÌfÿÌ ÿììÿìÿÿÿ_ÿÿ3ÿÿfÿÿ ÿÿìÿÿÿ!ù, ¹µ0 / _;

1.jpg nin içeriği: 1.png nin içeriği: Yukarıda 2x2 lik bir resim dosyası var; birinci satırı kırmızı ve mavi, ikinci satırı ise yeşil, sarı. Anlamsız karakter toplulukları ise bu resmin farklı formatlardaki kod hali. Gördüğünüz gibi dosyalar aynı ama farklı yine. Bu tipteki dosyaları bulmak için içeriğe göre arama (ben uydurdum literatürdeki ismini bilmiyorum) yöntemlerini kullanmalıyız. Tabiî ki hepimiz doğuştan programcı olmadığımız için kendi algoritmamızı geliştirene kadar hazır programlardan faydalanacağız. Resim 9. Bir resmin farklı çözünürlükteki kopyaları

Örneğin bir resmin farklı çözünürlüğe sahip kopyalarını iga (içeriği göre arama) yöntemleriyle kolayca bulabiliriz. (Dup Detector ve VisiPics %100 başarı gösterdi bu testte) (Programcı arkadaşlar burada nasıllar hakkında biraz açıklama yaparlarsa biz meraklı tüketicileri sevindirirler. Ben kendi tahminlerimi yazayım, dosyalar hızlı bir formülle ortak bir çözünürlüğe çevrilir ve karşılaştırma yapılır veya resimlerin örneğin yukarıdan %20 içeri, soldan %25 gibi bölgelerindeki renk kümelerine bakarak karşılaştırma yapılabilir, ) Bir insan için çocuk oyuncağı olan bu işi yapabilen yalnızca iki programın olması bence ne anlam ifade ediyor kısmı sonuç kısmında yer alacak. Resim 10. Aynı dosya farklı formatlarda Resim 11. Bazı görüntü formatları Sonraki testte bir dosyayı farklı formatlarda kaydettim ve yaptığım test sonuçları aşağıdaki gibidir. (Dup Detector bu sefer tatmin edici sonuçlar veremedi, VisiPics ise görevini başarıyla tamamlamanın mutluluğunu duyumsayamadıysa da benden bir aferin aldı)

Resim 12. Test sonuçları

Resim 13. Bazı bubi tuzakları

Daha da sonra bir resmin yönünü değiştirerek, aynalayarak ve renklerinin tersini alarak çeşitli denemeler yaptım, Dup Detector bu sefer sınıfı zar zor geçerken, VisiPics hiçbir varlık gösteremedi. Bir sonraki testte ise internetten indirdiğim ve içeriğini genel olarak tanımlayabileceğim foto klasöründe arama gerçekleştirdim. Sonuçlar: Resim 14. Dup Detector ün bulduklarından Aynı fotoğrafın renkli ve siyah beyaz kopyasını başarıyla bulan Dup Detector, genelde moda çekimlerinde karşımıza çıkan seri fotoğraflarda oldukça silik kaldı

Resim 15. VisiPics in bulduklarından Bu klasörde harikalar yaratan VisiPics, bulması gereken tüm dosyaları listeleyerek gönüllerdeki yerini biraz daha sağlamlaştırdı.

Birçok bilgisayar kullanıcısının bilgisayarının bir yerlerinde konumlandırdığı ve içinde karikatür, montaj fotoğrafları gibi eserlerin yer aldığı komik ya da benzer bir isimde klasörü vardır. Şimdiki testimiz tam da burada. Resim 14. Hanım koş Dup Detector bir şeyler buldu Resim 14. Kedidir kedi

Bu testi açık ara önde olarak VisiPics kazandı. Hiçbir dosyayı ıskalamadı. VisiPics in bulduklarına daha yakından bir bakış için:

Resim 15. Tıpkısının aynısının biraz farklısı Tek karelik görüntüler için tatminkâr aramalar yapılabilmektedir. Bu teknolojilerin biraz daha geliştirilmesiyle hareketli görüntüler için de kolayca uyarlanabilir (Örneğin hareketli bir görüntünün kendi içinde yeterli farklılığa sahip (tamamen aynı renk değil, vs ) bir karenin alınarak diğerleriyle karşılaştırılması zaman alıcı gibi görünse de ilk akla gelen yöntem oldu). Ses dosyaları için ise durum bu kadar parlak değil ya da ben yanlış yerlerde aradım hep. Demek istediğim ses analizi yaparak benzer dosyaları bulan program yok (yeteri kadar araştırma yapmadığım için bu lafımı yemeye seve seve razıyım). Klasik birebir arama yapan programlar haricinde şarkıcı ismi, parça ismi gibi anahtar ifadelere bakarak arama yapan programlar mevcut sadece. Resim 16. Hangi yöntem Aynı ses dosyalarını bulan arama programlarındaki şimdilik en işe yarar yöntem şarkıcı ismi ve parça ismi benzer olan (bkz: resim 16) dosyaları eşleştirmektir. Aynı dosyaları bulması ise sadece arşivinizdeki mp3 bilgilerinin doğru girilmiş olmasına ve şansa bağlıdır.

Sonuç kısımları her zaman zorlandığım bölümler olmuştur. Kısa keseceğim. Çoğu kişinin şu anda ihtiyaç bile duymadığı bu yazılımlar ileride çok önemli bir konumda olacaktırlar. Bilgi beraberinde bilgi kirliliğiyle birlikte hızla artmaktadır. Bir makaleyi veya şiiri okuyarak birbirinden esinlenip esinlenilmediğinin tespiti, fotoğraf ve resimleri inceleyerek taklit edilip edilmediği gibi şeyler ve daha birçoğunun çıkış noktası olacağını düşünüyorum bu konunun. Maidis