OT: Doppelte Images finden - the technology behind

Jan-Benedict Glaw jbglaw at lug-owl.de
Do Apr 26 09:46:07 CEST 2007


On Thu, 2007-04-26 09:40:42 +0200, Steffen Ille <steffenille at web.de> wrote:
> gegeben sind ein oder mehrere Verzeichnisse auf einer Linux-Kiste mit 
> jeder Menge (50.000+)
> Bildern. Mit Tools wie "fdupes" findet man einige doppelte Files, weil 
> ein MD5 Hash zum Vergleich
> genutzt wird. Bei Dateien (Binaries, Word, etc.) ist das sinnvoll, bei 
> Bildern nur bedingt. Wenn
> ich auch Bilder finden will, die zu X % ähnlich sind (gedreht, 
> verkleinert, etc) nützt MD5 nichts.

jbglaw at d2:~$ apt-cache search find compare similar images
findimagedupes - Finds visually similar or duplicate images
jbglaw at d2:~$ apt-cache show findimagedupes|grep '^ '
 findimagedupes is a commandline utility which performs a rough
 "visual diff" to two images. This allows you to compare two
 images or a whole tree of images and determine if any are
 similar or identical. On common image types, findimagedupes
 seems to be around 98% accurate.
 .
 Homepage: http://www.jhnc.org/findimagedupes/

MfG, JBG

-- 
      Jan-Benedict Glaw      jbglaw at lug-owl.de              +49-172-7608481
Signature of: 23:53 <@jbglaw> So, ich kletter' jetzt mal ins Bett.
the second  : 23:57 <@jever2> .oO( kletter ..., hat er noch Gitter vorm Bett, wie früher meine Kinder?)
              00:00 <@jbglaw> jever2: *patsch*
              00:01 <@jever2> *aua*, wofür, Gedanken sind frei!
              00:02 <@jbglaw> Nee, freie Gedanken, die sind seit 1984 doch aus!
              00:03 <@jever2> 1984? ich bin erst seit 1985 verheiratet!
-------------- nächster Teil --------------
Ein Dateianhang mit Binärdaten wurde abgetrennt...
Dateiname   : nicht verfügbar
Dateityp    : application/pgp-signature
Dateigröße  : 189 bytes
Beschreibung: Digital signature
URL         : http://www.tlug.de/pipermail/tlug_allgemein/attachments/20070426/9d3a29c9/attachment-0001.pgp