AW: Suche Such-Programme

Niels Dettenbach linux at eichsfeld.net
So Jan 13 14:51:58 CET 2008


Hallo Mario,

wenn Du eine "echte" wie flexible Suchmaschine suchst, kann ich Dir die - mittlerweile etwas vergessene - Software des Harvest Projektes empfehlen. Es ist zwar schon etwas älter - kann aber das, was Du haben möchtest und ggf. Noch mehr.

Harvest besteht aus einem Gatherer wie einem Broker - einem Robot / Agent zum Einsammeln wie Indizieren der Dokumente in eine Datenbank (in der alten Variante noch gdbm) sowie eine Software zur Abfrage / Recherche / Suche in den Daten.

Als ein Folgeprojekt wurde damals Harvest-NG begonnen, ein Rewrite des Gatherers (Robots) in übersichtlichem Perl.

Harvest wie dessen Konzept glänzt mit Performance, sehr weiter Flexibilität (z.B. realisierung verschiedener Dokumenten-Formate/-Typen) wie anpassbarer / mögliche eigene Suchalgorithmen und eigene Optik. Z.B. Gibt es ein Modul (alpha), welches das von Google bekannte Ranking nach Link-Referenzierung grundlegend abbildet. Auch kann man die Last auf Netzwerk / Server begrenzen bzw. geeignet herunterregeln. Wie die Dateien im Netz im Original erreichbar sind, ist gleich - die Dokumente können auf verschiedensten Servern liegen. Für eine ganze Reihe Formate (Text, HTML, PDF, MS Office, Postscript etc.) liegen passende Filter / Module bei - weitere lassen sich recht einfach selbst stricken. 

Leider wird das Projekt meines Wissens nicht mehr aktiv weiterentwickelt. Ich selbst habe mal vor ca. 2 Jahren begonnen, Harvest-NG aufzugreifen und als Ansatz für eine neue, offene, verteilte Suchmaschinenplattform zu verwenden. Leider fehlt mir immer wieder die Zeit, das Suchmaschinenprojekt allein weiter- bzw. fertig zu bauen, wenngleich mir kommerzielle Projekte wie Google nicht wirklich Spaß machen. 

Vielleicht finden sich ja noch weitere "Verrückte", die Interesse an einem völlig neuen Ansatz einer zudem offenen Suchmaschine mitzubasteln? Bei Interesse an sowas - bitte gern melden...

Beste Grüße,

Niels.

Niels Dettenbach
---
Syndicat mobile Email
http://www.syndicat.com

-- Urspr. Mitt. --
Betreff: Suche Such-Programme
Von: Mario Scheel <zweistein12 at web.de>
Datum: 13.01.2008 13:35

Hallo an alle

Wir haben in der Firma einen Linux-File-Server stehen. Auf diesen wird per 
Windows-Client zugegriffen. 

Nun suche ich ein programm das die Dateien auf dem Server durchsucht und 
indexiert und bei Eingabe von Suchwörtern (vermutlich per Webinterface) 
gescheite Antworten gibt. 

Die Dateien werden per Samba freigegeben. 

htdig - Ist so weit ich gelesen habe zum indexieren von Webseiten
strigi - Habe ich keine Suchmaske. 

mfg
Mario Scheel