Wo war es noch gleich? - Suchen nach Dokumenten

Vortragender: René 'Lynx' Pfeiffer

Schedule: Samstag 20. September, 16:00

Der Vortrag behandelt die Vorstellung einer kleinen Suchmaschine, die in C++ geschrieben ist und externe Plugins als Konverter zur Wandlung in Text verwendet. Zu indizierende Dokumente werden dann entweder einem CLucene Indexer oder einer Postgres Datenbank mit Volltextindex zugeführt. In diesen aufbereiteten Datenbanken kann man dann schauen, ob man bestimmte Inhalte in seinen Dokumenten wiederfindet.

Der Vortrag stellt das Werkzeug CLucene, den Postgres Volltextindex und die C++ Applikation vor, die zur Indizierung verwendet wird. Zusätzlich kommen Konvertierungen von Zeichenkodierungen und deren Probleme/Herausforderungen zur Sprache.