Elasticsearch

Volltextsuche mit Hochgeschwindigkeit

Anforderung

Für den Rudolf-Steiner-Verlag soll das Gesamtwerk mit über 400 Büchern und über 100.000 Seiten indexiert und durchsuchbar gemacht werden. Die Suche soll in Echtzeit erfolgen und eine Vielzahl an Suchparametern zulassen. So soll es möglich sein unscharf, also mit falsch geschriebenen Wörtern, trotzdem alle relevanten Inhalte zu finden. Ganz so, wie man es von Google gewohnt ist.

Umsetzung

Elasticsearch bietet eine Vielzahl an Möglichkeiten zur Suche in den gespeicherten Dokumenten. Unter anderem wird die, schon angesprochene, unscharfe Suche unterstützt, welche mit Hilfe der Levenshtein-Distanz definiert wird. Diese gibt an, wie viel Buchstabenänderungen pro Wort erlaubt sind. So würde eine Distanz von 1 mit dem Suchwort "B4sel" zu einer erfolgreichen Suche führen, "B4s3l" dagegen nicht mehr.

Ein anderes wichtiges Werkzeug ist die Suche nach Wortfolgen mit einem maximal erlaubten Wortabstand. So können Sätze gefunden werden, welche ganz ähnlich aufgebaut sind. Kombiniert man beides, erhält man ein mächtiges Suchwerkzeug für die Suche in Büchern.

Zusammenfassung

Elasticsearch bietet uns die Möglichkeit komplexe Suchanfragen in einer grossen Menge an Dokumenten zu stellen und blitzschnell eine Antwort zu erhalten. Dabei nutzen wir Features wie die Markierung von den gefundenen Textstellen oder die Möglichkeit verschiedene Inhaltsquellen in einer Anfrage zu kombinieren (Datum, Ort, Volltext, ...).

Ihre Suche nach einem cleveren Umsetzungspartner für Ihr nächstes Webprojekt war erfolgreich.