Volltextindexierung
aus Wikipedia, der freien Enzyklopädie
Volltextindexierung ist die (automatische) Erfassung sämtlicher Wörter eines Textes im Index. Ausgenommen davon sind in der Regel Stoppwörter.
Volltextindexierung wird entweder ergänzend zu intellektuell vergebenen Deskriptoren eingesetzt oder dient gänzlich als Ersatz für ein intellektuelles Ordnungssystem.
Ein populärer Irrglaube ist, dass Volltextindices grundsätzlich besser sind als von Menschen erstellte Ordnungssysteme. Ein weniger populärer Irrglaube ist, dass Volltextindices nur verwendet werden (sollten), wenn Zeit und Geld für ein funktionierendes Ordnungssystem fehlen - richtiger ist es das "Volltextindexierung" nicht gegen Ordnungssystem bestehen kann.
[Bearbeiten] Vorteile
Indexierung mittels Volltextindexierung hat eine Erhöhung des Recalls eines Retrievalsystems zufolge, zumal dadurch im Normalfall die Anzahl der Stichwörter höher ist.
Der Rechercheur kann ohne Kenntnis des Ordnungssystems suchen.
Als Ergänzung zu einem Intellektuellen Ordnungssystem kann der Volltextindex als "Backbone" dienen. Denn kein Ordnungssystem ist perfekt.
[Bearbeiten] Nachteile
Die Precision eines Retrievalsystems geht durch den Einsatz von Volltextindizierung enorm zurück. Wird ein Begriff in einem Text nur am Rande erwähnt, ist das Dokument trotzdem unter diesem zu finden.
Die Suche im Volltextindex dauert länger, da Volltextindices inherent größer sind als intellektuell erstellte. Das mag, auf eine einzelne Suche bezogen, zwar im Bereich von Bruchteilen von Sekunden liegen, ist aber mit steigender Nutzerzahl eines Retrievalsystems nicht mehr zu vernachlässigen.
[Bearbeiten] Zusammenfassung
Volltextindices fungieren, selbst wenn gepaart mit Ranking-Algorithmen, im allgemeinen als wenig passable Retrieval-Werkzeuge (siehe auch Google) und eher als Unterstützung von intellektuellen Ordnungssystemen.