Fuzzy-Suche

Mit der Fuzzy-Suche lassen sich unscharfe Suchanfragen in crossTerm durchführen. Diese unscharfe (oder schreibungstolerante) Suche findet auch dann einen Suchtreffer, wenn Suchwort und Suchtreffer nicht zu 100 Prozent übereinstimmen, sondern sich nur ähnlich sind.

Sie aktivieren die Fuzzy-Suche durch Auswahl des entsprechenden Eintrags aus der Dropdown-Liste unterhalb des Eingabefeldes der crossTerm-Suche.

Im nachfolgenden Beispiel wird nach dem orthographisch inkorrekten Wort „devise“ gesucht. Dank der Fuzzy-Suche wird aber dennoch der (orthographisch korrekte) Term „device“ gefunden:

cTeM_suchleiste_fuzzy_treffer

Über den Menü-Eintrag Tools > Übereinstimmungsgrad Fuzzy-Suche kann der prozentuale Grad der Übereinstimmung zwischen dem Suchwort und den möglichen Suchtreffern gewählt werden.

Je höher der gewählte Übereinstimmungsgrad dabei ist, desto höher ist auch die Suchgenauigkeit.

Beispiel

Gehen wir beispielhaft davon aus, dass in crossTerm Schraubendreher als Term hinterlegt ist. Wird nun nach Shraubendräher gesucht, wird Schraubendreher bei einem Übereinstimmungsgrad von 80% in crossTerm gefunden, bei einem Übereinstimmungsgrad von 90% wird Schraubendreher hingegen nicht gefunden.

Erläuterung

Die Berechnung des Übereinstimmungsgrads erfolgt auf Grundlage der so genannten Levenshtein-Distanz.

Tipp

Die Levenshtein-Distanz zwischen zwei Zeichenketten ist die Mindestanzahl von Editier-Operationen – d.h. jede Operation, bei der ein Zeichen eingefügt, gelöscht oder ersetzt wird –, die benötigt wird, um die erste Zeichenkette in die zweite umzuwandeln.

Bezogen auf das obige Beispiel bedeutet das, dass zwei Editier-Operationen benötigt werden, um Shraubendräher in Schraubendreher umzuwandeln. Die Levenshtein-Distanz beträgt in diesem Fall also 2.

Gehen wir nun weiter davon aus, dass für die Fuzzy-Suche ein Übereinstimmungsgrad von 80% gewählt ist. Wird nun in crossTerm mit aktivierter Fuzzy-Suche nach Shraubendräher gesucht, lässt sich anhand einer Formel berechnen, ob der Term Schraubendreher gefunden wird. Die Formel lautet:

Buchstabenanzahl Suchwort x (1-Übereinstimmungsgrad)

Also die Anzahl der Buchstaben des Suchwortes multipliziert mit dem Ergebnis der Subtraktion aus 1 und dem Übereinstimmungsgrad.

Das Ergebnis der Berechnung wird stets zur nächsten Ganzzahl ab- bzw. aufgerundet.

Für das vorliegende Beispiel ergibt sich durch Anwendung der Formel somit:

13 x (1-0,8) = 13 x 0,2 = 2,6

Schraubendreher wird also gefunden, da die Levenshtein-Distanz 2 beträgt und aufgrund des gewählten Übereinstimmungsgrads eine Distanz von (aufgerundet) 3 Zeichen erlaubt ist.

Bei einem Übereinstimmungsgrad von 90% ergibt sich hingegen die folgende Berechnung:

13 x (1-0,9) = 13 x 0,1 = 1,3

In diesem Fall wird Schraubendreher nicht gefunden, da die Levenshtein-Distanz wiederum 2 beträgt, aber aufgrund des gewählten Übereinstimmungsgrads nur eine Distanz von (abgerundet) 1 Zeichen erlaubt ist.