Systemeinstellungen: Terminologie > Stoppwörter

Unter Stoppwörter können Sie Stoppwörter zur jeweiligen, in Across angelegten Sprache hinzufügen.

Stoppwörter sind Wörter, die bei einer Termextraktion herausgefiltert und somit nicht als Termkandidaten vorgeschlagen werden. Stoppwörter sind typischerweise z. B. Artikel, Füllwörter oder Konjunktionen. Je umfassender die Liste der Stoppwörter ist, desto genauer sind folglich die Ergebnisse der Termextraktion.

Neben der Möglichkeit, Stoppwörter im Rahmen von Termextraktionsaufgaben zu definieren, können Sie Stoppwörter im gleichnamigen Bereich der Systemeinstellungen zum einen manuell eintragen, indem Sie die Stoppwort-Liste der gewünschten Sprache über die Dropdown-Liste auswählen, das entsprechende Wort in das untere Eingabefeld schreiben und auf Hinzufügen klicken.

Zum anderen besteht die Möglichkeit, Stoppwort-Listen im XML-Format zu importieren. Klicken Sie hierzu auf Importieren und legen Sie anschließend fest, ob die zu importierende Datei die aktuellen Listen ersetzen oder ergänzen soll. Wählen Sie anschließend die zu importierende Datei mit den Stoppwort-Listen aus und klicken Sie auf Öffnen, um die Datei zu importieren.

Bitte beachten Sie die folgenden Punkte:

  • Wenn Sie wählen, dass die bestehenden Stoppwort-Listen ersetzt (und nicht ergänzt) werden sollen, werden grundsätzlich alle bestehenden Stoppwort-Listen gelöscht und durch die zu importierenden Stoppwort-Listen ersetzt. Eine bestehende Stoppwort-Liste in einer Sprache wird auch dann gelöscht, wenn in der zu importierenden Datei für diese Sprache keine Stoppwort-Liste definiert ist.
  • Die zu importierende XML-Datei muss die folgende Struktur aufweisen:

    <EverydayWords>

    <Language Name="LCID">

    <Word>Wort 1</Word>

    <Word>Wort 2</Word>

    ...

    </Language>

    </EverydayWords>

    LCID müssen Sie durch die LCID der entsprechenden Sprache ersetzen. (LCID steht für Locale Identifier und ist ein eindeutiger Bezeichner, der jeder Sprache zugewiesen ist. So hat Deutsch (Deutschland) z.B. die LCID 1031 und Englisch (USA) die LCID 1033.)

Zusätzlich besteht die Möglichkeit, die Stoppwort-Listen aller Sprachen im XML-Format zu exportieren. Klicken Sie hierzu auf Alle exportieren, vergeben Sie einen Namen für die zu exportierende Liste und klicken Sie abschließend auf Speichern.