Termextraktion

Stoppwörter oder Terme

Der mit der Termextraktion beauftragte Terminologe erhält nach Öffnen seiner Aufgabe eine Termkandidatenliste.

Per Mausklick legt der Terminologe fest, welche Termkandidaten tatsächlich Terme und welche hingegen keine Terme, sondern so genannte Stoppwörter sind.

Um Stoppwörter festlegen zu können, muss der entsprechende Benutzer das Recht haben, Stoppwörter zu verwalten (siehe das Recht Stoppwort-Liste im Bereich Systemeinstellungen der Benutzergruppen-Rechte). Terminologen verfügen standardmäßig über das Recht.

Stoppwörter sind Wörter, die bei einer Termextraktion herausgefiltert und somit nicht als Termkandidaten vorgeschlagen werden. Stoppwörter sind typischerweise z.B. Artikel, Füllwörter oder Konjunktionen. Je umfassender die Liste der Stoppwörter ist, desto genauer sind folglich die Ergebnisse der Termextraktion.

Der Kontext erleichtert häufig die Entscheidung des Terminologen, ob ein Term oder im Gegenteil ein Stoppwort vorliegt. Deshalb können über das icn_cDesk_term-in-quelltext-suchen-Icon oberhalb der Termkandidatenliste die Kontexte zum jeweiligen Termkandidaten angezeigt werden.

Attention

Bitte beachten Sie, dass die Termextraktion von Quelldokumenten in asiatischen Sprachen aufgrund der morphologischen Struktur der Sprachen nicht möglich ist.

Lernendes System

Termkandidaten, zu denen bereits crossTerm-Einträge vorhanden sind, werden in der Liste fettgedruckt sowie blau dargestellt. Der Terminologe kann sich also auf das Wesentliche konzentrieren: neue und bisher nicht übersetzte Terme. Zudem werden nach Fertigstellung der Termextraktionsaufgabe alle Stoppwörter in einer Liste gespeichert und fortan – falls gewünscht – nicht mehr als Termkandidaten angezeigt. Je häufiger und intensiver Sie also die Termextraktion einsetzen, desto besser werden Sie sie als wertvolles Instrument nutzen können.

Wörter, die in der Termkandidatenliste fettgedruckt sowie in blauer Schrift dargestellt werden, sind bereits als Terme in crossTerm angelegt und müssen folglich nur dann übersetzt und entsprechend als Terme ausgewählt werden, wenn für diese Terme noch keine zielsprachlichen Entsprechungen in crossTerm vorliegen.

Bei Wörtern, die bereits als Stoppwörter in Across hinterlegt sind, ist das entsprechende Kontrollkästchen aktiviert und ausgegraut.

Durch einen Doppelklick auf einen Termkandidaten wird dieser in der Source View farblich unterlegt angezeigt. Durch einen erneuten Doppelklick springt die Anzeige zur nächsten Fundstelle des Termkandidaten in der Source View.

Termkandidaten bearbeiten

Es kann nötig sein, Termkandidaten zu bearbeiten, z. B. um ein Nomen im Plural in den Singular zu setzen. Hierzu genügt ein einfacher Klick auf den ausgewählten Termkandidaten. Anschließend können Sie die nötigen Anpassungen vornehmen. Klicken Sie abschließend auf die Eingabetaste oder wechseln Sie zu einem anderen Termkandidaten, um die Änderungen zu übernehmen.

In der an die Termextraktion anschließende Termübersetzung lassen sich die quellsprachlichen Terme nicht mehr anpassen. Daher muss die Anpassung der quellsprachlichen Terme stets im Rahmen der Termextraktion erfolgen.

Termkandidatenliste

Die Termkandidatenliste lässt sich individuell anpassen. So kann sie z. B. durch Klicken auf den entsprechenden Spaltenkopf alphabetisch oder nach Frequenz sortiert werden. Darüber hinaus stehen verschiedene Filterfunktionen zur Verfügung, über die die folgenden Elemente aus der Liste herausgefiltert werden können:

  • Terme: Es werden all jene Termkandidaten ausgeblendet, die durch Aktivierung des entsprechenden Kontrollkästchens bereits als Terme gekennzeichnet sind.
  • Wörter, die keine Terme sind: All jene Termkandidaten werden ausgeblendet, die noch nicht als Terme gekennzeichnet sind. Es werden folglich alle als Terme gekennzeichneten Wörter angezeigt.
  • Wörter, deren Frequenz unterhalb eines definierbaren Werts liegt.
  • Wörter, deren Buchstabenzahl unterhalb eines definierbaren Werts liegt.
  • Einzelwörter: All jene Termkandidaten werden ausgeblendet, die aus nur einem Wort bestehen.
  • Drei-Wort-Kombinationen: All jene Termkandidaten werden ausgeblendet, die aus drei Wörtern bestehen.
  • Stoppwörter: Es werden all jene Termkandidaten ausgeblendet, die bereits als Stoppwörter gekennzeichnet sind.

Zusätzlich zu den Filterfunktionen können Sie über das icn_cDesk_zu-termkandidatenliste-hinzufuegen-Icon einzelne markierte Wörter in der Source View zur Termkandidatenliste hinzufügen.

Aufgabe abschließen

Nach Beendigung der Termextraktion, d.h. nachdem Sie alle gewünschten Termkandidaten als Terme bzw. Stoppwörter markiert haben, können Sie die Aufgabe über das icn_cDesk_aufgabe-abschliessen–Icon in der crossDesk-Symbolleiste abschließen.

Nach Abschluss einer Termextraktionsaufgabe werden all jene Termkandidaten, die als Stoppwörter gekennzeichnet wurden, automatisch zur entsprechenden Stoppwortliste unter Tools > Systemeinstellungen > Terminologie > Stoppwörter hinzugefügt.

Termkandidaten, die als Terme gekennzeichnet wurden, werden in der nachfolgenden Termübersetzung zur Übersetzung angeboten.