Zweisprachige Termextraktion
Ergänzend zur normalen einsprachigen Termextraktion innerhalb von Across bietet crossMining die Möglichkeit einer zusätzlichen Termextraktion, bei der die quellsprachlichen Termkandidaten bereits mit ihren wahrscheinlichen zielsprachlichen Entsprechungen vorgeschlagen werden.
Nachdem ein Termkandidaten-Paar maschinell extrahiert und vorgeschlagen wurde, wird es durch den Benutzer als Termpaar bestätigt. Daraufhin wird das Termpaar automatisch an crossTerm gesendet und dort innerhalb eines neuen terminologischen Eintrags angelegt. Die Terme erhalten dabei den Status Nicht freigegeben. Als Autor der Einträge und Terme wird zudem der Benutzer eingetragen, der aktuell in crossMining angemeldet ist. Dadurch können sie anschließend systematisch gesucht (z. B. durch den Einsatz des entsprechenden Filters und durch die gezielte Suche nach den nicht freigegebenen Termen und/oder nach den Termen, die der entsprechende Benutzer angelegt hat) und ggf. nachbearbeitet sowie freigegeben werden.
Gehen Sie folgendermaßen vor, um eine zweisprachige Termextraktion durchzuführen:
- Starten Sie die zweisprachige Termextraktion über das Icon
in der crossMining-Symbolleiste oder alternativ über Tools > Terminologie-Harvesting.
- Der Dialog für das Terminologie-Harvesting wird eingeblendet. In der Registerkarte Neue Terminologie extrahieren führen Sie die zweisprachige Termextraktion durch.
- Klicken Sie auf Datei > Lexikon laden, um das statistische Lexikon auszuwählen, das Sie als Grundlage für die Termextraktion verwenden möchten.
- Ein Dialogfenster zeigt alle statistischen Lexika an, die im Ausgabeverzeichnis abgelegt sind. Über Pfad auswählen können Sie ein anderes Verzeichnis auswählen.
- Wählen Sie das Lexikon aus, das Sie verwenden möchten.
- Wählen Sie, ab welcher Mindestwahrscheinlichkeit und Mindesthäufigkeit die Terme vorgeschlagen werden und dass Stoppwörter nicht berücksichtigt werden.
- Klicken Sie auf OK, um die Termextraktion zu starten.
- crossMining schlägt nun Termpaare vor.
Zusätzlich zu den vorgeschlagenen quell- und zielsprachlichen Termen werden auch die Wahrscheinlichkeit der Übereinstimmung zwischen quell- und zielsprachlichem Term und die Zahl der Kookkurrenzen (d. h. das gemeinsame Auftreten zweier Terme) angezeigt.
Indem Sie auf einen der Spaltenköpfe der Tabelle klicken, ändern Sie die Sortierung der Tabelle auf Grundlage der ausgewählten Spalte.
Sie können die Liste der angezeigten Quell- und Zielterme anpassen, indem Sie in die Filter-Eingabefelder einen oder mehrere Buchstaben eingeben. Daraufhin werden nur noch die Quell- bzw. Zielterme angezeigt, die mit den entsprechenden Buchstaben beginnen. Um nur die Terme anzuzeigen, die auf bestimmte Buchstaben enden, können Sie den Asterisk (*) verwenden (z. B. *ion, um nur die Terme anzuzeigen, die auf „ion“ enden). Um nur die Terme anzuzeigen, die einen oder mehrere Buchstaben enthalten, können Sie den Asterisk an den Anfang sowie das Ende des Filtertextes setzen (z. B. *r*, um nur die Terme anzuzeigen, die den Buchstaben „r“ enthalten).
Zudem werden die Kontexte angezeigt, in denen die quell- und zielsprachlichen Terme in crossTank-Einträgen verwendet werden.
- Wählen Sie das oder die Termpaare (bzw. die entsprechenden Zeilen der Tabelle) aus, die Sie in crossTerm hinzufügen möchten.
Für die Mehrfachauswahl der Terme können Sie die Strg- oder Umschalt-Taste verwenden.
Falls erforderlich können Sie manuelle Korrekturen an den vorgeschlagenen Termen vornehmen.
- Klicken Sie auf Neuen Eintrag anlegen und bestätigen Sie die anschließende Meldung mit Ja.
Das bzw. die Termpaare werden daraufhin an crossTerm gesendet und dort als neue Einträge angelegt. Die Einträge werden dabei in der Across-Instanz angelegt, die hierfür in den Einstellungen zum Terminologie-Harvesting (unter Tools > Einstellungen > Terminologie-Harvesting) festgelegt ist.
Jeder Term erhält dabei die Picklistenwerte und Textfelder, die ebenfalls in den Einstellungen zum Terminologie-Harvesting festgelegt sind. Zudem erhalten die Terme den Status Nicht freigegeben. Als Autor der Terme wird der Benutzer eingetragen, der aktuell in crossMining angemeldet ist.
- Eine entsprechende Meldung bestätigt die erfolgreiche Anlage der Einträge. Klicken Sie auf OK.
- Die Terme, die soeben in crossTerm angelegt wurden, werden aus der Liste entfernt. Fahren Sie nun fort, bis Sie alle gewünschten Termpaare zu crossTerm hinzugefügt haben.
Über Datei > Schließen können Sie die zweisprachige Termextraktion beenden.