Erstellung der statistischen Lexika
Gehen Sie folgendermaßen vor, um statistische Lexika zu erstellen:
- Starten Sie die Lexikonerstellung über das Icon
in der crossMining-Symbolleiste oder alternativ über Datei > Lexikon erstellen.
TippBei der Erstellung der Lexika werden die Einstellungen verwendet, wie sie unter Tools > Einstellungen definiert sind.
Weitere Informationen hierzu erhalten Sie hier.
- Hierfür werden zunächst die Sprachen definiert, in denen das Lexikon erstellt werden soll. crossMining ermittelt automatisch die Sprachen, die in Across angelegt sind. Wählen Sie zunächst eine Quellsprache und anschließend eine Zielsprache (und ggf. Subsprachen) aus. Sie können die Quell- und Zielsprachen dabei beliebig miteinander kombinieren und auch mehrere Sprachpaare definieren. Pro Sprachpaar wird ein separates Lexikon angelegt.
- Nun können Sie crossTank- und/oder crossTerm-Filter definieren, um die Lexikonerstellung auf bestimmte crossTank- und crossTerm-Einträge bzw. -Bereiche zu beschränken. Für crossTerm können Sie den crossTerm-Bestand nach Instanzen, Relationen sowie Fachgebiete filtern. Bei crossTank ist die Filterung nach Benutzern, Fachgebieten, Projekten, Relationen sowie benutzerdefinierten Systemattributen möglich.
- Anschließend können Sie das Ausgabeverzeichnis für das Lexikon festlegen. Standardmäßig wird hierfür ein Unterverzeichnis der Gemeinsamen Dateien im Programme-Ordner verwendet.
Aus diesem Unterverzeichnis werden die statistischen Lexika ausgelesen und an die Across-Clients verteilt.
Falls gewünscht können Sie insbesondere ein anderes Ausgabeverzeichnis auswählen. Auf diese Weise können Sie z. B. für Testzwecke zunächst die Erstellung der statistischen Lexika optimieren und erst im Anschluss daran die Lexika im Standard-Ausgabeverzeichnis ablegen, um diese dadurch an die Clients zu verteilen. Deaktivieren Sie zur Auswahl eines anderen Ausgabeordners die Option Das Standard-Ausgabeverzeichnis verwenden und wählen Sie über Durchsuchen einen anderen Ordner aus.
- Nun erfolgt die Erstellung der Lexika. Dies geschieht in den folgenden Arbeitsschritten:
- Zusammenstellung der crossTerm-Daten in den ausgewählten Sprachen
Der Arbeitsschritt wird übersprungen, falls die Option zur Berücksichtigung der Terme (siehe oben) deaktiviert ist. - Zusammenstellung der crossTank-Daten in den ausgewählten Sprachen
- Erste Phase der Lexikonerstellung: Die Wahrscheinlichkeit der möglichen Wortentsprechungen wird errechnet.
- Zweite Phase der Lexikonerstellung: Die Position der Wörter wird in die Wahrscheinlichkeitsberechnung mit einbezogen.
- Dritte Phase der Lexikonerstellung: Die möglichen Entsprechungen von Mehrwortkombinationen werden ermittelt (also z. B. engl. table of contents vs. dt. Inhaltsverzeichnis) und die in den Einstellungen festgelegten Werte für die Mindestwahrscheinlichkeit und -häufigkeit werden angewandt.
TippÜber den Menüeintrag Ansicht > Prozessausgabe können Sie die Prozessschritte, die crossMining aktuell durchführt, in einem Fensterbereich einblenden.
- Zusammenstellung der crossTerm-Daten in den ausgewählten Sprachen
- Nach Abschluss der Lexikonerstellung erscheint eine entsprechende Meldung. Klicken Sie auf OK.
- Das statistische Lexikon wurde am ausgewählten Speicherort als dic-Datei abgelegt. Der Name der Datei besteht aus der Installations-GUID des Across Language Server sowie den Ländercodes (LCIDs) der Quell- und Zielsprache.
Nun können Sie das erstellte Lexikon für die crossMining-Funktionen der Autovervollständigung sowie des Terminologie-Harvesting nutzen.
Prozessgraphen
Über Ansicht > Graph können Sie sich die Entwicklung der Wahrscheinlichkeiten während der Lexikonerstellung in Form von graphischen Darstellungen anzeigen lassen. Über die Registerkarten wählen Sie den Graph für die erste oder die zweite Phase der Lexikonerstellung. Auf der x-Achse werden die Iterationen, auf der y-Achse die Wahrscheinlichkeiten dargestellt.
Anhand der Analyse der Graphen lässt sich die Erstellung der statistischen Lexika optimieren, z. B. indem die Anzahl der Iterationen entsprechend angepasst wird.
Indem Sie mit gedrückter linker Maustaste einen Bereich des Graphen auswählen, wird der entsprechende Ausschnitt vergrößert.
Über Zoom zurücksetzen können Sie die ursprüngliche Darstellung wiederherstellen.
Über Datei > Graph speichern und Datei > Graph laden können Sie die Graphen als XML-Dateien abspeichern und auch wieder laden. Auf diese Weise können z. B. verschiedene Graphen miteinander verglichen werden.