Erweiterte Einstellungen
In den erweiterten Einstellungen können Sie zunächst die Zahl der Iterationen festlegen, die jeweils in der ersten und zweiten Phasen der Lexikonerstellung durchlaufen werden. (Eine allgemeingültige Empfehlung bzgl. der optimalen Anzahl an Iterationen lässt sich kaum geben, da sich diese von Fall zu Fall unterscheidet. Sie hängt insbesondere von dem gewählten Sprachpaar ab, richtet sich aber z. B. auch nach der jeweils gewählten Sprachrichtung. So unterscheiden sich in der Regel die optimalen Werte für die Sprachrichtung Deutsch-Englisch – aufgrund der unterschiedlichen Morphologie der beiden Sprachen – von denen für die Sprachrichtung Englisch-Deutsch.)
Die vorgegebenen Werte in den erweiterten crossMining-Einstellungen sind daher als Ausgangspunkt für Testzwecke zu verstehen. Im Zuge Ihrer Tests sollten Sie diese Werte für Ihre spezifischen Daten optimieren.
Für die zweite Phase der Lexikonerstellung können Sie zudem wählen, dass diese übersprungen wird. Für Testzwecke kann dies nützlich sein, wenn die Ergebnisse der ersten Phase geprüft werden sollen.
Als Iteration (lat. für „Wiederholung“) wird in der numerischen Mathematik die wiederholte Anwendung desselben Rechenverfahrens bezeichnet. Dabei werden die Ergebnisse eines Iterationsschrittes als Ausgangswerte des jeweils nächsten Schrittes verwendet, um sich sukzessive einem zufriedenstellenden Endergebnis zu nähern.
In der ersten Phase der Lexikonerstellung werden Analysen zur Wahrscheinlichkeit von Wortentsprechungen durchgeführt. In der sich daran anschließenden zweiten Phase werden die Ergebnisse der ersten Phase weiterverarbeitet. Dabei wird insbesondere die Position der Wörter in die Wahrscheinlichkeitsberechnungen mit einbezogen.
Darüber hinaus können Sie die Mindestwahrscheinlichkeit sowie die Mindesthäufigkeit bestimmen. Hiermit legen Sie fest, ab welcher Wahrscheinlichkeit bzw. Häufigkeit die Entsprechungen in die statistischen Lexika geschrieben werden.
Durch Aktivierung der Option Zwischenergebnisse speichern werden die Ergebnisse der Analysen nach jeder Wiederholung gespeichert. Diese Option ist nur relevant für Tests oder Optimierungen durch das Team der Professional Services von Across oder im Falle von Anfragen an den Across-Support.