Tipp 3: Maschinelle Übersetzung verstehen
Wie bereits erwähnt, können Sie sich als Post-Editing-Experte positionieren, indem Sie bestmöglich über maschinelle Übersetzung informiert sind. Sie sollten wissen, wie die verschiedenen Systeme funktionieren und wie Unternehmen die Texte im Vorfeld für die maschinelle Übersetzung vorbereiten können.
Aktuell wird vermehrt neuronale maschinelle Übersetzung eingesetzt, aber dennoch ist es sinnvoll, sich mit den Grundprinzipien von regelbasierten und statistischen Systemen auszukennen.
Regelbasierte maschinelle Übersetzung
Der regelbasierte Ansatz ist die klassische Methode der MÜ. Es ist sehr kostspielig und zeitintensiv, ein System regelbasiert zu entwickeln, da jede sprachliche Eigenschaft manuell erfasst werden muss. Daher kommt dieser Ansatz heutzutage immer seltener zum Einsatz. Dennoch soll erwähnt sein, dass regelbasierte maschinelle Übersetzung gute terminologische Vorschläge liefert, da das System speziell mit der Unternehmensterminologie trainiert wird. Außerdem sind die Übersetzungen immer vollständig und die Ergebnisse sind berechenbar. Der große Nachteil ist, dass die Übersetzungen sehr mechanisch sind und die Satzstellung nicht gut dargestellt wird.
Statistische maschinelle Übersetzung
Statistische maschinelle Übersetzung basiert auf dem Ansatz, Übersetzungen anhand der Berechnung von Wahrscheinlichkeiten zu erstellen. Die dafür notwendige Information wird aus zweisprachigen Korpora extrahiert. Da die Satzstrukturen und die Terminologie in jedem Korpus unterschiedlich sind, spiegelt sich das als mangelnde Konsistenz im Output wider, wodurch der Lesefluss beeinträchtigt werden kann. Das System kann auch unvollständige Übersetzungen produzieren oder Informationen fälschlich hinzufügen. Außerdem produziert das System Fehler bei der Groß- und Rechtschreibung.
Neuronale maschinelle Übersetzung
Die neuronale maschinelle Übersetzung basiert auf einem künstlichen neuronalen Netz (KNN), das die neuronalen Verbindungen im Gehirn nachahmt. Für die Übersetzung werden auch parallele Korpora analysiert. Der Unterschied dabei ist, dass im KNN die grammatikalischen Zusammenhänge der Sätze implizit miteinbezogen werden. Die Texte werden also nicht auf Phrasen-, sondern auf Satzebene übersetzt, was die Lesbarkeit stark verbessert. Die bisher größte Herausforderung der neuronalen maschinellen Übersetzung ist der noch limitierte Wortschatz, der in den Modellen verarbeitet werden kann (derzeit sind es zwischen 50.000 und 80.000 Wörter). Beim Post-Editieren sollte also mehr auf die Lexik als auf die Grammatik geachtet werden. Die Nachteile des Systems sind die gleichen wie die der statistischen maschinellen Übersetzung. Mit NMÜ erzeugte Übersetzungen lesen sich jedoch ausgesprochen flüssig und das kann problematisch sein, denn Fehler werden schneller übersehen. Dennoch liefert neuronale maschinelle Übersetzung zurzeit die besten Ergebnisse, weswegen sich der Aufwand, den Text auf lexikalischer Ebene stärker zu kontrollieren, in den meisten Fällen lohnt.