Maschinelle Übersetzung, und jetzt? Teil 1 für Übersetzer

Blog-Beitrag vom 21.11.2018

Maschinelle Übersetzung (MÜ) ist in aller Munde: Die Resultate seien quasi über Nacht besser geworden, man benötige für viele Textsorten keine Humanübersetzung mehr, neuronale maschinelle Übersetzung (NMÜ) sei eine bahnbrechende Revolution und das Ende der klassischen Übersetzung.

In der Branche wird zudem viel über Post-Editing diskutiert und viele haben eine klare Meinung zum Thema, die auch gern verteidigt wird. Es ist für Übersetzer verständlicherweise ein sehr emotionales Thema, denn es geht bei der Diskussion oft um Existenzängste und die Zukunft des eigenen Berufs.

In diesem Artikel erhalten Sie einen kurzen Überblick über maschinelle Übersetzung und Post-Editing sowie einige Tipps und Tricks, um sich auf die Herausforderungen als Übersetzer vorzubereiten.

Ein Artikel von

Flurina Schwendimann
Content Management, Across Systems

Ein Artikel von

Julia Likutschewa
Training, Across Systems

Die Branche ist im Wandel und die Übersetzer können mit der richtigen Vorbereitung von diesen Veränderungen optimal profitieren.

Hintergrundwissen: Entwicklung der maschinellen Übersetzung

Eine Angst können wir Ihnen vorab nehmen: Die neuen Entwicklungen im Bereich der neuronalen maschinellen Übersetzung sind zwar bemerkenswert, sie sind aber teilweise ein Hype. Im Kontext betrachtet verlief die Entwicklung maschineller Übersetzung schon immer sprunghaft. Es gab mehrere Phasen, bei denen auch viele dachten, sie seien die endgültige Revolution, die Übersetzer überflüssig macht.

Dies war ab 1948 der Fall, als maschinelle Übersetzung zum ersten Mal eingeführt wurde. Mit der Veröffentlichung des ALPAC-Berichts (Automatic Language Processing Advisory Committee) 1966 kamen die Experten der National Academy of Sciences aber zum Ergebnis, dass maschinelle Übersetzung langsamer, ungenauer und doppelt so teuer wie Humanübersetzung sei. Daraufhin folgte die Ernüchterung, die Gemüter beruhigten sich wieder.

Als IBM 1988 die statistische maschinelle Übersetzung vorstellte, wiederholte sich der Hype. Die statistischen und regelbasierten Methoden zur maschinellen Übersetzung galten danach lange „nur“ als robuste Hilfsmittel im Übersetzungsprozess und die Stimmen derjenigen, die den Untergang des Übersetzungsberufes prophezeiten, verstummten wieder.

Bis 2014. In dem Jahr wurde die erste wissenschaftliche Arbeit über neuronale maschinelle Übersetzung veröffentlicht. Ein Jahr später wurde OpenNMT präsentiert, die erste funktionierende NMÜ-Engine, die Harvard in Kollaboration mit SYSTRAN entwickelte.

Dieser Artikel soll keine Geschichtsstunde werden, denn was ab diesem Zeitpunkt geschah, wissen wir alle. Von Google über Amazon, Microsoft, Facebook und DeepL, alle großen und viele kleinere Unternehmen setzen auf künstliche Intelligenz und neuronale maschinelle Übersetzung. Die Branche ist im Wandel und die Übersetzer können mit der richtigen Vorbereitung von diesen Veränderungen optimal profitieren.

Tipp 1: Maschinelle Übersetzung und CAT-Tool im Doppelpack nutzen

Als maschinelle Übersetzung noch hauptsächlich über statistische Systeme angeboten wurde, hatten Übersetzer noch nicht die Möglichkeit, ein qualitativ hochwertiges System an Ihr CAT-Tool anzubinden. Ein personalisiertes System zu konfigurieren kam für die meisten Übersetzer nicht infrage, da dies sehr kostspielig und zeitintensiv ist.

Heutzutage haben Sie mit neuronaler maschineller Übersetzung die Möglichkeit, für einen überschaubaren Beitrag Ihr CAT-Tool an sehr gute und sichere Systeme anzubinden. Mit diesen können Sie Ihre Übersetzungsaufträge mit Einwilligung Ihrer Auftraggeber bearbeiten und Sie erzeugen in viel kürzerer Zeit einen größeren Übersetzungsoutput.

Gleichzeitig können Sie sich optimal auf zukünftige Post-Editing-Aufträge vorbereiten, denn erfolgreich zu post-editieren ist anfänglich schwierig und erfordert Übung. Um produktiv zu arbeiten, müssen Sie zwei bis drei Mal schneller sein als beim Übersetzen. Gemäß KantanMT liegt der tägliche Output also bei ca. 7.000 Wörtern. Um diese Geschwindigkeit zu erreichen ist zu empfehlen, Post-Editing eine Zeit lang zu üben, bevor man den Service als Spezialist anbietet. Wenn Sie also ein maschinelles Übersetzungssystem an Ihre Across Translator Edition oder ein anderes CAT-Tool anbinden, können Sie während der Abwicklung Ihrer Aufträge das Post-Editieren nebenbei erlernen und üben.

Tipp 2: Offen mit dem Thema Post-Editing umgehen

Unternehmen setzen maschinelle Übersetzung ein, um die Übersetzungskosten zu senken und die Durchlaufzeiten zu beschleunigen. Aber man darf auch nicht vergessen, dass es immer mehr Content gibt, der sonst nicht zu bewältigen wäre.

Oft müssen fremdsprachliche Texte nur grob verstanden werden, weswegen sie maschinell übersetzt werden können. Zum Beispiel, wenn ein deutscher Projektmanager eine Mail eines französischen Kollegen bekommt und diese verstehen möchte. Dann ist es zweitrangig, wenn die Satzstruktur nicht ganz korrekt ist oder wenn grammatikalische Fehler auftauchen. Wenn aber ein maschinell übersetzter Text veröffentlicht werden soll, kommen Sie mit Ihrem Fachwissen ins Spiel. Ihr Auftraggeber wird Ihnen dankbar sein, wenn Sie ihn im Bereich Post-Editing beraten können. Informieren Sie ihn gezielt über den realistischen Arbeitsaufwand und geben Sie ihm bei den Projekten ein ehrliches Feedback, denn Post-Editing ist auch für viele Auftraggeber Neuland. Da Post-Editing eine noch relativ neue Dienstleistung ist, gibt es noch nicht viele Experten, die sich auf dem Markt positioniert haben. Sie haben somit eine gute Möglichkeit, neue Kunden und Projekte zu gewinnen.

Ein wichtiger Faktor für eine gelungene Zusammenarbeit mit Ihrem Auftraggeber ist eine offene und ehrliche Kommunikation: Eine wichtige Frage, die vor Projektbeginn abgeklärt werden sollte, ist die Festlegung der Endqualität einer Übersetzung.

Da Post-Editing eine noch relativ neue Dienstleistung ist, gibt es noch nicht viele Experten, die sich auf dem Markt positioniert haben.

Denken Sie daran, dass Sie die Kontrolle über Ihre Aufträge haben und entscheiden können, welche Sie annehmen. Sie sind der Fachkundige und verfügen über das nötige Wissen, um zu beurteilen, ob sich ein Projekt für Sie rentiert oder nicht. Wenn der Output schlecht ist, werden Sie nicht die erforderliche Editiergeschwindigkeit erreichen können. Sie sollten deswegen im Vorfeld wissen, welche Textsorten sich für maschinelle Übersetzung eignen und welche nicht. Kurze, standarisierte Sätze können von den Systemen gut übersetzt werden. Deswegen eignen sich technische Texte besonders gut für MÜ. Andererseits wird kreativer Inhalt von den Systemen nicht gut erfasst.

Wenn die Texte also stilistisch ansprechend sind, wie es in der Regel bei Marketingtexten oder literarischen Texten der Fall ist, ist der Einsatz von maschineller Übersetzung nicht zu empfehlen. Geben Sie Ihrem Auftraggeber Feedback, wenn Sie ein Projekt aufgrund niedriger Qualität nicht annehmen. Anhand dieses Feedbacks kann er seine Prozesse eventuell anpassen oder zusätzliche Schritte einführen, damit die Qualität der maschinellen Übersetzung besser wird und Sie sich bei zukünftigen Projekten beteiligen können. Wenn die Auftraggeber und die Übersetzer gut zusammenspielen, können beide Seiten davon profitieren.

Tipp 3: Maschinelle Übersetzung verstehen

Wie bereits erwähnt, können Sie sich als Post-Editing-Experte positionieren, indem Sie bestmöglich über maschinelle Übersetzung informiert sind. Sie sollten wissen, wie die verschiedenen Systeme funktionieren und wie Unternehmen die Texte im Vorfeld für die maschinelle Übersetzung vorbereiten können.

Aktuell wird vermehrt neuronale maschinelle Übersetzung eingesetzt, aber dennoch ist es sinnvoll, sich mit den Grundprinzipien von regelbasierten und statistischen Systemen auszukennen.

Regelbasierte maschinelle Übersetzung

Der regelbasierte Ansatz ist die klassische Methode der MÜ. Es ist sehr kostspielig und zeitintensiv, ein System regelbasiert zu entwickeln, da jede sprachliche Eigenschaft manuell erfasst werden muss. Daher kommt dieser Ansatz heutzutage immer seltener zum Einsatz. Dennoch soll erwähnt sein, dass regelbasierte maschinelle Übersetzung gute terminologische Vorschläge liefert, da das System speziell mit der Unternehmensterminologie trainiert wird. Außerdem sind die Übersetzungen immer vollständig und die Ergebnisse sind berechenbar. Der große Nachteil ist, dass die Übersetzungen sehr mechanisch sind und die Satzstellung nicht gut dargestellt wird.

Statistische maschinelle Übersetzung

Statistische maschinelle Übersetzung basiert auf dem Ansatz, Übersetzungen anhand der Berechnung von Wahrscheinlichkeiten zu erstellen. Die dafür notwendige Information wird aus zweisprachigen Korpora extrahiert. Da die Satzstrukturen und die Terminologie in jedem Korpus unterschiedlich sind, spiegelt sich das als mangelnde Konsistenz im Output wider, wodurch der Lesefluss beeinträchtigt werden kann. Das System kann auch unvollständige Übersetzungen produzieren oder Informationen fälschlich hinzufügen. Außerdem produziert das System Fehler bei der Groß- und Rechtschreibung.

Neuronale maschinelle Übersetzung

Die neuronale maschinelle Übersetzung basiert auf einem künstlichen neuronalen Netz (KNN), das die neuronalen Verbindungen im Gehirn nachahmt. Für die Übersetzung werden auch parallele Korpora analysiert. Der Unterschied dabei ist, dass im KNN die grammatikalischen Zusammenhänge der Sätze implizit miteinbezogen werden. Die Texte werden also nicht auf Phrasen-, sondern auf Satzebene übersetzt, was die Lesbarkeit stark verbessert. Die bisher größte Herausforderung der neuronalen maschinellen Übersetzung ist der noch limitierte Wortschatz, der in den Modellen verarbeitet werden kann (derzeit sind es zwischen 50.000 und 80.000 Wörter). Beim Post-Editieren sollte also mehr auf die Lexik als auf die Grammatik geachtet werden. Die Nachteile des Systems sind die gleichen wie die der statistischen maschinellen Übersetzung. Mit NMÜ erzeugte Übersetzungen lesen sich jedoch ausgesprochen flüssig und das kann problematisch sein, denn Fehler werden schneller übersehen. Dennoch liefert neuronale maschinelle Übersetzung zurzeit die besten Ergebnisse, weswegen sich der Aufwand, den Text auf lexikalischer Ebene stärker zu kontrollieren, in den meisten Fällen lohnt.

Extra Tipp

Die Qualität der maschinellen Übersetzung kann mit der Durchführung eines Pre-Editings verbessert werden. Pre-Editing ist die Bearbeitung des Quelltextes, bevor dieser maschinell übersetzt wird. Der Pre-Editor korrigiert Fehler, behebt Mehrdeutigkeiten und vereinfacht die Satzstruktur. Außerdem passt er den Text an den Redaktionsleitfaden des Unternehmens an und benutzt eine kontrollierte Sprache. Der Text wird auch so bearbeitet, dass er keine Abkürzungen, Grafiken oder Tags enthält, da die maschinellen Übersetzungssysteme diese nicht korrekt verarbeiten können.

Die Qualität der maschinellen Übersetzung kann mit der Durchführung eines Pre-Editings verbessert werden.

Tipp 4: Zwischen Light- und Full- Post-Editing unterscheiden

Post-Editing-Richtlinien sollten nicht pauschal aufgestellt werden, da die Qualitätsanforderungen an Light-Post-Editing und Full-Post-Editing unterschiedlich ausfallen. Mit einem Light-Post-Editing werden nur die gröbsten Fehler korrigiert, mit einem Full-Post-Editing wird der Text angepasst, bis er nicht mehr von einer humanen Übersetzung zu unterscheiden ist. Der Auftraggeber teilt dem Übersetzer vor Projektstart mit, welche Art von Post-Editing gewünscht ist, und er kann dementsprechend in Kombination mit der Output-Qualität den Arbeitsaufwand einschätzen.

Wenn die Output-Qualität hoch ist, kann ein Light-Post-Editing ausreichen, um die Qualität einer Humanübersetzung zu erreichen.

Ob für eine maschinelle Übersetzung ein Light- oder Full-Post-Editing benötigt wird, hängt von zwei Faktoren ab: die Qualität der Rohübersetzung und die benötigte Endqualität des Textes. Wenn die Output-Qualität hoch ist, kann mitunter ein Light-Post-Editing ausreichen, um die Qualität einer Humanübersetzung zu erreichen.

Zur Durchführung eines Light- oder Full-Post-Editing empfiehlt TAUS die folgenden Richtlinien:

Light-Post-Editing

  • Wenn notwendig, Informationen löschen oder ergänzen.
  • Semantische Fehler in der Übersetzung korrigieren.
  • Rohübersetzung so oft wie möglich übernehmen.
  • Rechtschreibfehler korrigieren.
  • Anstößige und unpassende Inhalte überarbeiten.
  • Satzstruktur nur dann ändern, wenn sie das Satzverständnis beeinträchtigt.
  • Keine stilistischen Anpassungen vornehmen.

Full-Post-Editing

  • Wenn notwendig, Informationen löschen oder ergänzen.
  • Anstößige und unpassende Inhalte überarbeiten.
  • Sätze grammatikalisch, syntaktisch und semantisch anpassen.
  • Firmenterminologie verwenden.
  • Rohübersetzung so oft wie möglich übernehmen.
  • Fehler in der Rechtschreibung, bei Satzzeichen und Silbentrennung korrigieren.
  • Formatierung an die des Quelltextes anpassen.

Tipp 5: Post-Editing ins Portfolio aufnehmen

Viele Übersetzer fragen sich, ob mit Post-Editing genauso viel verdient werden kann wie mit traditioneller Übersetzung. Wie bei Übersetzungsaufträgen können Sie anhand Ihres Outputs und gewünschten Einkommens Ihren Wortpreis berechnen. Beim Post-Editing geht man durchschnittlich von 50 – 60 % des Übersetzungswortpreises aus. Dies ist natürlich stark von der Art des Post-Editings und der zu erzielenden Textqualität abhängig. Mit der Zeit werden Sie beim Post-Editieren immer schneller und können somit höhere Stundenlöhne erzielen.

Hilfreiche Tipps, um schneller zu werden, hat zum Beispiel Sara Grizzo parat. Sie ist freiberufliche Übersetzerin und Post-Editorin und bietet Workshops und Vorträge zum Thema Post-Editieren an. Lesenswert ist dazu auch ihr Artikel in der Zeitschrift ‚technische kommunikation‘, Ausgabe 03/2018.

  • Überfliegen Sie den Text zuerst, um wiederholte Fehler ausfindig zu machen.
  • Korrigieren Sie wiederholte Fehler, indem Sie die Funktion „Suchen und Ersetzen“ Ihres CAT-Tools benutzen.
  • Benutzen Sie die automatische Qualitätssicherung Ihres CAT-Tools, um häufige Fehler zu finden: Großschreibung, Rechtschreibung, Zeichensetzung etc.
  • Setzen Sie Ihre Tastatur statt Ihrer Maus ein, denn Sie können mit den Pfeiltasten und diversen Tastenkombinationen schneller arbeiten.
  • Beim Post-Editing ist der Entscheidungsprozess sehr kurz. Da der maschinelle Output so oft wie möglich verwendet werden soll, muss sich der Post-Editor dazu überwinden, bei einem Light-Post-Editing Grammatik- oder Stilfehler nicht immer zu korrigieren.

Wortpreis ermitteln

Gewünschtes monatliches Einkommen/monatliche Arbeitstage/tägliche Arbeitsstunden/stündlicher Output

Tipp 6: Post-Editing-Experte werden

Um sich intensiv auf das Post-Editing vorzubereiten, sind Weiterbildungen und Trainings zu empfehlen. Zum Beispiel bietet TAUS einen sechsstündigen Onlinekurs an und auch über den BDÜ finden regelmäßig Seminare zum Thema maschinelle Übersetzung und Post-Editing statt.

 

Sind Sie der Auftraggeber?

Unternehmen, die maschinelle Übersetzung einsetzen möchten, haben andere Herausforderungen als Übersetzer. Im zweiten Teil unseres Artikels gehen wir auf die Chancen und Herausforderungen maschineller Übersetzung für die Unternehmen ein.