Across White Paper

Das Prinzip von Translation-Management-Systemen

Computergestützte Übersetzungen mit Hilfe von Translation-Memory-Technologie bringen zahlreiche Vorteile mit sich. Dennoch sind viele Unternehmen bisher noch gar nicht oder nur teilweise mit solchen Systemen in Berührung gekommen, weshalb die Funktionen und tatsächlichen Einsparpotenziale oft noch unbekannt sind. In diesem White Paper werden die grundlegenden Funktionalitäten und Arbeitsweisen sowie die zentralen Module eines Translation-Management-Systems erläutert.

Sehr häufig werden heutzutage maschinelle Übersetzungssysteme (MÜ-Systeme) und Translation-Management-Systeme miteinander verwechselt oder gleichgesetzt. Grundsätzlich können die Funktionsweisen beider Technologien über Schnittstellen miteinander verbunden werden, das zugrundeliegende Prinzip aber unterscheidet sich erheblich.

Ein maschinelles Übersetzungssystem muss zunächst mit Daten für vordefinierte Sprachpaare vorbefüllt werden, um es überhaupt einsetzen zu können. Auf welche Art und Weise dies geschieht, hängt von dem zugrundeliegenden Prinzip des MÜ- Systems ab. Die tatsächlichen Übersetzungen werden dann automatisch und ohne menschliches Eingreifen durchgeführt. Das Ergebnis wiederum kann durch einen Lektor oder Übersetzer post-editiert werden. Die Änderungen fließen allerdings nicht direkt in das System ein, sondern werden – wenn überhaupt – erst zeitverzögert gespeichert. Das bedeutet, dass der Lernprozess eines MÜ-Systems nur punktuell und nicht zeitgleich erfolgt.

Ein Übersetzungssystem mit Translation-Memory-Technologie ist für jede beliebige Sprachkombination direkt einsetzbar. Mit jeder Übersetzung, die mit Hilfe des Systems durchgeführt wird, erweitert sich der Datenspeicher des Systems. Der Lerneffekt erfolgt also bei Translation-Management-Systemen zeitgleich mit der Übersetzung, da jeder neue Satz direkt während der Übersetzung zusammen mit der zielsprachigen Entsprechung abgespeichert wird. So kann ein Übersetzer im Idealfall direkt beim darauffolgenden Satz von seiner vorherigen Übersetzung profitieren. Translation-Management-Systeme sollen also möglichst effektiv und unterstützend eingesetzt werden, das heißt, dass sie den Nutzern bereits vorhandene Übersetzungen anzeigen, aber nicht selbständig auf Basis eines Textkorpus Übersetzungen produzieren. So wird die eigentliche Übersetzung immer noch vom Übersetzer selbst durchgeführt und ist dadurch natürlich qualitativ hochwertiger.

Die grundlegende Arbeitsweise eines Translation-Management-Systems

Damit die Daten in einem Translation-Management-System sinnvoll angezeigt und wiederverwendet werden können, müssen die Systeme selbst über bestimmte Grundfunktionalitäten verfügen. Zunächst wird ein zu übersetzender Text importiert. Dies erfolgt anhand einer einfachen Projektanlage, in der unter anderem das Originaldateiformat und die Sprachrichtung(en) festgelegt werden. Beim Import wird der bearbeitbare Text aus dem Dokument extrahiert, um ihn anschließend im internen Editor übersetzen zu können. Für eine sinnvolle Bearbeitung wird der Text automatisch zunächst in Segmente unterteilt, die anhand von sogenannten Segmentende-Begrenzern identifiziert werden. Das klingt komplizierter als es ist. In den meisten Fällen kann ein Segment mit einem Satz gleichgesetzt werden, der anhand des Zeichens am Satzende erkannt wurde (z. B. Punkt, Ausrufezeichen oder Fragezeichen). Um ebenfalls Elemente, wie Überschriften, Aufzählungspunkte oder Text in Tabellen in sinnvolle Einheiten zu gliedern, wird ein harter Zeilenumbruch ( ) auch als Segmentende definiert.

Diese Segmentierung des Textes bildet die Basis für die sinnvolle Speicherung des Segments in der Ausgangssprache und der Zielsprache als sogenannte Übersetzungseinheit (ÜE). Diese besteht immer aus einem Sprachpaar (Ausgangssprache und Zielsprache) und wird im Translation Memory gespeichert, um bei Bedarf wiederverwendet zu werden. Ein vorhandenes Translation Memory mit Übersetzungen wird beim Anlegen eines neuen Übersetzungsprojekts automatisch als Basis für eine Projektanalyse herangezogen. Das bedeutet, dass vor Beginn einer jeden Übersetzung der Projektmanager oder Übersetzer direkt sehen kann, ob Teile des neuen Textes bereits in einer früheren Übersetzung in identischer oder ähnlicher Weise übersetzt wurden. Die Übersetzungseinheiten im Translation Memory bilden bei jeder neuen Übersetzung die Basis für eventuelle Zeit- und Kostenersparnis durch bereits vorhandene Übersetzungen. Eine automatische Analyse gibt Aufschluss darüber, wie viel Text tatsächlich noch zu übersetzen ist und erleichtert somit die Zeit- und Kostenplanung. Arbeiten Auftraggeber und Übersetzer auf Basis eines Translation-Management-Systems zusammen, ändert sich in der Regel auch die Abrechnungsweise. Die Zeilen- bzw. Wortpreise werden nach Match-Kategorien gestaffelt.

Match Kategorien

Die normalen Match-Kategorien einer Analyse teilen sich wie folgt auf:

Kein Match

Segmente in dieser Kategorie sind bisher noch nicht übersetzt worden oder haben keine Mindest- übereinstimmung mit einem bereits gespeicherten Segment. Die Mindestübereinstimmungsquote liegt in der Regel zwischen 50-75% und ist individuell einstellbar.

Fuzzy Match

Ein Fuzzy Match kennzeichnet sich dadurch, dass das neu zu übersetzende Segment eine gewisse Ähnlichkeit zu einem bereits übersetzten Segment aufweist. Diese Übereinstimmung kann selbst festgelegt werden und liegt normalerweise im Bereich von 75-99%.

100%-Matches

Fällt ein Segment in die Kategorie 100%-Matches, dann wurde es in identischer Weise (inklusive Formatierung) schon einmal in einem anderen Text übersetzt und kann in der Regel direkt übernommen werden.

Wiederholungen

Wiederholungen sind identische Segmente, die im selben Text mindestens zweimal vorkommen. Wird ein solches Segment zum ersten Mal übersetzt, ist es beim nächsten Vorkommen automatisch ein 100%-Match.

Kontext-Match

Kontext-Matches sind ebenfalls 100%-Matches, die sich zusätzlich dadurch auszeichnen, dass nicht nur das Segment selbst, sondern auch die Segmente davor und danach in der vorherigen Übersetzung identisch waren. Damit sind diese 100%-Matches noch zuverlässiger als die reinen 100%-Matches, da letztere sozusagen kontextlos im Translation Memory gespeichert sind.

Während der Übersetzer für einen neu zu übersetzenden Text natürlich nach wie vor den vollen Zeilen- oder Wortpreis erhält, werden Fuzzy Matches meist nur noch mit rund dem halben Preis und 100%-Matches beziehungsweise Wiederholungen mit rund einem Viertel des Originalpreises vergütet. Für Kontext-Matches gibt es oft gar keine Bezahlung mehr. Das sind allerdings reine Orientierungswerte, die im konkreten Fall zwischen Auftraggeber und Übersetzer verhandelt werden müssen. Auf jeden Fall ist somit vor Beginn einer Übersetzung für beide Seiten (Auftraggeber und Übersetzer) klar, welche Kosten bei einer Übersetzung entstehen. 

Die zentralen Module eines Translation-Management-Systems

Jedes Translation-Management-System hat heutzutage dieselben Kernmodule, die man für eine sinnvolle und effektive Arbeit mit einer computergestützten Übersetzungsumgebung benötigt. Der Funktionsumfang kann natürlich je nach Hersteller variieren.

Translation Memory

Im Übersetzungsspeicher, dem sogenannten Translation Memory, werden alle Übersetzungseinheiten gespeichert, die in einem bestimmten Sprachpaar erstellt werden. Der Vorteil hier ist, dass diese Einheiten automatisch während der Übersetzung – ohne zusätzlichen Zeitaufwand – in das Translation Memory überführt werden. Der Übersetzer kann also im Idealfall direkt von seiner zuvor abgeschlossenen Übersetzung profitieren. An dieser Stelle soll darauf hingewiesen werden, dass die Einheiten im Translation Memory als Segmente (meist Sätze) abgespeichert werden und der Abgleich mit einem neuen Text immer auf Segmentbasis erfolgt, das heißt, es wird keine Ähnlichkeit auf Basis von Wörtern, sondern von Segmenten durchgeführt. Dieses Prinzip ist einer der Hauptunterschiede zur Terminologiedatenbank.

Terminologiedatenbank

Die Terminologiedatenbank ist die „Wörterbuch“-Komponente in einer Übersetzungsumgebung. Auch diese Datenbank wird durch den Benutzer selbst gefüllt. Im Gegensatz zum Translation Memory werden die Daten hier nicht automatisch gespeichert, da das System ohne sprachliche Intelligenz oder linguistische Unterstützung keine Terme aus Sätzen selbst auswählen und die entsprechende Übersetzung zuordnen kann. Für eine hohe Qualität der Datenbank wird also immer das Wissen des Terminologieverantwortlichen einbezogen. Es ist aber problemlos möglich, die Terminologiedatenbanken zunächst mit vorhandenen Glossaren zu befüllen. So können Excel-Dateien zum Beispiel mit einem geringen Zeitaufwand komplett importiert und direkt für eine Übersetzung verwendet werden. Ansonsten ist das Anlegen von neuen Terminologieeinträgen eine manuelle Arbeit, die durch einen Benutzer angestoßen werden muss. Im Gegensatz zu einem kommerziellen Wörterbuch versucht man in einer Terminologiedatenbank nur Fachwörter beziehungsweise Firmenterminologie aufzunehmen, deren konsistente Verwendung zum Verständnis von Texten wichtig ist. Allgemeine Wörter sind einem Übersetzer in der Regel bekannt und müssen daher nicht aufgenommen werden. Zu viele Informationen führen ansonsten dazu, dass die Liste der angezeigten Terme zu unübersichtlich wird und der Übersetzer unnötig viel Zeit benötigt, um die für ihn relevanten Ergebnisse zu finden.

Projektmanagement

Eine Projektmanagement-Komponente ist in den verschiedenen Systemen mehr oder weniger umfangreich integriert. Allen gemein ist das Anlegen eines Übersetzungsprojekts zu Beginn einer Übersetzung. In diesem Schritt werden die Rahmenbedingungen für die Übersetzung festgelegt, wie Sprachkombination(en), Lieferdatum, Auswahl projektspezifischer Einstellungen anhand von Vorlagen und vieles mehr. Einige Systeme integrieren ebenfalls eine Benutzerverwaltung im System selbst und können daher über das Projektmanagement auch direkt die verschiedenen Aufgaben zuweisen, wie z. B. Übersetzung, Terminologiearbeit oder die eventuelle Prüfung eines Textes. Der Projektmanager hat über eine eigene Ansicht somit jederzeit den Überblick darüber, welche Projekte gerade aktiv sind, wann sie abgegeben werden müssen und wie der Fortschritt der einzelnen Beteiligten ist.

Übersetzungseditor

Heutzutage bieten Translation-Management-Systeme zur Erstellung von Übersetzungen fast ausschließlich einen integrierten Editor an. Der Übersetzer arbeitet in einer formatunabhängigen Umgebung, das heißt, er kann alle vom System unterstützten Dateiformate übersetzen, ohne das Format oder das System selbst zu kennen und bedienen zu können. Für die Übersetzung von InDesign-Dokumenten beispielsweise musste der Übersetzer bisher eine kostenpflichtige Version des Programms erwerben, um überhaupt einen solchen Auftrag annehmen zu können. Mit dem Einsatz von TranslationManagement-Systemen ist der Übersetzer heute unabhängiger und erweitert automatisch sein Angebotsportfolio. Der Auftraggeber hingegen kann den Übersetzer wieder verstärkt nach seinem Fachgebiet und seiner Sprachkompetenz auswählen und ist dadurch nicht mehr so sehr an technische Vorgaben gebunden. Auch der Umweg über Microsoft Word und das aufwändige Einfügen von Textpassagen in das Originalformat wird durch das Arbeiten mit Translation-Management-Systemen überflüssig und spart nicht nur Zeit und Kosten, sondern verhindert auch Fehler, die zwangsläufig beim Kopieren und Einfügen von fremdsprachigen Texten passieren. Zu guter Letzt muss sich der Übersetzer während der Übersetzung nicht mit unbekannten Formatierungsproblemen auseinandersetzen, da nur der zu übersetzende Text extrahiert wird und lediglich interne Formatierungen wie beispielsweise Fettdruck während der Übersetzung angezeigt werden. Externe Formate wie Tabellen, Überschriften oder ähnliches bleiben während der Übersetzung im Hintergrund verborgen und werden erst am Ende wieder auf den Zieltext übertragen.

Alignment

Anhand des Alignments kann das Translation Memory zusätzlich mit Übersetzungseinheiten aus bereits vorhandenen Übersetzungen befüllt werden. Liegen also frühere Übersetzungen in elektronischer Form vor, die nicht mit einem Translation-Management-System erstellt wurden, können die Texte in einzelne Sätze segmentiert werden, die dann automatisch durch das Alignment zu ausgangs- und zielsprachigen Paaren zusammengeführt werden. Das Ergebnis wird anschließend direkt im Translation Memory gespeichert. Das Alignment wird gerne zu Beginn durchgeführt, um noch vor der ersten Übersetzung Daten in das leere System zu importieren.

Qualitätssicherung

Zur Unterstützung aller Projektbeteiligten stellen alle Translation-Management-Systeme inzwischen umfangreiche Qualitätssicherungskriterien zur Verfügung, die automatisch während oder nach der Übersetzung abgeprüft werden können. Hierbei handelt es sich um rein formale Kriterien, wie zum Beispiel die Überprüfung von korrekt verwendeter InlineFormatierung, wie kursiv oder unterstrichen, oder die Übernahme von Zahlen und deren Anpassung an die zielsprachlichen Konventionen. Aber auch die konsistente Verwendung von Terminologie aus der Terminologiedatenbank kann ein zu überprüfender Punkt sein.

Arbeiten mit Translation-Management-System Arbeiten ohne Translation-Management-System
Zeit- und Kostenersparnis: Identische Sätze müssen nicht mehr doppelt übersetzt werden. Die anfallenden Übersetzungskosten lassen sich vorab besser planen. Identische Sätze müssen jedes Mal übersetzt werden.
Konsistente Übersetzung: Identische Sätze werden immer gleich übersetzt. Da der Übersetzer ohne Translation-Management-System nicht den Überblick darüber behalten kann, ob ein Satz schon einmal in identischer Form vorkam, wird er diesen zwangsläufig leicht anders übersetzen – vor allem wenn mehrere Übersetzer an einem Projekt arbeiten.
Konsistente Terminologieverwendung: Da Terme während der Übersetzung automatisch erkannt und angezeigt werden, können diese immer konsistent – gemäß der Corporate Language – verwendet werden. Ohne Terminologiedatenbank ist der Übersetzer darauf angewiesen, manuell in seinen Glossaren nachzuschlagen.
Bearbeitung von unterschiedlichen Dateiformaten: Der einheitliche Übersetzungseditor lässt jeden Übersetzer problemlos einbinden, unabhängig davon, welchen Kenntnisstand er in dem entsprechenden Programm hat. Der Übersetzer muss nach seiner technischen „Ausrüstung“ ausgewählt werden. Die Kenntnisse in den verschiedensten Programmen sind einem Übersetzer aber oft nicht zumutbar.
Alle Aufgaben auf einen Blick: Die Aufgaben- und Projekteübersicht im selben System spart Zeit und Kosten. Der Projektmanager sieht direkt, welche Projekte fällig sind oder welchen Fortschritt sie haben. Unabhängige Projektmanagement-Software bietet nur den Projektüberblick, aber nicht die Verknüpfung mit der tatsächlichen Übersetzung.
Qualitätsprüfung: Automatische Prüfung benutzerdefinierter Kriterien, die die Projektbeteiligten bei ihrer Arbeit unterstützen. Bis auf die klassische Rechtschreibprüfung müssen alle Überprüfungen manuell durchgeführt werden. Ein Terminologieabgleich mit einem bestehenden Glossar ist beispielsweise sehr zeitaufwändig.

Zentrale Module eines TMS

  • Translation Memory
  • Terminologiedatenbank
  • Projektmanagement
  • Übersetzungseditor
  • Alignment
  • Qualitätssicherung

Individuelle Beratung

info@across.net

+49 (0) 7248 925 425

Nächste White Paper

Reklamationsmanagement in Übersetzungsprozessen

Weiterlesen

Übersetzungsprojekte effizient abwickeln

Weiterlesen

Einsparpotenziale in der Technischen Dokumentation

Weiterlesen

Terminologieworkflows: Auf dem Weg zu mehr Konsistenz

Weiterlesen

Informationssicherheit in Übersetzungsprozessen

Weiterlesen