Systemeinstellungen: DST > Tagged HTML

Durch die Erstellung einer Vorlage für HTML-Dokumente legen Sie fest, wie anhand von Elementen und Attributen Absätze im crossDesk erzeugt und dargestellt werden. Die Verwendung von Vorlagen empfiehlt sich insbesondere auch, um eine benutzerfreundliche Übersetzung von HTML-Dokumenten zu gewährleisten und um das volle Potential der Übersetzung von HTML-Dokumenten in Across auszuschöpfen.

Die HTML-Vorlagen sind standardmäßig mit allen gängigen HTML-Elementen und Attributen befüllt.

In Across ist bereits die Tagged HTML-Standardvorlage QuarkXPress Tagged Text enthalten für die Übersetzung von QuarkXPress-Dateien im TAG- oder XTG-Format mit crossTransform.

Um zu verhindern, dass die Vorlage durch falsche Anpassungen o. Ä. beschädigt oder in Ihrer Funktion eingeschränkt wird, ist diese schreibgeschützt und kann daher nicht angepasst werden. Möchten Sie die Vorlage dennoch bearbeiten, so können Sie diese über die entsprechenden Buttons zunächst exportieren und anschließend wieder importieren. Diese reimportierte Vorlage ist nicht mehr schreibgeschützt und kann entsprechend bearbeitet werden.

Die Registerkarte Allgemein

In der Registerkarte Allgemein legen Sie fest, welchem Inhaltstyp das Element entspricht.

  • Sie können hierbei wählen zwischen:
  • Normal: Normale Elemente
  • CDATA: Abschnitte in XML-Dokumenten, die vom Parser nicht als XML-Quellcode interpretiert werden. CDATA-Abschnitte werden häufig für Textabschnitte verwendet, die viele Sonderzeichen (<, >, ", ') enthalten.
  • EMPTY: Elemente mit leerem Inhalt (Zeilenumbrüche, Bilder etc.)

Weisen Sie den Elementtyp zu. Dieser kann intern oder extern sein.

Extern vs. Inline

Externe Elemente stehen außerhalb des Fließtextes und befinden sich entsprechend nie innerhalb einer Textzeile. Sie ziehen in der Regel einen Zeilenumbruch nach sich. Inline-Elemente hingegen stehen innerhalb des Fließtextes und bewirken beispielsweise, dass ein bestimmtes Wort innerhalb eines Strings in Fettdruck dargestellt wird. Elemente bestehen in der Regel immer aus einem Anfangs-Tag (also z. B. <i>) und einem End-Tag (also z. B. </i>).

Nachfolgend sehen Sie ein Beispiel für einen String mit einem externen Element <p> (p steht für engl. paragraph, Absatz) sowie mit einem Inline-Element <b>, bei dem das Wort "fette" fett gedruckt wird (b steht für engl. bold, fett):

<p>Das ist eine <b>fette</b> Schrift.</p>

Die Tags <p> und </p> stehen außerhalb des Fließtextes und markieren den Anfang und das Ende des Strings bzw. des Absatzes. Die Tags <b> und </b> stehen hingegen innerhalb des Fließtextes und markieren den Beginn und das Ende des fettgedruckten Textes (im vorliegenden Beispiel von fette).

Zusätzlich können Sie wählen, wie das entsprechende Element im crossDesk dargestellt wird.

Attention

Bitte beachten Sie, dass die Einstellungen zur Verarbeitung eines Elements auch für alle untergeordneten Elemente des Elements (Kindelemente) gelten. Haben Sie z. B. für ein übergeordnetes Element (Elternelement) gewählt, dass es im crossDesk gesperrt dargestellt werden soll, so werden auch alle dazugehörigen Kindelemente gesperrt dargestellt.

Um Kindelemente anders als das Elternelement zu verarbeiten, können Sie Bedingtes XML verwenden. Wählen Sie hierzu in den Eigenschaften des Elternelements die Option Bedingt aus, klicken Sie auf Einstellungen und auf Hinzufügen. Legen Sie die gewünschte Verarbeitungsweise (z. B. Gesperrt) fest und bestätigen Sie mit OK. Wählen Sie anschließend das Kindelement aus, das anders als das Elternelement verarbeitet werden soll, wählen Sie ebenfalls Bedingt aus und klicken Sie auf Einstellungen und auf Hinzufügen. Wählen Sie die gewünschte Verarbeitungsweise (z. B. Normal) und bestätigen Sie mit OK. Im vorliegenden Beispiel wird das Elternelement gesperrt im crossDesk dargestellt, das Kindelement kann hingegen normal bearbeitet bzw. übersetzt werden.

Interne Elemente als Leerzeichen behandeln

Interne Elemente, die zwischen den Segmenten (bzw. Sätzen) eines Absatzes stehen, können durch Aktivierung der entsprechenden Option als Leerzeichen behandelt werden. Dadurch ist es möglich, dass Across diese Elemente als Segment- bzw. Satzgrenzen erkennt. Im Normalfall erkennt Across interne Elemente nicht als Segmentgrenzen.

Das folgende Beispiel erläutert die Funktionsweise der Option:

Wir gehen beispielhaft von einer HTML-Datei aus, die den folgenden String enthält:

<p>Satz A.<br>Satz B.</p>

Bei aktivierter Option wird <br> als Leerzeichen interpretiert. Across erkennt folglich eine Satzgrenze zwischen „Satz A.“ und „Satz B.“ und unterteilt den String entsprechend in zwei Segmente bzw. Sätze.

Bei deaktivierter Option wird <br> nicht als Leerzeichen behandelt. Across erkennt daher keine Satzgrenze zwischen „Satz A.“ und „Satz B.“, da interne Tags nicht als Satzgrenzen gewertet werden. Die beiden Sätze werden folglich als ein Segment behandelt.

Externe Elemente

Bei externen Elementen können Sie durch Aktivierung der entsprechenden Option reguläre Ausdrücke verwenden. Bei einer Übereinstimmung des externen Elements mit dem regulären Ausdruck, wird das Element entsprechend im crossDesk dargestellt. Liegt keine Übereinstimmung vor, wird das Element „Normal“ dargestellt. Sie können einen regulären Ausdruck aus der Dropdown-Liste auswählen – zum Beispiel den regulären Ausdruck für E-Mail-Adressen – und auf Einfügen klicken. Alternativ geben Sie den gewünschten regulären Ausdruck manuell in das entsprechende Eingabefeld ein.

Bedingtes ML

Durch die Wahl von Bedingt können Sie über den Button Einstellungen Bedingungen definieren, die festlegen, welcher Text übersetzbar und welcher z. B. nicht für den Übersetzer sichtbar sein soll.

Anwendungsbeispiel Bedingtes ML

Das folgende Anwendungsbeispiel erläutert die Verwendung von Bedingtem ML:

Klicken Sie in den Eigenschaften eines Elements auf Einstellungen.

Klicken Sie auf Hinzufügen, um eine Bedingung hinzuzufügen.

Über Attribut hinzufügen können Sie ein Attribut mit einem bestimmten Wert hinzufügen. Zudem können Sie Parents und Children hinzufügen. Abschließend können Sie einen Wert für die Verarbeitung bzw. Darstellung der Bedingung wählen.

sysset_dst_tagged-xml_elementeigenschaften_bedingtes-element_wert_no

Das Ergebnis im crossDesk: Der Text „Do not translate“ wird für den Übersetzer ausgeblendet.

Eingebetteter Markup-Code

Es kommt relativ häufig vor, dass innerhalb von Dokumenten in einer Auszeichnungssprache Code-Abschnitte einer anderen Auszeichnungssprache eingebettet sind. So erzeugen beispielsweise Content-Management-Systeme zum Teil XML-Dokumente, die auch Abschnitte in HTML enthalten. Der entsprechende „Fremdcode“ kann dabei auf zwei unterschiedliche Weisen eingebettet werden: durch Auszeichnung des entsprechenden Codes als CDATA-Abschnitte (<![CDATA[ ... ]]>) oder durch Maskierung des Codes mit Hilfe von Zeichen-Entitäten (z. B. &lt; für <).

Um diese Formen von Misch-Code zu unterstützen, können Sie für die entsprechenden Elemente des eingebetteten Codes definieren, dass es sich hierbei um eingebetteten Code handelt. Dabei kann gewählt werden, in welcher Art der eingebettete Code maskiert ist: durch CDATA oder durch Zeichen-Entitäten.

Attention

Bitte beachten Sie, dass Tags stets nur in einem der beiden Code-Bereiche vorkommen dürfen. So darf der Tag <p> z. B. nur im XML-Code oder im Fremdcode (z. B. HTML) enthalten sein, nicht aber im XML-Code und im Fremd-Code.

Durch Aktivierung der entsprechenden Option können Sie definieren, welchem Strukturattribut das Element entspricht.

Strukturattribute enthalten Informationen darüber, in welchem Bereich eines Dokuments ein Element enthalten ist bzw. welchem Bereich eines Dokuments eine Übersetzung entstammt. Denn es kann für die Übersetzung eines Segments durchaus relevant sein, ob dieses Segment eine Kapitelüberschrift, ein Listenelement oder ein Button in einer Softwareoberfläche ist. Über die Auswahl eines Strukturattributs aus der Dropdown-Liste können Sie also festlegen, dass das aktuelle Element z. B. eine Überschrift darstellt.

Längenbeschränkte Elemente

Abschließend können Sie die maximale Länge der Elemente festlegen. In bestimmten Fällen kann es nötig sein, dass ein Element eine bestimmte Anzahl an Zeichen nicht überschreitet, z. B. um zu gewährleisten, dass die entsprechenden Inhalte korrekt dargestellt werden. Aktivieren Sie in diesem Fall die entsprechende Option und geben Sie die maximale Anzahl der Zeichen ein.

Bei der Übersetzung von externen Elemente mit Längenbeschränkung zeigt das icn_cDesk_te_laengenbeschraenkung-Icon in der Symbolleiste des Target Editor die Anzahl der noch verbleibenden Zeichen an. Eine Überschreitung der zulässigen Zeichenzahl ist während der Bearbeitung des Absatzes möglich. Eine Speicherung des Absatzes wird allerdings verhindert, da ansonsten u. U. ungültige Dokumente entstehen könnten. Ein Popup weist auf die Überschreitung der Längenbeschränkung hin.

Auch bei der Übersetzung von internen Elemente mit Längenbeschränkung ist während der Bearbeitung des Absatzes eine Überschreitung der zulässigen Zeichenzahl zunächst möglich. Doch auch in diesem Fall wird die Speicherung des Absatzes verhindert.

Die Längenbeschränkung von Elementen kann auch über Attribute (z. B. maxlength="5") umgesetzt sein. Sollten Ihre XML-Dateien Elemente mit solchen Attributen beinhalten, können Sie die Längenbeschränkung durch Aktivierung einer entsprechenden Option in der Registerkarte Attribute automatisch beim Einchecken des Dokuments berücksichtigen lassen.

Attention

Sollte für ein Element sowohl eine Längenbeschränkung über das Element als auch über das Attribut definiert sein, so hat die Längenbeschränkung über das Attribut Vorrang vor der Längenbeschränkung über das Element.

Weitere Informationen zur Längenbeschränkung über Attribute finden Sie in den Ausführungen zur Registerkarte Attribute im nachfolgenden Abschnitt.

Für crossTank-Treffer, die länger als die vorgegebene Zeichenzahl sind, wird ein Penalty in Höhe von 1% abgezogen.

Im Rahmen von Vorübersetzungen werden diese crossTank-Einträge, die zu lang sind und gegen Längenbeschränkungen verstoßen würden, nicht in das Zieldokument eingefügt. Die entsprechenden crossTank-Einträge werden in den Reports in der gesonderten Kategorie Match/nicht eingefügt (Absatzvalidierung fehlgeschlagen) ausgewiesen.

Für den Fall, dass es für ein zu übersetzendes Element mit Längenbeschränkung mehrere 100%-Matches gibt, können Sie zudem Bonuspunkte definieren.

Die Registerkarte Attribute

In der Registerkarte Attribute werden die Attribute des jeweiligen ML-Elements verwaltet. Hier können Sie zum einen über die entsprechenden Buttons neue Attribute hinzufügen, den Namen bestehender Attribute bearbeiten sowie bestehende Attribute entfernen. Zum anderen können Sie über die entsprechende Dropdown-Liste in der Spalte Modus definieren, wie das jeweilige Attribut in Across verarbeitet werden soll.

Sie können dabei eine der folgenden Optionen wählen:

Option
Beschreibung
Ignoriert
Das Attribut und der dazugehörige Attributwert werden schreibgeschützt und als Teil des jeweiligen Elements im crossDesk dargestellt.
Übersetzbar
Der Attributwert des Attributs kann bearbeitet werden (siehe unten).
Längenbeschränkung
Das Attribut ist längenbeschränkt (siehe unten).
Als Kommentar
Der Attributwert wird als schreibgeschützter Kommentar in der Source View des crossDesk angezeigt.
Als Absatzbezeichner
Der Attributwert wird in der crossView in crossDesk anstelle des gesamten Elementinhalts als Absatzbezeichnung verwendet.

Attribute mit Längenbeschränkung

Durch Auswahl von Längenbeschränkung legen Sie fest, dass das Attribut längenbeschränkt ist. Sowohl externe als auch interne ML-Elemente können Attribute mit Längenbeschränkungen enthalten (wie z. B. maxlength="5"). Diese Längenbeschränkungen geben an, wie viele Zeichen das jeweilige Element maximal enthalten darf. Sollten in Ihren zu bearbeitenden ML-Dokumenten Elemente mit solchen Längenbeschränkungen vorkommen, so wählen Sie hierfür die Option Längenbeschränkung aus. Im Rahmen des Eincheck-Vorgangs werden dadurch die enthaltenen Längenbeschränkungen ausgelesen und bei der Übersetzung im crossDesk berücksichtigt

Im Falle von externen Elementen zeigt das icn_cDesk_te_laengenbeschraenkung-Icon in der Symbolleiste des Target Editor die Anzahl der noch verbleibenden Zeichen an. Eine Überschreitung der zulässigen Zeichenzahl ist während der Bearbeitung des Absatzes zunächst möglich. Eine Speicherung des Absatzes wird allerdings verhindert, da ansonsten u. U. ungültige Dokumente entstehen könnten. Ein Popup weist auf die Überschreitung der Längenbeschränkung hin.

Auch im Falle von internen Elementen mit Längenbeschränkungen ist während der Bearbeitung des Absatzes eine Überschreitung der zulässigen Zeichenzahl zunächst möglich. Doch auch in diesem Fall wird die Speicherung des Absatzes verhindert.

Für crossTank-Treffer, die länger als die vorgegebene Zeichenzahl sind, wird ein Penalty in Höhe von 1% abgezogen.

Im Rahmen von Vorübersetzungen werden diese crossTank-Einträge, die zu lang sind und gegen Längenbeschränkungen verstoßen würden, nicht in das Zieldokument eingefügt. Die entsprechenden crossTank-Einträge werden in den Reports in der gesonderten Kategorie Match/nicht eingefügt (Absatzvalidierung fehlgeschlagen) ausgewiesen.

Für den Fall, dass es für ein zu übersetzendes Element mit Längenbeschränkung mehrere 100%-Matches gibt, können Sie zudem Bonuspunkte definieren.

Eine Längenbeschränkung von Elementen kann auch über die Element-Einstellungen umgesetzt werden.

Attention

Sollte für ein Element sowohl eine Längenbeschränkung über das Element als auch über das Attribut definiert sein, so hat die Längenbeschränkung über das Attribut Vorrang vor der Längenbeschränkung über das Element.

Tipp

Weitere Informationen zur Längenbeschränkung über die Element-Einstellungen finden Sie in den entsprechenden Ausführungen zur Registerkarte Allgemein im vorangehenden Abschnitt.

Die Registerkarte Formatierung

In der Registerkarte Formatierung legen Sie fest, ob der zu übersetzende Text eines Elements in einer bestimmten Formatierung im crossDesk dargestellt werden soll. Aktivieren Sie hierzu das Kontrollkästchen Besondere Schriftart wählen und legen Sie anschließend die gewünschte Formatierung fest.

Klicken Sie nach Abschluss der Bearbeitung auf OK.

Über den Button Konfigurieren und den darin enthaltenen Befehlen Splitting-Einstellungen, Vorschau, Erweitert, DTD-Einstellungen und XSD-Einstellungen können Sie weitere Einstellungen für die Verarbeitung und Darstellung von XML-Dateien vornehmen.

Vorschau

Über den Befehl Vorschau können Sie Vorschauen von XML-Dateien – basierend auf den Einstellungen der aktuellen Dokumenteneinstellungsvorlage – erstellen. Auf diese Weise sehen Sie auf einen Blick, wie die unterschiedlich definierten Inhalte der Datei beim Einchecken in Across verarbeitet und anschließend im crossDesk dargestellt werden.

Für die Darstellung der unterschiedlichen Inhalte können Sie entsprechende Farben auswählen.

Klicken Sie zur Erstellung einer Vorschau auf Durchsuchen, um die gewünschte XML-Datei auszuwählen. Klicken Sie anschließend auf OK. Die Vorschau wird daraufhin erstellt und in einem Vorschau-Fenster angezeigt.

Erweitert

Über den Befehl Erweitert können Sie zusätzliche Einstellungen vornehmen.

Übersetzung von Skripten

Sie können zunächst festlegen, wie mit Skripten verfahren werden soll, die in den XML-Dokumenten enthalten sind. Skripte werden naturgemäß in der Regel nicht übersetzt. Es kann aber sein, dass in einem Skript Inhalte vorkommen, die dennoch übersetzt werden sollen. Sie können daher wählen, ob grundsätzlich alle Strings übersetzt werden dürfen, ob ausschließlich so genannte L_Strings übersetzt oder ob grundsätzlich keine Strings übersetzt werden dürfen.

Variablennamen, die zu übersetzende Inhalte enthalten, werden üblicherweise mit einem L_-Präfix gekennzeichnet.

Handling von META charsets

Bei Tags für META charsets, also Meta-Angaben zur Festlegung der Zeichenkodierung, können Sie wählen, ob ein <META>-Tag hinzugefügt werden soll, falls dieser nicht vorhanden ist, ob der Wert des <META>-Tags angepasst werden soll oder ob der Wert nicht geändert werden soll

Kodierung der Zieltexte

Falls XML-Dateien nicht in UTF-8 oder UTF-16 kodiert sind, kann es nötig sein, dass die Zieldokumente in der Kodierung angepasst werden müssen – um zu gewährleisten, dass alle Zeichen korrekt dargestellt werden. Für diese Fälle können Sie festlegen, welche Kodierung für die Zieldokumente verwendet werden soll.

  • Sie können dabei wählen:
  • dass die korrekte Kodierung automatisch von Across erkannt werden soll,
  • dass im Zieldokument die Kodierung des Quelldokuments verwendet werden soll oder
  • dass eine bestimme Kodierung verwendet werden soll (über eine Dropdown-Liste).

Verarbeitung undefinierter Tags

Für Tags, die in der entsprechenden Dokumenten-Verarbeitungsvorlage nicht definiert sind, können Sie festlegen, ob diese undefinierten Tags als Inline-Tags oder als externe Tags behandelt werden sollen.

Insbesondere wenn die ML-Struktur der zu übersetzenden Datei derart dynamisch ist, dass Sie im Vorhinein nicht immer wissen, welche externen Tags vorkommen, kann diese Einstellung sehr nützlich sein.

Zeichen-Entitäten

Zudem können Sie festlegen, ob und wenn ja welche Zeichen-Entitäten automatisch konvertiert werden sollen. Die Entitäten sind zu Sets zusammengefasst. Soll eine Konvertierung durchgeführt werden, müssen Sie hierzu das entsprechende Kontrollkästchen aktivieren. Die Inhalte des jeweiligen Sets werden im darunter liegenden Fensterbereich angezeigt.

Über den Button Hinzufügen können Sie ein neues Entitäten-Set anlegen. Anschließend können Sie über den Button Hinzufügen im darunter liegenden Fensterbereich neue Entitäten definieren – oder ein Entitäten-Set als Datei (im Format *.ent) importieren.

Behandlung von Whitespaces

ML-Editoren fügen häufig spezielle Whitespaces wie z. B. weiche Zeilenumbrüche und Tabulatoren in die entsprechenden Dokumente ein, um die Struktur der Dokumente „plastisch“ darzustellen und so die Dokumente übersichtlicher zu gestalten. Diese Whitespaces sind allerdings nicht relevant für die Übersetzung und können somit einen unnötigen Bearbeitungsaufwand bedeuten. Sie können daher festlegen, dass diese speziellen Whitespaces beibehalten oder „normalisiert“ werden. Sie können zum einen über die Option Angrenzende Whitespaces in den Absatz einbeziehen festlegen, dass die Whitespaces am Anfang und Ende von Absätzen erhalten bleiben. Zum anderen können Sie über die Option Whitespaces normalisieren wählen, dass – sowohl interne wie auch externe – Whitespaces in einem ersten Schritt zu normalen Leerzeichen umgewandelt, also normalisiert werden und anschließend mehrere Leerzeichen zu einem einzigen Leerzeichen zusammengefasst werden.

Behandlung ungültiger Tags

Falls ungültige Tags im ML-Dokument enthalten sind, können Sie durch Aktivierung der Option Ungültige Tags als Text behandeln bewirken, dass diese Tags als einfacher Text interpretiert werden und das ML-Dokument dadurch eingecheckt und bearbeitet werden kann. Bei den ungültigen Tags kann es sich z. B. um unmaskierte XML-Zeichen handeln. Im folgenden Beispiel ist das Zeichen < (‚kleiner als’) fälschlicherweise nicht als &lt; maskiert: <p>if x < 1 then write ('test')</p>

Ist die Option Ungültige Tags als Text behandeln deaktiviert, wird es beim Einchecken des entsprechenden Dokuments zu einem Parsing-Fehler kommen. Bei aktivierter Option ist das Einchecken des Dokuments hingegen möglich.

Behandlung von Absätzen ohne Text

Für Absätze, die keinen zu übersetzenden Text, sondern lediglich Placeables bzw. interne Tags enthalten, können Sie durch Aktivierung der entsprechenden Option festlegen, ob diese Absätze beim Einchecken extrahiert und somit im crossDesk angezeigt werden sollen oder nicht.

Die Registerkarte Attribute

In der Registerkarte Attribute werden die Attribute des jeweiligen ML-Elements verwaltet. Hier können Sie zum einen über die entsprechenden Buttons neue Attribute hinzufügen, den Namen bestehender Attribute bearbeiten sowie bestehende Attribute entfernen. Zum anderen können Sie über die entsprechende Dropdown-Liste in der Spalte Modus definieren, wie das jeweilige Attribut in Across verarbeitet werden soll.

Sie können dabei eine der folgenden Optionen wählen:

Option
Beschreibung
Ignoriert
Das Attribut und der dazugehörige Attributwert werden schreibgeschützt und als Teil des jeweiligen Elements im crossDesk dargestellt.
Übersetzbar
Der Attributwert des Attributs kann bearbeitet werden (siehe unten).
Längenbeschränkung
Das Attribut ist längenbeschränkt (siehe unten).
Als Kommentar
Der Attributwert wird als schreibgeschützter Kommentar in der Source View des crossDesk angezeigt.
Als Absatzbezeichner
Der Attributwert wird in der crossView in crossDesk anstelle des gesamten Elementinhalts als Absatzbezeichnung verwendet.

Anwendungsbeispiel Übersetzbare Attribute

Das Element <A> (für engl. anchor, Haken) steht in HTML für einen Hyperlink. Das Element kann unterschiedliche Attribute enthalten – so enthält es in der Regel das Attribut href, das für das Verweisziel des Links steht, wie z. B. <A href="http://www.across.net/en">. Indem Sie das Attribut href als Übersetzbar definieren, lässt sich das Verweisziel des Links im crossDesk bearbeiten. Wird für das Attribut hingegen Ignoriert gewählt, wird es schreibgeschützt und als Teil des jeweiligen Elements im crossDesk dargestellt.

Auswahl von Übersetzbar:
Auswahl von Ignoriert:
Der Hyperlink ist im Target Editor editierbar.
Der Hyperlink ist nicht im Target Editor editierbar, sondern wird schreibgeschützt dargestellt.
cDesk_te_tagged-html_attribut-uebersetzbar
cDesk_te_tagged-html_attribut-ignoriert

Attribute mit Längenbeschränkung

Durch Auswahl von Längenbeschränkung legen Sie fest, dass das Attribut längenbeschränkt ist. Sowohl externe als auch interne ML-Elemente können Attribute mit Längenbeschränkungen enthalten (wie z. B. maxlength="5"). Diese Längenbeschränkungen geben an, wie viele Zeichen das jeweilige Element maximal enthalten darf. Sollten in Ihren zu bearbeitenden ML-Dokumenten Elemente mit solchen Längenbeschränkungen vorkommen, so wählen Sie hierfür die Option Längenbeschränkung aus. Im Rahmen des Eincheck-Vorgangs werden dadurch die enthaltenen Längenbeschränkungen ausgelesen und bei der Übersetzung im crossDesk berücksichtigt

Im Falle von externen Elementen zeigt das icn_cDesk_te_laengenbeschraenkung-Icon in der Symbolleiste des Target Editor die Anzahl der noch verbleibenden Zeichen an. Eine Überschreitung der zulässigen Zeichenzahl ist während der Bearbeitung des Absatzes zunächst möglich. Eine Speicherung des Absatzes wird allerdings verhindert, da ansonsten u. U. ungültige Dokumente entstehen könnten. Ein Popup weist auf die Überschreitung der Längenbeschränkung hin.

Auch im Falle von internen Elementen mit Längenbeschränkungen ist während der Bearbeitung des Absatzes eine Überschreitung der zulässigen Zeichenzahl zunächst möglich. Doch auch in diesem Fall wird die Speicherung des Absatzes verhindert.

Für crossTank-Treffer, die länger als die vorgegebene Zeichenzahl sind, wird ein Penalty in Höhe von 1% abgezogen.

Im Rahmen von Vorübersetzungen werden diese crossTank-Einträge, die zu lang sind und gegen Längenbeschränkungen verstoßen würden, nicht in das Zieldokument eingefügt. Die entsprechenden crossTank-Einträge werden in den Reports in der gesonderten Kategorie Match/nicht eingefügt (Absatzvalidierung fehlgeschlagen) ausgewiesen.

Für den Fall, dass es für ein zu übersetzendes Element mit Längenbeschränkung mehrere 100%-Matches gibt, können Sie zudem Bonuspunkte definieren.

Eine Längenbeschränkung von Elementen kann auch über die Element-Einstellungen umgesetzt werden.

Attention

Sollte für ein Element sowohl eine Längenbeschränkung über das Element als auch über das Attribut definiert sein, so hat die Längenbeschränkung über das Attribut Vorrang vor der Längenbeschränkung über das Element.

Tipp

Weitere Informationen zur Längenbeschränkung über die Element-Einstellungen finden Sie in den entsprechenden Ausführungen zur Registerkarte Allgemein im vorangehenden Abschnitt.

Die Registerkarte Formatierung

In der Registerkarte Formatierung legen Sie fest, ob der zu übersetzende Text eines Elements in einer bestimmten Formatierung im crossDesk dargestellt werden soll. Aktivieren Sie hierzu das Kontrollkästchen Besondere Schriftart wählen und legen Sie anschließend die gewünschte Formatierung fest.

Klicken Sie nach Abschluss der Bearbeitung auf OK.

Über den Button Konfigurieren und den darin enthaltenen Befehlen Splitting-Einstellungen, Vorschau, Erweitert, DTD-Einstellungen und XSD-Einstellungen können Sie weitere Einstellungen für die Verarbeitung und Darstellung von XML-Dateien vornehmen.

Vorschau

Über den Befehl Vorschau können Sie Vorschauen von XML-Dateien – basierend auf den Einstellungen der aktuellen Dokumenteneinstellungsvorlage – erstellen. Auf diese Weise sehen Sie auf einen Blick, wie die unterschiedlich definierten Inhalte der Datei beim Einchecken in Across verarbeitet und anschließend im crossDesk dargestellt werden.

Für die Darstellung der unterschiedlichen Inhalte können Sie entsprechende Farben auswählen.

Klicken Sie zur Erstellung einer Vorschau auf Durchsuchen, um die gewünschte XML-Datei auszuwählen. Klicken Sie anschließend auf OK. Die Vorschau wird daraufhin erstellt und in einem Vorschau-Fenster angezeigt.

Erweitert

Über den Befehl Erweitert können Sie zusätzliche Einstellungen vornehmen.

Übersetzung von Skripten

Sie können zunächst festlegen, wie mit Skripten verfahren werden soll, die in den XML-Dokumenten enthalten sind. Skripte werden naturgemäß in der Regel nicht übersetzt. Es kann aber sein, dass in einem Skript Inhalte vorkommen, die dennoch übersetzt werden sollen. Sie können daher wählen, ob grundsätzlich alle Strings übersetzt werden dürfen, ob ausschließlich so genannte L_Strings übersetzt oder ob grundsätzlich keine Strings übersetzt werden dürfen.

Variablennamen, die zu übersetzende Inhalte enthalten, werden üblicherweise mit einem L_-Präfix gekennzeichnet.

Handling von META charsets

Bei Tags für META charsets, also Meta-Angaben zur Festlegung der Zeichenkodierung, können Sie wählen, ob ein <META>-Tag hinzugefügt werden soll, falls dieser nicht vorhanden ist, ob der Wert des <META>-Tags angepasst werden soll oder ob der Wert nicht geändert werden soll

Kodierung der Zieltexte

Falls XML-Dateien nicht in UTF-8 oder UTF-16 kodiert sind, kann es nötig sein, dass die Zieldokumente in der Kodierung angepasst werden müssen – um zu gewährleisten, dass alle Zeichen korrekt dargestellt werden. Für diese Fälle können Sie festlegen, welche Kodierung für die Zieldokumente verwendet werden soll.

  • Sie können dabei wählen:
  • dass die korrekte Kodierung automatisch von Across erkannt werden soll,
  • dass im Zieldokument die Kodierung des Quelldokuments verwendet werden soll oder
  • dass eine bestimme Kodierung verwendet werden soll (über eine Dropdown-Liste).

Verarbeitung undefinierter Tags

Für Tags, die in der entsprechenden Dokumenten-Verarbeitungsvorlage nicht definiert sind, können Sie festlegen, ob diese undefinierten Tags als Inline-Tags oder als externe Tags behandelt werden sollen.

Insbesondere wenn die ML-Struktur der zu übersetzenden Datei derart dynamisch ist, dass Sie im Vorhinein nicht immer wissen, welche externen Tags vorkommen, kann diese Einstellung sehr nützlich sein.

Zeichen-Entitäten

Zudem können Sie festlegen, ob und wenn ja welche Zeichen-Entitäten automatisch konvertiert werden sollen. Die Entitäten sind zu Sets zusammengefasst. Soll eine Konvertierung durchgeführt werden, müssen Sie hierzu das entsprechende Kontrollkästchen aktivieren. Die Inhalte des jeweiligen Sets werden im darunter liegenden Fensterbereich angezeigt.

Über den Button Hinzufügen können Sie ein neues Entitäten-Set anlegen. Anschließend können Sie über den Button Hinzufügen im darunter liegenden Fensterbereich neue Entitäten definieren – oder ein Entitäten-Set als Datei (im Format *.ent) importieren.

Behandlung von Whitespaces

ML-Editoren fügen häufig spezielle Whitespaces wie z. B. weiche Zeilenumbrüche und Tabulatoren in die entsprechenden Dokumente ein, um die Struktur der Dokumente „plastisch“ darzustellen und so die Dokumente übersichtlicher zu gestalten. Diese Whitespaces sind allerdings nicht relevant für die Übersetzung und können somit einen unnötigen Bearbeitungsaufwand bedeuten. Sie können daher festlegen, dass diese speziellen Whitespaces beibehalten oder „normalisiert“ werden. Sie können zum einen über die Option Angrenzende Whitespaces in den Absatz einbeziehen festlegen, dass die Whitespaces am Anfang und Ende von Absätzen erhalten bleiben. Zum anderen können Sie über die Option Whitespaces normalisieren wählen, dass – sowohl interne wie auch externe – Whitespaces in einem ersten Schritt zu normalen Leerzeichen umgewandelt, also normalisiert werden und anschließend mehrere Leerzeichen zu einem einzigen Leerzeichen zusammengefasst werden.

Behandlung ungültiger Tags

Falls ungültige Tags im ML-Dokument enthalten sind, können Sie durch Aktivierung der Option Ungültige Tags als Text behandeln bewirken, dass diese Tags als einfacher Text interpretiert werden und das ML-Dokument dadurch eingecheckt und bearbeitet werden kann. Bei den ungültigen Tags kann es sich z. B. um unmaskierte XML-Zeichen handeln. Im folgenden Beispiel ist das Zeichen < (‚kleiner als’) fälschlicherweise nicht als &lt; maskiert: <p>if x < 1 then write ('test')</p>

Ist die Option Ungültige Tags als Text behandeln deaktiviert, wird es beim Einchecken des entsprechenden Dokuments zu einem Parsing-Fehler kommen. Bei aktivierter Option ist das Einchecken des Dokuments hingegen möglich.

Behandlung von Absätzen ohne Text

Für Absätze, die keinen zu übersetzenden Text, sondern lediglich Placeables bzw. interne Tags enthalten, können Sie durch Aktivierung der entsprechenden Option festlegen, ob diese Absätze beim Einchecken extrahiert und somit im crossDesk angezeigt werden sollen oder nicht.