Splitting von Absätzen

Standardmäßig werden die Quelltexte – und damit auch die Zieltexte – in Absätze unterteilt im crossDesk angezeigt und bearbeitet. Neben dieser absatzweisen Anzeige und Bearbeitung der Texte können Sie auch eine satzweise Anzeige und Bearbeitung wählen: Dabei werden die Texte nicht in Absätze, sondern in Sätze unterteilt im crossDesk angezeigt. Absätze, die mehrere Sätze beinhalten, werden dadurch in die einzelnen Sätze aufgeteilt und gesondert angezeigt. Durch dieses so genannte Splitting der Absätze können insbesondere Dokumente mit vielen langen Absätzen komfortabler im crossDesk bearbeitet werden.

Darüber hinaus können Sie zusätzlich wählen, dass Absätze, die eine bestimmte Zeichenzahl übersteigen, gesplittet werden.

Sie wählen das Splitting von Absätzen für jedes Format einzeln sowie – über die Verwendung unterschiedlicher Dokumentenvorlagen – auch für bestimmte Dokumente in den entsprechenden Dokumenteneinstellungen über den Button Splitting-Einstellungen unter Tools > Systemeinstellungen > Dokumenteneinstellungen > gewünschte Dokumentenvorlage.

Die Wahl des Splittings muss vor dem Einchecken eines Dokuments erfolgen und kann nicht rückgängig gemacht werden. Falls dies doch erforderlich sein sollte, muss das entsprechende Dokument nochmals ohne Splitting eingecheckt werden.

Einstellungen in den Dokumenteneinstellungsvorlagen z. B. zum Sperren von Absätzen werden vor dem Splitting angewandt. Die Absätze werden also zunächst gesperrt und anschließend gesplittet.

Das Splitting wird nicht in Absätzen von ML-Formaten (HTML, SGML und XML) durchgeführt, die eine Längenbeschränkung enthalten.

Satzweises Splitting von Absätzen

Sie wählen das satzweise Splitting von Absätzen über die entsprechende Option in den Splitting-Einstellungen der jeweiligen Dokumenteneinstellungsvorlage.

Das folgende Beispiel verdeutlicht die Funktionsweise des satzweisen Splittings anhand eines Absatzes, der aus drei Sätzen besteht:

Satzweises Splitting
Absatzweises Splitting
cDesk_source-view_segmentierung-satzbasiert
cDesk_source-view_segmentierung-absatzbasiert
Der Absatz wurde in die drei Sätze aufgeteilt. Jeder Satz wird gesondert im crossDesk angezeigt.
Alle drei Sätze des Absatzes werden zusammen in einem Absatz im crossDesk angezeigt.

Bei der Verwendung des Satzsplittings wird im Target Editor keine Satzerkennung durchgeführt, da alle quellsprachlichen Absätze lediglich einen Satz enthalten.

Across nimmt das satzweise Splitting der Absätze auf Grundlage der Einstellungen der Satzerkennung vor. Diese sind im Bereich Spracheinstellungen in den Systemeinstellungen unter Tools > Systemeinstellungen > Allgemein > Spracheinstellungen hinterlegt.

Optionale Tilgung angrenzender Whitespaces

Über eine zusätzliche Option können Sie festlegen, dass angrenzende Whitespaces – also Whitespaces, die vor und nach den zu übersetzenden Sätzen stehen – im crossDesk für den Zeitraum der Übersetzung des Dokuments getilgt werden.

Die Whitespaces, die zwischen den Sätzen innerhalb der ursprünglichen Absätze stehen, werden im Zuge des Satzsplittings standardmäßig im crossDesk angezeigt (mit Ausnahme von einem einzelnen normalen Leerzeichen, das in jedem Falle automatisch ausgeblendet wird). Über die Option der Tilgung der angrenzenden Whitespaces besteht die Möglichkeit, diese angrenzenden Whitespaces im crossDesk vorübergehend zu tilgen. Im Rahmen des Auscheck-Vorgangs werden die getilgten Whitespaces automatisch wieder in das Zieldokument eingefügt.

Die Option wirkt sich insbesondere auch auf die Speicherung der Übersetzungseinheiten in crossTank aus: Bei aktivierter Option werden die Übersetzungseinheiten ohne angrenzende Whitespaces nach crossTank gespeichert. Dies führt dazu, dass sich die Matching-Quoten der Suchtreffer in crossTank verbessern und sich gleichzeitig die Zahl der gespeicherten Übersetzungseinheiten verringert.

Anwendungsbeispiel

Das folgende Beispiel erläutert die Funktionsweise der Option anhand eines Absatzes, der aus zwei Sätzen besteht, die durch einen Tabulator voneinander getrennt sind:

Mit deaktivierter Option der Whitespace-Tilgung
Mit aktivierter Option der Whitespace-Tilgung
cDesk_source-view_ohne-whitespace-tilgung
cDesk_source-view_mit-whitespace-tilgung
Der Tabulator wurde nicht getilgt und wird entsprechend vor dem zweiten Satz angezeigt.
Der Tabulator wurde getilgt und wird entsprechend nicht vor dem zweiten Satz angezeigt.

Bei den getilgten Whitespaces kann es sich neben normalen Leerzeichen (0x0020) z. B. auch um Tabulatoren oder geschützte Leerzeichen handeln. Von der Option werden all jene Zeichen berücksichtigt, die in den Spracheinstellungen als Whitespaces definiert sind.

sysset_allg_spracheinstellungen_wildcards
  • Standardmäßig sind die folgenden Zeichen als Whitespaces definiert:
  • NULL-Zeichen
  • horizontaler Tabulator
  • Leerzeichen
  • Wagenrücklauf
  • Zeilenvorschub
  • vertikaler Tabulator (weicher Zeilenumbruch)

Splitting von Absätzen nach einer bestimmten Zeichenzahl

Sie wählen das Splitting von Absätzen nach einer bestimmten Zeichenzahl über die entsprechende Option in den Splitting-Einstellungen der jeweiligen Dokumenteneinstellungsvorlage. Geben Sie nach der Aktivierung der Option zusätzlich die gewünschte Zeichenzahl an, nach der das Splitting erfolgen soll (Leerzeichen werden hierbei mitgerechnet).

  • Das Splitting eines Absatzes, der länger als die festgelegte Zeichenzahl ist, unterliegt den folgenden Regeln (am Beispiel eines Absatzsplittings nach 400 Zeichen):
  • Wenn der Absatz aus mehreren Sätzen besteht, erfolgt das Splitting nach dem Ende des letzten vollständigen Satzes vor dem Erreichen der festgelegten Zeichenzahl.
  • Wenn der Absatz aus nur einem Satz besteht, erfolgt das Splitting gemäß der festgelegten Zeichenzahl. Wörter werden dabei nicht gesplittet: Falls die festgelegte Zeichenzahl innerhalb eines Wortes erreicht ist, wird das Splitting vor diesem Wort durchgeführt.
  • Wenn der Zeichenzahl des Absatz die festgelegte Zeichenzahl um das Mehrfache übersteigt, wird der Absatz mehrmals gesplittet.

Das folgende Beispiel verdeutlicht die Funktionsweise des Splittings nach einer bestimmten Zeichenzahl:

Kein Splitting
Gesplitteter Absatz nach 400 Zeichen
cDesk_source-view_kein-splitting-nach-400-zeichen
cDesk_source-view_splitting-nach-400-zeichen
Der Absatz wurde nicht gesplittet und wird wie gewohnt als ein Absatz im crossDesk angezeigt.
Der Absatz enthält mehr als 400 Zeichen und wurde daher nach dem letzten Satz vor dem Erreichen der Zahl von 400 Zeichen gesplittet.