- Release Notes v7.0
- Getting Started
- Systemmanagement
- Allgemeine Informationen
- Benutzer
- Gruppen & Benutzer-Crowds
- Softkeys
- Reports für Benutzer- und Gruppeninformationen
- Benutzereinstellungsvorlagen
- Workflows
- Relationen
- Sprachen
- Schriftarten
- Benutzereinstellungen
- Systemeinstellungen
- Bearbeitungszustände
- Benutzerwörterbuch
- crossGrid
- crossGrid-Paketerstellungsvorlagen
- crossTank
- crossWAN-Paketerstellungsvorlagen
- Fachgebiete
- Informationen
- Maschinelle Übersetzung
- Projekteinstellungsvorlagen
- Qualitätssicherung v6.3
- Qualitätssicherung v7.0
- Reporting
- Segmentierung
- Spracheinstellungen
- Strukturattribute
- Systemattribute
- Search Center
- Konkordanzsuche
- Stoppwörter
- Termextraktion
- Dokumenteneinstellungen
- Dokumentzuordnungen
- Displaytexte
- .NET-Ressourcen
- Excel 2000-2003
- Excel 2007-2016
- IDML
- MIF 7
- MIF 8-2019
- PowerPoint 2000-2003
- PowerPoint 2007-2016
- QuickSilver
- Tagged HTML
- Tagged SGML
- Tagged XML
- Tagged XML v2
- Visual XML
- Windows-Ressourcen
- Word 2000-2003
- Word 2007-2016
- XLIFF
- Reguläre Ausdrücke
- Systemattribute
- Projektmanagement
- Projekte
- Projektansicht
- Projekteinstellungen
- Funktionen des Moduls
- Projektsuche
- Projektanlage
- Anhang hinzufügen
- Projekte freigeben
- Dokument- und Projektaktualisierung
- Projektstatus
- Projekte exportieren
- Projekte importieren
- Projekte aktivieren/deaktivieren
- Projekte kopieren
- Projekte archivieren
- Workflow ändern
- Workflow ändern (mehrere Dokumente)
- Dokumente
- Dokument hinzufügen
- Zielsprache hinzufügen
- Alignment bestehender Übersetzungen
- Dokumentformate und Programme
- Dokumente partitionieren
- Text sperren oder verbergen
- Dokumentversion wiederherstellen
- Dokumentversion löschen
- Vorübersetzungen
- Maschinelle Übersetzungen
- Dokumenteneinstellungsvorlagen
- Dokumente auschecken
- Reports
- Aufgaben
- Qualitätssicherung
- Formate
- Das Projektarchiv
- crossGrid
- Projektmanagement-Cockpit
- Der Filter-Editor
- crossAnalytics
- Linguistic Supply Chain Management (LSCM)
- crossWAN-Projektmanagement
- Partitionierung
- Relais-Übersetzungen
- Dokumentenvorbereitung
- Termextraktion und -übersetzung
- Externe Bearbeitung von Dokumenten
- Der Workflow EN 15038 Standard
- Der Workflow ISO 17100 Standard
- crossConnect für externe Bearbeitung
- Vorübersetzte Aufgaben automatisch abschließen
- Projekte
- Aufgabenbearbeitung
- Arbeiten im crossDesk
- Bearbeitungszustände
- Leere Absätze
- Modi
- crossDesk anpassen
- Aufgaben in Across
- Kommentieren
- Lesezeichen
- Nummerierung von Absätzen
- Absätze sortieren
- Die Context View/Source View
- crossTerm-Fenster im crossDesk
- Die crossView
- Fuzzy-Suche
- Konkordanzsuche
- crossSearch
- Rechtschreibprüfung und Benutzerwörterbuch
- Vorübersetzungen
- Store Translations Wizard
- Der Target Editor
- Vorschau
- QM-Prüfung im crossDesk
- Suchen und Ersetzen
- Die Korrektur
- Das Lektorat
- Rückdelegierung an den Übersetzer
- Quick Translate
- Eigene Daten im Offline-Client
- crossWAN
- TM-Management
- Terminologie-Management
- Begriffsorientiertes Terminologiesystem
- Definitionen
- Der crossTerm Manager
- crossTerm-Einstellungen
- crossTerm Manager-Benutzeroberfläche
- Einträge/Terme suchen
- Eintrags- und Termelemente
- Einträge/Terme bearbeiten
- Einträge/Terme löschen
- Einträge verschmelzen
- Einträge duplizieren
- Manuelle Korrektur
- crossTerm-Reports
- crossTerm-Import
- crossTerm-Export
- crossTerm-Datenpflege
- crossTerm Web
- crossMining
- crossSearch
- Browserbasierte Arbeit
- Bearbeitung spezieller Formate
- HTML-Dokumente
- XML-Dokumente
- SGML-Dokumente
- FrameMaker-Dokumente
- Word-Dokumente
- TXT-Dokumente
- Excel-Dokumente
- PowerPoint-Dokumente
- InDesign- und InCopy-Dokumente
- QuickSilver-Dokumente
- PO-Dokumente
- MC-Dokumente
- XLIFF-Dokumente
- crossTransform
- Softwarelokalisierung
- Lokalisierung von mobilen Apps
- Lokalisierung von Displaytexten
- Menüs, Icons und Tastenkombinationen
Satzerkennung
Die von Across eingesetzte Satzerkennung ist regelbasiert, d. h. Across ermittelt auf Grundlage von Regeln, wo ein Satz aufhört und wo ein neuer Satz beginnt.
Über Importieren bzw. Exportieren können Sie die Spracheinstellungen im XML-Format importieren bzw. exportieren.
Satzregeln sind folgendermaßen aufgebaut:
Teil | Funktion | Beispiel |
1 | Gibt an, welches Trennzeichen die Regel behandelt | [?] |
2 | Art der Regel, also ob die Regel ein Satzende definiert (+) oder nicht (-). | + oder - |
3 | Die eigentliche Regel | [?^_] |
Standardsatzregeln
Die folgenden Satzregeln (Standard-Sprache > Satzregeln) werden u. a. standardmäßig in Across verwendet:
Platzhalter | Funktion |
[!]+[!^_] | Ein Ausrufezeichen gefolgt von einem Whitespace wird als Satzende interpretiert. |
[!]-[!^_^a] | Ein Ausrufezeichen gefolgt von einem Whitespace und einem Kleinbuchstaben wird nicht als Satzende interpretiert. |
[.]+[.^_] | Ein Punkt gefolgt von einem Whitespace wird als Satzende interpretiert. |
[.]-[.^_^a] | Ein Punkt gefolgt von einem Whitespace und einem Kleinbuchstaben wird nicht als Satzende interpretiert. |
[.]-[^_^n.] | Ein Whitespace gefolgt von einer einstelligen Zahl und einem Punkt wird nicht als Satzende interpretiert. Mehrstellige Zahlen müssen durch weitere Regeln mit mehrfachen Platzhaltern n abgebildet werden, z. B. [.][^_^n^n.] für eine zweistellige Zahl. |
[?]+[?^_] | Ein Fragezeichen gefolgt von einem Whitespace wird als Satzende interpretiert. |
[?]-[?^_^a] | Ein Fragezeichen gefolgt von einem Whitespace und einem Kleinbuchstaben wird nicht als Satzende interpretiert. |
[n]+[.\n] | Ein Punkt gefolgt von einem Backslash und dem Buchstaben n wird als Satzende interpretiert. Hintergrund dieser Regel ist, dass insbesondere bei der Lokalisierung von Softwareressourcen die Zeichenfolge \n für einen Zeilenumbruch steht. Gemäß der Regel wird z. B. im folgenden String nach \n ein Satzende gemacht: Kann die Datei nicht laden.\nFehler: 0x%x |
[n]+[!\n] | Ein Ausrufezeichen gefolgt von einem Backslash und dem Buchstaben n wird als Satzende interpretiert. |
[n]+[?\n] | Ein Fragezeichen gefolgt von einem Backslash und dem Buchstaben n wird als Satzende interpretiert. |
[t]+[.\t] | Ein Punkt gefolgt von einem Backslash und dem Buchstaben t wird als Satzende interpretiert. Hintergrund dieser Regel ist, dass insbesondere bei der Lokalisierung von Softwareressourcen die Zeichenfolge \t für einen horizontalen Tabulator steht. Gemäß der Regel wird z. B. im folgenden String nach \t ein Satzende gemacht: &Suchen...\tStrg+F |
[t]+[!\t] | Ein Ausrufezeichen gefolgt von einem Backslash und dem Buchstaben t wird als Satzende interpretiert. |
[t]+[?\t] | Ein Fragezeichen gefolgt von einem Backslash und dem Buchstaben t wird als Satzende interpretiert. |
Beispiel:
[.]+[.^_] | Definiert ein Satzende: Ein Punkt (.) gefolgt von einem Whitespace (^_) wird als Satzende gewertet. In der Regel steht der Unterstrich _ für ein Whitespace. Das ^-Zeichen vor dem Unterstrich definiert das folgende Zeichen – also den Unterstrich – als Platzhalter. Ohne das ^-Zeichen würde das folgende Zeichen als normales Zeichen – also tatsächlich als Unterstrich – und nicht als Platzhalter interpretiert. |
[.]-[.^_^a] | Definiert hingegen eine Ausnahme für das Beispiel oben: Wird ein Punkt von einem Whitespace und einem Kleinbuchstaben (^a) gefolgt, liegt kein Satzende vor. |
In der Wortfolge „Das ist ein Satz. Das ist auch ein Satz.“ steht der erste Punkt demnach für ein Satzende, da er von einem Whitespace gefolgt wird. In der Wortfolge „Aber dies. nicht!“ stellt der Punkt hingegen kein Satzende dar, da auf den Punkt zwar ein Whitespace, aber auch ein Kleinbuchstabe folgt.
Abkürzungen
Einen Sonderfall der Satzregeln stellt die Definition von Abkürzungen dar: Denn nur wenn eine Abkürzung auch als solche definiert ist, wird die Abkürzung in einem Ausgangstext als solche erkannt – und korrekterweise nicht als Satzende interpretiert.
Die Groß- und Kleinschreibung wird bei den Abkürzungen nicht berücksichtigt. Daher wird die Abkürzung „max.“ auch dann als Abkürzung erkannt, wenn in einem Satz z. B. „Max.“ (am Satzanfang) vorkommt.
Die Abkürzungen werden in der Abkürzungsliste nach dem ASCII-Code der Zeichen in aufsteigender Reihenfolge sortiert. Daher werden Abkürzungen, die mit einem Umlaut oder Akzent beginnen, am Ende der Abkürzungsliste angezeigt.
Abkürzungen, die bei der Bearbeitung der Satzerkennung im crossDesk hinzugefügt werden, werden automatisch zu den Spracheinstellungen hinzugefügt.