Kodierung bei TXT-Dateien

Enthalten ausgecheckte TXT-Dateien Sonderzeichen (z. B. asiatische oder kyrillische Zeichen), so können diese u. U. in einem Text-Editor wie Notepad scheinbar falsch dargestellt werden.

drittprogramm_notepad_unicode_sonderzeichen-falsch-dargestellt

Hierbei handelt es sich allerdings lediglich um ein Darstellungsproblem des Editors. Das Auschecken von Across hingegen ist korrekt.

Das Problem liegt in der Kodierung der Quelldatei. Diese war nicht in Unicode kodiert oder wurde von der MS Office-API nicht als Unicode erkannt, weshalb eine andere Kodierung zugewiesen wurde. Das Programm Notepad beispielsweise kann die entsprechenden Sonderzeichen nicht darstellen, MS Word oder der Internet Explorer hingegen schon.

Wenn Sie die Datei im Internet Explorer öffnen, wird automatisch die korrekte Kodierung gewählt oder Sie können diese über Ansicht > Codierung auswählen. Die Sonderzeichen werden korrekt dargestellt:

drittprogramm_ie_unicode_sonderzeichen-korrekt-dargestellt

In MS Word werden Sie nach dem Öffnen der Datei über einen Dialog gefragt, in welcher Kodierung die Datei geöffnet werden soll. Die richtige Kodierung ist hier in der Regel bereits vorausgewählt.

drittprogramm_ms-word_unicode_sonderzeichen_kodierungsauswahl

Wählen Sie ansonsten die korrekte Kodierung aus. Sie können das Dokument nun öffnen. Die Sonderzeichen werden daraufhin korrekt dargestellt:

drittprogramm_ms-word_unicode_sonderzeichen-korrekt-dargestellt

Beim Speichern des Dokuments als TXT-Datei in Word können Sie zudem eine andere Kodierung auswählen:

drittprogramm_ms-word_unicode_sonderzeichen_kodierung-beim-speichern-auswaehlen

Wenn Sie hier die entsprechende Kodierung oder zum Beispiel UTF-8 wählen, zeigt auch Notepad die Datei korrekt an:

drittprogramm_notepad_unicode_sonderzeichen-korrekt-dargestellt