Übersetzungsspeicher
aus Wikipedia, der freien Enzyklopädie
Ein Übersetzungsspeicher (auch Übersetzungsarchiv; engl. translation memory) ist eine (in der Regel die Haupt-)Komponente von Anwendungen zur Rechnergestützten Übersetzung (CAT). Der Übersetzungsspeicher ist hierbei üblicherweise eine Datenbank, in der Übersetzungen gespeichert werden.
Inhaltsverzeichnis |
[Bearbeiten] Überblick
Der Übersetzungsspeicher speichert die Übersetzungen – in der Regel menschlicher – Übersetzer und bietet dem Übersetzer diese bereits vorhandenen Übersetzungen später zur Wiederverwendung an. Hierbei können nicht nur identische, sondern auch ähnliche Ausgangstextsegmente erkannt werden. TM-Systeme dienen vor allem zur Sicherung der terminologischen und stilistischen Konsistenz (Einheitlichkeit) von Übersetzungen. Ein weiterer Aspekt ist die Arbeitserleichterung und -beschleunigung und die damit verbundene Kostenreduktion.
Besonders sinnvoll ist der Einsatz von TM-Systemen zur Übersetzung von Gebrauchstexten, in denen immer wiederkehrende identische oder ähnliche Formulierungen vorkommen (etwa Bedienungsanleitungen für Serien ähnlicher Produkte).
Die einzelnen Einheiten der Datenbank werden Segmente genannt. Der Zugriff auf und die Arbeit mit Übersetzungsspeichern erfolgt über Translation-Memory-Systeme.
[Bearbeiten] Typen
Es gibt zwei grundsätzliche Systemtypen:
- Zum einen gibt es Systeme, in denen Paare von Referenztexten (wiederum getrennt nach Ausgangs- und Zielsprache) gespeichert werden. Diese Systeme haben den Vorteil, dass die jeweiligen Sätze/Segmente im Kontext des umgebenden Textes angezeigt werden können.
- Zum anderen gibt es datenbankorientierte Systeme in denen Paare von Übersetzungseinheiten (Sätze/Segmente in der Ausgangssprache und ihre Entsprechung in der Zielsprache) ohne den Kontext der jeweiligen Quelldokumente gespeichert werden. Diese Systeme sind im Laufzeitverhalten beim Zugriff auf große Datenmengen oft besser, da die einzelnen Übersetzungseinheiten in der Datenbank effizienter indiziert werden können.
In der Praxis erfolgt die interaktive Arbeit mit einem TM so, dass ein Übersetzer einen Satz bzw. ein Segment zur Übersetzung anwählt. Das System sucht dann im Speicher nach gleichen oder ähnlichen Sätzen/Segmenten und bietet die vorhandenen Übersetzungen an. Diese Übersetzungen können vom Bearbeiter übernommen oder angepasst werden. Werden keine entsprechenden Segmente gefunden, gibt der Bearbeiter eine eigene Übersetzung ein, die dann zusammen mit dem Ausgangssegment gespeichert wird und ab sofort beim Auftreten identischer oder ähnlicher Segmente zur Verfügung steht. Zusätzlich erhält der Übersetzer je nach System noch eine Reihe weiterer Informationen, die ihm die Übersetzung erleichtern sollen. Hierzu gehören:
- Wer hat die angebotene Übersetzung angelegt/geändert?
- Wann wurde die Übersetzung angelegt/geändert und wie häufig wurde die Übersetzung verwendet?
- Ggf. weitere klassifizierende Informationen.
- Angaben zur fach- oder nutzerspezifischen Terminologie.
Neben diesem interaktiven Verfahren bieten die meisten Systeme auch eine Option, um vor Beginn der eigentlichen Übersetzung eine vollautomatische Übersetzung („Vorübersetzung“) des zu bearbeitenden Dokumentes aus dem TM durchzuführen. Dabei werden alle im TM gefundenen identischen ausgangssprachlichen Segmente durch ihre gespeicherte Übersetzung ersetzt. Sätze/Segmente, deren Übersetzungen nicht im System gefunden werden, bleiben dabei zumeist unübersetzt.
[Bearbeiten] Eigenschaften
Üblicherweise verfügen TM-Systeme über Funktionen, die das Erkennen einer verwertbaren Übersetzung unabhängig von variablen Elementen wie Zahlen, Datumsangaben, Maßeinheiten oder Eigennamen ermöglichen.
Die Suche nach ähnlichen Quellsätzen/-segmenten erfolgt mithilfe von unterschiedlich aufwändigen Suchalgorithmen (Fuzzy-Suche), die dann auch einen meist prozentualen Ähnlichkeitswert angeben.
Um Texte aus Textverarbeitungs- und DTP-Programmen für die TM-Systeme verfügbar zu machen gibt es Filter- und Extraktionsprogramme, die den Quelltext aus den jeweiligen Dateien herauslösen. Im Ergebnis erhält man dann eine markierte („getaggte“) Datei, in welcher der zu übersetzende Text zwischen speziellen Steuercodes (Tags) verfügbar ist. Diese Layout-Tags werden vom System geschützt bzw. ausgeblendet, sodass sie nicht versehentlich überschrieben oder verändert werden können. Bei der Übersetzung von Software (Lokalisierung) kann der Programmcode auf diese Weise vor unbeabsichtigter Veränderung geschützt werden. Nach der Übersetzung dienen die Steuercodes dem Filterprogramm dazu, die Texte wieder an die korrekte Stelle in der DTP-Datei einzufügen und dabei auch Formatierungen (z. B. Fettdruck, Kursiv, ...) auf die entsprechenden Stellen der Übersetzung anzuwenden.
Die meisten TM-Systeme verfügen über spezielle Editoren, um die Arbeit mit diesen „getaggten“ Dateien zu erleichtern.
Der Austausch zwischen verschiedenen TM-Systemen kann über das TMX-Format (Translation Memory eXchange) erfolgen. Da der Inhalt eines Systems jedoch stark von der Art der jeweiligen Segmentierung abhängt, ist der Austausch in der Regel nicht verlustfrei.
[Bearbeiten] Weblinks
- Advantages and Disadvantages of Translation Memory: A Cost/Benefit Analysis (englisch)
- Translation Memory Survey 2003 (im Internet Archive) (englisch)
- Translation Memory eXchange (englisch)
- Proz CAT Center (englisch)