GPT vs. NMT: A Glimpse Into the Future of Translation

Published: 2024-04-03 Updated: 2025-07-30

Translators have been predicting for some time that their profession will soon become redundant due to AI applications such as ChatGPT. This is surprising since the translation industry in particular has been working with artificial intelligence and machine translation for quite some time. The established NMT tools (neural machine translation systems such as DeepL) are transformer models, similar to the currently much discussed generative AI applications, and have been used on a daily basis in agencies for more than a decade.

[Translate to Englisch:] NMT oder GPT?

[Translate to Englisch:]

Was ist also der Unterschied zwischen GPT und Neural Machine Translation (NMT), den herkömmlichen KI-Systemen, wie sie bereits seit geraumer Zeit in Übersetzungsagenturen zum Einsatz kommen?

Generative KI-Systeme wie ChatGPT sind – vereinfacht gesprochen ­– Allzweckwerkzeuge. Sie sind mit einer großen Anzahl an frei zugänglichen Daten trainiert, die einmalig eingegeben werden. Der Input für ChatGPT und andere generative Systeme ist ein Prompt, der das System dann veranlasst einen Text zu generieren. Wodurch diese Ausgabe beeinflusst wurde oder woher die Informationen dazu stammen, ist nicht nachvollziehbar. Es ist deshalb schwierig eine Balance zwischen Kreativität und Berechenbarkeit zu finden, was für viele Anwendungen in der Technischen Redaktion ein Problem darstellt. Dies gilt insbesondere für ChatGPT, dass ja explizit darauf trainiert ist, eine „menschenähnlichen“ Konversation nachzustellen, also bewusst NICHT konsistenten Output liefert, sondern variiert. Zwar kann in einer professionellen Anwendung von ChatGPT diese Varianz auch wieder übersteuert werden, aber insgesamt sind GPT-Anwendungen noch relativ neu und unerprobt, was ihre Einbindung in Redaktions- und Übersetzungsprozesse erschwert.

Neural Machine Translation Systeme sind dagegen (wie der Name schon sagt) spezialisiert auf das Übersetzen von Texten. Sie werden mit einem zweisprachigen Korpus trainiert, wobei wiederkehrende Trainings möglich sind und dadurch Anpassungen am System vorgenommen werden können. Der Input für ein NMT ist ein gesamter ausgangssprachlicher Text, er ist also deutlich umfangreicher als etwa bei ChatGPT, das ja auf etwa über 4.000 „Tokens“ als Input begrenzt ist. Der Output von NMT ist relativ berechenbar, weil kein Text neu erstellt wird, sondern „nur“ vorhandener Text in eine andere Sprache übertragen wird. Die Arbeit mit NMT ist in Übersetzungsprozessen robust und erprobt, und die Systeme fügen sich mit einer Vielzahl von Konstellationen in die alltägliche Arbeit.

 

[Translate to Englisch:] Was ist heute möglich?

[Translate to Englisch:]

Gemeinsam ist beiden Systemen, dass sie ihre Ergebnisse auf der Basis von statistischen Wahrscheinlichkeiten erzeugen. Die Systeme „verstehen“ also nicht, was sie produzieren. Die Ergebnisse beider KI-Anwendungen sind aufgrund der enormen Datenmengen im Hintergrund dennoch sehr brauchbar. Oft lassen sich die produzierten Texte kaum von Texten unterscheiden, die von Menschen geschrieben wurden.

Allerdings kommt es in beiden Systemen (bei GPT tatsächlich noch mehr als bei NMT) zu Fehlern, die schwer aufzuspüren sind. Denn die Systeme berücksichtigen den Kontext eines Ausgangstextes nur in beschränktem Umfang. Dieses Problem ist tatsächlich bei GPT-Systemen noch größer, da sie immer wieder zu sogenannten Halluzinationen neigen und Fakten frei erfinden.

Auch die Anbindung von Terminologiebeständen ist ein Problem, das sich in KI-Systemen nur bedingt lösen lässt. Das liegt daran, dass GPT Engines im Gegensatz zu NMT Engines nicht „umtrainiert“ werden können, sondern der Output nur durch die Beigabe sehr spezifischer Anweisungen im Prompt nachjustiert werden kann. Für Unternehmen wird es somit schwierig einen einheitlichen „Tone of Voice“ zu produzieren und das Corporate Wording des Unternehmens durchzuhalten.

Deshalb müssen die Arbeitsergebnisse der KI-Anwendungen immer von Übersetzungsexperten oder Reviewern geprüft werden. Sie müssen auf die Einheitlichkeit der Terminologie achten und dafür sorgen, dass alle Fakten übersetzt wurden. Außerdem müssen sie bei GPT-Systemen prüfen, ob nicht zusätzliche oder falsche Informationen hinzugefügt oder übersprungen wurden.

 

[Translate to Englisch:] NMT und GPT im Einsatz

[Translate to Englisch:]

NMT-Systeme sind in der übersetzerischen Praxis mittlerweile Alltagsgeschäft. Entsprechend gut integriert sind NMT-Systeme in Unternehmensprozesse und entsprechend genau sind diese Systeme auf die Bedürfnisse der Übersetzung in Technischen Redaktionen abgestimmt. Zwar gibt es auch bei NMT noch Optimierungsbedarf (z. B. bei Terminologie und Tone of Voice), jedoch existieren hier eingeschliffene Verfahren.

Für generative Modelle fehlen diese Verfahren bisher noch. Die Ergebnisse von ChatGPT und Co. sind zwar gut lesbar, lassen aber auf den zweiten Blick an vielen Stellen in der Qualität zu wünschen. Auch die Integration in Übersetzungswerkzeuge ist bisher bestenfalls rudimentär. ChatGPT lässt sich deshalb bisher besser für Aufgaben abseits des klassischen Übersetzungsprozesses einsetzen, z. B. zum Umformulieren eines Textes oder für die Generierung von Trainingsmaterial für NMT.

Doch egal ob NMT oder GPT – ohne menschliche Expertise sind die Ergebnisse der künstlichen Intelligenz nicht bedenkenlos verwendbar. Auf absehbare Zeit bleibt deshalb Bedarf an Übersetzern und Übersetzerinnen, die als „Human Expert in the Loop“ den Output der diversen Systeme überwachen, reparieren und auch laufend verbessern.

 

[Translate to Englisch:]

[Translate to Englisch:]

TEst Test TEst

Other articles from Quanos

This might also interest you

Does Your Technical Writing Department Need a Component Content Management System?  

Does Your Technical Writing Department Need a Component Content Management System?

Sometimes the answer to the question “At what point do you need a component content management system?” is quite obvi…

Pushing the boundaries of technical writing with automation  

Pushing the boundaries of technical writing with automation

Every technical writing department needs input from those that know the subject matter. Often this involves time, eff…

Easier, faster, more reliable – taking your technical writing to a new level with automation  

Easier, faster, more reliable – taking your technical writing to a new level with automation

Are you already using SCHEMA ST4 in your technical writing department? Do you have the typical challenges under contr…