Artificial Intelligence in Technical Documentation, Part 2

Artificial intelligence is already widespread in technical documentation these days. In this interview with Fabienne Lange and Eva-Maria Meier, project managers at plusmeta GmbH, we hear about the types of work for which artificial intelligence is already used in technical documentation, the advantages that this new technology brings, and where its boundaries lie. Part one of the interview on artificial intelligence methods is available on the plusmeta blog in German. plusmeta GmbH has its head office in Karlsruhe and is a pioneer of artificial intelligence in technical documentation, as well as a Quanos partner.

Schon heutzutage ist Künstliche Intelligenz in der Technischen Dokumentation verbreitet. Bei welchen Arbeiten in der Technischen Dokumentation Künstliche Intelligenz bereits zum Einsatz kommt, welche Vorteile die neue Technologie mit sich bringt und wo deren Grenzen liegen, erklären uns Fabienne Lange und Eva-Maria Meier, Projektmanagerinnen bei der plusmeta GmbH, im zweiten Teil dieses Interviews. Der erste Teil des Interviews zu KI-Methoden ist auf dem Blog von plusmeta zu finden. Die plusmeta GmbH mit Sitz in Karlsruhe ist Pionierin für künstliche Intelligenz in der Technischen Dokumentation und Partner von Quanos.

Frau Lange, Frau Meier, im ersten Teil unseres Interviews haben Sie uns erklärt, wie Künstliche Intelligenz funktioniert und welche Verfahren in der Technischen Dokumentation bereits zum Einsatz kommen, also zum Beispiel Machine Learning und regelbasierte Verfahren. Jetzt würden uns konkrete Anwendungsfälle interessieren. Können Sie ein paar davon beschreiben?

Fabienne Lange:  Der für uns wichtigste Anwendungsfall ist die Metadatenerkennung. Moderne Anwendungen wie Content Delivery Portale sind auf passende Metadaten angewiesen, damit Anwender zielgerichtet suchen und unter den Treffern die gewünschte Antwort finden können. Aber auch Standards im Umfeld der Technischen Kommunikation fordern Metadaten, so etwa die VDI 2770 oder iiRDS. Die KI-Unterstützung ist hier ein richtiger Türöffner. In der Technischen Dokumentation gibt es in der Regel große Mengen an Bestandsdaten. Müsste man diese händisch ohne Unterstützung aufbereiten, wäre das zeitlich einfach nicht leistbar und auch wirtschaftlich nicht sinnvoll.

Beispielsweise können mit der Regelbasierten Erkennung über das Vorkommen von Wörtern oder Synonymen im Text Metadaten erkannt werden. Der Vorteil hier ist, dass dafür kein zuvor aufwändig trainiertes Machine-Learning-Modell notwendig ist. Damit die regelbasierte Erkennung funktioniert, sollten die Wörter oder Synonyme aber explizit im Text vorkommen, wie es beispielsweise beim „Produkttyp“ üblich ist.

Spielen hier auch Knowledge Graphen eine Rolle?

Fabienne Lange: Ja, auf jeden Fall. Als Unterkategorien der Regelbasierten Erkennung können auch Knowledge Graphen und Extraktoren eingesetzt werden, um Metadaten zu erkennen. Knowledge Graphen können anhand von Produktwissen weitere Metadaten herleiten, die selbst gar nicht im Text vorkommen. Ein Beispiel dafür ist etwa der Hersteller eines Produktes, der über den Knowledge Graph mit dem Produkt verbunden ist.

Extraktoren hingegen eignen sich gut, um Metadaten zu erkennen, die bestimmten Mustern folgen. Beispiele dafür sind etwa Seriennummern, Auftragsnummern oder Datumsangaben. Das funktioniert auch dann, wenn es keine Auswahlliste zum Abgleich gibt.

Und wie sieht es mit Machine Learning aus, wenn es um die Erkennung von Metadaten geht?

Fabienne Lange: Natürlich hat auch das Machine Learning seine Daseinsberechtigung im Bereich der Metadatenerkennung. Zwar ist hier vorab ein Training mit Beispieldaten notwendig, dafür können mithilfe von Machine Learning Metadaten vorhergesagt werden, die mit den anderen Methoden oft nur schwer auffindbar wären. Das sind etwa Metadaten wie die Zielgruppe, das Informationsthema oder der Topictyp. Ein Text für einen Experten ist beispielsweise anders geschrieben als ein Text für einen Laien. Und in einem Topictyp „Aufgabe“ sind mehr anleitende Texte enthalten als in einem „Konzept“. Diese Auffälligkeiten können von einem Machine-Learning-Modell erkannt werden. Das ermöglicht es, auch Metadaten vorherzusagen, die nicht anhand einzelner Wortvorkommen festgemacht werden können. Insgesamt haben alle Verfahren ihre Stärken und Schwächen. Kombiniert man sie, kann man zu sehr guten Ergebnissen bei der Metadatenerkennung kommen.