Was sind Sprachassistenten?
Das Wort „Sprachassistent“ wird für Software verwendet, die mittels gesprochener Sprache Informationen zur Verfügung stellt. Dabei kommt eine Spracherkennung zum Einsatz, die das Gesagte analysiert und anhand von Schlüsselwörtern interpretiert, um die Absicht des Nutzers zu erkennen.
Der Sprachassistent wählt aus vorgegebenen Antwortmöglichkeiten aus und gibt diese mündlich aus. Im Zweifel stellt er Rückfragen, um die richtige Information zu finden. So entsteht eine Filtersuche, die der Nutzer als Gespräch wahrnimmt. Abgesehen von der Spracherkennung und -ausgabe funktioniert ein Sprachassistent ähnlich wie ein Chatbot. Teilweise verwenden wir das Wort deshalb als Synonym.
Sprachassistenz: Wie läuft das Gespräch ab?
Im besten Fall funktioniert ein Dialog mit einem Chatbot genau wie ein Dialog mit einem menschlichen Gesprächspartner: Sie stellen beispielsweise eine Frage und der Chatbot reagiert, idealerweise mit der richtigen Antwort oder einer lösungsrelevanten Nachfrage.
Um das zu ermöglichen, müssen prinzipiell folgende Schritte durchlaufen werden:
- Sie äußern eine Frage.
- Der Chatbot nimmt Ihre Äußerung als Input.
- Er ermittelt eine relevante, weiterführende Antwort.
- Er gibt Output aus und wartet auf neuen Input.
Für Außenstehende ist die Sprachanalyse undurchschaubar. Auch für uns soll das heute nicht das Hauptthema sein: Bei diesen rein technischen Aspekten haben automatische Sprachverarbeitung und Künstliche Intelligenz große Fortschritte gemacht, sodass zufriedenstellende Lösungen gefunden werden können.

Video: Technische Doku per Sprachassistent
Vorteile von Sprachassistenten in der Technischen Redaktion
Für jede Technische Redaktion ist ein positives Nutzererlebnis zentral. Smarte Informationen werden heute im gesamten Unternehmen gesammelt und zentralisiert, um die Benutzerfreundlichkeit zu verbessern. Warum also nicht auch eine Technische Doku erstellen, mit der Nutzer sprechen können?
Der Vorteil: Die Suche und die Informationsaufnahme verlaufen als Gespräch. Die Hände bleiben somit frei, was die zeitgleiche Arbeit am Produkt vereinfacht. Nutzer müssen nicht zwischen der Anleitung und der Arbeit an einer Maschine oder einem Gerät hin- und herwechseln. Außerdem überzeugen Sprachassistenten mit einer schnellen Bereitstellung von Informationen. Menschen mit eingeschränktem Sehvermögen oder mangelnden Lesefähigkeiten profitieren ebenfalls von Sprachassistenten.
Aufseiten eines Serviceanbieters sind Chatbot eine gute Möglichkeit, Teamkapazitäten vor allem bei zeitfressenden Standardfragen zu entlasten. Sprachassistenten werden zudem als innovatives Format angesehen, was auf das Markenimage einzahlt.
Was Unternehmen bei der Verwendung von Sprachassistenten in der Technischen Redaktion beachten müssen
- Nicht in jedem Fall funktioniert ein Sprachassistent optimal, zum Beispiel bei lauten Umgebungsgeräuschen, Dialekten und Akzenten.
- Hat ein Sprachassistent seine Mühe in der Spracherkennung, stellt unnötige Nachfragen oder gibt Antworten aus, die unpassend sind, sorgt dies für Frust beim Anwender.
- Insbesondere in der Technischen Dokumentation muss aus Sicherheits- und rechtlichen Gründen ein besonderes Augenmerk darauf liegen, dass der Sprachassistent korrekte und aktuelle Antworten gibt.
- Beim Einsatz von Sprachassistenz müssen die Anforderungen an den Datenschutz erfüllt werden, da Nutzerdaten verarbeitet werden.
- Nicht alle Nutzer sind bereit, einen Sprachassistenten zu verwenden, sondern bevorzugen nach wie vor die menschliche Kommunikation.
- Die Technische Dokumentation muss modular aufgebaut, die Informationseinheiten mit Metadaten versehen sein. Manche Redaktion müssen erst die Grundlagen schaffen, um Sprachassistenten einführen zu können.
Wie kommt der Chatbot an den Content?
Eine Frage stellt sich: Wie ermittelt der Chatbot eine relevante, weiterführende Antwort, die zur Situation und Zielgruppe des Fragestellers passt? Und woher nimmt er seine Informationen?
Stellen wir uns folgende Situation vor: Ein Fragesteller benötigt Informationen zum Austausch eines Ventils. Er befindet sich also in einem Wartungsszenario. Unmittelbar betroffen davon sind das Ventil und die Pulverlackieranlage, wobei das Ventil Teil der Anlage ist. Sowohl Ventil als auch Anlage liegen in unterschiedlichen Formen oder Varianten vor, sodass das zu verwendende Ventil vom Typ der Anlage abhängt.
Bestimmte Informationen kann der Chatbot aus dem Input seines Gesprächspartners gewinnen. Wenn sie nicht ausreichend spezifiziert sind, müssen sie erfragt werden („Welches Ventil meinen Sie?“, „Welches Anlagenmodell haben Sie?“). Auch der Kontext erschließt sich häufig durch bestimmte Schlüsselworte (zum Beispiel „austauschen“ als typisches Schlagwort für das Wartungsszenario).
Andere Informationen müssen bereits im Chatbot-System gespeichert sein, so etwa die Information,
- welche Anlagenmodelle es gibt,
- aus welchen (wartbaren) Teilen diese jeweils bestehen,
- dass das Schlauchquetschventil (Typ B mit der Nennweite DN 65) eines dieser Teile ist,
- dass es bei der Absaugeeinheit eingebaut ist,
- welche technischen Daten das Ventil aufweist und hier insbesondere
- welche Größe (Nennweite) es hat.
Wenn der Fragesteller das Angebot „Benötigen Sie Hilfe beim Austausch des Ventils“ nicht mit „Nein“ beantwortet hätte, dann hätten auch die entsprechenden Handlungsanweisungen für genau diese Wartungstätigkeit bei genau diesem Anlagenmodell gegeben werden müssen. Und spätestens hier bemerken Content-Affine den Zusammenhang zwischen diesen Daten und den Daten, die für die Technische Dokumentation vorgehalten werden: Zielgenaue Antworten kann ein Chatbot nur geben, wenn die benötigten Daten in modularer und klassifizierter Form vorliegen.
Klassifizierte Daten für qualifizierte Antworten
Ein Monteur, der im Rahmen einer konkreten Wartungstätigkeit nach einem bestimmten Ventil fragt, benötigt andere Antworten als ein Ingenieur, der sich im Rahmen der Produktentwicklung allgemein über dieses Bauteil informieren will. Ein Metadatum, das das entsprechende Informationsmodul klassifiziert und Angaben über dessen sinnvolle Einsatzszenarien (z. B. Installation, Wartung und Instandhaltung, Produktinformation) gibt, steuert dann die situationsspezifische Auswahl.
Wenn es um die Auswahl von Komponenten geht – im obigen Fall um das Ventil, aber auch um die entsprechende Anlage –, stellen sich häufig Fragen, zum Beispiel zu welcher Unterart einer genannten Kategorie ein Produkt gehört (Welches Anlagenmodell aus unserer Produktpalette? Welches der in der Anlage verbauten Ventile ist gemeint?). Um ungenauen Input zu klären, helfen beispielsweise Taxonomien. Sie bilden Teil-Ganzes-Beziehungen oder Menge-Untermenge-Beziehungen ab und ermöglichen so immer detailliertere Rückfragen und damit zielgenauen Content-Output.
Aber auch abhängig vom Fragesteller können die Antworten unterschiedlich ausfallen, wenn etwa Administratoren spezifischere Informationen erhalten als Standard-Anwender. Derartige Benutzerrechte können ebenfalls mittels Metadaten festgelegt werden.
Während bestimmte Teilaufgaben des Chatbot-Dialogs maschinell erledigt werden können, zum Beispiel die Analyse des sprachlichen Inputs, bleibt der Content nach wie vor die zentrale Aufgabe der Technischen Redaktion. Sie erfasst, strukturiert und klassifiziert die Inhalte derart, dass die Antworten sinnvoll und so benutzer- und situationsspezifisch ausfallen, wie es der Chatbot verspricht.
Mit SCHEMA ST4 zur flexiblen und intelligenten Content-Verwaltung
Für die Erstellung und Verwaltung solcher Informationseinheiten ist ein modernes, XML-basiertes Content-Management-System wie SCHEMA ST4 das Mittel der Wahl. Es bietet alle Möglichkeiten und Funktionalitäten, die oben angesprochen wurden: modulare Erfassung von Informationseinheiten, die dann frei eingesetzt und kombiniert werden können, Kategorisierung von Content mittels Metadaten (auch automatisiert mit dem ST4 AI Jetpack) sowie die Anlage und Einbindung von Taxonomien zur Abbildung von Zugehörigkeiten. Ein eingebautes Übersetzungsmanagement rückt sogar mehrsprachige Chatbots in greifbare Nähe.
Video: So erstellen Sie einen Sprachassistenten
Sie haben sich ein Bild über Sprachassistenten gemacht und möchten ein solches Vorhaben nun in die Tat umsetzen? Lara Krägel und Gerhard Glatz von der Dokuschmiede haben für Sie die wichtigsten Informationen zur Umsetzung im Video zusammengefasst. Darin geht es unter anderem um Folgendes:
- Warum Technische Doku als Sprachassistent?
- Welche Technologien sind hier notwendig?
- Wieso ist hier ein XML-Redaktionssystem so hilfreich?
Erfahrungsbericht: Wie die Dokuschmiede Sprachassistenten umsetzt
Gerhard Glatz und Lara Krägel sind Technische Redakteure bei Dokuschmiede (Stand Juli 2022), einem Dienstleister für Technische Kommunikation und Informationsdesign. Im Interview berichten sie von ihren Erfahrungen und erklären, worauf Redaktionen bei Sprachassistenten als Ausgabeformat für die Technische Dokumentation achten sollten.

Quanos: Ihr habt Dokumentationsinhalte auf einer Chatbot-Plattform umgesetzt. Ich frage jetzt mal provokant: „Braucht man so etwas?“
Lara Krägel: Aber sicher doch. Vielen ist nicht klar, wie oft wir heute schon Chatbots verwenden. Die meisten denken nur an einfache Frage-und-Antwort-Bots auf Websites.
Gerhard Glatz: Genau! Und vergessen dabei, dass Alexa, Siri und Konsorten ebenso Chatbots sind wie das Dialogsystem im Auto. Auch in vielen anderen Geräten und Kontexten sind Chatbots integriert. Wir unterscheiden Chatbots in Textbots, die per geschriebener Sprache mit dem Menschen kommunizieren, und Sprachassistenten, die sogar gesprochene Sprache verarbeiten und ausgeben können.

Quanos: In welchen Fällen lohnt sich ein Chatbot?
Gerhard Glatz: Sprachassistenz ist vor allem ein hilfreiches Format, wenn man die Hände nicht frei hat. Zum Beispiel bei Wartungsarbeiten oder beim Bedienen von Hausgeräten, wie etwa in der Küche beim Kochen.
Lara Krägel: Aber unabhängig davon ist ein Chatbot ein tolles Angebot für Leute, die lieber mündlich kommunizieren als lange Texte zu lesen. Und er bietet eine nutzerfreundliche Alternative für Menschen mit Sehbehinderung oder Leseschwäche.
Quanos: Ihr seid begeistert von Chatbots, aber wie war das denn auf dem Weg zum Chatbot? Lief da alles reibungslos?
Lara Krägel: Na ja, einen Chatbot zu entwickeln, ist nicht trivial. Trotzdem lief es recht geschmeidig. Das hat vermutlich auch damit zu tun, dass wir in den Anfang eine Menge Konzeption und Planung gesteckt haben. Das hat sich im Projektverlauf ausgezahlt.
Gerhard Glatz: Stimmt. Die wichtigste Weiche haben wir am Anfang gestellt und das Projekt in zwei Prozesse aufgeteilt. Lara hat sich um den Content gekümmert. Man vergisst gerne, dass die Aufbereitung für den Chatbot eine Menge Content-Arbeit bedeutet.
Lara Krägel: Allerdings war bei der Auswahl des technischen Systems und bei der Entwicklung auch eine Menge zu tun. Das hat Gerhard gemacht. Aber natürlich waren wir die ganze Zeit im engen Austausch. Komplett parallel aneinander vorbei arbeiten, funktioniert nicht.
Quanos: Was war für die Content-Arbeit notwendig?
Lara Krägel: Angefangen haben wir mit einer Zielgruppenanalyse. Auch da hat sich bestätigt, dass sich Konzeptarbeit am Anfang lohnt. Danach haben wir uns an die Content-Aufbereitung gemacht. Dabei hat es uns sehr geholfen, dass die Doku-Daten schon in einem CCMS vorlagen. Denn nicht jeder Doku-Inhalt ist auch für Chatbots geeignet. Wenn die Daten in einem CCMS schon topic-orientiert vorliegen, ist das leichter zu identifizieren. Außerdem hat uns im CCMS geholfen, dass viele Metadaten schon vergeben waren. Diese konnten wir auch für den Chatbot nutzen. Denn irgendwoher muss ein Content-Element ja wissen, für welche Anwenderfrage es gedacht ist. Zudem ist die Dialogstruktur ein wichtiger Aspekt. Es reicht nicht aus, wenn der Bot nur ein Textstück vorliest. Er muss bei Unklarheiten nachfragen, zum Beispiel wenn es Voraussetzungen für eine Handlung gibt oder eine Handlungskette schrittweise durchgehen.
Quanos: Und wie war das auf der technischen Seite?
Gerhard Glatz: Bei uns war der erste Schritt die Bot-Auswahl. Es gibt mittlerweile viele Systeme unterschiedlicher Komplexität, angefangen bei einfachen FAQ-Systemen und Script-Bots bis hin zu echten virtuellen Agenten. Je komplexer die Lösungen, desto mehr Möglichkeiten hat man, aber desto aufwendiger ist dann auch die Programmierung und Content-Aufbereitung für den Bot. Letzten Endes haben wir uns für eine Lösung mit Google Dialogflow entschieden und haben eine Voice-App für den Google Assistant entwickelt. Das hat den Vorteil, dass wir die ausgereifte Spracherkennungs- und Ausgabetechnologie von Google nutzen konnten.
Danach haben wir den Bot entwickelt. Dazu war dann schon der Content von Lara wichtig, weil man dann einen besseren Eindruck bekommt, wie die Dialogsituation aussieht und wie der Bot sich später verhalten soll. Um den Inhalt aus dem CCMS im Chatbot wiederverwenden zu können, haben wir eine Schnittstelle entwickelt, die den Content aufbereitet und ihn teilweise umformuliert. Hierzu war eine eigene Publikationsstrecke notwendig. So werden die Dokumentationsinhalte, die im Bot als Antworten auf die Nutzerfragen dienen, direkt in die Bot-Plattform gespielt. Die Daten müssen somit nicht an mehreren Stellen gepflegt und verwaltet werden und der Single-Source-Aspekt ist nach wie vor gegeben. Als wir dann einigermaßen zufrieden waren, haben wir das ganze System ausgiebig evaluiert und dabei die eine oder andere Schwachstelle entdeckt. Und zu guter Letzt musste dann der Bot veröffentlicht werden. Aber jetzt ist er da. Wer will, kann sich gerne eine Demo unseres neuen virtuellen Kollegen auf unserer Homepage ansehen.
Quanos: Ein spannendes Projekt, das ihr umgesetzt habt. Zu guter Letzt interessiert mich eure Einschätzung: Werden wir in Zukunft unsere Dokumentation nur noch von Bots erzählt bekommen?
Lara Krägel: Also nur noch von Bots … Das wäre sicher übertrieben. Es gibt einige Inhalte, die für Bots nicht so geeignet sind. Und manche Leute lesen ja auch lieber. Bots werden andere Ausgabeformate sicherlich nicht vollständig ablösen können, aber ich denke, sie werden in Zukunft auf jeden Fall eine wichtige Rolle in der Dokuwelt spielen, denn sie sind in vielen Kontexten ein hilfreiches, ergänzendes Format.
Gerhard Glatz: Ganz sicher. Denn es gibt jetzt schon eine große Reihe von Anwendungsfällen. Und die Nutzungsgewohnheiten der Menschen verändern sich. Immer mehr Leute kommunizieren lieber mündlich und dialogisch als lange Texte am Stück durchzulesen. Also auf jeden Fall: Bots sind stark im Kommen.
Unser Podcast „Die Doku-Lounge“: Folge 7 über Sprachassistenten
Unser Podcast "Die Doku-Lounge" dreht sich um alles rund um die Technische Redaktion. In jeder Folge lädt Kerstin Berke Profis aus der Branche ein, um ein Thema näher unter die Lupe zu nehmen. In dieser Folge hat sie sich mit Lara Krägel und Gerhard Glatz von der Dokuschmiede über Sprachassistenten unterhalten. Wir wünschen Ihnen viel Spaß!