Chatbots sind im Kommen. Vor allem der Einsatz moderner künstlicher Intelligenz fördert ihren Einsatz im Kundenservice. Dabei darf sich der Servicelevel jedoch nicht verschlechtern. Die Qualität der Kommunikation mit und Information für den Kunden muss gewahrt bleiben.

Chatbots und Conversational Banking

Künstliche Intelligenz eröffnet neue Möglichkeiten der Kommunikation durch Chatbots.

Partner des Bank Blogs

Die Digitalisierung und der damit verbundene Aufstieg des Internets und mobiler Geräte haben die Art und Weise verändert, wie Menschen miteinander und mit Unternehmen interagieren. Das Internet hat den elektronischen Geschäftsverkehr (E-Commerce) angekurbelt und das Wachstum von drahtlosen Netzwerken und mobilen Geräten hat zur Entwicklung des mobilen E-Commerce (M-Commerce) geführt. M-Commerce ermöglicht es den Nutzern, E-Commerce-Aktivitäten über ein mobiles Endgerät durchzuführen. Es bietet Unternehmen vielfältige Möglichkeiten, da es die Ausweitung der Handelsaktivitäten erleichtern kann und Transaktionen ermöglicht, die vorher nicht möglich waren. Darüber hinaus ermöglicht der Aufstieg des Internets und der mobilen Smartphones, direktere Beziehungen zu ihren Kunden aufzubauen und zu pflegen.

Mobile Messenger Apps auf dem Vormarsch

Neben dem Wachstum im M-Commerce wächst auch die Zahl der monatlich aktiven Nutzer von Mobile Messenger Apps. Seit 2016 übertreffen die vier größten Messenger-Apps (Facebook Messenger, WhatsApp, WeChat, QQ Messenger) sogar die vier größten sozialen Netzwerke, wenn man die Anzahl der monatlich aktiven Nutzer betrachtet.

Als Reaktion darauf begannen mehrere Unternehmen, Fluggesellschaften, Fahrdienstleister und Versicherungsgesellschaften, ihren Kunden Dienstleistungen über Messenger-Apps anzubieten. So bieten viele Airlines ihren Reisenden jetzt die Möglichkeit, über Facebook Messenger einzuchecken, Fragen zu stellen und Informationen zu aktualisieren. Ähnliches bieten Fahrdienstleister für Straße und Schienen etc. Die Kommunikation über eine mobile Messenger-App ermöglicht letztlich Kunden und Unternehmen die Interaktion über (multimodale) Textnachrichten, eine allgemein verständliche Kommunikationsmethode und eine vertraute Oberfläche. Anstatt anzurufen, per E-Mail zu versenden oder eine App zu öffnen, können Kunden einfach per Text- oder Voicechat zu einem für sie geeigneten Zeitpunkt und bequemen Zeitpunkt auf Unternehmen zugehen.

Machen Chatbots den Menschen bald überflüssig?

Doch wie funktionieren Chatbots denn nun eigentlich? Gibt es da diese eine KI im Hintergrund, die niemand wirklich kennt, über die jeder spricht, und die den Menschen schon bald überflüssig macht?

Die Antwort sei vorweggenommen: Nein es gibt diese KI nicht, die gibt es auch nicht in anderen Bereichen und in absehbarer Zukunft wird es die auch nicht geben. Stattdessen besteht ein Chatbot, sofern er gut gemacht ist, aus cleveren Bausteinen, die ein intelligentes Verhalten auf Basis von Methoden aus der Künstlichen Intelligenz und wissensbasierten Algorithmen ermöglichen.

Neun Schritte der Funktion eines Chatbots

Die Funktionalität eines Chatbots vollzieht sich in neun Schritten. Folgendes Schaubild stellt zugleich die Architektur und den internen Ablauf innerhalb des Chatbots dar:

 

Die Funktionalität eines Chatbots vollzieht sich in neun Schritten.

Ein Mensch formuliert hier also zunächst eine natürlichsprachliche Äußerung und teilt sie entweder per Tastatur oder durch Einsprechen dem Chatbot mit. An dieser Stelle kommt bereits die erste KI Methode zum Einsatz: Automatisches Sprachverstehen, bzw. Automatic Speech Recognition (ASR). Im Herz besteht das ASR aus einem komplexen Neuronalen Netz, das mit sehr vielen gesprochenen Texten von sehr vielen unterschiedlichen Sprechern trainiert wurde. Die hier zum Einsatz kommende KI-Methode ist das Deep Learning. Die Aufgabe des ASRs besteht letztlich darin die gesprochene Äußerung des Menschen in einen maschinenlesbaren Text zu verwandeln.

Im nächsten Schritt, dem natürlichen Sprachverstehen, Natural Language Understanding (NLU), geht es darum zu erkennen, was der Text im Kontext bedeutet. Es erfolgt eine semantische Analyse. Im obigen Beispiel geht es um die Überweisung von 100 Euro, entsprechend sind die zu extrahierenden Informationen: intent: Transaction, currency: Euro, amount: 100. Hier werden unterschiedliche KI-Technologien benutzt, u.a. grammatik-basierte Formalismen, Machine Learning und Deep Learning, Informationsextraktion, sowie weitere KI-basierte Subprozeduren.

Im Schritt 4 werden die Informationen strukturiert gespeichert, um dann im 5. Schritt mit dem dynamischen, dialogischen und statischen Wissen zu einer Aktion seitens des Chatbots zu gelangen. Statisches Wissen beinhaltet hierbei die Kontoinformationen des Benutzers, die Regeln einer Transaktion, Sicherheitsbestimmungen / Autentifizierung, uvm.  Das dynamische Wissen hingegen besteht aus den in Schritt 3 erkannten strukturierten Daten des derzeitigen Dialogs. Das dialogische Wissen beinhaltet den Dialoggraphen, der u.a. bestimmt welche Informationen zum Ausführen einer Aktion benötigt werden. In diesem Kontext spricht man auch von Semantic Frames, die gefüllt werden müssen. In unserem Beispiel fehlt die Information über das Zielkonto, so dass der Chatbot als logisch nächsten Schritt versucht, diese Daten beim Benutzer nachzufragen. Hätte der Benutzer das Zielkonto bereits in einem vorigen Dialogschritt mitgeteilt, so wäre dies im dynamischen Wissen gespeichert und die Nachfrage wäre nicht nötig. Das statische und dialogische Wissen kann hier über einfache SQL Datenbanken, Graph Datenbanken oder Big Data Technologien dargestellt sein, der Aufbau kann sowohl manuell, als auch über maschinelle Extraktionsverfahren erfolgen.

Die in Schritt 6 produzierten Ausgabedaten werden nun in Schritt 7 in natürliche Sprache formuliert. Das KI-Gebiet der Natürlichen Sprachgenerierung, bzw. Natural Language Generation (NLG) kommt hier zum Einsatz. Die Hauptaufgabe der NLG ist die Formulierung von zielgruppengerechten natürlichsprachlichen Texten, die alle Informationen und Intentionen aus Schritt 6 beinhalten sollen. Bei multimodalen Chatbots ist auch eine Kombination aus textueller und graphischer Information möglich.

Im 8. Schritt wird nun je nach Interaktionskanal das Ergebnis aus Schritt 7 an den Benutzer weitergeleitet. Für sprachbasierte Chatbots passiert hier die Synthese von natürlicher Sprache über ein sogenanntes Text-to-Speech System (TTS). Hinter dem TTS verbergen sich wiederum KI-Methoden aus dem Maschinellen bzw. Deep Learning.

Technologischer Fortschritt bereitet den Boden für Chatbots

Nach dieser Blaupause funktionieren alle ernst zu nehmenden Chatbots. Einige legen mehr Wert auf exakte Informationsstrukturen und vermeiden maschinelle Methoden beim Aufbau des zugrunde liegenden Wissens. Andere Chatbots wiederum verbessern über die Dialoge kontinuierlich das dialogische und statische Wissen. Jedes Einsatzgebiet verlangt hier eine andere Ausrichtung, die Lösung liegt oft zwischen diesen beiden Extremen.

Warum erfahren nun die Chatbots gerade in der letzten Zeit einen Aufschwung, waren doch die sogenannten Avatare – so hießen die Chatbots, die man vor etwa zehn Jahren auf vielen Webseiten gefunden hat – letztlich überwiegend nutzlos und verschwanden nach einiger Zeit wieder? Ein Grund dafür liegt an den Erfolgen in den Bereichen maschinellen Lernens und den Big Data Technologien, die es erlauben sehr große Datenmengen innerhalb kürzester Zeit zu verarbeiten. Hierdurch wurden die einzelnen Schritte qualitativ wesentlich verbessert bzw. überhaupt erst möglich. Ein anderer Grund ist, wie bereits oben erwähnt, der stetig wachsende M-Commerce.

Durch die KI-Technologien in Form von Chatbots können Unternehmen heute einen direkten Kanal zum Kunden 24/7 in beide Richtungen offen halten. Die Gleichung könnte hier also lauten: „KI = Kundenzentrierte Interaktion“.

Menschen bleiben wichtig

Durch den technologischen Fortschritt in den Bereichen KI und Big Data werden konversationelle Schnittstellen in naher Zukunft in vielen Bereichen etabliert werden. Immer besser werdende selbstlernende Künstliche Intelligenz wird zu wesentlicher Prozessautomatisierung und Kostenreduktion führen. Dabei werden Sicherheit und Privatsphäre wichtige Hürden der Akzeptanz bleiben. Auf absehbare Zeit wird ein Chatbot das persönliche Gespräch nicht ersetzen.