Was ist Conversational AI?

Conversational AI ist die Kommunikation zwischen Mensch und MaschineConversational AI – ein Schlagwort unserer Zeit. Doch was ist das überhaupt?

In dem Begriff „Conversational“ steckt das Wort „Konversation“ und AI steht für „Artificial Intelligence“: Conversational AI ist also eine gesprächsführende Künstliche Intelligenz. In jeder Maschine, mit der sich ein Mensch unterhalten kann, befindet sich demnach Conversational AI – sei es in Form eines ChatBots, einer Social Messaging App, eines Sprachassistenten oder eines VoiceBots.

Kurz gesagt zeichnet sich Conversational AI dadurch aus, dass die Mensch-Maschine-Kommunikation natürlichsprachlich abläuft: Der User kann also kommunizieren, wie „ihm der Schnabel gewachsen ist“. Dabei spielt keine Rolle, ob die Kommunikation schriftlich oder mündlich abläuft: Die Technologie, die dahintersteckt, ist dieselbe.

Unser Blog-Beitrag informiert Sie kurz und knapp über alles Wissenswerte rundum die Conversational AI:

Sprechende Maschinen mit oder ohne Conversational AI: Über ChatBots, Sprachassistenten, VoiceBots & Co.

Während Conversational AI einen Überbegriff darstellt, unter dem sich alle Anwendungen sammeln, die die intelligente Mensch-Maschine-Kommunikation beherrschen, schwirren noch viele weitere Begrifflichkeiten in der Welt der Conversational AI umher, die sich teils überschneiden und nicht selten unterschiedlich verwendet werden:

ChatBots

Anfangs waren die ChatBots hauptsächlich dafür vorgesehen, den Kundenservice zu unterstützen – das waren meist Bots ohne jede Conversational AI Funktion. Heute tummeln sie sich jedoch an allen möglichen Stellen in Webseiten, im Facebook Messenger, in iMessage oder in der Werbung.

Immer beliebter wird der E-Commerce: Dort berät uns ein Chatbot, der den Produktkatalog in- und auswendig kennt und uns auf die entsprechenden Seiten im Online-Shop weiterleitet.

Firmeninterne Chatbots unterstützen die eigenen Mitarbeiter bei Fragen oder Problemen. Ein IT-Helpdesk beantwortet zum Beispiel häufige IT-Anfragen, so dass die Mitarbeiter des Supports entlastet werden.

Voice Assistants oder Sprachassistenten

Sprachassistenten sind die hörbaren Geschwister des ChatBots. Während letztere nur in der Welt der Buchstaben leben, können wir mit Sprachassistenten mündlich kommunizieren. Häufig fragen wir dort das Wetter ab oder erkundigen uns über die Öffnungszeiten. Oft sind es wohlbekannte Namen wie Siri, Alexa oder der Google Assistant, die unsere Fragen beantworten.

Virtual Assistants

Virtual Assistants sind in die Webseite integriert. Ihre Aufgabe ist es, die Kunden durch die Webseite zu navigieren, indem sie ihnen die gesuchten Informationen liefern, eine Produktauswahl treffen oder durch eine Bestellung führen. Manche virtuelle Assistenten können schreiben und sprechen, andere nur schreiben oder nur sprechen.

Mobile Assistants

Der Begriff „Mobile Assistant“ wird eher im englischen Sprachraum verwendet. Darunter verstehen wir Sprachassistenten wie Siri, Google Now, Amazon Alexa oder Apple HomePod.

Digital Humans

Die „digitalen Menschen“ sind noch nicht allzu verbreitet, aber im Kommen: In Zukunft werden sie uns immer häufiger auf Bildschirmen erscheinen und uns als digitale Verkäufer*innen beraten oder das traditionelle Empfangspersonal ablösen.

Conversational Marketing / Conversational Commerce

Mit Conversational Marketing oder Conversational Commerce sind sämtliche Möglichkeiten gemeint, Conversational AI im Bereich Marketing & Sales einzusetzen.

Voice Ordering

Voice Ordering, die Bestellung per Stimme, ist komfortabler, als sich durch eine Webseite zu klicken. Und es ist die einzige Möglichkeit eine Bestellung auszuführen, wenn wir die Hände nicht frei haben – zum Beispiel im Auto.

VoiceBots oder Sprachdialogsysteme mit Conversational AI

Rufen wir bei einem Kundenservice an und antwortet uns ein „sprechender Roboter“, haben wir „VoiceBots“ oder „Sprachdialogsysteme“ an der Strippe. Sie sind sozusagen die Klassiker der Conversational AI und gehen zurück bis in die 1990er Jahre: Evar und FränKi waren die weltweit ersten natürlichsprachlichen Dialogsysteme, die am Erlanger Lehrstuhl für Mustererkennung entwickelt wurden. „Damals waren wir weltweit führend, sogar vor den Amis“, sagt Prof. Elmar Nöth, der Evar und FränKi mitentwickelt hatte.

Zur Vermarktung dieser Produkte wurde die Firma „Sympalog“ gegründet, die heute als „Sympalog Voice Solutions GmbH“ zahlreiche weitere Einsatzmöglichkeiten für unterschiedlichste Projekte entwickelt.

Möchten Sie es genauer wissen? Dann lesen Sie auch unsere Blog-Artikel „Was ist ein Sprachdialogsystem?“ und „Der Voicebot“.

Conversational Artificial Intelligence: Die Technologie hinter “Conversational AI”

Der alte Traum der Menschheit, mit einem Roboter zu sprechen, ist zu einem nicht unbeträchtlichen Teil also schon wahr geworden. Welche Techniken stehen hinter dem Science-Fiction-Szenario? Es sind im wesentlichen zwei, die Conversational AI erst möglich machen:

NLP – Natural Language Processing

NLP ist eine Unterkategorie der Künstlichen Intelligenz und konzentriert sich darauf, den durch Spracherkennung verschrifteten Text zu strukturieren, zum Beispiel durch das Parsen. Eine einfache Schlüsselworterkennung reicht aus: Erkennt das System zum Beispiel das Schlüsselwort „Rechnungskopie“, erfragt es die Rechnungsnummer und gegebenenfalls noch andere Informationen und sendet dem Anrufer die Rechnungskopie daraufhin automatisch zu.

Hochentwickelte, natürlichsprachliche Conversational AI braucht jedoch auch NLU:

Natural Language Understanding – NLU

Schaubild: Conversational AI braucht NLP und NLUNLU ist zwar als Einzelkomponente möglich, gehört aber meist als Unterkategorie zum Natural Language Processing.

Vereinfacht ausgedrückt konzentriert sich Natural Language Processing ohne NLU unter anderem darauf, was gesagt wurde, während Natural Language Understanding aufdeckt, was damit gemeint ist.

Um die Bedeutung einer ganzen Aussage oder Frage zu ermitteln, reichen Schlüsselwörter nicht aus. Das System muss dazu die Grammatik, die für uns so selbstverständlich ist, ansatzweise verstehen. Was ist in einer Aussage das Subjekt und was das Objekt? Worauf beziehen sich die Pronomen?

Die Voraussetzung dazu ist ein umfassendes Lexikon sowie grammatische Regeln, auf die das System zugreifen kann. Auch kompliziertere Aussagen versteht ein natürlichsprachliches System so mittels NLU:

„Hallo, ich habe heute ein Paket bekommen und es schon geöffnet. Kann ich es trotzdem noch zurückschicken?“

Eine einfache Schlüsselworterkennung wäre hier maßlos überfordert.

„Ich möchte eine Familienpizza bestellen. Die eine Hälfte mit Schinken und Salami und die andere vegetarisch. Ohne Peperoni.“

Kein Problem für ein System mit NLU: Der „Intent“, also die Absicht des Anrufs, ist schnell erkannt: „Familienpizza bestellen.“ Auch Rückbezüge wie „die andere“, also „die andere Hälfte“, erkennt NLU. Ein Negativ-Marker „ohne“ stellt sicher, dass auch Verneinungen korrekt erfasst werden. Reine NLP würde anhand der Schlüsselworterkennung nur „Peperoni“ verstehen – und die Pizza wäre eben gerade mit dem ungeliebten Gemüse garniert.

Ob nun ein einfaches, sprachgesteuertes Menüsystem oder ein hochentwickelter, natürlichsprachlicher Voicebot – Natural Language Processing ist immer dabei. Aber es ist die Technologie des NLU und des Machine Learnings, die die Conversational AI menschenähnlich erscheinen lässt.

Möchten Sie mehr über NLP und NLU wissen? Dann lesen Sie auch unseren Blogartikel “NLP, NLU – Natürlichsprachlichkeit mit Natural Language Processing”.

Warum muss Conversational AI agil sein?

Drehknopf traditional - agile

Mit dem Wandel von statischer, touch-tone gesteuerter IVR zu Conversational AI mit natürlichsprachlicher Bedienung gewinnt die Betreuung oder Anpassung von existierenden Systemen stark an Bedeutung. Zum Teil laufen einfache IVR-Systeme jahrelang unverändert, während sich die Kundenerwartungen permanent ändern.

Moderne Systeme hingegen müssen „mit der Zeit“ gehen und sich immer wieder aktuellen Situationen anpassen. Conversational AI braucht Werkzeuge für automatische Tests über alle Bereiche eines Sprachsystems (Spracherkennung, Verstehenskomponente, Dialogmanagement), um bei häufigen Änderungen eine hohe Qualität zu gewährleisten.

Da immer öfter die einzelnen Fachabteilungen Conversational AI betreuen – und nicht mehr der IT-Bereich – wird eine intuitiv bedienbare Benutzeroberfläche immer wichtiger, die die einfache Betreuung, Wartung und Weiterentwicklung gewährleistet – sei es um Inhalte einfach anzupassen oder eine graphisch aufbereitete Leistungsanalyse anzuzeigen.

Conversational AI ist kein Projekt, das man einmal in Angriff nimmt und schließlich einen Schlussstrich daruntersetzt. Sie lässt sich stetig erweitern, muss aktualisiert oder auf neue Kanäle übertragen werden. Vielleicht möchte ein Unternehmen zunächst nur seine Mitarbeiter im telefonischen Kundensupport entlasten, weitet die Conversational AI dann aber auch auf den Marketing-Bereich, den E-Commerce oder die Werbung aus.

Mit Conversational AI nicht nur Kosten senken, sondern auch den Umsatz steigern

Mit Conversational AI Geld sparenTraditionelle Conversational AI war bisher hauptsächlich darauf ausgerichtet, Kosten zu senken, indem die Künstliche Intelligenz den Mitarbeitern einen Teil ihrer Aufgaben abnimmt. Weil sich das Personal auf komplexere Anfragen konzentrieren und damit effektiver eingesetzt werden kann, sinkt der Personalaufwand.

Ein eher neuer Gedanke: Conversational AI kann nicht nur Kosten senken, sondern auch den Umsatz steigern. Im Marketing- und Salesbereich sind die Möglichkeiten der Künstlichen Intelligenz noch lange nicht ausgeschöpft, sondern werden gerade erst entdeckt:

Die Conversational AI unterstützt die Kunden dabei, mehr über Produkte herauszufinden und Kaufentscheidungen zu fällen, entweder durch virtuelle Assistenten und Chatbots auf der Webseite oder durch Digital Humans. Die Künstliche Intelligenz kommt dabei ganz nah an die Kunden heran – und kann sie an sich binden. Durch eine Eins-zu-eins-Betreuung sammelt sie Wünsche, Vorlieben und Interessen – was nicht nur der eigenen Statistik und Ausarbeitung neuer Marketing-Strategien dient, sondern auch dazu führt, dass die Kunden in Zukunft ganz individuell betreut werden.

Warum rufen Kunden überhaupt eine Webseite auf? Häufig um die Produktauswahl anzusehen und sich über deren Eigenschaften und Unterschiede zu informieren. Suchen sie ein Shampoo, unterbreitet der virtuelle Assistent auf den Haartyp des Kunden abgestimmte Vorschläge – wesentlich bequemer, als sich die Produktinformationen selbst herauszusuchen.

Webseiten mit Conversational AI wecken weitaus mehr Emotionen als traditionelle Webseiten und bleiben den Kunden daher besser im Gedächtnis. Es handelt sich um eine neue Form des Eins-zu-eins-Marketings, das sich nicht mehr anhand der Klicks oder Likes messen lässt, sondern an der Zeit, die die Kunden auf der Webseite verbringen. Davon profitiert nicht zuletzt auch das Suchmaschinen-Ranking: Und die Webseite wird häufiger angeklickt und zieht so noch mehr Interessenten an.

Das Non-Plus-Ultra ist in den meisten Fällen ein menschlicher Berater. Doch oft sind diese so teuer, dass sie gar nicht erst eingesetzt werden. An diesem Punkt springt die Conversational AI ein und bedient die Kunden. Letztendlich steigt so die Kundenzufriedenheit – und der Absatz.

Conversational AI verleiht der Marke ein Gesicht

Hinter der Conversational AI steckt eine Persönlichkeit. Ob künstlich oder nicht, sie beeinflusst uns, weckt Emotionen und verkörpert das Markenzeichen. Aus der Sicht der Kunden ist die Marke eng mit der Conversational AI verknüpft. Kein Wunder also, dass sich ein Unternehmen vorab gut überlegen sollte, welche Persönlichkeit die Conversational AI ausstrahlen sollte. Welcher Sprachstil ist beispielsweise für die entsprechende Klientel angebracht? Lustig, cool oder seriös? Welche Stimme passt? Eine Marke, die Jugendliche ansprechen möchte, wird hier einen anderen Weg einschlagen als ein Versicherungsinstitut.

Übrigens: Digital Humans können auch heute schon bis zu einem gewissen Grad den Gesichtsausdruck, die Körpersprache oder den Tonfall deuten und damit die Emotionen ihres Gegenübers erfassen. So wie Menschen sich aufeinander einstellen, kann sich auch ein Digital Human seinem Gesprächspartner anpassen.

Die Persönlichkeit der Conversational AI baut eine emotionale Bindung zu den Kunden auf – ein Schlüsselfaktor für das Kaufverhalten und ihre Treue.

Die Vorteile der Conversational AI

Die Conversational AI bietet viele Vorteile, von denen bereits einige angesprochen wurden. Hier ein kurzer Überblick:

  • Die Navigation durch die Webseite wird komfortabler.
  • VoiceBots schaffen langes Warten in der Telefonschleife ab.
  • Schneller Support – anstatt tagelangem Warten auf Antwort-E-Mails aus dem Kundenservice.
  • Der künstliche Mitarbeiter arbeitet rund um die Uhr.
  • Die menschlichen Mitarbeiter können sich interessanteren Aufgaben zuwenden. Deren Zufriedenheit steigt – die Fluktuation sinkt.
  • Besseres Suchmaschinen-Ranking durch längere Verweildauer auf der Homepage.
  • Überzeugende Customer Experience und enge Kundenbindung.
  • Innovatives Image.
  • Breite Scalability: Startpunkt ist häufig der Kundenservice, später kann die Conversational AI dann auf den Bereich Marketing & Sales ausgeweitet werden.
  • Ideal bei kurzzeitigen Spitzen, zum Beispiel bei Störungen oder einmaligen Events.

Bringen wir die Vorteile noch einmal kurz auf den Punkt: Conversational AI besticht durch Kosteneinsparungen mittels optimiertem Personaleinsatz und Umsatzsteigerung durch eine gelungene Customer Experience!

„Ich habe Sie leider nicht verstanden“

Verärgerter AnruferDie Spracherkennung legte in den letzten Jahrzehnten einen wahren Siebenmeilenstiefel-Sprung zurück: Hinter Google heute stecken etwa eine Million Stunden aufgezeichneter Sprache, während im Jahr 2000 im mit fast 170 Millionen DM geförderten Projekt „Verbmobil“ gerade einmal 600 Stunden Sprache gespeichert waren – kein Wunder also, dass sich die Spracherkennung enorm verbessert hat.

Doch auch heute können starke Dialekte oder Hintergrundgeräusche immer noch eine Herausforderung an die Technik darstellen.

Außerdem sind die Trainingsdaten das A und O für die Spracherkennung. Sind sie zu eng gehalten oder weichen zu sehr von der Realität ab, leidet das Verständnis – und das Anliegen kann nicht korrekt bearbeitet werden.

Ein weiteres Hindernis besteht in der Aufbereitung der verschiedenen Rubriken: Das Anliegen des Users wird in eine Art Schublade geschoben, etwa mit der Aufschrift „Rechnungskopie zuschicken“. Sind sich diese „Schubladen“ zu ähnlich oder nicht klar genug definiert, passieren bei der Einordnung folgenschwere Fehler. Generell gilt: Je weniger Schubladen, desto besser. Vor allem sollten sie sinnvoll und gut aufeinander abgestimmt sein.

Auch eine Conversational AI macht Fehler

Die Fehlerrate wird niemals null sein, deshalb sollten natürlichsprachliche Systeme, die sich am Gespräch mit einem Menschen orientieren, mit Fehlern umgehen können und die Möglichkeit zur Berichtigung einräumen. Auf eindeutige Korrekturen, wie „Ich habe einen Fehler gemacht“ oder „Jetzt hast du mich aber falsch verstanden“ muss die Conversational AI reagieren können.

Ist die Möglichkeit zur Korrektur dagegen nicht gegeben, sind Anrufer schnell frustriert, die in einer Frage-Antwort-Sackgasse landen:

System: „Wohin möchten Sie fliegen?“
Anrufer: „Nach Rom.“
System: „Wann möchten Sie nach Rom fliegen?“
Anrufer: „ Oh, eigentlich möchte ich ja nach Mailand, und nicht nach Rom.
System: „Ich habe Sie leider nicht verstanden. Wann möchten Sie fliegen?“

Und weiß der künstliche Mitarbeiter einmal überhaupt nicht weiter, sollten ihn menschliche Mitarbeiter auffangen und das Gespräch für ihn übernehmen.

Eine Herausforderung an die Conversational AI: Das Wissen über das Wissen

Die größte Herausforderung liegt allerdings längst nicht mehr in der Spracherkennung an sich, sondern oft an ganz anderer Stelle: Das interne Wissen benötigt eine Struktur – und manchmal mangelt es auch an dem nötigen Bewusstsein, dass das „Wissen über das Wissen“ maßgeblich für eine gelungene Automatisierung ist.

Ist das Anliegen des Kunden erkannt und in die richtige Schublade eingeordnet, muss die Künstliche Intelligenz auf Daten zugreifen können, um eine passende Antwort zu geben – häufig besteht zum Beispiel eine Schnittstelle zu einem CRM- oder ERP-System, wo die nötigen Informationen liegen.

Die Conversational AI kann nur so gut sein, wie ihr Zugriff auf die notwendigen Informationen. Dazu müssen diese aufbereitet und gezielt strukturiert werden. Nur so kann die Conversational AI „artgerecht“ gefüttert werden.

Die Unternehmensprozesse verstehen

Um Conversational AI erfolgreich einzusetzen, müssen wir die Geschäftsabläufe zuerst einmal gründlich analysieren und verstehen. Welche Fragen haben die Kunden? Welche Transaktionen bieten wir eigentlich an? Suchen unsere Kunden häufig Hilfe bei der Auswahl von Produkten?

Eine klare Strategie muss her, an welchen Stellen Conversational AI Sinn macht und zu einer verbesserten Customer Experience führt. Setzen Sie sich ein genaues Ziel, was Sie verbessern möchten, und definieren Sie deutlich den Mehrwert, den die Conversational AI bringen soll.

Vielleicht kommen Sie auch zu dem Schluss, dass für den Anfang ein einfacher Dialog mit einem festen Ablauf ausreicht. Die Natürlichsprachlichkeit – also die intelligente Fähigkeit des Systems, freie Sprache zu verstehen – kann dann in weiteren Schritten erfolgen. Der Ausbaufähigkeit der Conversational AI sind nahezu keine Grenzen gesetzt.

Ein Blick in die Glaskugel: Conversational AI in der Zukunft

Die Zukunft der Conversational AI: Ein Blick in die GlaskugelÜbernatürliche Kräfte sind nicht notwendig, um die zukünftige Bedeutung der Conversational AI vorauszusagen: Sie wird in großen Schritten immer wichtiger werden. Nicht zuletzt durch die Pandemie, die die Digitalisierung und die Aufgeschlossenheit gegenüber technologischen Veränderungen vorantreibt, wird sich ein Trend fortsetzen, den es schon vor Corona gab: Der Trend hin zur Automatisierung im Kundenkontakt.

Textbasierte Chatbots, aber vor allem auch Automatisierungen des mündlichen Gesprächs, werden in den kommenden Jahren immer selbstverständlicher werden. Sicher werden Tastatur und Touch-Screens weiterhin eine wichtige Rolle spielen, aber der Voice-Bereich wird den Trend entscheidend ergänzen.

Die Conversational AI wird sich neue Bereiche erschließen, so dass wir sie nicht mehr nur im First-Level-Support des Kundenservice antreffen werden, sondern auch mehr und mehr im Bereich Marketing & Sales oder Human Resources.

Eine Eins-zu-eins-Betreuung durch die Künstliche Intelligenz wird vor allem da kommen, wo es bisher noch gar keine Beratung gab. Und die Kunden werden diese Entwicklung akzeptieren und sogar erwarten – Siri, Alexa oder dem Google Assistant sei Dank, die den Weg dafür bereitet haben. Die Geduld, minutenlang in Warteschlangen auszuharren oder sich mit unzähligen Klicks durch eine Webseite zu navigieren, sinkt. Der Druck auf die Unternehmen steigt.

Sprachassistenten oder Digital Humans auf der Basis von Conversational AI werden wir in vollkommen neuen Bereichen antreffen und sie schnell in unseren Alltag integriert haben. Und unsere Kinder, die Zukunft von morgen, wird mit künstlichen Lernhelfern lesen lernen, Vokabeln pauken oder die englische Aussprache trainieren… und in die neue Welt der Conversational AI ganz selbstverständlich hineinwachsen.

Webinartipp

Im Contact Center Network e.V. haben wir unter dem Titel “IVR 4.0 – Individuell und Intuitiv!” die Einführung eines Sprachdialogsystems vorgestellt.