Künstliche Intelligenz 25.09.2020

Die Arbeit der Zukunft – mit digitalen Assistenten. Teil 1.

Da gerade die text- und sprachbasierte Erkennung natürlicher Sprache von den Fortschritten im Bereich der Künstlichen Intelligenz in den letzten Jahren profitieren konnte, geraten digitale Assistenten, auch gerne als Chatbots bezeichnet, immer stärker in den Nutzenfokus von Unternehmen.

Artikel teilen

Lucas Strauss
Consultant Digital Solutions

Solche Technologien sind nicht neu: Sie erfreuen sich schon seit den 1990er-Jahren zunehmender Popularität. Mit einem Unterschied: Während solche Assistenzsysteme, die Menschen bei der Ausführung kognitiver Aufgaben und Entscheidungsfindungen unterstützen sollen, früher nur einfache Aufgaben durch den Einsatz schwacher KI erledigen konnten, sind sie heute lernfähige digitale Assistenten.

Eine Kommunikation mit diesen softwarebasierten digitalen Assistenten kann dabei in Textform oder in gesprochener Sprache erfolgen. Bekannt sind Assistenten wie Siri, Alexa und Cortana aus dem privaten Umfeld. Nun finden die Systeme durch die gestiegene Leistungsfähigkeit aber zunehmend Verbreitung in Unternehmen.

Grund genug, sich intensiv mit den Potenzialen und Anwendungsbereichen von künstlichen Assistenten zu beschäftigen. Für diese Evaluation lohnt ein tiefer Blick in die Technologie, um anschließend sinnvolle Anwendungsmöglichkeiten im Unternehmenskontext ableiten zu können.

Betrachtung der Technologie – wie funktionieren moderne digitale Assistenten?

In der Wissenschaft werden u. a. sechs Merkmale genannt, die digitale Assistenten ausmachen:

  • Zielgerichtetheit/Proaktivität: ergreift von selbst die Initiative
  • Reaktivität: kann auf Umwelteinflüsse eingehen
  • Kommunikation/Kooperation: kooperiert mit anderen Software-Agenten, interagiert mit Menschen in natürlicher Sprache
  • Persönlichkeit/Charakter: menschenähnliche Emotionen und menschenähnliches Verhalten
  • Mobilität: kann sich innerhalb von Kommunikationsnetzwerken bewegen
  • Schlussfolgerungs- und Lernfähigkeit: kann eigenständig aus Wissen Schlüsse ziehen

Es leuchtet ein, dass einiges an „Intelligenz“ notwendig ist, damit eine Maschine diese Dinge beherrscht. Aufmerksame Leser werden sich nun fragen: Wie funktionieren diese digitalen Assistenten, die in der Wissenschaft gerne auch als Conversational User Interfaces (CUI) bezeichnet werden, denn nun?

Einen Entwurf für die zeitgemäße Architektur eines CUIs liefert eine Forscherin der Universität St. Gallen. Der moderne Ansatz solcher Systeme besteht demnach aus einer Drei-Komponenten-Bauweise und ist in vereinfachter Form in der folgenden Abbildung dargestellt.

Abbildung: Moderne Systemarchitektur von Chatbots.

Quelle: In Anlehnung an Stanoevska-Slabeva, K. Conversational Interfaces — die Benutzerschnittstelle der Zukunft?

 

Die Systemarchitektur charakterisiert sich hierbei durch ein Front-End, das die direkte Benutzerschnittstelle zum Nutzer darstellt und bei einem Chatbot aus der textbasierten Dialogkomponente besteht. Nutzer-Inputs werden von dort an die Komponente „Conversational Intelligence“ geleitet, die für die Analyse und Antwortgenerierung zuständig ist.

Die grundlegende Sprachverarbeitung in der Conversational Intelligence erfolgt dabei auf Basis von Natural-Language-Technologien (NLP). NLP fokussiert die Umwandlung von menschlicher Sprache in für den Computer verständliche Sprache, damit auf dieser Basis eine Handlung erfolgen kann.

Die Conversational Intelligence als zentrale Systemkomponente verarbeitet die Informationen und synthetisiert Sprache dann entweder auf Basis von einfachen Keyword-Analysen, regelbasiert oder durch KI. Hat das System den Kontext sowie die Nutzereingabe verstanden, können mögliche Antworten herausgearbeitet werden. Dazu wird auf das Back-End zugegriffen, welches aus Schnittstellen zu externen Applikationen und weiteren Daten besteht. Durch Musterabgleich werden hier passende Antworten zugeordnet.

Halten wir nach der Betrachtung der Funktionsweise fest: In modernen digitalen Assistenten wird Natural Language Understanding (NLU) zur Kategorisierung der Absicht des Nutzers, Dialog Management (DM) zur Bestimmung der Absicht des Nutzers und Natural Language Generation (NLG) zur Generierung einer Antwort in natürlicher Sprache genutzt – alles mittels Verwendung von KI.

Um die Einschränkungen regelbasierter Technologien, also vorprogrammierter Systeme, zu überwinden, wird die Sprachverarbeitung also zunehmend mithilfe von KI und Machine Learning (ML) automatisiert. Mit dem Ziel eines natürlichen Gesprächsverlaufs können Assistenten auf KI-Basis so offen formulierte Aussagen analysieren und durch Nutzung verfügbarer Daten passende Antworten generieren. Bei diesen Systemen erfolgt die Übersetzung der natürlichen Sprache ebenfalls in strukturierte Daten, jedoch mit dem Unterschied, dass das System automatisch Verknüpfungen zwischen einer Vielzahl von vorprogrammierten Daten herstellt und dynamisch Inhalte generiert. Machine Learning als Teilbereich der KI bildet hierbei die Grundlage solcher „KI-basierter“ Chatbots.

Denn mithilfe von Machine Learning werden IT-Systeme in die Lage versetzt, auf Basis vorhandener Datenbestände und Algorithmen, Muster und Gesetzmäßigkeiten zu erkennen und Lösungen zu entwickeln. Das aus diesen Erfahrungen gewonnene künstliche Wissen bzw. diese Intelligenz wird als ML definiert. Hierfür wird das System im ersten Schritt mit einem Test-Datensatz trainiert. Im weiteren Verlauf der Betriebsphase lernt das System kontinuierlich weiter, um immer besser auf die vorhandenen Daten zuzugreifen. Das bedeutet, solche Systeme lernen aus jedem Gespräch und entwickeln sich selbstständig weiter. Mit ausreichend Training und Analyse, auf Basis des Feedbacks der Anwender, können sich somit komplexe Reaktionsmuster ergeben, die eine freie und natürliche Unterhaltung ermöglichen. KI-Chatbots stellen damit die komplexeste Form von digitalen Assistenten dar. Doch wo liegen die Grenzen der Technologie? Dafür müssen wir uns im Detail mit der KI in digitalen Assistenten und der Datenverarbeitung beschäftigen.

Potenziale digitaler Assistenten – Datenverarbeitung unter Nutzung von KI und ML.

In der Informatik versucht man bereits seit den 1950er-Jahren, einen Computer so zu programmieren, dass er eigenständig Probleme bearbeiten kann. Mit neuen Technologien und der Weiterentwicklung von KI ist die Forschung diesem Ziel vor allem in den vergangenen Jahren durch viele Fortschritte näher gekommen – der breite Einsatz von KI konnte sich u. a. als globaler Trend etablieren.

Aber was ist KI überhaupt? Über die Jahre der Forschung haben sich unzählige Definitionsversuche gebildet, die je nach Fachrichtung unterschiedliche Facettierungen haben.

Das liegt nicht zuletzt daran, dass „Intelligenz“ auf verschiedenen Ebenen existiert und es ebenfalls keine einheitliche Begriffserklärung gibt. Oft wird Intelligenz als eine allgemeine geistige Fähigkeit beschrieben, die unter anderem die Fähigkeit umfasst, Regeln sowie Gründe zu erkennen, abstrakt zu denken, aus Erfahrungen zu lernen, komplexe Ideen zu entwickeln, zu planen und Probleme zu lösen. Künstliche Intelligenz kann demnach als der Versuch beschrieben werden, eine menschenähnliche Intelligenz nachzubilden. KI-Experten halten es für sehr wahrscheinlich, dass Intelligenzen in den nächsten Jahrzehnten künstlich erschaffen werden, die sogar dem Menschen überlegen sein dürften.

Ein Blick in die Gegenwart zeigt allerdings, dass es noch lange dauern wird, bis die Leistungsfähigkeit von Algorithmen solche Szenarien erlaubt. Im Idealfall könnten digitale Assistenten dann nicht nur Fragen beantworten und einfache Prozesse ausführen, sondern bei jedem Gespräch lernen und sich verbessern, um nicht nur in verschiedenen Kontexten angemessen reagieren zu können, sondern auch, um ihren Leistungsumfang selbstständig zu erweitern und komplexere Prozesse zu automatisieren.

Um dies bereits heute zu ermöglichen, wird in digitalen Assistenten – wie bereits beschrieben  –  im  Allgemeinen maschinelles Lernen (ML) in Verbindung mit der Verarbeitung natürlicher Sprache (NLP) im Bereich der Künstlichen Intelligenz verwendet.

Während heutzutage digitale Assistenten also verschiedene Methoden der KI zur besseren Verarbeitung der ihnen übertragenen Informationen nutzen, um ihre Aufgabe möglichst erfolgreich zu erledigen, stellt die Wissensdatenbank das „Gehirn“ der Systemarchitektur dar. Auf ihre Informationen und Daten bezieht sich ein System während der Dialog-Verwaltungsphase, also der Phase, bei der die Eingaben des Nutzers analysiert werden. Im Allgemeinen enthält diese Wissensbasis Schlüsselwörter bzw. Phrasen, die auch in (der Wissensbasis) vorhandenen möglichen Antworten vorkommen.

Damit Chatbots auf dieses Wissen zugreifen können, muss es allerdings aus umfangreichen Informationsquellen extrahiert und dann in einer Wissensdatenbank gespeichert werden. Hierbei kann es sich um strukturierte, halbstrukturierte und unstrukturierte Informationen handeln, wobei die meisten Systeme lediglich Daten aus strukturierten Dokumenten abrufen können. Durch die kürzlich durchgeführte Kombination der bereits erläuterten NLP-Techniken mit Machine Learning konnte das Auffinden von Mustern aus großen Datenmengen bereits verbessert werden. Auch gibt es bereits Forschungsansätze, in denen Systeme Wissen aus unstrukturierten Daten gewinnen konnten.

Dessen ungeachtet steht die Forschung vor der Herausforderung, nicht nur (unstrukturierte) Daten für die Systeme zugänglich zu machen, sondern auch die Verarbeitung und das Verständnis von Informationen in den Systemen so zu ermöglichen, dass kognitive Prozesse, ähnlich wie denen des Menschen, möglich werden. Mit dem Gelingen dieses Vorhabens, also der Erschaffung eines „Gehirns“, das Daten ganzheitlich verarbeiten kann, würde zumindest in der Theorie ein wirklich intelligentes System entstehen.

Sie fragen sich vielleicht: Wie weit ist denn nun die Forschung mit diesem Vorhaben und wann können wir mit einem solchen Durchbruch der Technologie rechnen?  Lassen Sie uns hierzu gemeinsam im zweiten Teil dieses Beitrags tiefer in das Thema eintauchen.

Live-Stream auf kreative-ki.de 

Noch bis zum 4.10.2020 finden die Feierlichkeiten zum Tag der Deutschen Einheit 2020 in der Innenstadt von Potsdam statt. Das Land Baden-Württemberg präsentiert sich dort als Europas führendes KI-Innovationszentrum – mit einer interaktiven KI-Installation unterstützt durch das KI-Unternehmen Colugo sowie Bechtle. Die Webseite kreative-ki.de zeigt einen Live-Stream der Kunstinstallation und informiert über wichtige wirtschaftliche und gesellschaftliche Aspekte von KI.

LIVE-STREAM ANSEHEN