Roboter auf der Rigi
- Digitalisierung, Künstliche Intelligenz
Was hat Künstliche Intelligenz auf dem Berg verloren? Die SATW unterstützte ein Projekt von Prof. Jana Koehler der Hochschule Luzern, die zusammen mit der Rigi Bahnen AG den Einsatz von Robotern im Tourismus testete.
Die Hochschule Luzern (HSLU) hat zwei humanoide Roboter programmiert, die am 16. Dezember 2017 im Einsatz getestet wurden. Die beiden Roboter namens «Pepper» beantworteten Fragen von Besucherinnen und Besuchern zu ihrem Ausflugsziel – der Rigi – auf Deutsch und Englisch. Die Resonanz war sehr positiv und der Versuch hat ein grosses Medienecho erzielt.
Grosses Interesse und einige technische Schwierigkeiten
Während des Versuchs im Shop der Rigi Bahnen AG auf Rigi Kaltbad wurden von den zwei Robotern über 300 Sprachaufnahmen gemacht. Die Audio-Aufnahme startet immer dann, wenn eine Person in seiner Nähe detektiert wurde, der er daraufhin seine Auskunftsdienste anbot. Da der Roboter bei Annäherung einer Person das eingebaute Mikrofon aktiviert, werden teils auch Gespräche von anderen Personen in der Umgebung erfasst. Wenn eine Person den Roboter nur betrachtet, aber nichts sagt, und gleichzeitig in der Umgebung gesprochen wird, so interpretiert die Software dies als Frage an den Roboter. Die aktuelle studentische Software-Lösung kommt hier durch die eingeschränkte Personenerkennung an ihre Grenzen. Eine alltagstaugliche Lösung würde eine viel subtilere Personenerkennung erfordern. Es erstaunt somit nicht, dass aktuelle kommerzielle Sprachsysteme wie Alexa immer per Codewort aktiviert werden müssen.
Menschliche Eigenheiten als Grenzen von KI-Diensten
Von den 138 direkten Anfragen wurden 88 korrekt vom Google Speech-To-Text-Service in Text transkribiert, die übrigen enthielten Fehler. Diese wurden teils durch falsche Interpretation von Rigi-spezifischen Eigennamen verursacht. Obwohl diese hinterlegt waren, wurden sie nicht korrekt identifiziert. Aus Vitznau wurde so beispielsweise Pittsburgh und Weggis wurde als Las Vegas transkribiert. Starke Akzente von Asiatischen oder auch Schweizer Touristen überforderten den Dienst ebenfalls. Die Leistung der Mikrophone im Pepper ist zudem begrenzt. Zwei Mikrophone befinden sich auf der Oberseite des Kopfes direkt neben der Lüftung für den internen PC, was die Aufnahmeleistung beeinträchtigt. Nur 33 der 88 richtig transkribierten Anfragen waren faktische Fragen zur Rigi. Diese bezogen sich auf Verkehrsverbindungen, das Wetter sowie touristische Angebote wie Skifahren, Schwimmen oder Restaurants. Die übrigen 55 Anfragen beinhalteten soziale Interaktionen wie «Hello», «What do you know», mit denen Menschen versuchten den Roboter kennenzulernen und zu verstehen, was er kann.
Die 88 korrekt transkribierten Anfragen wurden an den Microsoft QnA Maker Service weitergeleitet. In dieser Umgebung wurden als Wissensbasis über 600 Frage-Antwort-Paare erstellt. Der Dienst lieferte teils falsche Antworten, die durch mangelndes semantisches Verständnis verursacht wurden. Der QnA Maker antwortet basierend auf Muster- und Schlüsselworten und reagiert daher nur sehr eingeschränkt. Beispielsweise wird in der Frage «Are you hungry?» das Schlüsselwort «hungry» identifiziert und mit Angaben zu Restaurants beantwortet. Über ein Drittel der Anfragen wurden mit «I don’t know» beantwortet. Das lag teils an technischen Schwierigkeiten, aber auch daran, dass die Wissensbasis den Bereich der sozialen Interaktion mit dem Roboter kaum abdeckte. Fragen wie «What do you know?», «Can you follow me? », «What are you doing here? » waren nicht erwartet worden und daher nicht hinterlegt.
Unerwartete Ergebnisse und wertvolle Erfahrungen
Natürlichsprachliche Auskunftssysteme sind für Menschen neu und unbekannt. Viele Menschen versuchen daher zuerst die Fähigkeiten dieser Systeme durch Fragen zu erkunden. Diese Erkundungsphase und Kontaktaufnahme ist besonders wichtig für die Akzeptanz der Systeme. Bei einem humanoiden Roboter sind die Erwartungen besonders hoch, da dieser menschliche Fähigkeiten imitiert. Er muss daher auch die Erwartungen an die soziale Interaktion und Kommunikation erfüllen. Die Spracherkennung ist einem Umfeld wie die Rigi sehr hohen Anforderungen ausgesetzt und verlangt – aufgrund zahlreicher Eigennamen – eine kontextsensitive Disambiguierung. Nebengeräusche und der öffentliche Raum sind weitere Herausforderungen – besonders auch was den Datenschutz angeht, weil manchmal auch Gespräche aus der Umgebung unbeabsichtigt aufgenommen werden. Wenn eine antizipierte Auskunft verlangt wird, funktioniert der verwendete Service sehr gut. Sobald aber unerwartete Fragen mit Schlüsselwörtern au dem hiterlegten Datensatz gestellt werden, reagiert der Service falsch, da er semantische Feinheiten nicht versteht.
Es wird noch etwas dauern …
Prof. Jana Koehler führt als Präsidentin der SI-Fachgruppe SGAICO regelmässig Roundtables mit Schweizer Industrieunternehmen durch. Dabei geht es um Erkenntnisaustausch im Einsatz von Cognitive Services. Pepper steht dabei oft im Mittelpunkt. Beim Roundtable im Januar 2018 tauschten sich die Teilnehmenden zu Erfahrungen im Umgang mit den Robotern aus. Dabei interessierte besonders die Frage nach menschlichen Emotionen im Umgang mit Robotern, die sprechen können. Bis die eingesetzten Technologien den realen Anforderungen wie auf der Rigi gerecht werden, müssen verschiedene Komponenten verbessert werden. Natürlichsprachliche Systeme funktionieren heute nur unter gut kontrollierbaren Bedingungen wie im privaten Haushalt oder im Auto. Es ist allerdings zu erwarten, dass sich diese Systeme in den kommenden Jahren stark weiterentwickeln werden. Daher ist es sinnvoll, sich bereits heute mit diesen Technologien auseinanderzusetzen. Das Rigi-Roboter-Projekt wird vermutlich in einem erweiterten Rahmen weitergeführt. Mehrere grössere Schweizer Tourismusdestinationen haben bereits Interesse signalisiert.
Auskunft:
Manuel Kugler, Leiter Schwerpunktprogramme Advanced Manufacturing und Künstliche Intelligenz, Tel. +41 44 226 50 21, manuel.kugler(at)satw.ch
- Tags:
- künstliche intelligenz
Comments are disabled for this post.
0 comments