Einige Smart Devices sind intelligenter als andere, mit einer Reihe von Fähigkeiten, die sie in der Regel wirklich hilfreich machen. Aber sie sind sicherlich noch nicht an der Grenze ihres Nutzens angelangt. Neue Forschungen zeigen ein noch größeres Potential und wie dieses über die Akustik ausgeschöpft werden kann.

Ein guter Zuhörer

Eine neue Forschungsarbeit, die vom Human-Computer Interaction Institute der Carnegie Mellon University in Zusammenarbeit mit Apple veröffentlicht wurde, zeigt, wie eingebettete KIs durch das Hören von Geräuschen in ihrer Umgebung lernen können. All dies ist ohne vorherige Trainingsdaten möglich und verbessert sich im Laufe der Zeit. Ziel ist es, Smart Devices in die Lage zu versetzen, von ihrer Umgebung zu lernen und ihnen letztlich ein Situationsbewusstsein zu geben, damit sie noch hilfreicher werden.

Die Forschungsarbeit nennt das neue System „Listen Learner“. Dies bedeutet, dass ein intelligentes Gerät mit einem Mikrofon – wie der HomePod – „Ereignisse, die sich in seiner Umgebung abspielen, interpretiert“. Anhand dieser Interpretation kann das System verschiedene Aufgaben erfüllen.

Obwohl die Verarbeitung größtenteils hinter den Kulissen und ohne größere Eingriffe des Benutzers geschieht, benötigt der Lautsprecher – zumindest anfangs – noch etwas Hilfe. Wenn sich der HomePod beispielsweise in der Nähe der Küche befindet und die Mikrowelle piept, um mitzuteilen, dass das Essen fertig ist, kann der HomePod fragen: „Was ist das für ein Geräusch?“ Sobald das System anhand einer Antwort gelernt hat, dass es sich hier um die Mikrowelle handelt, kann der HomePod in Zukunft darauf aufmerksam machen, wenn das Essen fertig ist. Dabei könnte auch eine Verbindung zu einem iPhone bestehen, dass die Meldung des HomePods aufnimmt, falls man sich nicht in der Nähe befindet.

Je nach Erfahrungsgrad kann der Smart Speaker für sein Training spezifischere Fragen stellen. Anstatt der Frage, um welches Ereignis es sich gerade handelt, kann auch gefragt werden, ob es sich hier beispielsweise um eine Mikrowelle handelt. Diese Art von Fragen kommen auch bei sogenannten „Randfällen“ zum Einsatz, d.h. wo Geräusche dicht beieinander liegen und dennoch ein bestimmtes Ereignis bedeuten könnten – sagen wir, eine Tür wird geschlossen und ein Schrank wird geschlossen. Im Laufe der Zeit könnte das System in der Lage sein, eine fundierte Entweder-Oder-Annahme zu machen und diese dann dem Benutzer zur Bestätigung mitteilen.

Über die Rückmeldung hinaus, könnten natürlich auch weitere Aufgaben erfüllt werden, wie es typische IFTTT (If This Then That / Wenn dies dann das) Anwendungen bereits umsetzen. So könnte beispielsweise die Kaffee-Maschine eingeschaltet werden, wenn das System merkt, dass wir aufgewacht sind.

Das System ist durchaus komplex und kann mehrere Quellen orten sowie diese logisch verknüpfen, wie ihr in einem Demonstrations-Video sehen könnt: