„Hey Siri“: Apple erklärt wie die Sprachaktivierung von Siri funktioniert

| 21:03 Uhr | 0 Kommentare

In einem neuen Beitrag in dem Machine Learning Journal, hat sich Apple erneut Siris Fähigkeiten gewidmet. So erfahren wir dieses Mal, was hinter den Kulissen geschieht, wenn wir „Hey Siri“ in das iPhone sagen.

„Hey Siri“

In dem Oktober-Eintrag des interessanten Technik-Blogs von Apple, beschreibt das Siri-Team, was die Aktivierungsworte „Hey Siri“ in einem iPhone, iPad oder der Apple Watch bewirken. Apple erklärt, dass die Spracherkennung in dem Motion-Coprozessor integriert ist. Das System wartet ständig auf die Wörter „Hey Siri“. Wenn nur diese beiden Wörter erkannt werden, analysiert Siri jede nachfolgende Sprache als Befehl oder Abfrage. Die Apple Watch bildet hier eine kleine Ausnahme. Sie hört erst zu, wenn eine Handgelenkbewegung  erfasst wurde.

Die Spracherkennung verwendet einen aufwendigen Algorithmus, um das akustische Muster der Stimme eines Benutzers in eine Wahrscheinlichkeitsverteilung umzuwandeln, um zu berechnen ob der Besitzer einen Befehl gegeben hat. Wenn der Wert hoch genug ist, wacht Siri auf und fährt fort, den Befehl zu vervollständigen oder die Abfrage automatisch zu beantworten.

Sollte der ermittelte Wert nicht hoch genug sein, jedoch einen bestimmten Grenzwert überschreiten, geht das System in einen sensibleren Modus. Dies verbessert die Benutzerfreundlichkeit des Systems erheblich, ohne die Fehlalarmrate zu sehr zu erhöhen, da es nur für kurze Zeit in diesem außerordentlich empfindlichen Zustand ist.

Sprachproben

Um falsche Auslöser zu reduzieren, macht sich das System mit dem Besitzer vertraut. Hierfür werden fünf Versionen eingesprochen, die jeweils mit „Hey Siri“ beginnen. Die Beispiele werden auf dem Gerät gespeichert und später als Referenz verwendet.

„Wir vergleichen die Abstände zu den Referenzmustern, die während der Registrierung erstellt wurden, mit einem anderen Schwellenwert. So kann bewertet werden, ob der erfasste Ton wahrscheinlich „Hey Siri“ ist, der vom registrierten Benutzer gesprochen wurde.

Dieser Prozess verringert nicht nur die Wahrscheinlichkeit, dass „Hey Siri“ von einer anderen Person ausgelöst wird, sondern reduziert auch die Wahrscheinlichkeit, dass andere ähnlich klingende Sätze Siri auslösen.“

Kategorie: Apple

Tags: ,

0 Kommentare

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert