Der Dialog mit Alexa, Siri oder «Ok, Google» hat oft unfreiwilligen Unterhaltungswert. Nämlich immer dann, wenn die Maschine am Gesagten scheitert. Das ist selbst auf Hochdeutsch noch häufig der Fall – beim Schweizerdeutschen stösst die künstliche Intelligenz der digitalen Assistenten aber an ihre Grenzen. Dann heisst es nur noch: «Ich habe leider nicht verstanden.»

Um einer Maschine beizubringen, die Sprache verschiedener Nutzer zu verstehen, ist eine grosse Menge an Audiodaten und transkribiertem Text nötig. Auf dieser Grundlage lernt ein Spracherkennungssystem, mittels Algorithmen beide so miteinander zu kombinieren, dass es bis dahin unbekannte Sätze verstehen kann.

Partner-Inhalte
 
 
 
 
 
 

Siri versteht kein Schweizerdeutsch

Spracherkennungstools haben meist nur für die Standardsprache eines Landes «gelernt». Sprecher mit anderen Akzenten oder gar Dialekten schauen in die Röhre. Von der zunehmenden Entwicklung in Richtung sprachgesteuerter Technologien könnten daher nicht alle Menschen in gleichem Masse profitieren. So verstehen Amazons Alexa, Apples Siri oder Google Assistant und andere Geräte eben auch kein Schweizerdeutsch – geschweige denn die Vielzahl an regionalen Dialektvarianten.

Die Entwickler dieser Systeme kennen das Problem und versuchen, andere Sprachvarianten abzudecken. Zumindest für Englisch: Bei Siri oder Echo kann etwa australisches Englisch eingestellt werden.

Laut den Herstellern können Sprecher anderer Sprachen und Dialekte zudem ihre Smartphones und Geräte trainieren, sie zu verstehen, statt darauf zu warten, bis die Tech-Unternehmen eine Lösung anbieten. Allerdings scheint dies nur bei Sprachen wie Englisch gut zu funktionieren, wo es aufgrund der grossen Sprecherzahl auch eine sehr grosse Menge an Daten gibt.

Nicht einfach zu trainieren

Für Schweizerdeutsch bieten die grossen Anbieter wie Apple, Amazon und Google noch keine Lösungen – wahrscheinlich, weil der Schweizer Markt mit 5 bis 6 Millionen Deutschschweizern zu klein ist.

Denn bei Dialekten steht die Spracherkennung vor dem Problem, dass es aufgrund der begrenzten Sprecherzahl nicht viele Daten gibt, um die Systeme zu trainieren. Hinzu kommt, dass Schweizerdeutsch keine Schriftsprache ist.

Eingabe ins Smartphone

Apples Sprachassistent: Bei Dialekten stösst Siri an seine Grenzen.

Quelle: Keystone

Nach dem jetzigen Stand der Technik sei es zwar möglich, eine Software zur Spracherkennung für Dialekte wie Schweizerdeutsch zu entwickeln, erklärt David Imseng, wissenschaftlicher Mitarbeiter am IDIAP, einem unabhängigen Forschungsinstitut für künstliche Intelligenz in Martigny. Doch das sei sehr aufwändig. Um ein Spracherkennungssystem zu trainieren, muss es mit Audiodaten und dem transkribierten Text «gefüttert» werden. Für die grossen Sprachen können sogar Datenbanken eingekauft werden – bei Dialekten ist dies nicht möglich.

Nach Einschätzung des IDIAP-Forschers ist die Schweiz für Apple dennoch ein interessanter Markt, da die Nutzung von iOS-Geräten im Vergleich zu den Nachbarländern sehr hoch sei. Und trotzdem gibt es Apples Sprachassistenten Siri nicht für Schweizerdeutsch, denn der Aufwand für ein so kleines Land sei relativ hoch. «Im Moment scheint es, als ob Apple die Ressourcen in so ein Projekt noch nicht investieren will. Google hingegen entwickelt gerade eine Spracherkennung für den schottischen Dialekt. Der Trend geht also schon in diese Richtung, gerade Googles Systeme unterstützen auch kleinere Sprachen».

Spracherkennungs-Software für Schweizerdeutsch

David Imseng hält es daher nur für eine Frage der Zeit, bis auch kleinere Sprachen und Dialekte unterstützt werden, insbesondere weil sich die technologischen Voraussetzungen immer weiter verbessern. «Spracherkennungssysteme profitieren von dem Hype um künstliche Intelligenz, den wir gerade erleben,» so Imseng, der die Marktlücke in der Schweiz erkannte und vor vier Jahren das Startup Recapp gründete.

Seither entwickeln die Jungunternehmer aus dem Wallis Spracherkennungs-Software für Schweizerdeutsch. Bisher wurde diese an Swisscom für die TV-Box, die mittels Sprachsteuerung die Suche im Dialekt nach Fernsehprogrammen ermöglicht, sowie an regionale Parlamente, die Polizei und Gerichte verkauft. Den Kunden von Recapp sei es zudem wichtig, dass die Aufzeichnungen und sensiblen Daten nicht in einer Cloud gespeichert werden, wie dies bei den grossen Anbietern wie Amazon und Google der Fall ist.

«Das ist neben dem Dialekt unsere zweite Marktnische», erklärt David Imseng den Erfolg seines Unternehmens, dessen Umsatz sich Jahr für Jahr verdoppelte. Bisher hat das Startup keine Investoren, ist aber offen für die passende Finanzierung. Und auch künftige Kooperationen mit den grossen Playern schliesst Mitgründer und Geschäftsführer Imseng nicht aus.

Schweizer Wettbewerber

Einziger Wettbewerber von Recapp in der Schweiz ist Spitch, das sich auf die Entwicklung sprachgesteuerter Call-Center spezialisiert hat, unter anderem für den Bankensektor. Spitch entwickelte beispielsweise den Voice-Fahrplan der SBB, mit dem Bahnkunden auf Schweizerdeutsch kommunizieren können.

Mit Google, Amazon und Apple gibt es bereits grosse Player im Sprachbereich, aber einige Firmen wollen den Tech-Riesen keinen Einblick in ihre Kundenbeziehungen geben. Neben der Entwicklung von Sprachlösungen für Schweizerdeutsch, liegt genau dort die Chance von Firmen wie Recapp oder Spitch.