Sprachaufnahmen werden vorerst nicht mehr von Menschen ausgewertet

Sprachassistenten : Google und Apple stellen sich taub

Viele Nutzer waren schockiert, als sie erfuhren, dass Aufnahmen von Sprachassistenten zum Teil von Menschen abgetippt werden. Apple und Google haben die Praxis vorübergehend ausgesetzt.

Apple hat angekündigt, Nutzer künftig ausdrücklich um Erlaubnis zu fragen, wenn Mitschnitte des Sprachassistenten von Mitarbeitern ausgewertet werden. Die Zustimmungsfunktion solle in einem späteren Software-Update umgesetzt werden, erklärte der iPhone-Konzern dem Technologie-Blog Tech-Crunch. Bis dahin werde die Praxis weltweit gestoppt und auf den Prüfstand gestellt.

Erst am Donnerstag war bekannt geworden, dass das Konkurrenzunternehmen Google bereits Anfang Juli das Abhören eingestellt hat. Dieser Stopp gilt noch mindestens bis Ende Oktober, wie der Hamburger Datenschutzbeauftragte Johannes Caspar erklärt. Er leitete gegen den Konzern ein Verwaltungsverfahren ein. Caspar verwies dabei auf den Eklat, den es im Juli gab, weil Tausende Google-Mitschnitte aus den Niederlanden öffentlich wurden. Aus den aufgezeichneten Gesprächen ließen sich zum Teil sensible personenbezogene Daten entnehmen, argumentierte er. Es bestünden zudem erhebliche Zweifel daran habe, dass beim Einsatz des Google Assistant die Vorgaben der EU-Datenschutzgrundverordnung (DSGVO) eingehalten würden.

Bei Amazons Alexa, dem Google Assistant und Siri wurden Teile der Mitschnitte seit Jahren auch von Menschen angehört und abgetippt, um die Qualität der Spracherkennung zu verbessern. Es geht dabei zum Beispiel um Fälle, in denen die Sprachassistenten den Befehl des Nutzers nicht verstanden, Aktivierungswörter falsch erkannten oder mit neuen Sprachen und Dialekten nicht umgehen konnten. Die Anbieter betonten, dass die Aufnahmen davor anonymisiert würden. Den Nutzern war die Praxis allerdings weitestgehend nicht bekannt, bis vor einigen Monaten erste Medienberichte dazu auftauchten.

Apple wies schon länger in einem Sicherheitsdokument darauf hin, dass „eine geringe Anzahl von Transkriptionen“ für die Verbesserung des Dienstes eingesetzt werden könne. Allerdings war das Papier, das sich an Entwickler richtet, schwer zu finden und die Nutzer wurden bei der Einrichtung von Siri nicht explizit auf diese Möglichkeit hingewiesen.

Die fehlerhaften Aktivierungen, bei denen die Software glaubt, die Weckworte „Hey, Siri“, „Alexa“, oder „Hey, Google“ gehört zu haben, sind ein besonderes Problem. Denn dabei können Sätze und Unterhaltungen aufgezeichnet werden, die nicht an die Sprachassistentin gerichtet waren. Beim nachträglichen Anhören sollen die Mitarbeiter herausfinden, welche Worte oder Geräusche die versehentliche Aktivierung auslösten, um die Software entsprechend anzupassen.

Nach früheren Angaben von Apple wurde weniger als ein Prozent der Aufnahmen von Menschen ausgewertet. Laut Angaben in dem Sicherheitspapier für Entwickler können Mitschnitte bis zu zwei Jahre lang für die Verbesserung des Dienstes verwendet werden, nach sechs Monaten werde eine Kopie ohne persönliche Informationen gespeichert. Auch Google sagt, dass nur rund 0,2 Prozent aller Sprachbefehle an den Assistant auf diese Weise abgetippt würden.

Datenschützer kritisieren die Sprachassistenten schon lange. Sie sehen ein Problem darin, dass sich in einem Haushalt nur schwer dafür sorgen lässt, dass nur Daten von Nutzern verarbeiten werden, die dem auch ausdrücklich zugestimmt haben. Zum anderen findet es auch Datenschützer Caspar problematisch, dass Nutzer nicht ausdrücklich darauf hingewiesen wurden, dass die Mitschnitte auch von Menschen angehört werden können und nicht nur automatisiert zum maschinellen Lernen genutzt werden.

(dpa)
Mehr von Saarbrücker Zeitung