Siri, Alexa & Co.: Werden wir wirklich dauerhaft abgehört?

Words by Claudia Marisa Alves de Castro
Photography: Loewe Technologies
Lesezeit: 4 Minuten
Warum uns Alexa & Co. nicht abhören…

Immer wieder wird der Verdacht laut, wir könnten von Sprachassistenten abgehört werden. Doch stimmt das überhaupt? Und wenn ja, wie können wir uns davor schützen? Wir versuchen diese Fragen zu beantworten.

 

Siri, Alexa und Co.: Die Spione in deiner Wohnung

Ein Gerät, das die intimsten Gespräche im Schlafzimmer oder bei einem entspannten Treffen unter Freunden abhört, um danach perfide Werbung auszuspielen. Das hört sich gruselig an – und ist es ja irgendwie auch. Denn Apples Siri und Amazons Alexa hören ja wirklich mit. In gewisser Weise. An dieser Stelle hilft es vielleicht, sich den Unterschied zwischen abhören und mithören deutlich zu machen, denn auf den kommt es hier an. Abhören würde bedeuten, dass das Gerät tatsächlich das Gespräch belauscht, um irgendwie unerlaubt an private Informationen zu kommen. So etwas passiert aber nicht. Vielmehr wird mitgehört, denn persönliche Assistenten wie sie in Smart Speakern wie Echo Dot, aber auch in Smartphones vorkommen, benötigen nun mal ein akustisches Signal – eben ein »Hey, Siri« bzw. »Alexa«, um die anschließenden Sprachbefehle überhaupt verarbeiten zu können. Und um dieses akustische Signal nicht zu verpassen, müssen sie eben immer mithören.

Das läuft ähnlich wie auf einer Party: Du genießt deinen Drink und bist dabei, dich angeregt zu unterhalten. Um dich herum ein Klangteppich aus Musik, Gelächter und anderen Unterhaltungen, die du aber völlig ausblendest, um den Faden bei deiner eigenen Unterhaltung nicht zu verlieren. Doch plötzlich hörst du, wie am anderen Ende des Raums jemand deinen Namen sagt. Wahrscheinlich bist du noch nicht mal gemeint – aber egal wie laut es auf dieser Party ist oder wie viele Menschen miteinander sprechen – dein Name in diesem Stimmengewirr macht dich hellhörig, und du schaust dich erst mal um, um herauszufinden, wer etwas von dir will oder was da über dich geredet wird. Genauso hellhörig und auf ihren Namen fixiert müssen auch die Sprachassistenten sein. Egal was im Zimmer los ist – das Signalwort müssen sie bemerken und aus allen anderen Geräuschen herausfiltern. Was hier wichtig zu wissen ist: Dieses Mithören geschieht ausschließlich lokal auf dem jeweiligen Gerät. Es wird dabei noch keine Sprache übermittelt!

»Hey Siri, wir müssen reden«

Es stimmt also, dass smarte Lautsprecher mithören, aber nur, um herauszufinden, ob das Schlüsselwort gesagt wird – denn nur so kann im Anschluss ein möglicher Befehl verarbeitet werden. Das kann man sogar selbst überprüfen: Misst man die Anzahl und Größe der Datenpakete, die Alexa, Siri und Co. verursachen, werden schnell zwei Dinge klar:

  1. Wird das entsprechende Schlüsselwort nicht genannt, ist der Datentransfer so gering, dass Gespräche, die in der Umgebung stattfinden, damit gar nicht übermittelt werden können. Dass überhaupt ständig Daten transferiert werden, liegt einzig und allein daran, dass Sprachassistenten auf eine dauerhafte Internetverbindung angewiesen sind und immer wieder überprüfen, ob diese vorhanden ist. 
     
  2. Der Datentransfer steigt an, sobald ein Sprachbefehl gegeben wurde. Dieser wird zunächst verschlüsselt und dann in die Cloud übertragen, um dort bearbeitet werden zu können. Danach wird das Ergebnis wieder zurück an das Endgerät geschickt. Aus diesem Grund funktionieren diese Geräte nicht, wenn sie keinen Zugang zum Internet haben.
     

Das zeigt, dass es keinesfalls sein kann, dass persönliche Assistenten im eigentlichen Sinne zuhören, ohne dass das entsprechende Schlüsselwort gefallen wäre. Wäre das der Fall, könnte man das am Datenstrom klar erkennen.

Üblicherweise wird bis zum Zeitpunkt der Aktivierung des Gerätes durch ein Schlüsselwort nichts aufgezeichnet

Aber wann genau wird etwas aufgenommen?

Üblicherweise wird bis zum Zeitpunkt der Aktivierung des Gerätes durch ein Schlüsselwort nichts aufgezeichnet. So beginnt die Aufnahmne bei Alexa beispielsweise mit dem Erkennen des Schlüsselwortes. Alexa zeigt danach mit einem blauen Ring an, dass die Aufnahme startet. Das Gesagte wird dann aufgenommen und in die Cloud geschickt. Dort wird zum einen natürlich der Befehl als solches verarbeitet, zum anderen werden aber auch persönliche Sprachgewohnheiten der Sprecherin oder des Sprechers – zum Beispiel in Bezug auf Aussprache oder Vokabular – erlernt, um das Sprachverständnis des Assistenten zu optimieren. Danach wird die Antwort zurückübermittelt.

Dies ist ein weiterer Grund, warum Sprachassistenten eine aktive Internetverbindung benötigen: In der Cloud befindet sich sozusagen ihr »Gehirn«, das all die Informationen verarbeitet und dazulernt, um Schritt für Schritt und bei jeder Benutzung besser werden zu können.

»Das habe ich nicht verstanden«: Wenn irrtümlich mitgehört wird

Allerdings kann es bei einigen Assistenten tatsächlich vorkommen, dass einzelne anonymisierte Fragmente eines Sprachbefehls nicht nur maschinell verarbeitet werden, sondern tatsächlich in ein menschliches Ohr gelangen. Wenn beispielsweise ein Sprachbefehl nicht erkannt wird, werden diese manchmal an echte MitarbeiterInnen weitergeleitet. Dies geschieht ausschließlich, um die Geräte auf Dialekte und sprachliche Feinheiten zu trainieren. Wenn du Siri beispielsweise die Frage »Wo ist Porto?« stellst, und Siri stattdessen »Bordeaux« versteht, liefert sie entsprechend ein falsches Ergebnis. Hier müssten menschliche MitarbeiterInnen den Irrtum sozusagen aufklären und Siri beibringen, dass in deiner Aussprache »Porto« gemeint war.

Aber auch wenn man weiß, dass die MitarbeiterInnen diese Mitschnitte nur zur Verbesserung des Assistenten verwenden – die Vorstellung, dass andere Menschen wirklich mitbekommen könnten, was man in den eigenen vier Wänden so von sich gibt, fühlt sich unter Umständen komisch an. Da kann es beruhigend sein, genau zu wissen, welche Sprachdaten überhaupt übertragen wurden. Das kannst du selbst überprüfen, denn bei Amazon beispielsweise kann man seinen Sprachaufnahmen-Verlauf detailliert überprüfen – inklusive der Aufnahmen, die von Alexa nicht verstanden wurden. In unserem redaktionellen Test waren das vor allem Gesprächsfetzen aus Netflix-Shows oder Werbespots, in denen über »Alexa« oder »Siri« gesprochen wird. Oder eben, wenn ähnlich klingende Wörter in Gesprächen als Signalwörter missinterpretiert wurden. Diese falschen Mitschnitte können auch direkt gelöscht werden.

In keinem Fall jedoch schneidet der Assistent einfach mit, ohne dass man etwas davon mitbekommt: Wie oben beschrieben, gibt es in jedem Fall ein visuelles und akustisches Feedback. Einmal beim Start der Aufnahme und einmal, wenn eine Antwort auf eine bewusst gestellte oder auch fehlinterpretierte Frage aus den Lautsprechern strömt. 

»Alexa, stopp!«

Wenn man merkt, dass doch mal eine ungewollte Konversation stattfindet, kann man jederzeit mit »Alexa, stopp!« die Aufnahme beenden. Bei Apple kann über »Hey Siri, nicht mehr zuhören« Siri deaktiviert werden. Wer ganz sicher gehen möchte, kann zu extremeren Mitteln greifen und zeitweise das Mikrofon abschalten oder den Stecker bei den Smart-Home-Geräten ziehen. So kann man ganz sicher gehen, dass kein ähnlich wie »Alexa« klingendes Wort unbemerkt eine Aufnahme startet.

Dazu Passend

Jetzt drohen Gefängnisstrafen für Hasskommentare im Netz

Hasskommentare und Morddrohungen im Netz haben in den vergangenen Jahren immer weiter zugenommen. Jetzt droht ein neues Gesetz mit bis zu fünf Jahren Haft.

Share:

Claudia Marisa Alves de Castro

Redaktionsleiterin

Claudia Alves de Castro kommt vom Land, war aber nie für die Kleinstadt gemacht. Jetzt – da sie in Hamburg lebt – kann sie ihrem Interesse für Menschen, Geschichten und dem Schreiben freien Lauf lassen. Vom Lifestyle- und Fashionblog, über die Arbeit beim Fernsehen vor und hinter der Kamera, bis hin zu den Online-Redaktionen großer Verlage, Claudia ist mit allen Medien-Wassern gewaschen. Neben ihrer Leidenschaft für ihren Beruf, macht sie ihre Liebe für Kultur, Medien und Reisen besonders glücklich. Seit März 2018 schreibt sie über all das bei uns.

Kommentieren