Liest man aktuelle Meldungen zur Datenverarbeitung moderner Smart TVs, kann man sich die Frage stellen, welche Bedeutung der Vertraulichkeit des Wortes im Zeitalter des Internets der Dinge noch zukommt. Anstoß der aktuellen Diskussion gibt ein lesenswerter Kurzartikel auf netzpolitik.org, der etwa den Endbenutzer-Lizenzvertrag von Samsung für Smart-TVs problematisiert. In diesem findet sich u. a. folgende Passage:

Please be aware that if your spoken words include personal or other sensitive information, that information will be among the data captured and transmitted to a third party through your use of Voice Recognition. If you do not enable Voice Recognition, you will not be able to use interactive voice recognition features, although you may be able to control your TV using certain predefined voice commands. While Samsung will not collect your spoken word, Samsung may still collect associated texts and other usage data so that we can evaluate the performance of the feature and improve it.

Konkret geht es bei der aktuellen Diskussion um die Frage, zu welchem Zeitpunkt Sprachdaten von Smart-TVs zur Sprachsteuerung erfasst und vom Wohnzimmer aus an den Smart-TV-Hersteller übermittelt werden dürfen. Verallgemeinert geht es um die viel weitreichendere Frage, unter welchen Umständen Spracherkennung künftig dazu genutzt werden darf, um Nutzern persönliche Assistenzsysteme oder Geräte zur Verfügung zu stellen, die auf Spracheingaben reagieren, ohne dass diese jeweils vorher durch Knopfdruck aktiviert werden müssen.

Tatsächlich ist es nicht überraschend, dass zur Spracherkennung bestimmte Sprachdaten nicht nur lokal auf dem eingesetzten Gerät, sondern auch in Rechenzentren der jeweiligen Gerätehersteller zur Spracherkennung ausgewertet und sogar gespeichert werden. Unter anderem Google geht mit diesem Umstand überaus transparent um und ermöglicht es Nutzern der Google Sprachsteuerung unter https://history.google.com/history/audio?hl=de, die zur Spracherkennung im Rechenzentrum gespeicherten Dateien anzusehen, die Audiodateien erneut abzuspielen oder zu löschen. Hier der entsprechende Screenshot eines solchen Eintrags im Google Konto:

googlenow

Was ist also der Grund dafür, dass dieses Mal die Kritik an der dargestellten Datenverarbeitung durch Smart-TVs weiter zu gehen scheint als sonst?

Möglicherweise der Umstand, dass gar nicht klar ist, ab wann Sprachdaten vorliegend den geschützten Raum des Wohnzimmers verlassen und an externe Rechenzentren übermittelt werden. Denn im Gegensatz zu persönlichen Assistenzsystemen und Geräten wie z. B. Siri, Cortana, Google Now und auch Amazon Echo, scheint es unklar zu sein,

  • ob die Spracherkennung im vorliegenden Fall erst mittels eines lokal auf dem Gerät erkannten Aktivierungsworts („Hey Siri“, „Hey Cortana“, „Okay Google“, „Alexa“) gestartet werden muss, ohne dass hierzu vorher Sprachdaten übermittelt werden müssen oder
  • ob alle Audioinformationen jederzeit erfasst, übermittelt und auf Sprachbefehle hin untersucht werden.

Die letztgenannte Datenverarbeitung (alle gesprochenen Wörter werden ständig übertragen und untersucht) wäre durchaus problematisch, da plötzlich jedes in der Nähe des Gerätes gesprochene Wort betroffen wäre. Neben datenschutzrechtlichen Bedenken blieben in diesem Fall sogar strafrechtliche Unklarheiten. Denn wenn ein Gerät, welches in einem geschützten Raum, wie etwa dem Wohnzimmer, betrieben wird, gänzlich alle Sprachdaten von allen Anwesenden dauerhaft und unbemerkt zur Auswertung übermittelt und ggf. sogar speichert, könnte durchaus darüber nachgedacht werden, ob dieser Umstand die durch § 201 StGB geschützte Vertraulichkeit des Wortes berührt. Demnach wird mit Freiheitsstrafe von bis zu drei Jahren oder mit Geldstrafe u. a. bestraft,

  • wer unbefugt das nichtöffentlich gesprochene Wort eines anderen auf einen Tonträger aufnimmt oder
  •  das nicht zu seiner Kenntnis bestimmte nichtöffentlich gesprochene Wort eines anderen mit einem Abhörgerät abhört.

Zumindest strafrechtlich würde es insofern grundsätzlich keine Rolle spielen, welchen Inhalt die wörtlichen Äußerungen haben. Denn geschützt sind nicht nur personenbezogene oder vertrauliche Inhalte, sondern – vereinfacht gesagt – das gesprochene Wort an sich. Zu klären wäre allerdings, ob der Smart TV vorliegend tatsächlich als eine Art Abhörgerät angesehen werden kann, ob tatsächlich Daten gespeichert werden und wer im Zweifel als Täter in Betracht käme (der Smart-TV-Nutzer oder der Gerätehersteller).

Um datenschutzrechtlich und auch strafrechtlich auf der einigermaßen sicheren Seite zu sein empfiehlt es sich, Spracherkennungssysteme künftig so zu gestalten, dass eine nicht flüchtige Datenspeicherung bzw. eine Übermittlung an externe Server erst dann stattfindet, nachdem der Nutzer des Systems ein vorab vereinbartes Aktivierungsworts verwendet. Die Erkennung dieses Aktivierungswortes muss dabei lokal auf dem Gerät durchgeführt werden, ohne dass Daten übermittelt oder dauerhaft gespeichert werden. Sofern eine Spracherkennung für bestimmte Befehle auch ohne Aktivierungswort möglich sein soll, muss die Erkennung dieser Wörter ebenfalls lokal realisiert werden.

Ist das smarte Gerät hierzu technisch nicht in der Lage, muss auf eine „always on“-Spracherkennung möglicherweise verzichtet werden.

Im Fall von Samsung spricht viel dafür, dass hier tatsächlich nicht jedes gesprochene Wort übermittelt wird. So findet sich auf der Seite von Samsung etwa der Hinweis, dass auch hier ein Aktivierungswort „Hi TV“ zur Anwendung kommt. Wenigstens die Lizenzbedingungen hätten in diesem Fall aber klarer und transparenter gefasst werden können. Vor kurzem ist eine entsprechende Richtigstellung von Samsung auch bei heise veröffentlicht worden.

Der Fall zeigt jedoch deutlich, wie schnell die technische Gestaltung von smarten Dingen nicht nur zu rechtlichen Problemen, sondern auch zu Problemen der Nutzerakzeptanz führen kann. Hersteller sind daher gut beraten, Datenschutz und Datensicherheit schon im Entwicklungsstadium zu berücksichtigen (privacy by design) und auch die Nutzungs- und Lizenzbedingungen bzw. die im Rahmen ihrer Dienste präsentierte Datenschutzerklärung transparent und verständlich zu halten.