Sprachsteuerung ist die Übermittlung von Befehlen an technischen Geräte mit der Stimme. Beispiele hierfür sind Sprachassistenten wie Siri oder Alexa, die bereits mit einer Vielzahl von Geräten genutzt werden können.
Sprachsteuerung spielt insbesondere bei der Bedienung von Smartphones und Tablets eine immer bedeutendere Rolle. Die Geräte haben die entsprechende Funktion bereits eingebaut. Bei Google nennt sie sich Google Assistant, beim iPhone Siri. Die entsprechende Software kann aber auf ganz unterschiedlichen Geräten laufen, etwa auch auf Laptops Spielekonsolen oder auch sogenannten Smartspeakern wie dem Amazon Echo. Die Verbreitung nimmt zu. Eine Prognose von Statista zeigt, dass die Anzahl der weltweit verwendeten Sprachassistenten im Jahr 2024 bei bis zu 8,4 Milliarden liegen wird.
Gestartet wird die Sprachsteuerung in der Regel durch ein Schlüsselwort oder alternativ auch durch einen Tastendruck am Gerät. Dies setzt einen Aufnahmeprozess für den Befehl in Gang. Diese Aufnahme wird in die Cloud gesendet, wo ein Server die eigentliche Verarbeitung und Erkennungsarbeit leistet. Die erkannten Befehle und Antworten senden die Server dann an das Gerät zurück, das diese dann ausführt beizihungsweise ausgibt.
Am Handy gehören dabei das Anrufen von Kontakten, das Diktieren von Nachrichten oder die Internetrecherche zu den beliebtesten Nutzungsszenarien.
Sprachsteuerung auch im Smart Home
Sprachsteuerungssysteme halten auch im Smart Home Einzug. Auch sie haben als Basis meist Siri, Alexa oder den Google Assistenten. Mit solchen System lassen sich alle Befehle ausführen, für die sonst ein Bedienpanel notwendig wären. So kann die Raumtemperatur eingestellt oder Lampen einschaltet und gedimmt werden. Es lassen sich sogar ganze Szenerien aufrufen. Solche Szenarien können etwa beim Verlassen des Hauses alle Geräte ausschalten, die Heizung herunterdrehen und die Alarmanlage einschalten.
Die Sprachsteuerung des Smart Homes ist insbesondere auch für Senioren und behinderte Menschen wichtig. Sie funktioniert intuitiv, ein Tablet das leicht verlegt werden kann, ist nicht notwendig. Selbst Notrufe lassen sich per Sprachbefehl absetzen.
Systeme zur Spracherkennung gehören zur Technologie der künstlichen Intelligenz. Sie sind auch Ausdruck der wachsenden Digitalisierung. Sie integrieren Spracherkennung mit sogenannten Dialogmanagern, die die dem Nutzern bisweilen ein menschliches Gegenüber vorgaukeln. Text-to-Speach-Algorithmen sorgen dafür, dass die Antworten auf eine Sprachanfrage in natürlicher Sprache ausgegeben werden. Dabei lernen die Systeme bei jeder Anfrage hinzu und können Befehle immer präziser erkennen und ausführen.
Bild: Jonathan Borba via Pexels