Ist Stimme die nächste große UI?

Ja. Die Technologie zur Unterstützung von Sprachanwendungen ist heute sowohl relativ kostengünstig als auch leistungsstark.

Sprache ist die nächste UI

Obwohl die Spracherkennungstechnologie bereits seit den 1950er Jahren existiert, haben die jüngsten Fortschritte in der Rechenleistung und im maschinellen Lernen Sprachschnittstellen wesentlich praktischer gemacht. Die Technologie zur Unterstützung von Sprachanwendungen ist heute sowohl relativ kostengünstig als auch leistungsstark.

Mit diesen Fortschritten haben wir mehr sprachgesteuerte Anwendungen auf dem Markt gesehen, einschließlich Geräten, die "Voice-First" sind, wie Amazon Echo und Google Home. Die Absatzzahlen dieser Geräte sind exponentiell gewachsen und es wird prognostiziert, dass sie bis Ende dieses Jahres die Marke von 30 Millionen in amerikanischen Haushalten überschreiten werden. Man könnte argumentieren, dass Unternehmen und Produkte, die auf sprachbasierte Anwendungsfälle ausgerichtet sind, in den kommenden Jahren die Nase vorn haben werden. So wie diejenigen, die als erste eine Mobile-First- oder Mobile-Only-Strategie verfolgten, die Gewinner des vergangenen Jahrzehnts waren, könnten diejenigen, die Sprachplattformen vorantreiben, die Marktführer der 2020er Jahre sein.

Die automatisierte Spracherkennung (ASR) ist heute auf einem Niveau, das in etwa mit dem von Menschen vergleichbar ist. Vor nur drei Jahren lag die durchschnittliche Wortfehlerrate bei den Top-Anbietern bei etwa 25%. Heute behaupten die Giganten in diesem Bereich, Google, Microsoft und IBM, alle eine Rate von ~5%. Anders ausgedrückt: In einem Transkript von 100 Wörtern könnten nur fünf falsch sein. Bei dieser Genauigkeit eröffnet sich eine ganze Welt neuartiger Anwendungen und Anwendungsfälle.

Vor dem Hintergrund der Fortschritte in der Sprachtechnologie hat das Smartphone seine Reife erreicht. Der Formfaktor des Smartphones hat sich in den letzten Jahren kaum verändert und die Funktionalität bei allen großen Herstellern ist ähnlich. Benedict Evans von der Risikokapitalfirma Andreesen Horowitz glaubt, dass sich Smartphones am oberen Ende ihres Produktlebenszyklus befinden (siehe Grafik unten). Wenn dies stimmt, stellt sich die Frage: Was wird die nächste Wachstumskurve in der Technologie vorantreiben? Ist es Augmented Reality, Virtual Reality oder ist es Stimme?

Sonix - Sprache ist die neue UI

Das Schöne an sprachbasierten Systemen ist, dass sie eine Schnittstelle nutzen, auf die fast alle Menschen zugreifen können: Sprache. Selbst kleine Fortschritte in der Technologie können theoretisch massive, weitreichende globale Auswirkungen haben.

Erste Schritte

Sonix kostenlos testen

Sonix transkribiert, versieht mit Zeitstempeln und organisiert Ihre Audio- und Videodateien, damit Sie Ihre Medien suchen, bearbeiten und teilen können.

Beinhaltet 30 Minuten kostenlose Transkription

Weiterlesen

99% Genauigkeit. Jedes Wort zählt.

KI-Transkription und -Übersetzung in 53+ Sprachen.

30 minutes kostenlos
Keine Kreditkarte
Jederzeit kündbar