Er stemme den næste store UI?

Ja. Teknologien til at understøtte stemmeapplikationer er nu både relativt billig og kraftfuld.

Stemme er det næste UI

Selvom talegenkendelsesteknologi har eksisteret siden 1950'erne, har de seneste fremskridt inden for computerkraft og machine learning gjort stemmegrænseflader langt mere praktiske. Teknologien til at understøtte stemmeapplikationer er nu både relativt billig og kraftfuld.

Med disse fremskridt har vi set flere stemmedrevne applikationer blive bragt på markedet, herunder enheder der er "voice-first" som Amazon Echo og Google Home. Forsendelser af disse enheder er vokset eksponentielt og forudsiges at passere 30 millioner i amerikanske hjem inden udgangen af dette år. Man kan argumentere for, at de virksomheder og produkter, der er orienteret mod stemmebaserede use cases, vil være foran i de kommende år. Præcis som dem, der var først til at drive en mobile-first eller mobile-only strategi, var vinderne af det seneste årti, kan de, der driver stemmeplatforme, blive markedslederne i 2020'erne.

Automatiseret stemmegenkendelse (ASR) er nu på et niveau, der er nogenlunde på højde med mennesker. For blot tre år siden lå word error rate gennemsnitligt blandt de øverste udbydere på omkring 25%. I dag hævder giganterne på området, Google, Microsoft og IBM, alle at ligge på ~5%. Sagt på en anden måde, i en transskription på 100 ord, vil kun fem måske være forkerte. Ved dette nøjagtighedsniveau opstår en hel verden af nye applikationer og use cases.

Mod baggrunden af fremskridt inden for taleteknologi har smartphonen nået sin modenhed. Smartphonens formfaktor har ikke ændret sig meget over de sidste par år, og funktionaliteten på tværs af alle de store producenter er ens. Benedict Evans fra venturekapitalfirmaet Andreesen Horowitz mener, at smartphones er på toppen af deres produktlivscyklus (se diagram nedenfor). Hvis dette er sandt, så er spørgsmålet: Hvad skal drive den næste vækstkurve i teknologi? Er det Augmented Reality, Virtual Reality, eller er det stemme?

Sonix - Stemme er det nye UI

Det smukke ved stemmebaserede systemer er, at de udnytter en grænseflade, som næsten alle mennesker kan tilgå: sprog. Selv små fremskridt i teknologien kan teoretisk set få massive, vidtrækkende globale konsekvenser.

Kom i gang

Prøv Sonix gratis

Sonix transskriberer, tidsstempler og organiserer dine lyd- og videofiler, så du kan søge i, redigere og dele dine medier.

Inkluderer 30 minutters gratis transskription

Læs videre

99% nøjagtighed. Hvert ord tæller.

AI-transskription og oversættelse på 53+ sprog.

30 minutes gratis
Intet kreditkort
Afmeld når som helst