Is voice de volgende belangrijke UI?
Ja. De technologie om spraaktoepassingen te ondersteunen is nu zowel relatief goedkoop als krachtig.
Voice is de volgende UI
Hoewel spraakherkenningstechnologie al sinds de jaren 50 bestaat, hebben recente ontwikkelingen in rekenkracht en machine learning spraakinterfaces veel praktischer gemaakt. De technologie om spraaktoepassingen te ondersteunen is nu zowel relatief goedkoop als krachtig.
Met deze vooruitgang hebben we meer spraakgestuurde applicaties op de markt zien komen, waaronder apparaten die "voice-first" zijn, zoals Amazon Echo en Google Home. De leveringen van deze apparaten zijn exponentieel gegroeid en de voorspelling is dat ze tegen het einde van dit jaar de 30 miljoen in Amerikaanse huishoudens zullen passeren. Men zou kunnen stellen dat de bedrijven en producten die gericht zijn op spraakgestuurde use-cases de komende jaren voorop zullen lopen. Net zoals degenen die als eersten een mobile-first of mobile-only strategie hanteerden de winnaars van het afgelopen decennium waren, zouden degenen die spraakplatforms stimuleren de marktleiders van de jaren 2020 kunnen zijn.
Geautomatiseerde spraakherkenning (ASR) bevindt zich nu op een niveau dat ongeveer gelijk is aan dat van mensen. Slechts drie jaar geleden lagen de gemiddelde word error rate percentages bij de topaanbieders rond de 25%. Vandaag de dag claimen de reuzen in dit vakgebied, Google, Microsoft en IBM, allemaal ~5%. Anders gezegd: in een transcriptie van 100 woorden zijn er mogelijk slechts vijf onjuist. Op dit nauwkeurigheidsniveau ontstaat er een hele wereld aan nieuwe toepassingen en use-cases.
Tegen de achtergrond van de ontwikkelingen in spraaktechnologie heeft de smartphone zijn volwassenheid bereikt. De vormfactor van de smartphone is de afgelopen jaren niet veel veranderd en de functionaliteit bij alle grote fabrikanten is vergelijkbaar. Benedict Evans van durfkapitaalbedrijf Andreesen Horowitz gelooft dat smartphones zich aan de top van hun productlevenscyclus bevinden (zie onderstaande grafiek). Als dit waar is, dan is de vraag: wat gaat de volgende groeicurve in de tech-sector aandrijven? Is het Augmented Reality, Virtual Reality, of is het Voice?

Het mooie van op spraak gebaseerde systemen is dat ze gebruikmaken van een interface waar bijna alle mensen toegang tot hebben: taal. Zelfs kleine vorderingen in de technologie kunnen theoretisch een enorme, verreikende wereldwijde impact hebben.
Probeer Sonix gratis
Sonix transcribeert, tijdstempelt en organiseert je audio- en videobestanden, zodat je je media kunt doorzoeken, bewerken en delen.
Inclusief 30 minuten gratis transcriptie