La voix est-elle la prochaine
interface majeure ?

Oui. La technologie permettant de prendre en charge les applications vocales est désormais à la fois relativement peu coûteuse et puissante.

La voix est la prochaine interface utilisateur

Bien que la technologie de reconnaissance vocale existe depuis les années 1950, les progrès récents en matière de puissance de calcul et d'apprentissage automatique ont rendu les interfaces vocales beaucoup plus pratiques. La technologie pour prendre en charge les applications vocales est désormais relativement peu coûteuse et puissante.

Grâce à ces avancées, nous avons vu davantage d'applications pilotées par la voix arriver sur le marché, y compris des appareils dits « voice-first » comme Amazon Echo et Google Home. Les livraisons d'unités de ces appareils ont connu une croissance exponentielle et devraient dépasser les 30 millions dans les foyers américains d'ici la fin de cette année. On pourrait soutenir que les entreprises et les produits orientés vers des cas d'utilisation basés sur la voix seront en tête du peloton dans les années à venir. Tout comme ceux qui ont été les premiers à adopter une stratégie mobile-first ou mobile-only ont été les gagnants de la dernière décennie, ceux qui pilotent les plateformes vocales pourraient être les leaders du marché des années 2020.

La reconnaissance vocale automatisée (ASR) se situe désormais à un niveau à peu près équivalent à celui des humains. Il y a seulement trois ans, les moyennes du taux d'erreur par mot parmi les principaux fournisseurs oscillaient autour de 25%. Aujourd'hui, les géants du secteur, Google, Microsoft et IBM revendiquent tous environ 5%. En d'autres termes, dans une transcription de 100 mots, seuls cinq pourraient être incorrects. À ce niveau de précision, tout un monde d'applications et de cas d'utilisation inédits émerge.

Dans le contexte des progrès de la technologie vocale, le smartphone a atteint sa maturité. Le format du smartphone n'a pas beaucoup changé au cours des dernières années et les fonctionnalités entre tous les principaux fabricants sont similaires. Benedict Evans, de la société de capital-risque Andreesen Horowitz, estime que les smartphones sont au sommet de leur cycle de vie de produit (voir le graphique ci-dessous). Si cela est vrai, alors la question est : qu'est-ce qui va stimuler la prochaine courbe de croissance technologique ? Est-ce la Réalité Augmentée, la Réalité Virtuelle, ou la Voix ?

Sonix - La voix est la nouvelle interface utilisateur

La beauté des systèmes basés sur la voix est qu'ils exploitent une interface à laquelle presque tous les humains peuvent accéder : le langage. Même de petits progrès technologiques peuvent théoriquement avoir un impact mondial massif et de grande portée.

Commencer

Essayez Sonix gratuitement

Sonix transcrit, ajoute des horodatages et organise vos fichiers audio et vidéo afin que vous puissiez rechercher, éditer et partager vos médias.

Comprend 30 minutes de transcription gratuite

Continuer la lecture

Précision de 99 %. Chaque mot compte.

Transcription et traduction par IA en 53+ langues.

30 minutes gratuit
Sans carte de crédit
Annulez à tout moment