¿Es la voz la próxima
gran interfaz de usuario?
Sí. La tecnología para dar soporte a las aplicaciones de voz es ahora relativamente económica y potente.
La voz es la próxima interfaz de usuario
Si bien la tecnología de reconocimiento de voz existe desde la década de 1950, los avances recientes en la potencia informática y el aprendizaje automático han hecho que las interfaces de voz sean mucho más prácticas. La tecnología para dar soporte a las aplicaciones de voz es ahora relativamente económica y potente.
Con estos avances, hemos visto más aplicaciones impulsadas por voz en el mercado, incluidos dispositivos que son "primero la voz" como Amazon Echo y Google Home. Los envíos de unidades de estos dispositivos han crecido exponencialmente y se prevé que superen los 30 millones en los hogares estadounidenses para finales de este año. Se podría argumentar que las empresas y los productos orientados a casos de uso basados en voz estarán a la vanguardia en los próximos años. Así como aquellos que fueron los primeros en impulsar una estrategia basada primero o exclusivamente en dispositivos móviles fueron los ganadores de la década pasada, aquellos que impulsen las plataformas de voz podrían ser los líderes del mercado de la década de 2020.
El reconocimiento automático de voz (ASR) se encuentra ahora en un nivel que está aproximadamente a la par con los humanos. Hace apenas tres años, los promedios de la tasa de error de palabras entre los principales proveedores rondaban el 25%. Hoy en día, los gigantes del sector, Google, Microsoft e IBM, afirman tener un ~5%. Dicho de otro modo, en una transcripción de 100 palabras, solo cinco podrían ser incorrectas. Con este nivel de precisión, surge todo un mundo de aplicaciones y casos de uso novedosos.
En el contexto de los avances en la tecnología del habla, el smartphone ha alcanzado su madurez. El factor de forma del smartphone no ha cambiado mucho en los últimos años y la funcionalidad de todos los principales fabricantes es similar. Benedict Evans, de la firma de capital de riesgo Andreesen Horowitz, cree que los smartphones están en la cima de su ciclo de vida de producto (ver gráfico a continuación). Si esto es cierto, entonces la pregunta es: ¿Qué va a impulsar la próxima curva de crecimiento tecnológico? ¿Es la Realidad Aumentada, la Realidad Virtual o es la voz?

La belleza de los sistemas basados en voz es que aprovechan una interfaz a la que casi todos los seres humanos pueden acceder: el lenguaje. Incluso pequeños avances en la tecnología pueden, teóricamente, tener un impacto global masivo y de gran alcance.
Pruebe Sonix gratis
Sonix transcribe, pone marcas de tiempo y organiza sus archivos de audio y vídeo para que pueda buscar, editar y compartir su contenido multimedia.
Incluye 30 minutos de transcripción gratuita