A voz é a próxima grande UI?
Sim. A tecnologia para suportar aplicações de voz é agora relativamente barata e poderosa.
A voz é a próxima UI
Embora a tecnologia de reconhecimento de fala exista desde a década de 1950, os avanços recentes no poder de computação e machine learning tornaram as interfaces de voz muito mais práticas. A tecnologia para suportar aplicações de voz é agora relativamente barata e poderosa.
Com estes avanços, temos visto mais aplicações baseadas em voz serem lançadas no mercado, incluindo dispositivos que são "voice-first", como o Amazon Echo e Google Home. As remessas de unidades destes dispositivos cresceram exponencialmente e prevê-se que ultrapassem os 30 milhões em lares americanos até o final deste ano. Pode-se argumentar que as empresas e produtos orientados para casos de uso baseados em voz estarão à frente do grupo nos próximos anos. Tal como aqueles que foram os primeiros a impulsionar uma estratégia mobile-first ou mobile-only foram os vencedores da última década, aqueles que impulsionam as plataformas de voz poderão ser os líderes de mercado da década de 2020.
O reconhecimento de voz automatizado (ASR) está agora num nível que está sensivelmente ao mesmo nível dos humanos. Há apenas três anos, as médias da taxa de erro de palavras entre os principais fornecedores rondavam os 25%. Hoje, os gigantes do setor, Google, Microsoft e IBM, reivindicam todos ~5%. Dito de outra forma, numa transcrição de 100 palavras, apenas cinco podem estar incorretas. Com este nível de precisão, emerge todo um mundo de novas aplicações e casos de uso.
Com o pano de fundo dos avanços na tecnologia de fala, o smartphone atingiu a maturidade. O formato do smartphone não mudou muito nos últimos anos e a funcionalidade entre todos os principais fabricantes é semelhante. Benedict Evans, da empresa de capital de risco Andreesen Horowitz, acredita que os smartphones estão no topo do seu ciclo de vida de produto (ver gráfico abaixo). Se isto for verdade, então a questão é: o que vai impulsionar a próxima curva de crescimento tecnológico? Será a Realidade Aumentada, a Realidade Virtual ou será a Voz?

A beleza dos sistemas baseados em voz é que eles aproveitam uma interface à qual quase todos os humanos podem acessar: a linguagem. Mesmo pequenos avanços na tecnologia podem teoricamente ter um impacto global massivo e de longo alcance.
Experimente o Sonix gratuitamente
O Sonix transcreve, gera carimbos de data/hora e organiza seus arquivos de áudio e vídeo para que você possa pesquisar, editar e compartilhar sua mídia.
Inclui 30 minutos de transcrição gratuita