Является ли голос следующим важным UI?

Да. Технологии для поддержки голосовых приложений теперь одновременно относительно недорогие и мощные.

Голос — это следующий UI

Хотя технология распознавания речи существует с 1950-х годов, недавние достижения в вычислительной мощности и машинном обучении сделали голосовые интерфейсы гораздо более практичными. Технологии для поддержки голосовых приложений теперь относительно недорогие и мощные.

С этими достижениями мы увидели появление на рынке большего количества приложений, управляемых голосом, включая устройства категории «voice-first», такие как Amazon Echo и Google Home. Поставки таких устройств выросли в геометрической прогрессии, и, по прогнозам, к концу этого года они появятся в более чем 30 миллионах американских домов. Можно утверждать, что компании и продукты, ориентированные на голосовые сценарии использования, будут впереди всех в ближайшие годы. Так же, как те, кто первыми внедрил стратегию mobile-first, стали победителями прошлого десятилетия, лидеры голосовых платформ могут стать лидерами рынка 2020-х годов.

Автоматическое распознавание голоса (ASR) сейчас находится на уровне, примерно сопоставимом с человеческим. Всего три года назад средний показатель коэффициента ошибок в словах у ведущих поставщиков колебался в районе 25%. Сегодня гиганты в этой области, Google, Microsoft и IBM, заявляют о ~5%. Иными словами, в транскрипте из 100 слов только пять могут быть неверными. На таком уровне точности открывается целый мир новых приложений и сценариев использования.

На фоне достижений в области речевых технологий рынок смартфонов достиг зрелости. Форм-фактор смартфона не сильно изменился за последние несколько лет, а функциональность у всех крупных производителей схожа. Бенедикт Эванс из венчурной фирмы Andreesen Horowitz считает, что смартфоны находятся на пике своего жизненного цикла (см. график ниже). Если это правда, возникает вопрос: что станет драйвером следующей кривой роста в технологиях? Дополненная реальность, виртуальная реальность или голос?

Sonix — Голос — это новый UI

Прелесть голосовых систем в том, что они используют интерфейс, доступный почти всем людям: язык. Даже небольшие достижения в этой технологии теоретически могут иметь огромный глобальный эффект.

Начните работу

Попробуйте Sonix бесплатно

Sonix транскрибирует, расставляет временные метки и систематизирует ваши аудио- и видеофайлы, чтобы вы могли искать, редактировать и делиться своим контентом.

Включает 30 минут бесплатной транскрипции

Продолжить чтение

Точность 99%. Каждое слово имеет значение.

AI-транскрипция и перевод на 53+ языках.

30 minutes бесплатно
Без кредитной карты
Отмена в любое время