Sonix, развивающийся лидер в области распознавания речи, сравнил свой механизм распознавания речи с крупнейшими игроками в этой области, включая Google, Amazon и IBM.
Результаты неоднозначны: Google и Sonix признали "Laurel". Amazon распознал "Year Old", что ближе к Yanny. А IBM распознает и "Yeah role", и "Laurel", что похоже на смесь Yanny и Laurel.
Для проведения теста Sonix использовал версию "Янни против Лорел", которую Клоэ Фельдман впервые опубликовала в Twitter.
Вот результаты:
Речевой API Google
Amazon Transcribe
Sonix
IBM Watson Передача речи в текст
Когда вы смотрите видео с субтитрами, их форматирование и внешний вид могут быть не такими, как...
A VTT file (Web Video Text Tracks file) is a plain text format used to…
An SRT file (SubRip Subtitle file) is a plain text file format that stores subtitle…
Video transcription is the process of converting spoken dialogue, narration, and audio content from a…
Audio transcription is the process of converting spoken words from audio or video recordings into…
Video to text is the process of converting spoken dialogue and audio content from video…
На этом сайте используются файлы cookie.