音声は次の 主要UIか?

はい。音声アプリケーションをサポートする技術は、今や比較的安価で強力なものになっています。

音声は次世代のUIである

音声認識技術は1950年代から存在していましたが、近年の計算能力と機械学習の進歩により、音声インターフェースははるかに実用的なものとなりました。音声アプリケーションをサポートする技術は、今や比較的安価で強力です。

これらの進歩に伴い、Amazon EchoやGoogle Homeのような「ボイスファースト」のデバイスを含む、より多くの音声主導型アプリケーションが市場に投入されています。これらのデバイスの出荷台数は指数関数的に増加しており、今年末までにアメリカの家庭で3,000万台を超えると予測されています。音声ベースのユースケースに特化した企業や製品が、今後数年間で群を抜いてリードすると言えるでしょう。過去10年間にモバイルファーストやモバイルオンリーの戦略をいち早く推進した企業が勝者となったように、音声プラットフォームを推進する企業が2020年代の市場リーダーになる可能性があります。

自動音声認識(ASR)は現在、ほぼ人間と同等のレベルに達しています。わずか3年前まで、主要プロバイダーの単語誤り率の平均は約25%でした。今日、この分野の巨人であるGoogle、Microsoft、IBMはいずれも約5%を主張しています。言い換えれば、100単語の文字起こしのうち、間違いはわずか5単語程度です。このレベルの精度により、全く新しいアプリケーションやユースケースの世界が広がります。

音声技術の進歩を背景に、スマートフォンは成熟期を迎えました。スマートフォンの形状はこの数年あまり変わっておらず、主要メーカー全体の機能も似通っています。ベンチャーキャピタル Andreesen Horowitz の Benedict Evans 氏は、スマートフォンが製品ライフサイクルの頂点にあると考えています(下の図を参照)。もしこれが事実なら、テクノロジーにおける次の成長曲線を牽引するのは何でしょうか?AR(拡張現実)でしょうか、VR(仮想現実)でしょうか、それとも音声でしょうか?

Sonix - 音声は新しいUIである

音声ベースのシステムの素晴らしさは、ほぼすべての人間がアクセスできるインターフェース、すなわち「言語」を活用している点にあります。この技術のわずかな進歩であっても、理論的には世界規模で計り知れない影響を与える可能性があります。

今すぐ始める

Sonixを無料で試す

Sonixは、オーディオおよびビデオファイルを文字起こし、タイムスタンプ付与、整理することで、メディアの検索、編集、共有を可能にします。

30 分間の無料文字起こしが含まれています

続きを読む

99% の精度。 一言一句を大切に。

53+ 言語対応の AI 文字起こしと翻訳。

30 minutes 無料
クレジットカード不要
いつでもキャンセル可能