【ビジネス向け】音声認識の現状【IBMの誤認識率5.6%達成を受けて】
元記事はBusiness Insiderで日本語訳もあるのだけど、誤訳や省略がある...のでまとめました。
【結論】音声認識システム(英語)のエラーはヒューマンエラーに迫りつつある
【出来ていること】
- 人間の誤認識率5%に精度が近づいてきている
- どもり、不明瞭な発音、日常的な環境下では認識できている。
【出来ていないこと】
- トーンや暗喩のニュアンスは捉えられていない
【所見】
- 日本語での精度は完全に別問題
- 音声の音素を認識するのと、音声から言葉を認識するのは別のタスクで、後者は聞き取れた音から穴埋めや推測する自然言語処理の問題。手書き文字認識と似ている。あれも個々の文字を判別し、難しかったものは文脈が「自然になるよう」に補正している。
- このアプローチの都合上、世界中に転がる「自然な言葉の連なり」が正解データとなっているため、手書き文字認識も音声認識も「世の中に存在しない単語や新しい話し方には精度が落ちる」ことになる。
- 逆に、人間が「AIが認識しやすいように話せば」精度は大幅に上昇する。世の中で一般的でない言い回しをしなくなる、など。人間がシステム(AI)に合わせるようになっていくのだと思う。
私たちについて
Ations株式会社はオープンイノベーションを加速させることを目指しています。
現在は人工知能(AI)領域に絞り、開発会社とクライアントのAIリテラシーギャップを埋めるべく、メディアの運営および、AIコンサル、AIアドバイザリー、イベントや勉強会をしております。
いつでも気軽にご連絡ください。
また、「世界にテクノロジーを届けオープンイノベーションによって、科学の発展を加速させたい」と志を同じくする方は是非ご協力ください。
ライター、エンジニア、デザイナー、インターン、オープンイノベーター、サイエンスコミュニケーター、研究者を募集しています。