Academication-AI

AI活用・オープンイノベーションのためのメディアです。最先端のAIビジネス事例情報と研究情報をお届けします。

【ビジネス向け】音声認識の現状【IBMの誤認識率5.6%達成を受けて】

元記事はBusiness Insiderで日本語訳もあるのだけど、誤訳や省略がある...のでまとめました。

 

【結論】音声認識システム(英語)のエラーはヒューマンエラーに迫りつつある

【出来ていること】

  • 人間の誤認識率5%に精度が近づいてきている
  • どもり、不明瞭な発音、日常的な環境下では認識できている。

【出来ていないこと】

  • トーンや暗喩のニュアンスは捉えられていない

【所見】

  • 日本語での精度は完全に別問題
  • 音声の音素を認識するのと、音声から言葉を認識するのは別のタスクで、後者は聞き取れた音から穴埋めや推測する自然言語処理の問題。手書き文字認識と似ている。あれも個々の文字を判別し、難しかったものは文脈が「自然になるよう」に補正している。
  • このアプローチの都合上、世界中に転がる「自然な言葉の連なり」が正解データとなっているため、手書き文字認識も音声認識も「世の中に存在しない単語や新しい話し方には精度が落ちる」ことになる。
  • 逆に、人間が「AIが認識しやすいように話せば」精度は大幅に上昇する。世の中で一般的でない言い回しをしなくなる、など。人間がシステム(AI)に合わせるようになっていくのだと思う。

 

www.businessinsider.jp

www.businessinsider.com

 

私たちについて

Ations株式会社はオープンイノベーションを加速させることを目指しています。

現在は人工知能(AI)領域に絞り、開発会社とクライアントのAIリテラシーギャップを埋めるべく、メディアの運営および、AIコンサル、AIアドバイザリー、イベントや勉強会をしております。

いつでも気軽にご連絡ください。

また、「世界にテクノロジーを届けオープンイノベーションによって、科学の発展を加速させたい」と志を同じくする方は是非ご協力ください。

ライター、エンジニア、デザイナー、インターン、オープンイノベーター、サイエンスコミュニケーター、研究者を募集しています。

ations.strikingly.com