ディープラーニングの登場により音声認識技術が実用レベルまで向上し、音声インターフェースの利用が様々なシーンへと拡大しています。現在の音声認識技術は、スマートフォンやスマートスピーカーのように、話している人が1人しかいないような環境では、ストレスなく利用できます。しかし、接客カウンターにおける応対記録の自動入力や、音声インターフェースを備えたセルフ端末が複数台並んでいるような場合など、複数の人が同時に話しているような環境では、正しく認識できなかったり、複数の音声を区別して認識できなかったりする課題があります。OKIでは、このような音声インターフェースの課題を解決するために、『エリア収音技術』の研究開発を進めています。
エリア収音技術は、収音したいエリア(以下、目的エリア)の周囲に複数のマイクアレイを配置することで、目的エリア内の音のみ収音する技術です。通常のマイクでは、周囲の雑音が大きいと発言者の声が聞き取りにくいという問題があります。また、ガンマイクのような指向性を持つマイクや、マイクアレイなどを用いても、目的エリア方向にある雑音は収音してしまいます。本技術は、2組のマイクアレイの指向性をそれぞれ別の位置から目的エリアに向けて交差させ、各マイクアレイの指向性に共通に含まれる成分を目的エリアの音と推定し、それ以外の成分を抑圧します。
エリア収音技術により、周りで他の人が話をしていても目的エリア内の人の声だけを認識させることができるようになり、接客カウンターやセルフ端末などにおいて円滑なコミュニケーションが可能となります。
周りの人の声や背景雑音で発言者の声がよく聞き取れない
周りは騒がしくても発言者の声がクリアに聞こえる
公的研究費の不正使用および研究活動における不正行為等に係る通報も上記で受け付けます。