2012年11月21日
アンビエントボイスサプレッサ(AVS)搭載の「小型音源分離マイクモジュール」を開発
騒音下でのクリアなコミュニケーションを実現

AVS搭載小型音源分離マイクモジュール
OKIは、このたび大雑音下でも利用者の発声区間を正確に抽出し、雑音を抑圧するアンビエントボイスサプレッサ(以下AVS)技術を開発しました。さらにAVSを搭載した「小型音源分離マイクモジュール」を製作し、利用者の声を分離抽出する性能を大幅に向上させることに成功しました。本技術は周囲の雑音から利用者の声のみを分離・抽出できるため、スマートフォンなどのモバイル機器に搭載することで、展示会場、車中、駅などの騒がしい場所でも支障無くコミュニケーションができます。
近年、スマートフォンが急速に普及し、従来の通話に加えて、テレビ電話機能などのハンズフリーで音声通話を行う場合が多くなってきています。騒音が多い屋外の公共空間などでハンズフリー通話を行うと、周囲の人の話し声や環境雑音の混入によって通話音質の低下や、ハウリングが起こりやすくなる、という課題があります。
このような課題に対処するため、OKIは長年に亘る音源分離(注1)の研究開発をベースに、複数マイクを用いて周囲の人の話し声や背景雑音を抑圧するAVS技術を開発しました。さらに製作したAVS搭載の「小型音源分離マイクモジュール」を用いた検証実験では、騒音レベルの高いバスターミナルや駅のホームでクリアに会話ができることを確認しました。
今後、OKIはAVSを搭載した音源分離ソフトウェアおよび「小型音源分離マイクモジュール」の情報通信機器市場への展開や、さらなる応用に取り組んでいきます。
なお、本開発の一部は、早稲田大学・小林哲則 教授との共同開発によるものです。
AVS(Ambient Voice Suppressor)技術の概要
AVSは、周囲の人の話し声と話者本人の声とを判別し、周囲の人の声のみを抑圧するOKIの独自技術です。入力音の到来方位を判定し、正面以外から到来する入力信号 (隣の人の話し声や背景雑音など)を抑圧するという処理を行います(図1)。

図1 AVS技術の概要
到来方位の判定は、指向性形成フィルターで生成した4方向の指向性信号の相互相関(注2)に基づいて行います。相互相関は、正面から入力信号が到来していると大きくなり、そうでない場合には小さくなります。そこで、相互相関が小さい場合は話者の声ではないとみなして抑圧します。このようにして正面から到来する音声成分を抽出できます。
この機能により、従来は困難だった話者本人の声と隣で話している人の声とを正確に判別し、話者の声を抽出することが可能になりました。バスターミナル(騒音レベル60~70dBA)や鉄道の駅のホーム(騒音レベル60~85dBA)で検出性能評価を実施したところ、正確に目的音声区間を検出できていることが確認できました。
また、今回製作したAVS搭載「小型音源分離マイクモジュール」では、AVSの到来方位判定機能を応用して、モジュールに搭載されている4個のマイクの感度差を自動校正する機能も同時に稼動しています。この機能により、マイクの感度差によって生じる音質低下を防止できるようになり、話者の声の音質がさらに自然になりました。またマイク特性の経年変化が起きても、音質や抽出性能の変化を防ぐことができます。
AVS搭載「小型音源分離マイクモジュール」の特長
- 音声通話時の通話音質の向上
雑音下で会話している場合でも、通話相手には背景雑音や周囲の話し声が抑圧されたクリアな声が届くようになります。また大雑音下でハンズフリー通話を行う場合、音の回り込みによってハウリングが発生しやすくなりますが、AVSで回り込み成分を抑圧できます。これによりハウリングが発生しにくく安定した通話が可能になります。
本技術はスマートフォンなどの携帯端末に限らず、ビデオ会議システム・インターホンなど、音声通話機能を有する機器においても有効です。またATMや券売機の通話マイクとしても適用可能です。
- 音声認識技術(注3)の誤認識を防止
近年、スマートフォンやカーナビゲーションシステムには音声認識技術を用いた音声検索機能が搭載されるようになってきています。音声認識技術は騒がしい場所で使用した場合、誤って話者以外の人の話し声に反応してしまう場合があります。本モジュールを用いることで周囲の話し声が抑圧され、誤認識を防止できます。
AVS搭載「小型音源分離マイクモジュール」のサンプル仕様
| 項目 | 仕様 | |
|---|---|---|
| 概要 | マイク | MEMSマイク 4個 |
| ADコンバータ | 16bit(標本化周波数 16kHz ) | |
| DAコンバータ | 16bit | |
| 電源電圧 | DC 5V | |
| 消費電流 | 130mA | |
| 外形(mm) | 45(W)×70(H)×9(D)(基板サイズ:部品厚含まず) | |
| 電源コネクタ | 2極2mmピッチ | |
| 音響特性 | マイク周波数特性 | 200Hz~7.2kHz |
| 指向性 | 図2参照 | |
| 音響信号出力インターフェース | ディジタル | USB(type mini-B メス) |
| アナログ | 3極ミニチュアジャック(L側のみ出力) |

図2 指向特性(0~8kHz)
用語解説
- 注1:音源分離
複数の音源や各種環境音が混ざり合った状況から、目的とする音源のみを抽出する技術。
- 注2:相互相関
複数の信号の類似性を表す特徴量。
- 注3:音声認識技術
人が話した言葉を解析し、発話内容を文字データ化する技術のこと。
- 沖電気工業株式会社は通称をOKIとします。
- その他、本文に記載されている会社名、商品名は一般に各社の商標または登録商標です。
- 本件に関する報道機関からのお問い合わせ先
- 広報部
電話:03-3501-3835 - 本件に関するお客様からのお問い合わせ先
- 研究開発センタ メディア処理技術研究開発部
お問い合わせフォーム
- ※各リリースの記載内容は発表日現在のものです。その後予告なしに変更される場合がありますので、あらかじめご了承ください。
