2009年5月18日
「DVCリアルタイム映像符号化技術」と「多視点映像スイッチング通信システム」を開発
省電力で映像符号化を実現し、多視点映像スイッチングを可能に
OKIは、このたび「Distributed Video Coding(注1)リアルタイム映像符号化技術(以下、DVCリアルタイム映像符号化技術)」と「多視点映像スイッチング通信システム(以下、多視点スイッチングシステム)」を開発しました。本技術は、DVC方式による映像のリアルタイム処理を可能とするために、リアルタイム符号量制御処理および復号の高速化(並列化)処理を施したものです。また、本技術を応用した「多視点スイッチングシステム」は、省電力で映像符号化できるDVC方式の特長を活かし、多くのカメラを用いた多視点映像配信が実現できるシステムです。
現在、映像符号化において主流であるH.264(注2)方式は、圧縮率が高い反面、符号化の際に演算量、メモリなど多くの資源と電力を必要とします。このため欧米を中心に、電力を十分確保できない携帯端末や多視点・自由視点映像など、多数のカメラを利用するシステム向けの省電力な映像符号化方式として、DVC方式の研究開発が盛んになっています。
DVC方式による符号化では、動きベクトル探索(注3)は行わず、誤り訂正符号による符号化を行うため、H.264と比較して、数十分の1程度の演算量で符号化が可能です。しかし、現在、一般的に研究されているDVC方式では、符号量制御において復号結果に基づき追加の情報送信を要求する“フィードバック”を必要とするため遅延が大きくなる点と、復号処理の演算量がH.264と比較して非常に多いという点が課題でした。これらの課題により、リアルタイムに動作するシステムは実現されていませんでした。
そこでOKIは、送信側のみで符号量制御を行うことによりフィードバックを必要としない構成とし、復号処理についてはLDPC符号(注4)の処理を並列化することにより、リアルタイムに動作する「DVCリアルタイム映像符号化技術」を開発しました。主な特長は以下のとおりです。
- 送信側で符号量を推測する符号量制御技術を実現したため、従来必要であった受信側からの“フィードバック”を不要にしている
- 復号処理の大部分を占めるLDPC符号を並列化処理することで、高速な復号処理を実現している
- LDPC符号に必要な相関推定を、少ない演算量で処理することで高速な復号処理を実現している
これらの特長により、「DVCリアルタイム映像符号化技術」では、マルチコアプロセッサ(8コア)が搭載されたPCにおいて、QVGA(注5)サイズで45フレーム/秒の処理が可能となりました。
また、本技術を用いた「多視点スイッチングシステム」も開発しました。本システムは、DVC方式の低演算量で符号化が可能という特長を活かし、複数のカメラ映像を配信するものです。受信側では送られた映像のうち、必要な映像のみを選択することにより、見たい映像をリアルタイムに表示することが可能なシステムとなっています。
今回開発した「多視点スイッチングシステム」の適用例のひとつとして、臨場感を伝えるテレワークシステムがあります。例えば、本システムを用いて遠隔地にあるオフィスを俯瞰する映像を配信し、そこに在席している複数の人の映像から必要な映像を選択することができます。遠隔オフィスや、仕事相手の状況をより早く確実に把握できるため、コミュニケーション相手への理解を深め、相手の置かれている状況に即した対応をとることができることなど、テレワーク環境において有効なシステムを構築することが可能となります。
今後、OKIは、「DVCリアルタイム映像符号化技術」を利用した、ハードウエアモジュールを開発していきます。同時に、多くのカメラを用いて多視点映像を配信するテレワークシステムや監視装置などへの応用についても検討していきます。
「一般的なDVCリアルタイム映像符号化技術」のブロック図

「OKIが開発したDVCリアルタイム映像符号化技術」のブロック図

「DVCリアルタイム映像符号化技術」を用いた「多視点スイッチングシステム」の適用例

用語解説
- 注1:Distributed Video Coding
相関する二つのデータを個別に符号化しても、参照して符号化したときと同様に効率的に圧縮できるという理論(Slepian-Wolf理論,Wyner-Ziv理論)を動画像符号化に応用した方式。各フレームをkey frameとnon-key frameに分け、key frameは既存の静止画用の符号化方式(JPEG, H.264 Intraなど)により符号化する。non-key frameを符号化する場合、主にターボ符号(注6)やLDPC符号のような誤り訂正符号による符号化を行う。non-key frameを符号化する際に、動きベクトル探索を行わず誤り訂正符号による符号化を行うことにより、non-key frameに関しては数十分の1の演算両で符号化することができる。復号側では、過去の映像から予測画像を生成し、受信した誤り訂正符号を利用して元の画像を再現する。
- 注2:H.264
2003年5月にITU(国際電気通信連合)によって勧告された、動画データの圧縮符号化方式の標準の一つ。従来広く用いられてきたMPEG-2に比べ同じクオリティなら概ね半分程度のデータ量で済むよう改良されている。なおISO(国際標準化機構)によって動画圧縮標準MPEG-4の一部(MPEG-4 Part 10 Advanced Video Coding)としても勧告されている。このため、「H.264/MPEG-4 AVC」「H.264/AVC」のように両者の呼称を併記する場合も多い。
- 注3:動きベクトル探索
動画像の圧縮符号化において用いられる技術の一種。画像の動き量を推定するために行われ、H.264など現在主流な映像符号化方式の中心となる技術である。高い圧縮率を実現するために有効な技術であるが、ブロック単位(例えば、16×16画素)で、前フレームから現フレームへの動きを探索するため、演算量が多く必要であることで知られている。
- 注4:LDPC(Low Density Parity Check)符号
誤り訂正符号の1種。ターボ符号を越える性能を持つ符号として注目され、高速移動通信、衛星通信などに採用されている。
- 注5:QVGA(Quarter Video Graphic Array)
画像の解像度の1種。1画面の画素数が、320×240から構成される。
- 注6:ターボ符号
誤り訂正符号の1種。非常に高性能な符号として知られ、第三世代携帯電話などに採用されている。
- 沖電気工業株式会社は、グローバルに認知される成長企業を目指し、通称をOKIとします。
- 本開発は、独立行政法人情報通信研究機構平成20年度 通信・放送融合技術開発促進助成金に係る助成対象事業の一部として行われました。
- 本件に関する報道機関からのお問い合わせ先
- 広報部
電話:03-5403-1247 - 本件に関するお客様からのお問い合わせ先
- 研究開発センタ ヒューマンコミュニケーションラボラトリ
電話:048-420-7073
- ※各リリースの記載内容は発表日現在のものです。その後予告なしに変更される場合がありますので、あらかじめご了承ください。
