2010年6月30日
「DVCリアルタイム映像符号化技術搭載ハードウェアモジュール」を開発
省電力かつ低コストでリアルタイム映像符号化処理を可能に
OKIは、このたび「Distributed Video Coding(注1)リアルタイム映像符号化技術(以下、DVCリアルタイム映像符号化技術)を搭載したハードウェアモジュール」を開発しました。本ハードウェアモジュールは、符号量制御処理の低演算化およびプロセッサの特長を活かした高速化処理を施すことで、省電力かつ低コストなARM®プロセッサ(i.MX31 400 MHz)上でDVC方式による映像のリアルタイム処理を可能としたものです。
現在、映像符号化において主流であるH.264(注2)方式は、圧縮率が高い反面、符号化の際に演算量、メモリなど多くの資源と電力を必要とします。このため欧米を中心に、電力を十分確保できない携帯端末や多視点・自由視点映像など、多数のカメラを利用するシステム向けの省電力な映像符号化方式として、DVC方式の研究開発が盛んになっています。
DVC方式による符号化では、動きベクトル探索(注3)は行わず、誤り訂正符号による符号化を行うため、H.264と比較して、数十分の1程度の演算量で符号化が可能です。しかし、現在、一般的に研究されているDVC方式では、誤り訂正符号化以外の処理に多くの演算量を必要とするという課題があります。そのため、ARM®などの組込みプロセッサで映像のリアルタイム符号化は実現されていませんでした。
そこでOKIは、誤り訂正符号化以外に、多くの演算量を必要とする処理のうち、「送信側のみの符号量制御技術」、「ダイナミックレンジ算出処理技術」に関してアルゴリズムの工夫により高速化を実現しました。また同時に「整数変換(注4)を採用し並列化する」ことにより、「DVCリアルタイム映像符号化技術を搭載したハードウェアモジュール」を開発しました。このハードウェアモジュールはARM®プロセッサが搭載された市販ボードに前述の技術を搭載したものになります。主な特長は以下のとおりです。
- 送信側のみの符号量制御技術
DVCの特長である「符号化演算量が少ないこと」を損なわないために、符号量制御を低演算処理(前フレームと現フレームとの差から送信ビット量を割り当てる)で実現しました。同時に、従来必要であった受信側からの"フィードバック"も不要にしています。
- ダイナミックレンジ算出処理技術
DCT(注5)の高周波成分をダイナミックレンジに基づき量子化する際に、符号割り当てを工夫することで、ダイナミックレンジ算出処理を低演算で実現し、高速化を実現しました。
- 整数変換の採用と高速化
DCTを整数変換に変更することで高速化するとともに、変換演算に必須な乗数の桁数を16bit単位に限定することで、32bitプロセッサを用いて2並列処理を可能とし、高速化を実現しました。なお、乗数の桁数を限定しても同じ符号化処理性能を実現しています。
これらの特長により、「DVCリアルタイム映像符号化技術を搭載したハードウェアモジュール」は、ARM®プロセッサ(i.MX31 400 MHz)において、QVGA(注6)サイズで14フレーム/秒の処理が可能となりました。
今後、OKIは、「DVCリアルタイム映像符号化技術を搭載したハードウェアモジュール」を、多くのカメラを用いて映像を配信するテレワークシステムや監視装置などに応用することについて検討していきます。
「一般的なDVC映像符号化技術」のブロック図

「OKIが開発したDVCリアルタイム映像符号化技術」のブロック図

市販のボードを使用しOKIが開発したDVCリアルタイム映像符号化技術を搭載したハードウェアモジュール

用語解説
- 注1:Distributed Video Coding
相関する二つのデータを個別に符号化しても、参照して符号化したときと同様に効率的に圧縮できるという理論(Slepian-Wolf理論,Wyner-Ziv理論)を動画像符号化に応用した方式。各フレームをkey frameとnon-key frameに分け、key frameは既存の静止画用の符号化方式(JPEG,H.264 Intraなど)により符号化する。non-key frameを符号化する場合、主にターボ符号(注7)やLDPC符号(注8)のような誤り訂正符号による符号化を行う。non-key frameを符号化する際に、動きベクトル探索を行わず誤り訂正符号による符号化を行うことにより、non-key frameに関しては数十分の1の演算量で符号化することができる。復号側では、過去の映像から予測画像を生成し、受信した誤り訂正符号を利用して元の画像を再現する。
- 注2:H.264
2003年5月にITU(国際電気通信連合)によって勧告された、動画データの圧縮符号化方式の標準の一つ。従来広く用いられてきたMPEG-2に比べ同じクオリティなら概ね半分程度のデータ量で済むよう改良されている。なおISO(国際標準化機構)によって動画圧縮標準MPEG-4の一部(MPEG-4 Part 10 Advanced Video Coding)としても勧告されている。このため、「H.264/MPEG-4 AVC」「H.264/AVC」のように両者の呼称を併記する場合も多い。
- 注3:動きベクトル探索
動画像の圧縮符号化において用いられる技術の一種。画像の動き量を推定するために行われ、H.264など現在主流な映像符号化方式の中心となる技術である。高い圧縮率を実現するために有効な技術であるが、ブロック単位(たとえば、16×16画素)で、前フレームから現フレームへの動きを探索するため、演算量が多く必要であることで知られている。
- 注4:整数変換
H.264で用いられている周波数変換。従来の映像符号化では、DCTを用いられることが多かったが、H.264から整数変換が採用された。符号化側と復号側での演算精度に起因するミスマッチがないという特長がある。
- 注5:DCT(Discrete Cosine Transform)
離散コサイン変換。離散信号を周波数領域へ変換する方法。映像の符号化効率向上寄与する最も効果的な方式の一つ。
- 注6:QVGA(Quarter Video Graphic Array)
画面解像度の1種。1画面の画素数が、320×240から構成される。
- 注7:ターボ符号
誤り訂正符号の1種。非常に高性能な符号として知られ、第三世代携帯電話などに採用されている。
- 注8:LDPC(Low Density Parity Check)符号
誤り訂正符号の1種。ターボ符号を越える性能を持つ符号として注目され、高速移動通信、衛星通信などに採用されている。
- 沖電気工業株式会社は通称をOKIとします。
- 本文に記載されている会社名、商品名は一般に各社の商標または登録商標です。
- ARMは、ARM社のEUおよび米国における登録商標です。「ARM」とは、ARM Holdings plc(LSE:ARM、NASDAQ:ARMHY)、その事業会社であるARM Limited、各地域の子会社であるARM INC.、ARM KK、ARM Korea Ltd.、ARM Taiwan、ARM France SAS、ARM ChinaおよびARM Belgium N.V.の全部または一部を意味します。
- 本開発は、独立行政法人情報通信研究機構平成21年度 通信・放送融合技術開発促進助成金に係る助成対象事業の一部として行われました。
- 本件に関する報道機関からのお問い合わせ先
- 広報部
電話:03-5403-1247 - 本件に関するお客様からのお問い合わせ先
- 研究開発センタ ヒューマンコミュニケーションラボラトリ
電話:048-420-7073
- ※各リリースの記載内容は発表日現在のものです。その後予告なしに変更される場合がありますので、あらかじめご了承ください。
