OKIOpen up your dreams

Japan

  • Global Site
  • お問い合わせ
  • サイトマップ
  • Chinese Site
サイト内検索

 


現在位置:Home > OKIについて > 研究開発 > 注力する技術 > 声と音の技術 > ADPCM音声符号化技術


研究開発

声と音の技術 ADPCM音声符号化技術

1.適応量子化
2.適応差分PCM(ADPCM)符号化

1.適応量子化

信号の量子化に際しては、許せる量子化誤差と信号の変化範囲を考慮して、あらかじめ定めた1つの量子化特性を用いることは 「音声信号のディジタル化」のところで説明いたしました。ところが、図1.を見ていただければお判りになるかと思いますが、音声信号には、母音などのように振幅範囲が大きい部分もあれば、無声音みたいに振幅が非常に小さい部分もあります。このような信号に対して、いつも同じ量子化特性を用いて量子化するのは効率的ではありません。


図1.音声波形の振幅変化

そこで、図2.のように、振幅範囲が大きい所では量子化幅を大きくして振幅変化に追随するようにし、振幅範囲が小さい所では量子化幅を小さくし、小さな信号変化を再現できるようにします。このように、量子化特性を振幅変化範囲の大きさに応じて適応的に変える量子化方法を『適応量子化』と呼びます。


図2.適応量子化

ページの先頭へ

2.適応差分PCM(ADPCM)符号化

適応量子化を用いた符号化の一つが、適応差分PCM(Adaptive Differential PCM:ADPCM)です。ADPCM処理の構成を図3.に示します。差信号dnの量子化に際して適応量子化が用いられています。図4.にADPCM方式の演算のフローチャートを示します。
(ステップ1)~(ステップ5)が送信側、(ステップ6)~(ステップ8)が受信側の処理にそれぞれ対応します。以下、フローチャートに沿って処理の流れを説明します。


図3.ADPCM処理の構成


図4.ADPCM処理フローチャート

送信側(符号化)の処理

ステップ1
入力信号ynから1つ前の標本点での波形再生値y'n-1を差引き、差分dnを算出します。
ステップ2
つぎに差分dnを量子化幅Δnで量子化し、量子化レベルに対応した符号を割り当てます。ただし、ここでは差分dnを量子化幅Δnで除し、その結果を整数化したものを符号として用いていますので、量子化値を得ることなく直接符号Cnを算出しています。記号[・]は中の値を越えない最大の整数を表しています。
ステップ3
Cnを復号し量子化値d'nを算出します。(ステップ2)および(ステップ3)は、これまで学習した、量子化、符号化の順番と逆になっているので少し分かり難いですが、量子化特性図を書いてみると容易に理解できると思います。図5.に量子化レベルが8段階、3ビット符号化場合の量子化特性を示します。
ステップ4
復号された差分量子化値d'nを前標本点の波形再生値y'n-1に加え値現標本点での波形再生値y'nを算出します。
ステップ5
符号Cnによって定まる係数M(Cn)を、現在の量子化幅Δnに乗ずることにより、次の標本点で用いる量子化幅Δn+1を得ます。係数Mは音声の統計的性質に基づいて表1.のごとく、量子化の結果のレベルの絶対値が小さい場合にはM<1、大きい場合にはM>1なる値に定められています。つまり、符号化結果が、現在の量子化幅によって表現し得るダイナミックレンジに対して半分以下のレベルであれば、現在の量子化幅では大きすぎるとして量子化幅を縮小し、反対に符号化の結果が大きいレベルになったときには、信号のダイナミックレンジが増大しつつあると考えて、量子化幅を拡大して過負荷となることを防ぎます。

以上の一連の処理を各標本点毎に繰り返すことによってADPCMの符号化が進められます。

受信側(符号化)の処理

一方、受信側では、符号Cnを受け取って送信側(ステップ3)~(ステップ5)と、まったく同一処理により再生波形を生成します。


図5.ADPCMの量子化特性


表1.量子化幅適応化係数

以上、ADPCM音声符号化方式を紹介しました。これらの符号化方式を用いて、どの程度情報圧縮に効果があるかは、再生された音声を実際に耳で聞かないと、なかなか理解しづらいものがありますが、たとえば、ADPCM方式では、4ビットの符号化ビット数で実用上ほとんど問題のない合成音が得られます。
図6.に、単純に符号化を行った場合(図6(b))、ADPCM処理を行った場合(図6(c))の量子化による誤差を示しました。ADPCM処理によって量子化誤差が著しく小さくなっていることがお判りいただけると思います。


図6.ADPCM符号化による量子化誤差

ページの先頭へ