OKIOpen up your dreams

Japan

  • Global Site
  • お問い合わせ
  • サイトマップ
  • Chinese Site
サイト内検索

 


現在位置:Home > OKIについて > 研究開発 > 注力する技術 > 声と音の技術 > 音声信号のディジタル化


研究開発

声と音の技術 音声信号のディジタル化

1.音声信号のディジタル信号化
2.標本化
3.量子化
4.符号化

1.音声信号のディジタル信号化

音声の性質について簡単に説明しました。近年、半導体技術やマイクロプロセッサ技術が発達し、いままでアナログ信号としてしか処理できなかった音声信号がディジタル信号として処理できるようになり、

  • いままでできなかった複雑な処理が可能となる。
  • 安定性(温度、素子のばらつきなど)の良い回路が設計できる。

などの利点が生まれました。そこで、これらの技術に入る前に、音声信号をディジタル信号に変換するうえで注意しなければならない点を述べておきます。
ディジタル信号処理を行うに当たっては図1.に示すようにアナログ信号をアナログ・ディジタル変換でディジタル信号に変換しなければなりません。また、ディジタル信号処理の結果は必要に応じてディジタル・アナログ変換を用いてアナログ信号に戻してやる必要があります。


図1.ディジタル信号処理

さきほど話した音声信号をディジタル信号に変換する場合を例にとりましょう。音声の電気信号は時間とともに変化するアナログ量としてマイクロフォンから出力されます。横軸に時間の経過を,縦軸に電圧をとると図2.になります。


図2.音声の電気信号

このようなとき、マイクロフォンの電気信号をv(t)という関数の形で一般には表現します。すなわち、時間tの時の出力電圧がv(t)であることを意味します。
ここで図2.には2つのアナログ量が存在します。何と何でしょう。

  • 一つは時間経過を示す量がアナログ量です。
  • もう一つはマイクロフォンの出力電圧です。

時間tと電圧v(t)の2つの量がアナログ量であるため、図2.関数の線も連続的な線になっています。
これら2つのアナログ量それぞれをディジタル化しなければディジタル信号として取り扱うことはできません。

ページの先頭へ

2.標本化

標本化とは、時間の経過をディジタル化することをいいます。
連続的に変化している時間をディジタル化するということは、飛び飛びの時間間隔で信号を観測することを意味します。

標本化とは飛び飛びの時間間隔で信号を観測すること

気温の観測する場合でも、1時間ごと、あるいは1日ごとに観測します。これも標本化といえます。
通常、ディジタル信号処理において、標本化は同じ時間間隔で行われます。たとえば、図3.に示すように時間間隔Tで電気信号v(t)を観測した時、n番目の観測点における電気信号はv(nT)で表わされます。ここでnが整数であることに注意してください。


図3.アナログ信号の標本化

観測する(標本化する)時間間隔Tを『標本化周期』といいます。またその逆数1/Tを『標本化周波数(サンプリング周波数)』といいます。

  • 標本化する時間間隔を標本化周期という
  • 標本化する周波数を 標本化周波数という

次に標本化周期の決め方について説明します。標本化とは飛び飛びの時間間隔で信号を観測することでした。標本化周期は信号の変化する速さによって適度に決めなければなりません。信号には速く変化する信号と、ゆっくり変化する信号があります。図4.(a)のようにゆっくり変化する信号には長い標本化周期でかまいませんが、図4.(b)のように速く変化する波形をゆっくり標本化したのでは波形の情報は失われてしまいます。図4.(c)のように速く標本化しなければなりません。

  • 速く変化する信号には標本化周期を短くする
  • 遅く変化する信号には標本化周期は長くする


図4.信号の変化の速さと標本化周期

では、実際、どのくらいの速さで標本化しないといけないのでしょうか?理由は省略しますが、その信号の持っている周波数成分の2倍の周波数で標本化しなければなりません。

  • 電話音声信号は8kHz以上で標本化されている
  • 音楽は44.1kHzで標本化されている

ページの先頭へ

3.量子化

量子化とは電気信号v(nT)の値をディジタル量にすることをいいます。

量子化とは値をディジタル量にすること

量子化を説明するために、図5.の数直線上の実数と整数を考えます。


図5.数直線上の実数と整数

図5.の数直線は連続しており、実数(アナログ量)は線上の任意の点で表現されます。しかし整数(ディジタル量)は線上の飛び飛びの点でしか表現されません。
量子化とは実数を四捨五入で整数化するようなものです。

量子化と四捨五入は同じ

たとえば実数πの小数点以下を四捨五入すると3になります。四捨五入の結果は飛び飛びのディジタル量になります。切捨て、切上げも同じように量子化に一つです。だだ、量子化の方法が異なるだけだと考えてください。量子化のやり方を量子化特性といいます。小数点以下を四捨五入して整数化するときの量子化特性を図6.に示します。量子化特性のグラフは階段状になります。


図6.量子化特性

図6.の横軸はアナログ量の実数の値です。縦軸は量子化された値(ディジタル量)の整数の値です。図6.を用いれば、
1.5≦x<2.5
を満足する実数xは量子化により2になります。

量子化によりアナログ量がディジタル量に変換されたとき誤差を生じます。その誤差を量子化誤差といいます。

量子化を行うと量子化誤差を生じる

たとえば実数2.35の小数点以下を四捨五入する量子化によって生じる量子化誤差は、量子化の結果が2ですから、
2-2.35=0.35
となります。量子化を行う際には量子化誤差をなるべく小さくするように量子化特性を決めなければなりません。量子化誤差は量子化特性の中で図6.の斜線の部分で表現されます。

したがって、量子化誤差を小さくするためには図7.に示すように量子化特性の階段の幅を細かく設定すればよいことになります。


図7.量子化特性の階段幅の違い

しかし、量子化を考える場合、量子化特性の階段の幅以外に階段の数にも注意を払わなければなりません。その理由は次の符号化のところで説明しますが階段の数は有限でなければなりません。そうしないとコンピュータのなかで処理できないからです。

量子化特性の階段の数は有限でなければならない

図8.に実際に用いられる量子化特性を示します。この例では階段の数は8個になっており、階段の数が増えないように量子化特性の左右の端が水平になっている。


図8.実際の量子化特性の例

次に、信号の変化の範囲と量子化特性の関係を説明します。アナログ量が変化する範囲が限られている場合、図9.(a)のように量子化特性を設定したのでは量子化後の値が一定になってしまい信号の変化が失われてしまいます。このようなときには図9.(b)のように量子化特性を設定しなければなりません。


図9.信号が変化する範囲が限定されている時

また、信号の変化が大きいにもかかわらず図10.(a)のように量子化特性を設定したのでは大きな信号を量子化した時の量子化歪が非常に大きくなってしまいます。このようなときには図10.(b)のように量子化特性を設定しなければなりません。


図10.信号が大きく変化しているとき

量子化特性を決めるときに考えること

  • 許せる量子化誤差
  • 信号の変化範囲

ページの先頭へ

4.符号化

符号化とはディジタル量に符号を設定することをいいます。そこで、標本化および量子化した信号を符号化することを考えましょう。ディジタル信号処理では量子化した信号に0と1の数字(ディジタル量)を与えることを符号化といいます。

符号化とは量子化した信号に0と1を割り当てること

まず、前述した量子化特性の図を思いだしてください。


図11.符号の割り当て

図11.は階段の数が8つの場合の量子化特性を与えています。当然、量子化により得られる値は8つに限られます。この8つの値に0と1を対応させることが符号化です。1つの0と1は2つの場合しかありませんから3つの0と1で8つの場合を表わします。これを『3ビットの符号』といいます。
0から7までの数字を3つ(3ビット)の0と1で表現します(2進符号化といいます)。
話をもとに戻しまして、8つの量子化値にどの3ビットの符号を割り当てるかは約束ごとで決めます。しかし、一般的には2の補数表現で符号を割り当てる場合が多いようです。割り当てた符号のうち最上位(いちばん左)の桁をMSB(一番重要なビット:Most Significant Bit)、最下位(一番右)の桁をLSB(一番重要でないビット:Least Significant Bit)といいます。
量子化特性の階段の数はそれぞれに0と1の符号を割り当てる関係から2のべき乗に設定されます。階段の数と割り当てられる符号のビット数は表1.に与えます。

表1.階段の数と符号のビット数

階段の数 符号化のためのビット数
8 3
16 4
32 5
64 6
128 7
256 8
512 9
1024 10
2048 11

では、実際の音声信号は何ビットで量子化、符号化すればよいのでしょうか?音声信号のダイナミックレンジは50dB程度ですから、音声信号の量子化に際しては少なくとも10ビット必要なことがわかります。しかし、小さな信号の場合でも量子化誤差と信号が同じ大きさでは仕方がありません。そのため、余裕をみて、音声信号は通常12ビットで量子化します。ダイナミックレンジの広い音楽などをディジタル信号に変換するためには16ビット必要になります。

  • 音声信号は通常12ビット以上の量子化が必要
  • 音楽信号は通常16ビット以上の量子化が必要

ページの先頭へ