声の種類と発声のしくみ
1.声ってどんなもの?
音声信号をご覧になったことがありますか? 実際の音声は空気の振動であり、目に見えませんが、マイクロホンを通して電気信号に変換すれば、オシロスコープ等により表示・観測できます。図1.にいろいろな音声信号を示します。
ここで、図1.から音声信号の性質を考えてみましょう。
- 周期的である
波形をみると最初にわかる性質です。しかし、この性質は/a/,/i/,/u/,/e/,/o/などの母音や/n/鼻音にみられる性質で、/s/や/k/などの子音にはみられません。この周期は『ピッチ』と呼ばれており、声の高さを決める要因です。
- 音韻により波形の形が違う
楽器の音色が違うように音韻により聞こえ方(波形の形)が違っています。これは『ホルマント』と呼ばれる物理量が大きく関係しています。

図1.いろいろな音声
次に、同じ/a/についていろいろな波形を見てみましょう。図2のいちばん上の波形が男性1の/a/という波形です。2段目が別の男性2の/a/の波形です。3段目の波形が女性1の/a/の波形です。4段目が別の女性2の/a/の波形です。同じ/a/の波形ですから概略的には同じ波形をしています。しかし、男性と女性ではピッチの間隔が異なっていることに気づくと思います。まえにも述べましたようにピッチは声の高さを決める要因でした。したがって、声の高さの違う、男性と女性ではピッチが異なるのは当然のことでしょう。ピッチの大体の値を次に示します。
- 男性 5ミリ秒~10ミリ秒
- 女性 3ミリ秒~7ミリ秒

図2.母音/a/
2.母音の発声のしくみ

図3.発声気管の構造
図3.は人間の発声気管の構造です。声が出るためには音源が必要です。母音の場合には、この音源は声帯で作りだされます。肺から押し出される呼気は、図 3.(a)に示したように、気管の途中の喉頭というところの呼気を止める働きをする3つの弁を通過します。声帯はそのうちの1つであり、図3.(b)に示したように、一番下についています。他の2つは、それぞれ喉頭蓋、仮声帯と呼ばれます。前者は呼気を完全に止める作用をしていますが、後者の役割はまだよくわかっていません。
一方、声帯は2枚のヒダを開閉することによって、呼気を断続的に止める働きがあり、その断続によって空気流が発生します。声帯筋を緊張させますとこのヒダに張力が加わるため、ヒダの開閉の周波数が高くなり、声が高くなります。また、呼気流を大きくすると大きな声になります。
この声帯の振動周期が『ピッチ』を与えています。
声帯の振動周期が『ピッチ』(声の高さ)を与える
それでは、どのようにして図2.に示した複雑な母音の波形が作り出されるのでしょうか。それは、音源波が唇から放射されるまでに通過する声道(咽喉と口腔)の形によって作り出されています。
音波が円筒管のような音響管を通過すると、ある周波数を持つ音波が強められ、ある周波数のは弱められるという共鳴現象が生じることは御存知だと思います。その共鳴周波数は音響管の形にだけ依存します。シリンダに水を入れて吹くと、水の高さによって高さの違う音を出す遊びをやったことがあるでしょう。これとまったく同じ原理です。
声帯から唇までの声道を1つの音響管と考えると、円筒管の場合と同様に共鳴現象が生じます。
声道の長さは大人で17㎝程度です。声道を17㎝の長さを持つ円筒管とすると、図4.に示したような共鳴を起こします。

図4.声道における共鳴
ただ、声道の場合は円筒間のように一定の太さでないため、もう少し複雑になります。そして、共鳴によって強められた周波数をホルマントと呼びます。ホルマントは複数個発生し、周波数の低い方から第1ホルマント(F1)、第2ホルマント(F2)、第3ホルマント(F3)、…と呼びます。この複数のホルマントによって声の種類(音色)が決まります。
声道の形が『ホルマント』(声の種類)を与える
声道は母音によってきわめて複雑な形状を示すのですが、声道があまり変化しない部分と大きく変化する部分に分けて考えることができます。たとえば、声道を、図5.のように、長さと断面積がそれぞれ異なる管が接続したものと仮定すると、ホルマントと声道の形のおおよその関係を知ることができます。
図5.(b)は母音の/a/に相当する声道の形をしています。このとき、第1番目と第2番目のピーク、すなわち第1ホルマント、第2ホルマントはそれぞれ約780Hz、約1240Hzになります。
図5.(c)は母音の/i/に相当する声道の形をしています。このとき、第1番目と第2番目のピーク、すなわち第1ホルマント、第2ホルマントはそれぞれ約240Hz、約1990Hzになります。

図5.声道の形とホルマントの関係
これら声道の形は舌や唇を使って変えられています。口腔を横から見ると、舌の最も盛り上がっているところがありますが、これを舌の位置と呼びます。この位置が母音の種類によって特徴的に推移していることがわかります。この推移しているところを線で結びますと、図6.(a)に示したようにほぼ三角形になります。この三角形に基づいて、唇側の母音を前舌母音、声帯側を後舌母音、上のは口径が狭いので狭い母音、逆に、下のは広い母音と呼びます。舌の位置と第1,第2ホルマントの周波数の間には図6.(b)に示したような密接な対応関係があることがわかっています。

図6.舌の位置とホルマントの関係
実際、日本語5母音のスペクトル・パターンを観察してみますと、第1,第2ホルマントはほぼ上記の範囲にあり、母音によって特徴的に変化しているのがわかります。F1を横軸にF2を縦軸にとり、その領域を示すと図7.のようになります。

図7.日本語5母音のホルマントの位置
逆にいえば、これらのホルマントの時間的な動きを解析することにより、人間が話す言葉を認識できるわけです。
音声認識は『ホルマント』の時間的変化を解析して行う
3.子音の発声のしくみ
一方、子音の場合はどうかといいますと、まず、音源は声帯で作られるものだけではないことに気がつくでしょう。なぜならば、子音を発声しているとき、喉を指で触れても喉は振動していません。
では、音源はどこにあるのでしょうか。たとえば、/s/では、図8.に示したように、舌の先を上の前歯の付根の近くにもっていき、そこに狭めをつくって呼気を通過させていきます。このとき空気流は一種の乱気流になり、これが/s/の音源になります。
このように狭めによる乱流によってできる音を摩擦音と呼びます。その摩擦音の持っている周波数成分は非常に幅が広く、ときには耳に聞こえない超音波まで含まれています。

図8.摩擦音/s/の調音点とスペクトル
/k/の場合は、図9.(a)に示したように、発声する前に舌の腹の部分を軟口蓋
と呼ばれる上顎に接触させて、いったん呼気を止めているのがわかります。そして、呼気を一気に開放して出すと、/k/の音になります。このように呼気をいったん止めて開放するときにでる音を破裂音といいます。破裂音は摩擦音に比べるとはるかに時間的に短い音ですが、摩擦音と同様に含まれる周波数の範囲はきわめて広いのです。呼気を止める位置を調音点といい、調音点が図9.(b)のように前歯の付根の歯茎にあると/t/に、図9.(c)のように両唇にあると/p/になります。

図9.破裂音/p/,/t/,/k/の調音点
一方、/na/,/ya/の場合も、声帯を振るわせながら出すので有声音です。ただし、図10.(a)に示したように、/n/は/t/と同様に舌先を歯茎に接触させて口腔内の呼気を止めてはいますが、その呼気を鼻腔を通じて逃がしているところに特徴があります。ハミングのように口を閉じても音声を鼻孔から出すことができますが、このような音を鼻音といいます。また、呼気を止める位置、すなわち調音点の違いによって異なった鼻音になります。調音点が/p/と同様に唇にあると/m/になり(図10.(b))、軟口蓋にあると/η/になります。
/ya/は、ゆっくり発音すると/ia/になることから声道を/i/の形から/a/の形に変化させて出す子音であることがわかります。これは流音と呼ばれる有声音で、他に/wa/,/yo/,/yu/などがあります。半母音に似た子音に弾音と呼ばれる/r/があります。調音点は歯茎にあり、舌先が接触しています。

図10.鼻音/n/,/m/の調音点

図11.弾音/r/の調音点
子音の場合は、波形が時間的に激しく変化する音ですから、スペクトルの時間変化に着目してその特徴を探らなければなりません。そのため、子音部分を時間軸上で細かく区切って短時間に含まれる波形を次々に分析して短時間のスペクトルを求める方法がとられています。
- ※ 本ページに使用した図(図1.~図11.)は 伊福部達:「音声タイプライタの設計」CQ出版から引用しました。
