AD変換(音声)
連続情報であるアナログのままではコンピュータが扱うことが出来ないことを述べてきました。コンピュータで扱う為にはデジタルデータに変える必要が有ります。これをAD変換(アナログ・デジタル変換)と言います。
逆にデジタル化されたデータ(0と1の羅列)は、そのままでは人間にとって理解不能なデータであり、人間が理解できる情報に変換(つまりDA変換)して出力する必要が有ります。 具体的には文字や画像・映像、音声などに戻してそれぞれのデバイスで出力します。
パソコンで扱うデータ(デジタルデータ)を大別すると、テキストデータとバイナリデータの2つになります。テキストデータは文字、バイナリデータは大雑把に言って、音声や画像のデータです、温度や圧力などもこれに入ります。
画像はこのサイトがメインに取り扱う素材で、ページを改めて詳述します。
ここで、バイナリデータの一つである音声と 、テキストデータについて、そのデジタル化(AD変換)の考え方を取り上げてみます。 音声も画像(静止画、動画)も、デジタル化の考え方・手順は共通です。
llustrator講座、PC音痴駆け込み寺-共有
アナログとしての音声
■ 音
音は「音波」と言うくらいですから空気の振動・波で、そのままではアナログデータです。
時間の経過とともに連続的に変化するこのアナログデータを、離散的なデジタルデータ化する「パルス符号変調(PCM)」について説明します。
音は空気の振動
先ず「音」について簡単に図示してみます。
音の本質は空気などの振動・波(音は縦波です)で音波とも言います。その波の振動が人間の聴覚系を通して、音として感覚される訳です。
音波には、波長と振幅の2つの要素が有ります。
音波は時間の経過を伴う連続的な情報であり、そのままではアナログデータです。
波長と振幅
波長は通常、1秒間における振動数を言い、Hz(ヘルツ)で表します。振動数が多いほど波長は短くなり、音程が高くなります。
音楽で基準になる音、Aの音(ドレミで言うと下のラの音)は440Hzです。
振動数が低すぎる場合、或いは高すぎる場合は人間の耳に音として感じられません。通常「音」と言う場合、人間の耳に感じる範囲(可聴周波数)を言います。 この範囲を外れた振動を「超音波」と言います。
振幅は波の強さで、音の強弱を表します。
アナログ情報の再生
LPレコードや、カセットテープ等の録音は、この波の連続情報を電圧の強さに変換し、そのまま連続的なレコードの溝の深さや、テープの磁力の強さに反映させて記録します。
又それを再生する場合は、溝の深さやテープの磁力の強さ等、連続情報をそのまま電圧の強さに逆変換し、スピーカーの振動に反映させます。 我々の耳はその振動で得られる空気の振動を感じているのです。
音声のデジタル化(PCM―パルス符号変調)
■ PCMーパルス符号変調
PCMーパルス符号変調はAD変換(アナログ・デジタル変換)の一種です。音声のデジタル化は専らPCMに拠ります。
パルス符号変調の三段階
音声AD変換の基本は「パルス符号変調」です。
その手法は「標本化」「量子化」「符号化」の手順を踏みます。或いは標本化の前に「フィルタ」を置いて、予めデータの選別をすることも有るでしょう。 フィルタは人間にとって聞こえない周波数部分を予めカットする等の機能を持ちます(ローパスフィルタ、ハイパスフィルタ)。 今ここではフィルタには触れません。
右図の様な音の流れ(音波)が有ったとして、左から右に、時間の経過と共に音波が伝わって行くものとします。
この連続情報のままではコンピュータで扱うことが出来ません。これをデジタルデータ化する手順を考えて見ましょう。
■ 標本化(サンプリング)
サンプリングとは
音波の連続情報を、一定の時間間隔で区切り、その間隔ごとに値を平均化して順次計測して行きます。 これを「標本化(サンプリング)」と言います。連続情報を飛び飛びの値、離散的データにする訳です。
1秒間に刻まれるサンプリング数を、サンプリング周波数或いはサンプリングレート と言います。サンプリング周波数が高いほど、つまりソースデータを細かく刻むほどデータ復元の精度は高くなりますが、当然データ量は多くなります。
右図ではt0~t15迄の16に分割してして、説明しています。
t0、t1、t2......と、順に一定間隔で、その時の瞬間的なデータを拾って行きます。
連続的な線グラフを、一本一本独立した棒グラフに変換したようなものです。
棒グラフにした後、線グラフは無視されます。つまり連続情報は破棄される訳です(ここでは分かりやすいように引き続き掲載しておきます)。
サンプリング定理
「連続波形をサンプリングする際、含まれている最高周波数の2倍以上でサンプリングすれば、ソース波形を完全に復元できる」と言う法則があります。 これを「サンプリング定理」と言い、bit(ビット)の発案者であるシャノンと言う人が考え出しました。
例えば、人間の耳が聞こえる範囲は50Hz~20KHz程度と言われています。これを再現するには20KHzの2倍、少なくとも40kHz以上の間隔でサンプリングする必要が有ると言うことです。音楽CDではサンプリング周波数を44.1kHz(1秒間に44,100回のサンプリング)としています。
■ 量子化
量子化とは
サンプリングによって分割された一つ一つのデータを、予め定められた段階に近似します。これを量子化、と言います。量子化はAD変換の中心です。
サンプリングによって得られたデータは、そのままでは時々のバラバラな、端数を伴う中間的な値を取り得ます。その中間的な値を、予め設定された段階に合わせます。つまり端数を揃えて、デジタルデータとしての要件である整数に「丸める」機能です。
量子化レベル
サンプルされたデータを幾つの段階に量子化するかを、量子化レベルと言います。量子化レベルが高いほど、つまり細かく設定するほどソースデータとのギャップ(次に述べる「量子化誤差」)が小さくなります。
音楽CDでは、16ビット(65536)段階に量子化していますし、DVD等では24ビットに量子化しているものも有ります。
右図では、-7~+7迄、14段階に量子化レベルを設定している例です。 サンプリングによって得られた中間データを、量子化レベルに合わせます。
量子化誤差
上記のように、サンプルデータが持つ任意の値と、量子化レベルとの間にギャップが出ることが有ります。これを量子化誤差と言います。
この誤差を量子化レベルに近似する訳ですが、それによってカットされたデータは「量子化ノイズ」となります。
量子化誤差は、量子化レベルを上げることで少なくすることができますが、その分当然データサイズが膨らむことになります。
量子化を一口で言うと、いわばデータを量子化レベルで割り、余りが出たら四捨五入して整数に丸めることだと理解して、大きな間違いは無いでしょう。
■ 符号化
サンプリングと量子化によって、一定間隔の切りの良い整数に丸められたデータを、時間経過に沿って2進数で書き出せばデジタルデータの完成です。
上記例では、プラス、マイナス各7段階に量子化しています。
7は2進数3ビットで表されます。さらに最上位ビットに、プラス、マイナスを表す0,1を加え、2進数4ビットで符号化することが出来ます。
※ PCMとデータ圧縮
PCMは、AD変換の一手法で、特に圧縮との関連で述べられることは少ないのですが、実はPCMは圧縮の基本だとも言えます。
連続データのアナログは、言わば無限大のデータ量を持っていると言えます。1秒の中にも際限の無い連続的・瞬間データが有る訳で、それを余すことなく計測、定義、表示することは出来ません。「装置の単純化」でも触れましたが、それをどこまで精密に計測・再生できるかは、アナログデバイスの性能に依存します。
サンプリング、量子化による、離散的データ化の処理自体、無限から有限個のデータに圧縮することを意味します。デジタルカメラの画質設定は、文字通りこの量子化レベルの調整による、画像圧縮の度合いです。
トラックバック(0)
トラックバックURL: http://illustrator-ok.com/mt-tb.cgi/5
コメントする