AD変換(音声)

デジタル-3
Illustrator 基礎講座
HOME>基礎講座>デジタル>AD変換(音声)>NEXT

サイト内用語検索です

必要に応じ、ウインドウ巾を調整して閲覧下さい


コンピュータは連続情報であるアナログを、そのままでは扱うことが出来ないのでデジタルデータに変える必要が有ります。これをAD変換(アナログ・デジタル変換)と言います。
デジタル化されたデータ(0と1の羅列)は、逆にそのままでは人間にとって理解不能なデータであり、ディスプレー表示、プリントアウト、スピーカーを鳴らすなど人間が理解できる情報に変換(つまりDA変換)して出力する必要が有ります。
パソコンで扱うデータ(デジタルデータ)を大別すると、テキストデータとバイナリデータの2つになります。テキストデータは文字、バイナリデータは大雑把に言って、音声や画像のデータです、温度も有りますね。
画像はこのサイトがメインに取り扱う素材で、ページを改めて詳述します。
ここで、バイナリデータの一つである音声と 、テキストデータについて、そのデジタル化(AD変換)の考え方を取り上げてみます。
音声も画像(静止画、動画)も、デジタル化の考え方は同じです。

 

llustrator講座、PC音痴駆け込み寺-共有

 

■ PCM(パルス符号変調)

音は「音波」と言うくらいですから空気の振動・波で、そのままではアナログデータです。
時間の経過とともに連続的に変化するこのアナログデータを、離散的なデジタルデータ化する「パルス符号変調(PCM)」について説明します。

■ 音

■ 音は空気の振動

デジタル 音声先ず「音」について簡単に図示してみます。

音は空気などの振動・波(音は縦波です)で音波とも言います。
音波には、波長と振幅の2つの要素が有ります。
音波は時間の経過を伴う連続的な情報であり、そのままではアナログデータです。

■ 波長と振幅

波長は通常、1秒間における振動数を言い、Hz(ヘルツ)で表します。振動数が多いほど波長は短くなり、音程が高くなります。
音楽で基準になる音、Aの音(ドレミで言うと下のラの音)は440Hzです。
振動数が低すぎる場合、或いは高すぎる場合は人間の耳に音として感じられません。通常「音」と言う場合、人間の耳に感じる範囲(可聴周波数)を言います。 この範囲を外れた振動を「超音波」と言います。
振幅は波の強さで、音の強弱を表します。

■ アナログ情報の再生

LPレコードや、カセットテープ等の録音は、この波の連続情報を電圧の強さに変換し、そのままレコードの溝の深さや、テープの磁力の強さに反映させて記録します。
又それを再生する場合は、溝の深さやテープの磁力の強さをそのまま電圧の強さに逆変換し、スピーカーの振動に反映させます。
我々の耳はその振動で得られる空気の振動を感じているのです。

■ PCM(パルス符号変調)の手順

音声AD変換の基本は「パルス符号変調」です。
その手法は「標本化」「量子化」「符号化」の手順を踏みます。或いは標本化の前に「フィルタ」を置いて、予めデータの選別をすることも有るでしょう。 フィルタは人間にとって聞こえない周波数部分を、予めカットしておきます(ローパスフィルタ、ハイパスフィルタ)。
今ここではフィルタには触れません。
デジタル 音声 音波左図の様な音の流れ(音波)が有ったとして、左から右に、時間の経過と共に音波が伝わって行くものとします。

この連続情報のままではコンピュータで扱うことが出来ません。これをデジタルデータ化する手順を考えて見ましょう。

■ 標本化(サンプリング)

■ サンプリング周波数・サンプリングレート

音波の連続情報を、一定の時間間隔で区切り、その間隔ごとの瞬間的な値を順次計測して行きます。 これを「標本化(サンプリング)」と言い、連続情報が飛び飛びの値、離散的データになります。
1秒間に行われるサンプリング数を、サンプリング周波数或いはサンプリングレート と言います。サンプリング周波数が高いほど、データ復元の精度は高くなりますが、当然データ量は多くなります。

■ サンプリング定理

「連続波形をサンプリングする際、含まれている最高周波数の2倍以上でサンプリングすれば、ソース波形を完全に復元できる」と言う法則があります。
これを「サンプリング定理」と言い、bit(ビット)の発案者であるシャノンと言う人が考え出しました。
どう言うことかというと、音楽CDではサンプリング周波数を44.1kHz(1秒間に44,100回のサンプリング)としていますが、人間の耳が聞こえる範囲は50Hz〜20KHz程度と言われているので、これを再現するには20KHzの2倍、少なくとも40kHz以上の間隔でサンプリングする必要が有る。と言うことです。
デジタルアナログ変換 音声 量子化左図ではt0〜t15迄の16に分割してして、説明しています。
t0、t1、t2……と、順に一定間隔で、その時の瞬間的なデータを拾って行きます。
連続的な線グラフを、一本一本独立した棒グラフに変換したようなものです。
棒グラフにした後、線グラフは無視されます(ここでは分かりやすいように引き続き掲載しておきます)。

■ 量子化

■ 量子化とは

サンプリングによって分割された一つ一つのデータを、定められた段階に近似します。これを量子化、と言います。量子化はAD変換の中心です。
サンプリングによって得られた離散的データは、そのままでは時々のバラバラな、中間的な値を取り得ます。そのバラバラな値を、予め設定された段階に揃える機能です。

■ 量子化レベル

サンプルされたデータを幾つの段階に量子化するかを、量子化レベルと言います。量子化レベルが高いほど、ソースデータとのギャップ(次に述べる「量子化誤差」)が小さくなります。
音楽 CDでは、16ビット(65536)段階に量子化していますし、DVD等では24ビットに量子化しているものも有ります。
デジタルアナログ変換 音声 量子化左図では、-7〜+7迄、14段階に量子化レベルを設定している例です。
サンプリングによって得られた中間データを、量子化レベルに合わせます。

■量子化誤差

上記のように、サンプルデータが持つ任意の値と、量子化レベルとの間にギャップが出ることが有ります。これを量子化誤差と言います。
この誤差は量子化レベルに近似される訳ですが、それによってカットされたデータは「量子化ノイズ」となります。
量子化誤差は、量子化レベルを上げることで少なくすることができますが、当然データサイズが膨らむことになります。
デジタルアナログ変換 音声 量子化誤差量子化ということを一口で言うと、いわばデータを量子化レベルで割り、余りが出たら四捨五入して、整数に丸めると言うことと理解して良いと思います。

■ 符号化

量子化によって、一定間隔の切りの良い数字に揃えられたデータを、時間経過に沿って2進数で書き出せばデジタルデータの完成です。デジタルアナログ変換 音声 符号化


上記例では、プラス、マイナス各7段階に量子化しています。
7は2進数3ビットで表されます。さらに最上位ビットに、プラス、マイナスを表す0,1を加え、2進数4ビットで符号化することが出来ます。

※ PCMとデータ圧縮

PCMは、AD変換の1手法で、特に圧縮との関連で述べられることは少ないのですが、実はPCMは圧縮の基本だとも言えます。
連続データのアナログは、言わば無限大のデータ量を持っていると言えます。1秒の中にも際限の無い連続的、瞬間データが有る訳で、それを余すことなく計測、定義、表示することは出来ません。
サンプリング、量子化による、離散的データ化の処理自体、無限から有限個のデータに圧縮することです。

デジタルカメラの画質設定は、文字通りこの量子化レベルを調整することによる、画像圧縮の度合いです。


― PAGE-TOP ―