自由研究

CDはなぜ音質が劣化するのか、あるいはしないのか

投稿日:

本編

デジタルデータとは

CDに記録されているのはデジタルデータです。
デジタルデータとは、ごく簡単に言うと”0″と”1″で表現されたデータのことです。
現代では文章・画像・音声・動画などあらゆる情報がデジタルデータとして保存・活用されています。

たとえば、”HELLO”という文字列を考えます。
これをデジタルデータにすると、”01001000 01000101 01001100 01001100 01001111″となります。長いですね。
ちなみにこの”0″,”1″一つずつのことをビット、それを8個合わせたものを通常はバイトと呼びます。

デジタルデータの読み書き

ではまず、デジタルデータを記録するにはどうすればいいでしょう。
CDにデジタルデータを記録するとき、まさかCD表面に小さな文字で0とか1とか書いているわけはありません。
CDには同心円状にピットと呼ばれるくぼみが無数に刻まれていて、ある場所がくぼんでいるかどうかで0と1を表現します。
くぼんでいる場所が”1″、くぼんでいない場所が”0″というわけです。
CDの他にも、コンピュータの内部であれば電圧の高い低いであるとか、光ファイバーであれば光の明るい暗いであるとか、様々な方法で”0″と”1″を表現します。

次に、デジタルデータを読み出してみます。
CDの場合、表面にレーザー光を当てて、ピットと呼ばれるくぼみがあるかどうかを見極めます。
しかし「くぼみ」というのは物理的なものなので、全てのくぼみが均質に作られているわけではありません。
少し浅くなってしまってくぼみはどうなるんでしょうか。0と1の間だから0.8とか?
まさかそんなわけはないですね。読み込む機械の中で、”0″か”1″かどちらかに四捨五入されます。(本当は四捨五入ではなく、方式ごとにいろいろ考え方があります)

デジタルデータの破損

CDを記録するときの品質がダメだったり、保管中に傷ついてしまったりすると、記録したときと別の”0″と”1″を読み込んでしまうことがあります。
たとえば先程の”HELLO”の文字列を、誤って”01001000 01000101 01001101 01001100 01001111″と読み込んでしまうと、これは”HEMLO”という文字列になってしまいます。
1ビット間違えただけでデータが壊れてしまいました。

しかし、実際のCDやハードディスクなどではそうはなりません。なぜなら、通常デジタルデータを記録や通信する際には、符号化という処理が行われるからです。
次は符号化について説明していきます。

符号化とは

さて、皆さんが日常生活でよく見る符号化の代表例はバーコードやQRコードです。
では、QRコードで”HELLO”という文字列を書いてみましょう。

これが”HELLO”のQRコードです。読み込める人は読み込んでみてください。
QRコードは見ての通り、デジタルの0と1を白と黒の四角形で表しています。
生のデジタルデータである”01001000 01000101 01001100 01001100 01001111″は0と1が40個、つまり40ビットのデータでした。
しかしこのQRコードはどう見ても白と黒の四角形が40個より多く書かれています。
これは、データをQRコードにするとき、符号化という処理を挟んだからです。
QRコードでは、符号化によって元のデータに対して以下の機能を加えています。
(詳しい人への補足:ここでは狭義の符号化だけでなく、QRコードへの変換処理全体を符号化と表現しています)

  • カメラなどで読み込みやすくする
  • 一部が汚れても読み込めるようにする

これらの機能を加えることで、デジタルデータの大きさが大きくなり、より沢山の四角形が必要になったわけです。
実際に一部を汚したQRコードを見てみましょう。

先程の画像の一部を赤と青で塗りました。これで、デジタルな記録情報は壊れてしまいました。
しかし実際に読み込んでみると、まだ”HELLO”という情報を取り出すことができます。

このように通常の場合、デジタルデータは記録するときに符号化という処理を挟むことで、記録した媒体(QRコードの画像やCDの表面、光ファイバーの内部など)が一部壊れてしまっても、

  1. ある程度の破損であれば正しいデータを復元できる(誤り訂正
  2. データを復元できなくても、壊れたことが分かる(誤り検出

という機能を持った状態で記録しています。

CDの音質は劣化するか

CDももちろん、この誤り訂正ができる符号化を用いてデータを記録しているので、CDをちょっと傷つけても正しいデータを読み込めるわけです。

なーるほど、ではCDで音質が変わるというのはウソなのだな。
となるかと思いきや、ここで話が変わります。
CD音質問題をややこしくするのはここからです。

  1. デジタルデータが一致していても、スピーカーから聴こえてくる音が同じとは限らない
  2. 実はデジタルデータすら一致していないことがある

これらについて説明していきます。

アナログ信号はノイズを受ける

まず、1つ目の方です。デジタルデータが一致していれば音質は同じに決まっている。本当にそうでしょうか。
もちろんPC上の話なら、デジタルデータが一致しているならデジタルな品質は同じです。
問題はCDプレーヤーで再生するときです。
音質、というのはつまりわれわれ人間が耳で聴いたときの品質のことで、人間はデジタルデータをダイレクトに聴くことができません。
つまり、CDから取得したデジタルデータは、いちどアナログな電気信号に変換されて、さらに音波に変換されて耳に入ってくるわけです。
ここで、このアナログな信号に変換する処理のことをD/A変換とかデジアナ変換とか言います。
アナログな電気信号に変換されるともう誤り訂正はできませんから、アナログな電気信号にノイズが入れば音質は劣化します
特にCDドライブとD/A変換器が物理的に近いプレーヤーであれば、物理的なCDの品質がアナログ信号へのノイズになる、というのは十分にあり得ます。
なので、D/A変換器およびアナログ変換後の信号線は、ノイズ源から遠ざけた方が良いでしょうね。

音楽CDなら劣化する

次に2つ目、デジタルデータすら一致していない、とは一体何でしょうか。
これは先程の符号化の機能で説明した、”誤り検出”が絡んできます。
「誤り訂正できないほどの大きな誤り」を検出した場合、通常はデータ破損が発生したと判断してエラーになります
たとえば以下のQRコードは、カメラで撮影すると誤った文字列を返すのではなく、全く何もデータを返しません。

しかし、音楽CDだけは少し違います。
音楽CDに保存されている音声データは、近年の高度なデータ形式ではなく、かなり原始的な形式をしています。
このWAV形式(正確にはリニアPCM)は、音の波形をほぼそのままデジタルデータ化して時系列で保存するものです。
そのため、音楽CDは一部データが欠損しても、わずかな時間の音が途切れるだけで済むという特性があります。
それに加え、CDはクロスインターリーブ・リードソロモン方式という特殊な符号化を採用しており、誤り訂正できないデータを、前後のデータから補間することができます。

この「前後のデータから補間」というのは中々インパクトのある仕様です。
たとえば文字列データが欠損して、「おは×××××ます」というデータしか読み取れなかったときに、前後のデータを見て「おはようございます」を復元すると言っているのです。
途中のデータはあくまで欠損しているので、この補間で作り出される音はCDプレーヤーの勝手な想像です。
そんなことしていいのかという感じですが、音楽CDの仕様を決めた当時の人達としては、「CDが傷ついて音楽が聴こえなくなるぐらいなら、想像の音でもいいから鳴らしたほうが良い」という判断があったのだと思います。
とにかくこの補間が行われると、音楽CDに対して「正しいデジタルデータ」の他に「想像で補完されたデジタルデータ」を読み込むことがあり得る、というわけです。
もちろんこのモードは音楽CDに限定した動作で、データCDにはこのような補間は行われません。
また、PCで音楽CDを再生するときも、通常はこのモードは適用されません。

この補間モードは実際どれぐらい使われるのか、というのを昔調査した方がいます
その結果を見ると、細かい傷がある程度では補間の必要なく正常に誤り訂正が可能で、よほど劣化した状態のCDでもなければデジタルデータは劣化しないと思って良さそうです。

コラムコーナー

コピーコントロールCD

悪名名高いコピーコントロールCDはこの音楽CDのデータ補間の仕様を悪用したものです。
あえて半分破損したデータをCDに記録することで、「CDプレーヤーなら補間機能が働いてギリギリ音が鳴る」が「PCはデータ破損とみなして読み込めなくなる」という無茶苦茶な動きでコピーできなくなるように仕込みました。
しかし、実際のところPCでも特定の機器を使えば補間機能が働くモードを使うことができたり、逆にCDプレーヤーのすべてが補間機能に対応しているわけではなかったり、そもそも補間した音を聴かせているので音質が悪いとか散々でした。

デジタルデータはいつ劣化するか

デジタルデータはコピーしても劣化しない。それは正しいです。
ただし一方で、「デジタルデータなのだから何をしても劣化しない」というのも誤りです。
メディアファイル、つまり画像・音声・動画などは、ファイルそのものをコピーせずにメディアの再圧縮を行うと劣化します
再圧縮とはなんでしょうか。
近年のメディアファイルのほとんどは圧縮されています。画像で言えばJPGやPNG、動画ならMP4やMOV、これらは全部圧縮が可能なデータ形式です。
メディアファイルの圧縮は、圧縮前の生データに戻すことができる”可逆圧縮”と、戻すことができない”非可逆圧縮”に分類されます。
このうち”非可逆圧縮”とは、基本的には「人間の感覚では見分けがつかないように、細かい情報を省いていく」ことで実現されます。
この非可逆圧縮を繰り返すと、だんだんと細かい情報が失われていき、データが劣化するわけです。
たとえば以下のような操作でデジタルデータは劣化してしまいます。

  • 画像を保存するときにスマホのスクリーンショット機能を使う
  • 非可逆圧縮のファイルを編集して、同じく非可逆圧縮の形式で保存する
  • SNSに写真をアップロードする(SNS内で再圧縮されるため)
  • YouTubeに動画をアップロードする(YouTube内で再圧縮されるため)

劣化させたくないデータは「なるべくオリジナルファイルを保存しておく」、「非可逆圧縮の形式で編集しない」などの工夫が必要です。

まとめ

  • 音楽CDはデジタルデータなので基本的に劣化しない
  • アナログ信号へのノイズはあり得るかもしれない
  • 音楽CDに限って壊れたデータを補間するモードがあるが、通常は使われない
  • メディアファイルを再圧縮する場合は劣化していく

-自由研究

執筆者:

関連記事

no image

Instant NeRF(instant-ngp)で遊んだのでフォトグラメトリーと比較する

最近グラフィックボードを買って、CUDA環境を手に入れたのでかねてから興味のあったNeRFを試してみました。 そんな中で、フォトグラメトリーとの似ているところ、違うところが見えてきたので紹介したいと思 …

no image

最近学んだ3D関連の用語のまとめ

趣味でフォトグラメトリーを始めて約2ヶ月。学んだ用語を個人的にまとめたいと思います。 本格的に知りたい人は各自ググってください。 フォトグラメトリ 広義には、写真を用いた測量技術全般のこと。 狭義には …

no image

マイナンバーカードは偽造できるのか

まえがき マイナンバーカード、発行してますか?私は持ってます。 さて、マイナンバーカードの普及促進のキャンペーンにSPY×FAMILYが抜擢されて話題です。 マイナンバーカード普及に向けたSPY×FA …

no image

あみだくじはどれぐらいランダムか

あみだくじ。 紙とペンがあればすぐに作ることができるお手軽な抽選方法として知られています。 なにか物事を決めたいとき、あみだくじを使うという人も多いのではないでしょうか。 ふと思ったんですが、あみだく …

メカニカルキーボードを水洗いしてメーカーに捕捉されるまでの顛末

こんにちはぎんしゃりです。 最近キーボードを水洗いしてバズりました。 丸半日かけて俺を爆笑させてくれるフォロワーが居るTLに心を救われてる pic.twitter.com/K0I3DPPfE5 &md …