MP3とは(1) ~ 「MP3ファイル」の技術についてやさしく解説 【用語解説】


音声ファイルを扱うようになると、MP3というのをよく目にしますね。

もう何年も前から使われている音声の技術です。

かなりポピュラーなので、どのようなものなのかご存知な方が多いと思いますが、あまり詳しく知らないという方もいらっしゃると思いますので、そういった方のために簡単に解説してみたいと思います。

スポンサーリンク

WAVファイルについての記事シリーズに続いて、小学生でも判るように書いてみたいと思いますので、なんとなく知ってるけどもっと理解したいな~なんて方はぜひ読んでみてくださいね。

なぜ圧縮するの?

WAVについての解説で音声のデジタル化を説明しましたが、デジタル化された音声はパソコン上では「~.wav」というような名前で保存されます。

WAVアイコン

そしてこのWAVファイルは5分くらいの長さで50MBくらいになります。

これはどのくらいの大きさなのかイメージできますか?

写真で言うと、iPhoneで撮影した時には2MB前後になることが多いです。(iPHone4Sの時) また文字では、日本語100文字は200byteになります。単位が「MB」から「byte」に変わりましたね。1MBは1048576byteです。なんだかすごい数。

じゃあ先程の50MBのWAVファイルは何byteになるでしょうか?

正解は52428800byteです。文字数にすると26214400文字です。多すぎてイメージ出来ないですね。(この数字を細かく覚える必要は無いですのでご安心を。) 小説にすると、ざっくり言って37500ページ程度となります。1冊300~400ページくらいと考えると100冊程度と言えるでしょうか。

textwav_compare

WAVファイルはとても大きなサイズになるということがイメージ出来たと思います。

そこで、なんとかそれを小さく出来ないか?と、パソコンに関わる偉い人たちが頑張って考えて出来たのが「圧縮」という技術です。

いろいろな方法を使って圧縮することで、大きなサイズだったWAVファイルを小さく保存できます。

その代表的な技術がMP3です。MP3で圧縮すると、50MBくらいだったファイルサイズが、10分の1程度の5MBくらいになります。

MP3の圧縮の基本はデータを消すこと

MP3はどのような方法を使ってWAVファイルを圧縮しているのか、というのが気になりますよね。

それを説明していきます。

MP3の圧縮で最も重要なのは、あまり必要の無いデータは消してしまうという方法です。

音の中に含まれているけどあまり必要無いデータというのはどういうものか想像つきますか?

1 すごく小さい音

当たり前ですが、音を再生していて音量を下げていくと聴こえなくなってきますよね。でも、音量を0にしない限りは聴こえないけどほんの少しだけ音は鳴っているはずです。

この「人間に聴こえるか聴こえないかの境目の音量」のことを最小可聴限界と言います。

そして音声ファイルにおいては、人間には聴こえない音量でもデータとしては含まれます。なので、これを消してしまうことでデータを小さくします。

2 大きな音にかき消された小さな音

例えば、アーティストのライブを見に行くと、大きな音で鳴っている楽器の音はハッキリ聴こえますが、隣の人と話すのは大変です。

つまり、大きな音が鳴っているところでは、小さな音は聴こえづらくなりますね。これをマスキング効果と言います。

音声ファイルを圧縮する時には、これによって聴こえづらくなった音も消してしまいます。

3 他の方法も

上記の「最小可聴限界」と「マスキング効果」を利用するのが圧縮の基本ですが、他の方法も使われています。

例えば、人間の可聴領域というのがあります。

人間が聴こえる周波数は20~20000Hzくらいだと言われています。なので、20kHz以上の高音域は人間には聴こえづらいため、それを消してしまうということです。

それだけではなく、更に様々な工夫を重ねて10分の1というデータ量に小さくしています。

スペクトラム・アナライザーで見てみる

ここで、スペクトラム・アナライザーというものを使って、圧縮前と圧縮後の変化を見てみましょう。スペクトラム・アナライザーとは、低い音から高い音までどのぐらい音が鳴っているかをグラフにしたものです。

下の画像は、ある曲を圧縮する前のSoundEngineのスペクトラム・アナライザー画面です。左側は低い音、右側は高い音を表しています。今回のグラフの場合は音(60Hzくらい、ベース音やバスドラムの音)がたくさん出ています。またグラフの右端まできっちり出ているのも判ると思います。

圧縮前

圧縮前

では、圧縮後を見てみましょう。

圧縮後。高音域(画面右端)の音域が出ていない圧縮後。高音域(画面右端)の音域が出ていない

圧縮後。高音域(画面右端)の音域が出ていない圧縮後。高音域(画面右端)の音域が出ていない

ハッキリ判るのは右端でしょう。15kHzくらいより上は完全に無くなっていますね。データが一部消えているということです。

MP3とは(1) ~ 「MP3ファイル」の技術についてやさしく解説
MP3とは(2) ~ 「MP3ファイル」へのiTunesでの変換方法についてやさしく解説
MP3とは(3) ~ 「MP3ファイル」に変換できるソフトをやさしく解説
MP3とは(4) ~ 「MP3ファイル」を再生できるソフトをやさしく解説

スポンサーリンク
カテゴリー: 用語解説   パーマリンク