聞かザルでは済まされない! 知られザル音声ファイルの世界

聞かザルでは済まされない! 知られザル音声ファイルの世界

はじめまして、約みつるです。

今年は申(サル)年。
30年ぐらい前にはサルが音楽を聞く某ポータブルプレイヤーのCMが一世を風靡していました。今では音楽を外に持ち出すことはおろか、サイトに音声や映像をのせることが当たり前の世の中になっています。

そこで今回は原点に立ち返り、音声ファイルの基本、圧縮の仕様についてのお話です。

巷で流行りのハイレゾ音源とは

最近、「ハイレゾ音源」って言葉を聞きませんか?
読んで字のごとく高音質の音声ファイルであると想像できますよね。

CDやレコードの時代は「高音質」を追求するとオーディオ機器自体を追求することになる青天井の世界でしたが、音声をデータとして取り扱うようになった21世紀ではソフトウェア(つまり音声ファイル)でも改善の余地が生まれました。

「ハイレゾ音源」はCDの情報量を越える音声ファイルを意味しています。
一般的にCDの音声情報の約三倍と言われています。

人間の耳がこの30年間で劇的な進化を遂げたわけではないので、三倍ものデータ量を人間が感知できるとは思えませんが、それでも「CDよりは良くなった」と感じることができるのが「ハイレゾ音源」なのです。

ただし、データ容量が大きくなるという点では、サイト運用で用いるのは非現実的と言えます。

音声ファイルの圧縮の必要性

そんなにハイレゾ音源がすごいのなら、全部ハイレゾにしちゃえばいいのに……。

そりゃそうですね。
ただし、情報量が多いということはファイルサイズも大きくなってしまうのが玉にキズ。全部ハイレゾ音源にしてしまうと、持ち歩ける曲数もストレージ容量を気にかける必要が出てきますし、サイトで公開するにはあまりにもローディング時間を要してしまいます。

そこで折り合いを付ける手段として「音声ファイルの圧縮」が重要になってくるわけです。用途に応じて圧縮をかけなければユーザビリティを損なうということですね。

圧縮仕様のあれこれ

圧縮には「非圧縮」「可逆圧縮」「非可逆圧縮」の三種類が存在します。

「非圧縮」

これはそのまま、圧縮していないファイルです。元データの情報がそのまま保存されるので、ファイルサイズが大きくなってしまいます。当然ながら元ファイルが低音質なのであれば、低音質のまま再現されます。

非圧縮ファイルをそのまま運用するのは現実的ではないですが、非圧縮ファイルから圧縮ファイルを作成することができるので、バックアップ用にはもってこいといえます。

「可逆圧縮」

圧縮前のデータを保持しつつ圧縮する仕様でロスレス圧縮とも呼ばれています。非圧縮ファイルを50~70%のサイズにすることができるにも関わらず、ファイル展開時に圧縮前と同じデータ量を再現してくれます。

ファイル形式のアルゴリズムによって圧縮・解凍を行っているため、ビットレートの変更はできません。オーディオマニアや前述したハイレゾ音源で多用される仕様です。

「非可逆圧縮」

データをそぎ落として圧縮をかける仕様です。削ぎ落とす量はビットレート(kbps)という数値設定で変えられます。ビットレートを低くすることでファイルサイズもより軽くなりますが、引き換えに高周波の音からそぎ落としていく傾向にあります。

耳年齢の高齢化によって聞き取りづらくなるモスキート音が代表的です。ただし、ビットレートを下げ過ぎると、誰でも聞き取れるハイハット音などでさえ潰れてしまいますので、高音質を追求するのであればチョイスしないでしょう。

各種圧縮形式の代表的なファイルは以下の表を参考ください。

圧縮形式略称拡張圧縮率補足説明
非圧縮WAV.wav0%主にWindowsで用いられる。
AIFF.aiff0%Appleが開発した音声フォーマット。
可逆圧縮
(ロスレス圧縮)
FLAC.flac約30%オープンソース。iTunes非対応だがハイレゾ配信のほとんどがこれ。
ALAC.m4a約40%Appleが開発したロスレスフォーマット。最近オープンソース化。
非可逆圧縮MP3.mp3約90%(※)最古の圧縮方式。音楽配信のほとんどがこれ。
AAC.m4a
.mp4
約90%(※)iTunes Storeで使われているフォーマット。
WMA.wma約90%(※)Windows規格だが絶滅危惧扱いに。
※ビットレートを128kbpsとした場合

音声ファイルの未来は確約できない、だからこその使い分け

2015年は定額制音楽聴き放題サービス元年でした。しかしこれらのほどんどが非可逆圧縮を用いているため、低音質での配信になっているのが現状です。

また、AppleはALACという可逆圧縮方式を選択できるにも関わらず、ハイレゾ音源を再生できるハードウェアを持っていません。

最終的には量を取るか質を取るかのハナシになってしまいますが、例えば英語のリスニングやサイト掲載したい音源には低容量で済む非可逆圧縮で、空気感が重要な音楽には可逆圧縮で。どちらにも変換できる点で保存用に非圧縮といった使い分けが重要なんですね。

まだまだ全音声ファイルの高音質化には越えなければならないハードルは多いですが、確実に進化を遂げている業界なのです。

高音質化に伴い、数年後には音楽を聞くサルがHDDを背負っているCMが流れる可能性がありますねw

コメント