MP3とOGGの容量差について


動機

  • mp3とoggの容量、差があったりなかったりするので、そもそもなぜ容量が変わるのか調べておきたい
  • 容量が変わる理由を理解しておけば、容量を減らしたいときに助かる

そもそもwavはどうやって記録してるの?

  • サンプリング・量子化・符号化の3ステップをやっているらしい

サンプリング

  • サンプリング周波数とよく言われるやつ、音高
  • 可聴域が20kHzまでなので、普通は44.1kHz 48kHzとかもある

量子化

  • ビット深度とも言われる(こっちは画像のほうがなじみ深いか?)、音の大きさ
  • 16bitだと65,536段階ある、豊かな倍音の表現にはこれくらいは必要なのかしら

符号化

  • 時間順に並べるだけ、ステレオなら左右交互に並べる

mp3はどう圧縮してるの?

  • マスキング効果・高音域カット

マスキング効果

  • 大きな音の近くにある小さな音は聞こえづらいので、削除(周波数マスキング)
  • 大きな音の直後にある小さな音も聞こえづらいので、削除(時間マスキング)

高音域カット

  • 15kHz以上は聞こえづらいので、適度に間引く

ちなみにビットレートって何?

  • 1秒あたりに使うデータ量、単位はkbps
  • wavは44100Hz×16bit×2ch=1411kbps
  • 例えばmp3で128kbpsとかを指定すると、人が聞き取りやすい部分は情報量を多く、聞き取りにくい部分は情報量を少なくして、全体で128kbpsに収める

oggはどう圧縮してるの?

  • 基本mp3と同じことをやっているけど、より最新(といっても00年代)の研究を取り入れているので、高音質(に感じられる)
  • 容量はそこまで変わらない、高音質なのがメリット(一応圧縮アルゴリズムが多少進化してるので変わる)

mp3とoggの変換は?

  • mp3からoggに変換するときは、一度PCM(非圧縮の音声データ)に戻してから圧縮し直す
  • なので、mp3からoggに変換するツールのメリットはない(すでに音質が下がっている状態を復元し、それを圧縮するので二重劣化になる)
  • ビットレートを下げたいという目的があるのなら、oggに変換するのはありだが、最初からoggで保存したほうが良い

まとめ

  • mp3とoggの容量差はたいしてない
  • oggのほうが高音質というメリットがあるが、mp3からoggに変換するメリットは基本的にない
  • 最初からoggで保存しないと意味がない

余談

  • .oggはOgg Vorbisという形式の音声ファイルで、より高性能なOgg Opusという形式(.opus)もある

参考までに・AIによる音質の目安

一般的な目安(音楽用):

MP3:
- 320kbps - 透明性(原音との区別がほぼ不可能)
- 192kbps - 大半の人には十分な音質
- 128kbps - 及第点、でも高音域の劣化が分かる
- 96kbps以下 - 明らかに音質劣化

Ogg Vorbis:
- 256kbps - 透明性
- 160kbps - MP3の192kbps相当
- 96-112kbps - MP3の128kbps相当、まだ聴ける
- 64kbps - ギリギリ実用レベル