こんばんわ!お久しぶりです。
暫く更新していなくてごめんなさい……。
突然ですが、今回は、ちょっぴり音屋さんらしいお話をしてみようかと思ってブログをかいてみました。
ゲーム製作者様には是非よんでもらいたい
ゲームBGMで使う音源の拡張子についてです。
ちょっと長くなってしまいましたので
記事をわけていますがごめんなさい……;
今回は"Wave"と"MP3"と"ogg"と"MIDI"について
ゲームBGMに関連する私の知っている事を解説していきたいと思います。
まずは"Wave"編から!!
【Wave】いわゆる無圧縮状態の音源データです。
ビットレートは周波数*ビット数になります。詳細は後述しています。
・ゲームBGMに向いてる? 音質でいえば、無圧縮なので最高品質ではあります。
しかし一方で、44.1khz/16bitの一般的なwavデータで1分あたり10MBという途方も無い容量のため、ダウンロードを前提とするWebフリーゲーム等にはあまり向いていない拡張子です。
一方でWavという都合メモリ読み込みによる読み書きの処理が容易、高速なため、効果音等には頻繁に用いられている傾向にあるようです。
・Waveデータの音質について。
具体的に説明すると専門的になりすぎてしまうので
ここでは、ゲームのBGMに利用する事に関して必要最低限のことだけ解説してみます。
周波数とビット数で表現されていますが、基本的には"44.1khz/16bit"のデータが主流になります。
これは、所謂"音楽CD"に収録されているデータと同じ音質です。よく"CD音質"等というのもそのためですね。何故こんな中途半端になったのかなど理由も一応あるのですがゲームBGMには関係ないうえに話すと長くなってしまうので割愛させていただきます。
余談になりますが、DVDオーディオの場合は音質のレベルがあがって96khz/24bitが基本になります。実はCDよりも高音質!
それぞれの詳細については以下をどうぞ。
[周波数って何?]
周波数です!!
いやわけがわかりませんね。具体的にいうとこれは一般的によくいう音の周波数とは違って「サンプリング周波数」と呼ばれています。
簡単にいうと、音のデータを1秒間にどれくらい収録しているか、という数値です。
44.1khzというのは1秒間に44100回分の音の変化を収録していますよーという意味になります。
イラストデータでいうならば"解像度"に当たる部分ですね。これが高くなればなるほど音質はよくなります。が、絵描きさんなら分かるかもしれませんがとてつもなくファイル容量が膨れるため大きければ良いというものでもなかったりします。
細かくいうと、音程的な意味での周波数の限界値にも影響しているのですが、人間は20khz以上の音は聞けない(若い人でもだいたい18~19khz前後が最高)とされているのであまり深く気にする必要はないでしょう。ちなみに44.1khzではその半分の22050hzまでの音が収録されています。
でもこの数値、実は一部環境ではゲームBGMの仕様に大きく影響しています。
それは"サンプリングレートでのループポイントの指定"を行う場合です。
というのもプログラム的に特定の場所から特定の場所までを演奏させる、いわゆるループポイントを指定する場合、秒数による指定より、より機械語に近いサンプリング数を用いる事があります。こちらのほうがプログラムでの処理が容易のようです。
その場合、このサンプリング周波数を元に算出することになります、また1秒間で4万回の数値で指定するのでより正確な場所でループさせることも可能になります。
たとえば、3秒のところでループポイントを指定したい場合 44100*3 で 132300 がループ位置になります。
プレイヤー側で秒数指定によるループのサポートがされていなかったり、自作でプレイヤーを作る場合などはこちらのほうが容易になるそうですが、その場合はこのように位置を算出することになるわけですね。
[16bitとかいうけどbitって何?]
これはいわゆる"ダイナミクスレンジ"になります。といっても分かりづらいですよね。
分かりやすくいうと"音量の増減の幅"を意味します。16bitですと65536段階の音量を表現できる、という意味ですね。これ実は、イラストにたとえると、そのまま色数を意味する16bitと同じ役割になります。
16bitなら65536色を表現できます。音も16bitなら65536段階の音量を表現できるわけですね。
ゲームにおいてはそこまで意識する数値ではないですが、8bitサウンドというようにビット数を絞る事で雰囲気を出す事は可能になります。
ドット絵で色数を制限するのと同じかもしれません。また一部打撃など音量の変化があまりない効果音などではビット数を16bit→8bit等に減らすことによってある程度音質を劣化させずに容量を抑える事ができます。
・小話
ちなみに人間の音量のダイナミックレンジは120dBといわれています。これは数値にすると約104万段階の音量を聞き分けられることになります。
一方でCDの音質は16bit、これはデシベルに直すと96dBになります(1bitあたり6dBといわれている)。つまりCDの音質では人間の耳の精度においついていない事に……。
でもイラストでも人間の色覚は凡そ117dB前後といわれていますので16bit、96dBでは表現しきれていない事になります。が、実際のところはそこまで気にならないですよね。
容量との兼ね合い、コストパフォーマンスでこの値が最も好まれて使われているようです。
・その他
容量の早見表
44.1kh/16bit ステレオ ……1秒 約172KB / 1分 約10MB
44.1kh/16bit モノラル ……1秒 約86KB / 1分 約5MB
※周波数やビット数を半分にするとそれぞれ半分になります。
22.1khz/8bit モノラル ……1秒 約22KB / 1分 約1.25MB