この前、NHK杯(将棋)をH.264の--crf 29でエンコードした。
さすがに画質が悪く、サイズ優先でも28〜27くらいは必要だとわかった。
そのファイルは192MBだったのだが、画質の割に縮んでないなと思って調べると、
ファイル全体に占める動画の割合が51%で、音声とほぼ同じビットレートだった。
考えてみれば、画質にこれだけ妥協しているのに、音声がAAC-LC 128kbpsというのはマヌケだった。そこで、どのくらいまで落とせるのか、試してみた。
cd %~d0%~p0 neroAacEnc.exe -lc -br 64000 -if %1 -of "%~d1%~p1%~n1_LC64.m4a" neroAacEnc.exe -he -br 32000 -if %1 -of "%~d1%~p1%~n1_HE32.m4a"
使ったソースは、BS2の竜王戦で藤井九段と杉本七段が解説しているところ(AC-3、192kbps)。
すると、AAC-LCで48kbpsまで落としても違いがよくわからない。
32kbpsだと、杉本七段の高い声が耳障りになってしまう。
AAC-HEだと32kbpsでもほとんど変わらない感じで、
24kbpsにすると確実に音は変わってしまうが、不快感の少ない自然な音だ。
おそらく、適切な訓練を受ければ、48kbpsの音の劣化はすぐわかるようになるだろう。
だから、「自分ですぐには違いのわからないビットレート」では危険で、
それよりも数段高いビットレートで保存するのが普通だと思う。
この場合は、ある程度妥協するケースなので、AAC-HEの40kbpsくらいでいいだろう。
高音キンキンの音楽だと劣化して聞けたもんじゃないビットレートだろうが、
男性棋士がボソボソとしゃべる番組なので劣化に気付かないはずだ。