投稿者 itouhiro
タグ [ 音楽 ]

速聴するためのmp3音声ファイルを作成

速聴(そくちょう)は頭を良くするなどと言われているが、個人的にそういう脳力開発に興味はない。 だがオーディオブックを聞くことには興味があるので、それを速聴で聞こうと思った。

速聴していて私の感じるのは、 少し早く(1.5倍くらい)再生すると、 等速(1倍速)で聞くより理解しやすくなるということだ。頭にすんなり入ってくる感じがする。

速聴について調べて、いくつか買ったのでメモ。

PCで速聴音声ファイルを作成する

速聴mp3ファイルの作り方を調べた。

http://wweden.s18.xrea.com/ability/l_soft.html にWindows向け速聴音声ファイル作成方法がまとめてあった。

私もここを参考に聞き比べてみた。

WindowsMediaPlayer10 (+ChronotronWavOutputPlugin) (コスト 0円)

WindowsXPに付属している無料ソフトだが はっきりいって これが一番自然な速聴音声ファイルを作れた。 ただし速聴音声ファイルの作り方は面倒だ。

  1. まずCDをwmaで取り込む(wmaかmp3じゃないと再生速度変更ができないから)
  2. WindowsMediaPlayer10でプラグイン有効にして再生→速聴ファイル(wav)が生成される
  3. wav→mp3にエンコード

という手順だ。 あと、速度を2.0倍以上(2.000ちょうども含む)にするとポコポコというノイズが入るので、1.983倍くらいの速度にするのが上限だった。

Mp3tag
WindowsMediaPlayer10で速度を2.000に近づける

SoundPlayerLilith 0.991 (コスト 0円)

なんかが大ホールで歌っているような面白い音質になる。人間の声には向いてない。

EasyPitchPlus 1.0 (コスト 0円)

金属的なエコーが元の声にかぶってしまう。 人間の声には向いてない。

聞々ハヤえもん2.18 (コスト 0円)

これは無料ソフトとしてはなかなかよい品質。1.5倍速だとWindowsMediaPlayer10には少々劣りますがなかなか健闘です。 しかし2.0倍にすると声がロボット的な金属音に変質するようになる。 あとソフトの名前が元ライブドア社長を思い出させる。

NavePlayer 0.6.15 Limited (コスト 0円)

これは動画プレイヤーですが、意外にも1.5倍速も2.0倍も、WindowsMediaPlayer10 とほぼ同等の自然な音声になりました。 ただしwavなどのファイルにする手段が用意されていない。 PCで再生している音を取り込めるソフトを使えばいいかもしれないけど、 試したところ私のPCではできなかった。 それに、もしできたとしても手間がかかるのでパス。

速脳チェンジギア (コスト 12,800円)

金属的なエコーが元の声にかぶってしまう。EasyPitchPlusに似てるかも。

CHRONOStream2 (コスト 16,800円)

これは操作はしやすいんですけど、wavしか扱えない(mp3読み込みはできるけどいちいちwav変換待ちがある)のでファイル変換が面倒。 音質は、すっきりしていて人の声もはっきり聞き取れるけど、なんだか階段状にカクンカクンと音質が変化するような 感じもあるし、常時少し金属音がかぶってる感じがする。

CHRONOStream2
CHRONOStream2はリアルタイムで速度と音程を変化させることができる

Sound Forge Audio Studio 9 (コスト 8,000円)

1.5倍速(「スピーチ」設定で速度75%) だとWindowsMediaPlayer10にかなり匹敵している。 2.0倍速(「スピーチ」設定で速度50%) だと、ところどころ声がロボット的な金属音の雰囲気になってWindowsMediaPlayer10にはかなわない感じ。 マニュアルにも「最適な比率は 75〜115% です。この範囲外の値を指定すると、エコー、フランジ、欠落などの劣化が生じます。」 と書いてある。 2.0倍速以上に早くはできない。

itemSOUND FORGE AUDIO STUDIO 9

ソニー

ほかにも Melodyne (コスト 45,000円) と Wavelab6 (コスト 100,000円) も試してみたかったけど試していない。お値段高いので。

itemMELODYNE UNO(メロダイン ウノ)

フックアップ (2005-07)
itemWaveLab 6

スタインバーグジャパン (2006-03)
「研究施設みたい。」

順位

音質のみに注目した個人的な順位は以下のような感じ。(WMP10が1位)
「人の通常の話声を1.5〜2.0倍速に変換する」用途限定の順位なので、音楽とかだと ぜんぜん順位は変わってくると思う。

WMP10 ≧ NavePlayer > CHRONOStream2 > SoundForgeAudioStudio9 > 聞々ハヤえもん > 速脳チェンジギア > EasyPitchPlus > SoundPlayerLilith

ただし実際にはソフトウェアの場合、音質の差よりも使い勝手のほうが大事だったりする。 いかに簡単に、それなりの品質の速聴ファイルを作れるかが一番重要だ。

速脳チェンジギアや聞々ハヤえもんのように「一括変換機能」がついているものが、簡単に速聴ファイルを作れる。 2.0倍速よりもはやいファイルを作りたい場合も、WMP10やSoundForgeAudioStudio9 は対象から外れる。

しかし私は SoundForgeAudioStudio9 を買ってしまったし、これを使うことにする。 これだと CD音声でも、ネットで取得した mp3/wmaファイルでも、同じように以下の手順で1.5倍速mp3ファイルにできる。

  1. wav/mp3/wmaなど音声ファイルを読み込み、「ノーマライズ」する。(音量が小さい場合大きくできる)
  2. 必要ない部分を「削除」する。SoundForgeAudioStudio9は基本的に音声ファイル編集ソフトだし その中でも操作がやりやすいソフトなので、こういう編集は得意。
  3. [プロセス - タイムストレッチ] で「スピーチ」設定・速度75%に変換する。
  4. 「新規保存」で mp3 44.1Khz/128kbps/JointStereo で保存する。

個人的には頭を音声に集中できるとき(ヘッドホンで音声を聞いて他に何にもしてないとき)は 2倍速でも聞き取れるけど、 寝起きの朝にスピーカーから聞くときとかは 2倍速では聞き取れなくて 1.3倍速くらいならなんとかついていける、という経験もあるし、 1.5倍速ファイルを作ることにする。

mp3ファイルの作り方

mp3ファイルなんて久しぶりに作ったのですが、 この前買ったmp3プレーヤはMP3のタグ情報が表示できる、というかタグを入力しておかないとファイルが区別できない (ファイル名は表示できない)ので、 mp3タグ入力ソフトを調べた。

以前は SuperTagEditorというのを使って ID3v1、Shift_JIS でタグ情報をつけていたのだが、 最近だと iTunes互換の ID3v2 でアートワーク(アルバム画像)にも対応したタグ付けソフトを使うのがいいだろう…… と思った。

そこで最新情報を求めて、mp3 タグ site:2ch.net と検索した。2ちゃんねるの「至高の MP3 タグ エディタを求めて」スレが最新情報を網羅してまとめていた。

さっそく Mp3tag と日本語化キットをインストール。 ID3v2.3 (ID3v1は書き込まない設定にした), UTF-16 でタグに日本語を使った。 Mp3tagはエクセルふうには使えないので SuperTagEditorほど便利ではないが、とくに難しくはなかった。

Mp3tag
Mp3tagでタグを入力してアートワークをつけた

アートワークの画像サイズはいくらにすればいいだろう……。 mp3 アートワーク 画像サイズ でGoogle検索すると、 iTunes Storeで売っている音声ファイルには 600x600ピクセルのジャケット画像を埋め込んでるらしい。 たしかにMacOSXやiTunesのCoverFlowとかはやたら大きく表示されるからな…。 ほかにも 画像サイズ 240×240、320×320、480×480 なども使えるようだ。

とりあえず 480x480のjpgファイルを作り、Mp3tagで埋め込んだ。 ファイルサイズはPhotoshopやFireworksの「Web用に書き出し」で予想ファイルサイズを見て決める。50KB程度に抑えておきたい。

Mp3tagの使い方

  1. あるアルバムのmp3ファイルをすべて、Mp3tagのウィンドウにドラッグ&ドロップ。
  2. ファイル名で並び替え。
  3. 「トラック」はファイル名から取得できれば取得する。できないときは手入力。
  4. 「アルバム」「アーティスト」「Year」「ジャンル」は最初の曲だけにまず記入しておく。
  5. 「曲名」は調べてひとつひとつ記入。
  6. Ctrl+Aで全選択。
  7. 左ペインで、「アルバム」「アーティスト」「Year」「ジャンル」が維持をさっき入力したやつを選ぶ。
  8. 「曲名」は「維持」
  9. アートワークの画像ファイルをドラッグ&ドロップ。
  10. [ファイル-タグを保存する]

速聴mp3作成方法

(追記: 2008-07-22)

結局、速聴mp3作成方法だが、次のようになった。

  1. ExactAudioCopyでCDをリッピングして、wav+cue形式にする。
  2. wav単独で SoundForgeAudioStudio9 に読み込ませる。
  3. 音量が小さいときは、ノーマライズして大きくする。

    タイムストレッチ

  4. タイムストレッチ 75%で、1.5倍速の音声にする。

    タイムストレッチ

  5. mp3形式で出力する。(この時点で、CD1枚分まとめて1つのmp3ファイルになっている。この後の手順で、mp3をCDと同じように曲ごとに分割する)

  6. AudioEditorで [開く]ボタンをクリックして、mp3を読み込む。
  7. Cygwinコンソールなどで、以下のスクリプトを実行。ここでは Shincho-Rongo-1.cue というファイルを読み込んでいる。そのあとの Shincho-Rongo-1- というのは出力ファイル名につけるプレフィクス(曲番号の前に置かれる語)。

    $ perl -e '$n=0;while(<STDIN>){if(/INDEX 0\d (\d\d):(\d\d):(\d\d)/){$msecorg=$1*60*100+$2*100+$3; $msec = int($msecorg*0.75); $min=int($msec/6000); $sec=int(($msec-$min*6000)/100); $newmsec=$msec-($min*6000)-($sec*100); printf("%s%02d\n0%02d%02d.%02d\n",$ARGV[0],$n,$min,$sec,$newmsec);$n+=1;}} printf("%s%02d\n",$ARGV[0],$n);' < Shincho-Rongo-1.cue Shincho-Rongo-1-
    
  8. すると以下のような出力が得られる。

    Shincho-Rongo-1-00
    00000.00
    Shincho-Rongo-1-01
    00837.53
    Shincho-Rongo-1-02
    01545.46
    Shincho-Rongo-1-03
    02526.39
    Shincho-Rongo-1-04
    
  9. 上の文字列をマウスドラッグでコピーする。ただし、最初の 00:00:00の部分はコピーしない。(cueシートは曲の開始点を示しているので00:00:00があるが、AudioEditorには曲の終結点を指定しなくてはいけないので、00:00:00は いらない)

    マウスドラッグでコピー

  10. AudioEditorの[編集点リスト]に貼り付ける。

    編集点リスト

  11. 最後の行にカーソルをあわせる。 (AudioEditorの[編集点リスト]は、テキストエディタのようにEnterキーを押して次の行に移れる)

  12. mp3を再生して、マウスで曲の最後にカーソルを移動して、[xx:xx:xx]ボタンを押す。(cueシートには最後の曲の終わりの時間が記録されていないが、AudioEditorでは曲の終結点を指定しなくてはいけないので、ここで指定する)

    編集点リスト

  13. 最後の曲の終了時間を指定したことを確認する。

  14. [編集開始]ボタンを押すと、mp3が分割される。1.5倍速になったうえ、CDと計算上は同じ場所で曲が分かれているはず。

    分割されたmp3ファイル:

    Shincho-Rongo-1-01.mp3      8,088KB
    Shincho-Rongo-1-02.mp3      6,689KB
    Shincho-Rongo-1-03.mp3      9,079KB
    Shincho-Rongo-1-04.mp3      6,529KB
    

ちなみに、1.5倍速化しなくていいものの場合は、foobar2000にcueシートを読み込ませて、全選択して右クリック [Convert To] でmp3化できる。 この場合、ID3TAGのバージョンが v2.4 になってしまう。

foobar2000

タグ [ 音楽 ]
固定リンク http://ai11.net/2008/06/17/
ブックマーク はてなブクマ登録 Yahoo!ブクマ登録