投稿者 itouhiro
タグ [ 音楽 ]
速聴(そくちょう)は頭を良くするなどと言われているが、個人的にそういう脳力開発に興味はない。 だがオーディオブックを聞くことには興味があるので、それを速聴で聞こうと思った。
速聴していて私の感じるのは、 少し早く(1.5倍くらい)再生すると、 等速(1倍速)で聞くより理解しやすくなるということだ。頭にすんなり入ってくる感じがする。
速聴について調べて、いくつか買ったのでメモ。
速聴mp3ファイルの作り方を調べた。
http://wweden.s18.xrea.com/ability/l_soft.html にWindows向け速聴音声ファイル作成方法がまとめてあった。
私もここを参考に聞き比べてみた。
WindowsXPに付属している無料ソフトだが はっきりいって これが一番自然な速聴音声ファイルを作れた。 ただし速聴音声ファイルの作り方は面倒だ。
という手順だ。 あと、速度を2.0倍以上(2.000ちょうども含む)にするとポコポコというノイズが入るので、1.983倍くらいの速度にするのが上限だった。

なんかが大ホールで歌っているような面白い音質になる。人間の声には向いてない。
金属的なエコーが元の声にかぶってしまう。 人間の声には向いてない。
これは無料ソフトとしてはなかなかよい品質。1.5倍速だとWindowsMediaPlayer10には少々劣りますがなかなか健闘です。 しかし2.0倍にすると声がロボット的な金属音に変質するようになる。 あとソフトの名前が元ライブドア社長を思い出させる。
これは動画プレイヤーですが、意外にも1.5倍速も2.0倍も、WindowsMediaPlayer10 とほぼ同等の自然な音声になりました。 ただしwavなどのファイルにする手段が用意されていない。 PCで再生している音を取り込めるソフトを使えばいいかもしれないけど、 試したところ私のPCではできなかった。 それに、もしできたとしても手間がかかるのでパス。
金属的なエコーが元の声にかぶってしまう。EasyPitchPlusに似てるかも。
これは操作はしやすいんですけど、wavしか扱えない(mp3読み込みはできるけどいちいちwav変換待ちがある)のでファイル変換が面倒。 音質は、すっきりしていて人の声もはっきり聞き取れるけど、なんだか階段状にカクンカクンと音質が変化するような 感じもあるし、常時少し金属音がかぶってる感じがする。

1.5倍速(「スピーチ」設定で速度75%) だとWindowsMediaPlayer10にかなり匹敵している。 2.0倍速(「スピーチ」設定で速度50%) だと、ところどころ声がロボット的な金属音の雰囲気になってWindowsMediaPlayer10にはかなわない感じ。 マニュアルにも「最適な比率は 75〜115% です。この範囲外の値を指定すると、エコー、フランジ、欠落などの劣化が生じます。」 と書いてある。 2.0倍速以上に早くはできない。
![]() | SOUND FORGE AUDIO STUDIO 9 |
ソニー |
ほかにも Melodyne (コスト 45,000円) と Wavelab6 (コスト 100,000円) も試してみたかったけど試していない。お値段高いので。
![]() | MELODYNE UNO(メロダイン ウノ) |
フックアップ (2005-07) |
| WaveLab 6 | |
スタインバーグジャパン (2006-03) 「研究施設みたい。」 |
音質のみに注目した個人的な順位は以下のような感じ。(WMP10が1位)
「人の通常の話声を1.5〜2.0倍速に変換する」用途限定の順位なので、音楽とかだと ぜんぜん順位は変わってくると思う。
WMP10 ≧ NavePlayer > CHRONOStream2 > SoundForgeAudioStudio9 > 聞々ハヤえもん > 速脳チェンジギア > EasyPitchPlus > SoundPlayerLilith
ただし実際にはソフトウェアの場合、音質の差よりも使い勝手のほうが大事だったりする。 いかに簡単に、それなりの品質の速聴ファイルを作れるかが一番重要だ。
速脳チェンジギアや聞々ハヤえもんのように「一括変換機能」がついているものが、簡単に速聴ファイルを作れる。 2.0倍速よりもはやいファイルを作りたい場合も、WMP10やSoundForgeAudioStudio9 は対象から外れる。
しかし私は SoundForgeAudioStudio9 を買ってしまったし、これを使うことにする。 これだと CD音声でも、ネットで取得した mp3/wmaファイルでも、同じように以下の手順で1.5倍速mp3ファイルにできる。
個人的には頭を音声に集中できるとき(ヘッドホンで音声を聞いて他に何にもしてないとき)は 2倍速でも聞き取れるけど、 寝起きの朝にスピーカーから聞くときとかは 2倍速では聞き取れなくて 1.3倍速くらいならなんとかついていける、という経験もあるし、 1.5倍速ファイルを作ることにする。
mp3ファイルなんて久しぶりに作ったのですが、 この前買ったmp3プレーヤはMP3のタグ情報が表示できる、というかタグを入力しておかないとファイルが区別できない (ファイル名は表示できない)ので、 mp3タグ入力ソフトを調べた。
以前は SuperTagEditorというのを使って ID3v1、Shift_JIS でタグ情報をつけていたのだが、 最近だと iTunes互換の ID3v2 でアートワーク(アルバム画像)にも対応したタグ付けソフトを使うのがいいだろう…… と思った。
そこで最新情報を求めて、mp3 タグ site:2ch.net と検索した。2ちゃんねるの「至高の MP3 タグ エディタを求めて」スレが最新情報を網羅してまとめていた。
さっそく Mp3tag と日本語化キットをインストール。 ID3v2.3 (ID3v1は書き込まない設定にした), UTF-16 でタグに日本語を使った。 Mp3tagはエクセルふうには使えないので SuperTagEditorほど便利ではないが、とくに難しくはなかった。

アートワークの画像サイズはいくらにすればいいだろう……。 mp3 アートワーク 画像サイズ でGoogle検索すると、 iTunes Storeで売っている音声ファイルには 600x600ピクセルのジャケット画像を埋め込んでるらしい。 たしかにMacOSXやiTunesのCoverFlowとかはやたら大きく表示されるからな…。 ほかにも 画像サイズ 240×240、320×320、480×480 なども使えるようだ。
とりあえず 480x480のjpgファイルを作り、Mp3tagで埋め込んだ。 ファイルサイズはPhotoshopやFireworksの「Web用に書き出し」で予想ファイルサイズを見て決める。50KB程度に抑えておきたい。
(追記: 2008-07-22)
結局、速聴mp3作成方法だが、次のようになった。
音量が小さいときは、ノーマライズして大きくする。

タイムストレッチ 75%で、1.5倍速の音声にする。

mp3形式で出力する。(この時点で、CD1枚分まとめて1つのmp3ファイルになっている。この後の手順で、mp3をCDと同じように曲ごとに分割する)
Cygwinコンソールなどで、以下のスクリプトを実行。ここでは Shincho-Rongo-1.cue というファイルを読み込んでいる。そのあとの Shincho-Rongo-1- というのは出力ファイル名につけるプレフィクス(曲番号の前に置かれる語)。
$ perl -e '$n=0;while(<STDIN>){if(/INDEX 0\d (\d\d):(\d\d):(\d\d)/){$msecorg=$1*60*100+$2*100+$3; $msec = int($msecorg*0.75); $min=int($msec/6000); $sec=int(($msec-$min*6000)/100); $newmsec=$msec-($min*6000)-($sec*100); printf("%s%02d\n0%02d%02d.%02d\n",$ARGV[0],$n,$min,$sec,$newmsec);$n+=1;}} printf("%s%02d\n",$ARGV[0],$n);' < Shincho-Rongo-1.cue Shincho-Rongo-1-
すると以下のような出力が得られる。
Shincho-Rongo-1-00
00000.00
Shincho-Rongo-1-01
00837.53
Shincho-Rongo-1-02
01545.46
Shincho-Rongo-1-03
02526.39
Shincho-Rongo-1-04
上の文字列をマウスドラッグでコピーする。ただし、最初の 00:00:00の部分はコピーしない。(cueシートは曲の開始点を示しているので00:00:00があるが、AudioEditorには曲の終結点を指定しなくてはいけないので、00:00:00は いらない)

AudioEditorの[編集点リスト]に貼り付ける。

最後の行にカーソルをあわせる。 (AudioEditorの[編集点リスト]は、テキストエディタのようにEnterキーを押して次の行に移れる)
mp3を再生して、マウスで曲の最後にカーソルを移動して、[xx:xx:xx]ボタンを押す。(cueシートには最後の曲の終わりの時間が記録されていないが、AudioEditorでは曲の終結点を指定しなくてはいけないので、ここで指定する)

最後の曲の終了時間を指定したことを確認する。
[編集開始]ボタンを押すと、mp3が分割される。1.5倍速になったうえ、CDと計算上は同じ場所で曲が分かれているはず。
分割されたmp3ファイル:
Shincho-Rongo-1-01.mp3 8,088KB
Shincho-Rongo-1-02.mp3 6,689KB
Shincho-Rongo-1-03.mp3 9,079KB
Shincho-Rongo-1-04.mp3 6,529KB
ちなみに、1.5倍速化しなくていいものの場合は、foobar2000にcueシートを読み込ませて、全選択して右クリック [Convert To] でmp3化できる。 この場合、ID3TAGのバージョンが v2.4 になってしまう。

タグ [ 音楽 ]
固定リンク http://ai11.net/2008/06/17/
ブックマーク ![]()