Kuma Ichigo (くま一号)
  • Author:Kuma Ichigo (くま一号)
  • Kuma Ichigo (くま一号)の Hobby site.
    YURI, NOVEL GAME, VOCALOID & VOICE SYNTH.
  • RSS
怪盗紅薔薇の隠れ家
【を】な別室、です。
Counter



最近の記事


最近のコメント


カテゴリー


ブログ内検索


RSS


mail form

名前:
メール:
件名:
本文:


月別アーカイブ


スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

リンちゃん、ちょっと見せて (その3)
なんで音量がこんな変動を起こすのか。なぜノイズが出るのか。んで、オフセットはどうして?

 これ、LalaVoiceの時もAudacityの波形を見ながら考えたことがあって、専門家でもなんでもないくまが直感で思ったことを書いてみる。

 前の記事のAudacityの波形で合成音声ってこんなふうになるの? と思うわけです。横軸のスケールが大きいので音量のカーブだけしかわからないけど、それが二重に見えるでしょう? で、真ん中の薄い青の部分は比較的DCオフセットがないけど、濃い青のところが飛び出ている。 オリジナルリンとACT. 2リンで、同じ音、同じ音節でも挙動が違う。どころか、同じリンでも上行と下行で違う。な~ぜ~?

 ちょっと拡大すると、位相が回転してるみたいなのが見えてくる。Vocaloidから入った人はこれが当たり前だと思うんだろうね。でも、自然音でこれだけプラスマイナスの振幅が違うとか、こんなことって、ないよね?
RIN 位相?
 もっと拡大すると、二つの波が徐々に位相をずらしながら重なってるのがわかる。
ふーん、音声合成ってこういうことをやってるのか、と。

 LalaVoiceって、歌うためのエンジンじゃないでしょう? しゃべると綺麗な声なのに、LalaSongで歌わせるととたんにノイズが入る。DCオフセットも音程で変わる。CREに相当するような、高域を強調するパラメータを上げると、とたんにノイズが入る。挙動はよく似てる。
  でも、LalaVoiceは多分、こんな風に位相のズレがだんだん動いていかずにある角度で固定してるんじゃないのかな、波形見てもわからなかった。二つの波の位相が微妙にずれるんだとすると、音程を変えたときに二つの波の周波数が微妙にずれる、とすればなんとなくわからなくはない。
 この「うねり」の周期って、横軸を表示しなかったけど、0.1秒くらいなの。
この図は音程がD3なんだけど、切りのいいところで、500Hzで1/10秒で一周期ずれるとするでしょ? そうすると500Hzと500.1Hzの差だよね。子音のところはずっと細かい。一桁下で、500.01かな。 音程としてはどっちも感じないでしょう。この位相のズレのズレ(笑)でなんか起きてるんじゃないのかなあ。
 ただ、付け焼き刃でネットで調べた話でなんなんですが、位相の回転って母音でも必要なの? よくわかんない。

 それで。
ボーカロイド2って、ポルタメントでもディレイでも、ビブラートのパラメータでも1msec単位で時間管理してるよね。なにかタイミングのずれるところがでてくるんじゃないのかな、音程の周波数で割りきれないところとか。
 まあ、ボーカロイドの特許とか論文とかも読んでないし(読む気もないし)ここまで。スペクトル分析? そういうのはやりたい人にお任せします。
 えーと、音程管理の方は、1/5centだよな、半音の1/500。 えーと、500×((2の12乗根)の500乗根)って、やーめたってばーーー。

 ただ、科学の限界を越えたところの端っこを見たような気がしたの。
合成音声の音程を変える、なおかつ声質を変えない、ということがいかに難しいかということの。
さて。パラメータのスタート地点を決めるのだけが目的だったんだから、これから本題のリンちゃんに歌ってもらう方にもどります。
関連記事

この記事に対するコメント

この記事に対するコメントの投稿














管理者にだけ表示を許可する



上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。