Kuma Ichigo (くま一号)
  • Author:Kuma Ichigo (くま一号)
  • Kuma Ichigo (くま一号)の Hobby site.
    YURI, NOVEL GAME, VOCALOID & VOICE SYNTH.
  • RSS
怪盗紅薔薇の隠れ家
【を】な別室、です。
Counter



最近の記事


最近のコメント


カテゴリー


ブログ内検索


RSS


mail form

名前:
メール:
件名:
本文:


月別アーカイブ


スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

VOCALOID2 CV03 サンプル音声だそうな
リンちゃん解析編など書いていたら。
ほお、クリプトンのブログにCV03のサンプル音声とな。

 ふーん。ベタうちでもかなりいけるのは、ACT2リンやがくぽからさらに進んでるようだけど。
ようやくって感じで大人の女性。 MEIKOよりはやわらかい声かなあ。
しかしー。なんでサンプルに英語の曲?
子音で終わる閉音節がきちんと発音できてるのはすごいけどさ、でも、日本語の発音じゃないとわかんないよー。

スポンサーサイト
リンちゃんちょっと見せて【パラメータ解析編 ポルタメント1】
 だんだん核心に入ります。
というか、ファイル解析とかは誰かがやってくれるのでおいといて、核心に行きます。

 Vocaloid2エディタではどうしてもいじれない部分、そのなかでも、リンの滑舌とアタックの核心、ポルタメントのパラメータ。これはいったいなんなのか。
msec単位のvのパラメータと、1/5 cent単位のpのパラメータ群があります。 pはphaseじゃないかってのは、前々回書きました。今回はv系。

 えーと、スペクトルアナライザとか持ち出したわけではなく、聴感だけでやってますし、憶測部分もありますけど、v のパラメータは多分こんな感じ。
ボカロエディタのピアノロールの一部と思ってください。薄緑色の■が音符。
ポルタメントのvパラメータ

 v1, v2, v4ってパラメータがあります。これで全部ではないのですが。
v1とv2がベンドの深さだということはわかってます。
この、アタックで山になって、なぜかそこから谷ができる、ぐわにょんって音程変化が、リンのとかちのかなりの部分を形成してます。  逆に言うと、ミクは傾向は同じでも変化が少なく、Act2のリンでも変化が小さくなってる気がします。 (重音テトの原音調整でも、こんなかんじみたいなのがおもしろいです。これを消すとキャラクターが消えちゃうらしいです。)

 v3がなくなってますが、位置としてvelに相当するんじゃないかと思います。リンではほとんど効きません。単位もmsecではなく、0~127、というよりパーセント表示なので、実際にどれだけ動いてるかはエンジンと音声データベース次第ということになります。

 v4は、実はボカロエディタから設定できません。せっかくの使えそうなパラメータなのに、なぜ殺してしまったかわかりません。前の音符が短かったりすると、いろいろ処理が大変そうなのはわかりますけど。 その分、PORで調整しろということでしょう。PORはv4(通常ゼロ)とv3の境目の位置を前後に動かすパラメータだろうと思います。

 その意味では、v1とv2も、ベンドの深さで調整すると同期して動いてしまって独立に調整できません。 v1を残してv2を最小に持って行くと、ポルタメントを深くかけてもAct1のとかちはかなり軽減するんですけどね。

 右端に赤丸をつけたのは、ビブラートなしで最後に落ち着く音程が、A=440Hzのチューニングよりかなり低い、という話。 これはボカロ使いなら必修項目なのでたぶんどこにでも書いてあるから説明は省きます。 チューニングができない音源って何なのよ、という話は別の機会に。

つづく

リンちゃん ちょっと見せて【ファイル解析編4 よってたかって】
 よってたかってというのは、いろんなひとが解析してるから、いろいろわかってくる。
VSQファイルの解析が一番進んでるのは、LipSyncの中の人(Boare@ウィキ)かな?
VSQのテキスト部分の解析はほとんど完了していて、謎だった歌手の設定パラメータの解析もされてる。
……VSQやその他のファイルがプレーンテキストなのに、このファイルだけ暗号化されてるってなんで?

 それで、ひとつ、私の解析結果とちがうことがあるんです。
前回のその3で書いた、音符の前ツッコミの時間。
音符の長さで変わります、というところ。

もう一回復習。
VOCALOID2エディタは1拍を480クロックで数えます。一分間は、テンポ×480クロック。

 音符の長さをClocksとすると、時間(msec)になおせば

 60,000 ÷ Tempo ÷ 480 ×clocks
えっと計算すると、LipSyncの中の人の画像をお借りして

Vocaloid Duration計算式1

になるはずですよね。
それが、実際は100msec前後短く、125msecでゼロになっちゃう。
そして、その差の割合が、音符の長さによって違う。

 ディレイ時間もなぜかプリセンドタイムより短い。
本来こうなるはずです。(またBoare@ウィキより借用)
Vocaloid PresendTime計算式1

 そこで、Vocaloid2の時間計算をグラフにしてみました。
 VSQファイルの中の、テキスト部分から計算できる時間と、NRPN部分に書かれた時間の差。
Vocacloid 謎のDurationグラフ

 なんじゃ、これ?
前回、子音の発音部分が前ツッコミしてるんだろうって書いたけど、それにしては時間がばらつくのが気になってた。
 これって、音声合成の時に、5秒、10秒、16秒でやりかたが違うってことかな?
ループの引き延ばし方がだんだん長くなってる?
いや、サンプラー音源のループみたいな単純なもんじゃないよね。

 16秒の音声合成をするのはたぶんものすごく大変。UTAUと同じような、合成した音声を時間方向に引っぱり伸ばすような変換をやっぱりやってるのかな。



上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。