ボーカロイド自動調教計画(2)

生音からピッチと音量を取り出すための手法は分かったのだが、だたパクるだけではのうがない。そこで、自分が大学で研究している音声解析の手法を取り入れることにした。自分が今研究している手法は一般化調和解析と呼ばれるものすごくマイナーな音声解析手法である。正直言って実用性に疑問がありまくる手法だが、周波数分解能に関してはマジですごいので、・・・まぁいいや。
とりあえずjavaで書き直して動かしてみた。ぼかりすで使われているSWIPEという論文で紹介されていたCEPというそこそこメジャーなはずの手法の真似をしてカーネル関数を作成、ごにょごにょやってエネルギーが一番大きくなる正弦波をf0音とした。今のところ子音の所の基本周波数も取ってしまうのであまりかっこよく無い。明日はこの辺りを改良して以降と思う。