ボーカロイド自動調教計画
ぼかりすに影響されて少し前から妄想していました。
ぼかりすの問題点はマンパワーを必要とする点です。生歌からピッチと音量を取っているため、生歌が上手くないと意味がありません。ところが歌唱力が高い人はそうはいないと思います。そこで機械学習を用いて調教することが出来ないかと考えました。
現在考えているやり方は以下の通りです。
- 生音からピッチと音量を抽出する
- 楽譜情報を作成する
- 楽譜情報から特徴量ベクトルを抽出する
- 生音を教師データとして学習させる
特徴量ベクトルではノート番号、子音、母音などを数値化して使用しています。
実際にやってみた結果がこちら。赤が生音から抽出したデータ、緑が生成されたデータです。
上がピッチ、下が音量です。適当に拾ってきたピッチ/音量抽出プログラムを使っているため、データがぐちゃぐちゃになってしまっています。なんだか良く分かりません。もう少しちゃんとした抽出プログラムを使って実験したいです。