SlideShare a Scribd company logo
1 of 46
Download to read offline
話すひと:スズモフ
 KotonoSyncとは
ボーカロイド上で打ち込
んだシーケンスデータ
(VSQXファイル)を元
にしてお手軽にボイスロ
イドを歌わせる事のでき
るアプリケーションです。
 詳しくは動画見てください!
 アップデートは結構してました!
 いろいろ機能追加したにも関わらずアプデ報告のツイート
するだけで紹介動画やマニュアルもロクに作ってなかった
ので誰にも知られてない機能が多数・・・
 ボカロが無いと使う事ができないの?
 歌わせてみたけどなぜか音ズレしちゃう…
 リズム調整の途中で止まっちゃった…
 設定がたくさんあるけどよくわからない…
そういう疑問にもお答えしちゃいます。
1. 声の高さ分析(必要な場合のみ)
2. VSQXファイルを指定する
3. 曲変換する
4. 自動リズム調整する
5. 歌ってみた
6. アカネチャンカワイイヤッター!!!
 ボイスロイドは元々の声の高さがキャラク
ターごとに異なるので先にそれぞれの違いを
知っておく必要があります
 琴葉姉妹は声の高さは中間くらい(281Hz)
 ゆかりさんは声が低い(242Hz)
 ずん子さんは声が物凄く高い(414Hz!!!)
 KotonoSyncはEXシリーズの一部のボイロの声の
高さの情報が最初から入っています。
 しかしそこに無いボイロは最初に声の高さ分析を
行う必要があります。(ボイロ2とか)
 ボイスロイド2の場合はいくつか設定を変え
ておく必要があります(EXの場合は不要)
 1~2分ほど待てば終わりです。
一度高さ分析を行っておけば、その設定は
保存されるので何度も行う必要はありません。
 ボカロで打ち込んだデータを元にボイロ用の
フレーズ辞書を生成してくれる
 音の高さの数値を覚えておく必要が無い
 歌詞もボカロで歌わせた通りになる
 ボーカロイド2で作成したVSQファイルには
対応していません(V3発売から既に6年、V4発売から3年
が経っているので是非バージョンアップしてね・・・)
 VOCALOID4 結月ゆかり 大好評発売中
です。今ならゆかりさんのexVoiceも
付いてくるよ!
 スターターパック以外を購入する場合は
エディタは別売りなので注意してね。
Q.ボカロを持っていない場合は使えないの?
A.他のデータ形式からVSQX形式に変換すれば
一応使えます。
※前にやったKotonoSyncの
利用者向けアンケでは4割
くらいの人が別のソフトで
VSQXを作っているという
結果でした。
 ボイスロイドで音の高さを合わせるのは
簡単(簡単ではない)
 ボイスロイドでリズムを合わせるのは
難しい(本当に難しい)
自動化できたらいいな…
と思ったのでやりました。
 この機能では以下の内容を繰り返すことで
ちょっとずつ調整を行っていきます。
1. ボイロ用のフレーズ辞書の作成
2. 音声ファイルの保存
3. 音声からタイミングの分析
4. フレーズ内容を修正する
自動リズム調整の画面には
いくつかオプションが
あります。
 調整対象のフレーズ
 調整済みフレーズの再調整のオンオフ
 簡易調整モード
 リズム調整前のボイスロイドの再起動(V2用)
 失敗時の再試行回数(最近のバージョンで追加)
Q.キーボードやマウスの操作をしてたら
エラーでリズム調整が止まっちゃったよ?
A.Ver.1.5.0以降では発生しづらくなってます
Q.リズム調整を中断したら最初からやり直し?
A.そのまま調整開始すれば途中から再開できます。
 息継ぎのポイントが少ない歌の場合はボイスロイ
ド側の制限によって歌うことが出来ない場合があ
ります。
《歌えないフレーズの例》
 合計297モーラを超えるフレーズ。
 一つあたりの辞書データが15,000
バイト(ボイロ2は7,500バイト)を
超えるフレーズ。
 プロジェクト(拡張子がvcphのファイル)を
保存済みの場合はリズム調整後に自動的に同
名で音声ファイルも保存されます。
 直接ボイスロイド上で歌ってもらう事も
できます。
 フレーズ編集から手直しする
 元となるVSQXファイルを作り直して再調整する
 KotonoSync自体の設定を見直してみる
そんな訳でここから先はKotonoSyncの設定を
もっと細かく見ていきましょう。
 歌詞とか音の高さとか話速とか・・・
 誤差(単)は単体でどれくらい音ズレしてるか
 誤差(合)はそれまでの誤差の合計
誤差(合)が大体±0.010くらいに収まっていれば
それなりにリズムがあってると見て大丈夫。
 フレーズ内の話速を2.00まで上げても曲のテ
ンポが速すぎて歌が追いつけないときなど。
 自動リズム調整の限られた時間内では上手くタイミングの
合わせられる組み合わせを見つけられない場合があります。
 あるいは理想的なタイミングになる組み合わせが元から存
在しないという場合も・・・?
 ボカロやボイロの基本設定を行います。
 原曲からキーを変更することも可能です。
 あとはフレーズの見出し変更とか音声保存とか。
 音声効果の話速は重要な設定。
テンポの速い曲で上手く歌えないときは変更必須。
 ボカロのパラメータ取得位置も変更できます。
 話速目標値を変えると歌い方が大きく変わります。
 ロングトーン設定で長音の代わりに母音が使えます。
 長音のアクセントを結合する設定とかもあります。
同じようにリズムを
合わせる場合でも様々な
パターンがあります。
 話速を上げて長音符号
の数も増やす
 話速を下げて長音符号
の数も減らす。
 先頭音の話速目標値を下げる事で子音を伸ばして
不明瞭な発音をはっきりさせる事ができます。
逆に発音がくどいときは目標値を上げてみましょう。
 長音符号の話速目標値を下げるとボイスロイド特有の
声を伸ばした時の大きさのゆらぎを多少軽減できます。
これについてはKotonoToneで別の解決策も用意してます。
 末尾音の話速目標値を下げると次の音符への高さの変化の
仕方が緩やかになります。逆に目標値を上げると高さの変
化も早くなって僅かにケロケロ気味になります。
 VELを下げたときに促音を追加する設定
 ボカロと同じように短めの休符を無視する設定
 強制的にフレーズを分割する設定
 ボイスロイドではポーズの長さを80ミリ秒以下
に設定する事が出来ません。そのためそれよりも
短い休符を挟むことが通常は出来ません。
 そこで奇数番目のフレーズと偶数番目のフレーズ
を歌うパートに分けてこの問題を解決します。
 ピッチ圧縮機能
 リズム崩し機能
 歌詞の文字種による無声化
ひらがなとカタカナの使い分けで特定の箇所だけ
ボイスロイドに無声化させる事ができます。
 音の高さが2.00を超えてしまうと、限界を超えた
音を全て高さ2.00の扱いで歌ってしまいます。
 あとでMelodyneやVocalShifterなどのソフトで
高さを直してあげるにしても、多少高さの変化が
残っている方が良いのでは?
 ピッチ圧縮機能を使うと限界値の2.00や0.50
付近の高さの変化を圧縮して平らになってしまわ
ないようにします。(DAW使ってるひとはコン
プレッサーをイメージしてみてください)
 ピッチ圧縮なし
 ピッチ圧縮あり(閾値自動・圧縮比率4)
 細い線は
圧縮してない
声の高さです
 太い線です
ピッチ圧縮後の
声の高さです
 リズムや音の高さをランダムでずらしながら
歌わせることができます。
 わざと下手に歌わせたいとき。
 茜ちゃん葵ちゃんで同じパートを
歌わせたいとき。
 サンプル動画を用意したので
そちらをご覧ください。
 ボカロでは発音記号に「_0」を使うとボイロに歌わせるときも無
声化されるけれども…?
 末尾のノートの発音記号に「?」を使うと疑問調になります。
ボイロ2の断定や呼び掛けにはまだ対応していません。
 末尾のノートの発音記号を子音のみにするとボイロ上でも最後の
母音をカットするような発音になります。
 主要な機能は大体これで説明したはず!
 もし何か忘れてたら教えてね・・・。
 2016/8/20 β版公開(第2回ひじき祭の初日)
 2016/8/21~26 ひたすらバグ修正
 2016/8/28 Ver.1.0.0.0の公開&紹介動画のアップ
 2016/8/29 Ver.1.0.0.1(OSの違いによるバグの修正)
 2016/9/18 Ver.1.0.0.5(ゆかりモードの追加)
 2016/10/4 Ver.1.0.0.8(長音数が減らないバグの修正)
 2016/11/13 Ver.1.1.0(リズム調整の精度向上・
辞書サイズ問題の対策・ピッチ圧縮の追加など)
 2016/12/23 Ver.1.1.2(簡易調整モードの追加など)
 2017/2/18 Ver.1.1.4(子音発音の実験)
 2017/3/7 Ver.1.1.6(リズム調整後のヒント表示追加)
 2017/4/16 Ver.1.1.8(フレーズの強制分割機能の追加)
 2017/4/27 Ver.1.2.0(リズム崩しとキーの微調整の追加)
 2017/6/14 Ver.1.2.3(短い休符の無視機能の追加)
 2017/8/19 Ver.1.5.0(VOICEROID2の暫定対応)
 2017/8/20~9/24 ~Ver.1.5.9(ひたすらバグ修正)
 2017/10/1 Ver.1.6.0(ボイロ2に歌わせるときの仕様変更)
 2017/10/6 Ver.1.6.4(バグ修正など)
 未定です!
 KotonoSyncについての疑問にお答えします。
 何かありましたらご質問ください。
 ここまでご静聴頂きありがとうございました。

More Related Content

What's hot

Unityで音声認識
Unityで音声認識Unityで音声認識
Unityで音声認識光喜 濱屋
 
P J S: 音素バランスを考慮した日本語歌声コーパス
P J S: 音素バランスを考慮した日本語歌声コーパスP J S: 音素バランスを考慮した日本語歌声コーパス
P J S: 音素バランスを考慮した日本語歌声コーパスShinnosuke Takamichi
 
インターネットにおける動画配信の仕組み
インターネットにおける動画配信の仕組みインターネットにおける動画配信の仕組み
インターネットにおける動画配信の仕組みRyosuke Kubo
 
HLSについて知っていることを話します
HLSについて知っていることを話しますHLSについて知っていることを話します
HLSについて知っていることを話しますMoriyoshi Koizumi
 
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022GREE VR Studio Lab
 
Juceで作るオーディオアプリケーション
Juceで作るオーディオアプリケーションJuceで作るオーディオアプリケーション
Juceで作るオーディオアプリケーションKohsuke Yuasa
 
長崎方言におけるアクセントの中和
長崎方言におけるアクセントの中和長崎方言におけるアクセントの中和
長崎方言におけるアクセントの中和Toshio Matsuura
 
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
JTubeSpeech:  音声認識と話者照合のために YouTube から構築される日本語音声コーパスJTubeSpeech:  音声認識と話者照合のために YouTube から構築される日本語音声コーパス
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパスShinnosuke Takamichi
 
Hands on Voice Conversion
Hands on Voice ConversionHands on Voice Conversion
Hands on Voice ConversionNU_I_TODALAB
 
TokyoRリプレイ - RからfastTextを使ってみた
TokyoRリプレイ - RからfastTextを使ってみたTokyoRリプレイ - RからfastTextを使ってみた
TokyoRリプレイ - RからfastTextを使ってみたケンタ タナカ
 
AUDIOLOGIA I - AULA 6.pptx
AUDIOLOGIA I - AULA 6.pptxAUDIOLOGIA I - AULA 6.pptx
AUDIOLOGIA I - AULA 6.pptxJordniaMatias2
 
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパスJ-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパスShinnosuke Takamichi
 
言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyoShuyo Nakatani
 
Pod hd 500 manual - avançado (português)
Pod hd 500   manual - avançado (português)Pod hd 500   manual - avançado (português)
Pod hd 500 manual - avançado (português)kadron
 
【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...
【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...
【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...TakeshiFukae
 
音声合成の基礎
音声合成の基礎音声合成の基礎
音声合成の基礎Akinori Ito
 
音楽信号処理における基本周波数推定を応用した心拍信号解析
音楽信号処理における基本周波数推定を応用した心拍信号解析音楽信号処理における基本周波数推定を応用した心拍信号解析
音楽信号処理における基本周波数推定を応用した心拍信号解析Kitamura Laboratory
 
Fantiaから学ぶgcp運用のノウハウ
Fantiaから学ぶgcp運用のノウハウFantiaから学ぶgcp運用のノウハウ
Fantiaから学ぶgcp運用のノウハウ虎の穴 開発室
 

What's hot (20)

Unityで音声認識
Unityで音声認識Unityで音声認識
Unityで音声認識
 
P J S: 音素バランスを考慮した日本語歌声コーパス
P J S: 音素バランスを考慮した日本語歌声コーパスP J S: 音素バランスを考慮した日本語歌声コーパス
P J S: 音素バランスを考慮した日本語歌声コーパス
 
インターネットにおける動画配信の仕組み
インターネットにおける動画配信の仕組みインターネットにおける動画配信の仕組み
インターネットにおける動画配信の仕組み
 
HLSについて知っていることを話します
HLSについて知っていることを話しますHLSについて知っていることを話します
HLSについて知っていることを話します
 
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
オープンソースで構築するWebメタバース ~Mozilla Hubsで学ぶUX開発から運用コスト最小化まで #CEDEC2022
 
BrowserMob-Proxyのお話
BrowserMob-Proxyのお話BrowserMob-Proxyのお話
BrowserMob-Proxyのお話
 
Juceで作るオーディオアプリケーション
Juceで作るオーディオアプリケーションJuceで作るオーディオアプリケーション
Juceで作るオーディオアプリケーション
 
Kameoka2017 ieice03
Kameoka2017 ieice03Kameoka2017 ieice03
Kameoka2017 ieice03
 
長崎方言におけるアクセントの中和
長崎方言におけるアクセントの中和長崎方言におけるアクセントの中和
長崎方言におけるアクセントの中和
 
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
JTubeSpeech:  音声認識と話者照合のために YouTube から構築される日本語音声コーパスJTubeSpeech:  音声認識と話者照合のために YouTube から構築される日本語音声コーパス
JTubeSpeech: 音声認識と話者照合のために YouTube から構築される日本語音声コーパス
 
Hands on Voice Conversion
Hands on Voice ConversionHands on Voice Conversion
Hands on Voice Conversion
 
TokyoRリプレイ - RからfastTextを使ってみた
TokyoRリプレイ - RからfastTextを使ってみたTokyoRリプレイ - RからfastTextを使ってみた
TokyoRリプレイ - RからfastTextを使ってみた
 
AUDIOLOGIA I - AULA 6.pptx
AUDIOLOGIA I - AULA 6.pptxAUDIOLOGIA I - AULA 6.pptx
AUDIOLOGIA I - AULA 6.pptx
 
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパスJ-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
J-KAC:日本語オーディオブック・紙芝居朗読音声コーパス
 
言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo言語処理するのに Python でいいの? #PyDataTokyo
言語処理するのに Python でいいの? #PyDataTokyo
 
Pod hd 500 manual - avançado (português)
Pod hd 500   manual - avançado (português)Pod hd 500   manual - avançado (português)
Pod hd 500 manual - avançado (português)
 
【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...
【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...
【JAWS-UG AI/ML支部 第14回勉強会】Amazon SageMaker Studio Labの始め方 〜これから機械学習を学ぶ方へおすすめ!や...
 
音声合成の基礎
音声合成の基礎音声合成の基礎
音声合成の基礎
 
音楽信号処理における基本周波数推定を応用した心拍信号解析
音楽信号処理における基本周波数推定を応用した心拍信号解析音楽信号処理における基本周波数推定を応用した心拍信号解析
音楽信号処理における基本周波数推定を応用した心拍信号解析
 
Fantiaから学ぶgcp運用のノウハウ
Fantiaから学ぶgcp運用のノウハウFantiaから学ぶgcp運用のノウハウ
Fantiaから学ぶgcp運用のノウハウ
 

よくわかる?KotonoSyncの使い方!