Moresampler ができること(0.6.3準拠)

Moresamplerが出来るのは

1. wavtoolも兼ねることで、原理的位相最適化を自動的行う。
2. moreconfig.txtの設定で
*「44100Hz~192000Hz、8/16/24/32bit」の出力選択が可能
*全域伸縮もしくはループを強制(通常はオート、ノートにあるフラグが優先)
*同時にWAVも出力出来るが、他所のWAVTOOLの性能を超える場合も
*ログファイルを有効して、問題箇所を探せる(この場合開発元に送ろうね)
*分析機能を最適化して、困難な原音を挑める(玄人向け、ここでは無視する)
**例えば音源の中のフォルダーごとにmoreconfig.txtを置いてそれぞれ最適化する高等技術も

3.多彩なフラグ

やっていたうちにMoresamplerのフラグ群はしばらくResamplerの中に一番多彩となった、だと自負してます。

現在サポートしていたのは以下のフラグ:

>既存互換フラグ:g,t,P、A、b、e
gフラグ:レンジは-100~100、デフォルト0、+で男性/オトナ的、-で女性/ロリっぽく
tフラグ:レンジは-1200~1200、デフォルト0、音程微調整、1=半音の1/100
Pフラグ:レンジは0~100、デフォルト86、ピークコンプレサー、本家Resampler.exe準拠
Aフラグ:レンジは-100~100、デフォルト0、音量モジュレーション。リアルなビブラート作成に有用
bフラグ:レンジは-20~100、デフォルト0、無声音成分を強調/低減する
eフラグ:強制伸縮フラグ、(なお、Meと:eの場合が強制ループ。)

>Moresampler 拡張独自フラグ。二文字、Me以外使い所は音作りに集中する。
>Mt、Mb、Mo、Md、Ms、Mm、ME、Me
Mt:緊張感の有る/なしの声に。レンジは-100~100
Mb:息成分を増減する。100にするとウィスキーボイスに。レンジは-100~100
Mo:発音時の口開け具合を増減する。レンジは-100~100
Md:ドライさ、このフラグの効果はかなり微妙で。高周波(6KHz帯域)の方が使えられそう。
Ms:安定感。レンジは0~10。デフォルトは0
ノートの出音がちょっとした雑音のある場合は増やして安定させることが可能。**機能自体はanalysis-anti-distortionと一緒なので、雑音が頻発する場合moreconfig.txtでこの項目を有効するのも手です。
Mm:旧来の発音モデルと行き渡りする。0.3.0以前で使用されたモデルとそれ以降で使用された最新のモデルの間で補間する。レンジは0~100、デフォルトは100。
ME:フォルマントを強調する。マイナスすると声がボケる。レンジは0~100、デフォルトは0。
Me:強制ループフラグ。前述通り。

なお、本家サイトにサンプル音声が上げられるためオススメです。

Moresampler mrq関連

アップデート重ねたら、Moresamplerが現在もっとも豐富な機能群、フラグ群を提供していたが、逆に言うと一番わかり辛くなっていたかも知れない。

どうしてこうなったというと、高音質の「可能性を求めて」導入した構造が、ヒイキでもあるから良くなるも悪くなるもある。今まで他のUTAU向けResamplerで多少にいい加減な設定で行けるのも、Moresamplerでは行けなくなって、雑音とか、クラッシュとか、わかりやすい不具合として出てしまう。

よって、いわゆる周波数表、Resampler向けのfrqと相当するmrqファイルは、Moresamplerでは極めて重要となります。出音に問題があればまずこちらを疑え。

幸い、周波数表自体長い間頼れるツール、Frqeditorがすでに存在してますが、mrqも対応してもらっていた。
Frqeditorで選べる手法は、「すでに手作りで、問題ないと考えていた周波数表」があるかどうかで分岐する。

ここで闇音レンリさんを借りて説明しよう。

これは「表示→スペクトラム→スペクトラムを表示」を有効して、Mrqが未作成の場合です。
「ツール→オプション→合成エンジン」では、すでにMoresamplerが選ばられて、mrqを編集する予定でした。

眺めると、レンリさんは周波数表としてfrqすでに同時に配布したようです。
「ツール→オプション→合成エンジン」をResampler.exeに変更すると、以下のようになります。
明るい原音のスペクトラムに、音階を表する赤い水平線と、有声音(濁音)を表する青い線が描いてる。
一部青い線が暗い部分まではみ出してますが、この場合問題ありません。
(ここでの意味は「無声箇所を有声音(清音)へ誤認する」が、そもそも周期成分なかったので無声のままとなります)

1. 既存FRQは問題ないと判断する場合、コピーする。
編集→周波数表を変換

とこの画面に

FRQからMRQへ変換出力されます。

で、これは「必ずも問題ない」というわけではなく、そもそも周波数表自体作っていなかった場合、Resamplerが生成したFRQをそのまま入っていたやつをMoresamplerに食わせると普通に暴走するから確認をしてねー

2. 自力で分析させる
元々Moresamplerは精度辺り他を上回ってるし、上位ライブラリーも試してますので、自力で分析するのはかなりオススメしてます。

「編集→すべての周波数表を再作成→よろしいですか?YES」でここに入ります。

通常は「両方初期化する」を選んで、MRQとLLSM両方Moresamplerが一括生成します。
*:この手順をやってからUTAUで既存UST使うと、凄い速さで出力されます。

で、問題になりそうはこういう状況:

(緑でピックアップした箇所のように)基本周波数赤線はあってますが、有声音の部分に一部青い線が引いてない場合、有声音を無声音を誤認するため、そのままモデリングすると、致命な雑音(しゃー)が出ています。

この件だと、現在(0.6.3)はこの通りで正しく検出されます。

未だにF0と有声/無声音検出(voiced/unvoiced、V/U辺界検出)を改良する余地はあって、開発側は引き続き努力しますが、基本的どこか限界があって、どんな原音でも大丈夫、というのはなかなか無いとおもいます。
なんの問題もなかった、というのは人様が作った上位ライブラリーで、他人の努力があった、ということが多い。

自分が作ったモノだと、相当の可能性でMoresamplerが声上がってしまうと思います。

で、最新版使ってるけどどうする?
残念ながら….自分で描くしかないぞ…..

描く場合、こちら画力ないので説明出来ない!(え

Moresampler 0.6.4 以降の導入について

自分:「シアトルが、シアトルが私を待ってる….」
ミクさん:「仕事しろ」

====
というわけで、まずはMoresamplerの導入について。
1. ファイル


(**画像差し替えました)
moreconfig.txtと、moresampler-legacy /moresampler32 /moresampler64 3つの中に、
一つを選んでUTAUのフォルダーへコピーしてください。

(0.6.3まで、moresampler32にvcomp140.dll、moresampler64にvcomp140d.dllついてにコピーする必要ありますが、今後廃止する予定)
(*逆だった! 64-140, 32-140d
(**内蔵できないと判明しました。

迷ったらLegacy使って下さい。XPなどを含めて最低限動けます。

あと、特にリネームする必要もないですが、リネームする場合これからの導入ステップに反映して下さい。

2.ツール設定。

ツール1とツール2両方をmoresampler.exeにする。
*:リネームしてなかったらこの場合moresampler-legacy.exeとなります。

なお、ツール1をwavtool.exeとか使いたい場合、moreconfig.txtの

“resampler-compatibility”をonに変更して下さい。
WAVファイルが1kbとかではなくちゃんと生成します。
ただ音質悪化しますので基本的非推奨です。

3. 他のUTAU設定


以上の通りに設定して下さい。

以上でMoresamplerが最低限動けると思います

Moresampler 0.6.2 & 0.6.3

ミクエキスポ→高田夜桜ミクライブ!のジャパンツアー終了して落ち着いてない間、Moresamplerが2点のリリースをもしました。

今後はしばらく開発に使える時間、及び実装したい技術のストックが少なくなり、しばらく休眠する予定ということでもあって、発覚した致命的バグを直して、しばらく放置するとのこと
です。

0.6.2元サイト記事
0.6.3元サイト記事

0.6.3ミラー

更新履歴:
0.6.3 (2016年4月18日)
* 問題修正: 音高が抑えたノートにMCフラグ使うときクラッシュする問題
* 問題修正: オーバーラップノートのノート、そのPropertyがない場合クラッシュする問題
* 問題修正: frqeditorの「周波数表を初期化」するコールが無効の問題

0.6.2 (2016年4月16日)
* 新機能: UTAUの「$direct=true」をサポート。原音をモジュレーションなしに直出力する。一部の呼吸音用素材に有用。なお、Moresamplerは選択した範囲の最終ノートが$direct=trueの場合レンダリングされない問題がある。
この問題はUTAUのresamplerとwavtoolとの通信インターフェイス設計の起因であり、解決出来ません。
* 新機能: “u”フラグ、上記問題の迂回策を提供する。u=”unmodified/untouched”(触らない、改変されない)。
* 新機能: Growlエフェクトとして新しく3つのMoresampler Extension Flagsを提供した。
MC: 粗雑感, 範囲は [0, 100], 実数
MG: グロウル, 範囲は [0, 100], 実数
MD: 歪み, 範囲は [0, 100], 実数
* 改良: 音高予測エラーが約1/10まで低減

=====

0.6.3 (Apr. 18, 2016)
* Bug fix: crashes when MC flag is applied on a note whose pitch is shifted down.
* Bug fix: crashes when “overlap” note property is negative.
* Bug fix: not responding to frqeditor’s “initialize frequency map” call.

0.6.2 (Apr. 16, 2016)
* New feature: support UTAU’s “$direct=true” note setting, which let the sample
bypass modifications, going directly to output. Useful for sound effects such
as breathing. Notice: Moresampler won’t render if the last note in the selected
region has “$direct=true”; this problem is unsolvable due to the design of
UTAU <-> resampler & wavtool interface.
* New feature: added ‘u’ flag, which has the same effect as “$direct=true” but
provides a workaround to the above problem. ‘u’ means ‘unmodified/untouched’.
* New feature: 3 Moresampler Extension Flags for growling-like effects were added.
MC: coarseness, range: [0, 100], real number
MG: growl, range: [0, 100], real number
MD: distortion, range: [0, 100], real number
* Improved feature: pitch estimation error rate has been reduced by ten folds.


Moresampler 0.6.1

ミラー

0.6.1 (2016年4月7日)

問題修正:R直前のノート時々短くされる(wavtool mode)
問題修正:プロジェクト全域フラグがノートフラグに正しくオーバーライドされる問題。
改良:mrqファイルフォーマット更新
設定可能新機能:
auto-update-llsm-mrq on/off
wavファイルの更新時間と比較して、関連llsmとmrqを自動的更新する機能。
もしwavファイルがllsmより新しい場合だと再分析を行う。
そして、もしwavファイルがmrqよりも新しい場合、再分析する前にピッチ予測をも行う。

Moresampler 0.6.0

原文リンク
ダウンロードミラー

このバージョンのハイライトは新しく導入した一連のフラグ群「Moresampler Extension Flags」となります。
これらは声色に対する調整において、及び多種多様の声色を作り出すには極めて有用だと考える。MEFsは既存UTAU flagと区別を付くためにMと始まった二文字で構成される:

Mt:引き締まりさ。値域[-100,100];デフォルト0
Mb:息成分の多さ。100にするとウィスキーボイスに。値域[-100,100];デフォルト0
Md:ドライさ。値域[-100,100];デフォルト0
Mo:口の開け具合。値域[-100,100];デフォルト0
ME:フォルマントを強調、もしくは抑える。値域[-100,100];デフォルト0
Mm:合成モデルの過渡。0.3.0以前で使用されたモデルとそれ以降で使用された最新のモデルの間で補間する。値域[-100,100];デフォルト100(新モデル)
Ms:安定性改善。原音に息成分が多く含まれる場合で出てしまうようなポップアップ声、クリック声、がみ声を改善する。値域は[0,10](整数), デフォルトは0。これは合成速度を遅くさせます。

ついてに、:eフラグはMeに変更されましたが、互換性維持のため:eは引き続き有効です。

もう一つの機能はオプションで追加された「analysis-f0-range-from-path」、この機能は原音に対する音域をフォルダー名で入力し、音高抽出精度をさらに高められる。

作者は現在Moresampler向けの詳細な入門講座を作成しており、あともうちょっとで完成できます。今後このリリースのさらなる情報は講座の方で。

0.6.0(2016年 3月 30日)

* 問題修正: 64bitバージョンでUACの警告が絶えずに出てしまう問題
* 問題修正: wavtoolモードで1番目のノートのタイミングがずれる問題
* 問題修正: “b”フラグ時々子音抑えない問題
* 問題修正:(確率が非常に低いが)場合によってResamplerがクラッシュする問題。
* 改良: 新しいノートがなく、もしくはプロジェクトが編集されない場合、Moresamplerは再合成しない(WAVTOOLモードで繋ぐだけ)
* 改良:もっと頑健なピッチ予測
* 改良:偏差音からの非周期成分抽出の改善
* 改良:息成分が多い音声における安定性
* 新機能: 8種類の Moresampler Extension Flag(略してMEF)を追加
Mt: 引き締まりさ, 値範囲: [-100, 100], 実数
Mb: 息の多さ, 値範囲: [-100, 100], 実数
Mo: 口開け具合, 値範囲: [-100, 100], 実数
Md: ドライな声, 値範囲: [-100, 100], 実数
ME: フォルマントを強調もしくは衰減, 値範囲: [-100, 100], 実数
Mm: 0.3.0以前の古いと0.3.0以降の新しいスピーチモデルを補間する, 値範囲: [0, 100], 実数, デフォルト: 100
Ms: 安定化, 値範囲: [0, 10], 整数
Me: 0.5.0のeフラグ、伸縮方式をループ無効化してストレッチへ強制するフラグを”Me”へ改名しました。
MEFについて詳細な情報はホームページの用例(英語)へご参照ください
* 新機能: Pフラグサポート、音量ノーマライズをサポート、値範囲は[0, 100]、
synthesis-utau-style-normalization が ‘full’ もしくは ‘voiced’ だけ有効、デフォルトは86、本家resampler互換です。
* 設定可能新機能:
analysis-f0-range-from-path on/off
フォルダー名から原音音域を判定する機能。
 例えばC_D4だとピッチは294Hz前後と推定する。