「Eji」的全部文章

[MikuMikuDance] Silence-PV完成

2 6 月, 2008 Eji 2 則留言

http://www.nicovideo.jp/thumb/sm3524271

http://www.nicovideo.jp/watch/sm3524271

【MikuMikuDance】『Silence』（MMD Edition）【DANCE-PV】

ついに完成。現時点MMD作品の頂点であることは多分反論も出まい。

Zoomeは100MBくらいうｐできますから、高画質バージョンすごく期待します。

さすがにフルＨＤでレンダリングしたいな、このくらいになるとね。XD

でもMMDはFSAAできませんから、フルＨＤにする->960×540にscalingする->ポストプロセシングをかけて-> SD画面(DVDとか)にするとかなりうまいものになるかも….いや、絶対にいいものだ。

モデル？絶品ですよ！？

こんなに可愛いのに。

追加：

http://www.nicovideo.jp/thumb/sm3527117

これもすごい。

初音ミク

[ぼかりす] VocaListener paper data

2 6 月, 2008 Eji 發佈留言

れぽうＰのレスから見ると、たぶんある程度の日本からの巡回がいますと思う。(一人くらい？XD)

だから「日本語ヘタですが日記をある程度日本語にする」の考えも出てきます。日本語練習のためにもなるから。

もし日本の方々がいらっしゃれば、日本語でも大丈夫ですから気軽に書き込んでください。

自分以外でも、この日記を見る人は多分「日本語でおｋ」の人が多いんですw

—-

http://staff.aist.go.jp/t.nakano/VocaListener/index-j.html

VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステム

これはおそらく現時点で得られる最高の参考データである。

もっといいのはプログラム本体とソースですが、それはさすがに無理であろうXD

MikuMikuVoiceどの差は当然、調教パラメータの自動生成(ぼかりすの音節は自動判別、MMVは人による入力)ですが，MMVのほうは多分MMDと同じく、開発工数を減るのは目的ですから。

でもMMVはまだピッチの推定精度をあげる余地があるのようです。 (波形データはまだエイリアシングがありますから)

これはある程度に聴感を影響するかもしれない。

（ptt(台湾のBBS)のボカロスレの人に「なんか初音さん十年くらい年取りました」と言われましたw ）

生成波形にオーバーサンプルにすることで改善できるかもしれないだから，後に樋口さんのにっやほん日記にフィーバックしてみたいかも。

でも、すでにかなり数の先行者が出てきます：

http://www.nicovideo.jp/tag/MikuMikuVoice

やっばみんながんばりますね。

ツールの刺激效果覿面です。

まだ修正が必要かもしれないんですが、いつ出るか分からないぼかりすより、もう出てきましたMMVの方では、みんなをサポートになることは明白です。

「いまそこにあるぼかりす」(by 松尾さん)の言い方も頷ける。

でも、樋口さん5/28日記のレスによるとマルチパスのやり方も考えてる模様：

１．最初はＤｙｎの値を設定せずにVsqで吐き出して、ボーカロイドの喋らせる

２・そのWaveを再びMikuMikuVoiceに戻す

３．戻したＷａｖｅと元のＷａｖｅからＤｙｎを計算する…

「面倒臭い上に、これで上手くいくという保障もなさそう…」と言いました樋口さんでしたが、でもこれはまさしくぼかりすのやり方です。XD

正確的には、DYNを0~127まで与えられて合成する、そしてオリジナル（人間が歌うのデータ）との波形距離を最小限します。

その上でさらに多数回の実行を行い、四回反復でパラメータ推定する。

それはVocaloidの仕様によるへんな減衰にされたことを計算で回避するのためだけど、マルチパスの考え方は「ぼかりす」のやり方に同じです。

ぼかりすもこのやり方で減衰を回避したことのようです。(「Viterbi アラインメント (HMM)性能合成システムの特性」，発表資料page 43)

つまり、マルチパスのやり方で減衰特性を計算しだ上でのパラメータを生成しましたのがぼかりすです。

VSTiのサポートもそのため。MMVの延長線の上にはぼかりすが存在するかもしれない。

一周間やるだけでこれくらいのことを思いついた樋口さん、さすがに「ニコニコ開発局長」に呼ばれる人です。

凄すぎ。（そしてこれくらいのツールを「なんちゃってツール」で無料配信することの懐の深さもさすがです）

でもこれじゃマルチパスは特許の関係で実装できませんかもしれない。

これは「ぼかりすはMMVと同じくらいのことしかやってません」ではなく、

MMVをボカロユーサーに広く使わせる有効なツールになるために、ソフトのシステム要求を最小限にする樋口さんの判断の正確さを評価するです。

ぼかりすは歌詞さえ知れば（オリジナル曲とカヴァー曲も同じく）、完全自動で分析、そしてある程度（サンプルは3~5回くらい？）の錯誤を手動で訂正さえすれば、自動的調教を行います。

そして調教のデータはボーカロイドと本来の歌い手共に有效です。これくらい高度の機能を一度行うシステムはさすがに大規模になります。

http://d.hatena.ne.jp/grgr56/20080430

「ぼかりす」について今の時点でわかっている事

「素人を喜ばせる」観点から書く。

結局「元歌を人間が上手に歌ったデータ」がなくては使えないものなのか？

「人間の上手な歌唱」から抽出されたパラメータは、オリジナル歌唱著作権の中にあるのか？

これらは「素人が喜ぶかどうか」に大きく関わってくる事柄だ。この二つの質問に対する答えがNoであればそれは「神調教ツール」。公開されれば影響は計り知れない。

ここにも指摘したのように、「元歌を人間が上手に歌ったデータ」の必要はありません。ぼかりすは歌下手の人のデータ自体にも調教を行いますから。

パラメータを抽出されたことを制限しなければ、「神調教ツール」おそらくマジになります。

—-

論文によると、ぼかりすはマルチパスの分析が必要ですから、かなりのシステムスペックが要りますかもしれないだが，そのくらいの価値は絶対あります。

なぜかと言うとVocaListener-plusです。 VocaListener-plusは音高変更とスタイル変更機能がついています、つまり様々の歌手の歌唱スタイルの数值化が可能です。

おそらくほかのソフトの補助が必要かもしれないんだが、それでも「なんちゃって若本（？）」とかのマネ事が自動的データベース化できますから。

http://blogs.itmedia.co.jp/closebox/2008/06/post-84e9.html

「ぼかりす」で知った、プロとアマの違い

すでに松尾さんの指摘通り、プロとアマの違いがわかります、それはアマをプロにすることに繫ぎますから。

「すでに故人になった」の方の歌唱力の再現も可能になります。さらに微妙の音楽ノウハウを数值化、データベースにすることで音楽教育の向上をさらにサポートすることが出来るかもしれない。

「音楽を理解するコンピュータの実現に向けて～リアルタイム音楽情景記述システムの構築～」のように、音楽を理解するコンピュータの出来上がりです。

彼女との付き合いはもうMIDIデータ流れではなく、「とう歌えばいいか」ということになる。

これは【初音ミク】鍵盤ハーモニカ【少女】の音楽教育の理想形のひとつかもしれないたと思う。

現状ですら、作曲経験がなく楽器経験すらない方までソフトを購入しており、恐らくはほんの一握りでしょうが、それをきっかけにこれから音楽を本格的に始めてみようと思った方も中にはいらっしゃると思うんです。

そんなこれまでの常識を覆すような初音ミクがもし実体を持つことになったら、起こる奇跡は生半可なモノじゃないと思うんですね。

（来世さんより）

この１０が月の出来事が思うと、「初音ミクの奇跡は続きます」だと信じたい。

——————————————————————————————————————————————————————————–

看到れぽうＰ的發言，想說說不定這邊還有日本的人在巡迴….XD

開始想寫日文和中文雙解的東西。雖然日文程度實在是很爛啦_A_||||||

總之希望日本的朋友們可以輕鬆地以日文發言，反正會看這邊的人大概看得懂的比例比較高。XD

以下是上面這篇本來想寫的中文版，寫的時候並不是中文一句日文一句，而是”以想表達的東西”來思考。

所以直接翻的話可能會很爆炸XD

—-

http://staff.aist.go.jp/t.nakano/VocaListener/index-j.html

VocaListener: ユーザ歌唱を真似る歌声合成パラメータを自動推定するシステム

完整的論文、發表資料PDF…. 這個只能說夫復何求。XD

理所當然地，MMV為了節省開發時間，把音節推測交給實際操作的人來處理，並且將介面盡可能簡化這點，可以看出樋口老師的作風；但是在ptt Vocaloid版分享的結果，似乎波形部分的精確度還有努力的空間。(把畫面放大可以看到明顯帶有鋸齒的波形)

這應該會對聽感有點影響。

ptt的某K兄說道：「pitch隨時間變化的間距太長，所以造成轉出來的曲線不夠平滑，打開轉好的VSQ來看就知道」「聽起來聲音有點….初音老了十歲的感覺(炸)」

不過即使如此，工具扔出來就是會刺激很多人上來try。

http://www.nicovideo.jp/tag/MikuMikuVoice

而且不乏優秀的東西，昨天的兩首原創曲就是典型。

工具會帶來突破就是指這種狀況吧。

話說由於先前WX5檢證的關係，自己也在嘗試拿MMV來做cover，不過實在是對自己的素人程度極為絕望XD

但是可以知道不管還需不需要(或者打不打算)更正，比起還不知道什麼時候推出的VocaListener，絕對是已經推出的MMV會帶來的生產力比較高。

所謂「いまそこにあるぼかりす」的說法的確會讓人很有共鳴。

不過為了先前已知的不明衰減問題，在5/28日記的回文裡面，樋口大先生也考慮過multi-pass的做法：

１．最初はＤｙｎの値を設定せずにVsqで吐き出して、ボーカロイドの喋らせる

２・そのWaveを再びMikuMikuVoiceに戻す

３．戻したＷａｖｅと元のＷａｖｅからＤｙｎを計算する…

雖然當天看到速報就已經開始覺得是，但是今天論文出來發現這真的就是ぼかりす的作法實在是讓人噴了。

實際上就是先以0~127的參數作多次合成來做比較，甚至還執行四次來推定資料。

所以也就是說雖然樋口大先生因為懶與未定性所以沒做，實際上思考本身是完全正確的。

由於「Viterbi アラインメント (HMM)性能合成システムの特性」一文的敘述可以知道，這指的應該是採用音節切割合成法的Vocaloid實際的特性，也就是說ぼかりす確實是以這個方式來迴避音節的衰減問題。

(也因為這個樣子，為了多次生成，ぼかりす必須要繞過Vocaloid Editor來做多次合成，這也是ぼかりす支援VSTi的目的)

第一次碰MIDI規格，一個禮拜下來就可以想到這些東西的樋口大先生實在是很強大。XD

(然後把這些東西當成「なんちゃってツール」直接扔出來的胸襟也實在很猛)

不過既然已經是專利了，那大概永遠都沒辦法做上去。

VocaListener可以透過先得知歌詞內容的方式，自動將歌詞填進音節內。這點非常強大….

這並不是在說VocaListener的實作和MMV同級，要達成VocaListener的程度鐵定需要極為大量的know-how。

從VocaListener的實作規模也可以看出，當時樋口老師認定應該放棄十分明智。

http://d.hatena.ne.jp/grgr56/20080430

「ぼかりす」について今の時点でわかっている事

「素人を喜ばせる」観点から書く。

結局「元歌を人間が上手に歌ったデータ」がなくては使えないものなのか？

「人間の上手な歌唱」から抽出されたパラメータは、オリジナル歌唱著作権の中にあるのか？

これらは「素人が喜ぶかどうか」に大きく関わってくる事柄だ。この二つの質問に対する答えがNoであればそれは「神調教ツール」。公開されれば影響は計り知れない。

由於連唱得不好的user資料也會在mult-pass內受到調教，所以並不需要「唱得很好的原始資料」

也就是說只要法律不限制抽取唱法參數的行為，「神調教ツール」絕非誑語。

此外，由於multi-pass和多聲道生成的交叉比對，ぼかりす鐵定會需要非常大的硬體資源。

但是由於有VocaListener-Plus，具備音高變更與歌唱類型變更的功能，我相信它確實具備了先前期望過的「歌唱參數數據化」的能力。

http://blogs.itmedia.co.jp/closebox/2008/06/post-84e9.html

「ぼかりす」で知った、プロとアマの違い

和松尾先生講的一樣，你可以透過數值化來得知和專業人士的差距，就代表說這有辦法讓你知道專業人士怎麼唱，和你的差別在哪邊。

進一步地來說，也可以把已經作古的歌手唱法給數值化，這些微妙的know-how能夠加以統計起來，形成資料庫的話，絕對會對音樂教育產生極大的助益。

就像「音楽を理解するコンピュータの実現に向けて～リアルタイム音楽情景記述システムの構築～」這篇提到的一樣，讓電腦可以”理解音樂”。

妳可以不必再碰底層的MIDI編輯、而是實際”教她該怎麼唱歌”。

這其實就是【初音ミク】鍵盤ハーモニカ【少女】所指出的，音樂教育的一種理想型才對。

現状ですら、作曲経験がなく楽器経験すらない方までソフトを購入しており、恐らくはほんの一握りでしょうが、それをきっかけにこれから音楽を本格的に始めてみようと思った方も中にはいらっしゃると思うんです。

そんなこれまでの常識を覆すような初音ミクがもし実体を持つことになったら、起こる奇跡は生半可なモノじゃないと思うんですね。

（来世 さんより）

回想起這不過是十個月以來的改變，就會讓人相信，ミク的奇蹟還會繼續下去。

—-

以下巡迴

http://d.hatena.ne.jp/beentocanaan/20080529

[音楽周辺][ニコニコ動画] Vocaloidは、すでに人間に追いついた。

http://d.hatena.ne.jp/mame-tanuki/20080601/p2

ボーカロイドの進化に絶望した～絶望のニコ動シリーズ～

http://zh.wikipedia.org/wiki/VocaListener

中文版VocaListener資料，香港的朋友所整理。

式子引用自論文原文。

http://akira-izumi.cocolog-nifty.com/patent/2008/06/post_c0a5.html

ぼかんないんです＞＜技法の解析

http://akira-izumi.cocolog-nifty.com/patent/2008/06/post_878b.html

機械的イフェクトによるビブラート

即使沒有V-Vocal可用，同時期應該也有別的東西可以實作類似功能才是，比方說Auto-Tune。

Auto-Tune由於有real-time校正，連現場演唱都派得上用場….此外，V-Vocal也有Pitch to MIDI功能。

http://www.nicovideo.jp/thumb/sm3478357

「TからSへ」時就已經很喜歡這種調調了，這回更棒啦。

Uncategorized

耳コピ工具筆記—Synth1講座 + binoP的free loop音源

1 6 月, 2008 Eji 發佈留言

Synth1講座，作者心腸太好。XD

不過把知識系統化這點對自己也非常有幫助，所以作者不只是奉獻而已。

http://www.nicovideo.jp/thumb_mylist/6074643 http://www.nicovideo.jp/thumb_mylist/6629534

話說SaviHost安裝有夠單純….XDa

http://www.nicovideo.jp/thumb/sm2274095

http://www2.atword.jp/binop/2008/02/10/synth-test/

Synth Test

原來BinoP做過這種東西….看了之後對loop音源稍微有點概念了。

—-

是不是該加個DTM的tag….？

CELL、初音ミク

[ぼかりす] MikuMikuVoiceChanger原創曲測試

31 5 月, 2008 Eji 6 則留言

http://www.nicovideo.jp/thumb/sm3499652 http://www.nicovideo.jp/thumb/sm3495465

http://www.nicovideo.jp/watch/sm3499652

【MikuMikuVoice】人間→ミク声変換でオリ曲を歌わせてみた【神ツール】

原主唱為留桜良姫。

http://www.nicovideo.jp/watch/sm3495465

【完全無料でここまで出来ちゃう】プレゼント【初音ミクオリジナル】

純手打 + 完全使用free resource。

使用機材・音源/Independence(Free)・ソフト/MusicStudioProducerなど+BuzMaxi3・歌/初音ミク（体験版）・Windowsムービーメーカー+ピアプロのイラスト。

不過體驗版不是只能使用到07/12/31？XD

原作：はちみつれもん

http://8lemo.lala.cc/

作者刻意把PIT全消，只留DYN。

　　敢えてピッチとかほぼ消していつものミク声に。

由於原唱的抑揚頓挫轉為DYN參數，所以比起原手打資料來得圓潤；

但是PIT如果不去trace的話，就沒有變聲器的問題，而會留下ミク本來的聲音。

[EDIT]

http://www.nicovideo.jp/thumb/sm3511475

http://www.nicovideo.jp/watch/sm3511475

【MikuMikuVoiceで】オリジナル曲・月想夜【人間×初音ミク】

這回是保留PIT，並且與原主唱並列，的確非常類似沒錯，不過如果做左右聲道分離的話會更好比較。

http://akira-izumi.cocolog-nifty.com/patent/2008/06/post_c0a5.html

ぼかんないんです＞＜技法の解析

拿到Dearest原曲的和泉聰先生遇上了非常令人意外的結果：

本來認為因為yuukissP的Dearest波形很漂亮，所以應該不是從濱崎步的歌聲抽來的、而應該是自行用工具產生；

結果濱崎步原曲就已經波形很漂亮，代表其實濱崎步的原曲就已經有很多工具生成的部分了才對….

而從這種資料上抽取波形的話，那麼有得到漂亮波形的Dearest cover版也變得似乎頗理所當然。

不過先前在媒體上看到濱崎步在拍宣傳照的時候都要求徹底修到漂亮的小道消息，從這點的話其實也算不意外就是。

反過來說，目前商用曲使用的第一線商業技術如果也投注到Vocaloid的話，那理所當然會出現更出色的歌聲、而不只是人類聲音的再現….吧。

以上是和泉先生的想法，所以在這邊放一點自己的想法：

對我而言，VOCALOID的部分重點其實某種意味上是”穩定”的歌聲，因為不論怎麼鍛鍊，人類的規律行為總是很難達到完美，所以個人認為”穩定”這部分機械應該是血肉之軀無可比擬的。

比方說有人覺得”正確”地唱出歌曲的部分是死板，但是我是覺得某個程度上不見得啦….會存在一個”生動”但是卻”穩定”的境界….

對人類來講，到這種境界可能會需要在後製上大量的加工，但是Vocaloid就不見得需要。

所以達到某個程度之後，Vocaloid說不定真的可以超過現場歌唱的能力。

當然啦，人類歌唱的價值不可能會被取代的，但是當你想過現場都可以即時套用上Auto-Tune了，那麼你會覺得以人類唱現場很重要嗎？

讓某些其實本身歌喉並不好的人，也可以用Vocal曲得到支持，讓他們的才能得以突顯出來(而不是商業公司另找vocal來包裝)，也是個好事啊。

ryo新曲「World Is Mine(「ワールドイズマイン」)」。

http://www.nicovideo.jp/thumb/sm3504435

http://supercell.sakura.ne.jp/wim/

像ryo這種，就是典型的「自己就能夠包裝自己」的人啊XD

Uncategorized

錄影設備和PMP的完整solution

30 5 月, 2008 Eji 1 則留言

http://www.watch.impress.co.jp/av/docs/20080528/zooma362.htm

第362回：ウォークマンと完全同期するレコーダ「ソニー BDZ-A70」

～番組消化に強い味方、ダビング10対応で嬉しい唯一の機種～

從初代PSX + PSP[おでかけ・おかえり転送]功能、繼承的スゴ録 + PSP、到現在BDZ-A70 +PSP/Walkman雙對應。

錄製雙格式檔案、單鍵傳輸+認證、單周檔案list、看過的檔案自動送回PC(只送認證回來而已所以很快)、字幕整合功能等等。

不愧是自己都在大量使用的功能，已經發展到很洗鍊的地步。

裡面提到”盡量便宜、不能錄BD也沒關係的おでかけ・おかえり專用機”這點，感覺這應該就是PS3該占的定位了。

不過PS3大概做不到待機中、不開螢幕的單鍵one-touch轉送功能就是。_A_

—-

http://www.jp.playstation.com/scej/title/shikitei/

四季庭 for PS3

1500yen、Online配信專用。

好個HD專用content….XD

初音ミク

[ぼかりす] 75回音研總整理

30 5 月, 2008 Eji 發佈留言

http://nicovideo.g.hatena.ne.jp/vcld/20080529/1212037144

ボカリスレポまとめ

http://ishiirikie.jpn.org/article/15475698.html

「初音ミク」を創った方にお会いしました（神戸にて）

http://d.hatena.ne.jp/raydive/20080528/1211986787

ぼかりすを聞きにいってきたよ（日々の御伽噺）

http://njb.virtualave.net/web/rl2008/mus75/mus75.htm

第75回音楽情報科学研究会に行ってみた

MikuMikuVoice：

http://blogs.itmedia.co.jp/closebox/2008/05/mikumikuvoice-b.html

MikuMikuVoice：いまそこにあるぼかりす

http://vocaloid.blog120.fc2.com/blog-entry-1247.html

出た！生音声からパラメータ付きVSQを生成する「MikuMikuVoice」！

http://miku-challenge.seesaa.net/article/98605312.html

MikuMikuVoiceは、確かにVPVPのツールだ

http://akira-izumi.cocolog-nifty.com/patent/2008/05/mikumikuvoice.html

MikuMikuVoice

http://www.nicovideo.jp/thumb/sm3489465 http://www.nicovideo.jp/thumb/sm3486736

VocaListener在歌唱補正的部分只能說不能奢求。

重點是DYN和PIT曲線的輸入、還有音節手動抓取等等，唯一的缺點是已知VO Editor的仕樣，會給音節收尾的DYN加上很強大的衰減….所以語音的某些attack會不見；另外，MMV並沒有防呆，所以多音節輸入會混淆。

對ドラマ/語音製作來說，目前看來MMV比VO Editor本體好用很多。 🙂

—-

http://vocaloid.blog120.fc2.com/blog-entry-1248.html

名物男「クリ☆ケン」氏が生音で不甲斐なさを悔いるも聴き取れない

PIAPRO的資料量(~08/05/30)：

音楽：6,215曲

イラスト：38,780枚

歌詞：6,667枚

有趣的是歌詞已經超過音樂了。XD

Uncategorized

日本的放送業界還有機會嗎？

30 5 月, 2008 Eji 發佈留言

http://www.watch.impress.co.jp/av/docs/20080529/dub10.htm

6月2日の「ダビング10」延期が確定

http://www.watch.impress.co.jp/av/docs/20080529/jeita.htm

JEITAアンケート「ダビング10でも補償金不要」が78%

http://www.watch.impress.co.jp/av/docs/20080529/cf.htm

「ダビング10を人質にしてはいない」。権利者団体会見

我可不可以寫四個字「指鹿為馬」…._A_

對上面這堆的意見，本田雅一先生這篇大概就全部講完了。

http://blogs.itmedia.co.jp/honda/2008/05/post-ba99.html

その一言で、個人的にはさらに信用できなくなりました＜私的録音録画補償金制度での権利者団体の主張について

—-

http://www.cyzo.com/2008/05/post_602.html

「規制以前に風前の灯火……」美少女ゲーム業界の辛苦

風中殘燭還要再加上規制的話只怕遲早完蛋XDa

不過說真的，這和動畫狀況有點像，問題應該是供給過剩吧。

CELL

H.264 encoding on CUDA

30 5 月, 2008 Eji 16 則留言

http://techon.nikkeibp.co.jp/article/NEWS/20080415/150509/

【NAB】米Elemental Technologies社，GPUでH.264符号化処理を高速化

http://www.hkepc.com/?id=1212&fs=h3t

利用GPU進行 HD影像編碼

9600GT不需50分鐘 3GHz四核要5小時

http://elementaltechnologies.com/

先前CUDA已經在FAH上展示了與CELL同等的效率，而在對consumer有利的市場上，這就顯得非常有利….Elemental Technologies 的BadaBOOM Media Converter 在 9600GT上進行720p H.264 encode可以達到144fps前後，full-HD的encode更是幾乎是1/2 realtime，G92則是1/4 realtime；相較之下，目前Core2quad 3GHz還要跑個2x realtime….

以規模來說，應該可以推測G84就可以做到Full-HD realtime encoding，這與CELL差不多是同等的；這對已經賣出相當數量的G84來說，是個相當有意義的應用。

—-

就看encoder賣多少錢啦….XD

先前說要當成Adobe Premire Pro的plug-in賣，consumer產品呢？

http://www.theinquirer.net/gb/inquirer/news/2008/05/29/nvidia-gt200-sucessor-tapes

Nvidia GT200 sucessor tapes out

INQ繼續批得很慘。XD

不過我不知道他們哪邊看來4870可以和GT260在性能上相等。XD

Uncategorized