「Eji」的全部文章

Gackpoid再延期

http://www.itmedia.co.jp/news/articles/0806/10/news049.html

Gackt声のVOCALOID「がくっぽいど」発売延期

這回是封面選定問題。XD

日頃は弊社の製品をご愛顧賜りまして、誠にありがとうございます。

さて、6月中旬ということでご案内をさせていただいておりましたボーカリスト「Gackt様」の声を元に制作したバーチャルボーカリスト「がくっぽいど」ですが、商品パッケージなどに使用しますイラストの選定、変更のために発売を延期させていただきます。

同時に発音や歌い方のチューンナップなどをさらに進め、よりよい品質でお客様へお届けできるように開発を進めております。

お客様、並びに流通関係者の皆様には、ご迷惑をおかけすることとなり、深くお詫び申し上げます。

なお、6月中旬ごろには価格、発売日、パッケージイラストなど正式な発表をさせていただけるかと思いますので、今しばらくお待ちいただきますよう宜しくお願いいたします。

依照先前佐佐木涉先生的說法,Vocaloid2的系統真的卯起來做的話可以做到極為像真的程度;但是資料庫和系統負擔會膨脹到很大的程度,同時成本也會提升很多。問題是限界在哪邊….

Gackpoid + VocaListener的話,也許會挑戰目前擬真度的極限也說不定。

—-

http://www.nicovideo.jp/thumb/sm3612709

約9ヶ月間、このソフトを中心に音楽を創って来ましたが、これをもってボーカロイドのための楽曲制作は引退しようと思います。(3のエンジンがリリースされたらまた手を出すかもしれませんが・・・w)今まで聴いて頂いてありがとうございました。これからは純粋にこのシーンを楽しみ、サポートして行く側として見て行きたいと思います。 (by baker)

林檎、baker….初期P開始引退。

http://www.nicovideo.jp/watch/sm3544691

VOCALOID DAYS 2007-09

http://www.nicovideo.jp/watch/sm3612690

VOCALOID DAYS 2007-10

關於上述像真度的問題,回去找出處:

http://codezine.jp/a/article/aid/2265.aspx?p=3

クリプトン佐々木氏に聞く 「初音ミクムーブメントの当事者が今思うこと」

VOCALOIDはもっとよくなるのか

佐々木

うーん…。波形レベルでの磨き込みにより、現状の初音ミクより、リアルに調整されたVOCALOID2は、時間をかければ作れると思います。ただ、それ以上、人間に近づけようとした場合、すごく動作が重くなるという問題があります。個人的な見解ですが、サンプリング音源的な方法論として、例えばデータベースを多重化してランダムで揺らぎを出すだとか、あるにはあるのですが。

編集部

なるほど。

佐々木

あとは、音の長さを半分にしたり伸ばしたりだとかっていう「タイム・コンプレッション/エクスパンド/ピッチシフト」の技術は音楽製作ソフトが進化していくのに重要な要素ですし、さらに全体的に向上しつつあるので、進化していくであろうその技術がVOCALOIDに反映されれば、ある程度、音質的にも良くなると思います。

編集部

逆に設定が大変になったりしないんでしょうか。

佐々木

ほとんどのサンプリング系音源…VOCALOIDもそうですが、煩雑な設定を全て剥き出しにせず、内部的に処理している部分が当然あります。なので、そこまでチューニングが難しくなることはないと思います。ただ、細かい要素を持ち込めば持ち込むほど、敷居がとても高くなると。DBも何パターンか作るとなると、金額も数倍になってしまうでしょうから、そうなってくると「VOCALOID」という製品の特性からするとどうなんだと。

編集部

価格とのバランスもあるんですね。

佐々木

ええ。それ以外にも、単純にパソコンのCPUやメモリ性能があがっていくことでやれることが広がるということもあります。また、VOCALOIDを作る際に使っている開発ツールがあって、録音した音をコンバートしたり、合成できるようにデータベース化するソフトなんですが、それも今も細かくバージョンがあがっているんですよ。そっちが良くなればVOCALOIDの性能があがっていくこともあるので、これも重要なポイントだったりしますね。

佐々木

実はVOCALOID2の作り方を再検証しているんです。VOCALOIDの製作に関しては一から計算し直してて、もうちょっと精度の高いものにしたいなということで、試行錯誤しているところなんです。

編集部

というと?

佐々木

VOCALOIDは、エンジンの中に音声データが入ってて、そこに音声データを入れてあげれば一応製品としては完成するんです。ですが、音声合成ソフトなので接合部がうまく会わないとギリッという音が入ってしまったりとか、ノイズ成分が伸びてしまったりとか、そういうことがあるんです。それが起こらないような、もっと良い方法がないだろうかと検証している段階です。

編集部

単純に音を差し替えただけではない製品になるということですね。

佐々木

自分なりにどうしたらいいんだろうと考えてて。どこにどういう音をはめていくか、というところからブラッシュアップしながら、「ここにこういう音を入れた方がキレイになるんじゃないか」とかいろいろ試しています。本当だったら今のまま音声データベースを差し替えていこうかなと思ってたんですが、ちょっと一度整理したかったんで。それが完了すればユーザーさんの手元に届けられると思います。

Lipsync for XSI

http://www.nicovideo.jp/thumb/sm3592088http://www.nicovideo.jp/thumb/sm3556366

というわけで、顔アニメは修正含めなんと10分(!)、やっつけモーション15分、レンダリング10分、適当に背景のせてエンコード20分で完成させたテスト動画を作ってみました

Cg compiler realtime 十分鐘搞定,アノマロ/MAX user淚目(啥)

Source:

http://www.cveld.net/modules/Xigg/index.php/node/209

初音ミクVSQ読み込み、口パクスクリプト

http://ga-j.cocolog-nifty.com/blog/2008/06/xsi008_5f40.html

XSIメモ008 口パクスクリプトをやっつけろ

http://www.nicovideo.jp/thumb/sm3165721

觸角ミク本家十萬~

COREL的SpursEngine Demo

http://www.tgdaily.com/content/view/37845/135/

Scaled-down Cell CPU beats Intel’s quad-core chip in video transcoding

在君悅酒店分開展了,所以沒看到…. _A_

把1080p的H.264轉成480p,時間大約只要3GHz Core2Quad的1/2,更別提SpursEngine只要不到20w。

當然老實說,雖然”幹掉quad-core”看起來很爽,但是由於SpursEngine裡面有硬體H.264 encoder,實在很難講到底靠SPE做了哪些事情….

總之這張卡的確不貴,sample kit(含SDK)的價格都只要一萬日幣,大量生產的話應該會更低。

—-

http://www.tgdaily.com/content/view/37857/135/

Roadrunner: 130,536 cores break the Petaflop barrier

RoadRunner正式啟用。

要翻桌,大家都來吧

http://plusd.itmedia.co.jp/lifestyle/articles/0806/09/news018.html

思い切って放送行政のちゃぶ台をひっくり返してみよう

你們不想要Dump10,想拿來綁架補償金,不依就說人家翻桌?

要翻就翻個徹底吧。

1. 不要人家保存?那乾脆就做爛一點的節目不就得了?

有個最好的例子在台灣:

電視節目老是在重播,沒人想搞錄影,沒人想要timeshifting設備,因為重播就是電視台提供的timeshifting。

2. 既然覺得數位會損害自己,為什麼還要用數位停類比呢?繼續用類比電視就好啦?

然後就不會需要在電視上放洋片了,然後家電商就樂得賣BD啦。

既然洋片不會上電視,那也沒有保存與否的問題。

3. 需要資訊性節目的人老實說只需要文字放送和輔助的一些圖片,那個1-seg就很充分了。

如果怕看漏,卯起來要搞1-seg的全頻道錄影其實也很簡單啊,頻寬需求那麼小。

結果其實回頭看日本數位放送的爭執到現在,就可以看到對user而言,其實這麼爛的數位放送根本整個打掉別做了還比較好。

重點是現在的觀眾不像以前那麼呆了,需要資訊的話除了電視之外還有網路可以用,根本不會依賴電視。

所以電視台搞copy-once、搞dump10之類的有的沒的,只是加速讓過去看電視的人不再看電視而已。

不跳到數位放送不是因為不知道類比要停波,而是現在的日本數位放送只會帶來不便而已,然後這些不移過去的人,也早就找好自己需要的solution了。

怎麼看都覺得,日本的權利者正在自己親手埋葬電視放送的價值。

光靠萌就能翻身的話,我想美少女遊戲應該很好賣…

但是事實不是如此。

http://nicovideo.g.hatena.ne.jp/vcld/20080604/1212585052

クローズアップ現代でやっていたのがあまりにもVOCALOID界隈にかぶるので

由於供給過剩,只要沒上ranking,幾乎就是被埋掉的命運。

紙本出版與現在Vocaloid的作品狀況類似,所以要想不被埋掉還真的得花苦心。

http://d.hatena.ne.jp/menika/20080604/p1

二つのゲーム

http://d.hatena.ne.jp/font-da/20080529/1212075228

[web][社会]みんなの「初音ミク」

行文裡面要是有種「萌上去的都是オタ」,當然就會有點指桑罵槐的嫌疑。

不過要是探討到為什麼會初音ミク會捲起熱潮的時候,

我覺得很多人都只注意到”有角色性”的存在,卻沒去注意角色設計本身的出色性。

要不然MEIKO當時為什麼是三千份而不是現在ミク的三萬份?

但是蒼かな大姊就有注意到:

http://ushikun.ddo.jp/~yukamasa/cgi-bin/log/eid931.html

【ツアー間もなく終了です】目指す彼方は【ぼかりすとか色々】

ミクって、キャラ記号の強さがすごいね。

配色とツインテ&ヘッドホンマイクつけたら

あとはどんな格好させても『初音ミク』に見えるョ。

這就是重點啦。

設定本身很薄弱很單純、但是記號性卻極為強大的關係,使得同步性得以提高。

光是PIAPRO裡面就有不知道多少種細部不同的ミク,每個都可以有一種故事。

然後每個都是作者本身的投影產物;

(題外話:角色性的感染力強也是迪士尼那個新的雙馬尾機器大小姐會被當成有關的原因之一)

反過來說リン、レン相對地就比較沒這麼誇張,二次創作改變稍微大一點就看不出來了。

MEIKO也常常會被講設定土裏土氣沒特色之類,因為也是動得手腳稍微大一下就會走樣。

——-

有時候會覺得初音ミクニュース的人選文章選得很神….

http://earlesscat.blog91.fc2.com/blog-entry-281.html

歌姫に「ハジメテノコトバ」をささげよう

言葉を喋るというのは、単に子音と母音を並べることじゃない。

文にしてみると同じ言葉でも、声色や話すタイミングなどによって全然意味が違って聞こえます。

実際、言葉そのものよりも、そういった「付加的な情報」の方が発話者の意思を圧倒的に多く内包していると思う。

けれど、その「付加的な情報」の違いを言葉で説明するのってかなり難しい。

何故かというと、それこそが、人の「ココロのかたち」だからだと思う。

だからきっと、喋るというのはココロの形を外の世界に切り出すことなんだと思う。

機械には、魂がない。

だから、言葉を話せない。

多くの人が感じてる「ミクの儚さ」ってのは、きっとこのあたりが原因なんじゃないかと思います。

ミクの歌が歌に聞こえるのは、職人が一生懸命、彼ら自身の「ココロの形」を吹き込んでいるから。

ミクが歌っているのは、彼ら自身のココロの形なんだと思います。

上回STRAIGHT裡面對語音的音高模型,就已經讓人可以感受到同樣的詞語帶有不同的喜怒哀樂。

加上歌聲與曲目的話,能表達的資訊量就更大….

以一個容器而言,和傳統的樂器(從實際樂器到sampler都考慮在內),ミク的容量也太大了。

http://d.hatena.ne.jp/itkitk/20080602/1212418943

人間に追いついたVocaloidではなく、Vocaloidみたいに扱われる人間の話

だって人間に追いつくのが目的なら、永遠に人間以上の価値を生み出すことはできないし、そしたらはなから人間に歌わせろよ、ってなるわけで・・・

、ただ「Vocaloidが人間に追いつく」ということ自体に価値を見いだすならすごく意味はあると思うけど。

這也可以套到先前的「從電子樂器進步的歷史(sampler)來看Vocaloid」、還有為了cover曲動用trace工具來調教的意義。

http://d.hatena.ne.jp/KGV/20071017/1192633505

07-10-17 電子楽器の歴史から考える初音ミク

したがって結論を言えば、初音ミクは機械のボーカルという形でポストサンプリング時代の技術による在るべき楽器(今やソフトだが)の姿を提示することはできた。しかし、それがリアリティの追求を目指しているうちは一過性のブームに終わるしかない。楽器として新たな音楽を創り出すようでなければ、本当の意味での楽器ではない。

不過個人覺得,其實也不必想這麼多啦….畢竟這個世界(人類的數量/社會規模),對要容納各種不同的嗜好與做法而言,實在是太大了。

要找到同好實在沒那麼難….族群要成長到某種可以產生經濟價值的規模,那就是比較難沒錯,所以很多事情只能以嗜好的程度來看待就是。

CGM本身能夠產生多少經濟價值,我覺得就是在怎麼樣從嗜好來換錢這點困難。

所以Hotball老大在等Youtube倒台,我則在等nicovideo損益平衡。

其實是同一件事情吧。

>「初音ミクの魅力がオタクでない僕には分からないので教えて下さい – araig:net」

http://s03.megalodon.jp/2007-1020-1553-33/d.hatena.ne.jp/araignet/20071020/1192811893



ありったけの呪詛を込めて言うが、ここからは、絶対に、何も、生まれない。

至少這種毫無生產力的說法才是真正沒有意義就是了。

firmware 2.40的功能展示影片?


http://www.ps3-fan.net/2008/06/ver240.html

本物!?ファームウェアVer2.40のビデオが公開される

影片裡面的主要重點是在遊戲過程內按PS buttom是直接進XMB畫面,而不是本來的搖桿setup選單。

而且用的是RR7,代表遊戲本身不需要配合的update。

不過這個影片本身的真假沒有任何保證就是XD

此外,50sec前後有幾個選項很有趣的是:Update Server URL、Video Upload Debug、Wake On LAN、PLAYSTATION Store Ad Clock、Dummy XMB (in game) Debug、Dummy BGM Player Debug等。

一部主機的firmware可以當成新聞來報,我想PS3也算是空前絕後XD

[ぼかりす] 新demo 上路,鏡音リン + VocaListener

http://www.nicovideo.jp/thumb/sm3571447

http://www.nicovideo.jp/watch/sm3571447

【鏡音リン】 Game of Love 【ぼかりす】

http://www.nicovideo.jp/mylist/7012071

VocaListener Demonstrations

在75回音研結束後還有持續發布,果然是打算到實際推出前一個一個放出來嗎XD

[参考(歌声合成の技術情報): 歌声合成パラメータとしてPIT, PBS, DYNを自動推定し、他のVEL,

GEN等は初期値のままです。手作業として、歌唱の音素列のViterbiアラインメントで大きな誤りがあった2箇所を訂正し、自動推定した音節境界の誤り3箇所の指摘を1回だけしました。VocaListener-plusは未使用です。]

唯一的手動部分是把兩個部份的音素序列做更正、然後指出三個音節分界點的錯誤。

前面的是手動更正、後面則是指出錯誤後程式更正,總掃描次數一次。

也就是說總調教時間從輸入到結果輸出可能不超過15分鐘。

主要的問題:VocaListener可以自動檢出呼吸、抑揚頓挫,但是無法更正音標本身的滑舌/含滷蛋….XD

當然人工調教也是沒辦法改正這點的,這要靠編曲和填詞的功夫來cover。

—-

滑舌(かつぜつ)是日本媒體用語,專指講得很快的快嘴技術(簡單講就是繞口令),這時候如果還要咬字清晰的話就需要訓練….

滑舌指的是經過訓練後即使快嘴都能夠維持住咬字清晰的能力,所以這邊等於是在講反話來形容リン、レン的咬字不清。

http://www.nhk.or.jp/bunken/research/kotoba/kotoba_ura_04050101.html

滑舌(かつぜつ)from NHK放送文化研究所。

對VocaListener而言,因為リン的音量比較大(嗓音比較強勁),所以其實配合度反而更好,因為VocaListener在設計上只判別音量和音高而已,所以純以波形吻合的觀點來說,リン/レン的性能超過ミク很多。

VIA+NVIDIA = Mini-ITX 2.0

http://pc.watch.impress.co.jp/docs/2008/0606/comp17.htm

PCIe x16スロットが必須な「Mini-ITX 2.0」を規定

~NVIDIAがその取り組みに賛同、普及へ協力

聽說是Computex會場的大新聞,不過合作主要的原因是因為Atom綁chipset,所以NVIDIA碰不到。

這回Mini-ITX 2.0強制放PCIe x16,主要就是為了讓NVIDIA的GPU有伸展的空間。

* プロセッサ:構成で電力効率に優れたx86プロセッサ

* メモリ:最低でも2GB以上のDDR2 SDRAM

* グラフィックス:DirectX 9をサポートした統合型GPU、DirectX 10はアドオンカードで対応

* ディスプレイ出力:1つ装備、HDMIはアドオンカードで対応

* オーディオ:6チャネル出力のために3つのオーディオジャック

* ネットワーク:1つのGigabit Ethernet

* ストレージ:SATA×2+PATA×1

* 周辺機器:最低で4つのUSB 2.0ポート

* 拡張スロット:PCI Express x16スロット

* サイズ:17×17cm

* 対応OS:Windows Vista(Premiumロゴ対応はアドオンカードで対応)、Windows XP、Linux(Ubuntu、SuSE Linux)、gOSなど

由於17×17是沒有改變的關係,其實2.0變成是硬體spec上的要求。

總之最大的重點仍然是在low-end平台上放充足的主記憶體和GPU,讓Crysis也算是跑得動的程度。

而如果有GPU的話,考慮CUDA的能力,會讓不少應用足以達成高規格PC平台的水準。

所以VIA算是希望能夠讓市場對CPU的性能需求因此大幅減緩,讓小型的省電CPU成為主流….Nano才有挑戰Intel的機會。

而工作就交給GPU作,讓還有提升空間的GPU市場繼續擴大,成為和NVIDIA雙贏的狀況。

反過來說,這也看得到NVIDIA被Intel和AMD逼得走投無路只好出此下策的窘境。

畢竟這回Intel Atom、AMD Puma和Mini-ITX 2.0,最大的差異就是「前兩者都是notebook平台」。

如果VIA在notebook上也要求裝MXM or 類似AMD XGP的connector就算了,問題是還沒有看到solution….

以目前Desktop市場萎縮的狀況來看,是蠻讓人懷疑現在這個平台到底有什麼號召力。

——

http://www.beyond3d.com/content/news/644

NVIDIA Gelato now free; merges with Mental Ray (+NaturalMotion)

放棄Gelato(免費化且不再繼續開發),全力衝Mental Ray的GPU版。

但是Gelato其實已經頗有成果,所以可以算是大紅包也說不定。

總之,NVIDIA正非常地小心它的金流運作效率,要集中每一份金錢在最重要的地方。

但是看了GT200的block diagram,實在讓人很懷疑他們這一年在幹嘛。

NVIDIA Tegra

http://pc.watch.impress.co.jp/docs/2008/0605/kaigai443.htm

NVIDIAの携帯機器向けメディアプロセッサ「Tegra」の狙い

第一印象上,Tegra看起來單純就是上一季公布的APX2500的高時脈擴充版….

不過應該和OMAP系列晶片在內建device上有點落差狀況一樣,Tegra整合的元件應該又更多了些。

其實很有趣的是,不論是在PC市場或者是在MID/SmartPhone市場,NVIDIA似乎都是打算選擇CPU最弱的solution:

handheld這邊:ARM11 vs Cortex-A8 vs Atom

PC這邊:VIA Nano? vs K8 vs Core MA

先前Atom剛推出的時候,記得水球說ARM現在最大的問題是被Atom擋住往高性能走的去路,雖然ARM本身其實也有Cortex-A8/A9這樣的強化core產品。

問題是NVIDIA則似乎希望把工作從CPU搬出來,幾乎把所有可以做的應用都加上了accerator,現在大概剩下…..application本身(Firefox?)了吧。

靠ARM11 MPcore規模的東西,有沒有辦法跑順Firefox呢?老實說Firefox3真的快很多,說不定表現會很精彩XD

如果web真的要硬體化的話,問題似乎是在flash能不能順暢地硬體化這點。不知道APX2500/Tegra系列是不是連CUDA都支援了,答案是肯定的話說不定就可以靠CUDA來解決也說不定。

只要ARM維持住在MID這個層級的優勢,那麼代表application accerator的方式成為主流,就很有可能讓NVIDIA在這個市場跟著爬起來。