「Eji」的全部文章

Tukwila概要公布

http://pc.watch.impress.co.jp/docs/2008/0208/kaigai418.htm
Intel最大のモンスターチップ「Tukwila」の概要が明らかに

這個65nm製程、電晶體數2050M、die size 700mm^2的超級大怪物,是IA-64第一個native Quad-Core。
但是有趣的是,以後藤老爹畫的圖來說,離開了IA-64 CPU core之後,外面的記憶體控制器、Inter-connection等等,就幾乎和Nehalem如出一轍。

IA-64在Tukwila之前都還是南北橋、記憶體控制器外掛的設計;這次核心沒有大變化,但是透過記憶體控制器內建、QPI實作的機會,一口氣把I/O性能大幅提升,記憶體頻寬大了六倍,總共有4channel的FB-DIMM(4.8Gbps x 4);值得注意的是Nehalem-EX似乎也是這樣實作,只是在主機板上裝了Mill Brook晶片(memory buffer chip),把FB-DIMM的介面轉回DDR3 RDIMM。由於Mill Brook是每個晶片2ch,Nehalem-EX會變成8ch DDR3的大怪物。

Tukwila也是第一個實作QuickPath Interconnect(QPI)的CPU產品,總共實做了4條full-width、2條half-width的QPI,只是時脈只設定在規格半速的4.8Gbps;看這些後藤老大推算的數字來說,會發現Tukwila的對外界面不僅全面序列化,並統一在4.8Gtps的數字上,由於system logic的運作時脈是2.4GHz的關係,這樣整體同步會比較簡單;在die photo上的大小大約是123mm^2、電晶體數是39M,幾乎就接近兩個CPU核心的規模,也就是說,CPU上I/O成長的速度比CPU要大上許多….這點GPU也不例外。

後面後藤老大分析了Tukwila的設計走向曲折過程,簡單地講,Tukwila維持ILP強化的路線,沒有透過縮減CPU core規模來增設更多CPU的方式強化性能、也就是避開了強化TLP的路線,主要的原因是為了現有的軟體資產,所以Intel以強化傳統IA-64結構上的弱點,也就是I/O面上,來做整體的強化,因而造就了超巨大的CPU;當然這是Server市場的產品,其實成本就算是200~300usd,CPU本身一賣就是兩千美金,其實也沒差….

這點則和CELL、G80等針對TLP強化的晶片有所差異。
一概而論本來就不適合沒錯,不過其實好像也可以這樣簡化地看:

CELL沒有過去軟體的包袱,設計其實是偏向一個輕易可擴充的DSP系統(還包含了省電元件的採用、自動迴路設計等等方針),所以朝向TLP的方向走;GPU主要的軟體資源由於透過API虛擬化的關係,所以底層的設計細節可以有一定程度的掩蔽,G80更利用這個方式,透過CUDA的架構,把SIMD的結構隱藏在Scalar的表層底下;而CPU大概就不容易這樣走….

但是不管核心的怎麼性能強化,I/O沒有跟著強化自然是快不起來….

偏偏I/O強化就會遇到先前45nm CELL的時候討論到的問題:analog相關的部分在製程上縮小比其他部分困難,結果就是I/O周圍的成本比例上提升得會比其他的數位邏輯部分、或者是記憶體快。

然後就看到這個….
http://www.fudzilla.com/index.php?option=com_content&task=view&id=5605&Itemid=1

基本上G80和R600相比,記憶體頻寬明明比較小,但是記憶體控制器從hotball老大的心得來看,和CELL SPE的MFC/DMA contorller一樣可以吃非常多的outstanding request,延遲雖然明顯拉長(G8x約500cycle前後、CELL約1000cycle前後),但是透過結構(multi-threading or 大量register)可以吸收掉。

如果考慮分支的大小(32pixel per warp,但是執行卻是以half-warp為單位),G80的ALU很可能是double-pumped,8個SP很可能其實是double-pumped的4D,整個G80就變成只有”64個1D shader”了。從這角度來看,ALU占的規模很小,吃的主要還是register file和內部的fabric…..然後G80做得比R600徹底,剩下的就是倍速shader帶來的差異了。

所以如果RV770真的要在最小變更下把RV670給加快,可能就只有加上倍速shader了吧….不過NVIDIA目前下一代(G100? GT200?)似乎還是打算做超強的單晶片,這和宣稱要用四個RV770拼起來的R780似乎又有一點路線上的差距;另外一個敵人是從HPC市場圍堵GPU往GPGPU發展的Larrabee,這邊大概規模也小不下來。

總之超大型晶片現在是越來越難生了….

ISSCC08:45nm CELL

http://pc.watch.impress.co.jp/docs/2008/0206/kaigai416.htm
ISSCCに次世代Cell B.E. 45nm版が登場
~6GHz動作、電力を30%以上削減

電力消耗減很多(65nm,SPE和PPE本身的大小都有縮減(45nm SPE剩下90nm版的43.9%、65nm版的58.5%;45nm PPE剩下90nm版的42.1%、65nm的57.7%),從後藤老爹的對比圖來看,EIB的分布也有變化。

但是FlexIO和XDR的I/O邊沒辦法減,結果變成die size有浪費的空白部分….
這就是CELL的die size沒有顯著變化(45nm版縮小到90nm版的48%)的理由_A_

而且這種傾向也有在其他晶片上看到:總之就是analog、I/O部分很麻煩。

和這相比,JASRAC還算好人呢

http://yro.slashdot.org/yro/08/02/05/015231.shtml
RIAA Wants Songwriter Royalty Lowered

“Lest there be anyone left who believes the RIAA’s propaganda that its litigation campaign is intended to benefit the ‘creators’ of the music, Hollywood Reporter reports that the RIAA is asking the Copyright Royalty Board to lower songwriter royalties on song file downloads, from the present rate of 9 cents per song – about 13% of the wholesale price – down to 8% of wholesale. Meanwhile, the big digital music companies, such as Apple, want the royalty rate lowered even more, to something like 4% of wholesale. So any representations by any of these companies that they are concerned for the ‘creators’ of the music must henceforth be taken with a boxcar-load of salt.”

目前的商業型態是以通路商為主體,所以通路商的發言權就是一切….
現在作曲者得到的權利金大約是13%(9cents per song),RIAA要求降到8%;Apple乾脆要求降到4%。

相比之下JASRAC還算好的…. _A_

NVIDIA併購Ageia

http://www.nvidia.com/object/io_1202161567170.html
PhsyX now available in Green

現在的問題是PhsyX API到時候多出個GPU版之後,會不會把PhsyX PPU硬體支援給割捨掉….

[EDIT]
X-bit labs的相關訪談:
http://www.xbitlabs.com/articles/editorial/display/ageia-acquisition-interview-2008.html

話說NVIDIA給Intel的SLI果然少半截…. _A_|||||||

ゲーマー向けデュアルGPU&SLIソリューション「Skulltrail」の可能性を探る – 4Gamer.net
インテルの次世代最高級プラットフォーム「Skulltrail」で「8コア」の破壊力を知る – ITmedia+D
IntelのデュアルプロセッサPCプラットフォーム 「Skulltrail」- PC Watch
究極のDual Quad-Coreの実力拝見 – マイコミジャーナル :前編後編

結果放上去的NVIDIA Bridge,「NVIDIA 100」晶片上的編號是BR03….不是BR04(NVIDIA200)。(我一直以為是後者_A_|||||)
Skulltrial放了兩顆BR03,讓Seaburg的兩條PCIe 2.0 x16,轉換成四條PCIe 1.1 x16;但是因為BR03印象中只有PCIe 1.1….所以這大概代表非NVIDIA的chipset、想要有SLI就會變成只有PCIe 1.1可用。

然後BR04則是上下行都是PCIe 2.0,但是因為680i只有PCIe 1.1的關係,實質上用680i + NV200構成的780i也是只有PCIe 1.1。
當然對SLI來說,只要確保GPU間的頻寬足夠就可以了,而最近的演變中,上行頻寬的需求其實還沒有凸顯出來….所以實質上的表現應該不會差太多。
(這可以從7900GX2變化成7950GX2猜到)
反正BR03和BR04的內部結構都一樣是48lane的PCIe switch,差異主要就是PCIe 1.1與PCIe 2.0。

以我自己的看法來說,BR04的實際用途應該是為了支援x16+x8+x8的3slot模式、與四組x8的模式。(BR04的下行支援超過兩個方向,這個功能不清楚BR03有沒有)
以前者來說,這樣就可以達成單卡3way SLI(雖然聽起來很蠢),並且兩個副GPU都確保了連到主GPU的完整頻寬;後者則比較適合主機板上擴充頻寬使用。

不過,如果單GPU的規模也能夠拼到250w TDP的話,或許其實和單卡3way SLI沒什麼差異。
GT200 thermal design power (TDP) is 250W – Fudzilla

所以這回又是遷就哪邊?

http://gamereviewsblog.com/?p=87/confirmed-devil-may-cry-4-running-at-640p-on-xbox360ps3

PC version will supports DX9 and DX10 versions.
The PC version support higher resolution.
(In order to maintain stability in the game at 60 FPS, XBOX360, PS3 supports only 1024 * 640 resolution).

不過我覺得很不解的是,PS3的SDK提供的upscale功能,其實是為了讓3rd party願意做1080i/p模式….
所以提供的功能是1440×1080、960×1080等橫向放大….所以這邊說PS3″也是”640p,我是覺得很懷疑。
(上一款被這樣講的好像是COD4)

—-
[EDIT]
http://forum.beyond3d.com/showpost.php?p=1120810&postcount=33

DMC4 demo
720p AA 2x for the two version, very similar version on every feature
(Quaz51)

所以兩個Demo都是720p;不過兩個都有2x AA?

http://forum.beyond3d.com/showpost.php?p=1089950&postcount=689
順便翻出COD4比較。

http://www.n4g.com/NewsCom-107425.aspx?CT=1
DMC4 PS3 install time 22min…. 上一個這樣的遊戲好像是RR7。
以結論來說,安裝時間可能要不安裝玩很久才補得回來;不過老實說安裝一次之後都不必loading是比較好的做法,這種時間集中起來對玩家而言也比較好處理,而偶發的loading time體感起來會很煩。

nico的comment限制

http://hatunemikumikurabu.blog17.fc2.com/blog-entry-60.html

これによると2月1日のメンテナンスより事前告知無く
ニコニコ動画における2分30秒未満の動画が100コメントに制限された模様
さらにその後運営からのお知らせも無し

所以みっくみく因為總長1:39的關係當然也會遇到這個限制。
歌詞就用掉21行了,剩下的79行自然能做的事情變得很少…. 難怪一堆動畫看起來都變得比以前寂寞許多。
ロイツマ系也跟著全滅,還有half-size的曲子,3DPV(尤其是PV系因為製作時間的關係,half-size為多)也幾乎都無法倖免。

實質的限制:2:30以下是100個comment、2:30以上是1000個comment。

http://www.nicovideo.jp/thumb/sm1728993http://www.nicovideo.jp/thumb/sm1924663

可以想像的問題:

1. 職人系的運作變得困難(不只是圖案、字幕和歌詞也很可能在相對短很多的時間內被推走)
2. 荒らし惡化(一個人就可以輕易洗板),彈幕類的行為不論出發點全部可能造成不便

此外,ニコニコ新申請帳號的歡迎畫面所介紹的人氣動畫,主要介紹的作品有陰陽師、ゴム版的億千萬、組曲等三個。
不知道是不是因為上述的限制(主推時間較長的動畫),所以把みっくみく給除外。
這會讓人思考現在ニコニコ的系統負擔是哪方面比較大….

1. 動畫、還是comment? <–(動畫已經有低頻寬模式來處理,但是comment無論如何都得要refresh)
2. 切換overhead,還是storage本身的負載?

總之沒有更仔細的統計資料很難看出來,不過comment相關的系統負載很可能大到驚人。

——-
http://vocaloid.blog120.fc2.com/blog-entry-691.html

結果是閱讀性問題….orz
旁邊的comment viewer開同步捲軸就好啦?Orz

AquesTalk 語音合成引擎

http://www.a-quest.com/aquestalk/

AquesTalk (Win版)は、テキスト情報を音声波形に変換出力する Windows上で動作する規則音声合成ライブラリ(DLL)です。
独自開発の音声合成エンジンにより、滑らかな聞き取りやすい音質と自然なイントネーションを実現しています。
また、営利、非営利にかかわらず無償で使用でき、製品に組み込んで販売することも可能です。

sample聽起來蠻不錯的XDa
而且系統負擔小到誇張….

輸入規格:平假名
輸出規格:WAV(8KHz、16bit PCM MONO)
聲種:女聲x2、男聲x2、其他4種
介面:C語言函數呼叫
ROM:約100KB(Code + Data)
RAM:8KB(最小構成)
處理量:25MIPS

Windows:Free
Linux:Licence 15,750日幣 per CPU *:以socket為單位,多核心CPU算1CPU;虛擬化OS的話,每一份OS各計費一次。

MICRO TALK規律語音合成LSI:
http://www.actbrain.jp/development/inhouse/index.html

由於上述的引擎關係,這顆晶片不需要外部語音ROM,只需要文字檔輸入介面(EEPROM、serial port等),單次通信語音最大256個假名;64kbit ROM最大可儲存4000字假名。

朝日新聞初音ミク介紹文正式出刊

asahi
認真文出現了。_A_

朝日新聞記事「電子の歌姫」舞い降りる その1
朝日新聞記事「電子の歌姫」舞い降りる その2

http://jp.youtube.com/negiroll
刊載曲整理

http://www.nicovideo.jp/thumb/sm1274898http://www.nicovideo.jp/thumb/sm1510801http://www.nicovideo.jp/thumb/sm1204327http://www.nicovideo.jp/thumb/sm1336409http://www.nicovideo.jp/thumb/sm1181424http://www.nicovideo.jp/thumb/sm1587618http://www.nicovideo.jp/thumb/sm1783839http://www.nicovideo.jp/thumb/sm1460957

吉松隆:「人の創造の原点はこういうものだったと思う」。
從TBS的惡意到現在,真是五個月的奇蹟…. _A_

—-
雖然偷偷把福田康夫總理的檢索率放進去這點有爭議…. _A_|||||

補充:
http://d.hatena.ne.jp/colorred/20080204

當日記者於2ch發言。

それから皆さん、記事を読んでいただいてありがとうございます。
お察しの通り、「みっくみくにされて」ますよ。
(「ミク廃」という言葉があるのは知りませんでしたが)
どうかこれからもすばらしい作品を作り続けてください。
ありがとうございました。

いい人だXD

大亂鬥!!

結果看來是WiiKey無法讀取雙層的問題….弄成單層的ISO就可以順利執行了。
也就是說實質上的防拷手段與銀河瑪莉歐相同嗎?

這個影片的うp主宣稱成功dump雙層image。

[EDIT]
http://nekokabu.s7.xrea.com/blog/2008/02/post_34.html
補充來源與工具

—-
由於是雙層片的關係,可能因為積塵增加讀取錯誤的機率。
所以官方針對正版片無法讀取的狀況提出公式見解與support通知:
http://www.nintendo.co.jp/wii/rsbj/info.html
不過也有人懷疑原因沒這麼單純啦…._A_

從NGC的小片DVD,累積到現在的雙層DVD,讀取時間也延長….
也就是說,即使是SD的環境,隨著遊戲內容的強化,仍然需要一定程度容量的儲存媒體。