「Eji」的全部文章

兩篇Insomniac R&D分享

http://www.insomniacgames.com/tech/techpage.php
Insomniac R&D又丟新文出來了,這回是RFOM(抵抗)的引擎設計、還有SPU物理引擎的結合。

http://insomniacgames.com/tech/articles/0108/files/RFOM_Debriefing_public.pdf
Resistance: Fall of Man Debriefing

非常讓人意外地,抵抗其實用了5個SPE;不過這是因為SPURS尚未完成的關係,結果工作不能共享SPE,或者說不能多工….結果實際上就是SPE用得多,但是總計的利用率很低。
然後他們發現1280×704、2x MSAA、上下留空8pixel會是sweet spot,但是也來不及用在抵抗上。

http://www.insomniacgames.com/tech/articles/0108/files/CombinedSpuPhysics.pdf
Insomniac and SCEA Talk SPU Physics

解釋了R&C6用到的SPU物理系統;並且提到SPURS的設計很適合和PPE based的物理引擎作交互移植,算是對Windows/XBOX360平台的developer招手?

—-
http://www.neogaf.com/forum/showpost.php?p=9414174&postcount=476
ProFX後來更新了一些數據上來,指出他們的procedure texture SDK在PS3上跑的效率。
http://www.profxengine.com/
同一個demo的材質產生時間:
PS3 – 1.2秒
8800GTS 5秒
XBOX 360 10秒

不過其實既然要這個產生時間,那就是代表運作期間還是會吃那塊記憶體吧。

老文:David Kirk 在東京大學的Tesla/GPGPU相關演講

http://journal.mycom.co.jp/articles/2007/09/13/nvidia/index.html
“GeForceの父” David Kirk博士、東大で並列コンピューティングについて講演

這篇的重點有:
1. 每個Shader Multi-processor(SM)有768個thread、8個SP、每個TPC有兩個SM、所以總共有12288個data-thread可以on-the-fly執行。
2. 每32個data-thread組成一個warp,只要以這個單位來切換,就可以達到無延遲。
3. 每個SM有自己的share memory。(G80是16KB)

其次是CUDA programming的技巧
4. programmer可以設定grid,每個grid則由1~512個block來組成。
5. 每個block內部的資料可以以1~3次元的方式排列,這個block稱為Cooperative Thread Array(CTA)。

到這邊已經很清楚了:這樣一段一段的把資料結構切出來,就是希望programmer替GPU做好data的localize。
這樣的話每個SM對每個CTA進行處理,SM的share memory也只以CTA內部的單位來處理,理論上只要CTA有設好 = localize有做好,就不會有太多cache miss。
然後等到要進行記憶體存取的時候,就會發生latency,這時則把整個CTA(data set)給卸載換掉,來確保GPU維持滿載。

所以,實際在寫CUDA程式的人,除了上述的要點之外,不需要再深入顧忌GPU實際上的結構;
或者說,上面的要點實際上就是G8x這個GPU最終的可擴充範圍。
在ISA固定(保留擴充性前提)的狀況下,CTA的資料結構固定住之後,接下來NVIDIA只要擴充SM & TPC的規模即可。
可以增加shader processor數量與增設指令、增加share memory容量、增加TMU數量與功能(G9x已經做了)….在這些範疇內都還算是G8x的結構延伸。

於是在維持CUDA相容性的狀況下,其實還是有很多東西可以增補,調整。
為了培育CUDA的軟體資源,NVIDIA短期內的GPU結構變化,大概是離不開「TPC內部的擴充」、和「GPU總TPC數量的擴充」這兩項了。

當然這樣講的話,好像GPU就只剩shader變化一樣,只是shader之外的變化其實真的就不容易看出來,因為大家也不知道shader以外的繪圖技術進展會朝向什麼方向。
比方說NVIDIA資助發展的Logarithmic Shadow Maps,讓shadow map的效率進一步提升,而只需要Triangle Setup Engine支援對數值域即可,這不是研究的最尖端本來就很難知道。

http://www.xbitlabs.com/articles/video/display/radeon-hd3870-hd3850.html
Xbit針對RV670與G92/G80的benchmark。

可以看出G92相對於G80的底層還是有很多改善….比方說分支性能就有改善。

EOJ 機神叛亂 Set.2 資訊公布

http://www.watch.impress.co.jp/game/docs/20080126/teoj.htm
新クリーチャーとスペル、共に約100種類を追加!
SCEJ、PS3「THE EYE OF JUDGMENT BIOLITH REBELLION ~機神の叛乱~ SET.2」

Set.2是下載販售only,3/27、售價3500yen,共增加約100張卡,卡片同時由TAKARA發售。
由於仍是攝影機必須,所以可能還是要放set.1的光碟;夏天的時候會放Set.3,價格同樣是3500yen;
收錄Set.1~Set.3的合輯遊戲會採實體媒體,目前價格和上市時間未定。

雖然說以擴充實境(Augmented Reality)來當成號召,不過畫面要漂亮的話解析度就要高、不然就是畫面上”現實”的成分要減少(畢竟640×480的畫面放大到HD很拼)….
EOJ的好處是卡片遊戲本身做得不錯,所以卡片本身耐玩的話其實就能繼續賣。

IBM快看不下去了嗎

http://www.techpowerup.com/?50655
IBM May Create More Formal Chip Manufacturing Ties With AMD

可能是合資公司,可能是股權取得等等,總之IBM可能會對AMD有動作。
反正AMD和IBM現在關係真的不錯;而且IBM的製程如果要有進展,透過AMD的x86產品線來累積經驗幫助也很大。
所以現在AMD不能真的倒下去….這個新聞成真的話也許會讓AMD度過難關?

另外一個是AMD的Bulldozer(K11)….
似乎透過SSE5的指令(?),可以做到不同core的FPU(含CPU & GPU core)連動,來加速運算。
不過這樣控制大概會複雜到爆,不知道打算怎麼處理。

9800GX2 benchmark form VR-Zone

http://www.pcgameshardware.de/?article_id=629502
[vr-zone.com] Nvidia GF 9800 GX2: 13% mehr Spiele-Fps als GF8800 Ultra? Neue Benchmarks und Bilder

雖然德文看不懂_A_
不過以跑分來說,98GX2看來沒比88Ultra好多少。

當初在6800Ultra推出後,7800GTX也是跑分沒好多少、但是整體的”容量”(比方說開AA/AF之後的下降幅度)改善;7950GX2也有這種傾向。
如果Driver能夠達到實用化的程度,表現應該是會不錯的。

另外一個有趣的是98GX2的layout,現在看來算是把7950GX2的上層PCB給整個反轉過來。
也讓風扇從兩個小的變成一個大的,PCB看來是固定在風扇上頭。
這樣散熱應該會有所改善?

最後,9800GX2用的Bridge似乎是NF200,也就是BR04。

把 User 投稿認定為公式廣告的角川Youtube參入計畫

http://www.itmedia.co.jp/news/articles/0801/25/news044.html
「ユーザー投稿角川アニメ」の公式認定も YouTubeに角川参加

http://www.watch.impress.co.jp/av/docs/20080125/kadotube.htm
角川グループ、公式アニメ配信など、YouTube上で新規事業発表
-90%の精度で問題動画自動検出。「認定もする」

http://internet.watch.impress.co.jp/cda/news/2008/01/25/18237.html
YouTubeの投稿動画に角川が”認証マーク”、削除せず広告に活用も

「1話を全て掲載するというのは問題があるが、製作者の中には、作品の一部を使った投稿動画でも、面白いと言ってくれる人もいる」(角川GHD IR・広報室 柿澤史行課長)
そのため、角川GHDでは、リファレンスと一致する動画を違法動画として一方的に削除していくのではなく、「YouTubeを有益なWeb2.0型CGMと位置付け、著作権に配慮しながら連携していきたい」という。

簡單講,角川算是承認Youtube先前提出的著作權保護工具有效,所以只要是user上載的動畫被辨識為與公式內容相同,就「認定為公式」,然後Youtube就會在該user投稿動畫的頁面上放廣告,進而把廣告收入以比例回饋給角川,也就是公式認定「User替角川打廣告」的動作。

此外,角川除了2月開始自有channel之外,也開始試圖從上載MAD作者等來源,來挖掘有才能的creater。

—-
這算和JASRAC相比完全不同的出發點。XD

DMC4 demo capture

http://d.hatena.ne.jp/yoda-dip-jp/20080124#1201180252
Devil May Cry 4 簡易比較
http://d.hatena.ne.jp/yoda-dip-jp/20080126#1201180252
簡易比較2

PS3有個很怪的2 frame blending…. XD
這算是motion blur嗎?360沒有做這種動作。
以motion blur來說,這種作法品質應該是高不起來;而且60fps的話好像也不知道為什麼要這樣做motion blur。
也因為這樣,除了特定的反光狀態下看得到鋸齒之外,大部分狀況沒有鋸齒,這也難怪會被人家罵是掩飾了….

完全靜止狀況的話,材質應該是沒有差異;說有些骨架數量有差異,但是該文前述的明暗狀況也應該考慮進去。
話說yoda-dip-jp是架在自己家裡的,所以要是Router當掉就看不到圖了XD

—-
開發以PS3為基礎的話,就說PS3拖累360的劣化;結果變成PC為基礎朝Console移植。
其實說真的大半是立場而不是實際品質的差異啊_A_

http://www.watch.impress.co.jp/game/docs/20071218/dmc4.htm
所以CAPCOM的人發言是”模型與材質都相同”….

let’s talk about 奔奧天堂

http://forums.modojo.com/showthread.php?t=153676
Burnout paradise programmers sets the record straight

http://www.criteriongames.com/podcast/crashfm_15_080111.mp3

要點摘錄:
– says how funny it is to see guys on msg boards using more tech talk than actual game programmers.
– 360 development has pushed more earlier from having the same tools as the xbox used where as ps3s is all new.
– the 360 gpu is NOT more powerful than the ps3s gpu. and CELL pushes the graphic abilities well beyond.. points to uncharted.
– both 360 and ps3 has its strengths and weakness.
– Bad ports on PS3 are developers fault. not exactly the developers are bad but more to do with dead lines and late ps3 dev kits.
– DISK MEDIA speed can be the same but using different techniques.
– DVD DISK SPACE is a hindrance!
– dont listen to anyone on msg boards! lol
– msg board users pick strange things to moan about.
– says you can say anything about console performance.. goes on to say that he could right code that would perform better on ps2 than ps3.
– buy both consoles
– says little sister is going to buy a pink DS
– 360 not having a standard HDD is a problem. but not a total deal breaker. can be worked around.
– had to force programmers to work on PS3 because they all wanted to work on 360 instead.
– the two machines are graphically comparable when you combine the SPEs to do graphics work on the PS3 with the GPU.
– reading DVD data is faster on the outside of the disc (vs. blu ray) and slower on the inside.
– Bottleneck wasn’t really the size of the discs (contrary to what Oron said)
– Don’t read the blogs, go by what games are better or what your friends got [sic].
– they prefer sixaxis over 360 controller
– pink PSP and pink DS sold quite well actually
– Hopes sony will bring out a tiny dinky PS3 like they did with the flat PS2
– There are lots of SKUs, don’t really matter except 360 not all having an HD, but they work around it.
– can easily argue one system is better than the other, but it’s simply not true.
– So much more power to be unlocked in both consoles than they got in Burnout Paradise.
– lots of british phrases like ‘bits and bobs’
– iTunes made iPod, is the de-facto standard.
– please keep posting what’s better, it’s comedy gold (to paraphrase)
– send questions to mailbag@criteriongames.com

一言:RenderWare真好用….XD

對描いてみた的疑惑與解答

http://www.nicovideo.jp/thumb/sm2117772
繪製過程擷取類的動畫看起來都非常的猛….

話說,網站上的繪圖版雖然大多有step log,但是如果是繪圖軟體的話就只好用擷取軟體了。
而上次看到網野コハク的擷取過程,總覺得好像會需要很可怕的硬體;但是這個動畫解決了很多疑惑。

使用軟體:カハマルカの瞳
【著作権者】 MilBesos Co. 氏
【作者ページ】http://www.paw.hi-ho.ne.jp/milbesos/
注意的是,這個軟體只能擷取”無壓縮”的動畫,所以高framerate下顯然會相當吃硬碟。

1024×768 x 25% -> 512*386,1fps
這個設定下45分無壓縮擷取約2GB,9小時18分28秒的繪製過程總計26GB。
使用硬體:Pentium4 3.0E、2GB memory,作者本人認定繪製過程順暢。
上載影片:VP6-2pass[654.4kbits/s]画[594kb/s]音[56kb/s],總長度6分32秒,動作倍速約為100倍。

也就是說,其實關鍵在於:
既然本來就要上載實際繪製動作數十倍速的影片,那麼擷取的時候其實也只要擷取很低的framerate就好了…. (倒地)
怎麼現在想想很粗淺的miss….orz

另外,作者完全沒有使用圖層,也只使用鉛筆工具,這些手法雖然應該是繪圖板cgi(作者常用的是Paintchat,http://www.cdegroot.com:18000/)訓練出來的,但是這也有助於抑制記憶體消耗。

成品:PIAPRO
http://piapro.jp/a/content/?id=cehs48la94olplkn
くろーばー

http://chinchickrin.sakura.ne.jp/
作者個人網站:珍竹林(Chin-chick-rin)

—-
所以現在回過頭來看網野コハク:

http://www.nicovideo.jp/thumb_mylist/2713163

最大解析度的是4678×3366 (+PV ver0.01),播放倍速為30~35倍,動畫時間都在10分鐘左右,所以最後的11分1秒實際上大約是六小時左右。
影片中動作的數量顯然沒有100倍播放來得誇張,所以1fps擷取達到這個影片的效果應該沒有問題。

結論:既然是512×384的1fps無壓縮擷取,對目前一般主流的機器來說,其實應該負擔不會有想像中那麼大。_A_