http://gametomorrow.com/blog/index.php/2007/09/05/cell-vs-g80/
well,IBM又拿他們的iRT來說嘴了XD
能不能拿些別的應用出來….XD
這篇是引用薩爾大學的 Philipp Slusallek教授拿G80作ray-tracing的論文,Stackless KD-Tree Traversal for High Performance GPU Ray Tracing的數據,與CELL跑iRT的比較。非常有趣的是,iRT的作者正好是 Philipp Slusallek的學生。
這完全就是重複當初RacingPHT兄自己做的Ray-Tracing demo on G80的狀況,只是當初是預估,這次是實際跑完。

從左至右:
2.6 GHz AMD Opteron – Saarland Ray-tracer
Nvidia GeForce 8800 GTX – Saarland Ray-tracer
Sony Playstation3 (partial 3.2 GHz Cell processor running Linux) – IBM iRT
3.2 GHz Cell Processor – IBM iRT
IBM QS20 Blade (Two 3.2 GHz Cell Processors) – IBM iRT
論文本身有提到因為Register footprint的關係,G80運作的效率並不高,有待CUDA本身的改善。
Although we believe a performance of over 16M rays/s to be already quite impressive for the CONFERENCE scene, we expected much higher performance: The G80 with its 128 scalar arithmetic units running at 1.3GHz should deliver over 160GFlops, meaning that tracing one ray costs about 10,000 cycles. We suspect the main bottleneck to be the large number of registers in the compiled code, which limits the occupancy of the GPU to less than 33%. Unfortunately, although the program requires much less registers, the CUDA compiler is not yet mature enough and cannot aid in reducing their count. An option would be to rewrite the whole CUDA code in PTX intermediate assembly.
16M rays/sec,考慮他們用的主要是scalar unit,至少應該有160GFLOPS,等於每個ray要跑10000cycles!不過即使是考慮33%的效率,仍與6SPE的CELL有相當的距離,更別提完整8SPE的CELL與內建雙CELL的QS20 blade,這應該與每個SPE都具備相對多數的register有關….然後IBM的人對Larrabee放話了。XD
iRT ray tracer已經於9/5開放下載。
http://gametomorrow.com/blog/index.php/2007/09/05/interactive-ray-tracer-irt-available-for-download/
下載位址為
http://www.alphaworks.ibm.com/tech/irt
內含有兩個demo scene,各為33萬3千個三角形的法拉利、以及六萬九千個三角形的史丹福兔寶寶。
在這兩個scene底下,PS3可以達到720p解析度下超過40fps。
PS3有6SPE、QS20有16個SPE之故,效能與SPE數量成線性關係,後者能達前者的2.5倍性能。
—-
說真的,來點別的應用吧。TGS07希望多點東西….
謠傳TGS07會有HOME for JP、firmware 2.0、新的線上AV服務、新定價策略與同捆包,甚至是FF7….


CUDA本身的改善到最好後,
G80的表現好像只能與6SPE的CELL持平,
而Cell方面則是能穩定工作於4GHz的話,
8SPE的Cell應該能做到60Frames/s吧^^?
其实我个人对CELL的看法是很正面的, 因为SPE确实是一个几乎可以无限扩充的东西。而其他的结构每扩充一次就需要进行结构上的调整。
我是覺得iRT大概短期內還只能當tech demo,不太容易當成有生產力的東西。
IBM 測過的東西其實還不少只不過目前 Cell 主要的競爭對像轉為 GPU(或是說在 IBM 的情況下會碰到的競爭對象),至於其他部分的測試其實也頗多的,只是要看用途或是測試的單位,日本那邊就有一票人閒閒沒事做在測這些東西發論文的,這當中有很多是 non game use 也有很多是目前看不出來有什麼利用價值的,當然也有些是可能會用在遊戲中的就是,不過說實話到現在還在測 cell 的應用意義可能不是很大了。
話說我又想到當年有人說 Cell 跑 ray tracing 不如 opteron850 的話了,同樣的東西不同人用結果實在會差很多 sigh…… 不管怎麼說要看 ray tracing 用在 遊戲上,我想還有很長的時間,畢竟目前的遊戲廠商沒一個敢跳進來玩這東西。
TGS 還有一段時間,或許到時我們會看一堆人在用嘴巴玩 buzz 或是用語音控制遊戲指令之類的,畢竟這些是 PSeye 上面那4個 mic 一開始設計的功用,至於是否真的有趣就要看個人了。