Real-Time Ray Tracing with NVIDIA CUDA GPGPU and Intel Quad-Core
http://eric_rollins.home.mindspring.com/ray/cuda.html

測試用的是96sp的8800GTS,所以數據列成”12個”multi-processor。
基本上16KB的share memory還是太小了,所以物件一多就很悲慘。
此外,不太清楚對CELL optimize夠不夠好就是了_A_
[EDIT]
http://eric_rollins.home.mindspring.com/ray/ray.html
Real-Time Ray Tracing on the Playstation 3 Cell Processor
原始的CELL數據來源,由於只使用compiler來最佳化(IBM XLC compiler),上述的數據是在1024×564的解析度下,在10個球體與單一的光源下取得約22.5fps的性能數字,和IBM自家的iRT ray tracer有相當的效率差距。(iRT是在相當複雜的物件條件下,取得同等或更高的數據)
沒想到Core 2 Duo 可以這麼快…
連這種新聞都能拿去酸 PS3.. xDD 真是夠了 (*茶)
這與GameTomorrow的測試有點出路_A_
在GameTomorrow的測試中,
6SPE的成績與這次的CUDA是相當的…
真懷疑這次Cell到底有無最佳化,
而這次CUDA的測試進步真多_A_
話說Cell2,
也就是Cell eDP的正式名稱為”PowerXCell 8i”,
真是奇怪的名字…
從他的code來看,他應該完全用高階語言寫,沒有用到in-line asm….這樣的話SPE就是個比較小的浮點運算器而已,優勢就主要體現在和Core2的單一核心規模差異,也就是電晶體效率差異。
而Core2的核心比PPE還複雜許多…. XD
同規模底下的話,比較適合的對手大概會是32SPE CELL吧。
http://www.csm.ornl.gov/…_dod_112907_hofstee.pdf
這裡面有一張圖(page3)可以看到8SPE和其他CPU的規模比較。
> 話說Cell2,
> 也就是Cell eDP的正式名稱為”PowerXCell 8i”,
> 真是奇怪的名字…
所以32SPE CELL要叫做CELL3嗎XD
不太好吧XD
來個比較好的名字吧:Power7…. XD
>iRT是在相當複雜的物件條件下,取得同等或更高的數據
這意思是說IBM養的人都是變態嗎XD
>沒有用到in-line asm….
所以IBM的iRT有使用到asm _A_?
這該不會意味著PS3的最佳化也是?
>所以32SPE CELL要叫做CELL3嗎XD
目前暫時是這樣沒錯XD
http://www.ps3coderz.com/
從ps3coderz得知,
PPE會是以Power7為基礎的核心,
和Eji大之前與小弟告知的一樣,
而SPE居然還要重新設計某些小部份,
或者稱為小改良…_A_
主要針對以下二者:
reduce latency and improve bandwidth
這應該是為了應付更大、更快的記憶體吧?
還是說EIB太長了…XD
RoadRunner單純在講CELL的PPE太弱,所以要搭一個Opteron;然後為了Opteron和CELL的整合,弄了一個複雜的compiler stage出來….
不過其實這個compiler stage,觀念和Intel的PARROT很類似啊,所以當我們要把這個系統重新整合起來的時候,第一個會想到的就是把中間那個虛弱的PPE用正統的POWER7 core強化過…. XD
現在的問題主要是
1. 運算資源提升了,記憶體系統也得跟著提升,而提升的趨勢也包含了有效頻寬提升與延遲加長
2. 為了成本,繼續使用環狀bus的可能性仍高,而且會使用自動設計
所以SPE的MFC能力還要經過強化。