CUDA’s ray tracer打贏CELL?

Real-Time Ray Tracing with NVIDIA CUDA GPGPU and Intel Quad-Core
http://eric_rollins.home.mindspring.com/ray/cuda.html


測試用的是96sp的8800GTS,所以數據列成”12個”multi-processor。
基本上16KB的share memory還是太小了,所以物件一多就很悲慘。

此外,不太清楚對CELL optimize夠不夠好就是了_A_

[EDIT]
http://eric_rollins.home.mindspring.com/ray/ray.html
Real-Time Ray Tracing on the Playstation 3 Cell Processor

原始的CELL數據來源,由於只使用compiler來最佳化(IBM XLC compiler),上述的數據是在1024×564的解析度下,在10個球體與單一的光源下取得約22.5fps的性能數字,和IBM自家的iRT ray tracer有相當的效率差距。(iRT是在相當複雜的物件條件下,取得同等或更高的數據)

在〈CUDA’s ray tracer打贏CELL?〉中有 6 則留言

  1. 這與GameTomorrow的測試有點出路_A_
    在GameTomorrow的測試中,
    6SPE的成績與這次的CUDA是相當的…
    真懷疑這次Cell到底有無最佳化,
    而這次CUDA的測試進步真多_A_
    話說Cell2,
    也就是Cell eDP的正式名稱為”PowerXCell 8i”,
    真是奇怪的名字…

  2. 從他的code來看,他應該完全用高階語言寫,沒有用到in-line asm….這樣的話SPE就是個比較小的浮點運算器而已,優勢就主要體現在和Core2的單一核心規模差異,也就是電晶體效率差異。
    而Core2的核心比PPE還複雜許多…. XD
    同規模底下的話,比較適合的對手大概會是32SPE CELL吧。
    http://www.csm.ornl.gov/…_dod_112907_hofstee.pdf
    這裡面有一張圖(page3)可以看到8SPE和其他CPU的規模比較。
    > 話說Cell2,
    > 也就是Cell eDP的正式名稱為”PowerXCell 8i”,
    > 真是奇怪的名字…
    所以32SPE CELL要叫做CELL3嗎XD
    不太好吧XD
    來個比較好的名字吧:Power7…. XD

  3. >iRT是在相當複雜的物件條件下,取得同等或更高的數據
    這意思是說IBM養的人都是變態嗎XD
    >沒有用到in-line asm….
    所以IBM的iRT有使用到asm _A_?
    這該不會意味著PS3的最佳化也是?
    >所以32SPE CELL要叫做CELL3嗎XD
    目前暫時是這樣沒錯XD
    http://www.ps3coderz.com/
    從ps3coderz得知,
    PPE會是以Power7為基礎的核心,
    和Eji大之前與小弟告知的一樣,
    而SPE居然還要重新設計某些小部份,
    或者稱為小改良…_A_
    主要針對以下二者:
    reduce latency and improve bandwidth
    這應該是為了應付更大、更快的記憶體吧?
    還是說EIB太長了…XD

  4. RoadRunner單純在講CELL的PPE太弱,所以要搭一個Opteron;然後為了Opteron和CELL的整合,弄了一個複雜的compiler stage出來….
    不過其實這個compiler stage,觀念和Intel的PARROT很類似啊,所以當我們要把這個系統重新整合起來的時候,第一個會想到的就是把中間那個虛弱的PPE用正統的POWER7 core強化過…. XD
    現在的問題主要是
    1. 運算資源提升了,記憶體系統也得跟著提升,而提升的趨勢也包含了有效頻寬提升與延遲加長
    2. 為了成本,繼續使用環狀bus的可能性仍高,而且會使用自動設計
    所以SPE的MFC能力還要經過強化。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料