TOPSTREAM

http://www.topscom.co.jp/technology.html

TOPSTREAM(TM)テクノロジー

http://techon.nikkeibp.co.jp/article/HONSHI/20090508/169818/

リアルタイムのレイ・トレーシング目指す,800TFLOPS相当の演算をマルチコアで

http://techon.nikkeibp.co.jp/article/HONSHI/20090629/172373/

800TFLOPS Multicore IC for Realtime Ray Tracing

750MHz、130M電晶體、45nm process,die size 17×17….

可是單晶片88TFLOPS(內部8個cluster) x9?

ray tracing專用?一個晶片100w總共1000w?

TOYOTA投下去了?這好不可思議啊。

在〈TOPSTREAM〉中有 8 則留言

  1. 似乎9个core全部是fixed-function。
    这个晶片,看起来完全是可以民用化量产的级别。。

  2. 可是我看裡面的東西與其說是fix-func,倒不如說是針對用途作customize chip而已。
    component本身是programmable的耶….

  3. TOPSTREAM有讲到专用回路的效果,所以我理解为fixed function.programmable的部分还没有看到,因为不懂日文的缘故。。

  4. http://techon.nikkeibp.co.jp/…29/172373/fig1.jpg
    我想他說得專用回路並不是指fix function unit,而是針對工作去custom chip這件事情….
    所以每個開發project最後做出來的chip構成、內部單元數量和bus寬度之類的會有落差,但是基本上看來是一堆programmable unit的合成。
    不過作用一樣啦,雖然不是hardwired,但是轉換用途的時候,效率下降應該是很難避免。

  5. 它是針對光跡追蹤算圖的不同工作負載,
    去設計專屬的可程式化執行單位.
    雖然每個處理單位都是可程式化,
    但應該不太適合做其它工作.
    每一個處理單位性能都有差異,表示沒辦法像US架構
    的GPU一樣把工作做硬體的負載平衡…..
    這種東西應該只適合特定工作,
    (萬一工作負載改變,就會發生工作量卡在其中一個部份,而其他可程式單位都被迫閒置….效率下降)

  6. >>130M電晶體
    應該是130M “Gate” ,
    另一篇有說是1.3B電晶體(1 Core?).
    這已經和GT280差不多大了
    1個晶片有73個Core, 750MHz
    9個這種晶片可並聯一起運算一個畫面(657 core?)
    Well….其實你把800個RV740並聯起來,
    理論上也是一樣有這麼高的浮點運算…..
    跑光跡追蹤算圖可能沒這麼快,但是汎用性會更好.

  7. >>1.3B電晶體(1 Core?).
    1.3B電晶體應該是1 CHIP….
    所以它用GT280差不多的電晶體
    達到88Tflops的浮點運算能力.
    >>ヘテロジニアス型コアを1チップに73個集積
    這是指一個晶片就有73個異質核心.
    不過圖上每個叢集只有8個異質核心,
    8個叢集應該64個異質核心.
    多出的數字應該是把叢集外的risc cpu也加進去.
    看起來一整個複雜~不可能放到民用市場的架構.

  8. > Well….其實你把800個RV740並聯起來
    照理來講應該要和10個GTX280、或者20個RV740來比比較恰當….
    不過反過來說,因為各個部份都有固定用途,所以即使programmable變更用途效率也是會下降。
    某種意味上就和把GPU裡面的TMU、ROP都算進去,把浮點性能數字灌水衝上去有點異曲同工之妙….。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料