http://www.topscom.co.jp/technology.html
TOPSTREAM(TM)テクノロジー
http://techon.nikkeibp.co.jp/article/HONSHI/20090508/169818/
リアルタイムのレイ・トレーシング目指す,800TFLOPS相当の演算をマルチコアで
http://techon.nikkeibp.co.jp/article/HONSHI/20090629/172373/
800TFLOPS Multicore IC for Realtime Ray Tracing
750MHz、130M電晶體、45nm process,die size 17×17….
可是單晶片88TFLOPS(內部8個cluster) x9?
ray tracing專用?一個晶片100w總共1000w?
TOYOTA投下去了?這好不可思議啊。
似乎9个core全部是fixed-function。
这个晶片,看起来完全是可以民用化量产的级别。。
可是我看裡面的東西與其說是fix-func,倒不如說是針對用途作customize chip而已。
component本身是programmable的耶….
TOPSTREAM有讲到专用回路的效果,所以我理解为fixed function.programmable的部分还没有看到,因为不懂日文的缘故。。
http://techon.nikkeibp.co.jp/…29/172373/fig1.jpg
我想他說得專用回路並不是指fix function unit,而是針對工作去custom chip這件事情….
所以每個開發project最後做出來的chip構成、內部單元數量和bus寬度之類的會有落差,但是基本上看來是一堆programmable unit的合成。
不過作用一樣啦,雖然不是hardwired,但是轉換用途的時候,效率下降應該是很難避免。
它是針對光跡追蹤算圖的不同工作負載,
去設計專屬的可程式化執行單位.
雖然每個處理單位都是可程式化,
但應該不太適合做其它工作.
每一個處理單位性能都有差異,表示沒辦法像US架構
的GPU一樣把工作做硬體的負載平衡…..
這種東西應該只適合特定工作,
(萬一工作負載改變,就會發生工作量卡在其中一個部份,而其他可程式單位都被迫閒置….效率下降)
>>130M電晶體
應該是130M “Gate” ,
另一篇有說是1.3B電晶體(1 Core?).
這已經和GT280差不多大了
1個晶片有73個Core, 750MHz
9個這種晶片可並聯一起運算一個畫面(657 core?)
Well….其實你把800個RV740並聯起來,
理論上也是一樣有這麼高的浮點運算…..
跑光跡追蹤算圖可能沒這麼快,但是汎用性會更好.
>>1.3B電晶體(1 Core?).
1.3B電晶體應該是1 CHIP….
所以它用GT280差不多的電晶體
達到88Tflops的浮點運算能力.
>>ヘテロジニアス型コアを1チップに73個集積
這是指一個晶片就有73個異質核心.
不過圖上每個叢集只有8個異質核心,
8個叢集應該64個異質核心.
多出的數字應該是把叢集外的risc cpu也加進去.
看起來一整個複雜~不可能放到民用市場的架構.
> Well….其實你把800個RV740並聯起來
照理來講應該要和10個GTX280、或者20個RV740來比比較恰當….
不過反過來說,因為各個部份都有固定用途,所以即使programmable變更用途效率也是會下降。
某種意味上就和把GPU裡面的TMU、ROP都算進去,把浮點性能數字灌水衝上去有點異曲同工之妙….。