中國自己的CPU+GPU supercomputer

http://pc.watch.impress.co.jp/docs/column/kaigai/20091102_325517.html

フラットで自由度が高いNVIDIA Fermiのアーキテクチャ

結構洗練化。

—-

http://news.sina.com.tw/article/20091029/2308165.html

『天河一號』峰值性能1.206PFlops,LINPACK測試性能563.1TFlops@575MHz,超過2009年6月TOP500第四位。

http://www.lemote.com/bbs/viewthread.php?tid=26165

“天河一号”超级计算机配置图 [图]

沒用自家的CPU好像被拿來取笑就是了。


—-

http://www.realworldtech.com/page.cfm?ArticleID=RWT090909050230&p=2

Efficiency Data @ Computational Efficiency in Modern Processors

http://perspectives.mvdirona.com/2009/03/15/HeterogeneousComputingUsingGPGPUsAndFPGAs.aspx

Heterogeneous Computing using GPGPUs and FPGAs

http://perspectives.mvdirona.com/2009/03/15/HeterogeneousComputingUsingGPGPUsNVidiaGT200.aspx

Heterogeneous Computing using GPGPUs: NVidia GT200

http://perspectives.mvdirona.com/2009/03/18/HeterogeneousComputingUsingGPGPUsAMDATIRV770.aspx

Heterogeneous Computing using GPGPUs: AMD/ATI RV770

http://www.realworldtech.com/page.cfm?ArticleID=RWT090909050230&p=2

Zotac GeForce GT 220 1 GB

Performance per Watt

光比performance watt的話其實同製程的落差可能不大(和規模成比例),不過低階產品的面積因為非繪圖部份的比例變大所以會變差,比方說GT220的面積性能比大概只有Rade5870的1/2前後,要同產品線更大的晶片才能夠稀釋掉這個差異。

GT200/b當然光比DP的話和一般CPU沒兩樣,非動用混合精度programming才行;當然這邊為止都是理論規格直接除出來的數字,實際表現還要把工作性質與演算法都考慮進去。RV870在DP方面,不論耗電或者面積比應該都會超過RWT那張圖上的榜首RV770,剩下的就看Fermi和Larrabee實際的表現了。

RV770 276mm^2、1200GFLOPS SP、240GFLOPS DP

RV870 338mm^2、2700GFLOPS SP、540GFLOPS DP

Fermi ~466mm^2、1500GFLOPS SP、768GFLOPS DP(?)

(512sp x 1.5GHz x FMA)

老實說如果用FMA來算的話,Fermi可能只會比RV870好一點點。_A_

話說預料之內的是Sliverthome耗電量表現很好但是面積輸掉了,只是面積基本上不是絕對問題,因為建構成本的實際報價不單單被面積影響。使用者(買機器的人)通常要考慮的是耗電量(運作成本)沒錯,但是建構商才需要考慮面積(晶片生產成本)。

在〈中國自己的CPU+GPU supercomputer〉中有 1 則留言

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料