http://pc.watch.impress.co.jp/docs/column/kaigai/20091102_325517.html
フラットで自由度が高いNVIDIA Fermiのアーキテクチャ
結構洗練化。
—-
http://news.sina.com.tw/article/20091029/2308165.html
『天河一號』峰值性能1.206PFlops,LINPACK測試性能563.1TFlops@575MHz,超過2009年6月TOP500第四位。
http://www.lemote.com/bbs/viewthread.php?tid=26165
“天河一号”超级计算机配置图 [图]
沒用自家的CPU好像被拿來取笑就是了。
—-
http://www.realworldtech.com/page.cfm?ArticleID=RWT090909050230&p=2
Efficiency Data @ Computational Efficiency in Modern Processors
http://perspectives.mvdirona.com/2009/03/15/HeterogeneousComputingUsingGPGPUsAndFPGAs.aspx
Heterogeneous Computing using GPGPUs and FPGAs
http://perspectives.mvdirona.com/2009/03/15/HeterogeneousComputingUsingGPGPUsNVidiaGT200.aspx
Heterogeneous Computing using GPGPUs: NVidia GT200
http://perspectives.mvdirona.com/2009/03/18/HeterogeneousComputingUsingGPGPUsAMDATIRV770.aspx
Heterogeneous Computing using GPGPUs: AMD/ATI RV770
http://www.realworldtech.com/page.cfm?ArticleID=RWT090909050230&p=2
Zotac GeForce GT 220 1 GB
Performance per Watt
光比performance watt的話其實同製程的落差可能不大(和規模成比例),不過低階產品的面積因為非繪圖部份的比例變大所以會變差,比方說GT220的面積性能比大概只有Rade5870的1/2前後,要同產品線更大的晶片才能夠稀釋掉這個差異。
GT200/b當然光比DP的話和一般CPU沒兩樣,非動用混合精度programming才行;當然這邊為止都是理論規格直接除出來的數字,實際表現還要把工作性質與演算法都考慮進去。RV870在DP方面,不論耗電或者面積比應該都會超過RWT那張圖上的榜首RV770,剩下的就看Fermi和Larrabee實際的表現了。
RV770 276mm^2、1200GFLOPS SP、240GFLOPS DP
RV870 338mm^2、2700GFLOPS SP、540GFLOPS DP
Fermi ~466mm^2、1500GFLOPS SP、768GFLOPS DP(?)
(512sp x 1.5GHz x FMA)
老實說如果用FMA來算的話,Fermi可能只會比RV870好一點點。_A_
話說預料之內的是Sliverthome耗電量表現很好但是面積輸掉了,只是面積基本上不是絕對問題,因為建構成本的實際報價不單單被面積影響。使用者(買機器的人)通常要考慮的是耗電量(運作成本)沒錯,但是建構商才需要考慮面積(晶片生產成本)。
Fermi宣傳HPC性能的時候
出來一臺P級別用AMD GPU的HPC,這肯定是AMD的 刺客啦