http://www.nvidia.com/object/gpu_technology_conference.html#webcast
http://player.istreamplanet.com/nvidia/d/keynote_090930.html
Opening Keynote with Jen-Hsun Huanghttp://player.istreamplanet.com/nvidia/d/3pmsession_090930.html
General Session: Important Trends in Visual Computinghttp://player.istreamplanet.com/nvidia/d/4pmsession_090930.html
General Session: Breakthroughs in High Performance Computinghttp://ispss.istreamplanet.com/nvidia/d/keynote_091001.html
Day 2 Keynote: Hanspeter Pfister, Professor, Harvard University
結論….GPU還不夠快(核爆)
那堆動不動就需要ExaFLOPS level、grand challange級的東西實在是太瘋狂啦….
不過Fermi對工業的確會有很大推動力的感覺,畢竟單晶片倍精度破1TFLOPS真的意義非凡。改成64bit的線性定址空間讓C++可以re-compile就直接在上面也很重要,可以切換的16KB shre memory+48KB L1/768KB L2也讓大部分的code可以不做很大的修改就得到初步的加速,引入的debug機制也讓在Fermi上的開發比過去GPGPU要進步很多,最後是高速context switching和multi-kernel執行能力(16的話好像和SM的數量有關),這樣看來Fermi 似乎是有和Larrabee叫陣的本錢了。
最後,09年第四季Tesla business似乎有10M的盈餘….
—-
不過基本上最受關心的還是繪圖性能….畢竟成本就是高了1.5倍。
反過來說,超過GTX295應該是基本期望,但如果GF100還能夠單晶片挑贏5870X2(贏5870平均約25%)的話,那就真的很神了。
但是個人覺得GT200的問題不在shader,更比較偏向TMU和ROP吞吐不足(尤其是ROP基礎性能比G92還糟)….這個改善應該和shader是可以並行不悖的。
雖然以硬體context switching應該可以收到DirectCompute並列執行效率不減的好處,這樣預期來說只要一跑PhsyX,GF100單卡很有可能可以打贏兩張GT200 SLI、或者是GT200兩張各自跑繪圖和物理;但是繪圖本身單獨就贏,才會給人有全面性的感覺。