GT200相對於G80/G92的改善

http://pc.watch.impress.co.jp/docs/2008/0617/tawada143.htm

■多和田新也のニューアイテム診断室■

新設計コアを採用するNVIDIAの新ハイエンド「GeForce GTX 280」

http://pc.watch.impress.co.jp/docs/2008/0617/kaigai446.htm

後藤弘茂のWeekly海外ニュース

NVIDIAの1TFLOPS GPU「GeForce GTX 280」がついに登場

http://pc.watch.impress.co.jp/docs/2008/0617/nvidia.htm

NVIDIA、第2世代統合シェーダ搭載GPU「GeForce GTX 200」

—-

GT200代表的意味是”G8x/G9x = GT100″,or”GT = GeForce/Tesla”。

此外,G8x/G9x的missing MUL透過fw177找回來了….O_o

於是最近CUDA的文件又把G80寫回518GFLOPS;不過這似乎對CUDA的幫助比較大,對graphic就普通了。

GT200有改的部分應該只有:

1. TPC總thread數從1536變成3072

然後SM因為增加一個,所以每個SM可以分到的thread從768變成1024、亦即從24warp提高到32warp。

TMU相較於G8x/G9x沒有大變化。

GT200的材質處理是與G84開始的G8x/G9x一樣,有8個8bit Tex-fetch、8個FP32 Tex-Address。

所以GT200的TPC和G84一樣,相對於G80一樣都高了一倍的int8 (filtered)texture輸出。

而先前以為GT200是比G92少….所以這邊要更正一下_A_

另外要注意的是每個SM有一個1D FP64倍精度。

相較之下RV670是每個5D ALU有一個1D FP64,所以RV770的倍精度浮點能力就一口氣從64個變成160個FP64/cylce,大幅超過只有30個(不過還要再double clock)FP64 的GT200。

2. ROP blend速度強化

從2cycle變成1cycle的blending輸出,老實說這我覺得是繪圖面主要的強化。

—-

http://www.pcinlife.com/article/graphics/2008-06-16/1213601612d533.html

PCINLIFE的GT200 review。

65nm下仍然是24.5 x 24.5 mm^2的超級大晶片….讓人捏把冷汗。

只要應用程式本身使用的記憶體沒有超過GX2的512MB上限,由於比較高的Shader clock、比較多的TMU,9800GX2還是能取得一些優勢;如果超過的話GX2會急速變慢的關係,GTX280就會出現明顯的優勢。這會讓人覺得G92還是應該加點記憶體….

Crysis下GTX280單卡可以在1680×1050 veryHigh順暢運作,還離單卡HD的期望有點距離。XD

總之GT200代表的是fabless模式下,可以生產的經濟規模上限探頂。

如果NVIDIA可以透過這個模式獲利,未來也許會繼續嘗試這個規模的GPU;

反之AMD則是繼續走C/P值模式。RV770兩顆構成的R700看起來會有很不錯的表現?

在〈GT200相對於G80/G92的改善〉中有 14 則留言

  1. 本來也是流水的吧
    从2cycle变成1cycle應該不會有理論性能的差別。
    只是效率會更穩定

  2. 本來也是流水的吧
    从2cycle变成1cycle應該不會有理論性能的差別。
    只是效率會更穩定

  3. > fw177?
    forceware 177….
    >本來也是流水的吧
    >从2cycle变成1cycle應該不會有理論性能的差別。
    > 只是效率會更穩定
    這不是2cycle latency,而應該是為”2cycle指令變成1cycle指令”,所以吞吐就是double了,所以即使是同為pipelining,也是會有落差的。

  4. > fw177?
    forceware 177….
    >本來也是流水的吧
    >从2cycle变成1cycle應該不會有理論性能的差別。
    > 只是效率會更穩定
    這不是2cycle latency,而應該是為”2cycle指令變成1cycle指令”,所以吞吐就是double了,所以即使是同為pipelining,也是會有落差的。

  5. > 貌似fp64对游戏没用吧!
    是啊,這是對GPGPU用的。GT200事實上是一個Tesla為主的設計,所以你也可以看到game的產品(GeForce GTX280)沒有1TFLOPS、是Tesla T10P才有1TFLOPS。

  6. > 貌似fp64对游戏没用吧!
    是啊,這是對GPGPU用的。GT200事實上是一個Tesla為主的設計,所以你也可以看到game的產品(GeForce GTX280)沒有1TFLOPS、是Tesla T10P才有1TFLOPS。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料