http://pc.watch.impress.co.jp/docs/2008/0617/tawada143.htm
■多和田新也のニューアイテム診断室■
新設計コアを採用するNVIDIAの新ハイエンド「GeForce GTX 280」
http://pc.watch.impress.co.jp/docs/2008/0617/kaigai446.htm
後藤弘茂のWeekly海外ニュース
NVIDIAの1TFLOPS GPU「GeForce GTX 280」がついに登場
http://pc.watch.impress.co.jp/docs/2008/0617/nvidia.htm
NVIDIA、第2世代統合シェーダ搭載GPU「GeForce GTX 200」
—-
GT200代表的意味是”G8x/G9x = GT100″,or”GT = GeForce/Tesla”。
此外,G8x/G9x的missing MUL透過fw177找回來了….O_o
於是最近CUDA的文件又把G80寫回518GFLOPS;不過這似乎對CUDA的幫助比較大,對graphic就普通了。
GT200有改的部分應該只有:
1. TPC總thread數從1536變成3072
然後SM因為增加一個,所以每個SM可以分到的thread從768變成1024、亦即從24warp提高到32warp。
TMU相較於G8x/G9x沒有大變化。
GT200的材質處理是與G84開始的G8x/G9x一樣,有8個8bit Tex-fetch、8個FP32 Tex-Address。
所以GT200的TPC和G84一樣,相對於G80一樣都高了一倍的int8 (filtered)texture輸出。
而先前以為GT200是比G92少….所以這邊要更正一下_A_
另外要注意的是每個SM有一個1D FP64倍精度。
相較之下RV670是每個5D ALU有一個1D FP64,所以RV770的倍精度浮點能力就一口氣從64個變成160個FP64/cylce,大幅超過只有30個(不過還要再double clock)FP64 的GT200。
2. ROP blend速度強化
從2cycle變成1cycle的blending輸出,老實說這我覺得是繪圖面主要的強化。
—-
http://www.pcinlife.com/article/graphics/2008-06-16/1213601612d533.html
PCINLIFE的GT200 review。
65nm下仍然是24.5 x 24.5 mm^2的超級大晶片….讓人捏把冷汗。
只要應用程式本身使用的記憶體沒有超過GX2的512MB上限,由於比較高的Shader clock、比較多的TMU,9800GX2還是能取得一些優勢;如果超過的話GX2會急速變慢的關係,GTX280就會出現明顯的優勢。這會讓人覺得G92還是應該加點記憶體….
Crysis下GTX280單卡可以在1680×1050 veryHigh順暢運作,還離單卡HD的期望有點距離。XD
總之GT200代表的是fabless模式下,可以生產的經濟規模上限探頂。
如果NVIDIA可以透過這個模式獲利,未來也許會繼續嘗試這個規模的GPU;
反之AMD則是繼續走C/P值模式。RV770兩顆構成的R700看起來會有很不錯的表現?
ROP blend速度强化
从2cycle变成1cycle能带来最直接的好处是什么?FREE AA吗?
ROP blend速度强化
从2cycle变成1cycle能带来最直接的好处是什么?FREE AA吗?
fw177?
這是啥…?
不過這MUL被找回來,
有幫助遊戲效能大增嗎?
fw177?
這是啥…?
不過這MUL被找回來,
有幫助遊戲效能大增嗎?
本來也是流水的吧
从2cycle变成1cycle應該不會有理論性能的差別。
只是效率會更穩定
本來也是流水的吧
从2cycle变成1cycle應該不會有理論性能的差別。
只是效率會更穩定
> fw177?
forceware 177….
>本來也是流水的吧
>从2cycle变成1cycle應該不會有理論性能的差別。
> 只是效率會更穩定
這不是2cycle latency,而應該是為”2cycle指令變成1cycle指令”,所以吞吐就是double了,所以即使是同為pipelining,也是會有落差的。
> fw177?
forceware 177….
>本來也是流水的吧
>从2cycle变成1cycle應該不會有理論性能的差別。
> 只是效率會更穩定
這不是2cycle latency,而應該是為”2cycle指令變成1cycle指令”,所以吞吐就是double了,所以即使是同為pipelining,也是會有落差的。
貌似fp64对游戏没用吧!
貌似fp64对游戏没用吧!
> 貌似fp64对游戏没用吧!
是啊,這是對GPGPU用的。GT200事實上是一個Tesla為主的設計,所以你也可以看到game的產品(GeForce GTX280)沒有1TFLOPS、是Tesla T10P才有1TFLOPS。
> 貌似fp64对游戏没用吧!
是啊,這是對GPGPU用的。GT200事實上是一個Tesla為主的設計,所以你也可以看到game的產品(GeForce GTX280)沒有1TFLOPS、是Tesla T10P才有1TFLOPS。
由于是针对tesla为主的设计 所以导致GTX280的游戏性能不是很理想XD
由于是针对tesla为主的设计 所以导致GTX280的游戏性能不是很理想XD