http://www.fudzilla.com/content/view/15287/1/
RV870 is 1.6 times faster than RV770
RV770是RV670的2.8倍,所以這邊有兩個解釋:
1. RV870是RV770的260%,那就很不錯但是不太像最近的測試數據
2. RV870是RV770的160%,也就是best case快了60%,這樣就比較可惜了。
而以目前「2TFLOPS」的數字來說,應該符合的是後者。
http://nueda.main.jp/blog/archives/004606.html
AMDはHD 5800シリーズを9月22日に発表
http://www.nordichardware.com/news,9840.html
Radeon HD 5800 series with 2TFLOPS
HD5800於9月22日發表。
—-
https://nvidiagtc.wingateweb.com/scheduler/speakers.do?sort=fullNameReversed
GPU Technology Conference (oct02)
Speaker Catalog – ALL
https://nvidiagtc.wingateweb.com/scheduler/profile.do?SESSION_ID=1140&form=searchform&ts=1251737731499
Title: From Brook to CUDA
Speaker: Ian Buck NVIDIA
你什麼時候跳槽的w
Brook本來就是用在GPU的通用運算
Ian Buck是史丹佛的Brook計畫頭頭
後來就跑去N社了
Brook+才是A社的ATI Stream一部分
Brook++則是A社好友的通用運算計畫
其實還有Brook#喔(誤)
RV870的規格
850Mhz 1600SP + 256bits GDDR5
後者才是對的!
我還以為RV870是2000SP呢…. 結果是1600SP嗎。
ATI同時期同製程的高階大約抓在是中階的2.5~2.6倍.
例如中階2600=120SP , 高階2900XT = 320SP.
去年中階RV730=320SP , 高階RV770=800SP.
所以今年中階RV740=640sp , 高階RV870=1600SP
應該是合理的推測.
若是800Mhz~850Mhz,1600SP就有2.56~2.7Tflops了.
這應該可以很順利取代4870X2.
不過效能應該很難達到4870的兩倍,因為頻寬
沒有Double……恐怕需要很浪費ALU的
DX11 shader才能發揮1600SP的全力.
換句話說,最高階會是HD5870X2,起碼是5Tflops的等級.
總電晶體約1800Mx2 = 3600M.
R800 wiki已經有資料了,可靠度不明.
不過它是樂觀的認為HD5870是900Mhz, 2.88Tflops.
http://en.wikipedia.org/…aphics_processing_units
GT300的規格目前不詳
但據說很可能是雙512(512SP+512bits)
假設以上為真
那我預估這一代的性能就是RV870X2 > GT300 > RV870
而且RV870X2上市的時間可能會比GT300早
我看這一代nVidia不太妙阿…
RV740歸到RV870產品線的中階好嗎….我對這點有點疑問。
不過1600sp很合理就是了。
頻寬沒有double,TMU沒有增加,對手又很靠TMU,support又做得比他們好(?)。
以ATI來說大部份shader unit都是閒置,算是很吃虧;不過今年compute shader砸下去狀況可能會有差,就看CUDA會不會整碗被捧去這樣。
反過來說,NVIDIA似乎主要的重點還釋放在CUDA上,比方說GT300(Fermi)主要的改進並不是計算密度而是在unified share memory上,所以帳面數字應該還是會差ATI一大截,能不能到512×512還真的是個問題。
反過來說,目前看來NVIDIA架構上要去提昇shader:TMU的比例並沒有很大的困難,把unified share memory搞定之後再觀察看看。
一邊想積極追過去,一邊還在和自己的架構「理想(?)」奮鬥。
>>RV740歸到RV870產品線的中階好嗎….
雖然不是同產品線,
不過DX11和DX10在硬體規模上差異應該不大,
它的DX11中階卡應該會和RV740差不多大.
(畢竟ATI的DX10.1早就多做了Tesselation unit)
>>以ATI來說大部份shader unit都是閒置
所以RV870這代不必再追求更高的ALU:TEX比例,
只要維持1600SP:80Tex這個比例不動.
由於新遊戲的ALU比例慢慢上升,
以後RV870應該閒置的機率會比較少.
>>compute shader
這就要看暴力浮點運算量和unified share memory
哪一個方向比較符合未來需求了.
ATI大概是認為就算效率低一點,可是峰值數據高
就可以彌補過來吧.或是認為短期內不值得為
compute shader犧牲遊戲時的效能.
不過比對手先出DX11 GPU確實是好棋.
短期內要開發compute shader恐怕也只能針對
RV870的實作規格來開發與最佳化.