http://pc.watch.impress.co.jp/docs/2008/0930/tawada153.htm
AMDが全セグメントを4000シリーズ化「Radeon HD 4550」
先前R600的shader負載數據可以看出其實R6x0的shader使用率並不低,那麼將內部interconnection改善之後得來的效率竄升就很可以理解。
RV770以來AMD在短期內將所有產品線刷新,這回終於來到了最低階的Radeon HD4550,代號RV710。
結構上是單一的80sp array,64bit、單一的render backend,與過去的設計上主要的差距都和RV770相對於過去類似位置的R6x0類似。
表現相當優異,讓最近很受質疑的低階單卡存在價值又扳回來了一些。
其實當初AMD在R6x0關於生產性的如意算盤其實很多地方是不成立的…..直到R7x0才凹回來。
如果說R7x0其實才實現了市場對R6x0的期待也不為過。
當然這段時間也拜NVIDIA全力衝CUDA繪圖原地踏步所賜,R7x0於是有辦法在NVIDIA轉換製程的停頓期一口氣衝上去。
加上NVIDIA自己的內部管理問題,能不能再現NV40的大復活就得看年底的DX11了。
RV770可能也還是有改進空間.
我在GPU ShaderAnalyzer常常看到這種結果
//compiler statistics
Name x1300 HD2900 HD4870
EstCycles(Tri) 3.00 2.40 2.00
ALU:TEX(Tri) 1.25 0.83 2.08
BottleNeck(Tri)ALU Texture Interpolators
X1300的ALU/TEX是1:1所以瓶頸為ALU並不意外.
R600的TEX unit很少,瓶頸為TEX並不意外.
但是RV770竟然是卡在Interpolators.
這蠻意外的….
也許是改進R600的缺陷後,ALU/TEX效能增加了
卻沒有相對增加Interpolators數量,
(因為原本那不是問題).
不過這是只跑PS的情形,也許遊戲裡同時跑VS會改善一點.
因為只有PS需要從Interpolators索取資料.
或是PS的運算更複雜也許就不會卡在這裡.
RV770可能也還是有改進空間.
我在GPU ShaderAnalyzer常常看到這種結果
//compiler statistics
Name x1300 HD2900 HD4870
EstCycles(Tri) 3.00 2.40 2.00
ALU:TEX(Tri) 1.25 0.83 2.08
BottleNeck(Tri)ALU Texture Interpolators
X1300的ALU/TEX是1:1所以瓶頸為ALU並不意外.
R600的TEX unit很少,瓶頸為TEX並不意外.
但是RV770竟然是卡在Interpolators.
這蠻意外的….
也許是改進R600的缺陷後,ALU/TEX效能增加了
卻沒有相對增加Interpolators數量,
(因為原本那不是問題).
不過這是只跑PS的情形,也許遊戲裡同時跑VS會改善一點.
因為只有PS需要從Interpolators索取資料.
或是PS的運算更複雜也許就不會卡在這裡.
//compiler statistics
Name____________x1300__HD2900__HD4870
EstCycles(Tri)__3.00___2.40____2.00
ALU:TEX(Tri )___1.25___0.83____2.08
BottleNeck(Tri)_ALU___Texture__Interpolators
//compiler statistics
Name____________x1300__HD2900__HD4870
EstCycles(Tri)__3.00___2.40____2.00
ALU:TEX(Tri )___1.25___0.83____2.08
BottleNeck(Tri)_ALU___Texture__Interpolators