[url="http://photos11.flickr.com/14807626_922de02414_o.jpg"][img]http://photos11.flickr.com/14807626_922de02414_m.jpg[/img][/url]
前兩天令人迷惑的RSX性能怪數字,現在有點比較合理的解釋了。
RSX總op數為136ops,乘上550MHz 僅為74.8Gops/sec,
和這裡提到的100Gops/sec比起來還有25.2Gops/sec的落差;
但是如果把7個SPE乘上3.2GHz的時脈,可以得到22.4Gops/sec的數字,
合起來的話就相當接近100Gops/sec了。
這也大略地解除了G80/RSX的一些結構疑慮。
不過這樣一來與C1(X360-GPU)的差距也大致底定了。
550MHz的時脈也應該僅與RSX本身的良率有關,PS3這回所有的設計也完全僅與生產性相關。
PS3重視CPU,XBOX360重視GPU的態勢自此確立,
幾天下來的架構分析熱也該到此結束了。
—-
話說感想:
先學R300的AF,後學SONY的數據灌水,
NVIDIA你不要老是不學好啊….orz
[EDIT]
其實想想,RSX展現了非常可怕的實力,不論是生產性或是性能這兩個方面。
首先是生產性,RSX(G80)大約300M transistor,從NV40的die size來逆推的話,會變成
287mm2 x 300/222 x (90/130)^2 = 186mm2左右,
僅比NV43的150mm2稍大一些而已,有十足的能力可以打中階。
另外一個有趣的地方,是目前PS3上FlexIO的頻寬比預測的低
(原來Cell的總和是76.8GB/s,考慮時脈降至3.2GHz,至少也有60GB/s;
但是現在RSX用掉20+15GB/s,I/O只用了2.5+2.5GB/s,總共40GB/s而已,只能說可能channel數就比本來的少。
何況界面的速度應該根本與晶片主時脈無關),
當然還不知道G80桌面版最後會實作多大的頻寬,不過應該可以考慮應該會等於記憶體的頻寬。
ex: 假設使用700MHz 128bit GDDR3 有22.4GB/s,所以FlexIO如果要當成有效的NUMA-Link,
就會需要雙向各22.4GB/s的頻寬,最可能是雙向各4channel等於來回25.6GB/s,共51.2GB/s。
如果有完成這點的話,就可以想像兩顆G80有辦法完整結合兩顆晶片共44.8GB/s的頻寬,
然後RSX的550MHz時脈應該是以Console的高良率指標所設定的,桌面版的時脈應該會更高,可能會有700MHz。
如果只考慮要達到G70(目前的情報是約430MHz)的兩倍效能的話,只需要達到650MHz,而這應該不是很困難;
而且這還是良率估計會相當充裕的數字。
現在要達更高的效能最大的阻礙,反而是要設法找到更快的記憶體了,上哪找比700MHz GDDR3快兩倍的東西啊。
(總不會真的上XDR吧,這樣供貨會很麻煩的)
產品本身的吸引力也很大。
考慮RSX有提供dual-HDMI,可以視同G80單核心可以提供同等的能力(如同NV41/42內建雙TMDS),雙核心的話Free的Double Dual-Link也絕非空談了。
(雖然NV41/42明明有內建雙TMDS,NVIDIA在消費產品上照樣沒給dual-DVI….orz)
這樣的產品2006年年中之前就很有可能上市,然後就是2006年底到2007年初之前的NV5x,剛好是Longhorn也差不多該上市了。
啊,世界多美好?
真是打得太好了的如意算盤啊。