前兩天的日記內容又隨著後藤大叔去E3的XB360記者招待會得到的資料曝光,而被否定…..
這回的狀況真是太絕妙了。orz
本文使用後藤大叔目前參與E3上的MS媒體招待會得到的資料,
以及XBOX360已經宣佈的資料為基準,先解釋一下XGPU360的一些資料:
首先,是剛揭露的Shader部分,
目前看來應該是4D Vector + 1D Scalar的構成。
4D Vector 可以進行VS or PS的功能,指令集完全相容;
另外還有一個獨立的1D Scalar。
48G op/s,500MHz,所以可以推論是96ops/cycle。
所以總計算量能量,是 48 x (4Dx2 + 1D)= 48x 9 = 432 flops
4D x2 指的是FMA,有2flops。
這樣的話總理論效能就是500MHz x48 x (4×2+1) = 216GFLOPs。
其次是"eDRAM"。
簡單講,Xenon diagram看來是正確的,
根據看過XBOX360的人員洩漏的資料,
它似乎不是eDRAM,而是"eDRAM"
not embeded DRAM to GPU,but there is something in DRAM。
[EDIT:專有名詞錯用]
http://www.beyond3d.com/forum/viewtopic.php?t=23042
第六篇。
這個10MB的eDRAM,根據上述thread所留存的過去Xenon開發人員訪談,
內建有下列單元:
1. Z/stencil Test unit
2. Z-write
3. Alpha Blending
4. 4x MSAA
頻寬為32GB/s,每個cycle讀寫8個pixel,
透過上述的工作之後,可以等效到256GB/s。
其實一言以敝之:ROPs in eDRAM。 (by cho)
從這個角度上來看,就似乎比想像中單純。
每個pixel都經過上述的動作,而先前說過Xenon有16Gpixel/s 的 fillrate(in 4x MSAA),
意即4Gpixel/s,8color /cycle;然後,32GB/s x 8 = 256GB/s。
(因為每個pixel都等於免費得到上述的所有動作)
總頻寬是 32GB/s 的話,相信是個256bit DDR-bus的設計,
應該是MCM unit可以達到的設計。
這個 eDRAM 由 NEC所生產,大小並不大,可能在100M~120M以內,
從 DRAM 產品的規模來說,這是個很小的晶片,良率應該會相當高。
不過,含有GPU的北橋可能就沒這麼簡單了,因為如此看來,
應該是由TSMC繼續生產這個北橋,然後用MCM的模式結合,在封裝時才合併兩個廠商的晶片。
因為當初認定為eDRAM的模式,所以才認為NEC會生產這個GPU;
現在從eDRAM的角度來推斷的話,看來仍然是TSMC生產….
上面提到過了,它是個48個4D Vector + 1D Scalar + 8color unit的GPU,
規模多大並不清楚,問題是應該不會小於200M,而且考慮還有北橋的相關logic,
複雜度只怕是超乎想像。
而且,CPU是IBM、GPU-NB是TSMC、SB是SiS設計UMC生產,最後是NEC生產的eDRAM。
這四家廠商哪一個出毛病就掛了….
—-
比起來,PS3簡直就是單純到翻掉….
CPU是CELL,GPU是RSX,各自使用獨立的記憶體,
RSX可以用TurboCache功能透過FlexIO存取主記憶體。
據稱這個RSX雖然管線數量接近G70(24pipe),
但是結構比較接近G80,而非G70。
因為RSX有一個用意就是要驗證部分G80的設計。
當然,G80 與 RSX一樣都是由IBM系的製程所生產,
所以必然是使用IBM的library,所以上述的理由是說得過去的。
其次,RSX的規模可能大過G80,
因為G80(NV48)目前傳出的資訊是16pipe的設計,
所以RSX說不定可以視為NV4x最後的成員。
RSX的資料現在還有一些不明朗的部份,
不過我想並不是有特殊的暗樁,而只是窩著不說…..
詳情大概會在G70公開(ComputexTaipei 05之後),
也就是6/8正式宣佈的時候明朗化。
南橋大概與現有的NForce相差不大,只是把Host從Hyper Transport改為FlexIO、
GPU的Host也是從PCI-E改為FlexIO,然後分別與CELL連接;
其餘狀況不變,GPU照舊連接 GDDR3,南橋各自連接自己的周邊….
由於設計簡化許多,未來CELL與RSX都很可能順勢縮小到65nm、45nm,
然後如果狀況好的話,可能會如同今日的EE+GS般結合,然後在PS4(?!)上重演現在的歷史。
目前感覺上最大的缺點,是XDR/GDDR3可能會成為固定的成本,而難以節省:
PS3使用16bit 512Mbit XDR x4,32bit 512Mbit GDDR3 x4,都已經是可獲得的最大寬度;
而XBOX360使用16bit 512Mbit GDDR3 x8,未來如果1Gbit GDDR3普及,
可以使用32bit 1Gbit GDDR3 x4,節省記憶體成本。
http://www.extremetech.com/article2/0,1558,1817022,00.asp
Todd Holmdahl: Xbox 360 Interview