昨天在GZeasy有人提到的問題,G80或G90有沒有可能使用XDR…
我自己是覺得XDR因為是要吸引人家換跑道的一方,只有任何一方面全部都有優勢,人家才有可能會考慮,所以不論成本或性能都要有誘因,要NVIDIA用才有可能。
於是這邊有個問題是:相比於GDDR4,XDR/XDR2的誘因在哪邊?
XDR目前是16bit單顆、今年三月驗證到4.8Gtps(6.4Gtps可達但是未驗證),明年中照Roadmap是可以到8Gtps,也就是1GHz的運作時脈,此時的頻寬是16GB/s單顆。
相較之下,最近GDDR4剛宣佈了2.8Gtps的樣品,並且提到2006年中可以達到3.6Gtps,由於GDDR4是32bit單顆,所以在3.6Gtps的狀況下可達頻寬是14.4GB/s,相差其實很小。
當然,上述的狀況是128bit XDR vs 256bit GDDR4,XDR在頻寬與成本(pin-counts)上都有優勢(頻寬稍大、針腳數亦較少),但是轉換跑道終究是有風險,所以如果128bit XDR沒有強過256bit GDDR4,要吸引人轉換真的很難;而且其實優勢也只有一點點,如果考慮XDR的供貨量不見得足以達到需求,要吸引人家從GDDR4換成XDR就更難了。
於是XDR2開發的理由相當明顯:如果考慮XDR2的話,從ODR變化到HDR(Hex Data Rate)頻寬則是馬上變成兩倍(8Gtps→16Gtps),維持同樣時脈時就是最大32GB/s,這時候相對於GDDR4的優勢就會比較大。
不過XDR2必須要等到2007年才能供貨,所以G80使用GDDR4的理由就很明顯了,G80很可能還是維持256bit GDDR4;但如果GPU的性能繼續成長的話,有可能GPU還是要考慮512bit GDDR4,這時候比起來256bit XDR/XDR2就會更有吸引力。
主要的理由在於,pin-counts與頻寬雖然都是影響的因素,但是256bit GDDR4與128bit XDR都同樣需要8 chips,256bit XDR則需要16顆,所以256bit XDR的對手應該是512bit GDDR4,如果考慮記憶體晶片數量的話,就會發現XDR的誘因不足、需要XDR2;但是如果要考慮512bit GDDR4的話,那就會變成256bit XDR相較之下也有誘因存在。
也就是說,G80維持256bit GDDR4、G90則可能在512bit GDDR4與256bit XDR/XDR2之間做選擇,這是我的想法。
XDR的per pin transfer rate差不多是DDR兩倍以上的關係,基本上就是64bit XDR相對於128bit DDR、128bit XDR相對於256bit GDDR有優勢。
以頻寬來論的話,12/4發表的GDDR4可以達到2.9Gtps、256bit下的頻寬大約是92.8GB/s;
2006下半年的3.6Gtps出現後,頻寬則大約是115.2GB/s,這時的記憶體顆粒有八顆。
同樣的狀況下,上面提到128bit XDR大約是6.4Gtps~8Gtps,所以頻寬是102.4GB/s~128GB/s;於是Rambus推出XDR2的理由是很明顯的,幾乎同樣的成本下,128bit可以達到的頻寬是204.8GB/s~256GB/s,如此才能對抗GDDR4的成長,繼續維持自己的優勢。
Rambus它們做出來的XDR有兩種優勢,一種是pin-count、一種是bandwidth。
但是pin-count能夠較小的主因,是因為bit數較少(16bit),
GDDR4的pin數在32bit下是136pin、相比之下XDR在16bit下是104pin,
如果XDR擴增到32bit,應該無可避免地會比GDDR4的pin腳來得多一些。
(因為和兩顆相比,電源腳可以省下來,最後可能在160pin左右)
當然就像上面說的,這時候就會在顆粒數量上有優勢(只需要半數的晶片數量),
PCB的成本主要在於層數與打孔數,單顆32bit的話相比於兩顆16bit,可以節省掉半數的電源腳數量,所以相比於16bit,32bit顆粒需要的打孔數量還是會減少,也就是說32bit XDR的確是會降低成本的。
當然實質上,腳位並不是真的無限成長就會比較好,不然同理,我們早就看到單顆64bit的GDDR4了。
那麼,為什麼XDR"一開始沒做"32bit呢?
可能是因為對Rambus而言,XDR2其實比32bit XDR來得"簡單"。
(這並不是指32bit XDR要做很困難,只是比較上的問題)
因為XDR2與XDR可以完全相容,也就是說要搭配XDR2,
主要是需要XIO memory Controller提升至原有兩倍的時脈,
原則上controller本身不需要修改就可以直接使用XDR2。
所以對XIO MC而言,4GHz的XDR2與8Gtps的XDR原則上行為是無異的,
相比於32bit XDR來說,16bit XDR2其實只是XDR的小修改與完善化,
讓時脈可以超過8GHz,起跳正好就是原來XDR最高的16GB/s。
也就是說,XDR的cell运作時脈最高1GHz、XDR2則是將bank分為兩組,時脈降為一半(500MHz)之後,
內部傳輸率等於變為兩倍、使得整體時脈與頻寬能繼續提升的新版XDR。
所以相比之下,要做出32bit XDR的改動,應該會比XDR2要來得大。
—-
所以如果G90使用256bit XDR2的話,當時可達的時脈應該是8Gtps,可能是16顆16bit 512Mbit XDR,容量達到2GB;頻寬則為256GB/s。
相比之下,256bit GDDR4於2006年中的頻寬為3.6Gtps、115.2GB/s,2007年同期應該可以達到4Gtps以上,也就是128GB/s,要達到256GB/s則需要512bit,這時XDR/XDR2應該會有成本優勢。
不過這邊有個問題是,一如上面所說XIO Memory Controller的時脈要求相當高,發熱量上應該會有相當的問題;而且XIO的複雜度相比於GDDR系記憶體來說複雜不少(這可以從Cell的64bit XDR佔的die size看出),這都是XDR目前既有的問題。