G86的64bit和128bit封裝不同有感

http://www.hkepc.com/bbs/news.php?tid=810961
8400GS、G86-213
http://www.pcinlife.com/article/graphics/2007-04-18/1176863400d349_3.html
8500GT、G86-300

從這兩張照片可以明顯看出,G86有64bit和128bit兩種封裝,各自用在8400GS以下與8500GT以上….
可以拿來實證做得到用封裝來分兩種不同的記憶體介面寬度嗎?

Waterball:這是理所當然的,可以回想一下Socket 754和Socket939。

8500GT的ROP是8個、8400GS是4個,所以應該是每4個ROP(or quad)為一組、各連接64bit Memory。

沒錯的話,G84很可能晶片本身有16個ROP切四組,各自64bit最大256bit,然後以封裝區分產品;甚至G80本身也應該是總共8組ROP,只是用封裝做成現在這樣,理由前面提過了,如果考慮Texture Address能力的話,G86和G84這方面都是和記憶體頻寬可以配合的。(G86:1TCP有8個TA、G84:2TCP有16個TA、G80的8TCP有32個TA與64個TF,以TA存取記憶體、TF存取Texture cache,所以也合這個觀點)

當然封裝區分太細的話反而提昇成本,所以我們看到8800GTS和8800GTX/Ultra之間只用空焊沒用封裝區分。

所以G8x的總合結構整理如下:
G80 — 8TCP、32TA、64TF、32ROP、512bit
G84 — 2TCP、16TA、16TF、16ROP、256bit
G86 — 1TCP、8TA、8TF、8ROP、128bit

也就是說,與其說G80是Double TF、不如說是TA減半:TF由於與Texture Cache關係比較大,所以Texture Cache很可能也是和TCP個數成比例的。G80和G84之間的SP數量,可以看作對die size等半導體資源最大的讓步所在,這也讓die size的差距(484mm^2 vs 170mm^2)變動明顯,除此之外G8x家族內與記憶體頻寬相依的部份規模變動都有線性關係。如果考慮ROP的壓縮能力改善、TMU filter能力強化、支援材質格式的增加來看,雖然個數上是16TMU+16ROP、但是性能很可能不弱於G70的24TMU+16ROP。也就是說現在G84在舊遊戲方面的表現稍弱於7900系列,某些狀況自然是與DX10支援佔掉shader 的raw performance有關沒錯,但也應與關閉的ROP與記憶體介面這部份有關,G84目前以封裝封閉這些資源,目的應該是為了配合G7x高階的庫存出清,等到7900存貨解決之後,應該就有機會推出256bit、16ROP版的G84。(要看市場需求,如果對手無力的話其實可能也不會出?)

當然相較於出清掉的7900GTX,價位是另一個問題。目前台灣市場的7900GTX 512MB甚至有五千元台幣出頭左右的行情出現,8600GTS 256bit能有這種價位嗎?
另外一個明顯的對手是8800GTS320,甚至也有可能推出更低規格的8800系列,競爭力應該都會高過8600的256bit….不過這篇主旨是在討論G84的規模與電晶體資源的利用為主。

TSMC 80nm製程、289M電晶體、170mm^2的die size,和TSMC 110nm製程、304M、334mm^2的G70,或是TSMC 90nn、278M、196mm^2的G71的G70相比,進步遠大於製程帶來的改善,NV50的結構優勢的確讓人刮目相看。
同時也可以看出一個G8x現有的缺憾:NV50的SP原始設計應該是4D Vector轉為1D Scalar的同時,將SP提升到四倍左右的時脈,來維持性能。(注意:G8x的shader時脈與週邊ASIC並非整數倍率,可以完全浮動)
不過很可惜因為製程的關係沒有達到這個遠大的目標….

此外,G8x成功地將Texture Address與 Texture Filter運作分離之後,未來G9x有可能再強化這個部份。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料