G86的64bit和128bit封裝不同有感

http://www.hkepc.com/bbs/news.php?tid=810961
8400GS、G86-213
http://www.pcinlife.com/article/graphics/2007-04-18/1176863400d349_3.html
8500GT、G86-300

從這兩張照片可以明顯看出，G86有64bit和128bit兩種封裝，各自用在8400GS以下與8500GT以上….
可以拿來實證做得到用封裝來分兩種不同的記憶體介面寬度嗎？

Waterball：這是理所當然的，可以回想一下Socket 754和Socket939。

8500GT的ROP是8個、8400GS是4個，所以應該是每4個ROP（or quad）為一組、各連接64bit Memory。

沒錯的話，G84很可能晶片本身有16個ROP切四組，各自64bit最大256bit，然後以封裝區分產品；甚至G80本身也應該是總共8組ROP，只是用封裝做成現在這樣，理由前面提過了，如果考慮Texture Address能力的話，G86和G84這方面都是和記憶體頻寬可以配合的。(G86：1TCP有8個TA、G84：2TCP有16個TA、G80的8TCP有32個TA與64個TF，以TA存取記憶體、TF存取Texture cache，所以也合這個觀點）

當然封裝區分太細的話反而提昇成本，所以我們看到8800GTS和8800GTX/Ultra之間只用空焊沒用封裝區分。

所以G8x的總合結構整理如下：
G80 — 8TCP、32TA、64TF、32ROP、512bit
G84 — 2TCP、16TA、16TF、16ROP、256bit
G86 — 1TCP、8TA、8TF、8ROP、128bit

也就是說，與其說G80是Double TF、不如說是TA減半：TF由於與Texture Cache關係比較大，所以Texture Cache很可能也是和TCP個數成比例的。G80和G84之間的SP數量，可以看作對die size等半導體資源最大的讓步所在，這也讓die size的差距(484mm^2 vs 170mm^2)變動明顯，除此之外G8x家族內與記憶體頻寬相依的部份規模變動都有線性關係。如果考慮ROP的壓縮能力改善、TMU filter能力強化、支援材質格式的增加來看，雖然個數上是16TMU+16ROP、但是性能很可能不弱於G70的24TMU+16ROP。也就是說現在G84在舊遊戲方面的表現稍弱於7900系列，某些狀況自然是與DX10支援佔掉shader 的raw performance有關沒錯，但也應與關閉的ROP與記憶體介面這部份有關，G84目前以封裝封閉這些資源，目的應該是為了配合G7x高階的庫存出清，等到7900存貨解決之後，應該就有機會推出256bit、16ROP版的G84。(要看市場需求，如果對手無力的話其實可能也不會出？)

當然相較於出清掉的7900GTX，價位是另一個問題。目前台灣市場的7900GTX 512MB甚至有五千元台幣出頭左右的行情出現，8600GTS 256bit能有這種價位嗎？
另外一個明顯的對手是8800GTS320，甚至也有可能推出更低規格的8800系列，競爭力應該都會高過8600的256bit….不過這篇主旨是在討論G84的規模與電晶體資源的利用為主。

TSMC 80nm製程、289M電晶體、170mm^2的die size，和TSMC 110nm製程、304M、334mm^2的G70，或是TSMC 90nn、278M、196mm^2的G71的G70相比，進步遠大於製程帶來的改善，NV50的結構優勢的確讓人刮目相看。
同時也可以看出一個G8x現有的缺憾：NV50的SP原始設計應該是4D Vector轉為1D Scalar的同時，將SP提升到四倍左右的時脈，來維持性能。(注意：G8x的shader時脈與週邊ASIC並非整數倍率，可以完全浮動)
不過很可惜因為製程的關係沒有達到這個遠大的目標….

此外，G8x成功地將Texture Address與 Texture Filter運作分離之後，未來G9x有可能再強化這個部份。

Eji的碎碎念

G86的64bit和128bit封裝不同有感

發佈留言取消回覆

現在只剩下黑歷史….

發佈留言 取消回覆

現在只剩下黑歷史….

發佈留言取消回覆