結果RV770是16ROP、40TMU、160Shader ALU(或者說800sp),core維持單一時脈,沒有非等時脈shader。
也就是說RV770和RV670、R600等前輩一樣,沿用原來的Ultra Threading,只是把R600/RV670各4組16個ALU的ALU array,變成40個ALU,同時TMU array也跟著等比例擴充到40個TMU;ROP則沒有增加,維持16組,共256bit,只是MSAA的部分改善(CFAA硬體化?)。
這樣的話thread資源維持相同,卻變成有2.5倍的ALU張嘴巴來分,我想shader benchmark會有不少狀況性能沒增長….而主要改善性能的部分終究是靠TMU和ROP。
GT200則是每個shader multiprocessor從768 thread成長到1024個(on-the-fly的切換上24個warp變成32個warp)、所以每個TPC是1.5倍 x133% = 每個TPC具有幾乎G8x/G9x約2x的thread資源增長,所以分支性能相對於過去G8x/G9x來說還是強化的。
看來從R520這個巔峰以後,ATI的GPU分支性能一直走下坡啊….但是AMD手上本來就有CPU所以不太需要在意這點就是。XD
AMD說兩個月之後推出的R700會是「有史以來最快的顯示卡」….不過除非R700可以四卡作CrossFire-X,不然的話最終還是四顆晶片開CrossFire-X vs 3way-SLI的三顆晶片,又回到RV670和GT200單晶片的性能差異上。
并沒有提及Thread是否有改進吧。
當然,面積來看可能性不大了。
沒有拿到PDF的話不知道。
不過增加TMU、增加記憶體頻寬(GDDR5)、ROP的shader依存度降低,這些都是對症下藥的部分,R600結構其實這部分我覺得弱項得很明顯,shader的效率差就靠ALU硬加也不是什麼錯事,當成結構特性處理就好了。
沒有拿到PDF的話不知道。
不過增加TMU、增加記憶體頻寬(GDDR5)、ROP的shader依存度降低,這些都是對症下藥的部分,R600結構其實這部分我覺得弱項得很明顯,shader的效率差就靠ALU硬加也不是什麼錯事,當成結構特性處理就好了。