http://pc.watch.impress.co.jp/docs/2008/0208/kaigai418.htm
Intel最大のモンスターチップ「Tukwila」の概要が明らかに
這個65nm製程、電晶體數2050M、die size 700mm^2的超級大怪物,是IA-64第一個native Quad-Core。
但是有趣的是,以後藤老爹畫的圖來說,離開了IA-64 CPU core之後,外面的記憶體控制器、Inter-connection等等,就幾乎和Nehalem如出一轍。
IA-64在Tukwila之前都還是南北橋、記憶體控制器外掛的設計;這次核心沒有大變化,但是透過記憶體控制器內建、QPI實作的機會,一口氣把I/O性能大幅提升,記憶體頻寬大了六倍,總共有4channel的FB-DIMM(4.8Gbps x 4);值得注意的是Nehalem-EX似乎也是這樣實作,只是在主機板上裝了Mill Brook晶片(memory buffer chip),把FB-DIMM的介面轉回DDR3 RDIMM。由於Mill Brook是每個晶片2ch,Nehalem-EX會變成8ch DDR3的大怪物。
Tukwila也是第一個實作QuickPath Interconnect(QPI)的CPU產品,總共實做了4條full-width、2條half-width的QPI,只是時脈只設定在規格半速的4.8Gbps;看這些後藤老大推算的數字來說,會發現Tukwila的對外界面不僅全面序列化,並統一在4.8Gtps的數字上,由於system logic的運作時脈是2.4GHz的關係,這樣整體同步會比較簡單;在die photo上的大小大約是123mm^2、電晶體數是39M,幾乎就接近兩個CPU核心的規模,也就是說,CPU上I/O成長的速度比CPU要大上許多….這點GPU也不例外。
後面後藤老大分析了Tukwila的設計走向曲折過程,簡單地講,Tukwila維持ILP強化的路線,沒有透過縮減CPU core規模來增設更多CPU的方式強化性能、也就是避開了強化TLP的路線,主要的原因是為了現有的軟體資產,所以Intel以強化傳統IA-64結構上的弱點,也就是I/O面上,來做整體的強化,因而造就了超巨大的CPU;當然這是Server市場的產品,其實成本就算是200~300usd,CPU本身一賣就是兩千美金,其實也沒差….
這點則和CELL、G80等針對TLP強化的晶片有所差異。
一概而論本來就不適合沒錯,不過其實好像也可以這樣簡化地看:
CELL沒有過去軟體的包袱,設計其實是偏向一個輕易可擴充的DSP系統(還包含了省電元件的採用、自動迴路設計等等方針),所以朝向TLP的方向走;GPU主要的軟體資源由於透過API虛擬化的關係,所以底層的設計細節可以有一定程度的掩蔽,G80更利用這個方式,透過CUDA的架構,把SIMD的結構隱藏在Scalar的表層底下;而CPU大概就不容易這樣走….
但是不管核心的怎麼性能強化,I/O沒有跟著強化自然是快不起來….
偏偏I/O強化就會遇到先前45nm CELL的時候討論到的問題:analog相關的部分在製程上縮小比其他部分困難,結果就是I/O周圍的成本比例上提升得會比其他的數位邏輯部分、或者是記憶體快。
然後就看到這個….
http://www.fudzilla.com/index.php?option=com_content&task=view&id=5605&Itemid=1
基本上G80和R600相比,記憶體頻寬明明比較小,但是記憶體控制器從hotball老大的心得來看,和CELL SPE的MFC/DMA contorller一樣可以吃非常多的outstanding request,延遲雖然明顯拉長(G8x約500cycle前後、CELL約1000cycle前後),但是透過結構(multi-threading or 大量register)可以吸收掉。
如果考慮分支的大小(32pixel per warp,但是執行卻是以half-warp為單位),G80的ALU很可能是double-pumped,8個SP很可能其實是double-pumped的4D,整個G80就變成只有”64個1D shader”了。從這角度來看,ALU占的規模很小,吃的主要還是register file和內部的fabric…..然後G80做得比R600徹底,剩下的就是倍速shader帶來的差異了。
所以如果RV770真的要在最小變更下把RV670給加快,可能就只有加上倍速shader了吧….不過NVIDIA目前下一代(G100? GT200?)似乎還是打算做超強的單晶片,這和宣稱要用四個RV770拼起來的R780似乎又有一點路線上的差距;另外一個敵人是從HPC市場圍堵GPU往GPGPU發展的Larrabee,這邊大概規模也小不下來。
總之超大型晶片現在是越來越難生了….