http://www.computerbase.de/news/hardware/grafikkarten/2007/juni/larrabee_fakten_intel_highend-grafikkarte/
http://bt.pa.msu.edu/TM/BocaRaton2006/talks/davis.pdf (補上原檔)
原來這就是Intel Larrabee的真面目….?
http://www.beyond3d.com/content/articles/31/
這兩篇之間有些相輔相成的作用。
因為原文是德文,這邊只討論勉強看得懂的圖片….

別的圖不看,這張圖看下去馬上就脫口而出”顯示卡”…..
49.5 x 49.5 mm也太誇張了吧?(不過這有可能是package面積、和pin-count也有關)

CELL的影響還真大…. _A_
(上面那張圖藏在底下,要靠pdf Editor挖出來)
順道,我覺得JPG texture不是好點子….
Tib:CELL “DID” the right thing!!

系統組態圖,這還真像K8…. XD
不過I/O的部份有不少神經病的東西….

大概是同時期x86 High-end(4~8 core)的十倍運算能力。
不過他們只是把x86 core改成in-order就要上了,弄到16~24 core,這樣一些x86結構上造成的overhead應該會蠻驚人的吧?
x86在這個範疇內完全沒有任何優勢啊?
[EDIT]
http://molesterwaterball.blogspot.com/2007/06/intellarrabee.html
水球自己也寫了一些東西….XD
如果把上面的表格整理出來的話會得到下面的東西:
1. 因為是in-order CPU core,指令管線大約是P54c的程度,但是有具備4threads的FGMT和SSE,每個core有4組浮點運算單元,於是通常浮點是2FLOPS,SSE2+化之後是8 or 16FLOPS。
一個core的規模大約是數千萬(幾十M)電晶體的程度。
2. core內建L1 32KB、透過ringbus共享數塊L2 256KB。由於是傳統的cache結構,所以這個架構的底層還是與CELL有很大的不同….
這是水球那邊Intel人員跳出來回應的時候的持論,但是這就和PowerPC與x86的不同一樣….其實我們知道他們不會抄CELL的結構,但是他們跟著CELL去實現相同的觀念(透過內部網路集合多數簡單core來提供高運算量),這就夠了。
3. Ring-bus結構,256byte/cycle,考慮1.7GHz ~ 2.5GHz的話,頻寬大約是435.2GB/s ~ 640GB/s,每個core大約分到40GB/s。(這個剛好符合後面的DP peak,與SPE/EIB的每port 25.6GB/s相同)
比較值得注意的是Gesher的通用core也是用這樣的ring-bus。
4. 對外記憶體頻寬是128GB/s,可能是256bit、1Gbit、1GHz的GDDR5顆粒,1~2GB的容量。
也就是說大家能負擔的pin-count其實都差不多…. eDP CELL也是 256bit DDR2。
5. CSI的頻寬是17GB/s per link、兩個port、50ns的延遲。
6. 有Fix-function unit 和 Texture unit,所以其實對象是已經不見了的CELL Graphic;輸出入單元則可能會靠外接模組接上去。