http://pc.watch.impress.co.jp/docs/2008/0129/kaigai412.htm
2つのCPU開発チームに競わせるIntelの社内戦略
表面上是為了把CPU的開發時間透過兩個team交互填補的方式,把新架構的推出時間縮短為兩年。(再加上製程變更時機,看起來就像每年都有新產品)
但是另外一個目的則是為了讓兩個開發team(奧勒岡與以色列)在社內互相競爭的方式,以加速CPU開發的腳步。
不過,有那麼多資源還交互競爭的話其他人就追不上了_A_|||||||
只是兩個team的路線也有所不同:奧勒岡專注於性能(如P6、Netburst)、以色列則專注於電力效率。(如Core MA)
這回Nehalem的擴充也很明顯:同樣4core下,SPECint2006有1.6倍、fp2006則有2.4倍以上的提升。自然還沒有人拿到東西來測,不過Nehalem整個變得很大顆,自然會有大幅擴充才是。
理由則是因為記憶體控制器。
這邊有句話很有趣:「これまで、Intel CPUの浮動小数点演算性能がなぜ悪かったのかは、社内でも議論になっていた。しかし、メモリボトルネックを考慮しないパーフェクトメモリでのシミュレーションを行なうと性能はちゃんと出る。大きなネックがFSBにあることは明らかで、そのために、Nehalemではそこを取り去るアーキテクチャを取った」
完美記憶體系統下的模擬….這好像很微妙。_A_|||||
其實P6用共享FSB來做SMP來把成本壓低,是x86能以低價打下4CPU以下的低階伺服器市場的重大因素;不過也留下了性能上的缺點讓K8可以趁虛而入。
所以現在記憶體控制器也該放進CPU了;頻寬改善之後,就可以發揮所謂”在完美記憶體系統的模擬下理應可以發揮的性能”了?
所以記憶體系統性能改善,外加提升性能到TDP限界為止的策略,讓Nehalem整個變得很大顆,耗電量顯然會很驚人;
只能說這是當初沒有考慮Nehalem而直接衝E8400的一個重大因素。_A_
然後以色列的Sandy Bridge是Nehalem系列的後繼(32nm),是把規模維持做前提,改善結構的方式來提升效率。(不過這兩個應該不是同一個結構?)
結果就變成32nm的Sandy Bridge的浮點性能已經有1core 28GFLOPS(4GHz with SSE)的資訊出來(前述的完美記憶體模擬?),剩下的就是剛加進來的記憶體控制器結構上的效率改善,來改善耗電上的”贅肉”。
另外一個有趣的則是CPU+GPU,Nehalem的desktop系列目前還是MCM的方式結合;但是海法Team則對這個方式有所批判,畢竟他們當初曾經設計過Timna,而他們的評估是結構上沒有問題,但是因為RAMBUS當時因為高價問題整個在市場上已經沒有聲勢可言,所以cancel了Timna。
但是Timna的時代,GPU進展遠不如現在瘋狂;現在的GPU core規模大進、結構也常常翻新,如果沒有抓好時機的話,整合進CPU的GPU core很可能一下子就被淘汰掉。
當然一個方式就是MCM,但是要設計on-die的話,可能最後的方式就是模組化、以及內部匯流排網路的設計,據稱Sandy Bridge有類似CELL的ring-bus,就很適合拿來做各種不同模組的整合。
這樣的話GPU和CPU的設計就比較不會互相影響;但是基本上on-die之後就不能改變的問題還是不變。
只是其實仔細一想,CPU能整合的GPU規模本來就大不到哪去,中低階市場的需求本來就沒有時時跟著最高階的進步起舞;所以整合時機做得好的話,CPU內不大但符合需求的GPU一把抓住市場需求的機會仍然很高。
—–
俄勒岡有一堆天才、海法則是統御良好的部隊;那總部聖塔卡拉拉呢?