Penryn 到 Nehalem = K7 到 K8

http://pc.watch.impress.co.jp/docs/2008/0424/kaigai437.htm
Intelの次期CPU「Nehalem」の設計思想は”1 for 1″

Nehalem的1:1改進指的是在嚴守電力效率的狀況下進行改進,所以每加1%的電晶體成本(耗電)必須要有1%的性能提升。
以整體來說單一核心就接近Penryn的1.5x,單一核心的性能也應該至少有這個水準。

而如果把Penryn和Nehalem之間的差距類比的話,就會變成類似當初K7到K8的改進:記憶體控制器內建、I/O強化(NUMA)。
所以雖然Core MA在fetch & decode的一些弱點留存,但是整體競爭力仍然是大幅提升。

當然就像是K8主攻server市場的關係,算是把server產品拿來硬攻desktop;Nehalem也算是產品策略上主攻server的設計。
相對之下Havendale/Auburndale這個雙核心、GPU內建產品,為了主攻desktop市場,就比較沒有Nehalem架構上的好處。(沒有內建記憶體控制器)

由於fetch & decode是x86最大的問題所在,以改良來說實質上「x86本身」已經成為最大的限制,像Nehalem這樣實質半導體預算沒什麼限制的處理器,也沒辦法去改進這點。
Intel 既然以依賴x86資產為策略,那麼這個限制就會永遠卡在眼前。

NetBurst、PARROT(「Power AwaReness thRough selective dynamically Optimized Traces」)都是屬於乾脆盡量不做fetch & decode、以trace cache對uOPs作重複利用的做法。
而這些做法會強化對program localization的依存性,程式的重覆執行頻率越高、性能越好,那麼不可否認的區域性迴圈多、streamming類處理的性能得到改善之外,一般的狀況改善就不明顯了。

—-
以結論來說,x86繼續走下去限制會越來越多,但是由於應用侷限在x86/Windows上,所以CPU發展方向的限制就越來越大….那麼是不是把應用跳脫出x86/Windows就好了?

比方說做個與GPU整合、性能至少與Atom同等的強力ARM processor;更進一步甚至是和現有x86 desktop平起平坐的ARM processor;以性能提升為主軸,把x86(PC)目前占有的完整web application、甚至是BD等高解析多媒體環境都吃下來。因為先天的結構優勢,可以輕易發揮三到四倍的電力效率。

要不然我們都把Atom拿來當成MID device來考量,偏偏其實要說Web是什麼輕量化的應用也很難說,跑起firefox的話EeePC就是比自己的Core2Duo要難受許多。

Atom其實也快侵襲到ARM的市場了….而且現在”已經”擋住ARM高性能的發展方向。

http://pc.watch.impress.co.jp/docs/2008/0115/arm.htm
携帯電話の標準CPU「ARMコア」の現状
~ARM日本法人の西嶋社長に聞く

http://pc.watch.impress.co.jp/docs/2007/1018/arm.htm
ARM forum 2007

目前可得的最高階ARM core “Cortex-A9″是superscalar + OOOE。
以上面的數字來說,每瓦性能似乎比A8來得好….
考慮先前NVIDIA為了耗電量問題沒有在APX2500裡面使用Cortex-A8(但是用了ARM11 MPcore的”單核心”),NVIDIA後續的動作會如何值得注意?

*: APX2500的ARM11 MPcore跑750MHz,所以和內建Cortex-A8 550MHz的TI OMAP3430相比其實實力相近(920 DMIPS vs 1100 DMIPS),而很可能有比較低的成本和耗電量。

—–
有CPU、有GPU,馬上讓人聯想到console…..

http://en.wikipedia.org/wiki/Pandora_(console)
http://openpandora.org/

* ARM® Cortex™-A8 600Mhz+ CPU running Linux
* 430-MHz TMS320C64x+™ DSP Core
* PowerVR SGX OpenGL 2.0 ES compliant 3D hardware
* 800×480 4.3″ 16.7 million colours touchscreen LCD
* Wifi 802.11b/g & High Speed USB Host
* Dual SDHC card slots & SVideo TV output
* Dual Analogue and Digital gaming controls
* 43 button QWERTY and numeric keypad
* Around 10+ Hours battery life

看起來好像不錯!

在〈Penryn 到 Nehalem = K7 到 K8〉中有 7 則留言

  1. 如果只看 ARM 本身的話的確是受到一部分的限制,但如果考量到類似 UniPhier 這類的產品的話情況則又不一樣了。
    ARM 至今仍是在封閉系統中跑,很多優勢都能維持,但如果要走到能跟 x86 desktop 同等性能,一切的問題都會浮現,包括了製程技術,跟驗證能力都是,換個方面來說他們可能也不會想走到那一步,畢竟在限用途的機器上他們是很夠用的,況且多數消費者所用的也就是這些受到限制的用途而已。

  2. 前幾期我記得Eji就提到未來X86處理器的X86部分只是為了兼容而存在,而不是為了性能而存在的。
    AMD搞處理器集成APU,英特爾搞Larabee。
    此外,近年來處理器有所突破的設計我覺得也就3個,安騰、Cell還有Sun的Rock,但是前兩者無論是性能需求還是市場需求都沒法替代本公司的主流產品,第三個Rock能不能替代UltraSPARC系列還未可知。

  3. 前幾期我記得Eji就提到未來X86處理器的X86部分只是為了兼容而存在,而不是為了性能而存在的。
    AMD搞處理器集成APU,英特爾搞Larabee。
    此外,近年來處理器有所突破的設計我覺得也就3個,安騰、Cell還有Sun的Rock,但是前兩者無論是性能需求還是市場需求都沒法替代本公司的主流產品,第三個Rock能不能替代UltraSPARC系列還未可知。

  4. > 如果只看 ARM 本身的話的確是受到一部分的限制,但如果考量到類似 UniPhier 這類的產品的話情況則又不一樣了。
    問題是,”如果現在的Firefox要搬到x86以外的平台”的話,有什麼CPU的整數性能可以維持現在desktop環境的性能?
    其實就是把full browser跑得很順暢(和desktop一樣?)的程度。
    剛剛去補K了一些資料,如果看ARM公司扔出來的資料,Cortex-A9的4core組成看起來有辦法滿足這個要求:他們表示Cortex-A9 666MHz 單core 和Pentium3 1GHz基本上是可以對抗的(當然耗電量小非常多);而由於Intel宣稱Atom差不多和Dothan同等實力的關係,看起來其實是和Cortex-A9 4core不會真的差很多….
    那麼如果加上GPU整合的話,要跑順full browser應該不是很困難,比方說TI的OMAP4系列就有Cortex-A9 + PowerVR SGX。而Nokia顯然是不會考慮Atom….
    > ARM 至今仍是在封閉系統中跑,很多優勢都能維持,
    > 但如果要走到能跟 x86 desktop 同等性能,一切的問題都會浮現,包括了製程技術,跟驗證能力都是,
    > 換個方面來說他們可能也不會想走到那一步,畢竟在限用途的機器上他們是很夠用的,況且多數消費者所用的也就是這些受到限制的用途而已。
    如果主要功能一直是手機的話,那我想真的是不會有什麼改變;現在的問題是應用範圍的擴充。
    x86的應用範圍很難擴充的原因是因為(相對)規模龐大,占空間的desktop本來就很受制肘。如果手機可以做很多事情的話當然是相對起來就不錯;但是full browser在手機上用起來畢竟還是不太舒適….
    製程和驗證能力部分我倒是不會很擔心耶,畢竟他們也是賣IP core給人家搭上去,結構又天生簡單很多。當然以他們公司的規模來說是很微妙的狀況,畢竟他們的core驗證時間已經很長了。

  5. > 如果只看 ARM 本身的話的確是受到一部分的限制,但如果考量到類似 UniPhier 這類的產品的話情況則又不一樣了。
    問題是,”如果現在的Firefox要搬到x86以外的平台”的話,有什麼CPU的整數性能可以維持現在desktop環境的性能?
    其實就是把full browser跑得很順暢(和desktop一樣?)的程度。
    剛剛去補K了一些資料,如果看ARM公司扔出來的資料,Cortex-A9的4core組成看起來有辦法滿足這個要求:他們表示Cortex-A9 666MHz 單core 和Pentium3 1GHz基本上是可以對抗的(當然耗電量小非常多);而由於Intel宣稱Atom差不多和Dothan同等實力的關係,看起來其實是和Cortex-A9 4core不會真的差很多….
    那麼如果加上GPU整合的話,要跑順full browser應該不是很困難,比方說TI的OMAP4系列就有Cortex-A9 + PowerVR SGX。而Nokia顯然是不會考慮Atom….
    > ARM 至今仍是在封閉系統中跑,很多優勢都能維持,
    > 但如果要走到能跟 x86 desktop 同等性能,一切的問題都會浮現,包括了製程技術,跟驗證能力都是,
    > 換個方面來說他們可能也不會想走到那一步,畢竟在限用途的機器上他們是很夠用的,況且多數消費者所用的也就是這些受到限制的用途而已。
    如果主要功能一直是手機的話,那我想真的是不會有什麼改變;現在的問題是應用範圍的擴充。
    x86的應用範圍很難擴充的原因是因為(相對)規模龐大,占空間的desktop本來就很受制肘。如果手機可以做很多事情的話當然是相對起來就不錯;但是full browser在手機上用起來畢竟還是不太舒適….
    製程和驗證能力部分我倒是不會很擔心耶,畢竟他們也是賣IP core給人家搭上去,結構又天生簡單很多。當然以他們公司的規模來說是很微妙的狀況,畢竟他們的core驗證時間已經很長了。

  6. 嗯…. 比較對象好像不太對?Itanium是幹不掉x86沒錯….
    但是PowerPC單獨的core是已經”死掉”了,PowerPC已經沒有desktop的產品線,只剩下console市場的custom產品;而根據IBM的文件,POWER7目前也有打算整合異質運算的關係,所以主流產品實質上就是CELL本身了。
    Rock的話,其實那是應用導向的設計,”代替”UltraSPARC這種說法是不是適合,個人持保留意見。

  7. 嗯…. 比較對象好像不太對?Itanium是幹不掉x86沒錯….
    但是PowerPC單獨的core是已經”死掉”了,PowerPC已經沒有desktop的產品線,只剩下console市場的custom產品;而根據IBM的文件,POWER7目前也有打算整合異質運算的關係,所以主流產品實質上就是CELL本身了。
    Rock的話,其實那是應用導向的設計,”代替”UltraSPARC這種說法是不是適合,個人持保留意見。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料