NEC + Intel

http://pc.watch.impress.co.jp/docs/news/event/20091116_329293.html

マルチコア拡張の普及版「Cortex-A5」の凄さ

Cortex-A5的耗電性能比猛然很可怕,雖然性能離A9和Atom有段差距,但是把GPU算進去就不會太誇張的感覺。

說起來Tegra現在還是dual ARM11….所以接下來用A5感覺合理得多。

http://pc.watch.impress.co.jp/docs/news/20091117_329472.html

オンキヨー、Intel Capitalから資金を調達しIAベースのMIDなどを開発

Atom這個等級的processor大概性能不會再往上拉了,只是要一路縮小下去。

雖然總覺得web browser吃的資源並不如很多人想得少….

—-

http://pc.watch.impress.co.jp/docs/news/20091117_329468.html

IntelとNEC、スパコン技術の共同開発に合意

所以最後的vector processor獨立製造商NEC也去和Intel合作了。

承繼Earth Simulator的京速計算機計畫又傳出縮小,只剩Fujitsu獨立奮戰。

話說AMD和大陸的機器雖然是GPU第一次進Top500、而且還拿到Top500第五名。

但是Jaguar已經言明打算用Tesla,而且考慮Tesla-20上市是明年Q2,現在應該如火如荼展開中。

還有人有辦法比NVIDIA和Cray合作的這組人馬更早拿到Top500第一名嗎?

然後Jaguar好像是Top500第一台民生用途機器….終於不是核爆模擬一直拿第一名了。

—-

http://www.dns.com.tw/blog/2008/06/google.html

Google資料中心的秘密

http://www.dns.com.tw/blog/2009/08/google-caffeine-google-file-system-gfs.html

Google Caffeine 與新一代 Google File System (GFS)

http://www.theregister.co.uk/2009/08/12/google_file_system_part_deux/

Google File System II: Dawn of the Multiplying Master Nodes

然後Google ChromeOS好像這禮拜發表。

—-

http://www.hosimitu.com/twitter/stotreblog.htm

STOT to HTML

STOT形式のテキストをアイコン取得したりしてテーブルのHTMLに変換します。

プレビュー機能をうまく使えばドラッグ&ドロップで並び替えが出来ます。

twitter用的方便小工具,從Tween整段擷取出來的時候統整變得比較方便。

—-

http://moratorium.livedoor.biz/archives/1882431.html

スクール水着を破ったり伸ばしたりできるフィギュアが発売されるらしい

話說這泳裝既然會破掉,不就變成耗材….(’_’;)

http://sankei.jp.msn.com/economy/finance/091116/fnc0911161303013-n1.htm

女性用の性欲高進剤 バイアグラ並みの”革命”か

血流を促すなど体に物理的に働きかける米ファイザーの性機能障害治療薬「バイアグラ」とは異なり、ベーリンガーの錠剤は脳に働きかけ、精神面の禁忌を取り除こうとする。

這好像很危險O_O)a

雖然基本上就是傳統的春藥….

在〈NEC + Intel〉中有 16 則留言

  1. 把GPU算進去的話,功耗也不會有什么太大的變化呀。
    而且A8才能實現聲稱的4倍性能,當然要是說這個4倍只是flops不是全面X4,那是沒話說。

  2. 也不能這麼說啦,當然CPU本身一定不會是整個手持device中最大的耗電源(通常是液晶面板和無線模組),但也不是可以忽視的。
    在沒有GPGPU運作為前提下,GPU和液晶面板等顯示相關的部份耗電量一起計算的話說服力還頗大,baseband processor的部份如果要維持always on的話主要是要作低耗電的hang-on模式,這點3G和wi-fi都搞得定了….從這點來看的話idle時的電力能夠降低當然還是會延伸不少運作時間就是了。
    全力衝刺不管哪個時代都很難省電的啦….

  3. >>還有人有辦法比NVIDIA和Cray合作的這組人馬更早拿到
    >>Top500第一名嗎?
    天河一號看圖片好像是直接用瀚訊4870×2顯卡
    狂插2560張上去.
    如果再花不到1億台幣應該就可以再買2560張HD5890吧
    反正是PCI-E,升級很簡單,峰值效能馬上衝高4倍?
    天河一號Plus? 天河二號?
    雖然用Intel CPU+ AMD顯卡,這種超級電腦有點PC架構
    硬搞分散運算的感覺…..不過若效能可達到目標,
    成本又低的話, 搞不好會變成趨勢也說不定.
    起碼它可以一直升級@_@

  4. >>Atom這個等級的processor大概性能不會再往上拉了,
    >>只是要一路縮小下去。 雖然總覺得web browser
    >>吃的資源並不如很多人想得少….
    我覺得起碼的上網效能需求大概是eeepc701那等級.
    對只比Arm11好一點的A5不抱任何期待.
    eeepc701 cpu是賽揚M 600mhz,
    (賽揚M可亂序執行,超純量架構,有L2)
    其實它跑web browser IE已經算是夠快了.
    In Order執行的Atom反而至少要800Mhz才能跟上賽揚M.
    能流暢的操作一般網頁瀏覽器的CPU門檻就差不多在這吧.
    相對的,跑WM6.1的ARM11 800Mhz跑任何一種
    web browser都還是非常遲緩……用到非常火大.
    用Iphone3G(Arm11)上網也是相當遲緩.
    大概是因ARM11並不是超純量架構,無亂序執行,
    連L2 cache都沒有,跑起來實在太慢.
    HTC HD2已經開始賣了.
    希望超純量架構有L2的Cortex A8 1Ghz會快一點.
    規格上它應該已經勉強達到MID效能夠用的門檻了,

  5. 自覺超級電腦的技術瓶頸應該會在node間通信而不只是node本身性能….當然node本身只要拔卡就可以升級是很不錯就是了。
    L2 cache controller是option要自己掛上去啊….XDa
    A5我覺得dual-core + L2 cache應該不會慢到哪邊去,雖然我還沒摸過Tegra不知道ARM11放dual-core之後的實力在哪邊,ubuntu跑起來可以順暢的話就夠了?

  6. 「超級電腦的技術瓶頸應該會在node間通信而不只是node本身性能」這句話對身處大公司的小員工,帶來一股淡淡的哀傷….(茶)
    以一臺汽車來比喻HPC系統的組成元件,CPU是「引擎」,Memory是「油箱」,運算Node內的System Bus與外部Node間的連接網路是「道路」,而MPI就是「輪胎」了。

  7. >>IBM cancels Cell Processor development
    這倒一點都不意外.
    Cell的異質CPU註定只是一個走錯路生錯時代的悲劇設計,
    當2002三社開始設計的同時,電腦中大量運算已經趨勢
    轉向GPU. 等Cell上市時,G80和R600幾乎同時銷售.
    根本不需要另一種不相容的CPU核心來專職處理大量運算,
    因為未來有現成的大量SP可以使用在泛用運算.
    而且GPGPU成本更便宜.
    IBM應該早就看出此路不通了.

  8. cell的性能密度比还是很优秀的
    灵活度上,128bit SIMD的粒度是4,要比GPU那两家的32、64好太多。
    而且256KB的Local Store,虽比不上LRB和Fermi的全地址缓存,但是比起RV770、GT200那一批的8KB、16KB是宽裕多了。

  9. >>這倒一點都不意外.
    >>Cell的異質CPU註定只是一個走錯路生錯時代的悲劇設計,
    >>當2002三社開始設計的同時,電腦中大量運算已經趨勢
    >>轉向GPU. 等Cell上市時,G80和R600幾乎同時銷售.
    >>根本不需要另一種不相容的CPU核心來專職處理大量運算,
    >>因為未來有現成的大量SP可以使用在泛用運算.
    >>而且GPGPU成本更便宜.
    >>IBM應該早就看出此路不通了.
    STI從2001年就開始設計Cell了
    而且Cell是05年3月完成的…要比最早的Xenos還早8個月
    大量運算的趨勢轉向GPGPC是最近2年的事
    在2005年的時候又有多少人能預見五年後GPGPU有可能打敗Cell的簡單多核心呢?
    至於走不走錯路生不生錯年代
    我想要是沒有Cell做開路先鋒,我們恐怕還在使用傳統CPU硬算呢

  10. 即始沒有CELL, GPU從C based的高階Shader語言出現
    以及支援fragment的浮點格式時,
    就已經顯露出GPGPU的前景了.
    嚴格說起來應用的時間其實還比CELL更早.
    只不過當初必須透過繪圖API來做,限制太多.
    所以大多屬於實驗性質的學術運用.
    但趨勢已經開始,有沒有CELL都不會影響到這趨勢….
    2005年末的CELL是頭已經洗了一半不能收手,研發了4年,
    一定要想辦法回收,即使眼看當時GPU(R500,NV40)
    已擁有數百Gflops的潛力,風向已經轉向GPU.
    CELL也只能硬著頭皮上場.
    靈活度上,CPU架構的SPE當然是勝過GPU的Shader unit.
    但問題是一個SPE含LS需要25M電晶體以上.
    而一組VLIW的5D Shader卻只要3M電晶體.
    當然這功能上不相等,不過可以看出同單位運算成本下,
    拼峰值效能,CPU包袱太多是明顯居於劣勢.
    如果CELL還有前途,IBM已經投入這麼多,
    絕不會輕易放棄,但現實是…同樣的投資若是用在GPU上
    可以做得更好,發揮空間更大,不會只挶限於HPC的市場.
    Larrabee某方面來說,是考慮CELL失敗經驗後的修正路線
    不再是能做HPC的CPU, 而是針對GPU的需求當出發點,
    用CPU架構來實作GPU.
    Shader unit只要很少快取是因為架構使然.不是缺點.
    它主要是靠大量mini thread來抵消記憶體Latency.
    沒有數百KB的快取或LS反而是GPU優點,因此它可以把
    寶貴的電晶體用在放更多ALU.
    而大量運算需要的就是這種大量ALU單位的蠻力.
    …..其他需要靈活性的運算就讓傳統CPU來做,

  11. 終於拿到ARM 1Ghz的HTC HD2了,
    Cortex A8有L2和SuperScalar加持真的很威.
    之前用4~800Mhz ARM11機種跑yahoo首頁
    大概要6~8秒開完,差點睡著…..
    HD2只要1~2秒開完,而且還是WVGA,真的快太多了,
    幾乎是netbook的速度.
    而且這MSM8250B還是65nm的東西,Atom是45nm卻更耗電.
    ARM這樣的效能/耗電的確很可能威脅Atom在MID和
    低偕netbook的發展……

  12. 我是覺得CELL堪稱「失敗」的點應該不是在架構、運算密度之類的部份,而是在商業模式上。GPU每年靠換製程出新產品都是在擴大規模,CELL也是在PS3上每年換製程出新產品,但是卻都是在縮小規模。
    SPU加上LS的確要25M、但是不加上LS的話,這個幾乎完整的CPU core大概是7M。所以LS為了高速化付出的代價算是非常大的,和一組5D VLIW core的確是不太能比,但是別忘了ATI也沒辦法把這個core做到2~3GHz,否則高速化和與TMU/ROP切離的時脈domain以及interconnection都會讓設計擴大,這就和NVIDIA的選擇一樣。
    反之,CELL和Larrabee最大的差距也的確就是在能不能當GPU來每年擴大、攤償性能成長與軟體開發等等的成本。沒有CELL應該還是會有CUDA,但是沒有CELL倒不像是會有Larrabee。
    shader unit其實還是要很大量的記憶體,ATI的每個SIMD總成(16個5D VLIW core)總共有256KB的thread memory,RV870有高達2.25MB的thread memory來給10個unit使用,NVIDIA這方面投注的成本也不低,G80每個8D的SM有32KB,16個SM總共就512KB;GT200的時候每個SM成長到64KB,30個SM總計就接近2MB。
    ATI的16個5D總共80D卻只有48M看起來很小,那是因為沒把這些記憶體算進去,還有他們保持和TMU與ROP同樣低時脈的關係,這些成本都算進去的話並沒有GPU得天獨厚的感覺,CELL單純就是用console的量拼不過GPU生產和擴大的量,但是2002年的時候我想這方面應該沒有幾個人確信CELL一定會輸。
    而且完全只能靠thread的話,那node interconnection和block sync的成本會很大,所以他們或多或少都還是會加上一些scratch pad memory,只是這邊的成本就完全歸到對HPC市場的重視程度,因為除了DirectCompute,傳統的shader code完全不會用到這部份。
    Fermi的話,SM變成32D但是thread則是128KB,thread和scratch pad cache的總規模都差不多是2MB,基本上說兩邊並重甚至HPC更多已經沒有疑問。
    只是CELL的SPU嚴格檢討起來有不少ISA上的毛病啦。instruction slot在4D的時候就已經用光了沒辦法再擴增運算密度、scratch pad memory的讀寫被切成4塊64KB,每塊內部的記憶體位址不能同時讀寫等等,不過除卻bus上沒有個texture unit,單從HPC用途的角度來看CELL並不會比Fermi要差,這還是得歸到大數法則的感覺。
    關係到HPC效能的還有chip內的interconnection、shader unit的ISA、memory hierarchy、然後是HPC廠商專職的外部interconnection,當然每項都一定是缺一不可沒錯….
    —-
    以前的ARM會慢和沒有L2以及superscalar真的關係很大….Tegra的dual ARM11+GeForce6 ULP不知道表現如何。

  13. 民生用的 Cell 目前應該只有一版吧! 要拿 2009 年的產品來打 2006 上市的產品,然後說性能差這似乎非常的奇怪。
    GPU 在這幾年內路線有許多的修改,但在跟 Cell 比較時卻還是跟這個 2005 年設計出來的產品做比較,然後來證明 GPU 架構比較優越?
    但反過來說 Cell 就算推出16 core 32 core 也沒有市場能賣。Cell 在市場上除了 PS3 外沒有民生用的方案,剩下都只有超級電腦的方案在那邊。只靠這一塊要支撐一種處理器的研發在現在來看一定是不划算的,況且 SONY 在這一塊也早就徹走了只剩他們一家在搞這東西應用面又只有超級電腦會撤算是不意外。
    只能說 IBM 沒有民生方案,另外兩家也不會打進 PC 用板卡市場,在這狀況下要支持 Cell 的研發相當的不划算。而 GPU 能靠大量的顯卡市場來支撐他們的研發,換個方面說是 A N 兩社能以全社的資源來跟 IBM 的一個研發部做競爭發展上自然有所不同。
    至於下代 PS 要用 Cell 再擴張的 32core 版應該也是不成太大問題,只是看 SONY 要不要下單而已。

  14. 沒人拿2009 年產品來打 2006 上市的產品阿?
    是說由於GPU的市場需求讓它有持續發展的動力.
    從2005~2009,GPU變化非常劇烈.
    即使2006年,初代CELL和G80相比,也佔不到便宜.
    IBM就算有民生方案,也沒有這市場可以生存.
    以2006年來看,許多人想要G80.
    但是多少人想買CELL版卡?
    GPU不只用來泛用運算,它在繪圖市場的運用才造成
    商業模式上的壓倒性優勢.
    這和哪一年的產品對比沒有關係.
    而是每年都是這樣的商業優勢.
    就算2009 IBM生出32SPE的新版本,
    商業模式上仍是極端劣勢.
    下一代PS4我不認為還有32core 版CELL
    從2005年Shader3.0以後,GPU已經具備汎用能力.
    與其做32SPE倒不如直接把寶貴的成本用在好一點的GPU.
    PS4的CPU多做幾個好開發的core比較實際,
    我想4核以上的PPE是不錯的選擇
    至於SPE….保留8顆維持向下相容就夠了,
    不要把成本浪費在這種地方.
    CPU效能已不是重點,反正系統大部份運算能力都是靠
    GPU來提供,CPU性能只要堪用就好了.
    ……GPU不行,卻是立判生死.

  15. 一個PPE抵4個SPE,3個PPE的Xenon其實和CELL去掉XDR和FlexIO的大小幾乎一樣,放4個PPE的話看起來SPE就吃一半以下,而且目前SPE大半的使用用途都在於修補RSX的性能上利用的一些deferred rendering技巧,所以這8個SPE真的是只為了相容性而存在的東西….然後就還是得做個EIB在protocol面相容的interconnection。
    偏偏GPU從RSX變成別的東西(目前聽說有可能是PowerVR?)之後,要改的東西大概又超過維持SPE能保留下來的東西。老實說,CELL B.E.裡面容許變動最大的就是PPE這個CPU core,只要滿足特定幾個指令集(基本上就是POWER),然後有放EIB來讓SPE的DMA可以動就滿足條件了。
    但是反過來說,4個PPE然後SPE當option,,不覺得這樣和XBOX360相比根本沒什麼變?(笑)
    乾脆來個Xenon + CELL的single chip package吧,這下兩邊的軟體通通都能跑….XD
    —–
    CELL對SONY、Toshiba來說是個可以任意擴充的SIMD DSP解決方案,有很大的意義在於技術自主之故,45nm下的CELL已經可以足以塞進他們自己的電視和錄影機之類的產品來做靈活的處理,而這個市場GPU要不就是放不進來,不然就是太龐大….
    雖然SONY已經不再作興用CELL的家電,現在CELL只剩Toshiba自社的殘餘價值利用沒錯啦,但是GPU也是要花點精神才能夠在這個市場有成果。
    反過來說,除卻CELL這個對手,Tegra這樣的ARM + GPU產品,在embedded市場也是有和CPU+DSP方案一爭長短的可能性。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料