CELL computing Board參展 SIGGRAPH07

http://www.sony.co.jp/SonyInfo/News/Press/200708/07-070/index.html

8/7的SIGGRAPH07上,SONY要展出CELL + RSX的”CELL computing Board”。
從19吋1U Rack來看,有可能是SDK硬體再改良過的版本。(目前為止SDK應該是2U的大小)

展示的內容:物理模擬demo、CG rendering demo…. 這些都還好,不過4K影像的即時處理?!
好,RSX果然有辦法送4K…..orz

—-
PSP-2000支援M-JPEG的AVI了,PS3看來也有機會支援。
container支援之後,接著就是CODEC增加….喔喔喔。

[EDIT]
西川善司放上CELL computing Board的demo詳情。
http://journal.mycom.co.jp/articles/2007/08/24/siggraph08/index.html

雖然採用完全一樣的晶片組,但結構的部分有非常大的特色:
RSX完全沒有記憶體,以FlexIO和CELL形成UMA。

系統方塊圖:
http://journal.mycom.co.jp/photo/articles/2007/08/24/siggraph08/images/004l.jpg

而在會場的demo使用RSX輔助作合成的部分看來非常有效率。

比方說,過去CELL剛發表的時候toshiba做了一個48個SD解析度MPEG2影片合成到1080p畫面的demo,使用到6個SPE來解碼、1個負責合成與縮放。

但是在RSX加速的狀況下,這回CELL跑了一千個SD解析度MPEG2影片解碼,由RSX合成到4096×2160解析度的畫面上。(然後RSX完全只讀寫XDR,沒有自己的GDDR3)

這次的demo最大的意義,或許是證明RSX存取XDR的能力是可以倚重的。

在〈CELL computing Board參展 SIGGRAPH07〉中有 25 則留言

  1. 喔~~!
    這會是未來AV版的PS3(PS3為基礎的新PSX)嗎?
    (純個人幻想…^^a)
    有段時間沒上來了,
    這裡的消息又多了好多,
    一下子消化不完…腦殘中。

  2. 這台機器有兩個問題:
    1. 要不要給XMB?
    給了的話就變成PS3相容機了。
    但是如果給XMB也給Linux的話,那遊戲的安全性就會受到威脅。(如果以現在PS3不給RSX的存取來看)
    但是如果不給Linux完整的存取權限,光是多給256MB XDR實在是沒什麼誘因….
    不過如果下一版韌體就開始教大家怎麼用RSX,就當我沒說過這句話(倒)
    2. 硬體要不要獲利?要獲利的話要不要繼續當獨立市場推下去?
    這是1U的機器,而且展示內容也有Rendering,所以用途裡面應該是有計劃當成Render Farm,那麼他們應該就要做到硬體本身可獲利….但是這玩意兒市場上也是有一堆競爭者的。所以如果要維持它的競爭優勢的話,除了CELL本身的規模增加,最好是GPU本身的性能也能增加….
    那他們該不會有打算找NVIDIA出下一個FlexIO介面的GPU。XD

  3. XMB 只是 UI 而已,跟能否相容 PS3 沒有關係,就算有 XMB 也提供 Linux 對遊戲的安全其實也沒有威脅,只要 PS3 在 Linux 上不開放 RSX 的存取,遊戲一樣不能在一般的 PS3 上執行。
    GPU 的數目並不太重要,主記憶體的大小跟CPU的運算量才是關鍵,Cell Computing Board 的出現並不意外,以 SONY 本身對繪圖電腦的須求量以及後製設備的須求來看,如果能做出自己的系統且能發展起來的話對其集團是很直接的幫助的,以 x86 系統來說同等級的 Xeon 或是 opteron 的系統無論是售價或是耗電跟 Cell Computing Board 相比都是高的多,另一方面 Cell 的規模可大可小而且非傳統 DSP,從這上面發展出的軟體資源可被廣泛的應用,繪圖方面發展出來或是後製方面發展出來的軟體資源都可被轉往 PS3 或是民生用 Cell 產品上面來使用,例如 recorder HDV TV 都有可能用 Cell 來取代過往專門的 DSP,跟 DSP 相比雖然耗電跟製作成本較高,但是產品的開發期將可以有效的縮短,之前的 knowhow 可以更容易的被轉移,如果單純的只以Render Farm 或是 Physic simulation 來看的話這東西的價值並不大,但如果以 Cell Computing Board +Cell software 來看這東西的價值就大的多了,想想光是一堆 AV 後製設備改成以這東西為基礎來做能幫他們省下多少錢就不難了解了。

  4. 重新詳細的看過那連結裡的資料,
    當中寫到Cell的浮點達到230GFLOPS,
    這好像與PS3當初發表的218GFLOPS多了12GFLOPS,
    不知道是從哪冒出來的^^?

  5. 其實我覺得,如果日後SONY的專業機材都變得以CELL為基礎我都不會意外,畢竟RSX其實是有這個本錢的。這時候要把RSX當成Quadro FX SDI等級的硬體來思考,反正其實這時只差在輸出介面和API而已,對掌握IP詳情的SONY而言問題不大。
    230G的話會不會是這樣算的?3.2GHz x 9(SPE + PPE) x 2(MAD) =230.4GFLOPS。
    實話是當初218GFLOPS其實已經是謎般的數字了….

  6. PS3用的cell不是屏蔽的一個SPE(只有7SPEs)
    所以Cell有230GFLOPS
    PS3變成218GFLOPS 少12GFLOPS應該沒問題

  7. 話說那218GFLOPS只是個大慨,
    照PCWATCH的後藤大叔的算法:
    一個SPE於3.2GHz下有25.6GFLOPS,
    PPE則是VMX有25.6GFLOPS加上FPU的12.8GFLOPS,
    所以1PPE+7SPE=(25.6+12.8)+7*25.6=217.6GFLOPS,
    而SCE是否也是這麼算就不得而知了…
    而這230GFLOPS若照Orz兄所說的,
    將屏蔽的SPE算回來又過大,
    但若將PPE中FPU的12.8GFLOPS給減掉,
    那就是1PPE+8SPE=25.6+8*25.6=230.4GFLOPS,
    不過話又說回來”SCE是否也是這麼算就不得而知了”…

  8. 擷取自ps3coderz的同樣報導內文:
    IBM also have a new bridge chip on the way which is better than the existing Toshiba part and / or the PS3 bridge (it might be the same, nobody seems to know!). The new IBM part would be a good candidate for this board but there’s no details on this yet.
    看樣子外界對這版子有很多的猜測,
    真希望會有PS3為基礎的新PSX的現身且量產發售,
    而其規格也期望與這版子相同,
    當然囉~~!價格越低越好…
    (翻開荷包後,發現小弟我只能接受約五萬台幣以內的價錢…錢難賺^^a)

  9. > IBM also have a new bridge chip on the way which is better than the existing Toshiba part and / or the PS3 bridge (it might be the same, nobody seems to know!). The new IBM part would be a good candidate for this board but there’s no details on this yet.
    喔,對啊。
    IBM這個CELL CC非常豪華啊!不過那是針對PC用途就是了。
    http://farm2.static.flickr.com/…dc6ff419ec_o.gif
    PCIe x4 -> PCIe x16 *2
    PCI -> PCI-X
    GbN -> GbN *2
    DDR2 -> DDR2 *2
    內建PowerPC 405 for I/O offload、DMA engine、mailbox等。
    當然相對的本來Toshiba的Super Companion Chip內提供的 ATA-133、AV相關就不見了….
    Mercury的CAB(CELL介面卡)就是用這個南橋。

  10. 嗯~!
    也就是說CELL computing Board若採用這個CELL CC,
    則小弟幻想的”PS3為基礎的新PSX”之規格會與其不同…泣~~
    算了,那小弟繼續幻想另一個新產品:
    PS3為基礎的新VAIO,稱為”PS VAIO”…^^a
    好^^!我承認我最近想太多事了…(腦袋修理中)
    —-轉正題—-
    說真的,
    SONY這麼做爲自己的未來省了不少…

  11. http://www.sidefx.com/…ask=view&id=869&Itemid=55
    搭配CELL Computing Board的3D/影音軟體廠商 Side Effects Software,提供Houdini Escape($1995)與Houdini Master($7995),當然這兩套軟體是Linux版。

  12. http://journal.mycom.co.jp/…iggraph08/index.html
    西川善司的報導,
    當中提到Cell Computing Board整體架構,
    XDR 1GB+DDR2 1GB+PCI Express x4可擴充DDR2 8GB=10GB的記憶體,
    最讓小弟意外的就是RSX沒接任何的記憶體,
    也就是說RSX只有通過FlexIO來存取XDR,
    而RSX存取XDR的頻寬也與PS3版的RSX無異…
    看樣子RSX只有吃FramBuffer而已…^^?

  13. 當初還以為RSX最少會有512MB的GDDR3,
    除了PCI Express x4能擴張的沒小弟想的那麼多以外,
    其餘記憶體和小弟預想的一樣,
    沒想到最後RSX連256MB都沒有(當初預想最多是1GB),
    只不過那比PS3版的RSX還小的頻寬真的可以實作4K的畫面嗎^^?
    不知展示的Demo是否有HDR和AA^^?
    如果有的話,
    應該不是Cell在做吧?(

  14. 先前在大陸那邊討論,使用過PS3的人表示RSX直接存取XDR的時候算是”比一般(透過PCIe)的系統快上非常多”,所以如果考慮這個產品的賣點既然是要CELL/RSX之間彼此頻繁地交錯存取同一塊資料,那RSX自己的GDDR3可能會因為G7x結構的限制而造成阻礙,於是就不裝了。

  15. 裡面有個MPEG2即時合成demo,CELL解碼1000個SD MPEG2 stream、然後RSX合成並且render到4K的畫面上;當初在Toshiba的CELL SDK上,只有解碼48個MPEG2、用SSC輸出到1080p上….. 看來當時的限制是在SSC上了。
    RSX的所有動作都透過FlexIO直接讀寫1GB的XDR,以過去的實測來說,RSX的頻寬應該是15GB/s讀、10GB/s寫XDR,總和剛好25GB/s….其實這總和是已經有128bit GDDR3 1.6GHz的速度了。
    也就是說,這次測試代表看起來把RSX當成和CELL是UMA結構說不定真的行得通。

  16. 現在想想,
    如果照Eji大所說的,
    時間上有充分的允許SONY將PS3的RSX搭載eDRAM的話,
    那GDDR3就有可能省掉,
    取而代之的可能是XDR 512MB的UMA結構…
    不過HDR和AA之類的處理要多少容量的eDRAM才夠呢?
    話又說回來這產品上,
    它的Frambuffer是放在XDR,
    反觀PS3的狀況應該也辦得到吧?

  17. “那RSX自己的GDDR3可能會因為G7x結構的限制而造成阻礙,於是就不裝了。”
    G7x結構上有哪些限制會造成阻礙呢?
    如果是Cell存取GDDR3不佳這點,
    那應該是Cell只能透過PCIe來讀寫GDDR3所造成的吧?

  18. > G7x結構上有哪些限制會造成阻礙呢?
    > 如果是Cell存取GDDR3不佳這點,
    > 那應該是Cell只能透過PCIe來讀寫GDDR3所造成的吧?
    CELL這方面沒有限制,因為全部靠Memory mapping,所以EIB上的所有元件(PPE/SPE/XDR/FlexIO….)都可以互相交換資料,所以CELL如果讀寫GDDR3會有問題,那應該限制是在RSX裡面。

  19. > 不過HDR和AA之類的處理要多少容量的eDRAM才夠呢?
    1920×1080 4x FSAA的話,單一個32bit的back buffer的話大概32MB差不多滿。
    >話又說回來這產品上,它的Frambuffer是放在XDR,反觀PS3的狀況應該也辦得到吧?
    是的,辦得到。

  20. 看樣子PS3若用eDRAM來處理1080P的HDR兼AA,
    且PS3的eDRAM與XBox360的有著同樣的工作的話,
    結果就是1080P+HDR+2xAA會有超過40MB的可能…
    好大啊…OoO!

  21. >RSX的頻寬應該是15GB/s讀、10GB/s寫XDR,總和剛好25GB/s
    話又說回來,
    CELL Computing Board中RSX的頻寬就只有25GB/s,
    這適合做1080P 60fps+HDR+2xAA嗎?
    如果可以的話,
    PS3當初就應該做512MB XDR的UMA結構…
    甚至連eDRAM也不用裝了^^a

  22. 其實這個title還有一個弦外之音:G9x的串聯結構實作。
    CELL computinb Board的結構、RSX的設計證明線性對應定址做得好的話,一個device可以非常有效率地對另一個device的local memory作讀寫,所以其實我們大可把多數GPU用線性定址mapping串接起來,所以要是G92有512bit,那兩個G92就可以256bit對外、256bit互接就可以了。G92的單晶片只要封裝不實作完整的512bit,其實就可以達到產品區隔。
    當然實體層不見得是這樣,可是觀念應該很接近了:既然上層結構(TCP)已經做了切割,那麼要做的其實只是把TCP-ROP中間這段corssbar跨晶片連結起來就可以。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料