Firmware 1.82 相關資訊

28 6 月, 2007 Eji 5 則留言

英文
http://blog.us.playstation.com/2007/06/26/firmware-182-coming-soon/
http://www.computerandvideogames.com/article.php?id=166710
日文
http://www.ps3-fan.net/2007/06/ps3ver182h264mpeg4.html

H.264/AVC High Profile支援，基本上應該會改善畫質。

話說因為BD雖然有同時decode兩個Stream的需求，但是其實片子本身的流量限制在56Mbps、所以單一decoder最大不會接受超過40Mbps。同時能執行兩個40Mbps的decoder已經很overkill了….可是，如果是本來的Stroage Media Player的話，那根本不會有雙stream的播放需求，而且很可能反而因為硬碟的關係，而需要面對更多高流量高壓縮的Stream，所以有需要的話其實應該可以做到比BD Player的decode能力還好。如果考慮利用RSX內部的PureVideo HD，加上CELL的性能，以及完全解除雙stream保留的SPE數量限制，能decode的stream可能可以強到非常驚人的地步….當然一來還有Remote Play的保留資源、PureVideo HD用下去不知道能不能繼續搭配Remote Play等等都是問題。

http://en.wikipedia.org/wiki/H.264
Main Profile在Level 4.2可以到的流量最大是50Mbps，但是High Profile的話可以到62.5Mbps。

根據NVIDIA的文件，G8x的PureVideo HD比起G7x多提供的功能有：
1. H.264 Decode Acceleration with IDCT and CAVLC/CABAC
2. VC-1/WMV Decode Acceleration with IDCT
由於這些功能，G8x的話用single-core就可以順利播兩個stream、G7x的話則會需要dual-core。但這些讓CELL做應該都是小case。XD

話說這到底算是功能追加還是功能修正….

[EDIT]
說放就放嗎orz
更新立刻就放出來了….

http://www.watch.impress.co.jp/av/docs/20070628/sce.htm
AVWatch的相關測試。AVCHD的部份因此改善，現在*.m2t可以直接抓到，包含Panasonic HDC-SD3與Canon iVIS HR10所拍攝的影片都可以直接播放。

順便做了PS3-ESATA的測試。

手邊的eSATA外接盒(STARDOM I302-1S-SB2)雖然是抓到了，但是PS3關機時，外接盒的電源要跟著關。
不然的話在外接盒電源維持開啟的狀況下讓PS3獨自重新開關機的話，會抓不到這顆有USB2.0雙介面的硬碟。
猜測是晶片組本身的不相容問題…. 解法應該是找尋直接連結的eSATA獨立外接盒。

此外，透過備份功能，順利地把包含記憶在內(本來的說明會讓人以為個人資料裡面的記憶不會轉過去)的資料轉換到新硬碟上。
如果PS3以後可以支援samba，提供往NAS備份 & 從NAS回復的話，那會更棒。

—–
補充：HQV分數
360 premium score 20/130 <–包含VGA cable
PS3 Pre 1.80 update 38/130
Ps3 Post 1.80 update 88/130

http://www.pcmag.com/article2/0,1895,2136482,00.asp

Uncategorized

SONY CSL開發中的混音引擎”MMG”

26 6 月, 2007 Eji 1 則留言

http://www.watch.impress.co.jp/av/docs/20070625/dal287.htm
基本的觀念很簡單，他會將曲子先掃描過、然後以掃描結果產生metadata。這個metadata包含的資料有:
1. 小節
2. 速度與拍子
3. 類型(如intro、前半段、後半段、間奏、尾聲等等)
4. key
等資訊，所以能將曲子分解成一小塊一小塊的部份，然後便可以任意重組與混合，產生自己的曲子。

其次，因為將曲子本身分成part等零件來看，所以可以以此來作為搜尋不明曲目的根據。

目前雖然以著作權的觀點來看，你無法把作為混音用的原曲與新曲放出，但是混音過程產生的metadata本身卻是沒有受到限制的，所以這個部份資訊可以放出，然後同樣有著這些曲目素材的人，就可以透過散佈這些metadata的方式，來產生remix的結果。

目前這個產生metadata的系統，其實早就在SONY自己內部採用了，並且作為CDDB般的功用。只是實際的詳細判斷是以人來控制，實際上也是人來作比較快而且準確，MMG等於是一個很適合透過控制這些Metadata來作混音的程式引擎。

好，那這與PS3有什麼關係呢….？訪談內提到，以盡早推出的觀點，他們目前會優先推出手機用及PS3用的版本。（！！！）

也就是說PS3可能會在未來的音樂播放功能內，加入非常強大且易用的remix功能，並且會有這些data上載用的網站，可以像nicovideo般上傳、與其他user即時回應、甚至ranking等。甚至也有可能使得沒有名氣的原曲走紅也說不定。

看著看著，我想到 “おっくせんまん” 了啊。(雖然那是配詞不是remix….)

Uncategorized

G86的64bit和128bit封裝不同有感

23 6 月, 2007 Eji 發佈留言

http://www.hkepc.com/bbs/news.php?tid=810961
8400GS、G86-213
http://www.pcinlife.com/article/graphics/2007-04-18/1176863400d349_3.html
8500GT、G86-300

從這兩張照片可以明顯看出，G86有64bit和128bit兩種封裝，各自用在8400GS以下與8500GT以上….
可以拿來實證做得到用封裝來分兩種不同的記憶體介面寬度嗎？

Waterball：這是理所當然的，可以回想一下Socket 754和Socket939。

8500GT的ROP是8個、8400GS是4個，所以應該是每4個ROP（or quad）為一組、各連接64bit Memory。

沒錯的話，G84很可能晶片本身有16個ROP切四組，各自64bit最大256bit，然後以封裝區分產品；甚至G80本身也應該是總共8組ROP，只是用封裝做成現在這樣，理由前面提過了，如果考慮Texture Address能力的話，G86和G84這方面都是和記憶體頻寬可以配合的。(G86：1TCP有8個TA、G84：2TCP有16個TA、G80的8TCP有32個TA與64個TF，以TA存取記憶體、TF存取Texture cache，所以也合這個觀點）

當然封裝區分太細的話反而提昇成本，所以我們看到8800GTS和8800GTX/Ultra之間只用空焊沒用封裝區分。

所以G8x的總合結構整理如下：
G80 — 8TCP、32TA、64TF、32ROP、512bit
G84 — 2TCP、16TA、16TF、16ROP、256bit
G86 — 1TCP、8TA、8TF、8ROP、128bit

也就是說，與其說G80是Double TF、不如說是TA減半：TF由於與Texture Cache關係比較大，所以Texture Cache很可能也是和TCP個數成比例的。G80和G84之間的SP數量，可以看作對die size等半導體資源最大的讓步所在，這也讓die size的差距(484mm^2 vs 170mm^2)變動明顯，除此之外G8x家族內與記憶體頻寬相依的部份規模變動都有線性關係。如果考慮ROP的壓縮能力改善、TMU filter能力強化、支援材質格式的增加來看，雖然個數上是16TMU+16ROP、但是性能很可能不弱於G70的24TMU+16ROP。也就是說現在G84在舊遊戲方面的表現稍弱於7900系列，某些狀況自然是與DX10支援佔掉shader 的raw performance有關沒錯，但也應與關閉的ROP與記憶體介面這部份有關，G84目前以封裝封閉這些資源，目的應該是為了配合G7x高階的庫存出清，等到7900存貨解決之後，應該就有機會推出256bit、16ROP版的G84。(要看市場需求，如果對手無力的話其實可能也不會出？)

當然相較於出清掉的7900GTX，價位是另一個問題。目前台灣市場的7900GTX 512MB甚至有五千元台幣出頭左右的行情出現，8600GTS 256bit能有這種價位嗎？
另外一個明顯的對手是8800GTS320，甚至也有可能推出更低規格的8800系列，競爭力應該都會高過8600的256bit….不過這篇主旨是在討論G84的規模與電晶體資源的利用為主。

TSMC 80nm製程、289M電晶體、170mm^2的die size，和TSMC 110nm製程、304M、334mm^2的G70，或是TSMC 90nn、278M、196mm^2的G71的G70相比，進步遠大於製程帶來的改善，NV50的結構優勢的確讓人刮目相看。
同時也可以看出一個G8x現有的缺憾：NV50的SP原始設計應該是4D Vector轉為1D Scalar的同時，將SP提升到四倍左右的時脈，來維持性能。(注意：G8x的shader時脈與週邊ASIC並非整數倍率，可以完全浮動)
不過很可惜因為製程的關係沒有達到這個遠大的目標….

此外，G8x成功地將Texture Address與 Texture Filter運作分離之後，未來G9x有可能再強化這個部份。

Uncategorized

每日一緒七月份update

22 6 月, 2007 Eji 發佈留言

照例應該會在7月1日就上線….

10. 七月夏季新物品登場
9. cosplay 泳衣：切西瓜遊戲
8. cosplay 浴衣：盆踊りゲーム
這是定番了….XD

7. toro station結束之後，接上FLASH NEWS(遊戲專用報導)
遊戲部份的功能獨立出來的話，內容可能會開始傾向其他的日常物。
為了配合這一點才會有1 & 2兩點吧。
FLASH NEWS目前是不定時。

6. Store增加電光揭示板
直接報導新物品狀況

5. 電視支援RSS Feed(並支援瀏覽器直接閱覽）
4. 電視支援MusicStation(播放硬碟媒體)
這兩個屌了….XD
上回訪談才剛提到就馬上加進來，我開始懷疑這些功能SDK文件都沒寫了。
話說正常的話toro們的動作應該會反應音樂內容，這也很讓人感興趣。

3. 新增抓圖功能（SELECT鍵）
這是什麼誇示用功能….XD
直接會存到XMB的圖片功能裡面。

2. 邊看Toro Station累積miyairu
(新聞閱覽點數，刻意搞成mile XD)

1. miyairu累積之後可以直接用累積的點數買商品
另外會有一個點數兌換店。玩遊戲之類的其他活動也會累計XD
所以錢買不到(目前線上交易只能買擺設)的東西會用這邊增加。

Uncategorized

NVIDIA Stream Processor “Tesla”公佈

21 6 月, 2007 Eji 發佈留言

http://pc.watch.impress.co.jp/docs/2007/0621/nvidia.htm
NVIDIA終於還是拿出他們的HPC品牌了。

C870，全長PCB、1.5GB GDDR3、無輸出端子(空焊)、peak超過500GFLOPS。
這個peak數據可能代表G80 A3版真的把missing MUL修復了，只是用Driver做區隔，只在Stream Processor市場開啟。
不然8800Ultra應該全部都是A3版….

D870，使用Quadro Plex的外殼，裝載兩張C870，注意PCI Express外接結構目前已經認證為正式的Gen2。

S870 Tesla GPU server，4張G80的無風扇版、1U Rock Mount，這是這次最主要的新產品。
整個Tesla Solution會在2007年八月正式推出，相關文件到時候也會放出來。
值得注意的是，NVIDIA表示會有雙GPU產品，可能代表8950GX2的存在….

不過一個實話是，和GPGPU相比，CELL和Larrabee這一系列從CPU出發的處理法應該會對HPC需要的programming style比較友善，而AMD和NVIDIA如果不把依存於GPU結構的部份改掉(如Frame Buffer、Texture等)，那麼限制會一直存在；可是對AMD就算了，對NVIDIA來說GPU是主力產品，為了遷就GPGPU而去影響GPU的性能這點應該是無法被接受的，所以所有廠商(IBM、Intel、AMD、NVIDIA)裡面只有純GPU廠商的NVIDIA在態勢上會比較頭痛。

NVIDIA可能要在StreamOut的部份下很多苦工，才能夠以單一的設計既維持GPU的性能、又提供更好的GPGPU操作特性給HPC市場；AMD則不見得有辦法同時提供Larrabee類似的結構與適用於GPU的結構，這不見得是技術問題而是AMD還有沒有足夠的資源養好幾種不同的設計案。

參考： ECE 498 AL : Programming Massively Parallel Processors
http://courses.ece.uiuc.edu/ece498/al/

Uncategorized

MotorStorm日版update第一印象+小心得

20 6 月, 2007 Eji 發佈留言

好，MotorStrom日版終於推出update了，沒有變成黑歷史…. XD
不過如果才推出這麼短時間就出現黑歷史片的話，只怕大概會沒人敢買新遊戲….

從日本PS Store抓相關檔案回來之後，進行安裝。檔案在硬碟裡面的版號標為ver 1.2。
第一印象是”照樣放原片啟動”，我以為像這樣一開始不支援硬碟安裝的遊戲，後面會變成”從硬碟啟動時要求放光碟”，結果裝完之後就和”一開始就支援硬碟安裝”一樣，直接從光碟啟動減少混淆，這點還不錯。

進入遊戲之後Online mode順利出現、在使用規約之後就進入了日本區的lobby，機器是台灣機、使用的帳號也是台灣區的帳號。
看來SCE並不想徹底貫徹分區，有人買水貨片照樣讓他玩？看來以後如果出IM＠S的話可能真的可以照樣玩。(不過要購物大概就沒轍了)

連線品質還不錯，雖說自己是SEEDNET ADSL、也有使用NAT，不過並沒有感受到連外有頻寬或是回應速度上的問題。遇上車禍的時候果然也是維持即時進行….orz
話說明明是Beginner Lobby，怎麼大家好像還蠻厲害的orz

總之目前來說狀況都不錯，boosterpack vol1短期內即將推出，繼續期待中….XD

Uncategorized

後藤老爹Larrabee連三篇

19 6 月, 2007 Eji 發佈留言

http://pc.watch.impress.co.jp/docs/2007/0611/kaigai364.htm
Intelが進める、32コアCPU「Larrabee」
http://pc.watch.impress.co.jp/docs/2007/0618/kaigai365.htm
IntelのLarrabeeに対抗するAMDとNVIDIA
http://pc.watch.impress.co.jp/docs/2007/0620/kaigai366.htm
GPUライクな構造が想定されるIntelの「Larrabee」

http://www.impresswatch.com.cn/itwatch/441/3395441.shtml
對岸對第二篇的授權翻譯。

後藤老爹該不會是手上準備好資料等著其他網站講吧…. XD
整理起來如下：

1. Larrabee是Many-Core系列的第一個產品，歸類於”High-Thoughtput CPU系列”，也就是說相對於GPU廠商來看的話，就是”針對GPGPU市場、然後兼具GPU功能”的結構。
所以有Larrabee卡的Intel PC，就是個system-level的Many-Core結構，想成只有SPE的CELL卡，裝進PowerPC970之類的一般PowerPC就會比較單純。
日後Larrabee的小CPU會再整合進一般Intel x86裡面，這時候的x86就會兼具高速高thoughtput與複雜OOOE執行能力….. 然後都是x86。

2. 一開始會投入32core、一年之後會以製程微縮版投入48 core版，當然也有從32core版關閉部份核心所衍生的24core版。
不過這邊就會出現一個問題：這時候到底怎麼算core數量？是以Vector指令的發射單元來算、還是每個SIMD ALU來算？
尤其是4thread、16D Vector之類的部份，這很可能會大幅影響core數量的算法。

3. Pat Gelsinger表示”2008年會有Larrabee的運作demo”，還有其他消息來源指出”2008年底～2009年初”會有正式製品。
不過因為前述，這個產品屬於CPU的特性，需要軟體支援，沒辦法像GPU一樣一出來就有某個DirectX版本來配合運作，所以這個產品”小試身手”的意味濃厚。

4. 開發的單位是開發P4的奧勒崗。似乎是半數人力做Nehalem、半數做Larrabee的樣子。
照2002年的說法，2004年時會推出Nahalem的關係，現在就可以看得出來當年到底發生什麼事情，讓它大幅延遲。

5. 以目前來說Larrabee最大的特性是堅持x86 ISA。以Pat Gelsinger當年在講Many-Core的時候的說法，就是”種類不同但是ISA相同的core”混合處在同一個CPU die上面，針對不同特性的code以不同結構的core執行，並且有數個core共享的Cache，以提高可程式化的性能。然後會有特殊用途使用的單元以及需要的I/O介面。所以Larrabee(再強調一次)不是以GPU來執行GPGPU工作的產品，而是針對(GPGPU這些)特殊用途特別設計的Intel ISA processor，可以(比GPU)提供更好的通用性。也就是說它不是GPU而是CELL。
倒是說到GPU，Intel的GPU team本來也有計畫推出自己的獨立GPU，不過因為沒什麼風聲，有可能已經取消了。

6. Larrabee的用途是針對所有高平行度的工作，所以”當然還是包含繪圖”，只是因為並不專精(很可能沒有繪圖專用的ASIC)，連會不會以GPU產品的形式出現都不知道。
Larrabee在繪圖面的表現完全要看它到底具備了多少比例的繪圖用單元，畢竟Raster、Texture這些動作如果都用CPU來處理的話，實在效率太低。
雖然做了相當長時間的研究，不過總之目前來說Larrabee目前計畫中似乎並不重視繪圖。所以最可能的用途還是HPC。(如果對遊戲的話，很可能是PPU + TCP offload卡市場？)

7. CPU與GPU對ISA的態度是差異很大的CPU有大部分的狀況都會維持ISA的一貫性，但是GPU因為通常都會提供runtime來當中介，所以不僅廠商之間沒有維持ISA相容的狀況，連廠商的不同世代產品都很有可能出現ISA的變化，如G7x與G8x之間ISA就有很大的變化，GPU廠商也因此通常不會公開GPU的ISA。
所以Intel既然堅持x86 ISA，就可以視為其實是以CPU的觀點來看待Larrabee產品，ISA公開、而且與主CPU相容。當然這點很單純，因為x86 ISA的資產非常有價值，Intel Many-Core結構的最基本戰略，就是以x86 ISA當後盾。
Intel認為，平行處理本身已經夠複雜了，視不同處理用途分配到不同性質的核心更加複雜，在這些複雜到爆的東西上，加上不同ISA的話實在會造成programmer們太大的負擔。當然異種(ISA)混合短期內可能會很有效，但是隨著ISA變化，軟體資源會越來越難繼承，所以Intel不打算混合異種ISA。要注意的是Intel的看法裡面，所謂的同異種指的是ISA不同，而不是CPU本身的實作取向不同。所以只要OS能辨認不同種類的相容Core，就可以簡單的管理整個CPU資源。

—以下第二篇—

8. NVIDIA和AMD其實都差不多在五年以前，就幾乎同時開始號召GPGPU的用途。而Larrabee的開始時間則差不多是四年前。也就是大家幾乎是相同的時間點開始研究的。
對GPU廠商而言，Larrabee有可能會一口氣搶走GPGPU這個廣大的市場，當然是非常大的問題。而且NVIDIA還有CPU要是整合GPU功能的話，GPU廠商將無法在中低階市場獲利的絕大危機，所以如果它只專注於繪圖功能的話，很可能將會無法繼續存活下去。所以為了增加GPU存在的價值，NVIDIA有必要賦予GPU更多的用途，自然GPGPU就成了重點，而Larrabee也成了最大的敵人。

9. 在AMD的眼中，Larrabee是個很意外的存在。因為他們的情報指出Larrabee是個比較接近GPU的產品。(夾雜Dave Orton訪談)
他們在最後終於知道，Larrabee”以高平行度的小core來「順便」處理繪圖工作”，剛好與他們”整合GPU core的設計來順便處理高平行度的工作”相反；當然Larrabee這樣一來就很有可能在繪圖面的競爭力不足。
然後AMD則是手上有繪圖單元，所以部分的能力有競爭力；那AMD的高平行度工作面的處理能力呢？這就是爭論的重點了。
AMD的人認為以x86的結構很難設計出有效率的高平行度單元，所以從GPU的設計取材，想把它整合到x86的ISA裡面；但是CPU與整合進來的GPU本身則互不影響設計，GPU裡面不會有CPU的ISA，以維持GPU本身的運作效率。
除了先前推出的CTM，AMD在R600推出時，也推出了AMD Compute Abstraction Layer(CAL)來讓CPU與GPU之間能做更仔細的融合，就是打算配合這一點。

10. NVIDIA的部分，則是認為既然手上沒有x86 ISA相關的IP，自然不會採行與Intel/AMD這樣有x86 IP的廠商相同的戰略。NVIDIA目前的打算則是繼續以手上的設計來做出性能最佳的GPU、然後處理在這個設計下可以跑出最佳效能的應用。也就是既然做為GPU廠商，只能把GPU做到終極的境界，然後以此為出發點。今年(2007)年底NVIDIA就將會推出支援64bit FP、單晶片1TeraFLOPS的產品。

—以下第三篇—

11. Larrabee的性能可能達到單晶片1TFLOPS，不過包含G9x、4PE版CELL其實也都有同等的能力。

12. Larrabee由於是CPU，時脈有很大的可能高過ASIC，IDF06的時候Intel發表的研究結果指出，相比於OOOE、In-order的小型core可以在1/4的面積下(在適當的程式下)達到同等的thoughtput，所以相對起來同等die size的性能等於可以達到4倍，考慮4GHz的話，等於可以達到100GFLOPS的程度。這自然是高過ASIC(GPU)很多，不過要讓Larrabee達到1TFLOPS的目標來說還嫌不足，所以Larrabee可能還要比上述的In-order core還要單純。原理上來說，如果以45nm的話，Larrabee有機會用現有(65nm的)Core2Duo程度的die size，達到TeraFLOPS的性能。
這時候就會發現，為了避開ASIC的問題，提高ALU的單位性能，G80引入倍速shader有多麼重要。

13. 前面提過Larrabee的”16D(16way)”單元的結構會大幅地影響core數量，如果真的是4個4D vector unit連結在一起的話，那兩種不同的算法立刻會出現4倍的落差。過去疑似Intel的Larrabee基礎研究資料中，就出現了16way(512bit)的Vector Unit。可是如果真的是4D vector x4的話，那遇到4個1D scalar的時候很有可能會因為in-order的關係造成大量浪費…. 和NVIDIA與AMD目前的結構相比，Intel Larrabee畢竟還有太多謎團的關係，這部分只能等待時間解明。

14. threading的部分Larrabee目前看來比GPU的能量少得多，GPU目前的threading控制大多是32~64個thread為一個切換單位(GPU的說法就是batch or warp)，對Larrabee的16way來說，可能就會變成4cycle的切換；但是以x86、4GHz程度的高頻來說，ALU能夠在4個cycle內執行完指令的機會就變得比較小，只好和R600與G80一樣採用多組warp互相切換的做法；可是Larrabee目前的說法是硬體thread只有4個，和GPU準備了數十到近百的batch等待切換相比，顯然有很大的落差，所以Larrabee的設計應該與GPU廠商這部分的設計有落差。
但是GPU廠商這部分的設計與繪圖處理有很大的相關性，尤其是繪圖部分由於存取的資訊(材質)大、cache miss的場合明顯較多，所以大部分狀況都有可能直接存取記憶體，自然會需要較多的thread來隱藏記憶體造成的延遲。
相比之下Larrabee有內建相當的cache、較少的thread，因為通用處理會有比較大的機會產生資料的區域性、並且減少記憶體的存取。相比之下就比較朝向通用處理而非繪圖處理。

以上是目前後藤大叔以還非常少的洩漏資訊為基礎對Larrabee的推測。

Uncategorized

Panasonic發表45nm、Full HD雙串流解碼對應的 SoC「UniPhier」

19 6 月, 2007 Eji 2 則留言

http://www.watch.impress.co.jp/av/docs/20070619/pana.htm
http://pc.watch.impress.co.jp/docs/2007/0619/panasonic.htm
http://techon.nikkeibp.co.jp/article/NEWS/20070619/134483/

45nm SoC、250M transistors…..然後對應Full HD雙串流decode(最大24Mbps、耗電量約4~4.5w)、MPEG2 to H.264 Transcode、3D顯示核心、對應雙Tuner、提供3stream同時分配，Demo的狀況下提供BD觀賞時直接對另一台PC與手機(PDA？)進行Tuner串流配信。
65nm下做Full HD的話，die size與耗電量和過去的SD用chipset相比會達到兩倍；45nm的話則可以解決這個問題(面積削減39%、耗電量削減30%)。
同等功能下過去需要4個chip與11個外部記憶體，現在UniPhier全部整合後只需要4個memory chip。

可以看到Panasonic放了很多附加功能進去，來確保它的競爭力，這可以看成是對CELL的對抗意識也說不定；不過這個其實可以看出CELL的優勢，因為UniPhier以ASIC為主但規模卻高達250M….但是CELL加上SCC用軟體做的話其實也勉強可以提供上述的功能，只是CELL的耗電量相比之下就很可怕了，不是一般player設計上可以接受的。

Uncategorized

Toshiba展示自動設計研究成果：縮小CELL SPE面積約30%、1.4v下時脈達4GHz

17 6 月, 2007 Eji 發佈留言

http://techon.nikkeibp.co.jp/article/NEWS/20070616/134354/
東芝がCellのSPUを完全自動設計，面積を30％削減しつつ4GHzの周波数を達成

東芝がマイクロプロセサ「Cell」のSPUを完全自動設計で実装した例を紹介した（講演番号5-4）。通常の設計フローに加えて，ローカル・クロック・バッファの分配，太幅配線を使用することによるCR時定数の削減を別途追加することにより，オリジナルのSPUと比較して30％の面積削減を達成している。この場合，速度はオリジナルなものから10％程度低下する。それでも，論理合成・自動配置配線により実現したチップとしては，知りうる限りでは最高周波数となる4GHz（電源電圧1.4V）を実現している。

http://www.beyond3d.com/content/news/275
Toshiba presented a 4GHz synthesisable SPU at symposium

With the 7.07mm² IC fabricated using a 65nm CMOS process, the logic area is around 20-30% smaller than its custom design alter ego produced on the same node, but it’s also 10% slower (for chips operating at the same frequency). The chip operates at 4GHz with a voltage of 1.4V.

面積小30%、同時脈效率低10%，1.4v的時候可達4GHz；當然這比原始的SPE最高可達的時脈(65nm下1.5v時SPE約可達7.2GHz、全晶片full load約6GHz)低得多….不過還是相當有趣。

Uncategorized

結果Wii 到底改了哪些地方？

17 6 月, 2007 Eji 1 則留言

相關訪談

整理起來是：
1. 記憶體系統的頻寬提昇、容量提昇
2. TMU double（8 to 16）
所以畫質的改善是靠容量提昇，然後這些性能成長差不多480i到480p就用盡了。XD
功能面真的是連XBOX初代都差得遠了….

Eji的碎碎念

每月彙整: 2007 年 6 月

Firmware 1.82 相關資訊

SONY CSL開發中的混音引擎”MMG”

G86的64bit和128bit封裝不同有感

每日一緒七月份update

NVIDIA Stream Processor “Tesla”公佈

MotorStorm日版update第一印象+小心得

後藤老爹Larrabee連三篇

Panasonic發表45nm、Full HD雙串流解碼對應的 SoC「UniPhier」

Toshiba展示自動設計研究成果：縮小CELL SPE面積約30%、1.4v下時脈達4GHz

結果Wii 到底改了哪些地方？

現在只剩下黑歷史….