R700相關的多晶片GPU雜感

Fudzilla R700 to carry Radeon HD 4000 name
Fudzilla R700 is a low, mid and high end chip
Fudzilla R700XT to touch 2 Teraflops
Fudzilla R700 mini core is 72 sq mm
Fudzilla R700 is a 45 nanometre chip
Fudzilla R700 is indeed a multi core device

都說是FUDzilla了,到底有幾分可信呢?總之光從字面上來看看吧。

照這些說法,R700是以單一核心多晶片組成的產品線,構成的單位是72mm^2、每個核心300M電晶體的程度。其實以65nm的G86約80mm^2就有210M電晶體以上(以G86直接縮小來推算)來說,45nm下72mm^2放300M是很正常的,重點是到底哪來45nm製程可用?

其次,由於低階的核心很可能只有64 or 128bit,四個核心構成256 or 512bit,如果要單核心構成的話,就必須實作NUMA,否則光是四倍容量的材質浪費,就大到完全沒辦法接受。(實際上現在負擔盡可能轉到shader上的關係,對記憶體頻寬的依賴是盡量在減低的,不見得會有512bit)

這樣的話,要實作HyperTransport上去嗎?
HT對GPU來說有點複雜,不過卻可以配合AMD現在手上的HTX,不失為一個方法。
只是說真的,要在GPU上跑NUMA,材質頻寬的需求是很顯著的,目前最高16GB/s的HyperTransport說真的除了cache同步性之外和PCIe其實沒什麼高下之分,對GPU來說這種程度的頻寬可能不太充分….

總之,四顆晶片要達到2TFLOPS的話,帳面上單晶片會有500GFLOPS,與RV670差不多;而RV670其實扣一扣不需要的東西直接縮小(比方說256bit縮成64bit、材質單元數量跟進),應該也可以達到類似的性能,剩下的就是四顆UVD之類的浪費了。

對G8x來說的話,帳面數字應該會比較吃虧一點,如果真的照先前的說法,要實作3TFLOPS的話,那1D路線就不太能繼續用下去了;反過來說,因為1D設計的效率大家有目共睹,不如說3TFLOPS這數字本身就沒什麼意義?

nicovideo vs secondlife

http://internet.watch.impress.co.jp/cda/event/2007/11/22/17620.html
Second Lifeとニコニコ動画の同期性、”後の祭り”と”いつでも祭り”

http://www.itmedia.co.jp/news/articles/0711/23/news005.html
なぜ「ニコ動」は盛り上がり、「Second Life」は過疎化するのか

雖說這些分析通常都只是錦上添花而已,而且沒辦法解釋為什麼nico在日本以外的地方不受歡迎。XD
不過,自己覺得說起來台灣有個和nico的性質很接近的東西,就是BBS的推文。
如果把丟水球當成IM的話、那推文就是所謂的時間推移性了。

當然影片播放的時候”允許user在特定時間點插入comment”這點,是niconico最重要的服務性質。
因為youtube底下的comment無法讓你感受到”針對影片特定部分”的回應`;但是推文可以讓你看到對一整個討論串的其中一篇的反應,所以自覺有點接近。
所以說刻意把nicovideo的”擬似同步”抓出來當成創新要素來解釋的話,似乎有點危險。

總之雖然他們想得很複雜,實際上可能是更單純….
而且,nico和secondlife很顯然都是針對特定族群的關係,相對於最近的成功例(DS/Wii放棄特殊族群的藍海策略)來說,相對地是比較沒有發展性的。
反過來說,DS/Wii也有”新的族群消費力相對較低”的隱憂存在,所以還是有必要在競爭激烈的環境下衝刺。

總之,nico我現在還很支持,不過這種追捧我就覺得省省吧。

LoV的框體….

LOスクエニ、AC「ロード オブ ヴァーミリオン」
AC用初となるオリジナルタイトルを投下

スクエニ、AC「ロード オブ ヴァーミリオン」 AC用初となるオリジナルタイトルを投下


框體是和三國志大戰同類型的磁卡框體….所以目前來說卡片系統和框體都是由SEGA佔位站得好好的。
昨天討論到這玩意兒要移植家用的時候會遇到什麼問題,我是覺得就像三國志大戰會上DS一樣,他們所有的獲利全部寄望在卡片上,寄望在人家看著看著就想投錢玩、看著就想投錢買卡片的心態;
壓根兒沒打算花腦筋把那個系統移植到家用硬體上,畢竟當初一開始用這種磁卡系統,不就是為了維持Arcade的獨佔性嗎?

PS Eye跑Cybercode主要是為了卡片不需要正對攝影機都可以快速辨識,所以把二維條碼的資訊做得很簡單….如果硬做的話就會變成某EOJ那樣圖片小小一塊。

SN system資源加入PS3 SDK

http://www.scei.co.jp/corporate/release/071119a.html
「プレイステーション 3」タイトル開発環境を大幅強化
~開発効率の向上、多様な開発スタイルへの対応によりPS3®ゲーム開発を強力に支援~

ProDG等工具的無償化、Reference tool機半價、compiler與linker的效率改善、分散build….這些都是有用的功能沒錯,
不過最有用的應該是ProDG從這次的update開始,可以在debugging station(可以跑燒錄片的原機,PS/PS2/PS3都有這種版本的機器)直接執行。

さらに、機能改良によりこれまでPS3®のリファレンス・ツールのみでサポートしていたProDGがデバッギング・ステーションでも使えるようになり、大幅にコストを抑えたPS3®のタイトル開発が可能になります。
(by 新聞稿)

這些機器的編號是DECHA00J/DECHA00A(美版),大台的1U RACK機的編號則是DECR-1000/ DECR-1000A(同前)。
即使半價了還是95萬日幣、或者一萬美金左右;但是debugging station大概除了每家廠商要流水號之外,和一般的PS3是一模一樣的。
所以這下效率立刻就高起來了….

這讓很多人攻擊的「初期用開發機測、所以上實機難管理記憶體、結果變成開發機跑預錄動畫」之類的狀況有機會改善….
如果原因真的是某些人講的這樣的話,那用debugging station直接跑應該可以改善才對。

雖然我其實不懂這句話的來由是啥…._A_

PHL敗眼傳說再現

http://www.watch.impress.co.jp/av/docs/20071116/rt047.htm
開発陣が語る「新DIGA」の能力
- 「新Uniphier」で「PHLチューニング」が生きる

10月29日の週のGfK Japanの集計結果では、BD搭載モデルの台数シェアが、DVDレコーダ全体に対して15%近くを占めるに至った。
市場の移行がこのままの勢いを持続するとすれば、今冬は、各社が狙った通り、「国内BD市場離陸」が実現されることになりそうだ。

聽起來好像很厲害XD
不過總之這篇的內容主要是AVC encoding/decoding的tuning。
尤其是UniPhier的部分,45nm下包辦AVC encoding、graphic、BD-JAVA和I/O全部通通一顆搞定。

而且Encoder的部分因為是把MPEG2-TS抓進來直接transcoding,所以訊源就會變成1080/60i。
所以很多encoder其實縮成1440×1080在錄,但是這回PHL的幫助下,UniPhier可以搞定這點,就變得很有趣。

「ビットレートに余裕があるHGモードやHXモードは迷わず横解像度1,920ドットを選びましたが、(AVC記録の)最低ビットレートであるHEモードで、1,920にするか、1,440にするかは、慎重に検討しました。一般に、ビットレートが低くなると符号化ノイズが増えるため、解像度を落とした方がトータルの画質が良くなるケースがあるからです。ただし、やみくもに解像度を落とせば画質が上がるというわけではありません。解像度を下げれば、その分、本来の映像が持つ大切な高域信号が確実に失われるわけですから。大切なのは、高域の映像信号と符号化ノイズのバランスです。ビットレートを下げた時に、高域の映像信号を残す効果より、符号化ノイズの増加が支配的になった場合は、解像度を下げた方が良いという判断になります。どのくらいのビットレートまで 1,920でいけるかは、エンコーダが発生する符号化ノイズ量によりますので、つまりエンコーダの実力次第という事になります。我々のエンコーダでは、 HEのビットレート(5.7Mbps)でもトータルの画質は1,920の方が良いと判断しました」。

順道,這篇還回應了先前AVCREC不支援MPEG2-TS的說法:實際上是支援的。
另外,小寺信良的DMR-BW900 Review也提到了PS3很可能有打算支援AVCREC….錄出來的檔案其實可以照播,只是聲音規格目前不吃。
可能container還是和AVCHD很像的關係吧。(*.m2t/m2ts)

不過BW900的BD播放畫質大概真的會把好久沒有再改善的PS3電下去…._A_

PS3 2.01預告

http://blog.us.playstation.com/2007/11/16/firmware-v201-coming-soon/
Via playstation blog。2.0才剛出一個禮拜,2.01又要出啦XD
以目前的說法是穩定性更新,應該不會忽然就有DivX playback吧….?XD

[EDIT]
http://goten.jp/2007/11/071120.html

HDD 20/60GBの初代PS3のSACD再生機能で、光デジタルからのマルチチャンネル出力ができなくなっている。マルチチャンネル収録のSACDについては、ステレオで光デジタル出力しているようだ。

所以SACD多聲道轉DTS 5.1輸出沒啦~ _A_
SPDIF輸出全部變成立體聲….
感覺上把多聲道轉DTS 5.1似乎是韌體內建功能?
不然要刻意搞出這個”bug”好像也不容易。

此外,從internet作Remote Start似乎會有不正常自動開機的狀況,所以多了一個time out之後自動關機的功能,internet啟動選項也會跟著被disable。(不影響LAN內啟動)

IBM用RoadRunner來demo iRT,跑Boeing 777的模型

http://gametomorrow.com/blog/index.php/2007/11/09/cell-and-the-boeing-777-at-sc07/

史上第一台完全用數位設計的客機,波音777。
聽說這個複雜到炸開的模型總共有350M triangle…..乘上4byte,這代表這東西光Model的vertex量就已經 1.4GB了,實際上的總模型資料量更高達29GB….然後IBM拿LLNL RoadRunner來搞real time ray tracing。

你們真是神經病XD > IBM。

http://www.sci.utah.edu/%7Ewald/Publications/2006/boeingManta/download/mmshm.pdf
2006年這個demo用128 processor、256GB的1.5GHz Itanium2 SGI系統來測試,112個processor用在ray tracing。126個processor的話,1024×768勉強40fps。
因為模型實在太大了,很難用GPU處理。

在SC07上,IBM跑demo的狀況依照原文描述是:

In the IBM booth at SC07 the 350M triangle Boeing digital mockup will be rendered real-time at 1080p resolution using a hybrid cluster of Cell processor based QS21 blades and a Ridgeback (AMD Opteron) memory server.
The Ridgeback holds the 25GB digital model in its memory and services blade data request via NFS RDMA over 2GB/sec InfiniBand.
Each blade is responsible for a dynamic region of the screen and therefore only requires a fraction of the digital model to be cached in its local 2GB memory.
These regions are further subdivided among the local SPEs which DMA via software caches from the address space of the Opteron forming a memory hierarchy that’s transparent to the programmer.

—————–128GB———— 2GB————- 256KB
(x86 disk) -> (x86 memory) -> (Cell memory) -> (SPE local store) -> (SPE register file)
——–120MB/sec—— 2GB/sec———- 25GB/sec———50GB/sec

Ridgeback這個型號是4U的IBM x3755,最大頂多4顆Dual-core Opteron。(就算偷換成quad-core,也頂多16個K8 core)。
然後總之x86 Server存了25GB的總model data,然後用2GB/s的 InfiniBand 傳給QS21 CELL blade。
因為是跑iRT,主要的負擔應該都在CELL blade上,x86 server只負責管理模型和材質資料而已。

實際效果和數字等IBM扔出來。XD

[EDIT]
IBM的人回應了,他們用了一個Blade Center H rack,所以1個5U BCH有14張QS21,總共28個CELL、224個SPEs、接近6TFLOPS。

社長が訊くWii Fit

http://d.hatena.ne.jp/rkmt/20071116/1195197490

素晴らし過ぎです。モノづくり、とくに新しい『モノ』を作るためのエッセンスがすべて語られているような気がする。
ああもうやばすぎるぐらい勉強になる。
再読しててあっと思ったが、これこそ『真面目ナル技術者ノ技能ヲ、最高度ニ発揮セシムベキ自由豁達ニシテ愉快ナル理想工場』そのものではないか。

重點是,你是SCE的技術人員啊XDXD
既然會去羨慕人家的開發環境,那麼SCE裡面的環境和氣氛應該不會好到哪去。
當然想想現況的確是很難好起來啦….

反過來說,如果能夠容納這樣的社員、並且希望他們把自己本社的環境改善。
能夠往上進步、而非往下沉淪的話,SCE才會有希望吧。

Vol.1
「趣味からはじまった」
「誰もつくったことのないモノ」
「形を決める」
「いろいろなアイデアが活かされたトレーニング」
「自分の体を意識することの大切さ」

Vol. 2
「お相撲さんから生まれたアイデア」
「鍋まで使ってつくった、数々の試作品」
「二転三転したボードの形状」
「足で操作するコントローラ」