從GTS360M的洩漏消息開始思考

http://vgaclub.blogspot.com/2009/11/nvidia-geforce-gts-360m.html

NVIDIA GeForce GTS 360M

既然右下角都寫DirectCompute 4.1（SM4.0）那大概就不會是Fermi了吧….

不過這也有可能是GPU-Z在誤判就是了。

http://www.fudzilla.com/content/view/16170/34/

Nvidia leaks Geforce 3xxM series

從305~310M來看，大概又是個改名商法….除非Fermi真的要做到快速的上到下展開，問題是現在好像很難期待NVIDIA的chipset能有什麼市場空間，就算消費者想要也拿不到。(除非拿Atom的授權自己做？）

http://www.engadget.com/2009/11/10/nvidia-tablet-mystery-solved-an-odm-tegra-prototype/

NVIDIA tablet mystery solved: an ODM Tegra prototype

用ARM+現在手上的GPU作Tegra則是另外一條路，只是對手的PowerVR也不是省油的燈。

至於ION的話非得外接在CPU外頭，CPU又只能用現存的core所以頂多只能再做一兩年。

http://bbs.pczilla.net/thread-5002-1-1.html

NVIDIA Fermi(GT300) 光线追踪演示

其實從server性能宣傳上進步十倍、成本降低20倍之類的話，可以知道CPU急起直追純GPU的腳步是很快的，加上整合shader之後就更明顯了。

不論是以什麼形式，Intel認為只要承載能力和規模繼續成長就避不開整合，所以最後能活下來的只有作CPU的廠商，x86的驗證成本則成為高不可攀的門檻….然後ARM則是讓所有廠商都可以變成CPU製造商。

對NVIDIA而言，想走入x86市場的話目前還能用的資源還剩下transmeta（走Dynamic Binary Translation、code morphing）或者VIA的現有CPU core，但是這兩個對目前的x86 desktop而言競爭力都嫌太弱，然後ARM要衝上desktop市場還要很長的時間，現在要把ARM+desktop GPU拿來當日常工作+gaming的話也有疑問。

當然把gaming改走雲端的這點考慮進去的話，一般user買大規模GPU的機會就更少了，為了server端在追求的電力效率使得GPU走超大規模的機會也還是存在；或者是AMD的Liano那樣直接用Fusion來並聯會是個好主意？從server服務大量user的觀點來看，那樣好像又嫌太弱了，單獨GPU為了爭取記憶體頻寬變成Xeon般的暴力集合體應該是可以預見。

—-

http://pc.watch.impress.co.jp/docs/column/kaigai/20091202_332618.html

Larrabeeの切り札「シェアードバーチャルメモリ」

CPU側がセットアップしたデータ構造が、そのままGPU側からバーチャルメモリスペース上のデータとして見えるため、話は簡単だ。

アクセス権さえCPU側から与えられれば、データ構造を崩すことなく、直接取ってくることができる。

用相同ISA的另一個利點:用分頁為單位來共享記憶體空間，光是資料結構能夠保持就有很大的差別。

—-

http://pc.watch.impress.co.jp/docs/news/20091202_332819.html

NVIDIA、128SP搭載のQuadro FX 3800Mなど3製品

Quadro FX 2800Mは、MXM型のモバイル向けモジュール。主な仕様は、SP数が96、対応メモリが256bit 1GB GDDR3。DirectX 10.1、OpenGL 3.2に対応。最大消費電力は75W。

Quadro FX 3800Mは、MXM型のモバイル向けモジュール。主な仕様は、SP数が128、対応メモリが256bit 1GB GDDR3。DirectX 10.1、OpenGL 3.2に対応。最大消費電力は100W。

http://www.nvidia.com/object/product_quadro_fx_3800_m_us.html

Quadro FX 3800M

CUDA Cores 128

Shader Model 4.0

OpenGL 3.2

Microsoft DirectX 10.1

EnergyStar Enabling Yes 10:1 (10W Idle)

Maximum Power Consumption 100W

哪冒出這些128sp、256bit GDDR3但卻有DX10.1的玩意兒….O_o

這不就是在公開講G92可以支援DX10.1嗎….)a

還是真的有GT2x0系列、96sp以上、256bit記憶體介面的產品存在？

要不就是單純筆誤的機會最大吧老實說….

在〈從GTS360M的洩漏消息開始思考〉中有 7 則留言

由於雲端Game Server用的GPU,其性能需要同時分享
給許多用戶,不能太過依賴time sharing,
因為全都輪流算圖的話,Latency會很嚴重.
這讓我突然想到RV870的同時輸出6個畫面以及
多Kernal同時執行的能力.
雲端的大規模GPU必須同時處理大量用戶的需求.
….未來雲端GPU應該會更廣泛擴大這兩種能力.
FUSION這種處理器是設計來符合單一用戶的需求.
大概不適合用在雲端Server,但是也許可以
用在PC Client端(如果PC也搞雲端遊戲?)
畢竟PC比Console複雜多了,起碼要能跑舊遊戲舊軟體.
4核CPU+中階GPU還是必須的.
也就是隨製程進步,最後FUSION變成像目前Atom一樣小.
能力足以跑舊PC軟體,也能當雲端遊戲PC Client端硬體.
Console的話就可以便宜到ARM+硬體解碼器就搞定….
反正運算全靠Server.
所以就算遊戲雲端化,Console在成本上以及普及率上
應該還是有明顯優勢.
>>從server服務大量user的觀點來看…..
>>….變成Xeon般的暴力集合體應該是可以預見。
從記憶體使用效率來看,讓一組Server硬體
都跑同一個遊戲會比較恰當,
由於每個Client端可能跑遊戲的不同場景關卡.
所以一個雲端遊戲上百GB的資料,應是一開機
就全部讀到記憶體,不會有Loading的情形.
因此雲端的繪圖系統恐怕一定會做的非常暴力,
多晶片+超大頻寬+超大記憶體.
(這種訂製的東西可以不管PC單卡300W和尺寸上限)
一組Server實際上是一堆用戶在分攤成本,
所以價格不是主要問題,
但製程和die size永遠有上限,就算不管良率,
光罩尺寸限制Die Size最大就是600多mm2.
要讓一堆人同時跑高畫質遊戲,恐怕一定要多晶片化.

DX10.1的話怎么還會只是Shader Model 4.0，應該Shader Model 4.1了。
這本身是沖突的嘛，所以肯定有筆誤了。

新东西是有的
Quadro FX 3800M
怀疑这东西是40nm的G92
不过阉24SP一组又像是GT200衍生来的

Geforce 3xxM series…..
改名商法? 裡面該不會還有G92吧….XD

24sp一組的話，怎么湊得出128sp……

雲端的多重輸出應該不太會依存GPU本身的frame buffer，因為有辦法直接整合到輸出途徑內才對，GPU本身也有可能整合一些M-JPEG的codec之類，輸出可能會是用幾十個起跳。
> 要讓一堆人同時跑高畫質遊戲,恐怕一定要多晶片化.
這時候應該是多卡化而不只是多晶片化。
目前的多晶片建立在「中階performance層數量最多」所以高階用中階來兜多晶片，但是雲端的話會是偏高階的數量最多，頻寬效率最好，所以同樣多晶片卻會是以製程的經濟上限，而不是以零售市場的數量上限為基準，所以我想晶片規模會變大，但不是說一顆可以了事。

老實說改名商法+筆誤最可能啦….QuadroFX的G92 mobile的確好像還沒出過。

發佈留言取消回覆

waffenss表示:

2 12 月, 20092:37 下午

由於雲端Game Server用的GPU,其性能需要同時分享
給許多用戶,不能太過依賴time sharing,
因為全都輪流算圖的話,Latency會很嚴重.
這讓我突然想到RV870的同時輸出6個畫面以及
多Kernal同時執行的能力.
雲端的大規模GPU必須同時處理大量用戶的需求.
….未來雲端GPU應該會更廣泛擴大這兩種能力.
FUSION這種處理器是設計來符合單一用戶的需求.
大概不適合用在雲端Server,但是也許可以
用在PC Client端(如果PC也搞雲端遊戲?)
畢竟PC比Console複雜多了,起碼要能跑舊遊戲舊軟體.
4核CPU+中階GPU還是必須的.
也就是隨製程進步,最後FUSION變成像目前Atom一樣小.
能力足以跑舊PC軟體,也能當雲端遊戲PC Client端硬體.
Console的話就可以便宜到ARM+硬體解碼器就搞定….
反正運算全靠Server.
所以就算遊戲雲端化,Console在成本上以及普及率上
應該還是有明顯優勢.
>>從server服務大量user的觀點來看…..
>>….變成Xeon般的暴力集合體應該是可以預見。
從記憶體使用效率來看,讓一組Server硬體
都跑同一個遊戲會比較恰當,
由於每個Client端可能跑遊戲的不同場景關卡.
所以一個雲端遊戲上百GB的資料,應是一開機
就全部讀到記憶體,不會有Loading的情形.
因此雲端的繪圖系統恐怕一定會做的非常暴力,
多晶片+超大頻寬+超大記憶體.
(這種訂製的東西可以不管PC單卡300W和尺寸上限)
一組Server實際上是一堆用戶在分攤成本,
所以價格不是主要問題,
但製程和die size永遠有上限,就算不管良率,
光罩尺寸限制Die Size最大就是600多mm2.
要讓一堆人同時跑高畫質遊戲,恐怕一定要多晶片化.

afxif表示:

2 12 月, 20094:08 下午

DX10.1的話怎么還會只是Shader Model 4.0，應該Shader Model 4.1了。
這本身是沖突的嘛，所以肯定有筆誤了。

sss表示:

2 12 月, 20095:33 下午

新东西是有的
Quadro FX 3800M
怀疑这东西是40nm的G92
不过阉24SP一组又像是GT200衍生来的

waffenss表示:

2 12 月, 20099:48 下午

Geforce 3xxM series…..
改名商法? 裡面該不會還有G92吧….XD

afxif表示:

3 12 月, 200912:48 上午

24sp一組的話，怎么湊得出128sp……

Eji表示:

3 12 月, 20092:57 上午

雲端的多重輸出應該不太會依存GPU本身的frame buffer，因為有辦法直接整合到輸出途徑內才對，GPU本身也有可能整合一些M-JPEG的codec之類，輸出可能會是用幾十個起跳。
> 要讓一堆人同時跑高畫質遊戲,恐怕一定要多晶片化.
這時候應該是多卡化而不只是多晶片化。
目前的多晶片建立在「中階performance層數量最多」所以高階用中階來兜多晶片，但是雲端的話會是偏高階的數量最多，頻寬效率最好，所以同樣多晶片卻會是以製程的經濟上限，而不是以零售市場的數量上限為基準，所以我想晶片規模會變大，但不是說一顆可以了事。

Eji表示:

3 12 月, 20093:00 上午

老實說改名商法+筆誤最可能啦….QuadroFX的G92 mobile的確好像還沒出過。

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

Eji的碎碎念

從GTS360M的洩漏消息開始思考

在〈從GTS360M的洩漏消息開始思考〉中有 7 則留言

發佈留言取消回覆

現在只剩下黑歷史….

在〈從GTS360M的洩漏消息開始思考〉中有 7 則留言

發佈留言 取消回覆

現在只剩下黑歷史….

發佈留言取消回覆