從GTS360M的洩漏消息開始思考

http://vgaclub.blogspot.com/2009/11/nvidia-geforce-gts-360m.html

NVIDIA GeForce GTS 360M

既然右下角都寫DirectCompute 4.1(SM4.0)那大概就不會是Fermi了吧….

不過這也有可能是GPU-Z在誤判就是了。

http://www.fudzilla.com/content/view/16170/34/

Nvidia leaks Geforce 3xxM series

從305~310M來看,大概又是個改名商法….除非Fermi真的要做到快速的上到下展開,問題是現在好像很難期待NVIDIA的chipset能有什麼市場空間,就算消費者想要也拿不到。(除非拿Atom的授權自己做?)

http://www.engadget.com/2009/11/10/nvidia-tablet-mystery-solved-an-odm-tegra-prototype/

NVIDIA tablet mystery solved: an ODM Tegra prototype

用ARM+現在手上的GPU作Tegra則是另外一條路,只是對手的PowerVR也不是省油的燈。

至於ION的話非得外接在CPU外頭,CPU又只能用現存的core所以頂多只能再做一兩年。

http://bbs.pczilla.net/thread-5002-1-1.html

NVIDIA Fermi(GT300) 光线追踪演示

其實從server性能宣傳上進步十倍、成本降低20倍之類的話,可以知道CPU急起直追純GPU的腳步是很快的,加上整合shader之後就更明顯了。

不論是以什麼形式,Intel認為只要承載能力和規模繼續成長就避不開整合,所以最後能活下來的只有作CPU的廠商,x86的驗證成本則成為高不可攀的門檻….然後ARM則是讓所有廠商都可以變成CPU製造商。

對NVIDIA而言,想走入x86市場的話目前還能用的資源還剩下transmeta(走Dynamic Binary Translation、code morphing)或者VIA的現有CPU core,但是這兩個對目前的x86 desktop而言競爭力都嫌太弱,然後ARM要衝上desktop市場還要很長的時間,現在要把ARM+desktop GPU拿來當日常工作+gaming的話也有疑問。

當然把gaming改走雲端的這點考慮進去的話,一般user買大規模GPU的機會就更少了,為了server端在追求的電力效率使得GPU走超大規模的機會也還是存在;或者是AMD的Liano那樣直接用Fusion來並聯會是個好主意?從server服務大量user的觀點來看,那樣好像又嫌太弱了,單獨GPU為了爭取記憶體頻寬變成Xeon般的暴力集合體應該是可以預見。

—-

http://pc.watch.impress.co.jp/docs/column/kaigai/20091202_332618.html

Larrabeeの切り札「シェアードバーチャルメモリ」

CPU側がセットアップしたデータ構造が、そのままGPU側からバーチャルメモリスペース上のデータとして見えるため、話は簡単だ。

アクセス権さえCPU側から与えられれば、データ構造を崩すことなく、直接取ってくることができる。

用相同ISA的另一個利點:用分頁為單位來共享記憶體空間,光是資料結構能夠保持就有很大的差別。

—-

http://pc.watch.impress.co.jp/docs/news/20091202_332819.html

NVIDIA、128SP搭載のQuadro FX 3800Mなど3製品

Quadro FX 2800Mは、MXM型のモバイル向けモジュール。主な仕様は、SP数が96、対応メモリが256bit 1GB GDDR3。DirectX 10.1、OpenGL 3.2に対応。最大消費電力は75W。

Quadro FX 3800Mは、MXM型のモバイル向けモジュール。主な仕様は、SP数が128、対応メモリが256bit 1GB GDDR3。DirectX 10.1、OpenGL 3.2に対応。最大消費電力は100W。

http://www.nvidia.com/object/product_quadro_fx_3800_m_us.html

Quadro FX 3800M

CUDA Cores 128

Shader Model 4.0

OpenGL 3.2

Microsoft DirectX 10.1

EnergyStar Enabling Yes 10:1 (10W Idle)

Maximum Power Consumption 100W

哪冒出這些128sp、256bit GDDR3但卻有DX10.1的玩意兒….O_o

這不就是在公開講G92可以支援DX10.1嗎….)a

還是真的有GT2x0系列、96sp以上、256bit記憶體介面的產品存在?

要不就是單純筆誤的機會最大吧老實說….

在〈從GTS360M的洩漏消息開始思考〉中有 7 則留言

  1. 由於雲端Game Server用的GPU,其性能需要同時分享
    給許多用戶,不能太過依賴time sharing,
    因為全都輪流算圖的話,Latency會很嚴重.
    這讓我突然想到RV870的同時輸出6個畫面以及
    多Kernal同時執行的能力.
    雲端的大規模GPU必須同時處理大量用戶的需求.
    ….未來雲端GPU應該會更廣泛擴大這兩種能力.
    FUSION這種處理器是設計來符合單一用戶的需求.
    大概不適合用在雲端Server,但是也許可以
    用在PC Client端(如果PC也搞雲端遊戲?)
    畢竟PC比Console複雜多了,起碼要能跑舊遊戲舊軟體.
    4核CPU+中階GPU還是必須的.
    也就是隨製程進步,最後FUSION變成像目前Atom一樣小.
    能力足以跑舊PC軟體,也能當雲端遊戲PC Client端硬體.
    Console的話就可以便宜到ARM+硬體解碼器就搞定….
    反正運算全靠Server.
    所以就算遊戲雲端化,Console在成本上以及普及率上
    應該還是有明顯優勢.
    >>從server服務大量user的觀點來看…..
    >>….變成Xeon般的暴力集合體應該是可以預見。
    從記憶體使用效率來看,讓一組Server硬體
    都跑同一個遊戲會比較恰當,
    由於每個Client端可能跑遊戲的不同場景關卡.
    所以一個雲端遊戲上百GB的資料,應是一開機
    就全部讀到記憶體,不會有Loading的情形.
    因此雲端的繪圖系統恐怕一定會做的非常暴力,
    多晶片+超大頻寬+超大記憶體.
    (這種訂製的東西可以不管PC單卡300W和尺寸上限)
    一組Server實際上是一堆用戶在分攤成本,
    所以價格不是主要問題,
    但製程和die size永遠有上限,就算不管良率,
    光罩尺寸限制Die Size最大就是600多mm2.
    要讓一堆人同時跑高畫質遊戲,恐怕一定要多晶片化.

  2. DX10.1的話怎么還會只是Shader Model 4.0,應該Shader Model 4.1了。
    這本身是沖突的嘛,所以肯定有筆誤了。

  3. 新东西是有的
    Quadro FX 3800M
    怀疑这东西是40nm的G92
    不过阉24SP一组又像是GT200衍生来的

  4. 雲端的多重輸出應該不太會依存GPU本身的frame buffer,因為有辦法直接整合到輸出途徑內才對,GPU本身也有可能整合一些M-JPEG的codec之類,輸出可能會是用幾十個起跳。
    > 要讓一堆人同時跑高畫質遊戲,恐怕一定要多晶片化.
    這時候應該是多卡化而不只是多晶片化。
    目前的多晶片建立在「中階performance層數量最多」所以高階用中階來兜多晶片,但是雲端的話會是偏高階的數量最多,頻寬效率最好,所以同樣多晶片卻會是以製程的經濟上限,而不是以零售市場的數量上限為基準,所以我想晶片規模會變大,但不是說一顆可以了事。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料