分類彙整: GPU

GPU

GeForce GTX550Ti

18 3 月, 2011 Eji 10 則留言

http://pc.watch.impress.co.jp/docs/news/20110316_433034.html
NVIDIA、ミドルクラスGPU「GeForce GTX 550 Ti」
～3D Visionが50ドル値下げ

http://pc.watch.impress.co.jp/docs/column/tawada/20110318_433657.html
GeForce 500世代のミドルレンジが登場「GeForce GTX 550 Ti」

實質上GF106(GTS450)本來就有192bit，只是到GF116才開放….
不過可以混不同容量的memory chip這招就真的蠻有意思的。一口氣解決兩邊的問題….

—
http://pc.watch.impress.co.jp/docs/column/kaigai/20110316_432979.html
デュアルCPUコア&デュアルGPUコアになったiPad 2

Tegra2的GeForce ULP猛然被SGX543mp2打得滿地找牙….Tegra3的話可能可以高個4~5倍，也和NGP的SGX543mp4差不多。
不過A4和A5都是45nm，與Tegra2/Tegra3的關係一樣，都是規模擴大、同性能時耗電量相去不遠。
當然前提是task要能很順利平行化….

—
在日本剛好遇上地震，沒卡著回不來真是太好了(抖)

GPU

MWC2011的Tegra3

16 2 月, 2011 Eji 7 則留言

http://pc.watch.impress.co.jp/docs/news/20110216_427313.html
NVIDIA、クアッドコア版Tegraをサンプル出荷開始
～搭載製品は8月に出荷予定

本來Tegra3在1月的發表資料是繪圖3倍(Tegra2)，1920×1200；現在是5倍+2560×1600了。
而且是sampling出荷…. 所以應該是拿保留著的高階版出來，產品本身是一樣的。當然耗電量就拉上去了。
不過Tegra3已經比Core2Duo還快了….？

「なお、これらのコードネームはアメリカの架空のヒーローの本名に由来しており、Kal-Elはスーパーマンが生まれた時につけられた名前。
Wayneはバットマン、Loganはウルヴァリン、Starkはアイアンマンが由来と思われる。」

http://www.anandtech.com/print/4181
NVIDIA's Project Kal-El: Quad-Core A9s Coming to Smartphones/Tablets This Year

On the GPU side, Kal-El implements a larger/faster version of the ULP GeForce GPU used in Tegra 2. It's still not a unified shader architecture, but NVIDIA has upped the core count from 8 to 12. Note that in Tegra 2 the 8 cores refer to 4 vertex shaders and 4 pixel shaders. It's not clear how the 12 will be divided in Kal-El but it may not be an equal scaling to 6+6.

—
http://wiredvision.jp/news/201102/2011021522.html
「世界の全情報処理能力」は「ヒトの脳」に匹敵

「人類が記録している情報の総量は、1人の人間の全DNAに収められた情報量の300分の1程度という」

http://wiredvision.jp/news/201102/2011021622.html
中国が開発する「クリーンな新型トリウム原発」とは

「トリウムは溶融塩炉(MSR)に適し、核反応が固体の燃料棒ではなく液体燃料炉の中で起こるため、メルトダウンが発生する危険性がないとされている。

[溶融塩とは、塩類が高温で液体になったもの。MSRでは、トリウムのフッ化物を混合した溶融塩を燃料としてエネルギーを取り出す。原理的に重大事故を起こさないとされる。]

こうした安全性に加え、MSRでは、既存の核廃棄物を含むさまざまな種類の核燃料を消費できる。また、その副産物は、核兵器を製造するのにも適さない。

さらにMSRは、消費するよりも多くの燃料を生成する増殖炉として設計することもできる。」

GPU

GTX580正式發表

9 11 月, 2010 Eji 發佈留言

http://www.4gamer.net/games/123/G012385/20101109037/

ついに登場した“フルスペックFermi”は，今度こそ買いなのか

http://www.4gamer.net/games/123/G012385/20101106003/

NVIDIA，「GeForce GTX 580」を発表。これが“本物のGTX 480”だ!?

結果真的是re-spin耶，64TMU….XDa
然後re-spin有差這麼多也真的很嚇人。

主要的改良算是single-cycle FP16 filtering，這點與GF104相同。

GPU

GTX580紙面發佈

1 11 月, 2010 Eji 21 則留言

http://nueda.main.jp/blog/archives/005307.html
GF110を搭載したGeForce GTX 580は11月8日に発表

S|A只要寫NVIDIA的，看起來就有那麼一點像股票網站….w

不過512sp看起來的確很像GF100 debug。
只是還是有修改一些東西，以致於和GTX480相同的core/clock設定下，
據稱還有10%的改善，並且在提高過的設定下，耗電量比GTX480低。
這要算到架構還是製程respin則各有看法；但是NVIDIA的TDP數字畢竟比較浮濫一點….

(補充：TMU 64 -> 128，對GF100來說算是蠻重要的補強….不過沒差到一個世代才對)

剩下的則是ATI跳出來講「benchmark向無意義」的over-tessellating。
要說這樣是DX11最快，顯然是站不住腳；對手則是Cayman單晶片。
先不管能不能贏，實物得拖到明年就顯得非常慘。

Edit：
http://www.gdm.or.jp/voices_html/201010/20101104a.html
「正直、本当に出るとは思ってなかった」(11/4) —某ショップ店員談

居然似乎可以當天發售，看來狀況沒想像中的差。

http://www.microsoft.com/taiwan/silverlight/
結果說不定還是小光郵貼比較受人矚目_A_

GPU

GT430發表

12 10 月, 2010 Eji 2 則留言

http://pc.watch.impress.co.jp/docs/news/20101012_399485.html

NVIDIA、メインストリーム向け「GeForce GT 430」

GF108產品實際發表，性能約GT220的1.5倍。

不過GF108的die size(127mm^2)其實比GT220的GT216要大了約1/4(100mm^2)，

比較接近GT240使用的GT215(133mm^2)。

不過這邊還是拿GT216來比較。

http://www.nvidia.com/object/product-geforce-gt-430-us.html

GeForce GT 430

http://www.nvidia.com/object/product_geforce_gt_220_us.html

GeForce GT 220

core、shader clock都差不多是700MHz/1400MHz。

GT220（GT216）是48sp/16TMU、GT430（GF108）則是96sp/16TMU、官方說帖是「性能1.5倍」。

兩邊都是128bit GDDR3，頻率稍微拉高一點點（1.58GHz→1.8GHz）。

以sp數量來看的話性能當量算是大幅下降（兩倍的sp卻只有1.5倍的性能），

反之從register file和thread管理能力來看，

GT216有6個 8sp的array、register file約為 64KBx6=384KB。

GF108有2個48sp的array、register file約為128KBx2=256KB、並另有128KB的L2 cache。

也就是說和SP數量相比、其實週邊記憶體系統容量並沒有差很多….

但GT216有192warp（6144threads）、GF108只有96warp（3072threads）。

這邊要記得GT216的sp有多一個MUL….

當然和GF100相比GF104的單元安排比較能夠全面使用而沒有相依性，

所以即使GF100直接縮小事實上達不到這個性能，

仍可以說總計96sp、可以發揮的性能則差不多64sp的當量。

然後回到同sp的GT240。

基本上GT215的規格是GT216的兩倍。

96sp/32TMU、register file 768KB、384warp（12288threads）

並且繪圖性能其實僅介於G92與G94的中間。

長期來看，NVIDIA投在CUDA的資源是越來越大。

SP的數量、整體規模與繪圖性能之間的比例也是越來越低….

—-

轉過來看….

http://pc.watch.impress.co.jp/docs/news/20100903_391257.html

NVIDIA、モバイルGPU「GeForce 400M」シリーズ7モデルを一挙発表

考慮當初GT420M宣稱能贏i5的內建繪圖約5倍，

GT430大概和Sandy Bridge的雙GPU版相比只能贏個50%吧？

理想狀況的話Sandy Bridge幾乎都快和GT220一樣快了。

—-

http://www.the-area.com/blogs/shane/fun_with_iray_and_physx

Fun with iray and PhysX

平均每個frame 2~5分鐘，demo用的高解析度加大量物件弄一個4hr40min的測試，效能算不錯，但是iRay之外的選擇也不少，比方說VRAY RT。

demo系統是Quadro+Tesla。要有比較好的效率非得弄一個Tesla box和Quadro/普通GPU分開跑實在是很愚蠢的限制….但是沒有實做scheduling的GPU現在非這樣不可。

現在就看HPC市場上哪些公司會想把工作給拿到GPU上….最急的顯然還是NVIDIA自己吧。在被邊緣化之前的掙扎之類的。

GPU

GeForce GTS450發表

13 9 月, 2010 Eji 12 則留言

http://pc.watch.impress.co.jp/docs/column/kaigai/20100913_393425.html
CPUの設計思想の違いが反映されるKinectとPlayStation Move

前兩天自己的槍文有寫得這麼好就算了_A_

不過PS3的設計一開始就把PSMove給考慮進去了，Kinect則應該沒有算在XBOX360的發展歷程之內。
還有不管架構只看外觀的話，PSMove整個面對WiiMote就吃虧到爆。反而Kinect比較容易釣到user….

—-
http://pc.watch.impress.co.jp/docs/news/20100913_392968.html
NVIDIA、100ドル台前半のDirectX 11対応GPU「GeForce GTS 450」

http://pc.watch.impress.co.jp/docs/column/tawada/20100913_393443.html
GF106コア採用のミドルレンジGPU「GeForce GTS 450」

雖說表現並不差，但晚一年只能打個平手真的是有點悲慘。

反過來說4GPC的GF10x不知道還有沒有打算出？
同樣128bit的GTS450落在HD5750和5770中間、(當然，它馬上就要改名HD6770了)
256bit的GTS460落在HD5830和HD5850中間，(後頭還有HD6870等著)
然後最後是HD6950、HD6970之類的東西沒對手，
但要是真的弄個384bit 768sp的GF10x推出來卻不知道能不能回本。

well，至少等GF100的存貨清完….

—-
http://www.anandtech.com/show/3887/nvidia-400m-dx11-top-to-bottom
NVIDIA 400M: DX11 Top to Bottom Solutions Now Available

看了忍不住問，從公版的空焊來看，GF106有192bit？

GPU

GeForce 400M 筆電用系列發表

3 9 月, 2010 Eji 發佈留言

http://www.anandtech.com/show/3887/nvidia-400m-dx11-top-to-bottom

Anandtech : NVIDIA 400M: DX11 Top to Bottom Solutions Now Available

http://pc.watch.impress.co.jp/docs/news/20100903_391257.html

NVIDIA、モバイルGPU「GeForce 400M」シリーズ7モデルを一挙発表

～全モデルFermiベースでDirectX 11完全対応

裡面比較嚇人的大概是GTX480M，352sp拿的是GF100來放….

其次是GTX470M(288sp)/GTX460M(192sp)，這兩個應該是GF104。

GT445M(144sp)/GT435M(96sp)則是GF106。

GT425M(96sp)/GT420M(96sp)還有GT415M(48sp)則不清楚是不是兩個不同的晶片。

其實從上面的spec可以推估，GT420M和Core i5的內建GPU雖然乍看之下快5倍，但是Sandy Bridge的內建GPU性能大概會和GT415M相去不遠….

一個比較重要的特性是所有的產品都支援Optimus技術，所以搭配Nehalem CPU都可以在平常把GPU關閉來省電。

GPU

後藤老爹的GF104續文

29 7 月, 2010 Eji 發佈留言

http://pc.watch.impress.co.jp/docs/column/kaigai/20100729_383968.html

基本アーキテクチャの柔軟さが産んだGeForce GTX 460

討論了GF104增加單元後該怎麼處理記憶體延遲的問題。

不過感覺問題有點回到雞生蛋蛋生雞….

GF100和GF104的整個記憶體系統架構是完全一樣的：

32768 32bit register、64KB shared memory + L1 cache per SM、512KB L2 per ROP。

所以追加只有SP和warp scheduler (和TEX)。

其次是，register file其實一樣可以增加來消化更多的thread需求，以避免sp閒置；

但是除了繪圖之外的工作，在性質上會比較需要cache，所以GF100以擴充shared memory/cache來滿足這些要求，

所以疑問就變成：多出來的東西上哪去了？或者說過去是不是有東西是閒置的？

後藤的看法是，GF104增加sp數量的時候沒有增加register，是因為這些壓力由512KB的L2 cache消化掉了。

不過GF104相對於GF100的cache並沒有增加，這就會變成在繪圖工作上，GF100的L2 cache是沒有滿載的。

對繪圖而言(主要是tex read需求)，cache並不會很有效，所以有閒置空間這點或許說得過去；不過要說GPU漸漸地轉向對cache hit有期望似乎是有點讓人疑惑的部分。

GF100系列的cache主要的目的是為了增加有效頻寬，而非過去CPU所謂的隱蔽記憶體延遲才是。

所以以前沒餵飽，現在才補上unit？

GPU

GTX460(GF104)發表。

12 7 月, 2010 Eji 54 則留言

http://pc.watch.impress.co.jp/docs/column/kaigai/20100712_380148.html

GF100を大幅拡張したGeForce GTX 460アーキテクチャ

雖說後藤老爹講這樣壓注算是很少見，但是彷彿可以聽到黃仁勳喊：[此時不衝更待何時….」

總之某種意味上這次的修改反而非常有NVIDIA過往的風格。

無論如何就是要保住programming model的一致性。

每個SM的shader array加一組(16sp)、SFU加一組(4SFU)、TMU加一組(4TMU)、指令發射加一組(2 issue)。

總共是48sp、8SFU、8TMU、4issue。

追加的風格非常接近G80->GT200，只是這次不是隔一代(G80-G92-GT200)而是一次跳。

DP性能帳面上縮減到1/12，不過考慮GF100的縮減法，GF104仍然可能是軟體的關閉。

總之，GF104讓整體電晶體利用效率大幅改善、加上製程狀況的好轉，用同樣的SM結構推高階的話就非常夠格稱為「Fermi2」了吧….

不對，現在已經是Fermi2了。

剩下一個要注意的點是，GF104的生產批號是A1，代表良率應該相當不錯。

http://pc.watch.impress.co.jp/docs/column/tawada/20100712_380174.html

アーキテクチャ刷新で登場するハイミドルGPU「GeForce GTX 460」

「G92の再来を思い出させる下剋上チップ」

這註腳真是太棒嘍。

—-

Anandtech

Tom’s Hardware

Tech Report

hardocp

guru3d

GPU

可能會是雙架構的GF100族系

6 7 月, 2010 Eji 4 則留言

http://pc.watch.impress.co.jp/docs/column/kaigai/20100706_378760.html

GeForce GTX 460はGT200アーキテクチャのFermi拡張か?

從24sp提出的猜想，十分合理沒有太多質疑的空間：

GF104應該是GT200的DX11 extension。

架構上將GF100提供的DX11相關設計(GPC分割、tessellator)給納入之外，去除掉與graphic無關的部分(L1 cache、ECC)，使整體的性能比提高。

這樣的GF104可能會回到24sp x16SM(4GPC)、64TMU、256bit GDDR5等，比較接近GT200改良過的組態，繪圖面上的競爭力也會比較高。

但是反過來說，CUDA的延伸性在此遭到破壞，GF100可以使用的CUDA program在GF104以下的產品很可能無法沿用，而只能使用到與GT200相去不遠的CUDA spec。

另外一個問題是，Fermi提供的DX11性能可能還是會對Fermi的某些架構特性有依存，比方說tessellator的輸出性能可能會被cache拿掉影響到(到底有沒有拿掉L1/L2啊？)。

雖說還是要看出來之後的情況，但如果要玩CUDA的話可能還是得乖乖買GF100產品了。

此外，最近ATI也開始把先前HD5870的GDS/LDS/dp & fp的細節加到文件裡面。

加上GF104的修改造成CUDA實質上在民生市場的結構暫停進步，感覺上這會變成RV770 vs GT200的延長賽。

所以GF104單晶片能不能贏RV870呢？

http://www.siliconmadness.com/2010/06/geforce-gtx-460-gf104-architecture.html

GeForce GTX 460 – GF104 Architecture Rumors Dissected

—-

http://www.4gamer.net/games/110/G011058/20100602001/

［COMPUTEX］NVIDIAブースレポート～正体不明のノートPC向けGPUと「CUDA for Mac」の衝撃

其實在這時候GF104就已經偷偷露臉嘍~

Eji的碎碎念