目前股價失去理智中。不知怎的對NVIDIA沒信心到一種程度。
大概大家都覺得NVIDIA在兩個大廠中間撐到現在是奇蹟吧?然後泡沫快破滅了之類的。
真沒信心….
不過,Intel要不要趁現在趕快收購NVIDIA啊?XD
跌到七美元左右出手的話,要買下51%資本只要25億美金就可以搞定,比當初AMD買ATI值得多啦XD
well,我對NVIDIA目前的結構還很有信心的理由是GT200的一些設計:
http://pc.watch.impress.co.jp/docs/2008/0707/kaigai452.htm
GeForce GTX 200(GT200)のパフォーマンスの秘密
其實後藤老爹這篇說穿了,就是在設法替G100如何達成93%的dual-issue找理由….
說起來由於每個thread獨立,只要warp內可以找到8個同指令的thread配對,就可以一直維持高速,原理上完全不會有相依性的關係,實質上是終極的co-issue。
透過那個過去傳出的16thread”半warp”(後來就不再出現了)來推測「指令發射的half clock其實是對兩個unit交替發射」這點是蠻有趣的….不過這樣的話warp規模調整就一定是以32thread為單位了(因為實質上是8thread x 4cylce x N的方式來調整)
後藤老爹對dual-issue的推測有個問題的地方是,他把G80當成full scalar來設想,實際上應該不是full scalar,而是有gather & scatter功能的4D vector unit並列;於是8個unit共用的scalar DP,應該是2個1/2 cycle thoughtput的DP unit,但是其他部分其實還是大略吻合,這使得G100(GT200)有盡可能做到dual-issue。
總之G100的這些增加卻沒有很大的電晶體需求,比方說來點簡單的加減:
G92 — 754M
G94 — 505M
G94 x2 = 1010M = 8TPC、32ROP、512bit
*: PCIe/display/raster重複計算
G92 – G94 = 4TPC(GT100) = 249M(GT100)
G94 x2 – 754M = 16ROP(GT100) = 256M
10TPC + 512bit = G92 x 2 – 6TPC (1134M) or G94x2 + 2TPC (同1134M)
G100 = 1400M = 10TPC(GT200) + 32ROP(GT200)
1400 – 1134M = 250M(GT200相對於GT100的擴增規模,10TPC + 32ROP的總計)
當然這些數字意義不大,因為都忽略了雙層crossbar和rasterizer logic,而且這部分其實非常龐大(從die photo就可以知道);
但是由於這些部份同時也都需要隨著TPC與ROP數量作線性放大的關係,所以都當成規模的一部分直接扣進去_A_
可以當個參考比例。
結論就是,可以推知GT200的每個TPC,(對整個晶片比例來說)只增加1/4以下的電晶體,便得到增加50%的ALU性能,而且還沒有把dual-issue帶來的改進考慮進去。
實際TPC數量減少(和相當於1500M的G92直接double比起來),帶來的就是Crossbar規模的縮減。
(*:上述的擴增其實都是有把crossbar規模考慮進去的關係,SP的電晶體數量其實應該真的有增加個40~50%)
而且由於整個register file都double,其實說起來GT200系列的shader multiprocessor應該可以容許全速的DP,這點也是G92直接double也做不到的….不過記憶體頻寬大概負荷不了的關係,意義不大。(和powerXcell 8i的道理相同,行銷意義大於實質性能意義)
當然也不可能一直以這種方法(增加TPC內部register file規模、縮減crossbar規模)做下去就是了….
—-
話說回來,Larrabee好像是4thread + 大規模的單一cache來處理(似乎不區分texture or constant),控制都交給軟體了。
這相對又是個大極端…….XDa
另外,前兩天的引用提到PureVideoHD(VP2)已經可以由CUDA存取了,叫做CUDA Video Decode API。
http://viml.nchc.org.tw/blog/paper_info.php?CLASS_ID=1&SUB_ID=1&PAPER_ID=70
這個”dual-issue”,
在遊戲下能使用嗎?
可以”吧”。 _A_
可以”吧”。 _A_
AMD和NV这样杀下去,唯一的结局是双方精疲力竭后再合并吧
intel对收购NV明显是没有兴趣,intel觉得实现玩一次级别的计算,收购别人远不如自己的fab来实做来的可靠
AMD和NV这样杀下去,唯一的结局是双方精疲力竭后再合并吧
intel对收购NV明显是没有兴趣,intel觉得实现玩一次级别的计算,收购别人远不如自己的fab来实做来的可靠
> intel对收购NV明显是没有兴趣,intel觉得实现万亿次级别的计算,收购别人远不如自己的fab来实做来的可靠
Intel他們需要繪圖的driver人才吧….
> intel对收购NV明显是没有兴趣,intel觉得实现万亿次级别的计算,收购别人远不如自己的fab来实做来的可靠
Intel他們需要繪圖的driver人才吧….
> 可以”吧”。 _A_
這算是肯定句嗎_A_?
SFU應該算是沒有gather & scatter的SIMD吧?
> 可以”吧”。 _A_
這算是肯定句嗎_A_?
SFU應該算是沒有gather & scatter的SIMD吧?