總得要有點自信才能夠站得住腳

不然財報最近一直很難看，人家投資人怎麼敢付錢給你。

http://bbs.expreview.com/viewthread.php?tid=20215

预测：GT300将比Larrabee更小更快？

http://www.brightsideofnews.com/news/2009/5/12/nvidias-gt300-is-smaller2c-faster-than-larrabee.aspx

nVidia’s GT300 is “smaller, faster than Larrabee”?

http://www.hardware-infos.com/news.php?news=2944&sprache=1

GT300 with about 2.4 billion transistors

http://www.expreview.com/news/hard/2009-05-13/1242181654d12390.html

NVIDIA GT300核心面积更小、晶体管更多

GT300:

40nm、2400M transistors、<490mm^2、512 1D SP、512bit GDDR5、DX11。

Q4/2009

本來以從GT200的比例來說，2400M電晶體在40nm底下應該會是495mm^2；

但是HWinfo的說法是他們聽到比GT200b小，所以die size上面寫<490mm^2。

先不管這條謠言的真實度高低，以”單一大晶片”的路線來說，繼續往上探頂其實是比較符合這條基本教義。

但是這條謠言看起來，GT300看起來是GT200/200b這個成本定位的延續與調整。

從這個觀點來看，維持在500mm^2的size，其實和RV770是殊途同歸….

只是一邊抓在250mm^2、一邊覺得500mm^2比較好。

此外，ATI似乎比較早起步NUMA based的相關設計套用到產品的腳步，所以也許他們也會比較早開始走128bit x4的設計也說不定？

至於有沒有比Larrabee快….如果限制於GPU用途的話，我想這沒人懷疑吧老實說。

在〈總得要有點自信才能夠站得住腳〉中有 14 則留言

有点不敢相信GT300能做到这个面积但似乎这次的晶体管没有翻倍 GT200是1400M GT300是2400？

老實說電晶體數量沒翻倍但是性能能翻倍的話就是本事。

我本以为GT300会在GT200的基础上继续扩大规模，现在却是GT300的规模反而比GT200小

基本上如果以G92為基礎翻倍，用16 x 16 變成256的話就會撞上16×8的crossbar這面牆….所以GT200才用24sp x 10，弄成了10×8。
既然知道那面牆在那邊就總得設法避開….不管是64sp x 8還是什麼別的，總之成本降低性能提高終究是最終的目的，講得好像很籠統，不過….拼規模比較大但是性能沒比較高的話只是笑話而已。

>電晶體數量沒翻倍但是性能能翻倍
其实也不怎么难
RV635—>RV730
这甚至没有工艺的提升,待机功耗还降了。
Gt200相對G92性能增長不突出,翻倍的電晶體，1.5倍的性能。
如果Gt300電晶體性能比做到G92的水平，那么2400M就是G92的3倍還多，對1.5倍那就是兩倍了。（怎么做到就未知）
只是Xbar壁在前，高頻率比大規模更是出路吧……

若以RV670 -> RV770來說
的確是電晶體只有1.5倍,但性能翻倍的例子.
RV770是TEX數和ROP數不變只大幅增加2.5倍SP數.
保持原本的DX10.1, 又換掉佔電晶體的RingBus….
RV770是針對弱點選擇性的改進增強,
讓電晶體使用的更有效率.不是全面擴張兩倍,
所以勉強可以不大增電晶體又兩倍性能.
如果GT300的TEX和ROP不大改,只針對SP數去強化.
也許可以在2400M做到512SP.
只有SP兩倍應該還沒辦法增加兩倍性能,
但是若考慮製程改變55nm->40nm,GPU時脈應有明顯增加,那麼2400M有2倍性能就有可能了.
假設GT300是512SP 2Ghz shader clock
那麼浮點運算就高達3Tflops整整是GT280的三倍,
而且原本GT280的ROP是RV770兩倍但頻寬卻只多２成．
～根本發揮不出32ROP的全力．
所以ROP不增加,單靠改用GDDR5也可以讓ROP的MSAA
效率大增．
GT300即使TEX和ROP數不倍增．
應該也可以靠3倍浮點運算和兩倍頻寬增加ROP效率的
優勢達到至少二倍效能．

ATI的慣例是高階產品的SP數約是同製程中階的2.5倍．
所以….從4770大概可以推算出40nm高階會是什麼了．
640×2.5 = 1600
　

發佈留言取消回覆

GDDR8表示:

13 5 月, 20094:58 下午

有点不敢相信GT300能做到这个面积但似乎这次的晶体管没有翻倍 GT200是1400M GT300是2400？

GDDR8表示:

13 5 月, 20094:58 下午

有点不敢相信GT300能做到这个面积但似乎这次的晶体管没有翻倍 GT200是1400M GT300是2400？

Eji表示:

13 5 月, 200910:38 下午

老實說電晶體數量沒翻倍但是性能能翻倍的話就是本事。

Eji表示:

13 5 月, 200910:38 下午

老實說電晶體數量沒翻倍但是性能能翻倍的話就是本事。

GDDR8表示:

14 5 月, 20094:55 下午

我本以为GT300会在GT200的基础上继续扩大规模，现在却是GT300的规模反而比GT200小

GDDR8表示:

14 5 月, 20094:55 下午

我本以为GT300会在GT200的基础上继续扩大规模，现在却是GT300的规模反而比GT200小

Eji表示:

14 5 月, 20096:31 下午

基本上如果以G92為基礎翻倍，用16 x 16 變成256的話就會撞上16×8的crossbar這面牆….所以GT200才用24sp x 10，弄成了10×8。
既然知道那面牆在那邊就總得設法避開….不管是64sp x 8還是什麼別的，總之成本降低性能提高終究是最終的目的，講得好像很籠統，不過….拼規模比較大但是性能沒比較高的話只是笑話而已。

Eji表示:

14 5 月, 20096:31 下午

基本上如果以G92為基礎翻倍，用16 x 16 變成256的話就會撞上16×8的crossbar這面牆….所以GT200才用24sp x 10，弄成了10×8。
既然知道那面牆在那邊就總得設法避開….不管是64sp x 8還是什麼別的，總之成本降低性能提高終究是最終的目的，講得好像很籠統，不過….拼規模比較大但是性能沒比較高的話只是笑話而已。

afxif表示:

14 5 月, 20097:04 下午

>電晶體數量沒翻倍但是性能能翻倍
其实也不怎么难
RV635—>RV730
这甚至没有工艺的提升,待机功耗还降了。
Gt200相對G92性能增長不突出,翻倍的電晶體，1.5倍的性能。
如果Gt300電晶體性能比做到G92的水平，那么2400M就是G92的3倍還多，對1.5倍那就是兩倍了。（怎么做到就未知）
只是Xbar壁在前，高頻率比大規模更是出路吧……

afxif表示:

14 5 月, 20097:04 下午

>電晶體數量沒翻倍但是性能能翻倍
其实也不怎么难
RV635—>RV730
这甚至没有工艺的提升,待机功耗还降了。
Gt200相對G92性能增長不突出,翻倍的電晶體，1.5倍的性能。
如果Gt300電晶體性能比做到G92的水平，那么2400M就是G92的3倍還多，對1.5倍那就是兩倍了。（怎么做到就未知）
只是Xbar壁在前，高頻率比大規模更是出路吧……

waffenss表示:

14 5 月, 20099:41 下午

若以RV670 -> RV770來說
的確是電晶體只有1.5倍,但性能翻倍的例子.
RV770是TEX數和ROP數不變只大幅增加2.5倍SP數.
保持原本的DX10.1, 又換掉佔電晶體的RingBus….
RV770是針對弱點選擇性的改進增強,
讓電晶體使用的更有效率.不是全面擴張兩倍,
所以勉強可以不大增電晶體又兩倍性能.
如果GT300的TEX和ROP不大改,只針對SP數去強化.
也許可以在2400M做到512SP.
只有SP兩倍應該還沒辦法增加兩倍性能,
但是若考慮製程改變55nm->40nm,GPU時脈應有明顯增加,那麼2400M有2倍性能就有可能了.
假設GT300是512SP 2Ghz shader clock
那麼浮點運算就高達3Tflops整整是GT280的三倍,
而且原本GT280的ROP是RV770兩倍但頻寬卻只多２成．
～根本發揮不出32ROP的全力．
所以ROP不增加,單靠改用GDDR5也可以讓ROP的MSAA
效率大增．
GT300即使TEX和ROP數不倍增．
應該也可以靠3倍浮點運算和兩倍頻寬增加ROP效率的
優勢達到至少二倍效能．

waffenss表示:

14 5 月, 20099:41 下午

若以RV670 -> RV770來說
的確是電晶體只有1.5倍,但性能翻倍的例子.
RV770是TEX數和ROP數不變只大幅增加2.5倍SP數.
保持原本的DX10.1, 又換掉佔電晶體的RingBus….
RV770是針對弱點選擇性的改進增強,
讓電晶體使用的更有效率.不是全面擴張兩倍,
所以勉強可以不大增電晶體又兩倍性能.
如果GT300的TEX和ROP不大改,只針對SP數去強化.
也許可以在2400M做到512SP.
只有SP兩倍應該還沒辦法增加兩倍性能,
但是若考慮製程改變55nm->40nm,GPU時脈應有明顯增加,那麼2400M有2倍性能就有可能了.
假設GT300是512SP 2Ghz shader clock
那麼浮點運算就高達3Tflops整整是GT280的三倍,
而且原本GT280的ROP是RV770兩倍但頻寬卻只多２成．
～根本發揮不出32ROP的全力．
所以ROP不增加,單靠改用GDDR5也可以讓ROP的MSAA
效率大增．
GT300即使TEX和ROP數不倍增．
應該也可以靠3倍浮點運算和兩倍頻寬增加ROP效率的
優勢達到至少二倍效能．

waffenss_表示:

14 5 月, 20099:51 下午

ATI的慣例是高階產品的SP數約是同製程中階的2.5倍．
所以….從4770大概可以推算出40nm高階會是什麼了．
640×2.5 = 1600
　

waffenss_表示:

14 5 月, 20099:51 下午

ATI的慣例是高階產品的SP數約是同製程中階的2.5倍．
所以….從4770大概可以推算出40nm高階會是什麼了．
640×2.5 = 1600

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

Eji的碎碎念

總得要有點自信才能夠站得住腳

在〈總得要有點自信才能夠站得住腳〉中有 14 則留言

發佈留言取消回覆

現在只剩下黑歷史….

在〈總得要有點自信才能夠站得住腳〉中有 14 則留言

發佈留言 取消回覆

現在只剩下黑歷史….

發佈留言取消回覆