不然財報最近一直很難看,人家投資人怎麼敢付錢給你。
http://bbs.expreview.com/viewthread.php?tid=20215
预测:GT300将比Larrabee更小更快?
http://www.brightsideofnews.com/news/2009/5/12/nvidias-gt300-is-smaller2c-faster-than-larrabee.aspx
nVidia’s GT300 is “smaller, faster than Larrabee”?
http://www.hardware-infos.com/news.php?news=2944&sprache=1
GT300 with about 2.4 billion transistors
http://www.expreview.com/news/hard/2009-05-13/1242181654d12390.html
NVIDIA GT300核心面积更小、晶体管更多
GT300:
40nm、2400M transistors、<490mm^2、512 1D SP、512bit GDDR5、DX11。
Q4/2009
本來以從GT200的比例來說,2400M電晶體在40nm底下應該會是495mm^2;
但是HWinfo的說法是他們聽到比GT200b小,所以die size上面寫<490mm^2。
先不管這條謠言的真實度高低,以”單一大晶片”的路線來說,繼續往上探頂其實是比較符合這條基本教義。
但是這條謠言看起來,GT300看起來是GT200/200b這個成本定位的延續與調整。
從這個觀點來看,維持在500mm^2的size,其實和RV770是殊途同歸….
只是一邊抓在250mm^2、一邊覺得500mm^2比較好。
此外,ATI似乎比較早起步NUMA based的相關設計套用到產品的腳步,所以也許他們也會比較早開始走128bit x4的設計也說不定?
至於有沒有比Larrabee快….如果限制於GPU用途的話,我想這沒人懷疑吧老實說。
有点不敢相信GT300能做到这个面积 但似乎这次的晶体管没有翻倍 GT200是1400M GT300是2400?
有点不敢相信GT300能做到这个面积 但似乎这次的晶体管没有翻倍 GT200是1400M GT300是2400?
老實說電晶體數量沒翻倍但是性能能翻倍的話就是本事。
老實說電晶體數量沒翻倍但是性能能翻倍的話就是本事。
我本以为GT300会在GT200的基础上继续扩大规模,现在却是GT300的规模反而比GT200小
我本以为GT300会在GT200的基础上继续扩大规模,现在却是GT300的规模反而比GT200小
基本上如果以G92為基礎翻倍,用16 x 16 變成256的話就會撞上16×8的crossbar這面牆….所以GT200才用24sp x 10,弄成了10×8。
既然知道那面牆在那邊就總得設法避開….不管是64sp x 8還是什麼別的,總之成本降低性能提高終究是最終的目的,講得好像很籠統,不過….拼規模比較大但是性能沒比較高的話只是笑話而已。
基本上如果以G92為基礎翻倍,用16 x 16 變成256的話就會撞上16×8的crossbar這面牆….所以GT200才用24sp x 10,弄成了10×8。
既然知道那面牆在那邊就總得設法避開….不管是64sp x 8還是什麼別的,總之成本降低性能提高終究是最終的目的,講得好像很籠統,不過….拼規模比較大但是性能沒比較高的話只是笑話而已。
>電晶體數量沒翻倍但是性能能翻倍
其实也不怎么难
RV635—>RV730
这甚至没有工艺的提升,待机功耗还降了。
Gt200相對G92性能增長不突出,翻倍的電晶體,1.5倍的性能。
如果Gt300電晶體性能比做到G92的水平,那么2400M就是G92的3倍還多,對1.5倍那就是兩倍了。(怎么做到就未知)
只是Xbar壁在前,高頻率比大規模更是出路吧……
>電晶體數量沒翻倍但是性能能翻倍
其实也不怎么难
RV635—>RV730
这甚至没有工艺的提升,待机功耗还降了。
Gt200相對G92性能增長不突出,翻倍的電晶體,1.5倍的性能。
如果Gt300電晶體性能比做到G92的水平,那么2400M就是G92的3倍還多,對1.5倍那就是兩倍了。(怎么做到就未知)
只是Xbar壁在前,高頻率比大規模更是出路吧……
若以RV670 -> RV770來說
的確是電晶體只有1.5倍,但性能翻倍的例子.
RV770是TEX數和ROP數不變只大幅增加2.5倍SP數.
保持原本的DX10.1, 又換掉佔電晶體的RingBus….
RV770是針對弱點選擇性的改進增強,
讓電晶體使用的更有效率.不是全面擴張兩倍,
所以勉強可以不大增電晶體又兩倍性能.
如果GT300的TEX和ROP不大改,只針對SP數去強化.
也許可以在2400M做到512SP.
只有SP兩倍應該還沒辦法增加兩倍性能,
但是若考慮製程改變55nm->40nm,GPU時脈應有明顯增加,那麼2400M有2倍性能就有可能了.
假設GT300是512SP 2Ghz shader clock
那麼浮點運算就高達3Tflops整整是GT280的三倍,
而且原本GT280的ROP是RV770兩倍但頻寬卻只多2成.
~根本發揮不出32ROP的全力.
所以ROP不增加,單靠改用GDDR5也可以讓ROP的MSAA
效率大增.
GT300即使TEX和ROP數不倍增.
應該也可以靠3倍浮點運算和兩倍頻寬增加ROP效率的
優勢達到至少二倍效能.
若以RV670 -> RV770來說
的確是電晶體只有1.5倍,但性能翻倍的例子.
RV770是TEX數和ROP數不變只大幅增加2.5倍SP數.
保持原本的DX10.1, 又換掉佔電晶體的RingBus….
RV770是針對弱點選擇性的改進增強,
讓電晶體使用的更有效率.不是全面擴張兩倍,
所以勉強可以不大增電晶體又兩倍性能.
如果GT300的TEX和ROP不大改,只針對SP數去強化.
也許可以在2400M做到512SP.
只有SP兩倍應該還沒辦法增加兩倍性能,
但是若考慮製程改變55nm->40nm,GPU時脈應有明顯增加,那麼2400M有2倍性能就有可能了.
假設GT300是512SP 2Ghz shader clock
那麼浮點運算就高達3Tflops整整是GT280的三倍,
而且原本GT280的ROP是RV770兩倍但頻寬卻只多2成.
~根本發揮不出32ROP的全力.
所以ROP不增加,單靠改用GDDR5也可以讓ROP的MSAA
效率大增.
GT300即使TEX和ROP數不倍增.
應該也可以靠3倍浮點運算和兩倍頻寬增加ROP效率的
優勢達到至少二倍效能.
ATI的慣例是高階產品的SP數約是同製程中階的2.5倍.
所以….從4770大概可以推算出40nm高階會是什麼了.
640×2.5 = 1600
ATI的慣例是高階產品的SP數約是同製程中階的2.5倍.
所以….從4770大概可以推算出40nm高階會是什麼了.
640×2.5 = 1600