總得要有點自信才能夠站得住腳

不然財報最近一直很難看,人家投資人怎麼敢付錢給你。

http://bbs.expreview.com/viewthread.php?tid=20215

预测:GT300将比Larrabee更小更快?

http://www.brightsideofnews.com/news/2009/5/12/nvidias-gt300-is-smaller2c-faster-than-larrabee.aspx

nVidia’s GT300 is “smaller, faster than Larrabee”?

http://www.hardware-infos.com/news.php?news=2944&sprache=1

GT300 with about 2.4 billion transistors

http://www.expreview.com/news/hard/2009-05-13/1242181654d12390.html

NVIDIA GT300核心面积更小、晶体管更多

GT300:

40nm、2400M transistors、<490mm^2、512 1D SP、512bit GDDR5、DX11。

Q4/2009

本來以從GT200的比例來說,2400M電晶體在40nm底下應該會是495mm^2;

但是HWinfo的說法是他們聽到比GT200b小,所以die size上面寫<490mm^2。

先不管這條謠言的真實度高低,以”單一大晶片”的路線來說,繼續往上探頂其實是比較符合這條基本教義。

但是這條謠言看起來,GT300看起來是GT200/200b這個成本定位的延續與調整。

從這個觀點來看,維持在500mm^2的size,其實和RV770是殊途同歸….

只是一邊抓在250mm^2、一邊覺得500mm^2比較好。

此外,ATI似乎比較早起步NUMA based的相關設計套用到產品的腳步,所以也許他們也會比較早開始走128bit x4的設計也說不定?

至於有沒有比Larrabee快….如果限制於GPU用途的話,我想這沒人懷疑吧老實說。

在〈總得要有點自信才能夠站得住腳〉中有 14 則留言

  1. 有点不敢相信GT300能做到这个面积 但似乎这次的晶体管没有翻倍 GT200是1400M GT300是2400?

  2. 有点不敢相信GT300能做到这个面积 但似乎这次的晶体管没有翻倍 GT200是1400M GT300是2400?

  3. 我本以为GT300会在GT200的基础上继续扩大规模,现在却是GT300的规模反而比GT200小

  4. 我本以为GT300会在GT200的基础上继续扩大规模,现在却是GT300的规模反而比GT200小

  5. 基本上如果以G92為基礎翻倍,用16 x 16 變成256的話就會撞上16×8的crossbar這面牆….所以GT200才用24sp x 10,弄成了10×8。
    既然知道那面牆在那邊就總得設法避開….不管是64sp x 8還是什麼別的,總之成本降低性能提高終究是最終的目的,講得好像很籠統,不過….拼規模比較大但是性能沒比較高的話只是笑話而已。

  6. 基本上如果以G92為基礎翻倍,用16 x 16 變成256的話就會撞上16×8的crossbar這面牆….所以GT200才用24sp x 10,弄成了10×8。
    既然知道那面牆在那邊就總得設法避開….不管是64sp x 8還是什麼別的,總之成本降低性能提高終究是最終的目的,講得好像很籠統,不過….拼規模比較大但是性能沒比較高的話只是笑話而已。

  7. >電晶體數量沒翻倍但是性能能翻倍
    其实也不怎么难
    RV635—>RV730
    这甚至没有工艺的提升,待机功耗还降了。
    Gt200相對G92性能增長不突出,翻倍的電晶體,1.5倍的性能。
    如果Gt300電晶體性能比做到G92的水平,那么2400M就是G92的3倍還多,對1.5倍那就是兩倍了。(怎么做到就未知)
    只是Xbar壁在前,高頻率比大規模更是出路吧……

  8. >電晶體數量沒翻倍但是性能能翻倍
    其实也不怎么难
    RV635—>RV730
    这甚至没有工艺的提升,待机功耗还降了。
    Gt200相對G92性能增長不突出,翻倍的電晶體,1.5倍的性能。
    如果Gt300電晶體性能比做到G92的水平,那么2400M就是G92的3倍還多,對1.5倍那就是兩倍了。(怎么做到就未知)
    只是Xbar壁在前,高頻率比大規模更是出路吧……

  9. 若以RV670 -> RV770來說
    的確是電晶體只有1.5倍,但性能翻倍的例子.
    RV770是TEX數和ROP數不變只大幅增加2.5倍SP數.
    保持原本的DX10.1, 又換掉佔電晶體的RingBus….
    RV770是針對弱點選擇性的改進增強,
    讓電晶體使用的更有效率.不是全面擴張兩倍,
    所以勉強可以不大增電晶體又兩倍性能.
    如果GT300的TEX和ROP不大改,只針對SP數去強化.
    也許可以在2400M做到512SP.
    只有SP兩倍應該還沒辦法增加兩倍性能,
    但是若考慮製程改變55nm->40nm,GPU時脈應有明顯增加,那麼2400M有2倍性能就有可能了.
    假設GT300是512SP 2Ghz shader clock
    那麼浮點運算就高達3Tflops整整是GT280的三倍,
    而且原本GT280的ROP是RV770兩倍但頻寬卻只多2成.
    ~根本發揮不出32ROP的全力.
    所以ROP不增加,單靠改用GDDR5也可以讓ROP的MSAA
    效率大增.
    GT300即使TEX和ROP數不倍增.
    應該也可以靠3倍浮點運算和兩倍頻寬增加ROP效率的
    優勢達到至少二倍效能.

  10. 若以RV670 -> RV770來說
    的確是電晶體只有1.5倍,但性能翻倍的例子.
    RV770是TEX數和ROP數不變只大幅增加2.5倍SP數.
    保持原本的DX10.1, 又換掉佔電晶體的RingBus….
    RV770是針對弱點選擇性的改進增強,
    讓電晶體使用的更有效率.不是全面擴張兩倍,
    所以勉強可以不大增電晶體又兩倍性能.
    如果GT300的TEX和ROP不大改,只針對SP數去強化.
    也許可以在2400M做到512SP.
    只有SP兩倍應該還沒辦法增加兩倍性能,
    但是若考慮製程改變55nm->40nm,GPU時脈應有明顯增加,那麼2400M有2倍性能就有可能了.
    假設GT300是512SP 2Ghz shader clock
    那麼浮點運算就高達3Tflops整整是GT280的三倍,
    而且原本GT280的ROP是RV770兩倍但頻寬卻只多2成.
    ~根本發揮不出32ROP的全力.
    所以ROP不增加,單靠改用GDDR5也可以讓ROP的MSAA
    效率大增.
    GT300即使TEX和ROP數不倍增.
    應該也可以靠3倍浮點運算和兩倍頻寬增加ROP效率的
    優勢達到至少二倍效能.

  11. ATI的慣例是高階產品的SP數約是同製程中階的2.5倍.
    所以….從4770大概可以推算出40nm高階會是什麼了.
    640×2.5 = 1600
     

  12. ATI的慣例是高階產品的SP數約是同製程中階的2.5倍.
    所以….從4770大概可以推算出40nm高階會是什麼了.
    640×2.5 = 1600
     

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料