在〈GT300謠言繼續〉中有 38 則留言

  1. 为什么NV不用7Ghz的GDDR5呢 7Gbps的GDDR5不是准备要上市了吗 考虑到GDDR5的延迟高 256GB/S的带宽相比GTX285的160GB/S并没有提升太多耶

  2. 延遲高不代表有效頻寬比較低啦….反正主要是不要stall就好了。
    crossbar問題比較大就是了….

  3. 延遲高不代表有效頻寬比較低啦….反正主要是不要stall就好了。
    crossbar問題比較大就是了….

  4. 既然延迟高不代表有效频宽比较低,那延迟太高会对什么不利呢或者说会影响哪方面的性能呢?

  5. 既然延迟高不代表有效频宽比较低,那延迟太高会对什么不利呢或者说会影响哪方面的性能呢?

  6. 記憶體系統的延遲基本上大略是固定的(只要沒有太明顯的random access),所以假設我們只討論繪圖的話,基本上只要調整active thread數量,就可以對應延遲更大的高速記憶體介面。
    基本上繪圖面的話遲延沒什麼影響,但是記憶體系統延遲很高的時候要靠架構去吸收,所以基本上不能動不動就換記憶體。
    反過來說,CPU做的事情大部分都很怕延遲….

  7. 記憶體系統的延遲基本上大略是固定的(只要沒有太明顯的random access),所以假設我們只討論繪圖的話,基本上只要調整active thread數量,就可以對應延遲更大的高速記憶體介面。
    基本上繪圖面的話遲延沒什麼影響,但是記憶體系統延遲很高的時候要靠架構去吸收,所以基本上不能動不動就換記憶體。
    反過來說,CPU做的事情大部分都很怕延遲….

  8. 我是認為NV還是會出大核心的(當然我不是Eji,只代表自己的意見)
    不過我認為是搞12X8的384SP就差不多是極限了。16X8是我不敢想象的。

  9. 我是認為NV還是會出大核心的(當然我不是Eji,只代表自己的意見)
    不過我認為是搞12X8的384SP就差不多是極限了。16X8是我不敢想象的。

  10. 32×12嗎….不過想想,48×12就576啦。XD
    我是比較在意ROP的部分該怎麼處理啦,如果維持512bit的話,要利用增加的頻寬,就非得擴大內部的interconnection、ROP的性能等等都要跟著拉高才能善用….這也不是說解決就可以解決。

  11. 32×12嗎….不過想想,48×12就576啦。XD
    我是比較在意ROP的部分該怎麼處理啦,如果維持512bit的話,要利用增加的頻寬,就非得擴大內部的interconnection、ROP的性能等等都要跟著拉高才能善用….這也不是說解決就可以解決。

  12. 此外,我覺得wensee所想問的”單一大核心”,指的應該是”單版只能放一個的”這種程度的大核心;但是從GTX295我們可以知道,其實過去認為512bit是single board的極限,GT200沒辦法上dual-chip;但是NVIDIA最後還是放了兩個448bit上去。
    所以我覺得”單一大核心”路線並不存在,單純只是和對手拆招而已。
    比方說4770讓人開始想到128bit x4chip的可能性,這時候256bit又是大核心了。

  13. 此外,我覺得wensee所想問的”單一大核心”,指的應該是”單版只能放一個的”這種程度的大核心;但是從GTX295我們可以知道,其實過去認為512bit是single board的極限,GT200沒辦法上dual-chip;但是NVIDIA最後還是放了兩個448bit上去。
    所以我覺得”單一大核心”路線並不存在,單純只是和對手拆招而已。
    比方說4770讓人開始想到128bit x4chip的可能性,這時候256bit又是大核心了。

  14. GT300的最大疑問是會不會再跟GT200一樣不適合改出低端芯片來,得繼續用換名頂著……
    GT200雖然Gflops只有G92的1.5倍左右,但是GPGPU性能是G92的3倍,而且支持雙精度浮點。
    這點新的中低端用戶沒法享受到到還不算大問題。
    只是GT300時期如果繼續用G92、GT200及其工藝改良版頂著。
    那差別就是很關鍵的DX11了。

  15. GT300的最大疑問是會不會再跟GT200一樣不適合改出低端芯片來,得繼續用換名頂著……
    GT200雖然Gflops只有G92的1.5倍左右,但是GPGPU性能是G92的3倍,而且支持雙精度浮點。
    這點新的中低端用戶沒法享受到到還不算大問題。
    只是GT300時期如果繼續用G92、GT200及其工藝改良版頂著。
    那差別就是很關鍵的DX11了。

  16. 个人觉得现在的single board极限不是512bit,从GTX285单面可以放16颗显存颗粒可以看出,如果正反两面全部放上16颗显存将会达到惊人的1024bit 32颗显存,可见1024bit才是现在single board的极限,除非单颗显存颗粒的容量以及位宽继续往上攀升,否则1024bit就是现在single board的顶峰了

  17. 个人觉得现在的single board极限不是512bit,从GTX285单面可以放16颗显存颗粒可以看出,如果正反两面全部放上16颗显存将会达到惊人的1024bit 32颗显存,可见1024bit才是现在single board的极限,除非单颗显存颗粒的容量以及位宽继续往上攀升,否则1024bit就是现在single board的顶峰了

  18. 我覺得……非要上1024bit位寬的時候
    那時的立體封裝解決方案相比1024bit的PCB板會更便宜……

  19. 我覺得……非要上1024bit位寬的時候
    那時的立體封裝解決方案相比1024bit的PCB板會更便宜……

  20. 單一大晶片1024bit的問題在於,
    要能用到這麼大的頻寬的GPU需要很多的ROP單位,
    可是現在3D遊戲不能只靠ROP多,還需要
    更多的TEX和shader ALU單位.
    所以從512–>1024必須整個double才能線性效能成長.
    但是目前NV的512bitGPU就已經面積500mm2左右
    的低良率怪物了….
    你要再double那可能會是面積1000mm2的恐龍.
    ………整片12吋晶圓恐怕沒幾個可用的die.
    效能也許能double但成本卻可能是非線性的暴增.
    這低良率(高成本)因素,恐怕才是單一大晶片不做到
    1024bit的關鍵.
    至於單一board的記憶體寬度,其實要超過512bit並不難.
    用雙晶片的話,卡做長一點,耗電量大一點,
    實質上只是SLI單卡化,反正成本和效能都是線性增加,
    只要市場有需求這是可以解決的.

  21. 單一大晶片1024bit的問題在於,
    要能用到這麼大的頻寬的GPU需要很多的ROP單位,
    可是現在3D遊戲不能只靠ROP多,還需要
    更多的TEX和shader ALU單位.
    所以從512–>1024必須整個double才能線性效能成長.
    但是目前NV的512bitGPU就已經面積500mm2左右
    的低良率怪物了….
    你要再double那可能會是面積1000mm2的恐龍.
    ………整片12吋晶圓恐怕沒幾個可用的die.
    效能也許能double但成本卻可能是非線性的暴增.
    這低良率(高成本)因素,恐怕才是單一大晶片不做到
    1024bit的關鍵.
    至於單一board的記憶體寬度,其實要超過512bit並不難.
    用雙晶片的話,卡做長一點,耗電量大一點,
    實質上只是SLI單卡化,反正成本和效能都是線性增加,
    只要市場有需求這是可以解決的.

  22. 總之別再想1024bit了XD
    要利用更高的記憶體頻寬的時候整個晶片都得比例增倍,絕對不是什麼好方法XD
    以目前來說,至少拉浮點性能會是個提升的方法,畢竟把瓶頸轉嫁到shader長度上會比要求記憶體頻寬提升要簡單得多;只是以NVIDIA目前的做法來說,拉shader常常會同時拉到Tex,目前NV50系統第一個沒拉到的是GT200,以後大概有機會持續下去。
    ATI目前這方面乍看之下是比較不需要擔心,至少感覺RV770的單一SIMD array 80SP(or 16個5D)應該不是上限….才對?

  23. 總之別再想1024bit了XD
    要利用更高的記憶體頻寬的時候整個晶片都得比例增倍,絕對不是什麼好方法XD
    以目前來說,至少拉浮點性能會是個提升的方法,畢竟把瓶頸轉嫁到shader長度上會比要求記憶體頻寬提升要簡單得多;只是以NVIDIA目前的做法來說,拉shader常常會同時拉到Tex,目前NV50系統第一個沒拉到的是GT200,以後大概有機會持續下去。
    ATI目前這方面乍看之下是比較不需要擔心,至少感覺RV770的單一SIMD array 80SP(or 16個5D)應該不是上限….才對?

  24. NV内部非常自信会赢得新一轮GPU性能王者,因为GT300将会是512sp+512bit+DDR5的性能怪物,晶体管数量仅为2.4billion,在TSMC40nm制程下封装面积为495mm^2(某个秘密渠道透露的……)。相比较而言,Larrabee在Intel45nm制程下为600mm^2左右。而且NV的终极杀手锏将是GT300x2,单PCB+两个

  25. NV内部非常自信会赢得新一轮GPU性能王者,因为GT300将会是512sp+512bit+DDR5的性能怪物,晶体管数量仅为2.4billion,在TSMC40nm制程下封装面积为495mm^2(某个秘密渠道透露的……)。相比较而言,Larrabee在Intel45nm制程下为600mm^2左右。而且NV的终极杀手锏将是GT300x2,单PCB+两个

  26. 维持512bit是当然的 回过头想想看256bit从2002年一直延用到2006年 恐怕这个512bit也至少要延用4年左右吧

  27. 维持512bit是当然的 回过头想想看256bit从2002年一直延用到2006年 恐怕这个512bit也至少要延用4年左右吧

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料