http://nueda.main.jp/blog/archives/004389.html
次期NVIDIAのハイエンド GT300のメモリ帯域幅は256GB/s
http://www.techpowerup.com/index.php?93377
http://www.theinquirer.net/inquirer/news/1052025/gt300-delayed-till-2010
維持512bit、改為4GHz GDDR5、512SP。
記憶體頻寬加倍的話,ROP和內部bus加倍的可能性也很大,結果就是幾乎等於GT200的完整增倍….
合不合理就各自見仁見智_A_
我得說……
16X8的xbar是打算怎么繞哦……
为什么NV不用7Ghz的GDDR5呢 7Gbps的GDDR5不是准备要上市了吗 考虑到GDDR5的延迟高 256GB/S的带宽相比GTX285的160GB/S并没有提升太多耶
延遲高不代表有效頻寬比較低啦….反正主要是不要stall就好了。
crossbar問題比較大就是了….
延遲高不代表有效頻寬比較低啦….反正主要是不要stall就好了。
crossbar問題比較大就是了….
既然延迟高不代表有效频宽比较低,那延迟太高会对什么不利呢或者说会影响哪方面的性能呢?
既然延迟高不代表有效频宽比较低,那延迟太高会对什么不利呢或者说会影响哪方面的性能呢?
記憶體系統的延遲基本上大略是固定的(只要沒有太明顯的random access),所以假設我們只討論繪圖的話,基本上只要調整active thread數量,就可以對應延遲更大的高速記憶體介面。
基本上繪圖面的話遲延沒什麼影響,但是記憶體系統延遲很高的時候要靠架構去吸收,所以基本上不能動不動就換記憶體。
反過來說,CPU做的事情大部分都很怕延遲….
記憶體系統的延遲基本上大略是固定的(只要沒有太明顯的random access),所以假設我們只討論繪圖的話,基本上只要調整active thread數量,就可以對應延遲更大的高速記憶體介面。
基本上繪圖面的話遲延沒什麼影響,但是記憶體系統延遲很高的時候要靠架構去吸收,所以基本上不能動不動就換記憶體。
反過來說,CPU做的事情大部分都很怕延遲….
E大,你认为GT300还会继续走大核心路线没?
E大,你认为GT300还会继续走大核心路线没?
我是認為NV還是會出大核心的(當然我不是Eji,只代表自己的意見)
不過我認為是搞12X8的384SP就差不多是極限了。16X8是我不敢想象的。
我是認為NV還是會出大核心的(當然我不是Eji,只代表自己的意見)
不過我認為是搞12X8的384SP就差不多是極限了。16X8是我不敢想象的。
32×12嗎….不過想想,48×12就576啦。XD
我是比較在意ROP的部分該怎麼處理啦,如果維持512bit的話,要利用增加的頻寬,就非得擴大內部的interconnection、ROP的性能等等都要跟著拉高才能善用….這也不是說解決就可以解決。
32×12嗎….不過想想,48×12就576啦。XD
我是比較在意ROP的部分該怎麼處理啦,如果維持512bit的話,要利用增加的頻寬,就非得擴大內部的interconnection、ROP的性能等等都要跟著拉高才能善用….這也不是說解決就可以解決。
此外,我覺得wensee所想問的”單一大核心”,指的應該是”單版只能放一個的”這種程度的大核心;但是從GTX295我們可以知道,其實過去認為512bit是single board的極限,GT200沒辦法上dual-chip;但是NVIDIA最後還是放了兩個448bit上去。
所以我覺得”單一大核心”路線並不存在,單純只是和對手拆招而已。
比方說4770讓人開始想到128bit x4chip的可能性,這時候256bit又是大核心了。
此外,我覺得wensee所想問的”單一大核心”,指的應該是”單版只能放一個的”這種程度的大核心;但是從GTX295我們可以知道,其實過去認為512bit是single board的極限,GT200沒辦法上dual-chip;但是NVIDIA最後還是放了兩個448bit上去。
所以我覺得”單一大核心”路線並不存在,單純只是和對手拆招而已。
比方說4770讓人開始想到128bit x4chip的可能性,這時候256bit又是大核心了。
GT300的最大疑問是會不會再跟GT200一樣不適合改出低端芯片來,得繼續用換名頂著……
GT200雖然Gflops只有G92的1.5倍左右,但是GPGPU性能是G92的3倍,而且支持雙精度浮點。
這點新的中低端用戶沒法享受到到還不算大問題。
只是GT300時期如果繼續用G92、GT200及其工藝改良版頂著。
那差別就是很關鍵的DX11了。
GT300的最大疑問是會不會再跟GT200一樣不適合改出低端芯片來,得繼續用換名頂著……
GT200雖然Gflops只有G92的1.5倍左右,但是GPGPU性能是G92的3倍,而且支持雙精度浮點。
這點新的中低端用戶沒法享受到到還不算大問題。
只是GT300時期如果繼續用G92、GT200及其工藝改良版頂著。
那差別就是很關鍵的DX11了。
个人觉得现在的single board极限不是512bit,从GTX285单面可以放16颗显存颗粒可以看出,如果正反两面全部放上16颗显存将会达到惊人的1024bit 32颗显存,可见1024bit才是现在single board的极限,除非单颗显存颗粒的容量以及位宽继续往上攀升,否则1024bit就是现在single board的顶峰了
个人觉得现在的single board极限不是512bit,从GTX285单面可以放16颗显存颗粒可以看出,如果正反两面全部放上16颗显存将会达到惊人的1024bit 32颗显存,可见1024bit才是现在single board的极限,除非单颗显存颗粒的容量以及位宽继续往上攀升,否则1024bit就是现在single board的顶峰了
eji请把我17:03分的那次发言给删除了吧~
eji请把我17:03分的那次发言给删除了吧~
我覺得……非要上1024bit位寬的時候
那時的立體封裝解決方案相比1024bit的PCB板會更便宜……
我覺得……非要上1024bit位寬的時候
那時的立體封裝解決方案相比1024bit的PCB板會更便宜……
單一大晶片1024bit的問題在於,
要能用到這麼大的頻寬的GPU需要很多的ROP單位,
可是現在3D遊戲不能只靠ROP多,還需要
更多的TEX和shader ALU單位.
所以從512–>1024必須整個double才能線性效能成長.
但是目前NV的512bitGPU就已經面積500mm2左右
的低良率怪物了….
你要再double那可能會是面積1000mm2的恐龍.
………整片12吋晶圓恐怕沒幾個可用的die.
效能也許能double但成本卻可能是非線性的暴增.
這低良率(高成本)因素,恐怕才是單一大晶片不做到
1024bit的關鍵.
至於單一board的記憶體寬度,其實要超過512bit並不難.
用雙晶片的話,卡做長一點,耗電量大一點,
實質上只是SLI單卡化,反正成本和效能都是線性增加,
只要市場有需求這是可以解決的.
單一大晶片1024bit的問題在於,
要能用到這麼大的頻寬的GPU需要很多的ROP單位,
可是現在3D遊戲不能只靠ROP多,還需要
更多的TEX和shader ALU單位.
所以從512–>1024必須整個double才能線性效能成長.
但是目前NV的512bitGPU就已經面積500mm2左右
的低良率怪物了….
你要再double那可能會是面積1000mm2的恐龍.
………整片12吋晶圓恐怕沒幾個可用的die.
效能也許能double但成本卻可能是非線性的暴增.
這低良率(高成本)因素,恐怕才是單一大晶片不做到
1024bit的關鍵.
至於單一board的記憶體寬度,其實要超過512bit並不難.
用雙晶片的話,卡做長一點,耗電量大一點,
實質上只是SLI單卡化,反正成本和效能都是線性增加,
只要市場有需求這是可以解決的.
總之別再想1024bit了XD
要利用更高的記憶體頻寬的時候整個晶片都得比例增倍,絕對不是什麼好方法XD
以目前來說,至少拉浮點性能會是個提升的方法,畢竟把瓶頸轉嫁到shader長度上會比要求記憶體頻寬提升要簡單得多;只是以NVIDIA目前的做法來說,拉shader常常會同時拉到Tex,目前NV50系統第一個沒拉到的是GT200,以後大概有機會持續下去。
ATI目前這方面乍看之下是比較不需要擔心,至少感覺RV770的單一SIMD array 80SP(or 16個5D)應該不是上限….才對?
總之別再想1024bit了XD
要利用更高的記憶體頻寬的時候整個晶片都得比例增倍,絕對不是什麼好方法XD
以目前來說,至少拉浮點性能會是個提升的方法,畢竟把瓶頸轉嫁到shader長度上會比要求記憶體頻寬提升要簡單得多;只是以NVIDIA目前的做法來說,拉shader常常會同時拉到Tex,目前NV50系統第一個沒拉到的是GT200,以後大概有機會持續下去。
ATI目前這方面乍看之下是比較不需要擔心,至少感覺RV770的單一SIMD array 80SP(or 16個5D)應該不是上限….才對?
NV内部非常自信会赢得新一轮GPU性能王者,因为GT300将会是512sp+512bit+DDR5的性能怪物,晶体管数量仅为2.4billion,在TSMC40nm制程下封装面积为495mm^2(某个秘密渠道透露的……)。相比较而言,Larrabee在Intel45nm制程下为600mm^2左右。而且NV的终极杀手锏将是GT300x2,单PCB+两个
NV内部非常自信会赢得新一轮GPU性能王者,因为GT300将会是512sp+512bit+DDR5的性能怪物,晶体管数量仅为2.4billion,在TSMC40nm制程下封装面积为495mm^2(某个秘密渠道透露的……)。相比较而言,Larrabee在Intel45nm制程下为600mm^2左右。而且NV的终极杀手锏将是GT300x2,单PCB+两个
http://bbs.expreview.com/viewthread.php?tid=20215
http://bbs.expreview.com/viewthread.php?tid=20215
维持512bit是当然的 回过头想想看256bit从2002年一直延用到2006年 恐怕这个512bit也至少要延用4年左右吧
维持512bit是当然的 回过头想想看256bit从2002年一直延用到2006年 恐怕这个512bit也至少要延用4年左右吧
单卡单核的1024bit位宽最起码也要4年后才能见到
单卡单核的1024bit位宽最起码也要4年后才能见到
谣言快变成真的了…..
谣言快变成真的了…..