Uncategorized GF104發表在即 10 7 月, 2010 Eji 11 則留言 數字開始慢慢爬出來…. 雖然後藤老爹前幾天那樣寫,不過把GT200改成DX11的功夫可能還多過把ECC和倍精度從GF100的shader拿掉。 只是要怎麼強化又是個難搞的地方,於是第二種說法,也是一般比較支持的說法: GF104的另一個可能的設定是2GPC x 8SM x 48sp, 也就是每個SM從2個16sp array增加成3個、texture unit的數量也跟著補強;當然這樣的話tessellator數量就從GF100減一半了。
> Eji大想表示的應該是384的sp數量沒錯吧? > 如果是的話,那應該是4SM才對(2GPC x 4SM/GPC = 8SM)。 對啊我又搞錯了_A_ 2GPC x 4SM = 8SM total Reply
我也覺得用GT200硬改DX11的說法不太合常理, (這難度比DX10.0->10.1,大太多了) 而且GTX460的Die Size不小! NV若在DX11搞這麼多不同架構的大晶片,太浪費研發資源. 沿用GPC架構增加每SM的SP數是比較合理的選擇. 理論上每個SM負擔的SP變多,Branch效率會稍微下降. 不過和SP增多帶來的額外性能還是值得的. 不過原生是384SP,卻只能拿出336SP….. 代表GF104良率還是和ATI有差距…… 畢竟只小一點點的RV870,去年一開始就能提供完整的版本. 而類似規模的GF104使用同製程,又晚了這麼久, 竟然還要關閉SM才能供貨? GPU的Cache佔面積的比例很低, 沒必要特別去移除,通常只是關掉. 我是覺得硬體上L2Cache應該沒改. 畢竟對手早就把DX11鋪貨到全產品線了, Time to market才是NV最大的問題. NV頂多是中低階產品的L2 Cache關閉部分或全關, 以提升良率,降低單位成本. Tex unit數….. 如果真的變成2GPCx4SMx48個SP, 那麼每SM的Tex unit數可能需要提升到6組, 也就是GTX460要有48個原生TEX單位, 才能維持GF100相同的ALU:TEx的比例. 所以GF104最可能的規格是 2GPC x 4SM (沿用GF100架構) 每SM擴增為48SP,總SP數384, Tex unit數也相對應的提升到48Tex 這樣Die Size最少要400mm2, 可以切出的die會比RV870少20%. 良率也會比較低,耗電量應該會超過200W 所以關閉一組SM,而且可能關閉L2 Cache. 以讓良率拉高,最大耗電量壓低到200W以內 (使用雙6PIN外接電源) 因為架構上沒有明顯大改,但是SP數只有70% 性能大概會明顯低於5870. 可以預期這種GF104性能大致上類似5830, 部分情形下類似5850. Reply
384SP的版本不出货 应该不是良率问题,而是怕会影响到465的清理库存 毕竟AMD那边的出货量来看 TSMC在40nm良率上有很大进步 Die Size现在还不知道 但如果瞄着RV870竞争,还要打价格战的话,应该不会拿出比300mm还大的晶片来吧 Reply
>>应该不会拿出比300mm还大的晶片来吧 基本上如果做384SP的話,是一定超過300mm2啦 (因為GF100砍一半成256SP就至少要260mm2以上) 如果不砍規格功能,400mm2上下是可以預期的. 目前流傳的die也的確很大顆,只是不知確實的尺寸. 如果硬要壓在300mm2以下,那就只能做原生256SP的. Reply
以SM為比較基準, 沒想到最後不只TA、TF增為原來的2倍, 連SFU也是從4個變為8個, 而Texture L1 Cache也是2倍, 從12KB變24KB, 然而3組CUDA Core x 16, 只有一組有倍精度運算, 其餘沒啥改變。 沒想到NV最後是用刪除倍精度來換取Cache, 只不過以此方式減少die真的行嗎? 只能說:「真有你的,NV!」XDXDXD Reply
GF104的GTX460不是出來了嗎? 怎麼還在發表在即??? 難道現在市面上的GTX460不是用GF104??? 為什麼網上的消息都說GTX460就是GF104, 還是現在那些都只是用gf100改的?? 不然怎麼各位高手還在臆測呢? Reply
> Eji大想表示的應該是384的sp數量沒錯吧?
> 如果是的話,那應該是4SM才對(2GPC x 4SM/GPC = 8SM)。
對啊我又搞錯了_A_ 2GPC x 4SM = 8SM total
糟糕,不小心把shady兄的comment刪掉了…..
我也覺得用GT200硬改DX11的說法不太合常理,
(這難度比DX10.0->10.1,大太多了)
而且GTX460的Die Size不小!
NV若在DX11搞這麼多不同架構的大晶片,太浪費研發資源.
沿用GPC架構增加每SM的SP數是比較合理的選擇.
理論上每個SM負擔的SP變多,Branch效率會稍微下降.
不過和SP增多帶來的額外性能還是值得的.
不過原生是384SP,卻只能拿出336SP…..
代表GF104良率還是和ATI有差距……
畢竟只小一點點的RV870,去年一開始就能提供完整的版本.
而類似規模的GF104使用同製程,又晚了這麼久,
竟然還要關閉SM才能供貨?
GPU的Cache佔面積的比例很低,
沒必要特別去移除,通常只是關掉.
我是覺得硬體上L2Cache應該沒改.
畢竟對手早就把DX11鋪貨到全產品線了,
Time to market才是NV最大的問題.
NV頂多是中低階產品的L2 Cache關閉部分或全關,
以提升良率,降低單位成本.
Tex unit數…..
如果真的變成2GPCx4SMx48個SP,
那麼每SM的Tex unit數可能需要提升到6組,
也就是GTX460要有48個原生TEX單位,
才能維持GF100相同的ALU:TEx的比例.
所以GF104最可能的規格是
2GPC x 4SM (沿用GF100架構)
每SM擴增為48SP,總SP數384,
Tex unit數也相對應的提升到48Tex
這樣Die Size最少要400mm2,
可以切出的die會比RV870少20%.
良率也會比較低,耗電量應該會超過200W
所以關閉一組SM,而且可能關閉L2 Cache.
以讓良率拉高,最大耗電量壓低到200W以內
(使用雙6PIN外接電源)
因為架構上沒有明顯大改,但是SP數只有70%
性能大概會明顯低於5870.
可以預期這種GF104性能大致上類似5830,
部分情形下類似5850.
我的回复一直被这站的过滤系统挡掉 不知这个能不能看见 这样子就无法参与讨论了TAT
384SP的版本不出货 应该不是良率问题,而是怕会影响到465的清理库存
毕竟AMD那边的出货量来看 TSMC在40nm良率上有很大进步
Die Size现在还不知道 但如果瞄着RV870竞争,还要打价格战的话,应该不会拿出比300mm还大的晶片来吧
>>应该不会拿出比300mm还大的晶片来吧
基本上如果做384SP的話,是一定超過300mm2啦
(因為GF100砍一半成256SP就至少要260mm2以上)
如果不砍規格功能,400mm2上下是可以預期的.
目前流傳的die也的確很大顆,只是不知確實的尺寸.
如果硬要壓在300mm2以下,那就只能做原生256SP的.
以SM為比較基準,
沒想到最後不只TA、TF增為原來的2倍,
連SFU也是從4個變為8個,
而Texture L1 Cache也是2倍,
從12KB變24KB,
然而3組CUDA Core x 16,
只有一組有倍精度運算,
其餘沒啥改變。
沒想到NV最後是用刪除倍精度來換取Cache,
只不過以此方式減少die真的行嗎?
只能說:「真有你的,NV!」XDXDXD
對了,
差點忘了wrap dispatch也是從2個變4個。
GF104的GTX460不是出來了嗎?
怎麼還在發表在即???
難道現在市面上的GTX460不是用GF104???
為什麼網上的消息都說GTX460就是GF104,
還是現在那些都只是用gf100改的??
不然怎麼各位高手還在臆測呢?
因為這篇文章的日期(7/9)嘍….
現在當然是已經發表…._A_)a
to SSS兄:
奇怪,我貝氏過濾關掉了….
難道是被Akismet擋掉嗎。