http://www.pcper.com/comments.php?nid=6008
NVIDIA tackles the Larrabee question
本文:
http://www.pcper.com/images/news/A%20viewpoint%20from%20NVIDIA.pdf
In summary, Intel knows that moving to powerful, floating point rich parallel architectures is the future – in so doing they will inevitably encourage more developers to develop on GPUs as they too will see this move from Intel as a major industry shift and will want to target the hardware where their software has the greatest chance of success. NVIDIA will have shipped over 150 million CUDA capable parallel processors by the time Larrabee ships and Intel knows they will hurt their CPU business by making this transition, but this is truly the era of visual computing and this shift is a necessary move.
結論:free lunch is over。
你該想個新方法讓你的code跑得更快,但是要在什麼架構上跑什麼東西不是重點,重點只是大家在搶這個商機而已。
在過去,fabless的商務模式一直為人所津津樂道
即便到了現在,fabless模式依然備受推崇
個人在此提出一個完全相反的看法:
在圖形晶片這個領域
fabless最終可能會成為nvidia的致命傷
而intel公司的in-house模式將體現出巨大優勢
在過去,fabless的商務模式一直為人所津津樂道
即便到了現在,fabless模式依然備受推崇
個人在此提出一個完全相反的看法:
在圖形晶片這個領域
fabless最終可能會成為nvidia的致命傷
而intel公司的in-house模式將體現出巨大優勢
沒有人特別推崇fabless這種商務模式啊….XD
fabless只是比較靈活、可以視需求在短時間內推出變化比較大的產品;但是當你要做超級大晶片的時候,你還是手上要有晶圓廠,做垂直整合才會比較有效率啊。
不然AMD創始人也不會說「有晶圓廠才是真男人了」,他講的是集中投資的真諦啊XD
沒有人特別推崇fabless這種商務模式啊….XD
fabless只是比較靈活、可以視需求在短時間內推出變化比較大的產品;但是當你要做超級大晶片的時候,你還是手上要有晶圓廠,做垂直整合才會比較有效率啊。
不然AMD創始人也不會說「有晶圓廠才是真男人了」,他講的是集中投資的真諦啊XD
>Also, will larrabee be able to achieve the fine balance between both power and cost in graphics?
nvidia說的很對!!
例如:同樣是150W功耗, 而larrabee的性能遠遠低于GPU的話,是沒有競爭力。
又例如:如果larrabee的性能與某GPU相同時,叫價卻高上一倍,是沒有市場的。
就算性能領先,但是功耗太大,又或者成本太高,是很難參與競爭的。
fabless是要分點利潤給fab商的, 可能成本上高一點,但是投入小很靈活.
還有個關鍵因素: 就是性能的革新周期, 隨著制程改進與架構改進,GPU性能提升很快, 如果larrabee是按CPU的革新周期,那就很快就掉隊了. 第一擊沒有多重要,重要的是第二擊,第三擊….. 決定性因素是每一擊之間的時間間隔. larrabee能適應GPU的競爭環境?
>Also, will larrabee be able to achieve the fine balance between both power and cost in graphics?
nvidia說的很對!!
例如:同樣是150W功耗, 而larrabee的性能遠遠低于GPU的話,是沒有競爭力。
又例如:如果larrabee的性能與某GPU相同時,叫價卻高上一倍,是沒有市場的。
就算性能領先,但是功耗太大,又或者成本太高,是很難參與競爭的。
fabless是要分點利潤給fab商的, 可能成本上高一點,但是投入小很靈活.
還有個關鍵因素: 就是性能的革新周期, 隨著制程改進與架構改進,GPU性能提升很快, 如果larrabee是按CPU的革新周期,那就很快就掉隊了. 第一擊沒有多重要,重要的是第二擊,第三擊….. 決定性因素是每一擊之間的時間間隔. larrabee能適應GPU的競爭環境?
>你該想個新方法讓你的code跑得更快,但是要在什麼架構上跑什麼東西不是重點,重點只是大家在搶這個商機而已。
應該還要一個根本原因–就是CPU市場的增長速度遠遠低于晶圓廠的產能擴張速度,也遠遠低于晶圓廠的投入成本增加的速度, 于是需要把多余的產能利用起來,于是就想進入到GPU,以及超便攜領域推出產品. 據說,450mm晶圓廠需要$100億. 就算是300mm的32nm或22nm晶圓廠也要投入幾十億以上. 其實,可以想開點, 給nvidia代工就行了, 何必親自動手搶飯碗呢? 想要獨占所有利潤也太大胃口了,小心噎著了.
>你該想個新方法讓你的code跑得更快,但是要在什麼架構上跑什麼東西不是重點,重點只是大家在搶這個商機而已。
應該還要一個根本原因–就是CPU市場的增長速度遠遠低于晶圓廠的產能擴張速度,也遠遠低于晶圓廠的投入成本增加的速度, 于是需要把多余的產能利用起來,于是就想進入到GPU,以及超便攜領域推出產品. 據說,450mm晶圓廠需要$100億. 就算是300mm的32nm或22nm晶圓廠也要投入幾十億以上. 其實,可以想開點, 給nvidia代工就行了, 何必親自動手搶飯碗呢? 想要獨占所有利潤也太大胃口了,小心噎著了.
> 還有個關鍵因素: 就是性能的革新周期, 隨著制程改進與架構改進,GPU性能提升很快, 如果larrabee是按CPU的革新周期,那就很快就掉隊了. 第一擊沒有多重要,重要的是第二擊,第三擊….. 決定性因素是每一擊之間的時間間隔. larrabee能適應GPU的競爭環境?
這倒關係不大,CPU革新週期比較慢是因為架構有相容性需求、不能常常改、還有要搭配自己的製程更新週期,所謂的tick-tack模式,兩年新兩年舊改進,這對過去的GPU來說是比較慢些….
但是有注意到的話其實會發現,這兩年GPU架構也沒什麼大改了,後面很可能也不會。而且Larrabee擺明就是以後只想加核心不想加別的,那麼其實產品刷新周期也不會慢到哪去。(製程更新期是增加核心,核心變更期還是加核心….XD)
> 其實,可以想開點, 給nvidia代工就行了, 何必親自動手搶飯碗呢? 想要獨占所有利潤也太大胃口了,小心噎著了.
或許和NVIDIA買IP、自己生產然後拆帳也是個方法;但是這樣就不是Intel了,因為Intel有個最大的問題,就是「Not Invented Here Syndrome」,不是我做的就不是好東西、非我族類其心必異啊!XD
當然這個心態也有別的解釋就是了:
http://www.csie.ntu.edu.tw/…l/fog0000000007.html
> 還有個關鍵因素: 就是性能的革新周期, 隨著制程改進與架構改進,GPU性能提升很快, 如果larrabee是按CPU的革新周期,那就很快就掉隊了. 第一擊沒有多重要,重要的是第二擊,第三擊….. 決定性因素是每一擊之間的時間間隔. larrabee能適應GPU的競爭環境?
這倒關係不大,CPU革新週期比較慢是因為架構有相容性需求、不能常常改、還有要搭配自己的製程更新週期,所謂的tick-tack模式,兩年新兩年舊改進,這對過去的GPU來說是比較慢些….
但是有注意到的話其實會發現,這兩年GPU架構也沒什麼大改了,後面很可能也不會。而且Larrabee擺明就是以後只想加核心不想加別的,那麼其實產品刷新周期也不會慢到哪去。(製程更新期是增加核心,核心變更期還是加核心….XD)
> 其實,可以想開點, 給nvidia代工就行了, 何必親自動手搶飯碗呢? 想要獨占所有利潤也太大胃口了,小心噎著了.
或許和NVIDIA買IP、自己生產然後拆帳也是個方法;但是這樣就不是Intel了,因為Intel有個最大的問題,就是「Not Invented Here Syndrome」,不是我做的就不是好東西、非我族類其心必異啊!XD
當然這個心態也有別的解釋就是了:
http://www.csie.ntu.edu.tw/…l/fog0000000007.html
>>你該想個新方法讓你的code跑得更快,
>>但是要在什麼架構上跑什麼東西不是重點
不管shader unit的指令架構是怎樣變.
反正只要有driver和編譯器在,
就能把HLSL和GLSL編譯成對硬體最佳化的機器碼.
所以GPU硬體底層scalar,VLIW變來變去也沒關係.
是不是用X86指令或是否相容於上一代也沒人在乎.
反正開發者只有類似C語言的shader code.
其他全交給shader compiler.
硬體廠商也很方便,只要編譯器有跟著進步,
硬體架構可以針對當時軟體需求大改特改.
例如從X1900–>R600
G70 –>G80
CUDA也是像shader一樣,不綁死在任何ISA.
硬體底層要怎麼改都可以.
只要跑的快就好.
>>你該想個新方法讓你的code跑得更快,
>>但是要在什麼架構上跑什麼東西不是重點
不管shader unit的指令架構是怎樣變.
反正只要有driver和編譯器在,
就能把HLSL和GLSL編譯成對硬體最佳化的機器碼.
所以GPU硬體底層scalar,VLIW變來變去也沒關係.
是不是用X86指令或是否相容於上一代也沒人在乎.
反正開發者只有類似C語言的shader code.
其他全交給shader compiler.
硬體廠商也很方便,只要編譯器有跟著進步,
硬體架構可以針對當時軟體需求大改特改.
例如從X1900–>R600
G70 –>G80
CUDA也是像shader一樣,不綁死在任何ISA.
硬體底層要怎麼改都可以.
只要跑的快就好.
除了追加核心數
其實GPU要再演化也是有可能的,
例如512~1024bit的vector unit….甚至更多.
那並非只有Larrabee才能做.
只是太寬的vector unit不好做到滿載.
vec4 a = vec4 b + vec4 c;
vec4 b = vec4 a + vec4 c;
這2行就沒辦法一起用256bit的VU處理掉.
因為資料有依存性….一定要分開算.
如果後面還有其他shader code可能找的到
沒有資料依存性的計算去填滿空的vector unit.
如果沒有…compiler就無能為力.
所以GPU不是不能再突破,
只是它是針對”目前的軟體需求”去特製化的硬體.
等到shader code夠長夠複雜時,
自然有新的vector unit去適應新的狀況.
Larrabee因為還要模擬一些固定管線的功能,
可能比較容易填滿更寬的vector unit.
也許這是它能比較早選擇加寬vector unit的理由.
除了追加核心數
其實GPU要再演化也是有可能的,
例如512~1024bit的vector unit….甚至更多.
那並非只有Larrabee才能做.
只是太寬的vector unit不好做到滿載.
vec4 a = vec4 b + vec4 c;
vec4 b = vec4 a + vec4 c;
這2行就沒辦法一起用256bit的VU處理掉.
因為資料有依存性….一定要分開算.
如果後面還有其他shader code可能找的到
沒有資料依存性的計算去填滿空的vector unit.
如果沒有…compiler就無能為力.
所以GPU不是不能再突破,
只是它是針對”目前的軟體需求”去特製化的硬體.
等到shader code夠長夠複雜時,
自然有新的vector unit去適應新的狀況.
Larrabee因為還要模擬一些固定管線的功能,
可能比較容易填滿更寬的vector unit.
也許這是它能比較早選擇加寬vector unit的理由.
如果能養的起 fab 應該沒有什麼人願意去玩 fabless 吧! 主要是多數的廠商的產品本身無法負擔製程的研發跟產能的擴張,所以才都轉往給只發展製程的代工廠來進行生產,目前全球有先進製程 fab 的 IC 設計公司上算來算去也就那幾間 CPU 大廠,記憶體廠,跟日本那票互相合作的,除此之外沒什麼廠商能靠自己養活自的 fab,況且就算是 IBM 或日本的 Toshiba Fujitsu 一樣也接受外來訂單。
Intel 進到 GPU 市場能否成功關鍵之一還是看他們的製程技術能領先其他家多久,如果還是跟過去一樣能保持一年以上的製程領先,要靠產能跟先進製程壓死別家也並非不可能,這點在 CPU 的競爭上已經看到很多次了。
如果能養的起 fab 應該沒有什麼人願意去玩 fabless 吧! 主要是多數的廠商的產品本身無法負擔製程的研發跟產能的擴張,所以才都轉往給只發展製程的代工廠來進行生產,目前全球有先進製程 fab 的 IC 設計公司上算來算去也就那幾間 CPU 大廠,記憶體廠,跟日本那票互相合作的,除此之外沒什麼廠商能靠自己養活自的 fab,況且就算是 IBM 或日本的 Toshiba Fujitsu 一樣也接受外來訂單。
Intel 進到 GPU 市場能否成功關鍵之一還是看他們的製程技術能領先其他家多久,如果還是跟過去一樣能保持一年以上的製程領先,要靠產能跟先進製程壓死別家也並非不可能,這點在 CPU 的競爭上已經看到很多次了。
>或許和NVIDIA買IP、自己生產然後拆帳也是個方法;但是這樣就不是Intel了,因為Intel有個最大的問題,就是「Not Invented Here Syndrome」,不是我做的就不是好東西、非我族類其心必異啊!XD
给IP? 那會把核心技術都交給對方了!! 另外,fab都是坐收生產利潤的. 如果nvidia對臺積電說–你來買ip回去你生產吧. 臺積電可能就和nvidia取消生產關系了. 也沒有任何fab會與nvidia做如此的生意. fab是生產一塊合格晶片就要收一塊晶片的加工費用, 而晶片能否賺到錢那是nv或ati的事情,和臺積電fab無關.
>waffenss:Larrabee因為還要模擬一些固定管線的功能,
>可能比較容易填滿更寬的vector unit.
>也許這是它能比較早選擇加寬vector unit的理由.
還有一個原因, larrabee核心數量太少了, 例如: 32個核心要提供很大的運算力,那就被迫寬化vector unit. 那為什么larrabee的核心數量如此低? 還用問? x86!!
32個x86核心占用的晶體面積是多大?
200個x86核心占用的晶體面積是多大?
根據pdf
32核心/16 way simd條件下, larrabee的vpu與vector reg占core(核心,可能沒有包含L2等)面積的1/3.
如果是 128核心/ 4 way simd, 那就相當搞笑了, 或許larrabee的vpu與vector reg占core(核心,可能沒有包含L2等)面積的1/10.
由于相容x86而運算力是由vpu提供,所以核心必須讓vpu盡量寬化–是被迫的!!
>或許和NVIDIA買IP、自己生產然後拆帳也是個方法;但是這樣就不是Intel了,因為Intel有個最大的問題,就是「Not Invented Here Syndrome」,不是我做的就不是好東西、非我族類其心必異啊!XD
给IP? 那會把核心技術都交給對方了!! 另外,fab都是坐收生產利潤的. 如果nvidia對臺積電說–你來買ip回去你生產吧. 臺積電可能就和nvidia取消生產關系了. 也沒有任何fab會與nvidia做如此的生意. fab是生產一塊合格晶片就要收一塊晶片的加工費用, 而晶片能否賺到錢那是nv或ati的事情,和臺積電fab無關.
>waffenss:Larrabee因為還要模擬一些固定管線的功能,
>可能比較容易填滿更寬的vector unit.
>也許這是它能比較早選擇加寬vector unit的理由.
還有一個原因, larrabee核心數量太少了, 例如: 32個核心要提供很大的運算力,那就被迫寬化vector unit. 那為什么larrabee的核心數量如此低? 還用問? x86!!
32個x86核心占用的晶體面積是多大?
200個x86核心占用的晶體面積是多大?
根據pdf
32核心/16 way simd條件下, larrabee的vpu與vector reg占core(核心,可能沒有包含L2等)面積的1/3.
如果是 128核心/ 4 way simd, 那就相當搞笑了, 或許larrabee的vpu與vector reg占core(核心,可能沒有包含L2等)面積的1/10.
由于相容x86而運算力是由vpu提供,所以核心必須讓vpu盡量寬化–是被迫的!!
IP銷售其實有個成功的案例
PowerVR的MBX和SGX系列.
他不賣晶片,只賣3D core的IP.
連Intel都跟他買IP來用在配合Atom的GMA500.
之前Intel也用在PDA的2700G上.
手持裝置上買PowerVR的廠商多到數不清…..
他連fabless都不算,是只賣IP的.
會買IP的不是Fab廠,而是CPU或Chipset廠商.
買回去整合進自己的產品.
IP銷售其實有個成功的案例
PowerVR的MBX和SGX系列.
他不賣晶片,只賣3D core的IP.
連Intel都跟他買IP來用在配合Atom的GMA500.
之前Intel也用在PDA的2700G上.
手持裝置上買PowerVR的廠商多到數不清…..
他連fabless都不算,是只賣IP的.
會買IP的不是Fab廠,而是CPU或Chipset廠商.
買回去整合進自己的產品.
> 给IP? 那會把核心技術都交給對方了!!
PowerVR SGX(PowerVR5)其實算是蠻powerful的,以發表時間來說它其實是最早的DX10.1 core,而它都能賣IP了,老實說我覺得是沒什麼問題的,CPU市場也有一個ARM在賣IP,而且有一個持續維持住優勢的市場。
NVIDIA也賣了GeForce7的完整IP給SCEI,而為什麼能有廠商賣IP的關係,是因為就算買到了IP(核心技術),它也沒辦法在這個基礎上繼續把這東西發展下去,因為與time-to-market有關,SCEI本身也是有辦法作graphic hardware,但是大家都知道對目前的市場來說已經沒有競爭力,即使真的給他們一個目前現存等級的graphic IP,明年它也不見得能出自己的GPU不是嗎?
所以會買IP的原因,是因為他們只需要這個產品的市場,而不打算以自己的投資發展下去的,就會買IP來用;相對的Intel的自己作症候群就是,想做的產品都要自己養一個team來推完整的東西….所以他們後來又把StrongARM給賣了。
也就是說,Larrabee的目的未來仍然是要「全部以CPU處理」,而不是一個「可以作比較多事情的graphic ip」,只是目前它以graphic adapter、繪圖卡的形式推出(話說我之前以「GPU」稱呼Larrabee也是因為這點),因為繪圖卡目前對遊戲來說堪稱必要,而不是一個「xx加速卡」,那看起來就不是必需品、沒有既有市場了。
> 還有一個原因, larrabee核心數量太少了, 例如: 32個核心要提供很大的運算力,那就被迫寬化vector unit. 那為什么larrabee的核心數量如此低? 還用問? x86!!
> 32個x86核心占用的晶體面積是多大?
> 200個x86核心占用的晶體面積是多大?
我覺得問題不是因為x86: NVIDIA和ATI都是一堆stream processor共用一個decoder,你把整個x86 core和一個stream processor比就不對了,要比也是該和80個R600 SP比、或者是至少8個G8x的sp/1個SM比,所以如果每個sp有自己的decoder,還是一樣會和你上面講的一樣很慘。
用這個對比起來,RV770才10個核心、GT200也才30個SM,看起來就差不多了。
所以只要它能寬化就不是什麼大問題,不是被不被迫,過去因為維持指令格式支援,所以沒辦法大刀拓斧地拓寬SIMD;CPU上也沒有足夠的記憶體頻寬給它拓寬單元後的記憶體頻寬需求,這兩點在GPU上天生都比較輕鬆(一個是driver包裝自己,以整體solution的方式來處理相容性;另一個是記憶體頻寬較大)所以自然就會有一堆單元共用decoder,靠SIMD衝高throughtput的設計;更何況現在x86 core本身就被Intel當成另外一個訴求來用。
別忘了當年一開始8086也很小的…. :p
不過說「晶體面積」這個詞=die size的話,x86就真的很大了….
(Core2Duo 65nm的一個core+L1也才17M,但是卻有36mm^2,兩個合起來足足佔掉整個143mm^2 die size的將近2/5,但是電晶體只有全部的12%左右,顯然複雜的不是電晶體數量而是wiring….)
> 给IP? 那會把核心技術都交給對方了!!
PowerVR SGX(PowerVR5)其實算是蠻powerful的,以發表時間來說它其實是最早的DX10.1 core,而它都能賣IP了,老實說我覺得是沒什麼問題的,CPU市場也有一個ARM在賣IP,而且有一個持續維持住優勢的市場。
NVIDIA也賣了GeForce7的完整IP給SCEI,而為什麼能有廠商賣IP的關係,是因為就算買到了IP(核心技術),它也沒辦法在這個基礎上繼續把這東西發展下去,因為與time-to-market有關,SCEI本身也是有辦法作graphic hardware,但是大家都知道對目前的市場來說已經沒有競爭力,即使真的給他們一個目前現存等級的graphic IP,明年它也不見得能出自己的GPU不是嗎?
所以會買IP的原因,是因為他們只需要這個產品的市場,而不打算以自己的投資發展下去的,就會買IP來用;相對的Intel的自己作症候群就是,想做的產品都要自己養一個team來推完整的東西….所以他們後來又把StrongARM給賣了。
也就是說,Larrabee的目的未來仍然是要「全部以CPU處理」,而不是一個「可以作比較多事情的graphic ip」,只是目前它以graphic adapter、繪圖卡的形式推出(話說我之前以「GPU」稱呼Larrabee也是因為這點),因為繪圖卡目前對遊戲來說堪稱必要,而不是一個「xx加速卡」,那看起來就不是必需品、沒有既有市場了。
> 還有一個原因, larrabee核心數量太少了, 例如: 32個核心要提供很大的運算力,那就被迫寬化vector unit. 那為什么larrabee的核心數量如此低? 還用問? x86!!
> 32個x86核心占用的晶體面積是多大?
> 200個x86核心占用的晶體面積是多大?
我覺得問題不是因為x86: NVIDIA和ATI都是一堆stream processor共用一個decoder,你把整個x86 core和一個stream processor比就不對了,要比也是該和80個R600 SP比、或者是至少8個G8x的sp/1個SM比,所以如果每個sp有自己的decoder,還是一樣會和你上面講的一樣很慘。
用這個對比起來,RV770才10個核心、GT200也才30個SM,看起來就差不多了。
所以只要它能寬化就不是什麼大問題,不是被不被迫,過去因為維持指令格式支援,所以沒辦法大刀拓斧地拓寬SIMD;CPU上也沒有足夠的記憶體頻寬給它拓寬單元後的記憶體頻寬需求,這兩點在GPU上天生都比較輕鬆(一個是driver包裝自己,以整體solution的方式來處理相容性;另一個是記憶體頻寬較大)所以自然就會有一堆單元共用decoder,靠SIMD衝高throughtput的設計;更何況現在x86 core本身就被Intel當成另外一個訴求來用。
別忘了當年一開始8086也很小的…. :p
不過說「晶體面積」這個詞=die size的話,x86就真的很大了….
(Core2Duo 65nm的一個core+L1也才17M,但是卻有36mm^2,兩個合起來足足佔掉整個143mm^2 die size的將近2/5,但是電晶體只有全部的12%左右,顯然複雜的不是電晶體數量而是wiring….)
拿自己測自己畫的圖表,用嘴巴講,用推論的
比不上用實物跑給大家看
或拿給公正公開單位測試
INTEL在顯卡的部份說了太多狼來了
請用事實證明給我看
拿自己測自己畫的圖表,用嘴巴講,用推論的
比不上用實物跑給大家看
或拿給公正公開單位測試
INTEL在顯卡的部份說了太多狼來了
請用事實證明給我看
>CPU市場也有一個ARM在賣IP,而且有一個持續維持住優勢的市場。
買ARM ip的都是fabless, 而且要搞清楚ARM的銷量是25億片/年.
談到代工問題, 沒有fab會買ip來生產.
nv把ip核賣了, 那就很慘了. 舉例,如果nv已經把GTX280的IP賣掉了,那核心技術就被偷掉了. 今后就太被動了. 難以想象啊.
>用這個對比起來,RV770才10個核心、GT200也才30個SM,看起來就差不多了。
問個問題,GTX280的SM難道是decode一條指令/cycle? 是8個SP同一個cycle內收到的instruction指令是同一個? 那讓人大震驚了. 那8 SP就等效于8 way simd? 請教一下.
另外你也太少算了一個核心,一個核心包括fetch/decode/dispatch/reg/int alu/x87 fpu等等. 何止decode呢?
就是x86的原因了, 因為x86,很難做到了大量上百個核心,所以被迫提高每個核心的計算密度.
>CPU市場也有一個ARM在賣IP,而且有一個持續維持住優勢的市場。
買ARM ip的都是fabless, 而且要搞清楚ARM的銷量是25億片/年.
談到代工問題, 沒有fab會買ip來生產.
nv把ip核賣了, 那就很慘了. 舉例,如果nv已經把GTX280的IP賣掉了,那核心技術就被偷掉了. 今后就太被動了. 難以想象啊.
>用這個對比起來,RV770才10個核心、GT200也才30個SM,看起來就差不多了。
問個問題,GTX280的SM難道是decode一條指令/cycle? 是8個SP同一個cycle內收到的instruction指令是同一個? 那讓人大震驚了. 那8 SP就等效于8 way simd? 請教一下.
另外你也太少算了一個核心,一個核心包括fetch/decode/dispatch/reg/int alu/x87 fpu等等. 何止decode呢?
就是x86的原因了, 因為x86,很難做到了大量上百個核心,所以被迫提高每個核心的計算密度.
>拿自己測自己畫的圖表,用嘴巴講,用推論的
>比不上用實物跑給大家看
>或拿給公正公開單位測試
>INTEL在顯卡的部份說了太多狼來了
>請用事實證明給我看
可能是一測試就被打趴下了. 先賺眼球,相當于免費廣告,讓你知道larrabee的存在.
>拿自己測自己畫的圖表,用嘴巴講,用推論的
>比不上用實物跑給大家看
>或拿給公正公開單位測試
>INTEL在顯卡的部份說了太多狼來了
>請用事實證明給我看
可能是一測試就被打趴下了. 先賺眼球,相當于免費廣告,讓你知道larrabee的存在.
寫錯了
買ARM ip的倒都是些fabless廠,包括nv, 而且要搞清楚ARM的銷量是2.5億片/年.
寫錯了
買ARM ip的倒都是些fabless廠,包括nv, 而且要搞清楚ARM的銷量是2.5億片/年.
>PowerVR SGX(PowerVR5)其實算是蠻powerful的,以發表時間來說它其實是最早的DX10.1 core
問個問題, 你說如果cpu與gpu集成一體的處理器,將來有可能會采用PowerVR的ip吧?還是larrabee? 還是GMA進化版? 還是先用GMA進化版,然后改用PowerVR? 還是?
>PowerVR SGX(PowerVR5)其實算是蠻powerful的,以發表時間來說它其實是最早的DX10.1 core
問個問題, 你說如果cpu與gpu集成一體的處理器,將來有可能會采用PowerVR的ip吧?還是larrabee? 還是GMA進化版? 還是先用GMA進化版,然后改用PowerVR? 還是?
>>談到代工問題, 沒有fab會買ip來生產.
>>nv把ip核賣了, 那就很慘了. 舉例,如果nv已經把>>GTX280的IP賣掉了,那核心技術就被偷掉了. 今后就太>>被動了. 難以想象啊.
新一代架構的產品都要幾年時間開發.
當你能賣IP時,其實下1~2代已經正在開發中,
所以不怕人家偷技術.
而且買了IP應該只是買到整合這個core的權利.
能不能修改IP做成另外的產品也是問題…..
授權的範圍通常很有限.
當初Intel買了PVR MBX,之後還是得再買PVR SGX.
>>談到代工問題, 沒有fab會買ip來生產.
>>nv把ip核賣了, 那就很慘了. 舉例,如果nv已經把>>GTX280的IP賣掉了,那核心技術就被偷掉了. 今后就太>>被動了. 難以想象啊.
新一代架構的產品都要幾年時間開發.
當你能賣IP時,其實下1~2代已經正在開發中,
所以不怕人家偷技術.
而且買了IP應該只是買到整合這個core的權利.
能不能修改IP做成另外的產品也是問題…..
授權的範圍通常很有限.
當初Intel買了PVR MBX,之後還是得再買PVR SGX.
>>cpu與gpu集成一體的處理器,將來有可能會采用>>PowerVR的ip吧?還是larrabee?還是GMA進化版?
>>還是先用GMA進化版,然后改用PowerVR?
一起並存吧
那是不同市場的。
Intel在PDA等級的省電GPU這邊毫無研發經驗.
所以直接買現成IP. 因為GMA系列還是太耗電了.
SGX只會用在Atom平台,因為Intel買的core是
專for手持裝置,低效能的SGX535….
要更好的效能?那要另外買更好的Core才行.
>>cpu與gpu集成一體的處理器,將來有可能會采用>>PowerVR的ip吧?還是larrabee?還是GMA進化版?
>>還是先用GMA進化版,然后改用PowerVR?
一起並存吧
那是不同市場的。
Intel在PDA等級的省電GPU這邊毫無研發經驗.
所以直接買現成IP. 因為GMA系列還是太耗電了.
SGX只會用在Atom平台,因為Intel買的core是
專for手持裝置,低效能的SGX535….
要更好的效能?那要另外買更好的Core才行.
> 買ARM ip的倒都是些fabless廠,包括nv, 而且要搞清楚ARM的銷量是2.5億片/年.
> 舉例,如果nv已經把GTX280的IP賣掉了,那核心技術就被偷掉了.
> 今后就太被動了. 難以想象啊.
都是fabless?最大的ARM消耗源Nokia,主要的供應是Ti,所以這是說Ti沒fab?
“fab廠”當然不會買ip來生產,foundry和「手上有fab的廠商」是有落差的。
以「賣自己產能給其他廠商來當主要業務」,和「為了自己產品的輸出穩定、經濟規模而決定持有自有產能」完全是兩回事,所以我不知道為什麼會說TSMC「來買IP回去生產吧」,因為TSMC的產品本身是產能;你如果舉UMC的話可能還有點意思,因為他們過去有轉投資是設計晶片投產的子公司,所以有「取IP」的動機。
所以foundry如果本身有design house的轉投資,大概就不會被fabless公司信任….除非你和IBM一樣重視自己的商譽。
但是反過來說,目前才開始投產的IP畢竟已經「舊了」….開發的IP core一定已經走到下一個範疇,更何況一個完整的solution還有軟體部份,光靠買IP根本學不到什麼堪用的東西。
更別提還有高中低階不同規格的IP、比方說PowerVR SGX從低到高的IP版本差異很大,買低階就當成買到高階品了?這是不是把人家當成白痴….(照你這樣講買GTX280本身就是白痴,應該買GTX210之類的….XD)
所以問題是「賣給誰」而不是「有沒有賣」吧?
比方說,它會賣給AMD嗎?顯然不會;Intel也顯然不會,剛剛說了他們有那個病症存在就會全部自己做,會買的人肯定是「不打算自己作graphic core」的人,那位什麼會有「核心技術被偷走」的問題?
照這個邏輯來看,那其實foundry這個行業就無法存在了,因為「請你生產也是會被偷走」啊。
(其實說真的,我可不可以說會提出這種問題的原因是因為民族性?覺得可以和GTA一樣宰了路人廠商搶了車就跑….XD)
> 問個問題,GTX280的SM難道是decode一條指令/cycle? 是8個SP同一個cycle內收到的instruction指令是同一個?
> 那讓人大震驚了. 那8 SP就等效于8 way simd? 請教一下.
恭喜你理解了。事實上除了latency是4cycle,主要是gather & scatter的時間成本之外,decode一條指令本身是1cycle沒錯,它本來就是一種支援複雜移位的8way SIMD。
> 另外你也太少算了一個核心,一個核心包括fetch/decode/dispatch/reg/int alu/x87 fpu等等. 何止decode呢?
別錯開焦點啊,fetch/decode/dispatch/reg所有processor都需要。
int alu/x87 fpu則都是共用的。
x86最大的成本是在decode沒錯,但是我要強調x86本身的wiring複雜度,需要的面積大小並不是這個問題的根本,因為這些面積成本帶來的好處仍然存在,就是讓developer可以很快地把程式以最小的成本、堪用的性能port到Larrabee,不只是graphic、甚至是web server都可能在Larrabee執行(這時候的對手就變成Sun Rock了),這點透過GPGPU當然是作不到。
反之,你的立論就是「x86對graphic沒有用」,這大家當然知道沒有用….這和「GPU作不了其他事情」是一體兩面的,所以GPU廠商才要增加一些額外的設計,來提供GPU更大的靈活度,G8x和繪圖無關的部份讓NVIDIA額外負擔了10%的成本,目的不就是為了現在那號稱一億五千萬的CUDA install base?
> 買ARM ip的倒都是些fabless廠,包括nv, 而且要搞清楚ARM的銷量是2.5億片/年.
> 舉例,如果nv已經把GTX280的IP賣掉了,那核心技術就被偷掉了.
> 今后就太被動了. 難以想象啊.
都是fabless?最大的ARM消耗源Nokia,主要的供應是Ti,所以這是說Ti沒fab?
“fab廠”當然不會買ip來生產,foundry和「手上有fab的廠商」是有落差的。
以「賣自己產能給其他廠商來當主要業務」,和「為了自己產品的輸出穩定、經濟規模而決定持有自有產能」完全是兩回事,所以我不知道為什麼會說TSMC「來買IP回去生產吧」,因為TSMC的產品本身是產能;你如果舉UMC的話可能還有點意思,因為他們過去有轉投資是設計晶片投產的子公司,所以有「取IP」的動機。
所以foundry如果本身有design house的轉投資,大概就不會被fabless公司信任….除非你和IBM一樣重視自己的商譽。
但是反過來說,目前才開始投產的IP畢竟已經「舊了」….開發的IP core一定已經走到下一個範疇,更何況一個完整的solution還有軟體部份,光靠買IP根本學不到什麼堪用的東西。
更別提還有高中低階不同規格的IP、比方說PowerVR SGX從低到高的IP版本差異很大,買低階就當成買到高階品了?這是不是把人家當成白痴….(照你這樣講買GTX280本身就是白痴,應該買GTX210之類的….XD)
所以問題是「賣給誰」而不是「有沒有賣」吧?
比方說,它會賣給AMD嗎?顯然不會;Intel也顯然不會,剛剛說了他們有那個病症存在就會全部自己做,會買的人肯定是「不打算自己作graphic core」的人,那位什麼會有「核心技術被偷走」的問題?
照這個邏輯來看,那其實foundry這個行業就無法存在了,因為「請你生產也是會被偷走」啊。
(其實說真的,我可不可以說會提出這種問題的原因是因為民族性?覺得可以和GTA一樣宰了路人廠商搶了車就跑….XD)
> 問個問題,GTX280的SM難道是decode一條指令/cycle? 是8個SP同一個cycle內收到的instruction指令是同一個?
> 那讓人大震驚了. 那8 SP就等效于8 way simd? 請教一下.
恭喜你理解了。事實上除了latency是4cycle,主要是gather & scatter的時間成本之外,decode一條指令本身是1cycle沒錯,它本來就是一種支援複雜移位的8way SIMD。
> 另外你也太少算了一個核心,一個核心包括fetch/decode/dispatch/reg/int alu/x87 fpu等等. 何止decode呢?
別錯開焦點啊,fetch/decode/dispatch/reg所有processor都需要。
int alu/x87 fpu則都是共用的。
x86最大的成本是在decode沒錯,但是我要強調x86本身的wiring複雜度,需要的面積大小並不是這個問題的根本,因為這些面積成本帶來的好處仍然存在,就是讓developer可以很快地把程式以最小的成本、堪用的性能port到Larrabee,不只是graphic、甚至是web server都可能在Larrabee執行(這時候的對手就變成Sun Rock了),這點透過GPGPU當然是作不到。
反之,你的立論就是「x86對graphic沒有用」,這大家當然知道沒有用….這和「GPU作不了其他事情」是一體兩面的,所以GPU廠商才要增加一些額外的設計,來提供GPU更大的靈活度,G8x和繪圖無關的部份讓NVIDIA額外負擔了10%的成本,目的不就是為了現在那號稱一億五千萬的CUDA install base?
E大,什么叫垂直整合?..我比较赞成你的观点,要做超级大晶片最好还是要有自己的晶圆厂…
E大,什么叫垂直整合?..我比较赞成你的观点,要做超级大晶片最好还是要有自己的晶圆厂…
如果 GTX280的IP賣掉了,人家生產了GPU去銷售了,結果比臺積電時脈快40%,功耗低40%, 賣價低40%. 那生意怎么做啊? 難道今后就賣ip過活? 例如:賣ip的pvr的收入才多少?
關鍵是,到時候除了賣ip, 要是靠臺積電代工只會虧損了. 被自家的GPU核心擊垮.
所以很多賣ip的, 到最后根本就沒有成品銷售了,例如ARM與pvr.
如果僅僅是讓對方代工,既可以保護核心技術,還至少可以控制產品的銷售價格. 而且還可能選擇多家來同時代工. 只是利潤高低的差別.
如果 GTX280的IP賣掉了,人家生產了GPU去銷售了,結果比臺積電時脈快40%,功耗低40%, 賣價低40%. 那生意怎么做啊? 難道今后就賣ip過活? 例如:賣ip的pvr的收入才多少?
關鍵是,到時候除了賣ip, 要是靠臺積電代工只會虧損了. 被自家的GPU核心擊垮.
所以很多賣ip的, 到最后根本就沒有成品銷售了,例如ARM與pvr.
如果僅僅是讓對方代工,既可以保護核心技術,還至少可以控制產品的銷售價格. 而且還可能選擇多家來同時代工. 只是利潤高低的差別.
>照這個邏輯來看,那其實foundry這個行業就無法存在了,因為「請你生產也是會被偷走」啊。
連HDL源碼都沒有,fab如何偷啊? 要偷也是GSDII? 如何得到核心技術?
要是給了IP了,那就完蛋了. 就靠法律來保障了. 對手的研發實力,都太強大,要是把GTX280的IP給他們, 那就慘了, 很快就能掌握了核心技術. 是絕對需要保護的!!
如果nvidia給GTX280的IP那就死定了.
>照這個邏輯來看,那其實foundry這個行業就無法存在了,因為「請你生產也是會被偷走」啊。
連HDL源碼都沒有,fab如何偷啊? 要偷也是GSDII? 如何得到核心技術?
要是給了IP了,那就完蛋了. 就靠法律來保障了. 對手的研發實力,都太強大,要是把GTX280的IP給他們, 那就慘了, 很快就能掌握了核心技術. 是絕對需要保護的!!
如果nvidia給GTX280的IP那就死定了.
>照這個邏輯來看,那其實foundry這個行業就無法存在了,因為「請你生產也是會被偷走」啊。
連HDL源碼都沒有,fab如何偷啊? 要偷也是GSDII? 如何得到核心技術?
要是給了IP了,那就完蛋了. 就靠法律來保障了. 對手的研發實力,都太強大,要是把GTX280的IP給他們, 那就慘了, 很快就能掌握了核心技術. 是絕對需要保護的!!
如果nvidia給GTX280的IP那就死定了.
>別錯開焦點啊,fetch/decode/dispatch/reg所有processor都需要。
>int alu/x87 fpu則都是共用的。
你移開重點, 要弄清楚x86比shader isa要復雜的多,而x86的fetch/decode/dispatch/reg/alu是要比shader isa要復雜得多. 你要多設計很多東西.
顯然核心要支持x86,消耗將遠大于支持shader isa.
你的fetch/decode/dispatch/reg/int alu/x87 fpu都要按x86相容來設計, 也就是說你既要設計x86功能部分還要設計shader功能部分. 而GPU是shader isa處理器, 是設計fetch/decode/dispatch/reg/alu部分.
x86最大的成本是在decode沒錯,但是我要強調x86本身的wiring複雜度,需要的面積大小並不是這個問題的根本,因為這些面積成本帶來的好處仍然存在,就是讓developer可以很快地把程式以最小的成本、堪用的性能port到Larrabee,不只是graphic、甚至是web server都可能在Larrabee執行(這時候的對手就變成Sun Rock了),這點透過GPGPU當然是作不到。
>照這個邏輯來看,那其實foundry這個行業就無法存在了,因為「請你生產也是會被偷走」啊。
連HDL源碼都沒有,fab如何偷啊? 要偷也是GSDII? 如何得到核心技術?
要是給了IP了,那就完蛋了. 就靠法律來保障了. 對手的研發實力,都太強大,要是把GTX280的IP給他們, 那就慘了, 很快就能掌握了核心技術. 是絕對需要保護的!!
如果nvidia給GTX280的IP那就死定了.
>別錯開焦點啊,fetch/decode/dispatch/reg所有processor都需要。
>int alu/x87 fpu則都是共用的。
你移開重點, 要弄清楚x86比shader isa要復雜的多,而x86的fetch/decode/dispatch/reg/alu是要比shader isa要復雜得多. 你要多設計很多東西.
顯然核心要支持x86,消耗將遠大于支持shader isa.
你的fetch/decode/dispatch/reg/int alu/x87 fpu都要按x86相容來設計, 也就是說你既要設計x86功能部分還要設計shader功能部分. 而GPU是shader isa處理器, 是設計fetch/decode/dispatch/reg/alu部分.
x86最大的成本是在decode沒錯,但是我要強調x86本身的wiring複雜度,需要的面積大小並不是這個問題的根本,因為這些面積成本帶來的好處仍然存在,就是讓developer可以很快地把程式以最小的成本、堪用的性能port到Larrabee,不只是graphic、甚至是web server都可能在Larrabee執行(這時候的對手就變成Sun Rock了),這點透過GPGPU當然是作不到。
>沒有人特別推崇fabless這種商務模式啊….XD
不然你認為全世界前幾大的半導體廠商(TI、NXP、STMicro….)近年來都要轉型為fabless/fab-lite是怎麼回事?
>沒有人特別推崇fabless這種商務模式啊….XD
不然你認為全世界前幾大的半導體廠商(TI、NXP、STMicro….)近年來都要轉型為fabless/fab-lite是怎麼回事?
> 不然你認為全世界前幾大的半導體廠商(TI、NXP、STMicro….)近年來都要轉型為fabless/fab-lite是怎麼回事?
因為沒錢啊。
> 不然你認為全世界前幾大的半導體廠商(TI、NXP、STMicro….)近年來都要轉型為fabless/fab-lite是怎麼回事?
因為沒錢啊。
> 要是給了IP了,那就完蛋了. 就靠法律來保障了. 對手的研發實力,都太強大,要是把GTX280的IP給他們, 那就慘了, 很快就能掌握了核心技術. 是絕對需要保護的!!
所以我說重點是賣誰…._A_
“對手的研發實力都太強大”,你會賣你的競爭對手IP這就不對啦.,.._A_
> 你移開重點, 要弄清楚x86比shader isa要復雜的多,而x86的fetch/decode/dispatch/reg/alu是要比shader isa要復雜得多. 你要多設計很多東西.
> 顯然核心要支持x86,消耗將遠大于支持shader isa.
我覺得重點在驗證成本啦。
就像PC CPU市場裡面Intel拿x86的複雜度當保護傘,現在也沒有新加入的廠商,消耗遠大於支援shader ISA這點沒有錯,但是問題是沒有這個投資的話你又進不了PC CPU市場。
簡易的結論是,Larrabee就是想把CPU市場裡面靠製程領先度把其他對手的設計優勢拖死的模式,照舊在GPU市場重現而已,x86 core的投資對他們的策略而言是必要的,用ARM or 其他native ISA都沒有這個效果。
> 要是給了IP了,那就完蛋了. 就靠法律來保障了. 對手的研發實力,都太強大,要是把GTX280的IP給他們, 那就慘了, 很快就能掌握了核心技術. 是絕對需要保護的!!
所以我說重點是賣誰…._A_
“對手的研發實力都太強大”,你會賣你的競爭對手IP這就不對啦.,.._A_
> 你移開重點, 要弄清楚x86比shader isa要復雜的多,而x86的fetch/decode/dispatch/reg/alu是要比shader isa要復雜得多. 你要多設計很多東西.
> 顯然核心要支持x86,消耗將遠大于支持shader isa.
我覺得重點在驗證成本啦。
就像PC CPU市場裡面Intel拿x86的複雜度當保護傘,現在也沒有新加入的廠商,消耗遠大於支援shader ISA這點沒有錯,但是問題是沒有這個投資的話你又進不了PC CPU市場。
簡易的結論是,Larrabee就是想把CPU市場裡面靠製程領先度把其他對手的設計優勢拖死的模式,照舊在GPU市場重現而已,x86 core的投資對他們的策略而言是必要的,用ARM or 其他native ISA都沒有這個效果。
個人是猜測未來nvidia可能也是推出一個和Larrabee類似的晶片
歷代以來圖形晶片的「柔軟度」一直在提高
趨勢所至
Larrabee並非創舉,而是一個歷史必然結果
最後,”製程”可能會變成決勝負的關鍵
個人是猜測未來nvidia可能也是推出一個和Larrabee類似的晶片
歷代以來圖形晶片的「柔軟度」一直在提高
趨勢所至
Larrabee並非創舉,而是一個歷史必然結果
最後,”製程”可能會變成決勝負的關鍵
就IP上的爭論
基本上我同意eji兄的看法
就IP上的爭論
基本上我同意eji兄的看法
>買ARM ip的倒都是些fabless廠
事實並非如此
基本上任何一間你有聽過的廠商都有取得ARM的IP授權
幾乎是整個業界都有的
數目不下數百家
>所以很多賣ip的, 到最后根本就沒有成品銷售了,例如ARM與pvr.
ARM這些公司從來就沒有打算要賣成品
在半導體業界中有一群廠商歸類為IP廠商(ARM是其中最大的一間)
他們的商業模式完全是以依賴權利金來達成營收獲利
你可能會問說那除了ARM公司和提供PowerVR的imgtec公司之外還有那些?
我可以告訴你,包含眾人耳熟能詳的Rambus,MIPS….甚至沒人聽過的Virage Logic,Mosys….等等都是
>買ARM ip的倒都是些fabless廠
事實並非如此
基本上任何一間你有聽過的廠商都有取得ARM的IP授權
幾乎是整個業界都有的
數目不下數百家
>所以很多賣ip的, 到最后根本就沒有成品銷售了,例如ARM與pvr.
ARM這些公司從來就沒有打算要賣成品
在半導體業界中有一群廠商歸類為IP廠商(ARM是其中最大的一間)
他們的商業模式完全是以依賴權利金來達成營收獲利
你可能會問說那除了ARM公司和提供PowerVR的imgtec公司之外還有那些?
我可以告訴你,包含眾人耳熟能詳的Rambus,MIPS….甚至沒人聽過的Virage Logic,Mosys….等等都是
> E大,什么叫垂直整合?
從頭到尾自己做的,出來的東西就是產品這樣。
> E大,什么叫垂直整合?
從頭到尾自己做的,出來的東西就是產品這樣。
Fujitsu、NEC、Panasonic、toshiba、runesas 這些都自有廠房一樣也去買 ARM 的 IP……
轉型成 fabless 的原因從這裡很明顯的可以看到
http://www-03.ibm.com/…en/pressrelease/21592.wss
製程研發成為本過高要單一廠商去負擔太過困難,多數不是互相合作就是搞 fabless,目前有能力單獨負擔研發成本的廠商應該用手就數的出來吧!
Fujitsu、NEC、Panasonic、toshiba、runesas 這些都自有廠房一樣也去買 ARM 的 IP……
轉型成 fabless 的原因從這裡很明顯的可以看到
http://www-03.ibm.com/…en/pressrelease/21592.wss
製程研發成為本過高要單一廠商去負擔太過困難,多數不是互相合作就是搞 fabless,目前有能力單獨負擔研發成本的廠商應該用手就數的出來吧!