http://www.anandtech.com/weblog/showpost.aspx?i=659
Intel Cancels Larrabee Retail Products, Larrabee Project Lives On
We just got off the phone with Nick Knupffer of Intel, who confirmed something that has long been speculated upon: the fate of Larrabee. As of today, the first Larrabee chip’s retail release has been canceled. This means that Intel will not be releasing a Larrabee video card or a Larrabee HPC/GPGPU compute part.
看來Larrebee的顯示卡產品還是取消上市了。
其實長期以來對Larrabee的預期並不是高性能,而比較傾向用市場壓力和平台策略把對手用暴力硬擠出去,而不是對產品競爭力有什麼正面評價….反過來說,也許這決定和最近的幾個官司的判決有關也說不定。
此外,獨立GPU(或者「獨顯」)的市場長期來看應該會縮減….這也是對Larrabee要靠GPU市場來攤開發成本的策略可行度的一個疑問。畢竟Larrabee還是比其他對手大一號的可能性非常高,性能卻可能低了整整一個世代,賣點卻大多在非繪圖層面上,那麼作為顯示卡本身的競爭力一直都有很大的疑問。
CPU v.s. GPU真的只是Intel想的「CISC v.s. RISC延長戰」這麼單純?以繪圖來說,對平行度的依存非常徹底的關係,至少成長要遠遠超過實際需求和市場可以支撐的地步,才會發生當初音效卡市場被內建音效消滅的狀況,繪圖領域離這個範疇似乎還有點距離。
相對來說,AMD Fusion和Intel many-core 的high-throughtput computing(少數主core+多數Larrabee style的小core)競爭力自然是會高得多,因為在有需要的領域可以發揮的浮點性能遠比過去來得高,也可以消化掉低階繪圖需求。
總之Larrabee的價值應該不是在獨立顯示卡上,直接在未來推出many-core產品會合理得多。
Larrabee不管是時程與效能,幾乎沒人看好.
如果不能靠商業手段強迫搭售,恐怕毫無競爭力,
這時宣告放棄繪圖卡市場,並不讓人意外.
(可惜~沒機會看到LRB被fermi和RV870x2秒殺的情形了XD)
Intel於GPU這領域等於是空轉了1~2年.
LRB Project繼續也只是運用現有成果做軟體面研究,
其他Manycore, 也不可能補上這個位置.
實質上是永遠退出了獨顯/GPGPU的市場.
前幾年GPU泛用運算的趨勢下,
兩大CPU廠各自採取不同的策略,
Intel想靠mini-X86正面對抗,自行研發x86繪圖產品.
AMD則是順應趨勢,先買下GPU廠當技術儲備.
現在看來,AMD當初重金併購ATI,就顯得很有實際效益.
竟然成為2~3年內唯一手上有X86和高性能GPU的廠商.
AMD只要等製程上來,就有現成的DX11核心可整合到APU.
而Intel顯然兩手空空了,只能繼續用落後一整代GMA系列.
短期內也許還好, 但未來PC運算會是CPU/GPGPU協力,
而且主要運算量將在GPU.
不管Intel喜不喜歡, GPU已經不是遊戲專用,
其規模成長速度會比停在2~4核的CPU還快.
Intel若只想靠強力CPU硬幹OpenCL,恐怕效率不會很好.
有可能需要找外援……..例如PowerVR6?
內顯頻寬有限,用Tile架構應該會很有競爭力.
運算量轉移的事情其實我覺得還好啦,CELL也好CUDA也罷,GPGPU的確靠CUDA把實用性大大地改善沒錯,但是一個外部的accerator結果除了filtering(含影像和聲音等等)之外在consumer市場也真的沒有找到什麼可以勝任愉快的工作,結果Fermi還是要把cache結構給引進來,現在整個ISA都和RISC CPU相去無幾了。
不過說起來其實自己好像有些誤會,後來發現NV50的shared memory在結構上和constant buffer的gather效率有關係,所以其實繪圖的時候share memory還是用得到,所以不知道這回Fermi算不算把texture memory子系統整個給通用化了….是的話就還蠻不得了的。
—-
OpenCL目前幾乎完全是NVIDIA主導的關係,AMD要在自己的結構上實作這些部分就變得尷尬不已,不過手上有CPU這點其實讓影響不會很大,反正CUDA到目前為止還是不能算正式起跑。AMD買ATI的壞處只有當初ATI脫手價喊得有點灌水這點,讓陣痛期拉得很長(反過來說當初ATI的高層合併後也全被攆走了)….搞到一度NVIDIA的財力差點可以把AMD買下來,不過最後沒有發生就是了,除此之外AMD買ATI當成技術儲備這點現在看來的確是有翻本。
—-
老實說many-core在非graphic領域還是會比較有競爭力,問題是consumer市場裡面graphic是must have,因為user總是得要有個東西來操控,結果就造成Intel從CPU去往high-thoughtput computing走的時候全卡在 自己 這個柵欄裡面,因為他們一副就是沒辦法坐視自己的CPU最後只占整個產品的幾分之一,剩下都被實質上是GPU的部分吃掉,偏偏Larrabee的願景要生效顯然就是得做成這樣:Larrabee的研究成果是core可以小到1/5之間,CELL最後也是main CPU吃了1/3,說起來和CELL的結果(PPE:SPE=1:4)如出一轍….
於是回過頭來,Intel會在高階core用PowerVR嗎….
many-core在HPC領域比較有競爭力
但是偏偏目前PC高度平行化的暴力輸出型晶片
也只能藉規模龐大的GPU市場需求來推廣.
many-core不當顯卡賣也不知還能怎麼賣…..
即使是異質多核CPU,問題還是mini core能做的
都可以讓GPU來做,反過來卻不行.
而且GPU是must have.
所以Larrabee放棄繪圖市場, 其實意義上也等於
Many Core在PC上失去唯一立足點了.
PC上能保留的研究成果大概是未來也許可以把LNI
做到大型CPU裡,而不是Many core這概念.
呃,我是還不會覺得「many-core不能做的GPU都能做」啦,至少我覺得many-core不能做的只有和TMU扯上關係的行為而已,但是其餘的卻都可以做。
畢竟Larrabee的mini-core終究是P54C+LNI(還加上ringbus上的TMU不過這邊不能提),而不是CELL的SPE。
某種意義上CELL當初也打算加TMU/ROP,只是顯然找不到人替她做嫁衣就是了。
不過反過來說,CELL SPE和Larrabee core最後大小都差不多這點還蠻重要的。
—-
透過PC市場的must have,以擴充大數為前提來做到更高階的市場這點的確是當年CISC vs RISC裡面Intel贏得勝利的重大原因,這點在GPU上能不能再現是長期以來的疑問沒錯,但是遊戲市場透過要求user不斷換硬體來玩更新的遊戲這點到底能繼續奏效多久其實本身就很有疑問,才會出現遊戲主機雲端化的論調吧。
所以前兩天的48core SCC也是開始在賭雲端本身能不能成為主要成長動力這件事情,GPU如果要對應雲端化的話,die size的大小平衡點應該不會是現在中階晶片用multi-chip拼高階的位置才對,而會更大一些。
consumer端的device上GPU應該毫無疑問是must have沒錯,只是規模到什麼地步又很有意思。
CELL SPE和Larrabee core大小都差不多?
Larrabee core好像沒有公佈電晶體數量,
不過LRB有die photo可以判斷,
它的32core含cache約佔Larrabee 80~90%的面積.
以在45nm還要600mm2來看,起碼3000M電晶體,
其中大多數是那32core含cache用掉了.
粗估每個core含256KB cache,至少要75~80M電晶體,
這已經是SPE含LS的三倍大了吧.
從邏輯上來看,兩者也不可能一樣大,
因為LNI向量寬度是SPE向量單位的4倍寬.
單以core而言,並不是同級的東西.
除非你的意思是die size的mm2是同級.
不過他們製程不同阿…..
同製程的話,SPE會小很多.
>>獨立GPU的市場長期來看應該會縮減.
>>這也是對Larrabee要靠GPU市場來攤開發成本
>>的策略可行度的一個疑問
從時間點來看,仔細想想,
我覺得策略本身應該不是問題, 因為獨顯市場的縮減
應該是32nm~22nm這段時間才會開始顯現.
當時也沒有必要看這麼遠.
Larrabee原本是打算在2008 Q3~Q4送樣給開發者,
2009年Q2以45nm超前的優勢製程正式量產,
(其他GPU頂多是55nm)
用2Tflop以及更好的泛用性,狠狠教訓一下
不自量力,妄想搶食CPU工作的GT280.
Larrabee藉由攻略龐大繪圖卡市場來分攤掉研發成本後,
以後只要Intel等CPU製程進步,然後copy-paste,
就可48core,64core線性擴張…..省掉GPU研發時間.
以優勢製程和軟體更新,讓不斷修改架構的對手疲於應付.
順利的話隨著Intel拿手的製程微縮,到32nm或22nm,
Larrabee就可以順理成章的變成強力內顯.
一舉排除所有獨顯對手.
成為手上有最強CPU/最強GPU的獨占廠商.
計畫本身沒啥不可執行的漏洞,只是產品的性能和時程
問題非常大…..XD
導致計畫看起來像笑話.
Larrabee 之後說不定就跟其他 CPU 併在一起做成異質結構的 CPU 了,硬要走成 CPU+GPU 的路線除了對玩遊戲的人來說有用之外,似乎沒有什麼實際的好處。
PC Game 的市場衰退的相當的快速一直拿 GAME 在 PC 上這點當優勢來說,未必能有實質上的幫助。況且真正高端的 gamer 也不會去採用整併在一起的產品。
單純以其他運算來看 ATI 的 GPGPU 會勝過 Larrabee 嗎? 走到 Fermi 的情況來看又顯得快要跟 CPU 差不多了。
況且 Intel 主要獲利來自不用跑遊戲的商用機器,在遊戲上勝出對他們究竟能有多少的幫助? 走到後面 CPU+Larrabee 能在多數應用場合上勝出,不跑遊戲對他們真的會有那麼大的傷害嗎? 特別是在 PC game 市場穩定衰退的現在。
對 Intel 而言還是只要保持 CPU 本身的競爭能力,顯卡市場獲利過低本來就不會是他們的主要重心所在,要說 AMD 走 fusion 的確在顯卡上面能保有優勢,但 AMD 現在的顯卡在 GPGPU 上能做的還是少,要做到 nvidia 那樣又要放棄顯卡方面的能力,是要 AMD 走向 nvidia 那樣,還是要用 CPU+很好的顯卡但受限的 GP,去跟 Intel 全用 CPU 組成的產品線做競爭呢?
更別提 Intel 背後能提供的軟體資源遠多過於 AMD 特別是在商用產品這一方面上。
同樣的情況放在 Cell 或是純 many-core 的 Larrabee 來看,做到 GTX300 的情況他們的運算量會達到多少?
如果所有的一般使用者都需要主機能跑一定程度的遊戲那或許 AMD 的方案很有競爭力,但現在來說家用主機市場早佔領了主要的遊戲市場,PC game 所佔比例越來越少了。
呃,SPE是比Larrabee core小很多,我是說CELL PPE和SPE之間的大小比例,很像Core2Duo的單一核心 vs Larrabee Core的大小比例。
要不然Larrabee Core的實際大小應該是和PPE差不多,所以嚴格說來Larrabee在我眼中反而像是Xenon的大幅擴充版。
話說一直在講過去NVIDIA GPU走到Fermi喪失了多少性能,但是其實論電晶體比例來說G80-G92-GT200一路到Fermi的電晶體和峰值性能的數字比例並沒有變低,而是比較性地R600到RV670/RV770的設計能力改善非常多,同樣的面積塞進了更多電晶體,讓同樣一個架構實際可達的性能提升很多。
G80的shared memory先前一直以為是CUDA專用的東西。
可是只要在繪圖的時候shared memory並不是沒用(雖然我只聽到一種說法,就是constant buffer gathering),那麼其實嚴格說起來浪費就並不是很明顯,事實上黃仁勳自己就說過目前VIDIA大概花了10%的架構成本在通用運算上,這顯然遠遠不如NVIDIA和ATI架構之間的峰值差距(接近2x)。
ATI主要的問題是沒有出什麼力去推動GPU上的通用運算,以至於目前Steam除了少數實驗性的運用上跑出很高的峰值之外,原則上還是紙老虎,實際上R600架構以來ATI放在die上的register file規模並不下於NVIDIA,甚至該說GT200為止,處理單元和register file的比例都是ATI比較高。
所以或許這樣講比較好:
GPU目前的勝負問題其實不是架構,而是卡在雙方的設計能力差距上。
>>硬要走成 CPU+GPU 的路線除了對玩遊戲的人來說
>>有用之外,似乎沒有什麼實際的好處。
你誤會了.
Intel想做獨立GPU的初始原因不只是單為了跑遊戲.
而是要用GPU這個龐大市場來培養出ManyCore應用.
因為LRB/LNI都是新的東西.沒有PC的經濟規模的話,
不管是ManyCore或LRB都會遇到初期推廣的困難.
也就沒有辦法仿照CISC靠經濟規模碾過RISC的歷史.
它們著眼的是先靠GPU的龐大需求賣出大量的LRB.
有了龐大市場規模後,所有開發者(非遊戲)都會看到商機.
推動LRB的汎用運用就是eazy job.
Intel著眼是之前常提到的商業優勢.
GPU幾乎是Must Have,即使不玩遊戲的不太需要好GPU,
但其高中低階顯示晶片的市場總體規模,
已經足以讓廠商每年推出500mm2新設計,
並且把設計成本分攤到幾千萬遊戲用戶上,
把這500mm2設計汎用化用於HPC等小眾專業市場,
在成本上會非常有競爭力.
如果做ManyCore或CELL2之類新架構CPU,
也許在HPC高性能運算方面未必輸GPGPU.
但是商業模式卻輸慘了.
因為對手的銷售已經用千萬來計算,而沒有市場支撐的
新產品, 卻一切從零開始.根本沒得比.
比喻來說, HPC類似牛身上最有價值部位的肉.
但是你不可能只賣這一塊.
要能讓價格有競爭力, 牛全身上下從皮帶骨都要賣.
才能分攤把牛養大的昂貴成本.
有了這麼大的經濟規模, 殺牛取肉才划算.
若沒有攻佔龐大GPU市場, 直接賣ManyCore產品, 就像
殺一隻牛只取一塊肉, 整個研發成本都被迫由少量市場
來吸收.