http://pc.watch.impress.co.jp/docs/news/20090914_315467.html
Intel、9月22日~24日に開催予定のIDFの内容を予告
~32nm製品やJasper Forestなどの詳細が明らかに
Larrabee這回會講詳情嗎….
話說RV870也發表了關於對OpenCL支援的技術特性,其實也是進步不少,
比方說現在有支援global synchronization和share memory等等,其實也算over OpenCL的spec了。
ROP倍增也大幅地提昇了其吞吐能力,只要每個ROP都維持RV770時期的能力,
目前看來每個ROP應該都可以單週期完成1個8x AAed pixel。
(或者該說每個ROP的性能倍增?好像有看到32ROP的數字…)
Additional Functionality Beyond OpenCL1.0
§32-bit Atomic Operations
§Flexible 32 KB Local Data Shares
§64 KB Global Data Share
§Global Synchronization
§Append/Consume Buffers
總之不僅GT300在頭痛,對Larrabee而言可能RV870的威脅更大…..
—-
http://www.itmedia.co.jp/enterprise/articles/0909/14/news021.html
Oracleの対IBM「宣戦布告」広告の背景
memo。
—-
http://av.watch.impress.co.jp/docs/news/20090819_309355.html
オリンパス、8GB/音質改善の新リニアPCMレコーダ
-実売5万円の「LS-11」。新Voice-Trek DSシリーズも
http://av.watch.impress.co.jp/docs/series/dal/20090914_315537.html
第387回:オリンパスの新リニアPCMレコーダ「LS-11」
~ 高感度マイク/低域強化で音質向上。オーディオI/Fにも ~
LS-11看起來比LS-10還棒_A_)a
—-
http://bb.watch.impress.co.jp/docs/news/20090914_315492.html
IEEE、無線LAN規格「IEEE 802.11n」を正式承認
實在等很久了_A_
順道,整理一下提升到600Mbps的手法:
1. More subcarriers: 802.11g has 48 OFDM data subcarriers. 802.11n increases this number to 52, thereby boosting throughput from 54Mbps to 58.5 Mbps.
2. FEC: 802.11g has a maximum FEC (Forward Error Correction) coding rate of 3/4. 802.11n squeezes some redundancy out of this with a 5/6 coding rate, boosting the link rate from 58.5 Mbps to 65 Mbps.
3. Guard Interval: 802.11a has Guard Interval between transmissions of 800ns. 802.11n has an option to reduce this to 400ns, which boosts the throughput from 65 Mbps to 72.2 Mbps.
4. MIMO: thanks to the magical effect of spatial multiplexing, provided there are sufficient multi-path reflections, the throughput of a system goes up linearly with each extra antenna at both ends. Two antennas at each end double the throughput, three antennas at each end triple it, and four quadruple it. The maximum number of antennas in the receive and transmit arrays specified by 802.11n is four. This allows four simultaneous 72.2 Mbps streams, yielding a total throughput of 288.9 Mbps.
5. 40 MHz channels: all previous versions of 802.11 have a channel bandwidth of 20MHz. 802.11n has an optional mode (controversial and not usable in many circumstances) where the channel bandwidth is 40 MHz. While the channel bandwidth is doubled, the number of data subcarriers is slightly more than doubled, going from 52 to 108. This yields a total channel throughput of 150 Mbps. So again combining four channels with MIMO, we get 600 Mbps.
RV870測試結果出來了,連die都有照片.
(架構圖和die photo簡直完全一樣…)
http://www.pcdvd.com.tw/…81825151#post1081825151
HD5870平均數據約是GT285的1.5倍.
看同一個遊戲數據,通常MSAA開的越高的領先程度越大.
應該是因為高MSAA可以靠ROP的省頻寬技術.
不受限頻寬而發揮運算效能.
若MSAA開的少,就沒辦法省頻寬,受限於真實頻寬
其實差不多而拉不開應該有的性能差距.
每個ROP單週期完成1個8x AAed pixel
所以8xMSAA會是最能發揮的測試設定.
這下NV麻煩了,如果2.8B電晶體的GT295還打不平
不到2B電晶體的RV870…..NV架構不大改只是
變成2倍SP的話,就算GT300一樣換40nm
也不會有能抗衡的競爭力,
而且RV870良率應該會遠勝5x0mm2的GT300.
成本上差太多.
Larrabee就不用講了,效能/成本,恐怕更難看.
2010還是2Tflops的話.ATI應該不看在眼裡了.
Larrabee的成本可能比GT295還高,但是性能似乎只有RV870的50%前後…. _A_
8x MSAA應該是RV870的sweetspot的樣子,等效頻寬遠遠大過實際頻寬的關係,不開AA就吃大虧了。
不過NVIDIA的頻寬不是更吃緊?GT200還是GDDR3耶。
>>不過NVIDIA的頻寬不是更吃緊?GT200還是GDDR3耶
GT200 GDDR3是448~512bit ,
實際頻寬不會輸256bit+GDDR5.
只看ROP和頻寬的比例,GT200是明顯比RV770吃緊.
(32ROP可用140GB/s vs 16ROP可用115GB/s)
MSAA雖然靠省頻寬技術不必等倍消費頻寬.
但是加倍的subpixel,卻一定是等倍的增加ALU需求.
雖然RV770和RV870架構很類似.
但由於RV870更缺頻寬.
一定要靠開啟高MSAA省掉部份Pixel存取頻寬.
才有辦法讓1600SP都儘量不閒置.
不過GT200和RV870比較的話
都是80Tex,都是32ROP.都是頻寬140~150GB/s上下,
GT200的ALU峰值運算量卻少了60%!!
MSAA增加的幾倍運算量RV870應可輕鬆吃下.
而GT200瓶頸可能大部份是ALU不足來不及處理.
MSAA時受限於頻寬的機率比ATI少.
MSAA時GT200的頻寬反而沒有RV870吃緊.
well, 我的意思和waffenSS兄你的出發點反了….
RV770和RV870之間的關係基本上是晶片規模兩倍,ALU兩倍、TMU和ROP都跟著兩倍,然後細部架構改善,GDDR5時脈提昇;GT200和GT300之間的差異,則是除了上述的特性之外,還包含了GDDR3轉GDDR5。(448bit~512bit GDDR5?)
你提到了GTX295有2.8B電晶體然後輸給2.0B左右的RV870單晶片所以很麻煩,但是我卻覺得GT300卻有機會頻寬和運算比例比RV870更寬鬆。所以說,我們很多人提到GT300是GT200的兩倍這點競爭力面很令人擔心,但是我對這點有點疑問。
講簡單點,這可能會變成1.8TFLOPS+320GB/s vs 2.7TFLOPS+160GB/s是哪邊會比較有利?的問題。
也就是說,過去依靠TMU規模來衝性能,同價格代的產品大多比對方的記憶體頻寬大的NVIDIA,在這一代因為頻寬上升所獲得的利點比過去還要來得大,所以一邊是依靠ALU、另一邊則靠TMU和頻寬這點特性會比過去還要來得強,然後剩下的又是遊戲開發者要靠哪邊站的問題,ALU是不是瓶頸感覺是其次。
基本上我同意ATI重視ALU資源的部份,但是我比較懷疑能不能成為競爭力,這點和過去的問題一樣,雖然這過去都和developer program有關,實際上ALU的peak performance提高原理上的cost一定比較低。
另外,MSAA subpixel access我記得不是shader ALU而是ROP負責的?
>>GT300卻有機會頻寬和運算比例比RV870更寬鬆。
>>所以說,我們很多人提到GT300是GT200的兩倍
>>這點競爭力面很令人擔心,但是我對這點有點疑問。
這倒是,如是512bit+GDDR5的話,它的成長特性和過去
GPU趨勢不太一樣.通常增加頻寬比例會比較少,
之前GT200頻寬只有多RV770約20%
而這次GT300 vs RV870 卻有機會連頻寬
也拉開近2倍差距.
不過這樣的GT300,
是不是和兩個GT200拼起來的GT295很類似?
帳面上512bit+GDDR5 和 448bitx2 +GDDR3
頻寬是差不多的……總之,等於全部線性擴張兩倍.
GT300頻寬和運算比例是比RV870更寬鬆沒錯,
雖然它在ALU輸的,一定能靠頻寬和ROP數追回來
甚至明顯超過HD5870也不意外,
但競爭力是成本/效能比值.
雖然兩社在大晶片小晶片的方向不同.
最後決定產品定位的是成本.
….別忘了ATI一定會走X2策略.
GT300的同級對手應該是RV870X2阿 ,
RV870X2擁有和GT300相似的160Tex,64ROP,
連頻寬也是相近的(256bit x2 ,GDDR5)
GT300優勢消失了
這樣一來GT300靠頻寬和ROP數追回來的可能性就很低了.
然而浮點運算差距卻變成5.x Tflops vs 2.x Tflops.
所以我說RV870良率遠勝5x0mm2的GT300
成本上差太多是重要因素.
(這導致GT300對手不是5870,而可能是HD5850x2)
RV870和GT295效能差距不大已經透露出不妙了.
因而認為GT300競爭力不太樂觀.
EJI你的疑問,把HD5850X2代換進去重新考慮,
可能就找不到GT300明顯優勢之處了吧.
5870的同級對手應該是類似GT285規格的DX11,
256bit版, 40nm製程 , 2B電晶體以內的中高階晶片.
或者說,規模縮減版的GT300.
>>MSAA subpixel access我記得不是shader ALU
>>而是ROP負責的?
對,我講錯了,只有R600才可能動用ALU做AA運算.
後來的GPU好像都改了硬體Resolve線路了.
(Larrabee除外).
不過這樣一來那測試結果就有點奇怪,
為什麼8xAA時RV870優勢變更大?
GT285和RV870的實際頻寬和ROP數量是差不多的.
即便有時脈差異,但怎麼8x才特別不同?
影響8x AA的因素還有甚麼?
難道NV的ROP的free AA還沒有做到8X ?
> EJI你的疑問,把HD5850X2代換進去重新考慮,
> 可能就找不到GT300明顯優勢之處了吧.
不太一樣啦,別忘了這問題在GT200和RV770就發生過一次,結果他們最後也是弄出GTX295來解決啊。
而且65nm時期的GT200的確一直挨打,到55nm的GT200b才算真的和RV770可以抗衡。
所以這回要是重複這個過程我也不會覺得意外就是了。
此外,我覺得最有趣的莫過於peak vs average這件事情。
到目前為止大概沒人懷疑VLIW vs MIMD這一塊ATI事衝高peak,NVIDIA是衝高效率+靈活度。
靈活度的部份只有GPGPU用得到就不必說了,但是高效率、比較不依賴compiler optimize等部份真的沒差嗎?
ATI在R600以來的這幾代賭的都是製造cost,現在還有他們手上有CPU這件事情。
所以我基本上對shader效率這點其實是比較保守的,ALU的peak值他們不是贏一兩年,是從Radeon初代就贏到現在了,但是真的因此翻盤了嗎?好像都是NVIDIA自己垮掉他們才有機會。
—-
NVIDIA的AA還沒做到8x free,別忘了16x CSAA還比8x快。
這部份也一直都是ATI佔上風….從AA取點能力到壓縮比率都是這樣。
而且RV770的時候單一ROP的性能其實就是ATI這邊比較高….然後GT200的ROP重心又擺在CUDA用的非連續fetch上。
所以我會覺得GT300的ROP還有不少進步空間。
會給比較大的頻寬這部份也有關係。
ATI自R520起一直被延期困擾,RV670雖按時發布但也晚于G92,而RV770算是和GT200同步了。
到了這次,算是終于搶了個先。
性能什么的占且不多論——幾乎匹敵295起碼是合格了,但對ATI來說局面算是近年最好,上次明顯先發還是R300的時候呢。
啊,是啊。上回先發好像是R300的事情了。