君子報仇三年不晚 ~ 論NVIDIA在HDR上的行銷手法~

NVIDIA在六月推出G70之後,在九月初開始以"The Power of 3"等標語來強力行銷,同步推出7800GT。

當時本來預期NVIDIA會推出全系列的中階產品,看到7800GT時的感覺是有點失望…. 但是等到11月初6800GS、6600 DDR2推出之後,現在回頭看起來,才真的發覺到這是個相當高明的整體行銷策略。

討論:
https://www.kimicat.com/phpBB2/viewtopic.php?t=829 

先前在這裡提到了R580的結構,是16-1-3-2、也就是48組pixel shader、共計48個main32、48個mini32的超大型單元;但是TMU沒有FP filtering、也沒有Free FP16 Normalize。

本 來這不是個很大的問題,而且固定效能於這兩個用途上,感覺上也相當浪費,而且R520也提出了Int10/16混合精確度、3Dc+ single component Texture compression等功能來輔助HDR的使用,並且提出了HDR下的FSAA功能;只是前述的功能其實都不是針對OpenEXR FP16 HDR來設計的。

於是,如果論執行資源的話,這邊雖然算得有點籠統,不過如果假設以每個ROP前端分配到的Pixel Shader資源來說的話,這邊比較一下G70、R520與R580間的規模:

G70:1.5個TMU、1.5個PS(3個ALU)、TMU有FP filtering & Free nrm_pp
R520:1個TMU、1個PS(2個ALU)、FP filtering 與 Normalize由Pixel Shader處理。
R580:1個TMU、3個PS(6個ALU)、FP filtering 與 Normalize由Pixel Shader處理。

所以,這邊有個假設是:如果這新增的4個ALU,不能抵過 FP filtering 所需的執行資源的話,就會變成是NVIDIA的平行度較高了。
而且G70相對於NV40的一個很重大的改進,就是FP filtering的速度變快了:原本的FP filtering可能只有half speed。

如此一來,NVIDIA強推HDR的理由也變得相當明顯了:他們的結構針對這點擴增了執行資源,並且增加了免費的指令。
R580 本來擴增ALU資源的理由,是為了"不限制於單一的用途",但是當這個單一的用途成為主流、而變得長時間要被吃掉這些資源的時候,R580的規模優勢便會 遭到抵銷;而規模較小的G70在改為90nm的G71之後,很可能會進一步再抵消R580的時脈優勢,整體的執行資源便會出現此消彼長的狀況。

也就是說,今天不使用HDR的3DMark05雖然很可能會是R580以R520約1.5倍以上的表現,對G70取得優勢,但是3DMark06由於確定使用FP16 HDR,那麼R580擴增的ALU資源被消耗掉的機會也因此大增,分數上的差異便有可能縮小。

而 且,R580由於擴增了ALU數量,但"應該"沒有擴增Dispatch Processor的threading管制能力(為了節約die size),使得R520原本有的Branch penlty容忍能力,在R580的時候降低,這對疑似由Driver管理Dynamic Branch的G7x來說,也會從不力轉為有利。

於是結論是,由於G7x比R5x0早推出,影響了遊戲界的風向,使得G7x的架構較受遊戲 界歡迎,逼使R5x0本來的結構設計上的考量平衡受到了衝擊。G71便能以少了約30%的電晶體規模與die size,與ATI規模較大的同級產品在平行度上抗衡,進而在成本與產量上取得優勢。

其餘同理可證:6600 DDR2、6800GS,與原有的6600GT和7800GT/GTX等產品線,相對於ATI的產品通通構成了高低夾殺的陣勢,ATI打不到本來想打的 人,NVIDIA則可以順便銷庫存,等待明年推出G7x的中低階產品,好整以暇,全因HDR主流化之後成為優勢,當然不必貿然將舊產品phase out。

這個狀況一如當初NV3x與R3x0間的關係:NV3x本來不認為SM2會很快普及,做了一個SM1較好、SM2稍弱的結構,而較早推出的R3x0使得SM2較快普及,打破了NV3x原先的預想,進而陷入了長久的苦戰。

ATI當然會對即將推出的R580有著很深切的期許,R580也確實有著相當可觀的執行資源;不過面對市場的劣勢,有些事情並不見得能盡如人意,想想這個狀況也和當年的NV35是很類似的。

話說,如果光比GPGPU的話,可能R580就能摧枯拉朽吧?
雖然我覺得就算是GPGPU這個用途本身,也可能會隨著Cell的推廣而慢慢衰微也說不定。

—-
這一點可以告訴我們Time-to-Market的重要性。
目前已知有可能G80會緊接在G71後於2006年Q2推出,支援Shader Model 4.0 與 DX10,這時候NVIDIA的結構特性便可能會繼續影響SM3後的遊戲界風向,使得ATI的R6x0可能被迫要做出其他的妥協,而繼續陷入被動。

回頭看HDR…. 其實為了NVIDIA的這個策略,所謂的HDR已經陷入一種極為浮濫的狀況。

gloom-like HDR滿天飛,明明其實並不是SM3的一部份,卻被扭曲為SM3的標竿技術(其實本來應該是R520主打的 Dynamic branch),其實說起來,HDR的某些關鍵(曝光控制),在這些主打HDR的遊戲裡面反而遍尋不獲,本來HDRI主要的目的是要模擬Full Environment Lighting的,結果現在全部都拿來做dazzling….這真的不是一個很好的情形。

只是,遊戲市場畢 竟還是江山代有才人出,引領風騷數十載….Garbage-title終究是會有的,不見得NVIDIA不這麼做就會減少。想當初ATI也推了個讓人 頭痛的半調子精確度(FP24),結果也是把FP16/32混合經度給踹開了。既然現在市場上都能扶正為FP32,揚棄FP24可能造成的問題,我想 HDR浮濫的情況也慢慢會隨著美工技術know-how的累積,而得到改善吧。

從2002年底R300推出,到現在2005年底快要過完 了,半年前推出的G70在有足夠記憶體的頻寬下,面對晚半年推出的對手,仍然能維持性能優勢,整整三年的時間,目前看來NVIDIA有機會將NV3x時遇 到的狀況連本帶利地還給ATI,而且手法類似過去ATI的作法,真是君子報仇三年不晚啊。

—-
EDIT:
X-bit的測試測了Far Cry的HDR開關差異。
馬上印證了上面的想法…. (w
http://www.xbitlabs.com/articles/video/display/geforce7800gtx512.html

而且照理來說,目前這些程式通通都還沒有實裝FP Filtering Shader,只能考慮未來效能下降還會更明顯。
下面的這兩張圖來自HardOCP,不過這是Cho過去貼在B3D的圖,只是被HardOCP拿去用了。

原始出處:http://www.beyond3d.com/forum/showthread.php?t=25111

HardOCP盜圖處:http://www.hardocp.com/images/articles/1130724723wQf6EywE1q_5_5_l.jpg
http://www.hardocp.com/images/articles/1130724723wQf6EywE1q_5_6_l.jpg

總之,風水輪流轉了…. XD

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料