小黑送修回來….

去把小黑拿回來,結果果然是那顆乾燥劑的矽膠在裡面卡住卡榫。orz
如果沒有手癢的話,大概就不會拉斷吧….結果就是整個底盤全換,兩千八。

話說IBM的人員很好心地幫忙Update BIOS….
然後,上回在這篇裡面改好的11g WLAN就破功了。(死)

再改回來吧….

於是,晚上去找Tib弄現成的LiveCD….
因為雖然有人弄成com,不過需要Dos開機片的話好像同等麻煩度。
話說Tib的學弟有maintain個套件:PUD GNU/Linux,8cm CD可以塞進去的完整LiveCD工具組,有興趣的人可以看看。

專利通過時間與採用時間的關係?

照理來說,產品發展後應該是申請專利的同時就推出,才能順利卡位….
如果坐等專利通過才推出的話,那大概早就失去先機了。

所以就像這樣:NVIDIA最近的50個專利

其中的「Programmable graphics system and method using flexible, high-precision data formats」,其實看起來應該就是NV30。

結果2002年11月申請建檔,通過並生效卻是2005年10月,產品早就在2003年上市,而且通過的現在產品早就過時了。

High-performance heat sink for printed circuit boards 」,這個是大家非常熟悉的GF4系列風扇與記憶體配置。

不過其實也有別的狀況:像上回Xenos的US load-balance的prior art在Xenos結構公開之前就已經通過並且生效了。(所以cho才會盯著美國專利局不放)

業界果然還是蠻複雜的…. 🙂

補充:當成比較用的ATI專利數量

水電工模式中

這兩天,讓人無力的事情不斷發生….

1. 本來以為是橫跨兩棟的網路線出槌,結果是Hub掛了。
所以新簽的HiNet 256/64 完全是多此一舉了,讓人連無線網路互打都沒力氣牽了。

2. 幫Linux主機換完Power之後,要把剛回來的RMA HDD(250GB)裝上去,結果Sil3112裝不上去。
相關的Driver是有裝,但是偵測到的時候不知道是不是會把ATA順序打亂(?)還是怎的,總之Kernal boot不起來,畫面一片黑。

3. 最慘的是,這顆Refurbished(良品、非新品)回來的 Hitachi 250GB HDD,想說改放到Desktop的時候,A8N-SLI上的Sil3114開機BIOS畫面偵測就已經抓不到正確資料了….
要不就是抓到亂碼,要不就是和我說它有1.5TB(?!)….這誰敢用啊。
所以也派不上用場,又要寄回去了。

4. 小黑維修報價,話說這才讓我想起雖然在保固期內,機殼修復是一定要付錢的…. orz

結果總之今天一事無成…. 還沒時間練笛子。
我是不是好好睡一下別管了得好…. _A_

PCWatch 後藤弘貿 R5xx 專欄文第三部分:Ultra Threading

http://pc.watch.impress.co.jp/docs/2005/1017/kaigai217.htm
RADEON X1800(R520)アーキテクチャの鍵“Ultra-Threading”

這篇也是對於了解最近GPU技術發展上非常重要的一篇,值得留意。

節錄:

つまり、R5xx系では、16個のピクセルのブロックが、スレッドという名前で扱われている。このスレッドのサイズ、つまり1スレッドに何個のピクセル(または頂点)を含むかがGPUアーキテクチャによって決まっており、スレッドサイズが性能に大きく関係する。また、スレッドサイズとGPUのハードウェア構成には密接な関係がある。

R5xx系では、Pixel Shader側だけがマルチスレッディングを行なう。

NVIDIA的結構,VS與PS都各自有Multi-threading。

この16ピクセルが1単位として、Shader Engineで制御される。ピクセルプロセッシングのワークロード全体を、より小さなタスクグループ(=スレッド)に分解すると考えてもいい。

 R520は合計16個の「Pixel Shader Processor」を搭載している。各Pixel Shader Processorは4個づつバンドルされ、「Quad Pixel Shader Core」に編成されている。R520の場合は、4個のQuad Pixel Shader Coreを搭載する。スレッドの制御は、基本的に、このQuad Pixel Shader Coreをベースに行なわれる。Shader Processorベースではない。

 ちなみに、NVIDIAでもスレッディングについての説明は、同社の担当者によって異なっており、浸透しているとは言い難い。NVIDIAも、GeForce 6800(NV40)からVertex ShaderとPixel Shaderに、ハードウェアマルチスレッディングを実装している。だが、ATIほど詳しい説明は、まだ行なわれていない。

ATI這方面算是在學當年NVIDIA對付3dfx的方法:對普羅大眾進行較為詳細的技術解說,改善了解技術層面的非業界人士對ATI的觀感,便可收到宣傳之效。

下一篇後藤老爹打算對Mult-threading的作用進行更詳細的解說(原則上是作為延遲遮蔽之用,但是光這樣說還是相當籠統),有興趣的人不應錯過。

針對FAST-AF的討論

https://www.kimicat.com/phpBB2/viewtopic.php?t=804

結論上來說,由於目前大家的硬體實作其實都偷得很厲害,FAST 的頻寬需求與 Feline相近的話,那效率上其實優勢不是非常大。
但是沒有明顯的失效角度的話,效果應該還是會好很多….
硬體實作的話必然有最高的Sample數,所以不會完全沒有失效角度,但是仍然會比以前好很多。

所以就看NVIDIA怎麼處理了…

黨大談:結訓假

雖然只能回來三天,還是會想回家…. _A_

把HA8000的抽屜帶回來、小黑送修、家裡的ADSL、FTP硬碟增設、換Power….其實這幾天大概還是超忙的。

不過,連電視沒聲音、小燈泡燒掉也不管,你們真的把我當水電工嗎。_A_)a

比較慘的是小黑送修,現在Ultrabay抽不出來。=w=
上回底盤裝死硬是不修,這回看起來是逃不過了….

Cell 再修改、倍精度效能提升至單精度的1/2

來自IBM Cell Developer Forum的消息

1. 本月結束為止Cell 所需軟體與函式庫發放
2. IBM再對Cell做了點修改,讓原來只有單精度約1/10~1/14速度的倍精度浮點,加快到單精度的1/2。

IBM那些怪物又開始惡搞了…..
這下waterball兄先前在巴哈PS3版下的結論要準備收回了,雖然他自己顯然很高興。

不過到現在還有空慢慢改CPU細節設計,我看他們真的沒打算明年春天讓PS3上市了….

啊,我還是覺得只有一顆Cell會被製造出來,PS3拿到的Cell 不會和IBM/Toshiba到時候採用的Cell有什麼不同,所以這個DP效能改進我相信PS3會受惠。

比較應該注意的,是未完成的不只是Cell,還有RSX….

6800GS-保留實力至今的NV42

為了對抗X1600XT,NVIDIA宣佈會在短期內推出6800GS….
以NV42為基礎的產品,定價USD 249,等同X1600XT。

6800GS規格上目前不明,不過原則上這邊猜測應該與FX3450雷同:
425/500、256MB GDDR3。

總之,NV42與RV530之間的戰鬥應該精采可期,這也是RV530證明自己架構優越的絕佳機會:
425/500 vs 590/500,記憶體完全相同。
NV42-5vs12ps、12ROP、12TMU、256bit (4x64bit)、202M 電晶體。
RV530-5vs12ps、4ROP、4TMU、128bit (4x32bit + Ring bus)、157M。
Ultra Threading + Ring Bus Memory Controller + 時脈優勢,能不能打贏 TMU差距 & 記憶體頻寬差距呢?

這是越級挑戰啊。XD

話說"技術上的優勢",ATI現在比較樂於公開討論自己的優勢,這是好進展:
如B3D開始有ATI的人員公開出來討論"Toy shop"這個demo。

http://www.beyond3d.com/forum/showpost.php?p=593755&postcount=78

NV4x/G7x無法順利執行toy shop demo….
這邊擷取一下cho的翻譯:
[quote]问:我确信如果可能的话,会有人去写一个"wrapper"(让NVIDIA的卡也能运行),在过去不也正是这样吗?

回答:正如(Thorsten和Chris,另外两位在BBS中发言的ATI演示团队工作人员)所言,我们使用了一些在NVIDIA硬件上不支持但是对演示程序能提供非常大帮助的特性(例如R5XX专有的顶点数据格式、3Dc压缩、深度纹理格式、能显著节省内存带宽并提供良好HDR品质的10:10:10:2格式,如果不采用这些数据格式,将无法把庞大的资料塞进显示卡内存里)。

同样,parallax occlusion mapping可以充分发挥我们X1K系列产品的技术优势。

在开发这个技术的时候,我对比了G60、G70和R520在典型的parallax occlusion mapping场景效能,视乎不同的情形。在G60、G70上的运行速度只有R5XX同档次的30%~50%。

如果你想要获得平滑、正确的效果,NVIDIA目前最新的产品显然无法实现。你甚至无法在不使用10:10:10:2、3Dc以及额外顶点数据格式(例如dec3n)的情况下把demo的资料塞进内存中。这个演示使用了庞大的纹理和顶点数据。

当然,有人会想使用变通的执行方式来替代某些我们在这个演示中执行的算法。例如你可以使用relief mapping而不是parallax occlusion mapping。relief mapping技术在ATI和NVIDIA的硬件上都能执行,因为这个技术没有使用到动态分支并且会使用大量的相依性纹理读取。不过在我作的这两种技术的品质比较中,relief mapping如果使用我们目前的数据组是会出现人工化痕迹的。[/quote]

關於3Dc+,就我所知OpenEXR有個2:1的壓縮,不過一來並不確定那是3Dc+,二來也不確定NV4x/G7x可以支援。
其次是10:10:10:2 與 dec3n,這個應該都不是目前NV4x/G7x可以支援的部份。

所以光論這些部分的話,ATI應該不會擔心NV42與 RV530之間的對抗;反過來說NV42也只要撐到G72登場為止就可以了,那應該是06Q1的事情。

話說其實我覺得蠻有趣的地方,就是到時候G72的規模。
目前G72的規模聽說大概210M上下,同樣是5vs12ps,記憶體是128bit,ROP數量不明。
也就是說要是沒什麼結構上的好改進,那7600自己都不見得能夠打贏6800GS….XD
(well,如果G70後續的G7x也能有FAST AF的話,那大概就不成問題了?)

此外,NV42的DDL到底要不要開呢?

附圖:FX3450 aka NV42。

—-
剛好老大手邊有張NV41 on 7800GT’s PCB….拿來玩玩。XD

從2005動畫最萌現況看討論版的水準維持

LH+ thread:
http://www.lovehinaplus.com/phpBB2/viewtopic.php?t=7154

剛好最近出現票數膨脹的外國票….
所以反過來討論到討論版的秩序/品質上的維持部份。

大規模的組織鐵票会使討論串的流向低俗化、

1、一行レス、只投票不po萌文也不支援物資
2、1人多重投票(multi-host)、或是呼朋引伴在短時間内衝高票
3、忽視支援和和討論串流向、只想固票
這些都是最萌的大忌、

正如大部分人所説的、
八雲就算没有海外的組織票一様勝券在握、
但不幸的是海外的票幾乎以上皆是

要切記的是、所謂的「票」同時也是討論的一篇回覆文章

如果某一個普通的討論串7、8成的回覆文章
都是「某大大的説法+1」、「楼主説的好」、
「這個我討厭」、「XX比OO好」之類的回文的話各位作何感想?

(by 村上)

但是反過來看到"彈盡"的狀況,說起來炒熱到這個地步好像也難以不出現品質上的稀釋….強者的資源也不是無窮無盡的。

現在只剩下黑歷史….