Tib 的 Cherry G80-3000

某Tib又敗了,這回是Cherry的G80-3000機械式Keyboard。
有收入就是不一樣?

疑似 $99 鍵盤的外觀
機械式!!

因為看了有點爽,所以去找了一下。

官方產品頁面:
http://www.cherry.de/english/business-solutions/office_business_g80-3000.htm
DataSheet:
http://www.cherry.de/english/documents/Datasheet_G80-3000.pdf

> Also available as USB hub variant with four downstream ports
> G80-3000LUNxx-0/light grey/USB/linear

也就是說,G80-3000LUN是個
[色調灰色]、[使用黑軸]、[內含4 port USB Hub]
的 USB Keyboard。

看來這算是目前比較符合我使用習慣(含USB Hub的USB Keyboard)的機械式鍵盤產品….
於是麻煩來了,入手途徑呢?

—-
[EDIT]
補充:軸結構分類。
http://park16.wakwak.com/~ex4/kb/tech_cherry_mx.htm
所以黑軸可能會有手感上的疑慮?
老實買可以輕鬆取得的好像會比較實在…..

漸漸地驚世駭俗起來的Power6

來源:
IBM Power6的可能規格
Power6難道是超高時脈的單核心?

感謝Waterball兄整理的資訊。

第一篇內提到的spec可信數字:
peak performance: 20 Gflops,
memory bandwidth: 3.75 bytes/flop,
hardware support for ViVA(Virtual Vector Architecture)-2.

於是出現的可能組合:
˙單核心,兩組FMA,5GHz x 2 x 2 = 20G Flops
˙雙核心,兩組FMA,5GHz x 2 x 2 = 20G Flops
˙雙核心,四組FMA,2.5GHz x 2 x 2 x 2 = 20G Flops
最後是Waterball兄也不太想相信的單核心1FMA,10GHz x 1 x 2 = 20G flops;而不論是哪個狀況,記憶體頻寬都是20G flops x 3.75byte = 75GB/s。

接著,第二篇裡面是IBM自己所放出的,Power6很可能是單核心CPU的可信情報。

Waterball 說:
IBM最近一份Application Driven Supercomputing: An IBM Perspective的文件中,進一步的提到Power6的細節,分別是:

˙Total Virtualization
˙Mainframe RAS
˙Larger SMPs
˙Blade Optimized
˙4X Perf of Power5

也就是說,從IBM所提出的資訊來看,Power6有極大的可能會是個單核心CPU。
於是由前文可以推論,Power6的時脈可能高達5GHz(when FMA x 2) 或者是 10GHz(when FMA x 1)。
對現有的x86 CPU而言,即使是前者都堪稱是Ultra High Frequency….後者更是完全超乎想像的大怪物。
(10GHz in-order、Mult-threading CPU?)

加上這篇報導佐證了先前Hotball兄提到,IBM可能把z-series改為Power系列CPU的說法….
IBM最近在Power家族方面採行的大動作,現在才覺得真的是蠻可怕的。

—-
話說我自己看起來,Application Driven Supercomputing這篇比較有意思的部份,其實說不定是在於提到HPC用途大概會需要多大規模的運算量

1Peta(1×10^15) Flops也得算一年的東西,真的是很可怕的。

G7x的產品展開

情報:
1. G72 = 16pipe
2. G72 = NV46、200408 tape out。

推論:
G71 = 8vs24ps 256bit、
G72 = 6vs16ps 128bit、
G75 = 12vs32ps 256bit、
以上IBM 90nm。

看起來,NVIDIA還是沒有擺脫NVx0、NVx5的老毛病?

實際上,上述的東西的根據,其實只有samsung兄的一句話:
"G72 = 16pipe"
剩下的都是根據這句話,還有先前聽來的G71資訊做出來的推論。

另外還有一種說法,是GZeasy站長cho兄提出的,
「G72是非常低階的GPU core」。

不過能多低階他沒說…. 總不會比NV44(6200TC)還低階吧?
畢竟80.40beta有寫到G72GL,應該代表至少有價值作成Quadro,
那應該不會低階到太扯的地步。
(不過80.40都有C51GL了…. 顯然上面這句話其實也沒啥說服力)

總之,NV4x和G7x之間除了G7x的高階品有著明顯大過NV4x的良率與規模之外,另外還有一點是G7x的耗電量表現良好。
雖然目前沒有同規模品間的比較,不知道實際上G7x的耗電量節約方面到底精進到什麼程度….
不過,我並不認為差異會大到適合推出規模與NV41/NV43/NV44相仿的G7x核心,
而應該要推出die-size相仿、而用更新的製程容納規模更大的核心,
以應付未來競爭廠商的新產品,並擴大利基;
而如果還要再降低成本的話,與其推出AIC產品,
倒還真不如推出整合晶片組了。(所以也的確有C51的存在)

所以,雖然沒有確實的情報支援,但是個人認為上述的推論是合理的….

當然不可否認的是,由於外人總是不清楚內情,只能得知片面的情報,
以片面的情報做出符合片面推論的合理性,顯然不見得可以免除跌破眼鏡的下場。

最近幾天有點得意忘形

FX4500那篇引來不少連結….
看逆向連結那邊已經累積非常可怕的數量了。

不過這個應該單純只是因為圖片來源特殊的關係才對。
和自己的努力沒什麼關係…. 何況這也違反了自己寫blog的初衷。

結果自己好像以為說的話變得比較有份量了,
就又開始高談闊論起來?

這要檢討一下….

C1的US效率問題

http://xbox360.ign.com/articles/636/636018p3.html

這幾天有傳出一些Developer對C1的印象。
Beta kit目前似乎是90%的時脈….
然後,大約是alpha kit(x850xt?)的兩倍效率。

原文:

One North American developer had this outlook.

"On our side, we’ve been working very hard to tap into the full power of the Betas. On a technical side, while the GPU is nearly twice as powerful as the Alpha kits, the CPU architecture requires very clean logic coding in order to take advantage of its full potential." (We’ll get to the clean logic bit later on in the story.)

Another developer explained the differences this way:

"The major difference is in the video chipset, which is pretty different from anything you can find on the PC (or alpha hardware). It does some slick bits of load balancing between pixel performance and vertex performance, which helps us make sure that we’re maxing out the video hardware no matter what we’re doing. HDTV looks spectacular on this thing.

雖然沒有提到"兩倍"的詳細狀況,不過可以推論一下:
如果都有開FSAA的話,考慮X850XT在4AA8AF大約是noAAnoAF的70%效率,以及C1的4x FSAA有95%的效率,可以得知C1的fillrate(or Shader Power)大概是R4x0的1.4~1.5倍。

也就是說,幾乎同時脈下,C1的ALU數量超過R4x0的兩倍(6+16 vs 48),但是看起來只有70~80%的效率….這樣好像有點虧?

話說回來,R520的效率應該會比C1好些。
首先,R520一直有消息指出是vs/ps分離式設計,這是效率較好但是靈活度較差的設計。
二來R520在PCWatch提過,可使用的thread數量較大,代表R520結構內的bank數理應較C1為大,有著較少的ALU數量與較大的bank數,代表每bank的ALU數量勢必大幅減少。
(個人認為4ALU per bank、8bank total的可能性為大;不過ATI公開了這個數字,代表developer可以控制thread,應該就代表R520是US結構?)

——–
總之,基本上US的效率較低是合理的,畢竟G80看來都打算用兩倍左右的時脈去補了….
或許這只是告訴我們,天下終究沒有白吃的午餐罷了。

G80 = Unified Shader, VR-Zone said

http://www.vr-zone.com/?i=2492&s=1

最近NVIDIA的一些流言,最後真實度似乎都蠻高的….
總之VR-Zone說,G80(NV50) = Unified Shader。

在這邊先整理一下G80過去曾經出現過的情報:

1. 基本上是NV50改名
2. The Inquirer說 G80是Dual-core
3. cho提過,NVIDIA表示NV50 = 4x NV40 < G70
4. 曾是XBOX2的參考設計

—-
首先,是聽起來很不合理的Dual-Core。
從這個部份來說,我覺得這個是耗電量考量。

參照IBM的Cell簡介:
http://www.in-stat.com/promos/05/spf_ibm_keynote6593.pdf
page7提到,Multi-core的用意是為了Attack Power Wall

也就是說,因為電晶體的數量增加會使得漏電問題惡化,
在某個規模之上後,可能會使得一個大核心的耗電量,大過兩個小核心的耗電量….
也許G80採用Dual-Core設計,可能和與IBM合作後,受到的影響有關係。

—-
其次,NV50 = 4x NV40,這部分我覺得是在敘述規模的差異;不過不見得是指電晶體數量,而可能是類似在敘述單元構成,比方說64 Shaders。(Int + FP一組,共128ALUs?)

當初NV50就已經傳聞是Unified Shader,而且支援WGF2。考慮WGF2的複雜度之高,G80支援WGF2的話,ALU的規模勢必比SM3時期提高很多。
即使G80的規模是NV40的四倍以上,同時脈的效能不見得能夠高出兩倍,那的確有可能在同時脈下被G70超過。
而VR-Zone也提到了,G80的時脈可能超過1GHz,Unified Shader的確需要靠時脈來處理靈活度提升帶來的效能下降問題。

上面也提到,NV50曾是XBOX2的參考設計。
和當初的設計比起來,現在的XBOX360(C1)少了WGF2的部份功能,規模就還停在SM3的程度,所以從C1來揣測G80的規模,可能不太容易。
此外,對Unified Shader的著眼點,以及對引入時機的見解,顯然也與NVIDIA不同。


最後,先前的消息指出,RSX可能肩負有驗證G80部分關鍵設計的用意,所以我個人是認為,G7x有可能存在dual-core RSX的產品。

也就是說,兩個RSX各自用FlexIO與一個Arbiter相連,然後Arbiter本身再提供一個PCIe介面,與Host連接。

這樣的話,G7x家族猛然有許多個高階並列:
24pipe的G70、G71
32pipe的G75(暫稱)
48pipe的Dual-core RSX

….這種陣仗擺出來,猛然覺得G71看起來像中階….orz
Kirk艦長提到,PS3目前看起來很棒,但是PS3上市的時候,再過一小段時間PC看起來就會更屌了,指的是這個嗎….

Dual-core RSX G7x,目前還不知道會不會推出。
這樣的產品光跑SM3的話,可能真的會比G80還強….orz

G80 = Unified Shader,talk by VR-Zone

http://www.vr-zone.com/?i=2492

最近NVIDIA的流言不知怎的可信度都很高….
總之,NV50 = G80、然後是Unified Shader。

以過去曾經傳出的幾個資訊來看,所謂的G80:

1. NV50改名
2. 曾經是XBOX2的原始設計的一部份
3. cho提到,NVIDIA的人隨口說 NV50 = 4x NV40 < G70
4. Dual-core設計
5. 2006年Q3推出

這邊可能有幾個問題,就是很可疑的Dual-core,這點可能與製造考量有關;
另外,於IBM的Cell 簡介裡面也曾提到,多核心的設計與耗電量有關。
http://www.in-stat.com/promos/05/spf_ibm_keynote6593.pdf
page7,Attack Performance wall的部份:多核心是用來"Attack Power Wall"。

Hotball大先前提過,如果不斷地做寬下去,增加電晶體,漏電的增加可能是非線性的,
所以作一個較多管線的核心,可能因為漏電問題,而造成耗電量會大過兩個原管線數量一半的核心結合起來。

其次,為了實作WGF2所需的單元,單一ALU的可能成長到SM3的兩倍?
基本上R520還沒有支援WGF2、所以SM4 device需要的電晶體數量其實還沒有定論,但是至少比G70/R520大是肯定的。
所以變成即使規模擴大至四倍,等時脈下的效能可能不見得能夠達到兩倍,結果變成G80可能弱於同時脈的G70。
當然,Unified Shader是一個進一步求取靈活性的結構,所以實際上效能較差而需要靠更高的時脈才能改善表現的機會很大。
G80的時脈,照VR-Zone所言可能達到1GHz。

另外,RSX據稱還有一個利用方向是用來驗證G80的關鍵設計的話,可能就與dual-core有關:
比方說,兩個RSX可能使用FlexIO,各自連到一個Arbiter;然後Arbiter再提供一個PCI-E控制器,與Host連接。
記憶體介面則成為128bit crossbar兩組,共256bit(維持64×4 or 32×8?)
實話是如果時脈與RSX同等甚至更高的話,也許效能方面G80還真的會受到一點威脅。

不過這樣一來的話,G7x就等於有好幾個高階了-G70 24pipe、G71 24pipe、G75(暫稱) 32pipe、Dual-core RSX G7x 48pipe…..
真是誇張。XD

最後,根據先前Bit-Tech的訪談所提到,PS3推出之後,距離NVIDIA的新結構可能就不遠了。

David B. Kirk said:
RSX looks incredible now, but when it launches, there’ll be a smaller time until PC looks better.

G80推出的時間應該是2006年Q3,考慮R5x0家族的推出時間表,dual-core RSX可能會在PS3推出後,用來作為G80推出前的高階產品?

G7x果然深不可測….orz

GPU 馬路消息 20050724

下面的東西是聽來的,不過可以不信。
( ) 內為眉批,非情報。

~20050724~

——-
NVIDIA方:

1. G71確認為G70的高頻版
製程與生產廠商不明、時脈不明。
(標準時脈應該是RSX稍高的程度吧…. 600?)

2. 32pipe G7x存在確認,single-core

3. Dual-core 產品管線數不明
(可能非32pipe;話說這邊既然情報變少了,推出可能性就降低了)

4. G70GTX 良率39%確認
GT改為20 Shader後良率更高,
八月大量推出。6800自此完全Phase out。

———–
ATI方:

1. 24pipe R520 yleid rate 3% 確認
不過這是first silicon的數字。
(現在比較高,但是仍然讓人不甚滿意的程度)

2. 八月發表的 R520 標準產品會是 24pipe,時脈約400~500之間
效能在G70同等的程度;此外16pipe會叫做 "pro"。
(所以24pipe是XT、32pipe是XTPE?)

—補充:
http://www.vr-zone.com/?i=2492&s=1
G80 理論設計完成…..採用Unified Shader設計"的樣子"。
和過去NV50採用US的"已知"相符。

話說從上述的dual-core產品一直"怪怪的"來看,
也許這個Dual-core產品,實際上指的還是G80。
不過G80應該是2006第三季的產品,現在就有風聲本身就很奇怪。

另外還有一個可能,就是G7x家族實際上真的有一個Dual-Core的特殊產品,用來測試一些G80的設計….
比方說 RSX dual-core,兩個Core中間用FlexIO相連,夾一個FlexIO-PCIe的二合一Arbiter,而這個Arbiter可能用來處理G80?

不過我仍然不知道為什麼不做個很大的G8x,而要dual-core之…
唯一合理的理由是Design For Manufacturing,製造細節因素….
這樣的話實際上運作應該仍然會相當於一個管線兩倍的大GPU就是。
而這樣的話該GPU會變成48shader、600M以上的超大產品,有點誇張….
只是還是有可能可以透過調整來提高良率,結果爭取到40pipe以上的機會仍然很大。
而且話說回來,如果當初G70>NV50(G80)的傳聞正確的話,那 Dual-core G70仍然可能強過Dual-Core G80。
(假設核心之外的條件相同的話)

總之實際狀況不明….

現在只剩下黑歷史….