http://rian.s26.xrea.com/nicky.cgi?DT=20061121A#20061121A
■2006年11月21日(火) PS3 Cell BE の PPE の性能は?
・ gccの最適化オプションは -O3 のみ
・ 3回実行して最も良かった値
・ スレッド分割してません。プロセッサコア単体の性能になります
・ Pentium4 3.2GHzはPrescott
・ 32bit coding
http://www.beyond3d.com/forum/showthread.php?t=36058
相關討論
・Dhrystone v2.1
PS3 Cell 3.2GHz: 1879.630
PowerPC G4 1.25GHz: 2202.600
PentiumIII 866MHz: 1124.311
Pentium4 2.0AGHz: 1694.717
Pentium4 3.2GHz: 3258.068
・Linpack 100×100 Benchmark In C/C++ (Rolled Double Precision)
PS3 Cell 3.2GHz: 315.71
PentiumIII 866MHz: 313.05
Pentium4 2.0AGHz: 683.91
Pentium4 3.2GHz: 770.66
Athlon64 X2 4400+ (2.2GHz): 781.58
・Linpack 100×100 Benchmark In C/C++ (Rolled Single Precision)
PS3 Cell 3.2GHz: 312.64
PentiumIII 866MHz: 198.7
Pentium4 2.0AGHz: 82.57
Pentium4 3.2GHz: 276.14
Athlon64 X2 4400+ (2.2GHz): 538.05
基本上大略是在預料之內….PPE的整數和倍精度都不太好;單精度FP倒是有一定程度的實力,本來以為不是VMX-128應該會蠻糟的。
可以看得出來倍精度的部份應該和SPE一樣有一定程度的弱化….
所以如果不使用SPE的話,基本上倍精度對Cell仍然是極為吃重的工作;或許65nm版本的Cell會做些強化也說不定。
(65nm Cell可能要等到07Q3)
總和來說,PPE的整數實力大約只有PPC970 @ 1.8GHz的1/3左右。
這其實會導因到一個很有趣的結果-回頭看具有3個PPX的Xenos,實際上PPX也只不過是PPE + VMX128而已,這代表Xenos的整數實力也頂多是PPC970 @ 1.8GHz同等的水準。
如果善用SMT的話,或許可以和缺乏OOOE扯平,不過也不是可以樂觀地說整數多好的程度;而SPE也是可以執行整數的,雖然範疇有相當的限制。
此外,Emotion Engine的R4300,當初跑Dhrystone 2.1的成績是450分,PPE大約是4x,所以考慮PPE在ISA上對EE的一些輔助設計,執行PS2 Emulator應該是沒有什麼問題。
(只是大概PPE得滿載吧)
不過這又有一點相當有趣:
根據傳統的說法,即使是遊戲,仍然有相當比例的整數運算;但是從PS2以來,console都相當重視flops。
這回的benchmark可以讓我們看到,不僅是PS3、XBOX360的整數其實也是偏弱的。
那麼到底對執行遊戲而言,整數和浮點運算資源,哪方面的比重比較大呢?
最後從本文看來,如果想買台PS3來跑Linux,而沒把活用SPE資源當成前提的話,不如買一台低階準系統還比較經濟實惠。
你忘了..Xenos的L2快取有1Mb
基本上 會更快一點.
加上VMX-128跟VMX-32是有差別的
Xenos的L2是1MB沒錯,但是是三顆共用1MB啊。
而且上面是說”整數部分”,PPE和PPX會差不多快,並沒有說VMX128的速度和VMX32的速度一樣。
最後,VMX128的速度再快,也只是和VMX32相比快,和SPE比是會有很大落差的。