http://blog.cell.sijam.com/x264_for_cell_070412_part2/
哇哈哈哈…. 慢到爆。
最慘的莫過於原始版 x264 rev:635 和 SPE 化的 rev:635 cell 比起來,不論是用不用SPE都比原始版慢。XD
當然了,這個程式碼以減少對x264原始程式碼的改動比例為前提….
基本上SPE只做motion vector search的關係,一開始就知道效率不會好。
這個程式碼有下列的問題:
1. PPE的使用率幾乎沒有什麼明顯縮減。(55% -> 40%)
原文指出因為要求SPE處理用的packet的複製動作需要耗損PPE資源,這部分要的時間很長。
2. PPE剩下的處理因為使用的資料隨機性質大,所以cache miss機率高。
3. 工作分割單位過小。
最後,還提供了thread數量與SPE使用率的比例表….(1~6)
有執行指令(包含搬動資料的指令)就只有8~14%了,更別提裡面運算指令只占了55%前後,也就是說SPE的使用率最高也只有8%前後…
結論:移植程式給CELL,需要大幅修改演算法….或者說重寫比較快。_A_