Eji的碎碎念

搜尋

跳至主要內容

About
Sample Page

搜尋關鍵字:

B3D的Tesla T10P/GT200 for CUDA review

28 6 月, 2008 Eji 發佈留言

http://www.beyond3d.com/content/articles/106/

Beyond3D：Tesla 10 & CUDA 2.0: Technical Analysis & Performance

目前改進的範疇都還是用起來比較方便，但是GPU對一般的programmer來說還是很麻煩，因為你要知道為什麼你的程式快不起來，你就非得去了解GPU架構；而Larrabee應該會以幹掉這個部分為主要的賣點….

Missing MUL的問題：在G80時代只有在CUDA底下才能發揮出來，在GT200似乎只要一些排程上的小限制就可以在大部分的狀況下達到理論值；目前PCIe 2.0的頻寬利用率在CUDA底下是大約6GB/s，即總頻寬的75%。

PCI-Express 2.0目前”總算”達到雙向傳輸，或者是邊做單向傳輸、邊做運算；下一代會做到運算與PCIe雙向傳輸可以同時進行。

目前看起來最大的改進可能是那個沒有大幅宣傳的Memory read/write combine(Atomic unit)，G80的時候每個warp都還是需要循序讀取、不然就得自己讀進share memory後再排序，這點看起來算是大改進。

雖然B3D敘述的時候講得很保留，說沒什麼魔法、只是會方便些….XD

文章導覽

上一篇文章Life with Playstation；DS-10開發人員訪談下一篇文章Gackpoid的開發背景

發佈留言取消回覆

發佈留言必須填寫的電子郵件地址不會公開。必填欄位標示為 *

留言 *

顯示名稱 *

電子郵件地址 *

個人網站網址

Δ

這個網站採用 Akismet 服務減少垃圾留言。進一步了解 Akismet 如何處理網站訪客的留言資料。

現在只剩下黑歷史….

搜尋關鍵字:

近期文章

「可不のCeVIO AI声色雑感」
「おうちで、キャンプ。うちキャン△ペーン」。へやキャン△特典映像を24時間限定公開
VOCALOID:AI (UPF-MTG NPSS)雜感
Oculus Goを飛行機で使う
Moresampler 0.8.3

近期留言

「Eji」於〈Oculus Riftを試した後〉發佈留言
「HOGEGE」於〈Oculus Riftを試した後〉發佈留言
「Eji」於〈Oculus Riftを試した後〉發佈留言
「なりた＠ﾁｪﾘ男」於〈Oculus Riftを試した後〉發佈留言
「Eji」於〈Oculus Riftを試した後〉發佈留言

彙整

分類

CELL
customize firmware
Galaxy Angel
GPU
hardware
MikuMikuDance
Negima
NVIDIA
P2P
router
software
Uncategorized
VOCALOID
WL-500g
XBOX
初音ミク

其他操作

登入
訂閱網站內容的資訊提供
訂閱留言的資訊提供
WordPress.org 台灣繁體中文

本站採用 WordPress 建置