GTC看完四個video的感想

http://www.nvidia.com/object/gpu_technology_conference.html#webcast

http://player.istreamplanet.com/nvidia/d/keynote_090930.html

Opening Keynote with Jen-Hsun Huang

http://player.istreamplanet.com/nvidia/d/3pmsession_090930.html

General Session: Important Trends in Visual Computing

http://player.istreamplanet.com/nvidia/d/4pmsession_090930.html

General Session: Breakthroughs in High Performance Computing

http://ispss.istreamplanet.com/nvidia/d/keynote_091001.html

Day 2 Keynote: Hanspeter Pfister, Professor, Harvard University

結論….GPU還不夠快(核爆)

那堆動不動就需要ExaFLOPS level、grand challange級的東西實在是太瘋狂啦….

不過Fermi對工業的確會有很大推動力的感覺,畢竟單晶片倍精度破1TFLOPS真的意義非凡。改成64bit的線性定址空間讓C++可以re-compile就直接在上面也很重要,可以切換的16KB shre memory+48KB L1/768KB L2也讓大部分的code可以不做很大的修改就得到初步的加速,引入的debug機制也讓在Fermi上的開發比過去GPGPU要進步很多,最後是高速context switching和multi-kernel執行能力(16的話好像和SM的數量有關),這樣看來Fermi 似乎是有和Larrabee叫陣的本錢了。

最後,09年第四季Tesla business似乎有10M的盈餘….

—-

不過基本上最受關心的還是繪圖性能….畢竟成本就是高了1.5倍。

反過來說,超過GTX295應該是基本期望,但如果GF100還能夠單晶片挑贏5870X2(贏5870平均約25%)的話,那就真的很神了。

但是個人覺得GT200的問題不在shader,更比較偏向TMU和ROP吞吐不足(尤其是ROP基礎性能比G92還糟)….這個改善應該和shader是可以並行不悖的。

雖然以硬體context switching應該可以收到DirectCompute並列執行效率不減的好處,這樣預期來說只要一跑PhsyX,GF100單卡很有可能可以打贏兩張GT200 SLI、或者是GT200兩張各自跑繪圖和物理;但是繪圖本身單獨就贏,才會給人有全面性的感覺。

UGA+JOYSOUND

http://www.itmedia.co.jp/news/articles/0909/30/news085.html

USEN、「カラオケUGA」を「JOYSOUND」のブラザーに売却

http://gigazine.net/index.php?/news/comments/20091001_joysound_uga/

マニアックな曲を収録していることで定評のあるカラオケ「JOYSOUND」と「UGA」が合体へ

這真是神來一筆….XDa

——

http://internet.watch.impress.co.jp/docs/news/20091001_318774.html

ニコニコ動画、違法投稿の自動モニタリングを開始


http://www.itmedia.co.jp/news/articles/0910/01/news110.html

ニコ動、著作権侵害動画を自動で検出 フィンガープリント技術をテスト



 著作権を侵害した動画が見つかった場合、削除せずに残しておき、動画視聴ページ上に掲載した広告収入を権利者と分配するシステムの運用も、試験的に行う。

和YOUTUBE的系統一樣,主要是從人力變成上載的時候自動比對。

不過重點在參與廠商,這樣的話有可能開啟一些比方說手塚、吉卜力之類過去不受正視的MAD作品可以投稿的機會。

Y2 PROJECT @ CEATEC

http://www.yamaha.co.jp/news/2009/09100101.html

CEATEC JAPAN 2009のライフコンテンツ フロンティアでの展示に参加

http://www.yamaha.co.jp/ceatec/

トップ | CEATEC | ヤマハ株式会社:

http://www.yamaha.co.jp/ceatec/details.html

展示一覧

◎コンセプト展示ですので、製品発売の可能性や時期については未定です。

◎記載されている会社名、法人名、製品名は各社の登録商標または商標です。

VOCALOIDで歌を合成し、ロボットがピアノの音に合わせて自由に、感情豊かに、歌います。来場してくださるあなたからの曲のリクエストにも、応えてくれるかもしれません。

http://twitter.com/y2project/status/4524309667

頓智・さんとのコラボレーションがヤマハブースで実現! セカイカメラを是非お持ちください。常設機もスタンバイしています。

……………………………..好想去T__T

—-

http://northwood.blog60.fc2.com/blog-entry-3168.html

(北森瓦版元記事)

http://mikudan.blog120.fc2.com/blog-entry-150.html

AMDとオープンソースな物理演算エンジンで―”Bullet Physics”

かんなさん、你家的9600GT已經可以動了啊,別被ATI拐走了….

Fermi正式發表

http://www.4gamer.net/games/099/G009929/20090930012/

NVIDIA,DirectX 11世代の次世代GPU「Fermi」を予告~30億トランジスタ,512シェーダプロセッサ!

http://pc.watch.impress.co.jp/docs/news/event/20091001_318660.html

【GTCレポート】NVIDIAの次世代GPUアーキテクチャ「Fermi」搭載Teslaを公開

http://pc.watch.impress.co.jp/docs/column/kaigai/20091001_318463.html

NVIDIAが次世代GPUアーキテクチャ「Fermi」を発表

http://www.realworldtech.com/page.cfm?ArticleID=RWT093009110932

Inside Fermi: Nvidia’s HPC Push

http://forum.beyond3d.com/showthread.php?p=1342380

NVIDIA Fermi: Architecture discussion and pre-launch GF100 speculation

3.0B transistors @ TSMC, 40nm

2 x 16-way FMA SM, IEEE754-2008, 16 SMs

Each SM has four SFUs

384-bit GDDR5

~650/1700/4200MHz (base/hot/mem)

16 pixels clock address and filter per SM

48 ROPs, 8Z/C clock

64KiB L1/smem per SM (48/16 or 16/48 per clock config, not user programmable as far as I know, at least not yet)

Unified 768 KiB L2 (not partitioned now, so a write to L2 from any SM is visible to all others immediately)

Unified memory space (hardware TLB, 1TiB address, 40-bit if my brain’s working)

http://www.anandtech.com/video/showdoc.aspx?i=3651

NVIDIA’s Fermi: Architected for Tesla, 3 Billion Transistors in 2010

http://www.anandtech.com/video/showdoc.aspx?i=3651&p=7

The RV770 Lesson (or The GT200 Story)

http://www.theinquirer.net/inquirer/news/1137331/a-look-nvidia-gt300-architecture

A look at the Nvidia GT300 architecture

其實某種觀點來看,16 x[8TMU+32sp]這個預測是完全沒有問題的,只是32sp本來以為是4×8,結果NVIDIA做了徹底重新的整合來refine,並且更有效地改善了GPGPU的部份。

Fermi在各處的改良都讓它更適合同時執行GPGPU與原來GPU繪圖的工作,包含全速倍精度性能等等,讓PhsyX之類的應用可以更有效率地和繪圖進行整合,追加ECC能力也更有辦法執行HPC高階應用的任務,這兩點都是當初CELL這樣的處理器推出的時候被HPC業界所質疑的部份,也是Tesla一開始遇到的問題,所以CELL推出了倍精度全速版,Fermi也把倍精度全速和ECC都放了上去,某種意味上這算是一種行銷也說不定。(為了clear最低門檻)

所以說,這次發表是把CUDA放在繪圖部份之前來發表,也是一種象徵性,所以感覺Fermi比起GPGPU,更像是「有繪圖功能的HPC處理器」….第一時間沒發表繪圖性能基本上也是有點氣勢已經輸給人家的感覺。

因為投注了太多成本在GPU以外的地方,光比遊戲繪圖的話,GT300/GF100/Fermi應該還是很容易被RV870修理;所以如果沒搭PhsyX(而且要非常積極地使用)的話應該很難有比較空間。所以在這個時候把PhsyX混用關閉,讓ATI+NVIDIA GPU充當PhsyX的solution不能用(或者說逼ATI面對無PhsyX可用的狀況),感覺其實有點小家子氣w

與繪圖工作同時執行的能力、全速倍精度、ECC支援。

從G80到GT200為止,CUDA相關的問題幾乎都獲得了解決,投注的成本幾乎差不多就是從512bit變成384bit所少掉的那個128bit GDDR5控制器,GT300一如預期與兩顆GT200差不多大,繪圖性能也都保持線性提昇。

但是這樣真的值得嗎?