Version 1 (modified by nakasato, 14 years ago) (diff) |
---|
DDエミュレーション手法の性能について
いわゆるdouble-doubleエミュレーション手法により、四倍精度演算を利用して、ファインマンループの数値積分を計算した場合の演算性能について。 ACAT2010での発表と論文から、AMDのCypressアーキテクチャGPUでの演算性能がさらに向上したので、結果をまとめる。
ソースコード
結果
性能はMFLOPS。28N3演算として評価した。
N=256 | N=512 | N=1024 | N=2048 | note | |
Core i7 | 63.6 | 63.7 | 63.7 | 2670MHz 1 core | |
GRAPE-DR | 2234 | 3106 | 3840 | 4365 | 380MHz |
Cypress | 9395 | 12958 | 15497 | 16938 | 850MHz |
Cypress FMA | 27270 | 850MHz |
行列乗算のテスト実装
MatrixMultiplyを参照のこと
Attachments (1)
- ACAT2010_Nakasato.pdf (131.4 KB) - added by nakasato 14 years ago.
Download all attachments as: .zip