wiki:DDemulation

Version 1 (modified by nakasato, 14 years ago) (diff)

--

DDエミュレーション手法の性能について

いわゆるdouble-doubleエミュレーション手法により、四倍精度演算を利用して、ファインマンループの数値積分を計算した場合の演算性能について。 ACAT2010での発表と論文から、AMDのCypressアーキテクチャGPUでの演算性能がさらに向上したので、結果をまとめる。

ソースコード


結果

性能はMFLOPS。28N3演算として評価した。

N=256 N=512 N=1024 N=2048 note
Core i7 63.6 63.7 63.7 2670MHz 1 core
GRAPE-DR 2234 3106 3840 4365 380MHz
Cypress 9395 12958 15497 16938 850MHz
Cypress FMA 27270 850MHz

行列乗算のテスト実装

MatrixMultiplyを参照のこと

Attachments (1)

Download all attachments as: .zip