= DDエミュレーション手法の性能について = いわゆるdouble-doubleエミュレーション手法により、四倍精度演算を利用して、ファインマンループの数値積分を計算した場合の演算性能について。 ACAT2010での発表と論文から、AMDのCypressアーキテクチャGPUでの演算性能がさらに向上したので、結果をまとめる。 == ソースコード == {{{ }}} == 結果 == 性能はMFLOPS。28N^3演算として評価した。 || || N=256 || N=512 || N=1024 || N=2048|| note || ||Core i7 || 63.6 || 63.7 || 63.7 || || 2670MHz 1 core || ||GRAPE-DR|| 2234 || 3106 || 3840 || 4365 || 380MHz || ||Cypress || 9395 || 12958 || 15497 || 16938 || 850MHz || ||Cypress FMA|| || || || 27270 || 850MHz || == 行列乗算のテスト実装 == [wiki:MatrixMultiply]を参照のこと