| 1 | = DDエミュレーション手法の性能について = |
| 2 | いわゆるdouble-doubleエミュレーション手法により、四倍精度演算を利用して、ファインマンループの数値積分を計算した場合の演算性能について。 |
| 3 | ACAT2010での発表と論文から、AMDのCypressアーキテクチャGPUでの演算性能がさらに向上したので、結果をまとめる。 |
| 4 | |
| 5 | == ソースコード == |
| 6 | {{{ |
| 7 | |
| 8 | |
| 9 | }}} |
| 10 | |
| 11 | == 結果 == |
| 12 | 性能はMFLOPS。28N^3演算として評価した。 |
| 13 | || || N=256 || N=512 || N=1024 || N=2048|| note || |
| 14 | ||Core i7 || 63.6 || 63.7 || 63.7 || || 2670MHz 1 core || |
| 15 | ||GRAPE-DR|| 2234 || 3106 || 3840 || 4365 || 380MHz || |
| 16 | ||Cypress || 9395 || 12958 || 15497 || 16938 || 850MHz || |
| 17 | ||Cypress FMA|| || || || 27270 || 850MHz || |
| 18 | |
| 19 | == 行列乗算のテスト実装 == |
| 20 | [wiki:MatrixMultiply]を参照のこと |