Changes between Version 1 and Version 2 of DDemulation
- Timestamp:
- Jul 7, 2010 1:41:30 AM (14 years ago)
Legend:
- Unmodified
- Added
- Removed
- Modified
-
DDemulation
v1 v2 5 5 == ソースコード == 6 6 {{{ 7 VARI xx, yy, cnt4; 8 VARJ x30_1, gw30; 9 VARF res; 10 CONST tt, ramda, fme, fmf, s, one; 7 11 12 zz = x30_1*cnt4; 8 13 14 d = -xx*yy*s-tt*zz*(one-xx-yy-zz)+(xx+yy)*ramda**2 + 15 (one-xx-yy-zz)*(one-xx-yy)*fme**2+zz*(one-xx-yy)*fmf**2; 16 17 res += gw30/d**2; 9 18 }}} 10 19 11 20 == 結果 == 12 性能はMFLOPS。28N^3演算として評価した。13 21 || || N=256 || N=512 || N=1024 || N=2048|| note || 14 22 ||Core i7 || 63.6 || 63.7 || 63.7 || || 2670MHz 1 core || … … 17 25 ||Cypress FMA|| || || || 27270 || 850MHz || 18 26 27 性能はMFLOPS。28N^3^演算として評価した。Cypressでは、FMA命令を使うことでDD乗算が2.5倍ほど高速化するため非常に効率がよい。 28 19 29 == 行列乗算のテスト実装 == 20 30 [wiki:MatrixMultiply]を参照のこと