Changes between Version 1 and Version 2 of DDemulation


Ignore:
Timestamp:
Jul 7, 2010 1:41:30 AM (14 years ago)
Author:
nakasato
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • DDemulation

    v1 v2  
    55== ソースコード == 
    66{{{ 
     7VARI xx, yy, cnt4; 
     8VARJ x30_1, gw30; 
     9VARF res; 
     10CONST tt, ramda, fme, fmf, s, one; 
    711 
     12zz = x30_1*cnt4; 
    813 
     14d = -xx*yy*s-tt*zz*(one-xx-yy-zz)+(xx+yy)*ramda**2 +  
     15        (one-xx-yy-zz)*(one-xx-yy)*fme**2+zz*(one-xx-yy)*fmf**2; 
     16 
     17res += gw30/d**2; 
    918}}} 
    1019 
    1120== 結果 == 
    12 性能はMFLOPS。28N^3演算として評価した。 
    1321|| || N=256 || N=512 || N=1024 || N=2048|| note || 
    1422||Core i7 || 63.6 || 63.7 || 63.7   ||       || 2670MHz 1 core || 
     
    1725||Cypress FMA||   ||       ||       || 27270 || 850MHz || 
    1826 
     27性能はMFLOPS。28N^3^演算として評価した。Cypressでは、FMA命令を使うことでDD乗算が2.5倍ほど高速化するため非常に効率がよい。 
     28 
    1929== 行列乗算のテスト実装 == 
    2030[wiki:MatrixMultiply]を参照のこと