Changes between Version 24 and Version 25 of CALによるGPUプログラミング


Ignore:
Timestamp:
Mar 23, 2009 2:26:06 AM (16 years ago)
Author:
nakasato
Comment:

--

Legend:

Unmodified
Added
Removed
Modified
  • CALによるGPUプログラミング

    v24 v25  
    99 * 二つのボードの違いは、動作クロックとメモリインターフェイス 
    1010 
    11  * Shader Processorが800個搭載されており、それぞれが単精度でMultiply-Addが可能なprocessorである。実際には、単純に単精度演算ができるprocessor(Stream Core)が4個と関数演算もできるprocessor(T-Stream Core)が一緒になって、128 bitレジスタをもつ5 wayのVLIW processor(Thread Processor)になっているらしい。さらに、このTPが、X個づつまとまって、メモリを共有している(shared buffer)と思われる。 
     11 * Shader Processorが800個搭載されており、それぞれが単精度でMultiply-Addが可能なprocessorである。実際には、単純に単精度演算ができるprocessor(Stream Core)が4個と関数演算もできるprocessor(T-Stream Core)が一緒になって、128 bitレジスタをもつ5 wayのVLIW processor(Thread Processor)になっているらしい。さらに、このTPが10組(Stream Processor?)でメモリを共有している(Local Data Store)と思われる。 
    1212  
    1313 * 以上のことから単精度での理論性能は以下の式で計算される: 
     
    4646[[Image(GFLOPS.png)]]  
    4747 
    48 RV770 @ 750 MHz with 1GB 
     48RV770 @ 750 MHz