changeset 25:1e019b5d8577

rdtsc
author Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
date Fri, 10 Jan 2014 16:06:16 +0900
parents 330abf1bb892
children d602bd03a4db
files presen/images/glaffle/.DS_Store presen/index.html
diffstat 2 files changed, 39 insertions(+), 10 deletions(-) [+]
line wrap: on
line diff
Binary file presen/images/glaffle/.DS_Store has changed
--- a/presen/index.html	Fri Jan 10 04:16:03 2014 +0900
+++ b/presen/index.html	Fri Jan 10 16:06:16 2014 +0900
@@ -413,9 +413,8 @@
                 <td>z</td>
                 <td>z座標の要素数</td>
               </tr>
-
             </tbody>
-          </table>          
+          </table>
 
         </article>
       </slide>      
@@ -424,6 +423,43 @@
         <hgroup>
           <h3>ベンチマーク</h3>
         </hgroup>
+        <article>
+          <h3 class="yellow">実験環境</h3>
+          <table>
+            <tbody>
+              <tr>
+                <td>OS</td><td>MacOS 10.9.1</td>
+              </tr>
+              <tr>
+                <td>CPU</td><td>2*2.66GHz 6-CoreIntel Xeon</td>
+              </tr>
+              <tr>
+                <td>Memory</td><td>16GB</td>
+              </tr>
+              <tr>
+                <td>Compiler</td><td>Apple LLVM version 5.0<br>(clang-500.2.79)</td>
+              </tr>
+              <tr>
+                <td>GPU</td><td>AMD ATI Radeon HD 5870 1024MB</td>
+              </tr>
+            </tbody>
+          </table>
+          <p>
+          </p>
+          <h3 class="yellow">時間測定の方法</h3>
+          <ul>
+            <li>CPU</li>
+            RDTSC命令を用いて、CPUのクロックからタイムスタンプカウンタを取得し、時間の測定を行っている
+            <li>GPU</li>
+            OpenCLのAPI(clGetEventProfilingInfo)を用いて測定
+          </ul>
+        </article>
+     </slide>
+
+     <slide>
+        <hgroup>
+          <h3>ベンチマーク</h3>
+        </hgroup>
         <table >
           <tbody>
             <tr>
@@ -437,13 +473,6 @@
                     フーリエ変換と周波数フィルタによる、
                     512*512の画像への処理をデータ並列で行う例題
                   </p>
-                  <h3 class="yellow">実験環境</h3>
-                  OS : MacOS 10.9.1<br>
-                  CPU : 2*2.66GHz 6-CoreIntel Xeon<br>
-                  Memory : 16GB<br>
-                  Compiler : Apple LLVM version 5.0<br>
-                        (clang-500.2.79)<br>
-                  GPU :  AMD ATI Radeon HD 5870 1024MB<br>
                   <h3 class="yellow">結果</h3>
                   <font size="5">
                     <p>
@@ -458,7 +487,7 @@
         </table>
         <dl>
         <ul>
-          <li>Run TimeはGPUが最も早い</li>
+          <li><font color="red">iterateを使用すると、GPU側が劇的に速い</font></li>
           <li>GPUはBusy Time以外の時間に大きく処理を割いている</li>
           <dd>おそらくデータの転送(IO)部分</dd>
         </ul>