diff paper/fft_benchmark.tex @ 5:208ca954df56

fix
author Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
date Wed, 06 Nov 2013 21:46:55 +0900
parents b7c8a956c10b
children
line wrap: on
line diff
--- a/paper/fft_benchmark.tex	Wed Nov 06 21:09:42 2013 +0900
+++ b/paper/fft_benchmark.tex	Wed Nov 06 21:46:55 2013 +0900
@@ -29,6 +29,8 @@
         \hline
         8 CPU&117 ms \\
         \hline
+        GPU&94 ms \\
+        \hline
       \end{tabular}
     \end{center}
   \end{table}
@@ -38,4 +40,4 @@
 1 CPU を利用した場合と比較して,2 CPU では約 1.7 倍,GPU では約 4.8 倍の速度向上が見られる。
 しかしながら,8 CPU を利用した場合,4 CPU を利用した場合と比較して速度はあがっているが速度上昇率は約 1.5 倍に落ちている。
 これはアムダールの法則から,並列化率が低いために速度向上が頭打ちになっていると考えられる。
-並列化率が低いのは,iterate で登録された Task が終了されるまで次の Task を実行することが出来ず,表\ref{table:data_parallel_index}のような index 割り当てだと Task の終了時間にばらつきが出て CPU の Utilization が低くなってることが考えられる。
+原因は,iterate で登録された Task が終了されるまで次の Task を実行することが出来ず,表\ref{table:data_parallel_index}のような index 割り当てだと Task の終了時間にばらつきが出て CPU の Utilization が低くなっていることが予想される。