Mercurial > hg > Members > kokubo > 2013-mid-thesis
comparison paper/fft_benchmark.tex @ 5:208ca954df56
fix
author | Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp> |
---|---|
date | Wed, 06 Nov 2013 21:46:55 +0900 |
parents | b7c8a956c10b |
children |
comparison
equal
deleted
inserted
replaced
4:8c37fee42142 | 5:208ca954df56 |
---|---|
27 \hline | 27 \hline |
28 4 CPU&178 ms \\ | 28 4 CPU&178 ms \\ |
29 \hline | 29 \hline |
30 8 CPU&117 ms \\ | 30 8 CPU&117 ms \\ |
31 \hline | 31 \hline |
32 GPU&94 ms \\ | |
33 \hline | |
32 \end{tabular} | 34 \end{tabular} |
33 \end{center} | 35 \end{center} |
34 \end{table} | 36 \end{table} |
35 \end{tiny} | 37 \end{tiny} |
36 | 38 |
37 表\ref{table:fft_runtime}は使用する CPU のコア数を変更し比較を行った。 | 39 表\ref{table:fft_runtime}は使用する CPU のコア数を変更し比較を行った。 |
38 1 CPU を利用した場合と比較して,2 CPU では約 1.7 倍,GPU では約 4.8 倍の速度向上が見られる。 | 40 1 CPU を利用した場合と比較して,2 CPU では約 1.7 倍,GPU では約 4.8 倍の速度向上が見られる。 |
39 しかしながら,8 CPU を利用した場合,4 CPU を利用した場合と比較して速度はあがっているが速度上昇率は約 1.5 倍に落ちている。 | 41 しかしながら,8 CPU を利用した場合,4 CPU を利用した場合と比較して速度はあがっているが速度上昇率は約 1.5 倍に落ちている。 |
40 これはアムダールの法則から,並列化率が低いために速度向上が頭打ちになっていると考えられる。 | 42 これはアムダールの法則から,並列化率が低いために速度向上が頭打ちになっていると考えられる。 |
41 並列化率が低いのは,iterate で登録された Task が終了されるまで次の Task を実行することが出来ず,表\ref{table:data_parallel_index}のような index 割り当てだと Task の終了時間にばらつきが出て CPU の Utilization が低くなってることが考えられる。 | 43 原因は,iterate で登録された Task が終了されるまで次の Task を実行することが出来ず,表\ref{table:data_parallel_index}のような index 割り当てだと Task の終了時間にばらつきが出て CPU の Utilization が低くなっていることが予想される。 |