Mercurial > hg > Members > kokubo > 2013-mid-thesis
annotate paper/fft_benchmark.tex @ 2:b7c8a956c10b
write benchmark and conclusion
author | Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp> |
---|---|
date | Wed, 06 Nov 2013 01:16:42 +0900 |
parents | 9e88a388ec83 |
children | 208ca954df56 |
rev | line source |
---|---|
0 | 1 \section{Benchmark}\label{fft_benchmark} |
2
b7c8a956c10b
write benchmark and conclusion
Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
2 続いて,フーリエ変換と周波数フィルタによる画像処理を行う例題を用いて benchmark を行った。 |
b7c8a956c10b
write benchmark and conclusion
Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
3 512*512 の画像を High Pass Filter で変換する例題である。 |
0 | 4 |
5 実験環境 | |
6 \begin{itemize} | |
7 \item OS : MacOS 10.9 | |
8 \item CPU : 2*2.66GHz 6-CoreIntel Xeon | |
9 \item Memory : 16GB | |
10 \item Compiler : Apple clang version 4.1 (based on LLVM 3.1svn) | |
11 \item GPU : AMD ATI Radeon HD 5870 1024MB | |
12 \end{itemize} | |
13 | |
14 \begin{tiny} | |
15 \begin{table}[h] | |
16 \begin{center} | |
17 \caption{Run Time} | |
18 \label{table:fft_runtime} | |
19 \small | |
20 \begin{tabular}[t]{c||r} | |
21 \hline | |
22 &Run Time \\ | |
23 \hline | |
24 1 CPU&453 ms \\ | |
25 \hline | |
26 2 CPU&261 ms \\ | |
27 \hline | |
28 4 CPU&178 ms \\ | |
29 \hline | |
30 8 CPU&117 ms \\ | |
31 \hline | |
32 \end{tabular} | |
33 \end{center} | |
34 \end{table} | |
35 \end{tiny} | |
36 | |
2
b7c8a956c10b
write benchmark and conclusion
Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
37 表\ref{table:fft_runtime}は使用する CPU のコア数を変更し比較を行った。 |
b7c8a956c10b
write benchmark and conclusion
Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
38 1 CPU を利用した場合と比較して,2 CPU では約 1.7 倍,GPU では約 4.8 倍の速度向上が見られる。 |
b7c8a956c10b
write benchmark and conclusion
Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
39 しかしながら,8 CPU を利用した場合,4 CPU を利用した場合と比較して速度はあがっているが速度上昇率は約 1.5 倍に落ちている。 |
b7c8a956c10b
write benchmark and conclusion
Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
40 これはアムダールの法則から,並列化率が低いために速度向上が頭打ちになっていると考えられる。 |
b7c8a956c10b
write benchmark and conclusion
Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
41 並列化率が低いのは,iterate で登録された Task が終了されるまで次の Task を実行することが出来ず,表\ref{table:data_parallel_index}のような index 割り当てだと Task の終了時間にばらつきが出て CPU の Utilization が低くなってることが考えられる。 |