view conclusion.tex @ 5:679859bf2fe8

rivision
author Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
date Tue, 22 Apr 2014 14:35:47 +0900
parents 593671347b01
children
line wrap: on
line source

\section{まとめ}
本研究では並列プログラミングフレームワーク Cerium を OpenCL および CUDA に対応させた。
OpenCL および CUDA に対応させたことで Cerium は単一の記述から CPU および GPU 上での実行が可能になった。
WordCount, FFT を例題に用い、Scheduler の測定も行なった。
OpenCL と CUDA で異なる結果が出たことからそれぞれで最適なチューニングの方法が違うことがわかる。
どちらもチューニングを行えば同等な結果が出ると考えられるのでプロファイラなどを用いて、実装を見直すことが今後の課題となる。
また、Cerium は CPU と GPU の同時実に対応している。
しかし、スケジューリングを行わず Task を CPU, GPU に対し交互に割り振っているため CPU 単体、GPU 単体で実行するより結果が悪くなる。
Task の割り当てを最適化することで性能を向上させることが予想される。
スケジューリングの方法として、一度 Task を CPU のみ、GPU のみで実行し、プロファイルを取ることで Task の割り当てを決定するなどが考えられる。
%% 同時実行の話も入れて