comparison paper/conclusion.tex @ 2:b7c8a956c10b

write benchmark and conclusion
author Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
date Wed, 06 Nov 2013 01:16:42 +0900
parents 9e88a388ec83
children 208ca954df56
comparison
equal deleted inserted replaced
1:f4b3de446113 2:b7c8a956c10b
1 \section{まとめ} 1 \section{まとめ}
2 本研究では Cerium Task Manager をデータ並列による実行に対応させ、更にベンチマークも行った。 2 本研究では Cerium Task Manager を Data 並列による実行に対応させ,更に benchmark も行った。
3 これにより、大量のデータに対して同一の処理を繰り返し行うというGPUが得意とする処理が可能となった。 3 これにより,大量の Data に対して同一の処理を繰り返し行う Task を簡単に記述できるようになった。
4 しかし、 GPU 実行の場合は充分な性能が出ているが、 Multi Core の場合は並列度が充分に出ているとは言えない。 4 しかし,実行時に並列度が充分に出ているとは言えない。
5 データの転送や測定の見直し等、チューニングが必要である。 5 index の割り当てや例題の選定等、チューニングが必要である。
6
7 更に複数あるTaskをCPUとGPU、両方のアーキテクチャで実行できるように実装した。
8 しかし、CPUとGPUは同じ性能が出るわけではない。
9 更に GPU はデータの転送がネックになりやすいので、各Taskの計算量と実行時間が比例しない場合がある。
10 そういった場合にCPUとGPUに均等にTaskを割り振ってしまうと、並列度が出ない。
11 そこでCPUとGPUに対して最適にTaskを割り振るSchedulingの手法を提案した。