view paper/conclusion.tex @ 0:9e88a388ec83

first commit
author Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
date Tue, 05 Nov 2013 23:18:04 +0900
parents
children b7c8a956c10b
line wrap: on
line source

\section{まとめ}
本研究では Cerium Task Manager をデータ並列による実行に対応させ、更にベンチマークも行った。
これにより、大量のデータに対して同一の処理を繰り返し行うというGPUが得意とする処理が可能となった。
しかし、 GPU 実行の場合は充分な性能が出ているが、 Multi Core の場合は並列度が充分に出ているとは言えない。
データの転送や測定の見直し等、チューニングが必要である。

更に複数あるTaskをCPUとGPU、両方のアーキテクチャで実行できるように実装した。
しかし、CPUとGPUは同じ性能が出るわけではない。
更に GPU はデータの転送がネックになりやすいので、各Taskの計算量と実行時間が比例しない場合がある。
そういった場合にCPUとGPUに均等にTaskを割り振ってしまうと、並列度が出ない。
そこでCPUとGPUに対して最適にTaskを割り振るSchedulingの手法を提案した。