diff paper/conclusion.tex @ 2:b7c8a956c10b

write benchmark and conclusion
author Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
date Wed, 06 Nov 2013 01:16:42 +0900
parents 9e88a388ec83
children 208ca954df56
line wrap: on
line diff
--- a/paper/conclusion.tex	Tue Nov 05 23:59:45 2013 +0900
+++ b/paper/conclusion.tex	Wed Nov 06 01:16:42 2013 +0900
@@ -1,11 +1,5 @@
 \section{まとめ}
-本研究では Cerium Task Manager をデータ並列による実行に対応させ、更にベンチマークも行った。
-これにより、大量のデータに対して同一の処理を繰り返し行うというGPUが得意とする処理が可能となった。
-しかし、 GPU 実行の場合は充分な性能が出ているが、 Multi Core の場合は並列度が充分に出ているとは言えない。
-データの転送や測定の見直し等、チューニングが必要である。
-
-更に複数あるTaskをCPUとGPU、両方のアーキテクチャで実行できるように実装した。
-しかし、CPUとGPUは同じ性能が出るわけではない。
-更に GPU はデータの転送がネックになりやすいので、各Taskの計算量と実行時間が比例しない場合がある。
-そういった場合にCPUとGPUに均等にTaskを割り振ってしまうと、並列度が出ない。
-そこでCPUとGPUに対して最適にTaskを割り振るSchedulingの手法を提案した。
+本研究では Cerium Task Manager を Data 並列による実行に対応させ,更に benchmark も行った。
+これにより,大量の Data に対して同一の処理を繰り返し行う Task を簡単に記述できるようになった。
+しかし,実行時に並列度が充分に出ているとは言えない。
+index の割り当てや例題の選定等、チューニングが必要である。