changeset 5:4614c0f15615

add scheduling file
author Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
date Mon, 04 Nov 2013 23:33:34 +0900
parents e9872101e0ee
children 343fad986745
files paper/bibliography.tex paper/conclusion.tex paper/ipsj.pdf paper/scheduling.tex
diffstat 4 files changed, 16 insertions(+), 24 deletions(-) [+]
line wrap: on
line diff
--- a/paper/bibliography.tex	Mon Nov 04 15:57:09 2013 +0900
+++ b/paper/bibliography.tex	Mon Nov 04 23:33:34 2013 +0900
@@ -1,12 +1,6 @@
 
 \begin{thebibliography}{10}
 
-\bibitem{osmesa}
-The Mesa 3D Graphics Library, \url{http://www.mesa3d.org/}.
-
-\bibitem{sdl}
-Simple DirectMedia Layer, \url{http://www.libsdl.org/}.
-
 \bibitem{akira}
 {Akira KAMIZATO.}: Cell を用いたゲームフレームワークの提案,琉球大学工学部情報工学科平成19年度学位論文(修士) (2008).
 
@@ -16,14 +10,8 @@
 \bibitem{gogo:2008a}
 {nd Shinji KONO}:Cerium Task Manager におけるマルチコア上での並列実行機構の実装(2012)
 
-\bibitem{amdahl}
-{Brian Goetz, Tim Peierls, Joshua Bloch, Joseph Bowbeer, David Holmes, and Doug
-  Lea.}: Java Concurrency in Prac-tice, {\em Addison-Wesley Professional}
-  (2005).
-
-\bibitem{gongo}
-{Wataru MIYAGUNI, Shinji KONO}: SourceForge.JP: Project Info - Cerium Rendering
-  Engine, \url{https://sourceforge.jp/projects/cerium/}.
+\bibitem{opencl}
+{Aaftab Munshi, Khronos OpenCL Working Group}:The OpenCL Specification Version 1.0 (2007)
 
 \bibitem{cell}
 {Sony Corporation.}: {\em Cell broadband engine architecture} (2005).
@@ -32,15 +20,6 @@
 {Chiaki SUGIYAMA.}: SceneGraph と StatePattern
   を用いたゲームフレームワークの設計と実装,琉球大学工学部情報工学科平成19年度卒業論文 (2008).
 
-\bibitem{blender}
-{Satoshi Yamasaki.}: Blender.jp - Blender Japanese Website,
-  \url{http://blender.jp/}.
-
-\bibitem{libspe2}
-{International Business Machines Corporation, Sony Computer Entertainment
-  Incorporated, Toshiba Corporation.}: {\em SPE Runtime Management Library}
-  (2006).
-
 \bibitem{spurs}
 {Keisuke INOUE.}: Cell プロセッサ向け実行環境(SPU Centric Execution
   Model),先進的計算基盤システムシンポジウム SACSIS (2006).
--- a/paper/conclusion.tex	Mon Nov 04 15:57:09 2013 +0900
+++ b/paper/conclusion.tex	Mon Nov 04 23:33:34 2013 +0900
@@ -4,4 +4,5 @@
 しかし、 GPU 実行の場合は充分な性能が出ているが、 Multi Core の場合は並列度が充分に出ているとは言えない。
 データの転送や測定の見直し等、チューニングが必要である。
 
-更に、
+更に複数あるTaskをCPUとGPU、両方のアーキテクチャで実行できるように実装した。
+
Binary file paper/ipsj.pdf has changed
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/paper/scheduling.tex	Mon Nov 04 23:33:34 2013 +0900
@@ -0,0 +1,12 @@
+\section{CPUとGPUの同時実行}\label{scheduling}
+CPU と GPU で同時実行する場合、実行速度には差が出る。
+ GPU はホスト側とPCIバスを通してデータの転送を行う。
+ CPU 側の計算量によってバスの転送を圧迫する事が考えられる。
+他にも、各アーキテクチャの得意とする計算が異なる事からも実行速度に差異が出ることが予想できる。
+これらの事から、 CPU と GPU に対して均等に Task を割り振ると並列度は低くなる。
+並列度を維持するためにアーキテクチャのコア数によってどちらかに優先してTaskを振る必要がある。
+一般的にコア数はGPUの方が多いので、GPUを優先してTaskを振っていく。
+\subsection{Scheduling}
+Schedulingを行う際は、並列実行するTaskをCPUとGPUで事前に実行し、実行速度を測定する。
+それぞれの実行速度の割合で重みをつけてTaskを振り分けていく。
+