changeset 13:61407e91e1bd

refrect comment feedback
author Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
date Tue, 26 Nov 2013 03:41:45 +0900
parents 05a67420ce5c
children c44f787fbac6
files paper/bibliography.tex paper/data_parallel.tex paper/fft_benchmark.tex paper/introduction.tex paper/ipsj.pdf paper/ipsj.tex paper/scheduling.tex
diffstat 7 files changed, 11 insertions(+), 10 deletions(-) [+]
line wrap: on
line diff
--- a/paper/bibliography.tex	Tue Nov 05 09:07:32 2013 +0900
+++ b/paper/bibliography.tex	Tue Nov 26 03:41:45 2013 +0900
@@ -8,7 +8,7 @@
 {Daichi TOMA and Shinji KONO}:Cerium Task Manager におけるマルチコア上での並列実行機構の実装(2012)
 
 \bibitem{gongo:2008a}
-{nd Shinji KONO}:Cerium Task Manager におけるマルチコア上での並列実行機構の実装(2012)
+{Wataru MIYAGUNI,Shinji KONO}:Cell 用の Fine-grain Task Manager の実装
 
 \bibitem{opencl:ref}
 {Aaftab Munshi, Khronos OpenCL Working Group}:The OpenCL Specification Version 1.0 (2007)
--- a/paper/data_parallel.tex	Tue Nov 05 09:07:32 2013 +0900
+++ b/paper/data_parallel.tex	Tue Nov 26 03:41:45 2013 +0900
@@ -1,8 +1,7 @@
-\section{Ceriumにおけるデータ並列}\label{data_parallel}
+\section{新たに実装したCeriumにおけるデータ並列}\label{data_parallel}
 OpenCLで充分な並列度を得るには、データ並列による実行をサポートした方が良い。
 CeriumでOpenCLのデータ並列を使うために、iterateというAPIを用意した。
 
-ベンチマークをとるために、まずはCPU(many core)上でデータ並列の機構を実装した。
 OpenCLでデータ並列を行う際は、NDRangeの引数でワークアイテムのサイズを設定し、以下のようにkernelを書けばよい。
 
 \begin{Verbatim}[fontsize=\footnotesize,xleftmargin=1cm]
--- a/paper/fft_benchmark.tex	Tue Nov 05 09:07:32 2013 +0900
+++ b/paper/fft_benchmark.tex	Tue Nov 26 03:41:45 2013 +0900
@@ -4,8 +4,8 @@
 
 実験環境
 \begin{itemize}
-\item OS : MacOS 10.9
-\item CPU : 2*2.66GHz 6-CoreIntel Xeon
+\item OS : MacOS X 10.9
+\item CPU : 2x2.66GHz 6-CoreIntel Xeon
 \item Memory : 16GB
 \item Compiler : Apple clang version 4.1 (based on LLVM 3.1svn)
 \item GPU : AMD ATI Radeon HD 5870 1024MB
--- a/paper/introduction.tex	Tue Nov 05 09:07:32 2013 +0900
+++ b/paper/introduction.tex	Tue Nov 26 03:41:45 2013 +0900
@@ -1,5 +1,5 @@
 \section{研究の目的}
-当研究室では Cell および Linux 、Mac OS X 上で動く並列プログラミングフレームワーク、
+当研究室では PS3 および Linux 、Mac OS X 上で動く並列プログラミングフレームワーク、
  Cerium Task Manager \cite{gongo:2008a}の開発・改良を行っている。
  Cerium は普遍的に演算資源を利用できるフレームワークを目指している。
 Cell だけでなく、 GPU のような異なる種類のアーキテクチャを搭載した CPU 、
@@ -11,4 +11,6 @@
 しかし、GPUのみで並列計算を行った場合、Taskによっては並列度が出ない場合がある。
 そこで今回、データ並列によるTaskの実行と、MultiCore と GPU 上での同時実行を可能とした。
  Task を CPU と GPU の両方で動かす場合、どの Task を CPU/GPU に割り当てるかという Scheduling 等の問題がある。
- fft, sort, wordcount について実行速度を測定し、これらの問題の解決方法について考察する。
+ CPU と GPU ではTaskの実行速度に差が出ることが多い。
+ Task を CPU と GPU の両方で動かす場合、どの Task を CPU/GPU に割り当てるかという Scheduling 等の問題がある。
+ FFT を用いて実行速度を測定し、これらの問題の解決方法について考察する。
Binary file paper/ipsj.pdf has changed
--- a/paper/ipsj.tex	Tue Nov 05 09:07:32 2013 +0900
+++ b/paper/ipsj.tex	Tue Nov 26 03:41:45 2013 +0900
@@ -45,7 +45,7 @@
   Cerium Task Managerは並列プログラミングフレームワークである。
   今回、MultiCoreとGPU上での同時実行を可能とした。
   TaskをCPUとGPUの両方で動かす場合、どのTaskをCPU/GPUに割り当てるかというScheduling等の様々な問題がある。
-  fft,sort,wordcountについて実行速度を測定し、これらの問題の解決方法について考察する
+  FFT を用いて実行速度を測定し、これらの問題の解決方法について考察する
 \end{abstract}
 % 英文概要
 \begin{eabstract}
@@ -54,7 +54,7 @@
 In particular, it is necessary to implement the dependency of task in Cerium by the function of Open CL.
 But, to match specialization for OpenCL spoils of flexibility of framework. 
 Balance of flexibility and the performance is considered.
-We evaluate example  Sort, Word count, and FFT.
+We evaluate example FFT.
 
 \end{eabstract}
 
--- a/paper/scheduling.tex	Tue Nov 05 09:07:32 2013 +0900
+++ b/paper/scheduling.tex	Tue Nov 26 03:41:45 2013 +0900
@@ -1,4 +1,4 @@
-\section{CPUとGPUの同時実行}\label{scheduling}
+\section{新たに実装したCPUとGPUの同時実行}\label{scheduling}
 今回、 CPU と GPU 両方のデバイスで Task を実行させることに成功した。
 CPU と GPU で同時実行する場合、実行速度には差が出る。
  GPU はホスト側とPCIバスを通してデータの転送を行う。