changeset 3:7c4c34d2586a

add fft_benchmark
author Yuhi TOMARI <yuhi@cr.ie.u-ryukyu.ac.jp>
date Mon, 04 Nov 2013 15:42:34 +0900
parents 3a68ce4babfc
children e9872101e0ee
files paper/bib.tex paper/bibliography.tex paper/fft_benchmark.tex paper/introduction.tex paper/ipsj.pdf paper/ipsj.tex paper/opencl.tex
diffstat 7 files changed, 26 insertions(+), 12 deletions(-) [+]
line wrap: on
line diff
--- a/paper/bib.tex	Sun Nov 03 18:58:35 2013 +0900
+++ b/paper/bib.tex	Mon Nov 04 15:42:34 2013 +0900
@@ -1,2 +1,2 @@
 \bibliographystyle{ipsjunsrt}
-\bibliography{sigos}
+\bibliography{ipsj}
--- a/paper/bibliography.tex	Sun Nov 03 18:58:35 2013 +0900
+++ b/paper/bibliography.tex	Mon Nov 04 15:42:34 2013 +0900
@@ -10,6 +10,12 @@
 \bibitem{akira}
 {Akira KAMIZATO.}: Cell を用いたゲームフレームワークの提案,琉球大学工学部情報工学科平成19年度学位論文(修士) (2008).
 
+\bibitem{toma:2012a}
+{Daichi TOMA and Shinji KONO}:Cerium Task Manager におけるマルチコア上での並列実行機構の実装(2012)
+
+\bibitem{gogo:2008a}
+{nd Shinji KONO}:Cerium Task Manager におけるマルチコア上での並列実行機構の実装(2012)
+
 \bibitem{amdahl}
 {Brian Goetz, Tim Peierls, Joshua Bloch, Joseph Bowbeer, David Holmes, and Doug
   Lea.}: Java Concurrency in Prac-tice, {\em Addison-Wesley Professional}
--- /dev/null	Thu Jan 01 00:00:00 1970 +0000
+++ b/paper/fft_benchmark.tex	Mon Nov 04 15:42:34 2013 +0900
@@ -0,0 +1,13 @@
+\section{データ並列実行のベンチマーク}\label{fft_benchmark}
+続いて、フーリエ変換と周波数フィルタによる画像処理を行う例題を用いてベンチマークを行った。
+512*512, 768*768, 1024*1024の画像を High Pass Filter で変換する例題である。
+これも GPU, CPU 上, 及び CPU + GPU 上で同時実行して比較を行った。
+
+実験環境
+\begin{itemize}
+\item OS : MacOS 10.9
+\item CPU : 2*2.66GHz 6-CoreIntel Xeon
+\item Memory : 16GB
+\item Compiler : Apple clang version 4.1 (based on LLVM 3.1svn)
+\item GPU : AMD ATI Radeon HD 5870 1024MB
+\end{itemize}
--- a/paper/introduction.tex	Sun Nov 03 18:58:35 2013 +0900
+++ b/paper/introduction.tex	Mon Nov 04 15:42:34 2013 +0900
@@ -9,6 +9,6 @@
  Cerium は演算資源として GPU の使用が可能である。
 
 しかし、GPUのみで並列計算を行った場合、Taskによっては並列度が出ない場合がある。
-そこで今回、MultiCore と GPU 上での同時実行を可能とした。
+そこで今回、データ並列によるTaskの実行と、MultiCore と GPU 上での同時実行を可能とした。
  Task を CPU と GPU の両方で動かす場合、どの Task を CPU/GPU に割り当てるかという Scheduling 等の問題がある。
  fft, sort, wordcount について実行速度を測定し、これらの問題の解決方法について考察する。
Binary file paper/ipsj.pdf has changed
--- a/paper/ipsj.tex	Sun Nov 03 18:58:35 2013 +0900
+++ b/paper/ipsj.tex	Mon Nov 04 15:42:34 2013 +0900
@@ -66,6 +66,8 @@
 \input{cerium}         % Cerium
 \input{opencl}           % Open  CL
 \input{cerium_gpu}     % GPU上での実行の機構
+\input{data_parallel}
+\input{fft_benchmark}
 \input{benchmark1}
 \input{scheduling}
 \input{conclusion}     % まとめ
@@ -80,9 +82,9 @@
 \nocite{opencl:applied}
 \nocite{yutaka:os}
 \bibliographystyle{ipsjunsrt}
-\bibliography{sigos}
-%\bibliography{cerium,book}
-%\input{bibliography}   % 参考文献
+\bibliography{ipsj}
+\bibliography{cerium,book}
+\input{bibliography}   % 参考文献
 
 
 \end{document}
--- a/paper/opencl.tex	Sun Nov 03 18:58:35 2013 +0900
+++ b/paper/opencl.tex	Mon Nov 04 15:42:34 2013 +0900
@@ -93,13 +93,6 @@
 
 なお、 work\_group を設定した場合は global\_id の他に work\_group\_id 、local\_id が
 それぞれの kernel に割り当てられる(図:\ref{fig:workitem_id})。
-\begin{figure}[htb]
-  \begin{center}
-    \includegraphics[scale=0.60]{./images/workitem.pdf}
-  \end{center}
-  \caption{WorkItem ID}
-  \label{fig:workitem_id}
-\end{figure}
 
 なお、work\_groupを設定した場合はglobal\_idの他にwork\_group\_id、local\_idが
 それぞれのkernelに割り当てられる(図:\ref{fig:workitem_id})。