# HG changeset patch # User Yuhi TOMARI # Date 1383547354 -32400 # Node ID 7c4c34d2586a0c33790a45274d128d4322389201 # Parent 3a68ce4babfc5520402256819b248e4450484396 add fft_benchmark diff -r 3a68ce4babfc -r 7c4c34d2586a paper/bib.tex --- a/paper/bib.tex Sun Nov 03 18:58:35 2013 +0900 +++ b/paper/bib.tex Mon Nov 04 15:42:34 2013 +0900 @@ -1,2 +1,2 @@ \bibliographystyle{ipsjunsrt} -\bibliography{sigos} +\bibliography{ipsj} diff -r 3a68ce4babfc -r 7c4c34d2586a paper/bibliography.tex --- a/paper/bibliography.tex Sun Nov 03 18:58:35 2013 +0900 +++ b/paper/bibliography.tex Mon Nov 04 15:42:34 2013 +0900 @@ -10,6 +10,12 @@ \bibitem{akira} {Akira KAMIZATO.}: Cell を用いたゲームフレームワークの提案,琉球大学工学部情報工学科平成19年度学位論文(修士) (2008). +\bibitem{toma:2012a} +{Daichi TOMA and Shinji KONO}:Cerium Task Manager におけるマルチコア上での並列実行機構の実装(2012) + +\bibitem{gogo:2008a} +{nd Shinji KONO}:Cerium Task Manager におけるマルチコア上での並列実行機構の実装(2012) + \bibitem{amdahl} {Brian Goetz, Tim Peierls, Joshua Bloch, Joseph Bowbeer, David Holmes, and Doug Lea.}: Java Concurrency in Prac-tice, {\em Addison-Wesley Professional} diff -r 3a68ce4babfc -r 7c4c34d2586a paper/fft_benchmark.tex --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/paper/fft_benchmark.tex Mon Nov 04 15:42:34 2013 +0900 @@ -0,0 +1,13 @@ +\section{データ並列実行のベンチマーク}\label{fft_benchmark} +続いて、フーリエ変換と周波数フィルタによる画像処理を行う例題を用いてベンチマークを行った。 +512*512, 768*768, 1024*1024の画像を High Pass Filter で変換する例題である。 +これも GPU, CPU 上, 及び CPU + GPU 上で同時実行して比較を行った。 + +実験環境 +\begin{itemize} +\item OS : MacOS 10.9 +\item CPU : 2*2.66GHz 6-CoreIntel Xeon +\item Memory : 16GB +\item Compiler : Apple clang version 4.1 (based on LLVM 3.1svn) +\item GPU : AMD ATI Radeon HD 5870 1024MB +\end{itemize} diff -r 3a68ce4babfc -r 7c4c34d2586a paper/introduction.tex --- a/paper/introduction.tex Sun Nov 03 18:58:35 2013 +0900 +++ b/paper/introduction.tex Mon Nov 04 15:42:34 2013 +0900 @@ -9,6 +9,6 @@ Cerium は演算資源として GPU の使用が可能である。 しかし、GPUのみで並列計算を行った場合、Taskによっては並列度が出ない場合がある。 -そこで今回、MultiCore と GPU 上での同時実行を可能とした。 +そこで今回、データ並列によるTaskの実行と、MultiCore と GPU 上での同時実行を可能とした。 Task を CPU と GPU の両方で動かす場合、どの Task を CPU/GPU に割り当てるかという Scheduling 等の問題がある。 fft, sort, wordcount について実行速度を測定し、これらの問題の解決方法について考察する。 diff -r 3a68ce4babfc -r 7c4c34d2586a paper/ipsj.pdf Binary file paper/ipsj.pdf has changed diff -r 3a68ce4babfc -r 7c4c34d2586a paper/ipsj.tex --- a/paper/ipsj.tex Sun Nov 03 18:58:35 2013 +0900 +++ b/paper/ipsj.tex Mon Nov 04 15:42:34 2013 +0900 @@ -66,6 +66,8 @@ \input{cerium} % Cerium \input{opencl} % Open CL \input{cerium_gpu} % GPU上での実行の機構 +\input{data_parallel} +\input{fft_benchmark} \input{benchmark1} \input{scheduling} \input{conclusion} % まとめ @@ -80,9 +82,9 @@ \nocite{opencl:applied} \nocite{yutaka:os} \bibliographystyle{ipsjunsrt} -\bibliography{sigos} -%\bibliography{cerium,book} -%\input{bibliography} % 参考文献 +\bibliography{ipsj} +\bibliography{cerium,book} +\input{bibliography} % 参考文献 \end{document} diff -r 3a68ce4babfc -r 7c4c34d2586a paper/opencl.tex --- a/paper/opencl.tex Sun Nov 03 18:58:35 2013 +0900 +++ b/paper/opencl.tex Mon Nov 04 15:42:34 2013 +0900 @@ -93,13 +93,6 @@ なお、 work\_group を設定した場合は global\_id の他に work\_group\_id 、local\_id が それぞれの kernel に割り当てられる(図:\ref{fig:workitem_id})。 -\begin{figure}[htb] - \begin{center} - \includegraphics[scale=0.60]{./images/workitem.pdf} - \end{center} - \caption{WorkItem ID} - \label{fig:workitem_id} -\end{figure} なお、work\_groupを設定した場合はglobal\_idの他にwork\_group\_id、local\_idが それぞれのkernelに割り当てられる(図:\ref{fig:workitem_id})。