# HG changeset patch # User Shohei KOKUBO # Date 1383742015 -32400 # Node ID 208ca954df5642ca6a3de518e39c0971347ea51a # Parent 8c37fee421421b92a52396cc25aa993a9bc1b2f1 fix diff -r 8c37fee42142 -r 208ca954df56 paper/bibliography.tex --- a/paper/bibliography.tex Wed Nov 06 21:09:42 2013 +0900 +++ b/paper/bibliography.tex Wed Nov 06 21:46:55 2013 +0900 @@ -1,4 +1,3 @@ - \begin{thebibliography}{10} \bibitem{akira} @@ -13,20 +12,9 @@ \bibitem{opencl:ref} {Aaftab Munshi, Khronos OpenCL Working Group}:The OpenCL Specification Version 1.0 (2007) -\bibitem{cell} -{Sony Corporation.}: {\em Cell broadband engine architecture} (2005). - -\bibitem{spurs} -{Keisuke INOUE.}: Cell プロセッサ向け実行環境(SPU Centric Execution - Model),先進的計算基盤システムシンポジウム SACSIS (2006). - \bibitem{kono} {Shinji KONO.}: 検証を自身で表現できるハードウェア、ソフトウェア記述言語 Continuation ba sed C と、その Cell への応用,電子情報通信学会VLSI設計技術研究会 (2008). -\bibitem{fuchita} -{Yoshihiko, FUCHITA.}: 分散プログラミングモデル Federated Linda - と分散デバッグ開発,琉球大学工学部情報工学科平成19年度学位論文(修士) (2008). - \end{thebibliography} diff -r 8c37fee42142 -r 208ca954df56 paper/conclusion.tex --- a/paper/conclusion.tex Wed Nov 06 21:09:42 2013 +0900 +++ b/paper/conclusion.tex Wed Nov 06 21:46:55 2013 +0900 @@ -1,5 +1,6 @@ \section{まとめ} -本研究では Cerium Task Manager を Data 並列による実行に対応させ,更に benchmark も行った。 -これにより,大量の Data に対して同一の処理を繰り返し行う Task を簡単に記述できるようになった。 +本研究では Cerium Task Manager を Data 並列による実行に対応させ,Cerium 上で fft の実行を可能にした。 +更に,benchmark を取り,iterate API の性能を測定した。 +また,大量の Data に対して同一の処理を繰り返し行う Task の生成を OpenCL と同様に一つの記述で済むようにした。 しかし,実行時に並列度が充分に出ているとは言えない。 -index の割り当てや例題の選定等、チューニングが必要である。 +性能を向上させるためには, Task の終了を待つ CPU が出ないように,途中で Task を終了させ,Scheduling し直し Task を再投入する機能などの実装が必要である。 diff -r 8c37fee42142 -r 208ca954df56 paper/fft_benchmark.tex --- a/paper/fft_benchmark.tex Wed Nov 06 21:09:42 2013 +0900 +++ b/paper/fft_benchmark.tex Wed Nov 06 21:46:55 2013 +0900 @@ -29,6 +29,8 @@ \hline 8 CPU&117 ms \\ \hline + GPU&94 ms \\ + \hline \end{tabular} \end{center} \end{table} @@ -38,4 +40,4 @@ 1 CPU を利用した場合と比較して,2 CPU では約 1.7 倍,GPU では約 4.8 倍の速度向上が見られる。 しかしながら,8 CPU を利用した場合,4 CPU を利用した場合と比較して速度はあがっているが速度上昇率は約 1.5 倍に落ちている。 これはアムダールの法則から,並列化率が低いために速度向上が頭打ちになっていると考えられる。 -並列化率が低いのは,iterate で登録された Task が終了されるまで次の Task を実行することが出来ず,表\ref{table:data_parallel_index}のような index 割り当てだと Task の終了時間にばらつきが出て CPU の Utilization が低くなってることが考えられる。 +原因は,iterate で登録された Task が終了されるまで次の Task を実行することが出来ず,表\ref{table:data_parallel_index}のような index 割り当てだと Task の終了時間にばらつきが出て CPU の Utilization が低くなっていることが予想される。 diff -r 8c37fee42142 -r 208ca954df56 paper/ipsjpapers.sty --- a/paper/ipsjpapers.sty Wed Nov 06 21:09:42 2013 +0900 +++ b/paper/ipsjpapers.sty Wed Nov 06 21:46:55 2013 +0900 @@ -457,7 +457,7 @@ \let\fs@footnote\footnotesize \let\fs@caption\footnotesize \let\fs@table\footnotesize -\let\fs@eabst\footnotesize +%\let\fs@eabst\footnotesize \let\fs@header\footnotesize \let\fs@footer\footnotesize \let\fs@bibliography\small @@ -503,7 +503,7 @@ \let\fs@caption\footnotesize \let\fs@table\footnotesize \let\fs@abst\small -\def\fs@eabst{\small\baselineskip13\@Q} +%\def\fs@eabst{\small\baselineskip13\@Q} \let\fs@header\small \let\fs@footer\small \let\fs@subsec\normalsize @@ -689,17 +689,17 @@ \long\def\eauthor#1{\long\gdef\@eauthor{#1}} \def\@eauthor{\mkt@warning\eauthor} -\newbox\@eabstractbox -\def\eabstract{\global\let\@eabstract\relax - \global\setbox\@eabstractbox\hbox\bgroup - \begin{minipage}[b]{\@titlewidth}\fs@eabst\parindent11\@Q} -\let\endeabstract\endabstract -\def\@eabstract{\mkt@warning{eabstract env}} +%% \newbox\@eabstractbox +%% \def\eabstract{\global\let\@eabstract\relax +%% \global\setbox\@eabstractbox\hbox\bgroup +%% \begin{minipage}[b]{\@titlewidth}\fs@eabst\parindent11\@Q} +%% \let\endeabstract\endabstract +%% \def\@eabstract{\mkt@warning{eabstract env}} -\ifDS@english -\let\author\eauthor \let\abstract\eabstract -\let\@eauthor\@author \let\@eabstract\@abstract -\fi +%% \ifDS@english +%% \let\author\eauthor \let\abstract\eabstract +%% \let\@eauthor\@author \let\@eabstract\@abstract +%% \fi \def\mkt@warning#1{\ipsj@warning{Missing \string#1}} % 2.00(3) @@ -761,10 +761,10 @@ \vskip-\mkt@prevdepth \nointerlineskip\vskip28\@Q \centerline{\vbox{\centering\hsize\@titlewidth\fs@eauthor\sc \mkt@makeeauthor}} - \fi - \ifDS@preface\else - \vskip-\prevdepth \nointerlineskip\vskip28\@Q - \centerline{\@eabstract\box\@eabstractbox} + %% \fi + %% \ifDS@preface\else + %% \vskip-\prevdepth \nointerlineskip\vskip28\@Q + %% \centerline{\@eabstract\box\@eabstractbox} \fi \vskip-\prevdepth \nointerlineskip\vskip25\@Q} \@tempdimb\ht\mkt@titlebox \advance\@tempdimb\dp\mkt@titlebox