changeset 32:5ac27091f43b

modify benchmark comment
author Daichi Toma <toma@cr.ie.u-ryukyu.ac.jp>
date Mon, 21 Nov 2011 20:48:48 +0900
parents 5bae9ef745a1
children b613f75e04ad
files Paper/prosym.pdf Paper/prosym.tex
diffstat 2 files changed, 24 insertions(+), 5 deletions(-) [+]
line wrap: on
line diff
Binary file Paper/prosym.pdf has changed
--- a/Paper/prosym.tex	Mon Nov 21 20:10:03 2011 +0900
+++ b/Paper/prosym.tex	Mon Nov 21 20:48:48 2011 +0900
@@ -152,8 +152,8 @@
 今回新たに, Mac OS X, Linux 上でも並列に実行させることを可能にした.
 これは, PlayStation 3/Cell の Mailbox に対応させる形で, 
 Synchronized Queue を用いて Mac OS X, Linux 側の Cerium Task Manager へ移植したものである.
-また, PlayStation 3/Cell と違い各 CPU で同じメモリ空間が利用できるため, DMA転送を用いていた箇所をポインタ渡しをするように修正し, 
-速度の向上を図った.
+また, PlayStation 3/Cell と違い各 CPU で同じメモリ空間が利用できるため,
+DMA転送を用いていた箇所をポインタ渡しをするように修正し, 速度の向上を図った.
 
 % \subsection{Mailbox}
 % Mailbox は, Cell の機能の1つである.
@@ -172,12 +172,22 @@
 表\ref{table:benchmark}に結果を示す.
 
 {\bf 実験環境}
+
+Linux
 \begin{itemize}
 \item OS : CentOS 6.0
 \item CPU : Intel\textregistered Xeon\textregistered X5650 @2.67GHz * 2
 \item Memory : 128GB
+\item Compiler : GCC 4.4.4
 \end{itemize}
 
+PlayStation 3
+\begin{itemize}
+\item OS : Yellow Dog Linux 6.1
+\item CPU : Cell Broadband Engine @ 3.2GHz
+\item Memory : 256MB
+\item Compiler : GCC 4.1.2
+\end{itemize}
 
 \begin{table}[h]
 \begin{center}
@@ -204,7 +214,7 @@
 \end{center}
 \end{table}
 
-また, 図\ref{fig:multi_result}に各例題をスレッド数を変更して実行した結果を示す.
+% また, 図\ref{fig:multi_result}に各例題をスレッド数を変更して実行した結果を示す.
 % 図\ref{fig:cell_result}は, PlayStation 3/Cell 上で同様の例題を動かしたものである.
 
 % \begin{figure}[h]
@@ -223,14 +233,23 @@
 % \label{fig:cell_result}
 % \end{figure}
 
-表\ref{table:benchmark}より, Playstation 3/Cell と比較して, 十分に速い結果が出ていることが確認できる.
+表\ref{table:benchmark}より, Playstation 3/Cell と比較して十分に速い結果が出ていることが確認できる.
+また, 6 CPU を利用した時, 1 CPU を利用した時と比較して台数効果が確認できる.
+しかしながら, 24 CPU を利用した時, 12 CPU を利用した時と比較して速度は上がっているが速度向上率が十分ではない.
+これはアムダールの法則\cite{amdahl}より, 並列化率が低いために速度向上が頭打ちになっていると考えられる.
+
 % また, 図\ref{fig:multi_result}より, 台数効果が確認できる.
 
 \section{まとめ}
 本稿では, 既存の Cerium Task Manager の実装と新しい並列実行の機構について説明した.
 新しく実装した並列実行の機構を用いることによって, Mac OS X, Linux 上でのマルチプロセッサ環境に対応できる. 
 
-\nocite{yutaka:2010a, cell_abi, opencl}
+\section{今後の課題}
+現在の Cerium Task Manager は, Task の種類が増え, Open CL\cite{opencl} に比べても記述が煩雑であるなどの欠点がある.
+これは Task の依存関係を, ユーザ側ではなくシステム側が記述するようにすることで解決できると考える.
+
+
+\nocite{cell_abi}
 \bibliographystyle{junsrt}
 \bibliography{cerium.bib,book.bib}