Papers/2010/kent-master: evaluations.tex comparison

comparison evaluations.tex @ 4:30c102343b37

modify gcc. fix references.

author	kent <kent@cr.ie.u-ryukyu.ac.jp>
date	Sat, 06 Feb 2010 18:28:43 +0900
parents	50e23a4b2f40
children	dfb89e32eea1

comparison

equal deleted inserted replaced

-:d2999e94b97d
+:30c102343b37
 \end{itemize}
 なお、mcはmips,armにも対応しているが、現在その処理系が用意できなかった
 ので割愛している。また、GCC-4.2.3ベースコンパイラはppcでは実行不能であ
 ったためx86のみとなる。
-各評価マシンの詳細は付録\ref{sec:}に掲載する。
+各評価マシンの詳細は付録\ref{sec:machine-specs}に掲載する。
 %gccのコンパイルでは``-O2 -fomit-pointer''の最適化を付加して測定している。
 % noreturnもON.
 % x86ではfastcallもON,
 \subsection{評価結果}
-実効速度の測定結果を表\ref{tab:eval-speed}に示す。
+実効速度の測定結果を表\ref{tab:speed-mc-vs-gcc}に示す。
 ただし環境毎にCPU速度は異なるので、上下の比較には意味はない。
 % -O2で約10秒になる要素数を選んだ方がいいかもしれない
 \begin{table}[htpb]
 \centering
 \begin{tabular}{|c|c|c|c|c|} \hline
 ppc/OS X  &14.875 & 2.146 & 2.170 & 4.811 \\ \hline
 ppc/Linux &19.793 & 3.955 & 4.013 & 6.454 \\ \hline
 ppc/PS3   &39.176 & 5.874 & 6.111 &11.121 \\ \hline
 \end{tabular}
 \caption{アーキテクチャ毎のgccとmcの速度比較（単位: 秒）}
-\label{tab:eval-speed}
+\label{tab:speed-mc-vs-gcc}
 \end{table}
 次に実行ファイルのstrip前のファイルサイズを表\ref{tab:eval-nostrip}
 に、strip後のファイルサイズを表\ref{tab:eval-strip}に示す。
 \end{tabular}
 \caption{実行ファイルのファイルサイズ比較 stripped（単位: bytes）}
 \label{tab:eval-strip}
 \end{table}
-最後に、本研究での実装GCC-4.4.2と以前のバージョンGCC-4.2.3との比較であ
+最後に、本研究での実装GCC-4.4.2と以前のバージョンGCC-4.2.3との比較を表
-る。こちらはx86のみ、最適化も-Osは対応していない。
+\ref{tab:speed-old-vs-new}に示す。こちらはx86のみ、最適化も-Osは対応し
+ていない。
 \begin{table}[htpb]
 \centering
 \begin{tabular}{|c|c|c|c|c|} \hline
 \multirow{2}{*}{ \backslashbox{CPU/OS}{コンパイラ}  }
 & \multicolumn{2}{c|}{CbC on GCC-4.4.2} &
 &  -O0  &  -O2  &  -O0  &  -O2  \\ \hline
 x86/OS X  & 5.907 & 2.434 & 4.668 & 3.048 \\ \hline
 x86/Linux & 5.715 & 2.401 & 4.525 & 2.851 \\ \hline
 \end{tabular}
 \caption{GCC-4.2.3ベースとGCC-4.4.2ベースの速度比較（単位: 秒）}
-\label{tab:eval-speed}
+\label{tab:speed-old-vs-new}
 \end{table}
 % ppcのが圧倒的に早い
 % x86ではあまりさはでない
 まずは速度面からこの測定結果を考察する。
 まずどのアーキテクチャにおいても、GCCの最適化が大きな速度差を生み出し
 ている事が分かる。最適化なしと速度最適化を比較すると、x86では2.4倍、
 ppcでは5〜7倍もの差が生じている。
-ただしppcのこの以上な速度差は\ref{ssec:}並列代入で示した様に、継続の引
+ただしppcのこの以上な速度差は\ref{sec:impl-parallel}並列代入で示した様に、継続の引
 数を全て一時変数に入れていることが大きい。その場合最適化なしではすべて
 の引数を一度メモリに確保するので、その分逆に遅くなっているのだと考えら
 れる。しかしながら最適化を有効にすることでそのメモリへの一時変数の確保
 も解消されるということが分かった。

Mercurial > hg > Papers > 2010 > kent-master

comparison evaluations.tex @ 4:30c102343b37