Papers/2010/kent-master: evaluations.tex annotate

annotate evaluations.tex @ 2:50e23a4b2f40

add many files.

author	kent <kent@cr.ie.u-ryukyu.ac.jp>
date	Fri, 05 Feb 2010 10:00:05 +0900
parents	aa09c34b90d3
children	30c102343b37

rev	line source
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	1 \chapter{評価・考察}
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	2 \label{chp:eval}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	3
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	4 本章では本研究の評価を行う。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	5 まず、gccでのCbCコンパイルにおける利点と欠点を考察する。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	6 次にgccベースのCbCコンパイラの性能評価を行う。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	7 最後に、\ref{chp:task}章のTaskManagerの開発を元に、CbC言語そのものの記述性、プログラミング手法などについて考察する。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	8
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	9
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	10 \section{gccを使うことの利点・欠点}
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	11 \label{sec:merit}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	12
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	13 これまでCbCのコンパイルに使用してきたmc(micro-c)に対し、新しくgccが
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	14 CwCのフルセットとして使用可能となった。ここでgccを用いることの利点と欠
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	15 点について考察する。
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	16
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	17 \subsection*{アーキテクチャ}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	18
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	19 mcにおいてはPPC,x86,MIPS,ARM,SPUなど、多数のCPUアーキテクチャをサポー
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	20 トしてきた。しかしあるCPUに新しく対応するには多大な時間、労力が必要と
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	21 なる。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	22 gccは現在、既に20を越えるCPUに対応しており、またOS毎のABIの差異も吸収
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	23 可能である。これはgccをコンパイラとすることに最大の利点である。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	24
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	25 またそれだけでなく、gccは新しいアーキテクチャへの対応も早い。この特徴
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	26 は、gccがフロントエンドとバックエンドという形で言語実装とアーキテクチ
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	27 ャを分離していることからくる。一般的に新しいCPUアーキテクチャが開発さ
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	28 れた場合にはその開発者自身がgccにコミットすることが多いため、組み込み
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	29 用途を目的の一つとするCbCではよりその強みがます。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	30
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	31 \subsection*{最適化の恩恵}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	32 gccは豊富な最適化機構を備えている。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	33 代表的な最適化だけでもループ最適化、分岐スレッディング(jump threading)
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	34 、共通式除去(common subexpression elimination)、命令スケジューリング
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	35 (instruction scheduling)などがある。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	36
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	37 とくに、プログラムにおいては類似した形の式(expression)を扱うことがよく
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	38 あるため、共通式除去は非常に効果が高い。同様の効果は同じ式を保持する変
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	39 数を用意することでも実現できるがソースコードの修正が必要になる。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	40 mcにはこの最適化は含まれていないため、複雑な計算式を含むプログラムにお
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	41 いてはgccの方が良いコンパイル結果を示すものと考えられる。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	42
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	43 %\ref{sec:}の性能評価では最適化の効果についても測定する。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	44
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	45 \subsection*{デバッガ}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	46 これまでCbCにはデバッガが存在しなかった。デバッガの実装には出力するア
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	47 センブラに行番号や変数名、関数名などの情報を付加する必要があるが、gcc
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	48 は標準でこれを行っている。そのためCのデバッガとして広く一般的に使われ
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	49 ている gdbをそのままCbCのデバッガとして使用することが可能であり、ソフ
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	50 トウェア開発の大きな助力となる。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	51
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	52 %ただし継続制御では``next''コマンドが使いづらいなどの操作性の問題がいく
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	53 %つか確認している。これらは
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	54
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	55 %
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	56 \subsection*{関数呼出しの名残り}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	57 上記の利点に対し、gccであるゆえの欠点も存在する。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	58
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	59 本研究による軽量継続制御の実装には\ref{chp:impl}章で説明したように関数
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	60 の末尾最適化を利用した。それゆえコードセグメントのアセンブラ出力の命令
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	61 列には一部関数呼び出し時のスタック処理が残ってしまうことが分かっている。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	62 特にレジスタの少ないアーキテクチャ、x86などではそれが顕著に現れる。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	63
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	64 mcではコードセグメントと関数は完全に別物として取り扱っており、この様な
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	65 スタック操作はコードセグメントには現れないため、このオーバヘッドがgcc
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	66 では不利な点である。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	67
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	68 % TODO: 取り除くには…
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	69
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	70 % スタック処理が残ってしまう
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	71 % 同じくcpuに特化したコンパイルに比べると
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	72
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	73
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	74 \subsection*{互換性、ABI}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	75 %これは最後の考察に入れよう
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	76 ソースコードレベルでの互換性の問題がある。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	77 また、継続制御のパラメタを
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	78 % 関数宣言
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	79 % 型推定
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	80 % ABI、特にppc
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	81
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	82
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	83 % 最適化
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	84 % SPUでのベクトル演算
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	85 % gdb
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	86 % architecture
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	87
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	88 % 関数呼び出しのオーバヘッド
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	89 % 互換性,ソースコード、ABI
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	90
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	91
1 aa09c34b90d3 add quicksort_for_pcc kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	92
aa09c34b90d3 add quicksort_for_pcc kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	93
aa09c34b90d3 add quicksort_for_pcc kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	94
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	95 \section{性能評価}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	96
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	97 \subsection{評価項目、比較対象}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	98 コンパイラの出力した実行ファイルを複数回実行し、その実効速度を測定する
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	99 。CbCは実用的なプログラムの記述を目的としているので、プログラムの動作
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	100 速度は性能の評価として妥当だと考えられる。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	101
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	102 またもう一つの項目として、出力した実行ファイルのファイルサイズも評価す
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	103 る。一般的なプログラムではファイルサイズを気にすることは少ないが、CbC
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	104 の用途には組み込みなども考えられているため、ファイルサイズの影響は大き
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	105 い。比較する際はstripコマンドを用いてデバグ情報等を取り除いている。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	106 %SPUはm..
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	107
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	108 実効速度、ファイルサイズの比較対象として2つ用意した。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	109 一つは過去の研究でのGCCベースコンパイラ、つまり今回の改善を含めてない
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	110 ものである。こちらはGCCのバージョン4.2.3をベースとしている。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	111
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	112 もう一つの比較対象にはmicro-cベースのコンパイラ（以下mc）を用いる。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	113 さらにGCCでは最適化による効果も評価するため、
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	114 \begin{inparaenum}[\itshape 1)\ttfamily]
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	115 \item 最適化なし ``-O0''
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	116 \item 速度最適化 ``-O2 -fomit-framepointer''
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	117 \item サイズ最適化 ``-Os''
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	118 \end{inparaenum}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	119 についてもそれぞれ比較する。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	120
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	121 \subsection{評価手法と環境}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	122 実行するプログラムとして、クイックソートのテストプログラムを作成した。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	123 クイックソートは再帰呼び出しを伴うため、スタック操作が必須となる。その
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	124 ためより様々な状態でコードセグメントへの継続制御が使用されることになり、
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	125 CbCの性能評価に適していると考えられる。クイックソートはCbCに先立ってC
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	126 で実装し、参考文献\cite{bib:kinjo-2005}で紹介する手法を用いてCbCに変換
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	127 した。このプログラムは付録\ref{apx:quicksort}に添付する。
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	128
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	129 測定環境は両コンパイラが対応しているアーキテクチャ、OSから以下の5つの
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	130 組み合わせ[CPUアーキテクチャ/OS種別]を選択した。
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	131 \begin{itemize}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	132 \item ppc/OS X
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	133 \item ppc/linux
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	134 \item ppc/linux on PS3
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	135 \item x86/OS X
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	136 \item x86/linux
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	137 \end{itemize}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	138 なお、mcはmips,armにも対応しているが、現在その処理系が用意できなかった
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	139 ので割愛している。また、GCC-4.2.3ベースコンパイラはppcでは実行不能であ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	140 ったためx86のみとなる。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	141
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	142 各評価マシンの詳細は付録\ref{sec:}に掲載する。
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	143
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	144 %gccのコンパイルでは``-O2 -fomit-pointer''の最適化を付加して測定している。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	145 % noreturnもON.
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	146 % x86ではfastcallもON,
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	147
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	148 \subsection{評価結果}
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	149 実効速度の測定結果を表\ref{tab:eval-speed}に示す。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	150 ただし環境毎にCPU速度は異なるので、上下の比較には意味はない。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	151 % -O2で約10秒になる要素数を選んだ方がいいかもしれない
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	152 \begin{table}[htpb]
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	153 \centering
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	154 \begin{tabular}{\|c\|c\|c\|c\|c\|} \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	155 \multirow{2}{*}{ \backslashbox{CPU/OS}{コンパイラ} }
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	156 & \multicolumn{3}{c\|}{gcc} & \multirow{2}{*}{mc} \\ \cline{2-4}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	157 &最適化なし&速度最適化&サイズ最適化& \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	158 x86/OS X & 5.901 & 2.434 & 2.785 & 2.857 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	159 x86/Linux & 5.732 & 2.401 & 2.876 & 2.254 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	160 ppc/OS X &14.875 & 2.146 & 2.170 & 4.811 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	161 ppc/Linux &19.793 & 3.955 & 4.013 & 6.454 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	162 ppc/PS3 &39.176 & 5.874 & 6.111 &11.121 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	163 \end{tabular}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	164 \caption{アーキテクチャ毎のgccとmcの速度比較（単位: 秒）}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	165 \label{tab:eval-speed}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	166 \end{table}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	167
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	168 次に実行ファイルのstrip前のファイルサイズを表\ref{tab:eval-nostrip}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	169 に、strip後のファイルサイズを表\ref{tab:eval-strip}に示す。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	170
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	171 \begin{table}[htpb]
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	172 \centering
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	173 \begin{tabular}{\|c\|c\|c\|c\|c\|c\|} \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	174 \multirow{3}{*}{ \backslashbox{CPU/OS}{コンパイラ} }
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	175 & \multicolumn{4}{c\|}{GCC} & \multirow{3}{*}{mc} \\ \cline{2-5}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	176 & \multicolumn{2}{c\|}{デバグ情報(-g)付き} & \multicolumn{2}{c\|}{デバグ情報なし} & \\ \cline{2-5}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	177 & -O2 & -Os & -O2 & -Os & \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	178 x86/OS X & 11100 & 11100 & 9804 & 9804 & 11136 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	179 x86/Linux & 18444 & 17310 & 8216 & 8214 & 9844 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	180 ppc/OS X & 10392 & 10392 & 9172 & 9172 & 14396 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	181 ppc/Linux & 25138 & 23876 & 13030 & 13028 & 15453 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	182 ppc/PS3 & 22142 & 20452 & 9906 & 9672 & 15463 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	183 \end{tabular}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	184 \caption{実行ファイルのファイルサイズ比較 not stripped（単位: bytes）}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	185 \label{tab:eval-nostrip}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	186 \end{table}
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	187 \begin{table}[htpb]
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	188 \centering
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	189 \begin{tabular}{\|c\|c\|c\|c\|} \hline
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	190 \multirow{2}{*}{ \backslashbox{CPU/OS}{コンパイラ} }
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	191 & \multicolumn{2}{c\|}{GCC} & \multirow{2}{*}{mc} \\ \cline{2-3}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	192 & -O2 & -Os & \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	193 x86/OS X & 9176 & 9176 & 9172 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	194 x86/Linux & 5752 & 5752 & 5796 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	195 ppc/OS X & 8576 & 8576 & 12664 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	196 ppc/Linux & 10068 & 10068 & 9876 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	197 ppc/PS3 & 6960 & 6728 & 8636 \\ \hline
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	198 \end{tabular}
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	199 \caption{実行ファイルのファイルサイズ比較 stripped（単位: bytes）}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	200 \label{tab:eval-strip}
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	201 \end{table}
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	202
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	203 最後に、本研究での実装GCC-4.4.2と以前のバージョンGCC-4.2.3との比較であ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	204 る。こちらはx86のみ、最適化も-Osは対応していない。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	205 \begin{table}[htpb]
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	206 \centering
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	207 \begin{tabular}{\|c\|c\|c\|c\|c\|} \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	208 \multirow{2}{*}{ \backslashbox{CPU/OS}{コンパイラ} }
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	209 & \multicolumn{2}{c\|}{CbC on GCC-4.4.2} &
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	210 \multicolumn{2}{c\|}{CbC on GCC-4.2.3} \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	211 & -O0 & -O2 & -O0 & -O2 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	212 x86/OS X & 5.907 & 2.434 & 4.668 & 3.048 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	213 x86/Linux & 5.715 & 2.401 & 4.525 & 2.851 \\ \hline
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	214 \end{tabular}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	215 \caption{GCC-4.2.3ベースとGCC-4.4.2ベースの速度比較（単位: 秒）}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	216 \label{tab:eval-speed}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	217 \end{table}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	218
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	219
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	220 % ppcのが圧倒的に早い
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	221 % x86ではあまりさはでない
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	222 % 最適化が効いている
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	223 % TODO: ファイルサイズの比較
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	224 % SPUに送るのに有利
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	225 % コンパイルにかかる時間？
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	226
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	227 \subsection{評価結果考察}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	228 % stripするとx86はサイズに変化がない
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	229 \subsubsection{速度面}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	230 まずは速度面からこの測定結果を考察する。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	231
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	232 まずどのアーキテクチャにおいても、GCCの最適化が大きな速度差を生み出し
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	233 ている事が分かる。最適化なしと速度最適化を比較すると、x86では2.4倍、
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	234 ppcでは5〜7倍もの差が生じている。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	235 ただしppcのこの以上な速度差は\ref{ssec:}並列代入で示した様に、継続の引
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	236 数を全て一時変数に入れていることが大きい。その場合最適化なしではすべて
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	237 の引数を一度メモリに確保するので、その分逆に遅くなっているのだと考えら
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	238 れる。しかしながら最適化を有効にすることでそのメモリへの一時変数の確保
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	239 も解消されるということが分かった。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	240
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	241 x86はOS XとLinuxの環境で測定を行った。速度最適化のGCCとmcを比べると、
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	242 OS Xではmcに比べて20\%ほど早くなった事が分かる。しかし逆にLinux環境で
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	243 は6\%の速度低下が示された。どちらにしてもppcほどの良い結果ではない。こ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	244 れは自由に使えるレジスタが極めて少ないというx86の特殊なアーキテクチャ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	245 が要因だと考えられる。そのためGCCの最適化が十分に機能できなかった可能
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	246 性がある。この6\%の差は実用レベルでは問題なく、プログラムの構成によっ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	247 ては結果は逆転する事も十分にある。
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	248
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	249 ppcにおいてはどのオペレーティングシステムでも、速度最適化を使ったGCCは
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	250 mcに比べて早い事が分かる。いずれも約2倍、もしくはそれ以上に速度が向上
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	251 している。これはGCCの最適化機構が十分に働いている要因が大きい。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	252
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	253 \subsubsection{アセンブラ比較}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	254 実際に出力されたアセンブラから速度向上の要因を確かめるため、quicksort
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	255 プログラムで使用されているコードセグメントを一つ例に挙げる。CbCのプロ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	256 グラムソースがコード \ref{code:divider-e}である。このコードセグメント
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	257 の速度最適化を使ったGCCによる出力がコード\ref{code:divider-e-gcc}、mc
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	258 による出力がコード \ref{code:divider-e-mc}である。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	259 どちらもアーキテクチャはppcである。
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	260
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	261 %まずどのアーキテクチャにおいてもgccの最適化の効果が大きいことが分かる
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	262 %。 x86では約2.5倍、ppcでは4~7倍もの差が生じている。ppcの方で異様に効果
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	263 %が高いように見えるのは、関数やコードセグメントの引数渡しがレジスタベー
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	264 %スのため、最適化なしの場合には無駄なメモリアクセスが生じているためであ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	265 %る。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	266
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	267 %x86はOS XとLinuxの環境で測定を行った。OS Xではmcに比べて20\%ほど早くな
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	268 %ったことが分かる。しかし逆にLinux環境では6\%の速度低下が示された。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	269 %どちらにおいてもppcほどの良い結果ではない。これは自由に使えるレジスタ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	270 %が極めて少ないというx86の特殊なアーキテクチャが要因だと考えられる。そ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	271 %のためにgccの最適化が十分に働かなかった可能性がある。逆に言うとmcが高
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	272 %いレベルでx86のアセンブラ命令を実行しているともとれる。この6\%の差は実
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	273 %用レベルでは問題なく、プログラムの構成によっては結果は逆転する事も十分
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	274 %にある。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	275
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	276 %ppcではどのオペレーティングシステムでもmcに比べてgccが早いことが分かる
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	277 %。いずれも約2倍近くあるいはそれ以上に速度が向上している。これはgccの最
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	278 %適化機構が十分に働いている要因が大きい。
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	279
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	280 %\subsubsection{アセンブラ比較}
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	281 %比較のため、quicksortプログラムで使われているコードセグメントを一つ例
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	282 %にあげる。 CbCのソースがコード\ref{code:divider_s}、そのコードセグメン
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	283 %トのgccによる出力がコード\ref{code:divider_s_gcc}、mcによる出力がコー
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	284 %ド \ref{code:divider_s_mc} である。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	285 %
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	286 \lstinputlisting[
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	287 caption=quicksortプログラムで使われているコードセグメント,
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	288 label=code:divider-e]
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	289 {sources/divider-e.cbc}
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	290 \begin{minipage}[t]{.45\textwidth}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	291 \lstinputlisting[
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	292 caption=divider\_eのgccによる出力(ppc),
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	293 label=code:divider-e-gcc]
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	294 {sources/divider-e-gcc.asm}
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	295 \end{minipage}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	296 \hfill
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	297 \begin{minipage}[t]{.45\textwidth}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	298 \lstinputlisting[
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	299 caption=divider\_eのmcによる出力(ppc),
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	300 label=code:divider-e-mc]
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	301 {sources/divider-e-mc.asm}
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	302 \end{minipage}
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	303
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	304 もっとも比較しやすい箇所は\verb\|e-1\|の処理である。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	305 コード\ref{code:divider-e-gcc}のgccではこれを1命令の\verb\|addi 5,5,-1\|
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	306 で行っている。 mcではこれが\verb\|mr, addi, mr\|という3命令になっている
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	307 。これは変数\verb\|s\|の値を一度別のレジスタに移して計算するという処理で
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	308 ある。この様な細かい命令の展開が速度に差が出る要因である。
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	309
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	310 またこのppcのアセンブラからも、x86での速度差が少ないことが頷ける。引数
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	311 のほとんどをメモリに格納するx86では、計算のために一度レジスタに格納し
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	312 ないといけないことから、この命令は結局3命令になるはずであり、実際にx86
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	313 ではGCC,mc共にそのようなコードが出力されていた。
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	314
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	315 この結果より、CbCで記述されたプログラムではレジスタが多い方が実効速度
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	316 の面で有利であるということが分る。これは他のコンパイラ言語でも同じ事が
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	317 言えるが、（手続きやメソッドにおける）前の環境を保持する必要がないCbC
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	318 ではその影響がより強い。
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	319
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	320 %レジスタの数は
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	321
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	322 \subsubsection{ファイルサイズ}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	323
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	324 次に、実行ファイルのファイルサイズの面から考察する。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	325
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	326 実行ファイルのファイルサイズは組み込み用途のプログラムには重要な要素と
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	327 なる。多くの場合、組み込み機器では大容量のメモリは用意されておらず、
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	328 OSも存在しないため仮想記憶の概念がない。そのためメモリに乗り切らないプ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	329 ログラムはそもそも実行不能である。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	330
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	331 まず、評価の主な特徴として、strip後のファイルサイズ\ref{tab:eval-strip}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	332 をみると、x86ではmcとGCCでほとんど差がない事が分かる。この環境では速度
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	333 面でも大きな差はなく、mcの精度の良さがわかる。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	334
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	335 デバグ情報のあり／なし／strip後との比較で大きな差が出ているのは全て
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	336 Linux（PS3含む）である。Linuxでは実行ファイルのファイル形式にELFを用い
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	337 ている。この形式はLinuxの標準的な実行形式で、様々な研究に用いられてい
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	338 るため、Mach-Oと比べて付加機能が豊富である。そのため多くの情報が含まれ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	339 ているのだと考えられる。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	340 Linuxは組み込み用途に多く用いられているため、極端にメモリの制限された
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	341 環境ではデバグが困難になることが考えられる。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	342
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	343 また興味深い特徴として、-O2と-Osの差がppc/PS3以外は全くないことも分か
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	344 った。 -Osは-O2の最適化機能から、ファイルサイズが大きくなるものを除外
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	345 したものである。評価結果には-Osによるファイルサイズの減少はほとんどな
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	346 く、しかし速度は少々遅くなっている。このことからCbCによるプログラムで
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	347 は-Osを用いる必要はなく、-O2で十分であることが分かった。
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	348
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	349
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	350 % ELF, Mach-O
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	351 % o OS Xはデバグ情報が少ない。逆か、ELFが多いのか
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	352 % o x86でほぼ同じサイズ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	353 % - mcがんばってる
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	354 % o -Osと-O2が変わらない、でも速度は-O2
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	355 % o PS3とLinuxで大きく違う
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	356 %
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	357
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	358 \subsubsection{以前のバージョンとの速度比較}\label{sec:compare2old}
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	359
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	360 古いバージョンとの速度差についても考察を重ねる。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	361 実行環境にppcが存在しないのは、\ref{sec:impl-indirect}節における問題の
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	362 ためである。今回用意したプログラムは間接継続を用いているため、古いバー
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	363 ジョンではバグにより実行できなかった。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	364 また、速度向上に関する改善は\ref{sec:impl-fastcall}節におけるfastcall
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	365 の追加のみなであり、このfastcallはx86環境にしか影響しないはずである。
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	366
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	367 表を見ると、\verb\|-O0\|の場合は新バージョンの方が旧バージョンより遅くな
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	368 っているのが分かる。これは\ref{sec:impl-parallel}節の一時変数への退避
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	369 処理のためだと考えられる。この処理では、最適化により無駄なスタックへの
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	370 アクセスは排除されることを期待して実装していた。\verb\|-O0\|は最適化を行
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	371 わないので、この場合は逆に遅くなっている。これは予想通りの結果である。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	372 しかし最適化を行った場合は新バージョンに劣化はない。したがって一時変数
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	373 への退避処理においては、期待通り無駄な命令は十分に排除されていることが
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	374 分かった。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	375
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	376 また、それだけなら速度はほぼ同じ結果がでるところだが、ここではいずれの
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	377 環境でも新しいバージョンの方が速い。15~20\%ほど高速化していることがわ
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	378 かる。これは本研究で行った改善の一つ、fastcallの影響である。
0 e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	379
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	380
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	381
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	382
e9ecd5b5f29a first commit. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	383
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	384
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	385 \section{CbCでのプログラミング}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	386
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	387 % TODO:
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	388
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	389
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	390 \section{バージョン管理}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	391
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	392 % TODO: version management
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	393
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	394
1 aa09c34b90d3 add quicksort_for_pcc kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	395
aa09c34b90d3 add quicksort_for_pcc kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	396
2 50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	397 \section{本研究における成果}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	398 本研究では、これまでバグが多くプログラムの動作に問題のあった GCCベース
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	399 のCbCコンパイラを、実用的なプログラムが動くレベルまで改善することがで
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	400 きた。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	401
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	402 2008年の研究にて、GCCベースのCbCコンパイラは一部実装されていた。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	403 そして本研究により、そのコンパイラの改善が行われた。
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	404
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	405 \begin{itemize}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	406 \item CwCの全機能に対応
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	407 \item 一部バグのあったアーキテクチャに対応
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	408 \item バージョン管理の
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	409 \item 宣言の簡略化
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	410 \item
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	411 \end{itemize}
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	412
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	413
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	414
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	415
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	416
50e23a4b2f40 add many files. kent <kent@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	417

Mercurial > hg > Papers > 2010 > kent-master

annotate evaluations.tex @ 2:50e23a4b2f40