Papers/2018/mitsuki-sigos: Paper/sigos.tex annotate

annotate Paper/sigos.tex @ 59:aa9be79a7569

fix

author	mir3636
date	Sun, 22 Apr 2018 18:58:59 +0900
parents	0e42707ddeb2
children	b40dda8f52e7

rev	line source
38 56602a19c10e update mir3636 parents: diff changeset	1 \documentclass[techrep]{ipsjpapers}
56602a19c10e update mir3636 parents: diff changeset	2 \usepackage[dvipdfmx]{graphicx}
56602a19c10e update mir3636 parents: diff changeset	3 \usepackage{url}
56602a19c10e update mir3636 parents: diff changeset	4 \usepackage{listings,jlisting}
56602a19c10e update mir3636 parents: diff changeset	5 \usepackage{enumitem}
56602a19c10e update mir3636 parents: diff changeset	6
56602a19c10e update mir3636 parents: diff changeset	7 \lstset{
56602a19c10e update mir3636 parents: diff changeset	8 language=C,
56602a19c10e update mir3636 parents: diff changeset	9 tabsize=2,
56602a19c10e update mir3636 parents: diff changeset	10 frame=single,
56602a19c10e update mir3636 parents: diff changeset	11 basicstyle={\ttfamily\footnotesize},%
56602a19c10e update mir3636 parents: diff changeset	12 identifierstyle={\footnotesize},%
56602a19c10e update mir3636 parents: diff changeset	13 commentstyle={\footnotesize\itshape},%
56602a19c10e update mir3636 parents: diff changeset	14 keywordstyle={\footnotesize\bfseries},%
56602a19c10e update mir3636 parents: diff changeset	15 ndkeywordstyle={\footnotesize},%
56602a19c10e update mir3636 parents: diff changeset	16 stringstyle={\footnotesize\ttfamily},
56602a19c10e update mir3636 parents: diff changeset	17 breaklines=true,
56602a19c10e update mir3636 parents: diff changeset	18 captionpos=b,
56602a19c10e update mir3636 parents: diff changeset	19 columns=[l]{fullflexible},%
56602a19c10e update mir3636 parents: diff changeset	20 xrightmargin=0zw,%
56602a19c10e update mir3636 parents: diff changeset	21 xleftmargin=1zw,%
56602a19c10e update mir3636 parents: diff changeset	22 aboveskip=1zw,
56602a19c10e update mir3636 parents: diff changeset	23 numberstyle={\scriptsize},%
56602a19c10e update mir3636 parents: diff changeset	24 stepnumber=1,
56602a19c10e update mir3636 parents: diff changeset	25 numbersep=0.5zw,%
56602a19c10e update mir3636 parents: diff changeset	26 lineskip=-0.5ex,
56602a19c10e update mir3636 parents: diff changeset	27 }
56602a19c10e update mir3636 parents: diff changeset	28 \renewcommand{\lstlistingname}{Code}
42 75ef5a43fb05 fix mir3636 parents: 41 diff changeset	29 \usepackage{caption}
75ef5a43fb05 fix mir3636 parents: 41 diff changeset	30 \captionsetup[lstlisting]{font={small,tt}}
38 56602a19c10e update mir3636 parents: diff changeset	31
56602a19c10e update mir3636 parents: diff changeset	32 \input{dummy.tex} %% Font
56602a19c10e update mir3636 parents: diff changeset	33
56602a19c10e update mir3636 parents: diff changeset	34 % ユーザが定義したマクロなど．
56602a19c10e update mir3636 parents: diff changeset	35 \makeatletter
56602a19c10e update mir3636 parents: diff changeset	36
56602a19c10e update mir3636 parents: diff changeset	37 \begin{document}
56602a19c10e update mir3636 parents: diff changeset	38
56602a19c10e update mir3636 parents: diff changeset	39 % 和文表題
56602a19c10e update mir3636 parents: diff changeset	40 \title{Gears OS のモジュール化と並列 API}
56602a19c10e update mir3636 parents: diff changeset	41 % 英文表題
56602a19c10e update mir3636 parents: diff changeset	42 \etitle{}
56602a19c10e update mir3636 parents: diff changeset	43
56602a19c10e update mir3636 parents: diff changeset	44 % 所属ラベルの定義
56602a19c10e update mir3636 parents: diff changeset	45 \affilabel{1}{琉球大学大学院理工学研究科情報工学専攻 \\Interdisciplinary Information Engineering, Graduate School of Engineering and Science, University of the Ryukyus.}
56602a19c10e update mir3636 parents: diff changeset	46 \affilabel{2}{琉球大学工学部情報工学科\\Information Engineering, University of the Ryukyus.}
56602a19c10e update mir3636 parents: diff changeset	47
56602a19c10e update mir3636 parents: diff changeset	48 % 和文著者名
56602a19c10e update mir3636 parents: diff changeset	49 \author{
56602a19c10e update mir3636 parents: diff changeset	50 宮城光希\affiref{1}
56602a19c10e update mir3636 parents: diff changeset	51 \and
56 c39c2e8eddc7 update mir3636 parents: 55 diff changeset	52 桃原優 \affiref{1}
c39c2e8eddc7 update mir3636 parents: 55 diff changeset	53 \and
38 56602a19c10e update mir3636 parents: diff changeset	54 河野真治\affiref{2}
56602a19c10e update mir3636 parents: diff changeset	55 }
56602a19c10e update mir3636 parents: diff changeset	56
56602a19c10e update mir3636 parents: diff changeset	57 % 英文著者名
56602a19c10e update mir3636 parents: diff changeset	58 \eauthor{
56602a19c10e update mir3636 parents: diff changeset	59 Mitsuki MIYAGI\affiref{1}
56602a19c10e update mir3636 parents: diff changeset	60 \and
56 c39c2e8eddc7 update mir3636 parents: 55 diff changeset	61 Yu TOBARU\affiref{1}
c39c2e8eddc7 update mir3636 parents: 55 diff changeset	62 \and
38 56602a19c10e update mir3636 parents: diff changeset	63 Shinji KONO\affiref{2}
56602a19c10e update mir3636 parents: diff changeset	64 }
56602a19c10e update mir3636 parents: diff changeset	65
56602a19c10e update mir3636 parents: diff changeset	66 % 連絡先（投稿時に必要．製版用では無視される．）
56602a19c10e update mir3636 parents: diff changeset	67 \contact{宮城光希\\
56602a19c10e update mir3636 parents: diff changeset	68 〒903-0213 沖縄県西原町千原1番地\\
56602a19c10e update mir3636 parents: diff changeset	69 琉球大学工学部情報工学科\\
56602a19c10e update mir3636 parents: diff changeset	70 TEL: (098)895-2221\qquad FAX: (098)895-8727\\
56602a19c10e update mir3636 parents: diff changeset	71 email: mir3636@cr.ie.u-ryukyu.ac.jp}
56602a19c10e update mir3636 parents: diff changeset	72
56602a19c10e update mir3636 parents: diff changeset	73 % 和文概要
56602a19c10e update mir3636 parents: diff changeset	74 \begin{abstract}
56602a19c10e update mir3636 parents: diff changeset	75 現代の OS では拡張性と信頼性を両立させることが要求されている。
56602a19c10e update mir3636 parents: diff changeset	76 信頼性をノーマルレベルの計算に対して保証し、拡張性をメタレベルの計算で実現することを目標に Gears OS を設計中である。
56602a19c10e update mir3636 parents: diff changeset	77 Gears OS は Continuation based C によってアプリケーションと OS そのものを記述する。
56602a19c10e update mir3636 parents: diff changeset	78 CbC はこの Code Gear と Data Gear の単位でプログラムを記述する。
56602a19c10e update mir3636 parents: diff changeset	79 システムやアプリケーションを記述するためにCode Gear と Data Gear を柔軟に再利用する必要がある。
56602a19c10e update mir3636 parents: diff changeset	80 このときに機能を接続するAPIと実装の分離が可能であることが望ましい。
56602a19c10e update mir3636 parents: diff changeset	81 Gears OS の信頼性を保証するために、形式化されたモジュールシステムを提供する必要がある。
45 48561c7a2036 add src mir3636 parents: 44 diff changeset	82 本論文では、Interface を用いたモジュールシステムの説明とその応用としての並列 API について考察する。
38 56602a19c10e update mir3636 parents: diff changeset	83 並列APIは継続を基本とした関数型プログラミングと両立する必要がある。
56602a19c10e update mir3636 parents: diff changeset	84 ここでは、CbC の goto 文を拡張したpar goto 文を導入する。
56602a19c10e update mir3636 parents: diff changeset	85 par goto では並列実行のための実行 Context を生成し、TaskScheduler に登録する。
56602a19c10e update mir3636 parents: diff changeset	86 Gears OS での同期機構はData Gear の待ち合わせとして定義する。
56602a19c10e update mir3636 parents: diff changeset	87 メタレベルではこれらの同期機能はCASとそれを用いて実装した Synchronized Queue になる。
56602a19c10e update mir3636 parents: diff changeset	88 これらの Queue も Interface を用いてモジュール化されている。
56602a19c10e update mir3636 parents: diff changeset	89 モジュール化の詳細と、有効性について考察する。
56602a19c10e update mir3636 parents: diff changeset	90 \end{abstract}
56602a19c10e update mir3636 parents: diff changeset	91
56602a19c10e update mir3636 parents: diff changeset	92 % 英文概要
56602a19c10e update mir3636 parents: diff changeset	93 \begin{eabstract}
56602a19c10e update mir3636 parents: diff changeset	94 \end{eabstract}
56602a19c10e update mir3636 parents: diff changeset	95
56602a19c10e update mir3636 parents: diff changeset	96 % 表題などの出力
56602a19c10e update mir3636 parents: diff changeset	97 \maketitle
56602a19c10e update mir3636 parents: diff changeset	98
56602a19c10e update mir3636 parents: diff changeset	99 % 本文はここから始まる
56602a19c10e update mir3636 parents: diff changeset	100
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	101 \section{OS の拡張性と信頼性の両立}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	102
43 e23c914e27b4 update mir3636 parents: 42 diff changeset	103 さまざまなコンピュータの信頼性の基本はメモリなどの資源管理を行う OS である。OS の信頼性を保証する事自体が難しいが、時代とともに進歩する
41 d55a001df3d6 fix mir3636 parents: 40 diff changeset	104 ハードウェア、サービスに対応して OS 自体が拡張される必要がある。
d55a001df3d6 fix mir3636 parents: 40 diff changeset	105 OS は非決定的な実行を持ち、その信頼性を保証するには、従来のテストとデバッグでは不十分であり、テストしきれない部分が残ってしまう。
d55a001df3d6 fix mir3636 parents: 40 diff changeset	106 これに対処するためには、証明を用いる方法とプログラムの可能な実行をすべて数え上げるモデル検査を用いる方法がある。
d55a001df3d6 fix mir3636 parents: 40 diff changeset	107 モデル検査は無限の状態ではなくても巨大な状態を調べることになり、状態を有限に制限したり状態を抽象化したりする方法が用いられている
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	108 図\ref{fig:verification}。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	109 \begin{figure}[ht]
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	110 \begin{center}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	111 \includegraphics[width=70mm]{./pic/verification.pdf}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	112 \end{center}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	113 \caption{証明とモデル検査によるOSの検証}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	114 \label{fig:verification}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	115 \end{figure}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	116
41 d55a001df3d6 fix mir3636 parents: 40 diff changeset	117 証明やモデル検査を用いて OS を検証する方法はさまざまなものが検討されている。
d55a001df3d6 fix mir3636 parents: 40 diff changeset	118 検証は一度ですむものではなく、アプリケーションやサービス、デバイスが新しくなることに検証をやり直す必要がある。
d55a001df3d6 fix mir3636 parents: 40 diff changeset	119 つまり信頼性と拡張性を両立させることが重要である。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	120
41 d55a001df3d6 fix mir3636 parents: 40 diff changeset	121 コンピュータの計算はプログラミング言語で記述されるが、その言語の実行は操作的意味論の定義などで規定される。
d55a001df3d6 fix mir3636 parents: 40 diff changeset	122 プログラミング言語で記述される部分をノーマルレベルの計算と呼ぶ。
d55a001df3d6 fix mir3636 parents: 40 diff changeset	123 コードが実行される時には、処理系の詳細や使用する資源、あるいは、コードの仕様や型などの言語以外の部分が服属する。
d55a001df3d6 fix mir3636 parents: 40 diff changeset	124 これをメタレベルの計算という。
d55a001df3d6 fix mir3636 parents: 40 diff changeset	125 この二つのレベルを同じ言語で記述できるようにして、ノーマルレベルの計算の信頼性をメタレベルから保証できるようにしたい。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	126 ノーマルレベルでの正当性を保証しつつ、新しく付け加えられたデバイスやプログラムを含む正当性を検証したい。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	127
55 8916b7fa1bef update mir3636 parents: 53 diff changeset	128 ノーマルレベルとメタレベルを共通して表現できる言語として Continuation based C(以下CbC)\cite{cbc}を用いる。
41 d55a001df3d6 fix mir3636 parents: 40 diff changeset	129 CbC は関数呼出時の暗黙の環境(Environment)を使わずに、コードの単位を行き来できる引数付き goto 文(parametarized goto)を持つ C と互換性のある言語である。
d55a001df3d6 fix mir3636 parents: 40 diff changeset	130 これを用いて、Code Gear と Data Gear、さらにそのメタ構造を導入する。
d55a001df3d6 fix mir3636 parents: 40 diff changeset	131 これらを用いて、検証された Gears OS を構築したい。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	132 図\ref{fig:MetaGear}。
55 8916b7fa1bef update mir3636 parents: 53 diff changeset	133 検証には定理証明支援系である Agda を用いる。
8916b7fa1bef update mir3636 parents: 53 diff changeset	134 Gears の記述をモジュール化するために Interface を導入した。
8916b7fa1bef update mir3636 parents: 53 diff changeset	135 さらに並列処理の記述用にpar goto 構文を導入する。
8916b7fa1bef update mir3636 parents: 53 diff changeset	136 これらの機能は Agda 上で継続を用いた関数型プログラムに対応するようになっている。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	137 \begin{figure}[ht]
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	138 \begin{center}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	139 \includegraphics[width=70mm]{./pic/MetaGear.pdf}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	140 \end{center}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	141 \caption{Gearsのメタ計算}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	142 \label{fig:MetaGear}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	143 \end{figure}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	144
55 8916b7fa1bef update mir3636 parents: 53 diff changeset	145 本論文では Interface と par goto の実装の詳細を記述し評価を行った。
8916b7fa1bef update mir3636 parents: 53 diff changeset	146 マルチ CPU と GPU 上での par goto 文の実行を確認した。
8916b7fa1bef update mir3636 parents: 53 diff changeset	147 %Go言語に比べて並列構文 par goto が遅いことがわかった。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	148
55 8916b7fa1bef update mir3636 parents: 53 diff changeset	149 \section{Gears におけるメタ計算}
8916b7fa1bef update mir3636 parents: 53 diff changeset	150 Gears OS ではメタ計算を柔軟に記述するためのプログラミング言語の単位として Code Gear、Data Gear という単位を用いる。
59 aa9be79a7569 fix mir3636 parents: 58 diff changeset	151 Code Gear、Data Gear にはそれぞれメタレベルの単位である Meta Code Gear、Meta Data Gear が存在し、これらを用いてメタ計算を実現する。図\ref{fig:metaCS}
aa9be79a7569 fix mir3636 parents: 58 diff changeset	152
aa9be79a7569 fix mir3636 parents: 58 diff changeset	153 \begin{figure}[ht]
aa9be79a7569 fix mir3636 parents: 58 diff changeset	154 \begin{center}
aa9be79a7569 fix mir3636 parents: 58 diff changeset	155 \includegraphics[width=70mm]{./pic/metaCS.pdf}
aa9be79a7569 fix mir3636 parents: 58 diff changeset	156 \end{center}
aa9be79a7569 fix mir3636 parents: 58 diff changeset	157 \caption{Gears でのメタ計算}
aa9be79a7569 fix mir3636 parents: 58 diff changeset	158 \label{fig:metaCS}
aa9be79a7569 fix mir3636 parents: 58 diff changeset	159 \end{figure}
38 56602a19c10e update mir3636 parents: diff changeset	160
55 8916b7fa1bef update mir3636 parents: 53 diff changeset	161 CbC は軽量継続 (goto文) による遷移を行うので、継続前の Code Gear に戻ることはなく、状態遷移ベースのプログラミングに適している。
8916b7fa1bef update mir3636 parents: 53 diff changeset	162 CbC は LLVM\cite{llvm} と GCC\cite{gcc} 上で実装されている。
8916b7fa1bef update mir3636 parents: 53 diff changeset	163 メタレベルの記述は Perl スクリプトによって生成される stub と goto meta によって Code Gear で記述される。
38 56602a19c10e update mir3636 parents: diff changeset	164
56602a19c10e update mir3636 parents: diff changeset	165 Code Gear と Data Gear は Interface と呼ばれるまとまりとして記述される。
56602a19c10e update mir3636 parents: diff changeset	166 Interface は使用される Data Gear の定義と、それに対する操作を行う Code Gear の集合である。
55 8916b7fa1bef update mir3636 parents: 53 diff changeset	167 Interface 作成時に Code Gear の集合を指定することにより複数の実装を持つことができる。
8916b7fa1bef update mir3636 parents: 53 diff changeset	168 Interface の操作に対応する Code Gear の引数は Interface に定義されている Data Gear を通して指定される。
8916b7fa1bef update mir3636 parents: 53 diff changeset	169 一つの実行スレッド内で使われる Interface の Code Gear と Data Gear は Meta Data Gear に格納される。
8916b7fa1bef update mir3636 parents: 53 diff changeset	170 この Meta Data Gear を Context という。
8916b7fa1bef update mir3636 parents: 53 diff changeset	171 ノーマルレベルでは Context を直接見ることはできない。
38 56602a19c10e update mir3636 parents: diff changeset	172
55 8916b7fa1bef update mir3636 parents: 53 diff changeset	173 Code Gear の継続は関数型プログラミングからみると継続先の Context を含む Closure となっている。
59 aa9be79a7569 fix mir3636 parents: 58 diff changeset	174 これを記述するために継続に不定長引数を追加する構文をスクプリトの変換機能として用意した。Code \ref{varargnext}
55 8916b7fa1bef update mir3636 parents: 53 diff changeset	175 メタ計算側ではこれらの Context を常に持ち歩いているので goto 文で引数を用いることはなく、
8916b7fa1bef update mir3636 parents: 53 diff changeset	176 行き先は Code Gear の番号のみで指定される。
38 56602a19c10e update mir3636 parents: diff changeset	177
58 0e42707ddeb2 add mir3636 parents: 57 diff changeset	178 \lstinputlisting[label=varargnext, caption=不定長引数を持つ継続]{./src/varargnext.cbc}
55 8916b7fa1bef update mir3636 parents: 53 diff changeset	179
8916b7fa1bef update mir3636 parents: 53 diff changeset	180 これにより Interface 間の呼び出しを C++ のメソッド呼び出しのように記述することができる。
8916b7fa1bef update mir3636 parents: 53 diff changeset	181 Interface の実装は、Context 内に格納されているので、オブジェクトごとに実装を変える多様性を実現できている。
8916b7fa1bef update mir3636 parents: 53 diff changeset	182 呼び出された Code Gear は必要な引数を Context から取り出す必要がある。
8916b7fa1bef update mir3636 parents: 53 diff changeset	183 これはスクリプトで生成された stub Meta Code Gear で行われる。
38 56602a19c10e update mir3636 parents: diff changeset	184 Gears OS でのメタ計算は stub と goto のメタ計算の2箇所で実現される。
56602a19c10e update mir3636 parents: diff changeset	185
55 8916b7fa1bef update mir3636 parents: 53 diff changeset	186 Context を複製して複数の CPU に割り当てることにより並列実行を可能になる。
8916b7fa1bef update mir3636 parents: 53 diff changeset	187 これによりメタ計算として並列処理を記述したことになる。
8916b7fa1bef update mir3636 parents: 53 diff changeset	188 Gears のスレッド生成は Agda の関数型プログラミングに対応して行われるのが望ましい。
8916b7fa1bef update mir3636 parents: 53 diff changeset	189 そこで、par goto 構文を導入し、Agda の継続呼び出しに対応させることにした。
8916b7fa1bef update mir3636 parents: 53 diff changeset	190 par goto では Context の複製、入力の同期、タスクスケジューラーへの Context の登録などが行われる。
8916b7fa1bef update mir3636 parents: 53 diff changeset	191 par goto 文の継続として、スレッドの join に相当する \_\_exit を用意した。
8916b7fa1bef update mir3636 parents: 53 diff changeset	192 \_\_exit により par goto で分岐した Code Gear の出力を元のスレッドで受け取ることができる。
8916b7fa1bef update mir3636 parents: 53 diff changeset	193
8916b7fa1bef update mir3636 parents: 53 diff changeset	194 関数型プログラムではメモリ管理は GC などを通して暗黙に行われる。
8916b7fa1bef update mir3636 parents: 53 diff changeset	195 Gears OS ではメモリ管理は stub などのメタ計算部分で処理される。
8916b7fa1bef update mir3636 parents: 53 diff changeset	196 例えば、寿命の短いスレッドでは使い捨ての線形アロケーションを用いる。
38 56602a19c10e update mir3636 parents: diff changeset	197
56 c39c2e8eddc7 update mir3636 parents: 55 diff changeset	198 %Meta Code Gear は通常の Code Gear の直後に遷移され、メタ計算を実行する。
c39c2e8eddc7 update mir3636 parents: 55 diff changeset	199 %これを図示したものが図\ref{fig:metaCS}である。
38 56602a19c10e update mir3636 parents: diff changeset	200
56602a19c10e update mir3636 parents: diff changeset	201 \section{Gears OS の構成}
56602a19c10e update mir3636 parents: diff changeset	202 Gears OS は以下の要素で構成される。
56602a19c10e update mir3636 parents: diff changeset	203
56602a19c10e update mir3636 parents: diff changeset	204 \begin{itemize}
56602a19c10e update mir3636 parents: diff changeset	205 \item Context
56602a19c10e update mir3636 parents: diff changeset	206 \item TaskQueue
56602a19c10e update mir3636 parents: diff changeset	207 \item TaskManager
56602a19c10e update mir3636 parents: diff changeset	208 \item Worker
56602a19c10e update mir3636 parents: diff changeset	209 \end{itemize}
56602a19c10e update mir3636 parents: diff changeset	210
56602a19c10e update mir3636 parents: diff changeset	211 図\ref{fig:gearsos} に Gears OS の構成図を示す。
56602a19c10e update mir3636 parents: diff changeset	212
56602a19c10e update mir3636 parents: diff changeset	213 \begin{figure}[ht]
56602a19c10e update mir3636 parents: diff changeset	214 \begin{center}
56602a19c10e update mir3636 parents: diff changeset	215 \includegraphics[width=70mm]{./pic/gears_structure}
56602a19c10e update mir3636 parents: diff changeset	216 \end{center}
56602a19c10e update mir3636 parents: diff changeset	217 \caption{Gears OS の構成図}
56602a19c10e update mir3636 parents: diff changeset	218 \label{fig:gearsos}
56602a19c10e update mir3636 parents: diff changeset	219 \end{figure}
56602a19c10e update mir3636 parents: diff changeset	220
56602a19c10e update mir3636 parents: diff changeset	221 Data Gear は union と struct によって表現される。
56602a19c10e update mir3636 parents: diff changeset	222 Context には Data Gear の Data Type の情報が格納されている。
56602a19c10e update mir3636 parents: diff changeset	223 この情報から確保する Data Gear のサイズなどを決定する。
56602a19c10e update mir3636 parents: diff changeset	224
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	225 Context は Task でもあり、Taskは通常のOSのスレッドに対応する。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	226 Task は実行する Code Gear と Data Gear をすべて持っている。
43 e23c914e27b4 update mir3636 parents: 42 diff changeset	227 TaskManager は Task を実行する Worker の生成、管理、Task の送信を行う。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	228 Gears OS における Task Queue は Synchronized Queue で実現される。
43 e23c914e27b4 update mir3636 parents: 42 diff changeset	229 Worker は TaskQueue から Task である Context を取得し、Task の Code Gear を実行し、Output Data Gear の書き出しを行っている。
e23c914e27b4 update mir3636 parents: 42 diff changeset	230 Input/Output Data Gear の依存関係が解決されたものから並列実行される。
38 56602a19c10e update mir3636 parents: diff changeset	231
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	232 \section{Interface}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	233 Interface は呼び出しの引数になる Data Gear の集合であり、そこで呼び出される Code Gear のエントリである。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	234 呼び出される Code Gear の引数となる Data Gear はここで全て定義される。
38 56602a19c10e update mir3636 parents: diff changeset	235
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	236 Code\ref{interface}は stack の Interface である。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	237 Code Gear、Data Gear に参照するために Context を通す必要があるが、
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	238 Interface を記述することでデータ構造の api と Data Gear を結びつけることが出来る。
38 56602a19c10e update mir3636 parents: diff changeset	239
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	240 \lstinputlisting[label=interface, caption=StackのInterface]{./src/Stack.cbc}
38 56602a19c10e update mir3636 parents: diff changeset	241
52 4d5bd76a70df fix mir3636 parents: 51 diff changeset	242 Code\ref{implement}は stack の実装の例である。
4d5bd76a70df fix mir3636 parents: 51 diff changeset	243 createImpl は関数呼び出しで呼び出され、初期化と Code Gear のスロットに対応する Code Gear の番号を入れる。
38 56602a19c10e update mir3636 parents: diff changeset	244
52 4d5bd76a70df fix mir3636 parents: 51 diff changeset	245 \lstinputlisting[label=implement, caption=SingleLinkedStackの実装]{./src/stackimpl.cbc}
38 56602a19c10e update mir3636 parents: diff changeset	246
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	247 \section{stub Code Gear の生成}
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	248
38 56602a19c10e update mir3636 parents: diff changeset	249 stub Code Gear は Code Gear 間の継続に挟まれる Code Gear が必要な Data Gear を Context から取り出す処理を行うものである。
56602a19c10e update mir3636 parents: diff changeset	250 Code Gear 毎に記述する必要があり、そのCode Gear の引数を見て取り出す Data Gear を選択する。
56602a19c10e update mir3636 parents: diff changeset	251 stub Code Gear を自動生成する generate stub を Perl スクリプトで作成することによって Code Gear の記述量を約半分にすることができる。
56602a19c10e update mir3636 parents: diff changeset	252
56602a19c10e update mir3636 parents: diff changeset	253 stub を生成するために generate\_stub は指定された cbc ファイルの \_\_code型である Code Gear を取得し、引数から必要な Data Gear を選択する。
56602a19c10e update mir3636 parents: diff changeset	254 generate\_stub は引数と interface を照らし合わせ、Gearef または GearImpl を決定する。
56602a19c10e update mir3636 parents: diff changeset	255 また、この時既に stub Code Gear が記述されている Code Gear は無視される。
56602a19c10e update mir3636 parents: diff changeset	256
56602a19c10e update mir3636 parents: diff changeset	257 cbc ファイルから、生成した stub Code Gear を加えて stub を加えたコードに変換を行う。(Code\ref{stack_c})
56602a19c10e update mir3636 parents: diff changeset	258
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	259 \lstinputlisting[label=stack_c, caption=stub Code Gear を加えたコード]{./src/ex_stub}
38 56602a19c10e update mir3636 parents: diff changeset	260
56602a19c10e update mir3636 parents: diff changeset	261 \section{Context の生成}
56602a19c10e update mir3636 parents: diff changeset	262 generate\_context は Context.h、Interface.cbc、generate\_stub で生成されたImpl.cbc を見て Context を生成する Perl スクリプトである。
56602a19c10e update mir3636 parents: diff changeset	263
56602a19c10e update mir3636 parents: diff changeset	264 \begin{figure}[ht]
56602a19c10e update mir3636 parents: diff changeset	265 \begin{center}
56602a19c10e update mir3636 parents: diff changeset	266 \includegraphics[width=70mm]{./pic/generate_context3.pdf}
56602a19c10e update mir3636 parents: diff changeset	267 \end{center}
56602a19c10e update mir3636 parents: diff changeset	268 \caption{generate\_context による Context の生成}
56602a19c10e update mir3636 parents: diff changeset	269 \label{fig:gc}
56602a19c10e update mir3636 parents: diff changeset	270 \end{figure}
56602a19c10e update mir3636 parents: diff changeset	271
56602a19c10e update mir3636 parents: diff changeset	272 Context は Meta Data Gear に相当し、Code Gear や Data Gear を管理している。
56602a19c10e update mir3636 parents: diff changeset	273
56602a19c10e update mir3636 parents: diff changeset	274 generate\_context は context の定義 (Code\ref{context}) を読み宣言されている Data Gear を取得する。
56602a19c10e update mir3636 parents: diff changeset	275 Code Gear の取得は指定された generate\_stub で生成されたコードから \_\_code 型を見て行う。
56602a19c10e update mir3636 parents: diff changeset	276 取得した Code Gear、Data Gear の enum の定義は enumCode.h、enumData.h に生成される。
56602a19c10e update mir3636 parents: diff changeset	277
56602a19c10e update mir3636 parents: diff changeset	278 Code/Data Gear の名前とポインタの対応は generate\_context によって生成される enum Code、enum Data を指定することで接続を行う。
49 06a21764be00 fix mir3636 parents: 48 diff changeset	279 また、generate context は取得した Code/Data Gear から initContext の生成も行う。
38 56602a19c10e update mir3636 parents: diff changeset	280
56602a19c10e update mir3636 parents: diff changeset	281 Context には Allocation 等で生成した Data Gear へのポインタが格納されている。
56602a19c10e update mir3636 parents: diff changeset	282 Code Gear は Context を通して Data Gear へアクセスする。
56602a19c10e update mir3636 parents: diff changeset	283 Data Gear の Allocation を行うコードは dataGearInit.cに生成される。
56602a19c10e update mir3636 parents: diff changeset	284
56602a19c10e update mir3636 parents: diff changeset	285
43 e23c914e27b4 update mir3636 parents: 42 diff changeset	286 \section{Gears OS の並列処理}
e23c914e27b4 update mir3636 parents: 42 diff changeset	287 Gears OS では実行の Task を Code Gear と Input/Output Data Gear の組で表現する。
e23c914e27b4 update mir3636 parents: 42 diff changeset	288 Input/Output Data Gear によって依存関係が決定し、それにそって並列実行を行う。
e23c914e27b4 update mir3636 parents: 42 diff changeset	289 Gears OS では並列実行する Task を Context で表現する。
e23c914e27b4 update mir3636 parents: 42 diff changeset	290 Context には Task 用の情報として、実行される Code Gear、Input/Output Data Gear の格納場所、待っている Input Data Gear のカウンタ等を持っている
e23c914e27b4 update mir3636 parents: 42 diff changeset	291 Task の Input Data Gear が揃っているかを TaskManager で判断し、実行可能な Task を Worker に送信する。
e23c914e27b4 update mir3636 parents: 42 diff changeset	292 Worker は送信された Task が指定した Code Gear を実行し、Output Data Gear を書き出す。
e23c914e27b4 update mir3636 parents: 42 diff changeset	293
e23c914e27b4 update mir3636 parents: 42 diff changeset	294 \section{SynchronizedQueue}
e23c914e27b4 update mir3636 parents: 42 diff changeset	295 SynchronizedQueue は Worker の Queue として使用される。
e23c914e27b4 update mir3636 parents: 42 diff changeset	296 Worker の Queue は TaskManager を経由して Task を送信するスレッドと Task を取得する Worker 自身のスレッドで扱われる。
e23c914e27b4 update mir3636 parents: 42 diff changeset	297 そのため SynchronizedQueue はマルチスレッドでもデータの一貫性を保証する Queue を実装する必要がある。
e23c914e27b4 update mir3636 parents: 42 diff changeset	298
e23c914e27b4 update mir3636 parents: 42 diff changeset	299 データの一貫性を保証する解決例としての 1 つとしてロックを使った解決方法がある。
e23c914e27b4 update mir3636 parents: 42 diff changeset	300 しかし、ロックを行ってデータを更新した場合、同じ Queue に対して操作を行う際に待ち合わせが発生し、全体の並列度が下がってしまう。
e23c914e27b4 update mir3636 parents: 42 diff changeset	301 そこで、Gears OS ではデータの一貫性を保証するために CAS(Check and Set、Compare and Swap) を利用した Queue を実装している。
e23c914e27b4 update mir3636 parents: 42 diff changeset	302 CAS は値の比較、更新をアトミックに行う命令である。
e23c914e27b4 update mir3636 parents: 42 diff changeset	303 CAS を使う際は更新前の値と更新後の値を渡し、渡された更新前の値を実際に保存されているメモリ番地の値と比較し、同じならデータ競合がないため、データの更新に成功する。
e23c914e27b4 update mir3636 parents: 42 diff changeset	304 異なる場合は他に書き込みがあったとみなされ、値の更新に失敗する。
e23c914e27b4 update mir3636 parents: 42 diff changeset	305
46 000136257736 fix mir3636 parents: 45 diff changeset	306 Gears OS ではこの CAS を行うための Interface を定義している(Code\ref{atomicInterface})。
45 48561c7a2036 add src mir3636 parents: 44 diff changeset	307 この Interface では、Data Gear 全てを内包している Data 共用体のポインタの値を更新する CAS を定義して
46 000136257736 fix mir3636 parents: 45 diff changeset	308 いる(Code\ref{atomicInterface} 6行目)。
45 48561c7a2036 add src mir3636 parents: 44 diff changeset	309
46 000136257736 fix mir3636 parents: 45 diff changeset	310 \lstinputlisting[label=atomicInterface, caption=AtomicInterface]{./src/atomicInterface.h}
45 48561c7a2036 add src mir3636 parents: 44 diff changeset	311
46 000136257736 fix mir3636 parents: 45 diff changeset	312 AtomicInterface での CAS の実際の実装を Code\ref{atomicImpl} に示す。
000136257736 fix mir3636 parents: 45 diff changeset	313 実際の実装では \_\_sync\_bool\_compare\_and\_swap 関数を呼び出すことで CAS を行う(Code\ref{atomicImpl} 2行目)。
45 48561c7a2036 add src mir3636 parents: 44 diff changeset	314 この関数は第一引数に渡されたアドレスに対して第二引数の値から第三引数の値ヘ CAS を行う。
48561c7a2036 add src mir3636 parents: 44 diff changeset	315 CAS に成功した場合、true を返し、失敗した場合は false を返す。
46 000136257736 fix mir3636 parents: 45 diff changeset	316 Code\ref{atomicImpl} では CAS に成功した場合と失敗した場合それぞれに対応した Code Gear へ継続する。
45 48561c7a2036 add src mir3636 parents: 44 diff changeset	317
46 000136257736 fix mir3636 parents: 45 diff changeset	318 \lstinputlisting[caption=CAS の実装, label=atomicImpl]{./src/atomicImpl.cbc}
45 48561c7a2036 add src mir3636 parents: 44 diff changeset	319
46 000136257736 fix mir3636 parents: 45 diff changeset	320 SynchronizedQueue の Data Gear の定義を Code\ref{synchronizedQueue} に示す。
45 48561c7a2036 add src mir3636 parents: 44 diff changeset	321 SynchronizedQueue はデータのリストの先頭と、終端のポインタを持っている。
48561c7a2036 add src mir3636 parents: 44 diff changeset	322 Queue を操作する際はこのポインタに対して CAS をすることでデータの挿入と取り出しを行う。
48561c7a2036 add src mir3636 parents: 44 diff changeset	323
46 000136257736 fix mir3636 parents: 45 diff changeset	324 \lstinputlisting[caption=SynchronizedQueue の定義, label=synchronizedQueue]{./src/synchronizedQueue.h}
45 48561c7a2036 add src mir3636 parents: 44 diff changeset	325
43 e23c914e27b4 update mir3636 parents: 42 diff changeset	326 \section{並列構文}
51 7880e4a8895b add src mir3636 parents: 50 diff changeset	327 Gears OS の並列構文は par goto文で用意されている(Code\ref{pargoto})。
7880e4a8895b add src mir3636 parents: 50 diff changeset	328 \lstinputlisting[caption=par goto による並列実行, label=pargoto]{./src/parGotoCreateTask.cbc}
43 e23c914e27b4 update mir3636 parents: 42 diff changeset	329 par goto の引数には Input/Output Data Gear と実行後に継続する \_\_exit を渡す。
e23c914e27b4 update mir3636 parents: 42 diff changeset	330 par goto で生成された Task は \_\_exit に継続することで終了する。
44 6076ec5e33de fix mir3636 parents: 43 diff changeset	331 par goto文でも通常の goto 分と同様にメタへの goto 文へ置き換えられるが、par goto 文では通常の goto 文とは異なるメタへと継続する。
43 e23c914e27b4 update mir3636 parents: 42 diff changeset	332 Gears OS の Task は Output Data Gear を生成した時点で終了するので、par goto では直接 \_\_exit に継続するのではなく、
e23c914e27b4 update mir3636 parents: 42 diff changeset	333 Output Data Gear への書き出し処理(Commit)に継続される。
e23c914e27b4 update mir3636 parents: 42 diff changeset	334
44 6076ec5e33de fix mir3636 parents: 43 diff changeset	335 Code Gear は Input に指定した Data Gear が全て書き込まれると実行され、実行した結果を Output に指定した Data Gear に書き出しを行う。
6076ec5e33de fix mir3636 parents: 43 diff changeset	336 Code Gear の引数である\_\_next が持つ引数の Data Gear が Output Data Gear となる。
6076ec5e33de fix mir3636 parents: 43 diff changeset	337
43 e23c914e27b4 update mir3636 parents: 42 diff changeset	338 書き出し処理は Data Gear の Queue から、依存関係にある Task を参照する。
44 6076ec5e33de fix mir3636 parents: 43 diff changeset	339 参照した Task が持つ実行に必要な Input Data Gear カウンタのデクリメントを行う。
43 e23c914e27b4 update mir3636 parents: 42 diff changeset	340 カウンタが0になると Task が待っている Input Data Gear が揃ったことになり、
e23c914e27b4 update mir3636 parents: 42 diff changeset	341 その Task を TaskManager 経由で実行される Worker に送信する。
e23c914e27b4 update mir3636 parents: 42 diff changeset	342
e23c914e27b4 update mir3636 parents: 42 diff changeset	343 この par goto 文は通常のプログラミングの関数呼び出しのように扱うことができる。
e23c914e27b4 update mir3636 parents: 42 diff changeset	344
e23c914e27b4 update mir3636 parents: 42 diff changeset	345
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	346 %\section{比較}
6c55961dcf0b update mir3636 parents: 56 diff changeset	347 %
6c55961dcf0b update mir3636 parents: 56 diff changeset	348 %従来のプログラミングスタイルとの比較。
6c55961dcf0b update mir3636 parents: 56 diff changeset	349 %Gears のプログラミングは関数呼出を中心とするプログラミングとはかなり異なる。
6c55961dcf0b update mir3636 parents: 56 diff changeset	350 %Gears は関数呼出を禁止しているわけではなく、使用する資源の制御に問題がないなら普通に関数呼出して良い。
6c55961dcf0b update mir3636 parents: 56 diff changeset	351 %%Linux kernel などでは関数呼出の大半はインライン展開されることを期待してプログラミングされており、
6c55961dcf0b update mir3636 parents: 56 diff changeset	352 %関数呼出で予測できないスタックの爆発やCPU資源の浪費が起きないようにプログラミングされている。
6c55961dcf0b update mir3636 parents: 56 diff changeset	353 %Gears では Gears 間のプログラミングは戻り先や使用する資源を明示する必要がある。
6c55961dcf0b update mir3636 parents: 56 diff changeset	354 %
6c55961dcf0b update mir3636 parents: 56 diff changeset	355 %goto 文での引数は通常の関数呼出と異なり、スタック(環境)に積むことができない。引数に必要な情報を含むData Gearを
6c55961dcf0b update mir3636 parents: 56 diff changeset	356 %持ち歩くスタイルとなる。一つのインタフェース内部では、これらは共通している。実際、これらはメタレベルでは、
6c55961dcf0b update mir3636 parents: 56 diff changeset	357 %Context というMeta Data Gear にすべて格納されている。メタレベルは、Data Gear の詳細な型は使用されない。
6c55961dcf0b update mir3636 parents: 56 diff changeset	358 %ノーマルレベルに移行する際に stub Code Gear を通して詳細な型が接続される。
6c55961dcf0b update mir3636 parents: 56 diff changeset	359 %
6c55961dcf0b update mir3636 parents: 56 diff changeset	360 %インタフェースを再利用する際には、呼び出すインタフェースが持つ引数は保存される必要がある。これらは、実際には
6c55961dcf0b update mir3636 parents: 56 diff changeset	361 %Context 内にあるので自動的に保存されている。ノーマルレベルの記述では、... の部分にその意味が込めれている。
6c55961dcf0b update mir3636 parents: 56 diff changeset	362 %これは、可変長引数の...と同じ意味だと考えても良い。ただ、LLVM/GCC レベルでそれを実装するのは比較的難しい。
6c55961dcf0b update mir3636 parents: 56 diff changeset	363 %なので、今回はScriptによる変換を採用している。
6c55961dcf0b update mir3636 parents: 56 diff changeset	364 %
6c55961dcf0b update mir3636 parents: 56 diff changeset	365 %ノーマルレベルの記述と関数型プログラミングの記述の比較。Gear は必ず継続を渡す必要がある。これは一段の
6c55961dcf0b update mir3636 parents: 56 diff changeset	366 %関数呼出を許しているのと同等である。70年代の Fortan の関数呼出は決まった場所に戻り先を格納するので
6c55961dcf0b update mir3636 parents: 56 diff changeset	367 %再起呼出ができなかったのと同じである。例えば Code Gears 以下のような型を持つ。ここで t は継続の型である。
6c55961dcf0b update mir3636 parents: 56 diff changeset	368 %Stack は Stack を受けとる Stack \verb\|->\| t という Code Gear を継続として引数で受けとる。popStack はこの引数を
6c55961dcf0b update mir3636 parents: 56 diff changeset	369 %呼び出す。
6c55961dcf0b update mir3636 parents: 56 diff changeset	370 %
6c55961dcf0b update mir3636 parents: 56 diff changeset	371 %\verb\|popStack : {a t : Set} -> Stack \|
6c55961dcf0b update mir3636 parents: 56 diff changeset	372 %
6c55961dcf0b update mir3636 parents: 56 diff changeset	373 %\verb\| -> (Stack -> t) -> t\|
6c55961dcf0b update mir3636 parents: 56 diff changeset	374 %
6c55961dcf0b update mir3636 parents: 56 diff changeset	375 %つまり、Code Gear は制限された関数の形式を持っている。Data Gear は、関数型言語の直積や排他的論理和(Sum)を含むデータ型に
6c55961dcf0b update mir3636 parents: 56 diff changeset	376 %対応する。しかし、一つの Context で実行される Data Gear は、一つの巨大なSumに含まれるようになっている。これを
6c55961dcf0b update mir3636 parents: 56 diff changeset	377 %メタレベルでは、中の型の詳細に立ち入ることなく実行する。
6c55961dcf0b update mir3636 parents: 56 diff changeset	378 %
6c55961dcf0b update mir3636 parents: 56 diff changeset	379 %%Context はノーマルレベルのData Gear の他に様々なメタ情報を持つ。例えば、メモリ管理情報や実行される CPU 、あるいは、Task の
6c55961dcf0b update mir3636 parents: 56 diff changeset	380 %状態、待ち合わせている Data Gear などである。これらの情報は C やアセンブラのレベルで実装されるのと同時に、通常の Gear の
6c55961dcf0b update mir3636 parents: 56 diff changeset	381 %プログラミングにも対応する。例えば、CPU をかそうてきに Gears で記述すればソフトウェア的な並列実行を実現し、実際の
6c55961dcf0b update mir3636 parents: 56 diff changeset	382 %GPU を用いれば GPU による並列実行となる。この実行をモデル検査的な状態数え上げに対応させればモデル検査を実行できる。
6c55961dcf0b update mir3636 parents: 56 diff changeset	383 %
6c55961dcf0b update mir3636 parents: 56 diff changeset	384 %Haskell などを実行可能仕様記述として用いる OS の検証\cite{Klein:2009:SFV:1629575.1629596,Chen:2015:UCH:2815400.2815402}と、Code Gear を用いる手法は類似>しているが、Code Gear の場合は、
6c55961dcf0b update mir3636 parents: 56 diff changeset	385 %記述を制限し、Code と仕様の対応、さらにCodeと資源の対応が明確になる利点がある。
6c55961dcf0b update mir3636 parents: 56 diff changeset	386 %
6c55961dcf0b update mir3636 parents: 56 diff changeset	387 %型つきアセンブラ\cite{Yang:2010:SLI:1806596.1806610}は、より低レベルの関数型の記述であると言える。アセンブラの記述自体は小さく扱いやすいが、
6c55961dcf0b update mir3636 parents: 56 diff changeset	388 %OS レベルあるいはアプリケーションレベルからの距離が大きい。型の整合性を保証するだけでは OS の検証としては
6c55961dcf0b update mir3636 parents: 56 diff changeset	389 %不十分なので、証明やモデル検査を用いることになるが、記述量が多いのが、その際に欠点となる。
6c55961dcf0b update mir3636 parents: 56 diff changeset	390 %Code Gear は、より大きな単位であり、プログラミングレベルの抽象化が可能になっているので、これらの記述の
6c55961dcf0b update mir3636 parents: 56 diff changeset	391 %大きさの欠点をカバーできる可能性がある。
6c55961dcf0b update mir3636 parents: 56 diff changeset	392 %
6c55961dcf0b update mir3636 parents: 56 diff changeset	393 %証明手法は、従来では Hoare Logic \cite{Chen:2015:UCH:2815400.2815402}のような Post Condition / Pre Condition を用いる方法が使われている。
6c55961dcf0b update mir3636 parents: 56 diff changeset	394 %現在のGearsは、Agda への変換は考えているが、その上の具体的な証明方法はまだ用意されていない。
6c55961dcf0b update mir3636 parents: 56 diff changeset	395 %
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	396
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	397 \section{Gears OS の評価}
6c55961dcf0b update mir3636 parents: 56 diff changeset	398
6c55961dcf0b update mir3636 parents: 56 diff changeset	399 \subsection{実験環境}
6c55961dcf0b update mir3636 parents: 56 diff changeset	400 今回 Twice、 BitonicSort をそれぞれ CPU、GPU環境で Gears OS の測定を行う。
6c55961dcf0b update mir3636 parents: 56 diff changeset	401
6c55961dcf0b update mir3636 parents: 56 diff changeset	402 使用する実験環境を表\ref{tab:powerEdge}、 GPU 環境を表\ref{tab:gtx1070} に示す。
6c55961dcf0b update mir3636 parents: 56 diff changeset	403 また、今回は LLVM/Clang で実装した CbC コンパイラを用いて Gears OS をコンパイルする。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	404
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	405 \begin{table}[htbp]
6c55961dcf0b update mir3636 parents: 56 diff changeset	406 \begin{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	407 \begin{tabular}{\|l\|l\|} \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	408 Model & Dell PowerEdgeR630 \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	409 OS & CentOS 7.4.1708 \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	410 Memory & 768GB \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	411 CPU & 2 x 18-Core Intel Xeon 2.30GHz \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	412 \end{tabular}
6c55961dcf0b update mir3636 parents: 56 diff changeset	413 \caption{実行環境}
6c55961dcf0b update mir3636 parents: 56 diff changeset	414 \label{tab:powerEdge}
6c55961dcf0b update mir3636 parents: 56 diff changeset	415 \end{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	416 \end{table}
6c55961dcf0b update mir3636 parents: 56 diff changeset	417
6c55961dcf0b update mir3636 parents: 56 diff changeset	418 \begin{table}[htbp]
6c55961dcf0b update mir3636 parents: 56 diff changeset	419 \begin{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	420 \begin{tabular}{\|l\|\|l\|} \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	421 GPU & GeForce GTX 1070 \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	422 Cores & 1920 \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	423 Clock Speed & 1683MHz \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	424 Memory Size & 8GB GDDR5 \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	425 Memory Bandwidth & 256GB/s \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	426 \end{tabular}
6c55961dcf0b update mir3636 parents: 56 diff changeset	427 \caption{GPU 環境}
6c55961dcf0b update mir3636 parents: 56 diff changeset	428 \label{tab:gtx1070}
6c55961dcf0b update mir3636 parents: 56 diff changeset	429 \end{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	430 \end{table}
6c55961dcf0b update mir3636 parents: 56 diff changeset	431
6c55961dcf0b update mir3636 parents: 56 diff changeset	432 \subsection{Twice}
6c55961dcf0b update mir3636 parents: 56 diff changeset	433 Twice は与えられた整数配列のすべての要素を2倍にする例題である。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	434
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	435 Twice の Task は Gears OS のデータ並列で実行される。
6c55961dcf0b update mir3636 parents: 56 diff changeset	436 CPU の場合は配列ある程度の範囲に分割してTaskを生成する。
6c55961dcf0b update mir3636 parents: 56 diff changeset	437 これは要素毎に Task を生成するとその分の Context を生成するために時間を取ってしまうからである。
6c55961dcf0b update mir3636 parents: 56 diff changeset	438
6c55961dcf0b update mir3636 parents: 56 diff changeset	439 Twice は並列実行の依存関係もなく、データ並列での実行に適した課題である。
6c55961dcf0b update mir3636 parents: 56 diff changeset	440 そのため、通信時間を考慮しなければ CPU よりコア数が多い GPU が有利となる。
6c55961dcf0b update mir3636 parents: 56 diff changeset	441
6c55961dcf0b update mir3636 parents: 56 diff changeset	442 要素数$2^{27}$ のデータに対する Twice の実行結果を表\ref{tab:wice}、図\ref{fig:twice}に示す。
6c55961dcf0b update mir3636 parents: 56 diff changeset	443 CPU 実行の際は $2^{27}$ のデータを 64個のTask に分割して並列実行を行っている。
6c55961dcf0b update mir3636 parents: 56 diff changeset	444 GPU では1次元の block 数を $2^{15}$、 block 内の thread 数を $2^{10}$ で kernel の実行を行った。
6c55961dcf0b update mir3636 parents: 56 diff changeset	445 ここでの ``GPU`` は CPU、GPU 間のデータの通信時間も含めた時間、 ``GPU(kernel only)`` は kernel のみの実行時間である。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	446
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	447 \begin{table}[htbp]
6c55961dcf0b update mir3636 parents: 56 diff changeset	448 \begin{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	449 \begin{tabular}{\|l\|\|l\|} \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	450 Processor & Time(ms) \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	451 1 CPU & 1181.215 \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	452 2 CPUs & 627.914 \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	453 4 CPUs & 324.059 \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	454 8 CPUs & 159.932 \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	455 16 CPUs & 85.518\\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	456 32 CPUs & 43.496 \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	457 GPU & 127.018\\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	458 GPU(kernel only)& 6.018 \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	459 \end{tabular}
6c55961dcf0b update mir3636 parents: 56 diff changeset	460 \caption{$2^{27}$ のデータに対する Twice}
6c55961dcf0b update mir3636 parents: 56 diff changeset	461 \label{tab:twice}
6c55961dcf0b update mir3636 parents: 56 diff changeset	462 \end{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	463 \end{table}
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	464
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	465 \begin{figure}[htbp]
6c55961dcf0b update mir3636 parents: 56 diff changeset	466 \begin{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	467 \includegraphics[width=70mm]{./pic/twice.pdf}
6c55961dcf0b update mir3636 parents: 56 diff changeset	468 \end{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	469 \caption{$2^{27}$ のデータに対する Twice}
6c55961dcf0b update mir3636 parents: 56 diff changeset	470 \label{fig:twice}
6c55961dcf0b update mir3636 parents: 56 diff changeset	471 \end{figure}
6c55961dcf0b update mir3636 parents: 56 diff changeset	472
6c55961dcf0b update mir3636 parents: 56 diff changeset	473 ある程度の台数効果があると考えられる。
6c55961dcf0b update mir3636 parents: 56 diff changeset	474
6c55961dcf0b update mir3636 parents: 56 diff changeset	475 GPU での実行は kernel のみの実行時間は 32 CPU に比べて約 7.2 倍の速度向上が見られた。
6c55961dcf0b update mir3636 parents: 56 diff changeset	476 しかし、通信時間を含めると 16 CPU より遅い結果となってしまった。
6c55961dcf0b update mir3636 parents: 56 diff changeset	477 CPU、GPU の通信時間かオーバーヘッドになっている事がわかる。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	478
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	479 \subsection{BitonicSort}
6c55961dcf0b update mir3636 parents: 56 diff changeset	480 BitonicSort は並列処理向けのソートアルゴリズムである。
6c55961dcf0b update mir3636 parents: 56 diff changeset	481 代表的なソートアルゴリズムである Quick Sort も並列処理を行うことが可能であるが、 QuickSort ではソートの過程で並列度が変動するため、台数効果が出づらい。
6c55961dcf0b update mir3636 parents: 56 diff changeset	482 一方でBitonic Sort は最初から最後まで並列度が変わらずに並列処理を行う。
6c55961dcf0b update mir3636 parents: 56 diff changeset	483 図\ref{fig:bitonicNetwork} は要素数8のデータに対する BitonicSort のソートネットワークである。
6c55961dcf0b update mir3636 parents: 56 diff changeset	484
6c55961dcf0b update mir3636 parents: 56 diff changeset	485 \begin{figure}[htbp]
6c55961dcf0b update mir3636 parents: 56 diff changeset	486 \begin{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	487 \includegraphics[width=70mm]{./pic/bitonicNetwork.pdf}
6c55961dcf0b update mir3636 parents: 56 diff changeset	488 \end{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	489 \caption{要素数8の BitonicNetwork}
6c55961dcf0b update mir3636 parents: 56 diff changeset	490 \label{fig:bitonicNetwork}
6c55961dcf0b update mir3636 parents: 56 diff changeset	491 \end{figure}
6c55961dcf0b update mir3636 parents: 56 diff changeset	492
6c55961dcf0b update mir3636 parents: 56 diff changeset	493 BitonicSort はステージ毎に決まった2点間の要素の入れ替えを並列に実行することによってソートを行う。
6c55961dcf0b update mir3636 parents: 56 diff changeset	494 Gears OS ではこのステージ毎に Output Data Gear を書き出し、次のステージの Code Gear の Input Data Gear として記述することで BitonicSort を実現する。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	495
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	496 要素数$2^{24}$ のデータに対する BitonicSort の実行結果を表\ref{tab:bitonicSort}、図\ref{fig:bitonicSort}に示す。
6c55961dcf0b update mir3636 parents: 56 diff changeset	497 こちらも Twice と同じくCPU 実行の際は $2^{24}$ のデータを 64個のTask に分割して並列実行を行っている。
6c55961dcf0b update mir3636 parents: 56 diff changeset	498 つまり生成される Task は 64 * ステージ数となる。
6c55961dcf0b update mir3636 parents: 56 diff changeset	499 GPU では1次元の block 数を $2^{14}$、 block 内の thread 数を $2^{10}$ で kernel の実行を行った。
6c55961dcf0b update mir3636 parents: 56 diff changeset	500
6c55961dcf0b update mir3636 parents: 56 diff changeset	501 \begin{table}[htbp]
6c55961dcf0b update mir3636 parents: 56 diff changeset	502 \begin{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	503 \begin{tabular}{\|l\|\|l\|} \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	504 Processor & Time(s) \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	505 1 CPU & 41.416 \\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	506 2 CPUs & 23.340\\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	507 4 CPUs & 11.952\\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	508 8 CPUs & 6.320\\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	509 16 CPUs & 3.336\\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	510 32 CPUs & 1.872\\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	511 GPU & 5.420\\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	512 GPU(kernel only)& 0.163\\ \hline
6c55961dcf0b update mir3636 parents: 56 diff changeset	513 \end{tabular}
6c55961dcf0b update mir3636 parents: 56 diff changeset	514 \caption{$2^{24}$ のデータに対する BitonicSort}
6c55961dcf0b update mir3636 parents: 56 diff changeset	515 \label{tab:bitonicSort}
6c55961dcf0b update mir3636 parents: 56 diff changeset	516 \end{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	517 \end{table}
6c55961dcf0b update mir3636 parents: 56 diff changeset	518
6c55961dcf0b update mir3636 parents: 56 diff changeset	519 \begin{figure}[htbp]
6c55961dcf0b update mir3636 parents: 56 diff changeset	520 \begin{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	521 \includegraphics[width=70mm]{./pic/bitonicSort.pdf}
6c55961dcf0b update mir3636 parents: 56 diff changeset	522 \end{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	523 \caption{$2^{24}$ のデータに対する BitonicSort}
6c55961dcf0b update mir3636 parents: 56 diff changeset	524 \label{fig:bitonicSort}
6c55961dcf0b update mir3636 parents: 56 diff changeset	525 \end{figure}
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	526
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	527 1 CPU と 32 CPU で約22.12 倍の速度向上が見られた。
6c55961dcf0b update mir3636 parents: 56 diff changeset	528 GPU では通信時間を含めると 8 CPU の約1.16倍となり、 kernel のみの実行では 32 CPU の約11.48倍となった。
6c55961dcf0b update mir3636 parents: 56 diff changeset	529 現在の Gears OS の CUDA 実装では、 Output Data Gear を書き出す際に一度 GPU から CPU へ kernel の実行結果の書き出しを行っており、その処理の時間で差が出たと考えられ
6c55961dcf0b update mir3636 parents: 56 diff changeset	530 る。
6c55961dcf0b update mir3636 parents: 56 diff changeset	531 GPU で実行される Task 同士の依存関係の解決の際はCuDevicePtr などのGPU のメモリへのポインタを渡し、CPU でデータが必要になったときに初めて GPU から CPU へデータの通
6c55961dcf0b update mir3636 parents: 56 diff changeset	532 信を行うメタ計算の実装が必要となる。
6c55961dcf0b update mir3636 parents: 56 diff changeset	533
6c55961dcf0b update mir3636 parents: 56 diff changeset	534 \subsection{OpenMP との比較}
6c55961dcf0b update mir3636 parents: 56 diff changeset	535 OpenMP\cite{openmp} は C、 C++ のプログラムにアノテーションを付けることで並列化を行う。
6c55961dcf0b update mir3636 parents: 56 diff changeset	536 アノテーションを Code \ref{code:openMP} のように for 文の前につけることで、ループの並列化を行う。
6c55961dcf0b update mir3636 parents: 56 diff changeset	537
6c55961dcf0b update mir3636 parents: 56 diff changeset	538 \lstinputlisting[caption=OpenMP での Twice, label=code:openMP]{./src/openMP.c}
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	539
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	540 OpenMP は既存のコードにアノテーションを付けるだけで並列化を行えるため、変更が少なくて済む。
6c55961dcf0b update mir3636 parents: 56 diff changeset	541 しかし、ループのみの並列化ではプログラム全体の並列度が上がらずアムダールの法則により性能向上が頭打ちになってしまう。
6c55961dcf0b update mir3636 parents: 56 diff changeset	542 OpenMP はループの並列化ではなくブロック単位での並列実行もサポートしているが、アノテーションの記述が増えてしまう。
6c55961dcf0b update mir3636 parents: 56 diff changeset	543 また、 OpenMPはコードとデータを厳密に分離していないため、データの待ち合わせ処理をバリア等のアノテーションで記述する。
6c55961dcf0b update mir3636 parents: 56 diff changeset	544
6c55961dcf0b update mir3636 parents: 56 diff changeset	545 Gears OS では Input Data Gear が揃った Code Gear は並列に実行されるため、プログラム全体の並列度を高めることが出来る。
6c55961dcf0b update mir3636 parents: 56 diff changeset	546 また並列処理のコードとデータの依存関係を par goto 文で簡潔に記述することが出来る。
6c55961dcf0b update mir3636 parents: 56 diff changeset	547
6c55961dcf0b update mir3636 parents: 56 diff changeset	548 Gears OS と OpenMP で実装した Twice の実行結果の比較を図\ref{fig:vsopenmp} に示す。
6c55961dcf0b update mir3636 parents: 56 diff changeset	549 実行環境は表\ref{tab:powerEdge}、 $2^{27}$ のデータに対して行い、Gears OS 側は配列を 64個のTaskに分割し、OpenMP は for 文を static スケジュールで並列実行した。
6c55961dcf0b update mir3636 parents: 56 diff changeset	550 static スケジュールはループの回数をプロセッサーの数で分割し、並列実行を行う openMP のスケジュール方法である。
6c55961dcf0b update mir3636 parents: 56 diff changeset	551
6c55961dcf0b update mir3636 parents: 56 diff changeset	552 \begin{figure}[htbp]
6c55961dcf0b update mir3636 parents: 56 diff changeset	553 \begin{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	554 \includegraphics[width=70mm]{./pic/vsopenmp.pdf}
6c55961dcf0b update mir3636 parents: 56 diff changeset	555 \end{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	556 \caption{vs OpenMP}
6c55961dcf0b update mir3636 parents: 56 diff changeset	557 \label{fig:vsopenmp}
6c55961dcf0b update mir3636 parents: 56 diff changeset	558 \end{figure}
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	559
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	560 実行結果として OpenMP は 1CPUと 32CPU で約10.8 倍の速度向上がみられた。
6c55961dcf0b update mir3636 parents: 56 diff changeset	561 一方 Gears OS では約 27.1 倍の速度向上のため、台数効果が高くなっている。
6c55961dcf0b update mir3636 parents: 56 diff changeset	562 しかし、Gears OS は 1CPU での実行時間がOpenMP に比べて大幅に遅くなっている。
6c55961dcf0b update mir3636 parents: 56 diff changeset	563
6c55961dcf0b update mir3636 parents: 56 diff changeset	564 \subsection{Go 言語との比較}
6c55961dcf0b update mir3636 parents: 56 diff changeset	565 Go 言語は Google社が開発しているプログラミング言語である。
6c55961dcf0b update mir3636 parents: 56 diff changeset	566 Go 言語によるTwice の実装例を code \ref{code:go}に示す。
6c55961dcf0b update mir3636 parents: 56 diff changeset	567
6c55961dcf0b update mir3636 parents: 56 diff changeset	568 \lstinputlisting[caption=Go 言語での Twice, label=code:go]{./src/go.go}
6c55961dcf0b update mir3636 parents: 56 diff changeset	569
6c55961dcf0b update mir3636 parents: 56 diff changeset	570 Go 言語は並列実行を ``go function(argv)'' のような構文で行う。
6c55961dcf0b update mir3636 parents: 56 diff changeset	571 この並列実行を goroutine と呼ぶ。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	572
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	573 Go 言語は goroutin 間のデータ送受信をチャネルというデータ構造で行う。
6c55961dcf0b update mir3636 parents: 56 diff changeset	574 チャネルによるデータの送受信は ``\textless-'' を使って行われる。
6c55961dcf0b update mir3636 parents: 56 diff changeset	575 例えばチャネルのデータ構造であるchannel に対して ``channel \textless- data'' とすると、 data を channel に送信を行う。
6c55961dcf0b update mir3636 parents: 56 diff changeset	576 ``\textless- channel'' とすると、 channel から送信されたデータを1つ取り出す。
6c55961dcf0b update mir3636 parents: 56 diff changeset	577 channel にデータが送信されていない場合はchannel にデータが送信されるまで実行をブロックする。
6c55961dcf0b update mir3636 parents: 56 diff changeset	578 Go 言語はチャネルにより、データの送受信が簡潔に書ける。
6c55961dcf0b update mir3636 parents: 56 diff changeset	579 しかし、チャネルは複数の goroutine で参照できるためデータの送信元が推測しづらい。
6c55961dcf0b update mir3636 parents: 56 diff changeset	580
6c55961dcf0b update mir3636 parents: 56 diff changeset	581 Gears OS では goroutine は par goto 文とほぼ同等に扱うことが出来る。
6c55961dcf0b update mir3636 parents: 56 diff changeset	582 また、Code Gear は par goto 文で書き出す Output Data Gear を指定して実行するため、Data Gear の書き出し元が推測しやすい。
6c55961dcf0b update mir3636 parents: 56 diff changeset	583
6c55961dcf0b update mir3636 parents: 56 diff changeset	584 Go 言語での OpenMP と同様に Twice を実装しGears OS と比較を行う。
6c55961dcf0b update mir3636 parents: 56 diff changeset	585 こちらも実行環境は表\ref{tab:powerEdge}、 $2^{27}$ のデータに対して行い、Gears OS、Go 言語両方とも配列を64個のTask、 goroutineに分割して並列実行を行った。
6c55961dcf0b update mir3636 parents: 56 diff changeset	586
6c55961dcf0b update mir3636 parents: 56 diff changeset	587 \begin{figure}[ht]
6c55961dcf0b update mir3636 parents: 56 diff changeset	588 \begin{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	589 \includegraphics[width=70mm]{./pic/vsgo.pdf}
6c55961dcf0b update mir3636 parents: 56 diff changeset	590 \end{center}
6c55961dcf0b update mir3636 parents: 56 diff changeset	591 \caption{vs Go}
6c55961dcf0b update mir3636 parents: 56 diff changeset	592 \label{fig:vsgo}
6c55961dcf0b update mir3636 parents: 56 diff changeset	593 \end{figure}
6c55961dcf0b update mir3636 parents: 56 diff changeset	594
6c55961dcf0b update mir3636 parents: 56 diff changeset	595 実行結果として Go 言語は 1CPUと32CPU で約4.33 倍の速度向上が見られた。
6c55961dcf0b update mir3636 parents: 56 diff changeset	596
38 56602a19c10e update mir3636 parents: diff changeset	597
52 4d5bd76a70df fix mir3636 parents: 51 diff changeset	598 \section{結論}
4d5bd76a70df fix mir3636 parents: 51 diff changeset	599 本論文では Gears OS のプロトタイプの設計と実装、メタ計算である Context と stub の生成を行う Perl スクリプトの記述、並列実行機構の実装を行った。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	600 Code Gear 、Data Gear を処理とデータの単位として用いて Gears OS を設計した。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	601 Code Gear、Data Gear にはメタ計算を記述するための Meta Code Gear、Meta Data Gear が存在する。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	602 メタ計算を Meta Code Gear、によって行うことでメタ計算を階層化して行うことができる。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	603 Code Gear は関数より細かく分割されてるためメタ計算を柔軟に記述できる。
52 4d5bd76a70df fix mir3636 parents: 51 diff changeset	604 Gears OS は Code Gear と Input/Output Data Gear の組を Task とし、並列実行を行う。
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	605
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	606 Code Gear と Data Gear は Interface と呼ばれるまとまりとして記述される。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	607 Interface は使用される Data Gear の定義と、それに対する操作を行う Code Gear の集合である。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	608 Interface は複数の実装をもち、Meta Data Gear として定義される。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	609 従来の関数呼び出しでは引数をスタック上に構成し、関数の実装アドレスを Call するが、
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	610 Gears OS では引数は Context 上に用意された Interface の Data Gear に格納され、操作に対応する Code Gear に goto する。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	611
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	612 Context は使用する Code Gear、Data Gear をすべて格納している Meta Data Gear である。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	613 通常の計算から Context を直接扱うことはセキュリティ上好ましくない。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	614 このため Context から必要なデータを取り出して Code Gear に接続する Meta Code Gear である stub Code Gear を定義した。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	615 stub Code Gear は Code Gear 毎に記述され、Code Gear 間の遷移に挿入される。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	616
52 4d5bd76a70df fix mir3636 parents: 51 diff changeset	617 並列処理を行う際は Context を生成し、 Code Gear と Input/Output Data Gear を Context に設定して TaskManager 経由で各 Worker の SynchronizedQueue に送信される。
4d5bd76a70df fix mir3636 parents: 51 diff changeset	618 Context の設定はメタレベルの記述になるため、ノーマルレベルでは par goto 文という CbC の goto 文に近い記述で並列処理を行える。
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	619 この par goto は通常のプログラミングの関数呼び出しのように扱える。
52 4d5bd76a70df fix mir3636 parents: 51 diff changeset	620
40 e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	621 これらのメタ計算の記述は煩雑であるため Perl スクリプトによる自動生成を行なった。
e4bdf44eafc7 fix mir3636 parents: 38 diff changeset	622 これにより Gears OS のコードの煩雑さは改善され、ユーザーレベルではメタを意識する必要がなくなった。
38 56602a19c10e update mir3636 parents: diff changeset	623
57 6c55961dcf0b update mir3636 parents: 56 diff changeset	624 Twice と BitonicSort の例題の測定結果では 1CPU と 32CPU で Twice では約 27.1 倍、BitonicSort では約 22.12 倍の速度向上が見られた。
6c55961dcf0b update mir3636 parents: 56 diff changeset	625 また、GPU 実行の測定も行い、kernel のみの実行時間では 32 CPU より Twice では約 7.2 倍、BitonicSort では約 11.48 倍の速度向上がみられ、
6c55961dcf0b update mir3636 parents: 56 diff changeset	626 GPU の性能を活かすことができた。
6c55961dcf0b update mir3636 parents: 56 diff changeset	627
6c55961dcf0b update mir3636 parents: 56 diff changeset	628 今後の課題は、
6c55961dcf0b update mir3636 parents: 56 diff changeset	629 Go、OpenMP との比較から、 Gears OS が1CPU での動作が遅いということがわかった。
6c55961dcf0b update mir3636 parents: 56 diff changeset	630 Gears OS は par goto 文を使用することで Context を生成し、並列処理を行う。
6c55961dcf0b update mir3636 parents: 56 diff changeset	631 しかし、Context はメモリ空間の確保や使用する全ての Code/Data Gear を設定する必要があり、生成にある程度の時間がかかってしまう。
6c55961dcf0b update mir3636 parents: 56 diff changeset	632 そこで、 par goto のコンパイルタイミングで実行する Code Gear のフローをモデル検査で解析し、処理が軽い場合はContext を生成せずに、関数呼び出しを行う等の最適化を行>うといったチューニングが必要である。
6c55961dcf0b update mir3636 parents: 56 diff changeset	633
38 56602a19c10e update mir3636 parents: diff changeset	634
56602a19c10e update mir3636 parents: diff changeset	635 \nocite{*}
56602a19c10e update mir3636 parents: diff changeset	636 \bibliographystyle{ipsjunsrt}
56602a19c10e update mir3636 parents: diff changeset	637 \bibliography{sigos}
56602a19c10e update mir3636 parents: diff changeset	638
56602a19c10e update mir3636 parents: diff changeset	639 \end{document}

Mercurial > hg > Papers > 2018 > mitsuki-sigos

annotate Paper/sigos.tex @ 59:aa9be79a7569