annotate Paper/sigos.tex @ 59:aa9be79a7569

fix
author mir3636
date Sun, 22 Apr 2018 18:58:59 +0900
parents 0e42707ddeb2
children b40dda8f52e7
Ignore whitespace changes - Everywhere: Within whitespace: At end of lines:
rev   line source
38
mir3636
parents:
diff changeset
1 \documentclass[techrep]{ipsjpapers}
mir3636
parents:
diff changeset
2 \usepackage[dvipdfmx]{graphicx}
mir3636
parents:
diff changeset
3 \usepackage{url}
mir3636
parents:
diff changeset
4 \usepackage{listings,jlisting}
mir3636
parents:
diff changeset
5 \usepackage{enumitem}
mir3636
parents:
diff changeset
6
mir3636
parents:
diff changeset
7 \lstset{
mir3636
parents:
diff changeset
8 language=C,
mir3636
parents:
diff changeset
9 tabsize=2,
mir3636
parents:
diff changeset
10 frame=single,
mir3636
parents:
diff changeset
11 basicstyle={\ttfamily\footnotesize},%
mir3636
parents:
diff changeset
12 identifierstyle={\footnotesize},%
mir3636
parents:
diff changeset
13 commentstyle={\footnotesize\itshape},%
mir3636
parents:
diff changeset
14 keywordstyle={\footnotesize\bfseries},%
mir3636
parents:
diff changeset
15 ndkeywordstyle={\footnotesize},%
mir3636
parents:
diff changeset
16 stringstyle={\footnotesize\ttfamily},
mir3636
parents:
diff changeset
17 breaklines=true,
mir3636
parents:
diff changeset
18 captionpos=b,
mir3636
parents:
diff changeset
19 columns=[l]{fullflexible},%
mir3636
parents:
diff changeset
20 xrightmargin=0zw,%
mir3636
parents:
diff changeset
21 xleftmargin=1zw,%
mir3636
parents:
diff changeset
22 aboveskip=1zw,
mir3636
parents:
diff changeset
23 numberstyle={\scriptsize},%
mir3636
parents:
diff changeset
24 stepnumber=1,
mir3636
parents:
diff changeset
25 numbersep=0.5zw,%
mir3636
parents:
diff changeset
26 lineskip=-0.5ex,
mir3636
parents:
diff changeset
27 }
mir3636
parents:
diff changeset
28 \renewcommand{\lstlistingname}{Code}
42
mir3636
parents: 41
diff changeset
29 \usepackage{caption}
mir3636
parents: 41
diff changeset
30 \captionsetup[lstlisting]{font={small,tt}}
38
mir3636
parents:
diff changeset
31
mir3636
parents:
diff changeset
32 \input{dummy.tex} %% Font
mir3636
parents:
diff changeset
33
mir3636
parents:
diff changeset
34 % ユーザが定義したマクロなど.
mir3636
parents:
diff changeset
35 \makeatletter
mir3636
parents:
diff changeset
36
mir3636
parents:
diff changeset
37 \begin{document}
mir3636
parents:
diff changeset
38
mir3636
parents:
diff changeset
39 % 和文表題
mir3636
parents:
diff changeset
40 \title{Gears OS のモジュール化と並列 API}
mir3636
parents:
diff changeset
41 % 英文表題
mir3636
parents:
diff changeset
42 \etitle{}
mir3636
parents:
diff changeset
43
mir3636
parents:
diff changeset
44 % 所属ラベルの定義
mir3636
parents:
diff changeset
45 \affilabel{1}{琉球大学大学院理工学研究科情報工学専攻 \\Interdisciplinary Information Engineering, Graduate School of Engineering and Science, University of the Ryukyus.}
mir3636
parents:
diff changeset
46 \affilabel{2}{琉球大学工学部情報工学科\\Information Engineering, University of the Ryukyus.}
mir3636
parents:
diff changeset
47
mir3636
parents:
diff changeset
48 % 和文著者名
mir3636
parents:
diff changeset
49 \author{
mir3636
parents:
diff changeset
50 宮城 光希\affiref{1}
mir3636
parents:
diff changeset
51 \and
56
mir3636
parents: 55
diff changeset
52 桃原 優 \affiref{1}
mir3636
parents: 55
diff changeset
53 \and
38
mir3636
parents:
diff changeset
54 河野 真治\affiref{2}
mir3636
parents:
diff changeset
55 }
mir3636
parents:
diff changeset
56
mir3636
parents:
diff changeset
57 % 英文著者名
mir3636
parents:
diff changeset
58 \eauthor{
mir3636
parents:
diff changeset
59 Mitsuki MIYAGI\affiref{1}
mir3636
parents:
diff changeset
60 \and
56
mir3636
parents: 55
diff changeset
61 Yu TOBARU\affiref{1}
mir3636
parents: 55
diff changeset
62 \and
38
mir3636
parents:
diff changeset
63 Shinji KONO\affiref{2}
mir3636
parents:
diff changeset
64 }
mir3636
parents:
diff changeset
65
mir3636
parents:
diff changeset
66 % 連絡先(投稿時に必要.製版用では無視される.)
mir3636
parents:
diff changeset
67 \contact{宮城 光希\\
mir3636
parents:
diff changeset
68 〒903-0213 沖縄県西原町千原1番地\\
mir3636
parents:
diff changeset
69 琉球大学工学部情報工学科\\
mir3636
parents:
diff changeset
70 TEL: (098)895-2221\qquad FAX: (098)895-8727\\
mir3636
parents:
diff changeset
71 email: mir3636@cr.ie.u-ryukyu.ac.jp}
mir3636
parents:
diff changeset
72
mir3636
parents:
diff changeset
73 % 和文概要
mir3636
parents:
diff changeset
74 \begin{abstract}
mir3636
parents:
diff changeset
75 現代の OS では拡張性と信頼性を両立させることが要求されている。
mir3636
parents:
diff changeset
76 信頼性をノーマルレベルの計算に対して保証し、拡張性をメタレベルの計算で実現することを目標に Gears OS を設計中である。
mir3636
parents:
diff changeset
77 Gears OS は Continuation based C によってアプリケーションと OS そのものを記述する。
mir3636
parents:
diff changeset
78 CbC はこの Code Gear と Data Gear の単位でプログラムを記述する。
mir3636
parents:
diff changeset
79 システムやアプリケーションを記述するためにCode Gear と Data Gear を柔軟に再利用する必要がある。
mir3636
parents:
diff changeset
80 このときに機能を接続するAPIと実装の分離が可能であることが望ましい。
mir3636
parents:
diff changeset
81 Gears OS の信頼性を保証するために、形式化されたモジュールシステムを提供する必要がある。
45
48561c7a2036 add src
mir3636
parents: 44
diff changeset
82 本論文では、Interface を用いたモジュールシステムの説明とその応用としての並列 API について考察する。
38
mir3636
parents:
diff changeset
83 並列APIは継続を基本とした関数型プログラミングと両立する必要がある。
mir3636
parents:
diff changeset
84 ここでは、CbC の goto 文を拡張したpar goto 文を導入する。
mir3636
parents:
diff changeset
85 par goto では並列実行のための実行 Context を生成し、TaskScheduler に登録する。
mir3636
parents:
diff changeset
86 Gears OS での同期機構はData Gear の待ち合わせとして定義する。
mir3636
parents:
diff changeset
87 メタレベルではこれらの同期機能はCASとそれを用いて実装した Synchronized Queue になる。
mir3636
parents:
diff changeset
88 これらの Queue も Interface を用いてモジュール化されている。
mir3636
parents:
diff changeset
89 モジュール化の詳細と、有効性について考察する。
mir3636
parents:
diff changeset
90 \end{abstract}
mir3636
parents:
diff changeset
91
mir3636
parents:
diff changeset
92 % 英文概要
mir3636
parents:
diff changeset
93 \begin{eabstract}
mir3636
parents:
diff changeset
94 \end{eabstract}
mir3636
parents:
diff changeset
95
mir3636
parents:
diff changeset
96 % 表題などの出力
mir3636
parents:
diff changeset
97 \maketitle
mir3636
parents:
diff changeset
98
mir3636
parents:
diff changeset
99 % 本文はここから始まる
mir3636
parents:
diff changeset
100
40
mir3636
parents: 38
diff changeset
101 \section{OS の拡張性と信頼性の両立}
mir3636
parents: 38
diff changeset
102
43
mir3636
parents: 42
diff changeset
103 さまざまなコンピュータの信頼性の基本はメモリなどの資源管理を行う OS である。OS の信頼性を保証する事自体が難しいが、時代とともに進歩する
41
mir3636
parents: 40
diff changeset
104 ハードウェア、サービスに対応して OS 自体が拡張される必要がある。
mir3636
parents: 40
diff changeset
105 OS は非決定的な実行を持ち、その信頼性を保証するには、従来のテストとデバッグでは不十分であり、テストしきれない部分が残ってしまう。
mir3636
parents: 40
diff changeset
106 これに対処するためには、証明を用いる方法とプログラムの可能な実行をすべて数え上げるモデル検査を用いる方法がある。
mir3636
parents: 40
diff changeset
107 モデル検査は無限の状態ではなくても巨大な状態を調べることになり、状態を有限に制限したり状態を抽象化したりする方法が用いられている
40
mir3636
parents: 38
diff changeset
108 図\ref{fig:verification}。
mir3636
parents: 38
diff changeset
109 \begin{figure}[ht]
mir3636
parents: 38
diff changeset
110 \begin{center}
mir3636
parents: 38
diff changeset
111 \includegraphics[width=70mm]{./pic/verification.pdf}
mir3636
parents: 38
diff changeset
112 \end{center}
mir3636
parents: 38
diff changeset
113 \caption{証明とモデル検査によるOSの検証}
mir3636
parents: 38
diff changeset
114 \label{fig:verification}
mir3636
parents: 38
diff changeset
115 \end{figure}
mir3636
parents: 38
diff changeset
116
41
mir3636
parents: 40
diff changeset
117 証明やモデル検査を用いて OS を検証する方法はさまざまなものが検討されている。
mir3636
parents: 40
diff changeset
118 検証は一度ですむものではなく、アプリケーションやサービス、デバイスが新しくなることに検証をやり直す必要がある。
mir3636
parents: 40
diff changeset
119 つまり信頼性と拡張性を両立させることが重要である。
40
mir3636
parents: 38
diff changeset
120
41
mir3636
parents: 40
diff changeset
121 コンピュータの計算はプログラミング言語で記述されるが、その言語の実行は操作的意味論の定義などで規定される。
mir3636
parents: 40
diff changeset
122 プログラミング言語で記述される部分をノーマルレベルの計算と呼ぶ。
mir3636
parents: 40
diff changeset
123 コードが実行される時には、処理系の詳細や使用する資源、あるいは、コードの仕様や型などの言語以外の部分が服属する。
mir3636
parents: 40
diff changeset
124 これをメタレベルの計算という。
mir3636
parents: 40
diff changeset
125 この二つのレベルを同じ言語で記述できるようにして、ノーマルレベルの計算の信頼性をメタレベルから保証できるようにしたい。
40
mir3636
parents: 38
diff changeset
126 ノーマルレベルでの正当性を保証しつつ、新しく付け加えられたデバイスやプログラムを含む正当性を検証したい。
mir3636
parents: 38
diff changeset
127
55
mir3636
parents: 53
diff changeset
128 ノーマルレベルとメタレベルを共通して表現できる言語として Continuation based C(以下CbC)\cite{cbc}を用いる。
41
mir3636
parents: 40
diff changeset
129 CbC は関数呼出時の暗黙の環境(Environment)を使わずに、コードの単位を行き来できる引数付き goto 文(parametarized goto)を持つ C と互換性のある言語である。
mir3636
parents: 40
diff changeset
130 これを用いて、Code Gear と Data Gear、さらにそのメタ構造を導入する。
mir3636
parents: 40
diff changeset
131 これらを用いて、検証された Gears OS を構築したい。
40
mir3636
parents: 38
diff changeset
132 図\ref{fig:MetaGear}。
55
mir3636
parents: 53
diff changeset
133 検証には定理証明支援系である Agda を用いる。
mir3636
parents: 53
diff changeset
134 Gears の記述をモジュール化するために Interface を導入した。
mir3636
parents: 53
diff changeset
135 さらに並列処理の記述用にpar goto 構文を導入する。
mir3636
parents: 53
diff changeset
136 これらの機能は Agda 上で継続を用いた関数型プログラムに対応するようになっている。
40
mir3636
parents: 38
diff changeset
137 \begin{figure}[ht]
mir3636
parents: 38
diff changeset
138 \begin{center}
mir3636
parents: 38
diff changeset
139 \includegraphics[width=70mm]{./pic/MetaGear.pdf}
mir3636
parents: 38
diff changeset
140 \end{center}
mir3636
parents: 38
diff changeset
141 \caption{Gearsのメタ計算}
mir3636
parents: 38
diff changeset
142 \label{fig:MetaGear}
mir3636
parents: 38
diff changeset
143 \end{figure}
mir3636
parents: 38
diff changeset
144
55
mir3636
parents: 53
diff changeset
145 本論文では Interface と par goto の実装の詳細を記述し評価を行った。
mir3636
parents: 53
diff changeset
146 マルチ CPU と GPU 上での par goto 文の実行を確認した。
mir3636
parents: 53
diff changeset
147 %Go言語に比べて並列構文 par goto が遅いことがわかった。
40
mir3636
parents: 38
diff changeset
148
55
mir3636
parents: 53
diff changeset
149 \section{Gears におけるメタ計算}
mir3636
parents: 53
diff changeset
150 Gears OS ではメタ計算を柔軟に記述するためのプログラミング言語の単位として Code Gear、Data Gear という単位を用いる。
59
mir3636
parents: 58
diff changeset
151 Code Gear、Data Gear にはそれぞれメタレベルの単位である Meta Code Gear、Meta Data Gear が存在し、これらを用いてメタ計算を実現する。図\ref{fig:metaCS}
mir3636
parents: 58
diff changeset
152
mir3636
parents: 58
diff changeset
153 \begin{figure}[ht]
mir3636
parents: 58
diff changeset
154 \begin{center}
mir3636
parents: 58
diff changeset
155 \includegraphics[width=70mm]{./pic/metaCS.pdf}
mir3636
parents: 58
diff changeset
156 \end{center}
mir3636
parents: 58
diff changeset
157 \caption{Gears でのメタ計算}
mir3636
parents: 58
diff changeset
158 \label{fig:metaCS}
mir3636
parents: 58
diff changeset
159 \end{figure}
38
mir3636
parents:
diff changeset
160
55
mir3636
parents: 53
diff changeset
161 CbC は軽量継続 (goto文) による遷移を行うので、継続前の Code Gear に戻ることはなく、状態遷移ベースのプログラミングに適している。
mir3636
parents: 53
diff changeset
162 CbC は LLVM\cite{llvm} と GCC\cite{gcc} 上で実装されている。
mir3636
parents: 53
diff changeset
163 メタレベルの記述は Perl スクリプトによって生成される stub と goto meta によって Code Gear で記述される。
38
mir3636
parents:
diff changeset
164
mir3636
parents:
diff changeset
165 Code Gear と Data Gear は Interface と呼ばれるまとまりとして記述される。
mir3636
parents:
diff changeset
166 Interface は使用される Data Gear の定義と、それに対する操作を行う Code Gear の集合である。
55
mir3636
parents: 53
diff changeset
167 Interface 作成時に Code Gear の集合を指定することにより複数の実装を持つことができる。
mir3636
parents: 53
diff changeset
168 Interface の操作に対応する Code Gear の引数は Interface に定義されている Data Gear を通して指定される。
mir3636
parents: 53
diff changeset
169 一つの実行スレッド内で使われる Interface の Code Gear と Data Gear は Meta Data Gear に格納される。
mir3636
parents: 53
diff changeset
170 この Meta Data Gear を Context という。
mir3636
parents: 53
diff changeset
171 ノーマルレベルでは Context を直接見ることはできない。
38
mir3636
parents:
diff changeset
172
55
mir3636
parents: 53
diff changeset
173 Code Gear の継続は関数型プログラミングからみると継続先の Context を含む Closure となっている。
59
mir3636
parents: 58
diff changeset
174 これを記述するために継続に不定長引数を追加する構文をスクプリトの変換機能として用意した。Code \ref{varargnext}
55
mir3636
parents: 53
diff changeset
175 メタ計算側ではこれらの Context を常に持ち歩いているので goto 文で引数を用いることはなく、
mir3636
parents: 53
diff changeset
176 行き先は Code Gear の番号のみで指定される。
38
mir3636
parents:
diff changeset
177
58
mir3636
parents: 57
diff changeset
178 \lstinputlisting[label=varargnext, caption=不定長引数を持つ継続]{./src/varargnext.cbc}
55
mir3636
parents: 53
diff changeset
179
mir3636
parents: 53
diff changeset
180 これにより Interface 間の呼び出しを C++ のメソッド呼び出しのように記述することができる。
mir3636
parents: 53
diff changeset
181 Interface の実装は、Context 内に格納されているので、オブジェクトごとに実装を変える多様性を実現できている。
mir3636
parents: 53
diff changeset
182 呼び出された Code Gear は必要な引数を Context から取り出す必要がある。
mir3636
parents: 53
diff changeset
183 これは スクリプトで生成された stub Meta Code Gear で行われる。
38
mir3636
parents:
diff changeset
184 Gears OS でのメタ計算は stub と goto のメタ計算の2箇所で実現される。
mir3636
parents:
diff changeset
185
55
mir3636
parents: 53
diff changeset
186 Context を複製して複数の CPU に割り当てることにより並列実行を可能になる。
mir3636
parents: 53
diff changeset
187 これによりメタ計算として並列処理を記述したことになる。
mir3636
parents: 53
diff changeset
188 Gears のスレッド生成は Agda の関数型プログラミングに対応して行われるのが望ましい。
mir3636
parents: 53
diff changeset
189 そこで、par goto 構文を導入し、Agda の継続呼び出しに対応させることにした。
mir3636
parents: 53
diff changeset
190 par goto では Context の複製、入力の同期、タスクスケジューラーへの Context の登録などが行われる。
mir3636
parents: 53
diff changeset
191 par goto 文の継続として、スレッドの join に相当する \_\_exit を用意した。
mir3636
parents: 53
diff changeset
192 \_\_exit により par goto で分岐した Code Gear の出力を元のスレッドで受け取ることができる。
mir3636
parents: 53
diff changeset
193
mir3636
parents: 53
diff changeset
194 関数型プログラムではメモリ管理は GC などを通して暗黙に行われる。
mir3636
parents: 53
diff changeset
195 Gears OS ではメモリ管理は stub などのメタ計算部分で処理される。
mir3636
parents: 53
diff changeset
196 例えば、寿命の短いスレッドでは使い捨ての線形アロケーションを用いる。
38
mir3636
parents:
diff changeset
197
56
mir3636
parents: 55
diff changeset
198 %Meta Code Gear は通常の Code Gear の直後に遷移され、メタ計算を実行する。
mir3636
parents: 55
diff changeset
199 %これを図示したものが図\ref{fig:metaCS}である。
38
mir3636
parents:
diff changeset
200
mir3636
parents:
diff changeset
201 \section{Gears OS の構成}
mir3636
parents:
diff changeset
202 Gears OS は以下の要素で構成される。
mir3636
parents:
diff changeset
203
mir3636
parents:
diff changeset
204 \begin{itemize}
mir3636
parents:
diff changeset
205 \item Context
mir3636
parents:
diff changeset
206 \item TaskQueue
mir3636
parents:
diff changeset
207 \item TaskManager
mir3636
parents:
diff changeset
208 \item Worker
mir3636
parents:
diff changeset
209 \end{itemize}
mir3636
parents:
diff changeset
210
mir3636
parents:
diff changeset
211 図\ref{fig:gearsos} に Gears OS の構成図を示す。
mir3636
parents:
diff changeset
212
mir3636
parents:
diff changeset
213 \begin{figure}[ht]
mir3636
parents:
diff changeset
214 \begin{center}
mir3636
parents:
diff changeset
215 \includegraphics[width=70mm]{./pic/gears_structure}
mir3636
parents:
diff changeset
216 \end{center}
mir3636
parents:
diff changeset
217 \caption{Gears OS の構成図}
mir3636
parents:
diff changeset
218 \label{fig:gearsos}
mir3636
parents:
diff changeset
219 \end{figure}
mir3636
parents:
diff changeset
220
mir3636
parents:
diff changeset
221 Data Gear は union と struct によって表現される。
mir3636
parents:
diff changeset
222 Context には Data Gear の Data Type の情報が格納されている。
mir3636
parents:
diff changeset
223 この情報から確保する Data Gear のサイズなどを決定する。
mir3636
parents:
diff changeset
224
40
mir3636
parents: 38
diff changeset
225 Context は Task でもあり、Taskは通常のOSのスレッドに対応する。
mir3636
parents: 38
diff changeset
226 Task は実行する Code Gear と Data Gear をすべて持っている。
43
mir3636
parents: 42
diff changeset
227 TaskManager は Task を実行する Worker の生成、管理、Task の送信を行う。
40
mir3636
parents: 38
diff changeset
228 Gears OS における Task Queue は Synchronized Queue で実現される。
43
mir3636
parents: 42
diff changeset
229 Worker は TaskQueue から Task である Context を取得し、Task の Code Gear を実行し、Output Data Gear の書き出しを行っている。
mir3636
parents: 42
diff changeset
230 Input/Output Data Gear の依存関係が解決されたものから並列実行される。
38
mir3636
parents:
diff changeset
231
40
mir3636
parents: 38
diff changeset
232 \section{Interface}
mir3636
parents: 38
diff changeset
233 Interface は呼び出しの引数になる Data Gear の集合であり、そこで呼び出される Code Gear のエントリである。
mir3636
parents: 38
diff changeset
234 呼び出される Code Gear の引数となる Data Gear はここで全て定義される。
38
mir3636
parents:
diff changeset
235
40
mir3636
parents: 38
diff changeset
236 Code\ref{interface}は stack の Interface である。
mir3636
parents: 38
diff changeset
237 Code Gear、Data Gear に参照するために Context を通す必要があるが、
mir3636
parents: 38
diff changeset
238 Interface を記述することでデータ構造の api と Data Gear を結びつけることが出来る。
38
mir3636
parents:
diff changeset
239
40
mir3636
parents: 38
diff changeset
240 \lstinputlisting[label=interface, caption=StackのInterface]{./src/Stack.cbc}
38
mir3636
parents:
diff changeset
241
52
mir3636
parents: 51
diff changeset
242 Code\ref{implement}は stack の実装の例である。
mir3636
parents: 51
diff changeset
243 createImpl は関数呼び出しで呼び出され、初期化と Code Gear のスロットに対応する Code Gear の番号を入れる。
38
mir3636
parents:
diff changeset
244
52
mir3636
parents: 51
diff changeset
245 \lstinputlisting[label=implement, caption=SingleLinkedStackの実装]{./src/stackimpl.cbc}
38
mir3636
parents:
diff changeset
246
40
mir3636
parents: 38
diff changeset
247 \section{stub Code Gear の生成}
mir3636
parents: 38
diff changeset
248
38
mir3636
parents:
diff changeset
249 stub Code Gear は Code Gear 間の継続に挟まれる Code Gear が必要な Data Gear を Context から取り出す処理を行うものである。
mir3636
parents:
diff changeset
250 Code Gear 毎に記述する必要があり、そのCode Gear の引数を見て取り出す Data Gear を選択する。
mir3636
parents:
diff changeset
251 stub Code Gear を 自動生成する generate stub を Perl スクリプトで作成することによって Code Gear の記述量を約半分にすることができる。
mir3636
parents:
diff changeset
252
mir3636
parents:
diff changeset
253 stub を生成するために generate\_stub は指定された cbc ファイルの \_\_code型である Code Gear を取得し、引数から必要な Data Gear を選択する。
mir3636
parents:
diff changeset
254 generate\_stub は引数と interface を照らし合わせ、Gearef または GearImpl を決定する。
mir3636
parents:
diff changeset
255 また、この時既に stub Code Gear が記述されている Code Gear は無視される。
mir3636
parents:
diff changeset
256
mir3636
parents:
diff changeset
257 cbc ファイルから、生成した stub Code Gear を加えて stub を加えたコードに変換を行う。(Code\ref{stack_c})
mir3636
parents:
diff changeset
258
40
mir3636
parents: 38
diff changeset
259 \lstinputlisting[label=stack_c, caption=stub Code Gear を加えたコード]{./src/ex_stub}
38
mir3636
parents:
diff changeset
260
mir3636
parents:
diff changeset
261 \section{Context の生成}
mir3636
parents:
diff changeset
262 generate\_context は Context.h、Interface.cbc、generate\_stub で生成されたImpl.cbc を見て Context を生成する Perl スクリプトである。
mir3636
parents:
diff changeset
263
mir3636
parents:
diff changeset
264 \begin{figure}[ht]
mir3636
parents:
diff changeset
265 \begin{center}
mir3636
parents:
diff changeset
266 \includegraphics[width=70mm]{./pic/generate_context3.pdf}
mir3636
parents:
diff changeset
267 \end{center}
mir3636
parents:
diff changeset
268 \caption{generate\_context による Context の生成}
mir3636
parents:
diff changeset
269 \label{fig:gc}
mir3636
parents:
diff changeset
270 \end{figure}
mir3636
parents:
diff changeset
271
mir3636
parents:
diff changeset
272 Context は Meta Data Gear に相当し、Code Gear や Data Gear を管理している。
mir3636
parents:
diff changeset
273
mir3636
parents:
diff changeset
274 generate\_context は context の定義 (Code\ref{context}) を読み宣言されている Data Gear を取得する。
mir3636
parents:
diff changeset
275 Code Gear の取得は指定された generate\_stub で生成されたコードから \_\_code 型を見て行う。
mir3636
parents:
diff changeset
276 取得した Code Gear、Data Gear の enum の定義は enumCode.h、enumData.h に生成される。
mir3636
parents:
diff changeset
277
mir3636
parents:
diff changeset
278 Code/Data Gear の名前とポインタの対応は generate\_context によって生成される enum Code、enum Data を指定することで接続を行う。
49
mir3636
parents: 48
diff changeset
279 また、generate context は取得した Code/Data Gear から initContext の生成も行う。
38
mir3636
parents:
diff changeset
280
mir3636
parents:
diff changeset
281 Context には Allocation 等で生成した Data Gear へのポインタが格納されている。
mir3636
parents:
diff changeset
282 Code Gear は Context を通して Data Gear へアクセスする。
mir3636
parents:
diff changeset
283 Data Gear の Allocation を行うコードは dataGearInit.cに生成される。
mir3636
parents:
diff changeset
284
mir3636
parents:
diff changeset
285
43
mir3636
parents: 42
diff changeset
286 \section{Gears OS の並列処理}
mir3636
parents: 42
diff changeset
287 Gears OS では実行の Task を Code Gear と Input/Output Data Gear の組で表現する。
mir3636
parents: 42
diff changeset
288 Input/Output Data Gear によって依存関係が決定し、それにそって並列実行を行う。
mir3636
parents: 42
diff changeset
289 Gears OS では 並列実行する Task を Context で表現する。
mir3636
parents: 42
diff changeset
290 Context には Task 用の情報として、実行される Code Gear、Input/Output Data Gear の格納場所、待っている Input Data Gear のカウンタ等を持っている
mir3636
parents: 42
diff changeset
291 Task の Input Data Gear が揃っているかを TaskManager で判断し、 実行可能な Task を Worker に送信する。
mir3636
parents: 42
diff changeset
292 Worker は送信された Task が指定した Code Gear を実行し、Output Data Gear を書き出す。
mir3636
parents: 42
diff changeset
293
mir3636
parents: 42
diff changeset
294 \section{SynchronizedQueue}
mir3636
parents: 42
diff changeset
295 SynchronizedQueue は Worker の Queue として使用される。
mir3636
parents: 42
diff changeset
296 Worker の Queue は TaskManager を経由して Task を送信するスレッドと Task を取得する Worker 自身のスレッドで扱われる。
mir3636
parents: 42
diff changeset
297 そのため SynchronizedQueue はマルチスレッドでもデータの一貫性を保証する Queue を実装する必要がある。
mir3636
parents: 42
diff changeset
298
mir3636
parents: 42
diff changeset
299 データの一貫性を保証する解決例としての 1 つとしてロックを使った解決方法がある。
mir3636
parents: 42
diff changeset
300 しかし、ロックを行ってデータを更新した場合、同じ Queue に対して操作を行う際に待ち合わせが発生し、全体の並列度が下がってしまう。
mir3636
parents: 42
diff changeset
301 そこで、Gears OS ではデータの一貫性を保証するために CAS(Check and Set、Compare and Swap) を利用した Queue を実装している。
mir3636
parents: 42
diff changeset
302 CAS は値の比較、更新をアトミックに行う命令である。
mir3636
parents: 42
diff changeset
303 CAS を使う際は更新前の値と更新後の値を渡し、渡された更新前の値を実際に保存されているメモリ番地の値と比較し、同じならデータ競合がないため、データの更新に成功する。
mir3636
parents: 42
diff changeset
304 異なる場合は他に書き込みがあったとみなされ、値の更新に失敗する。
mir3636
parents: 42
diff changeset
305
46
mir3636
parents: 45
diff changeset
306 Gears OS ではこの CAS を行うための Interface を定義している(Code\ref{atomicInterface})。
45
48561c7a2036 add src
mir3636
parents: 44
diff changeset
307 この Interface では、Data Gear 全てを内包している Data 共用体のポインタの値を更新する CAS を定義して
46
mir3636
parents: 45
diff changeset
308 いる(Code\ref{atomicInterface} 6行目)。
45
48561c7a2036 add src
mir3636
parents: 44
diff changeset
309
46
mir3636
parents: 45
diff changeset
310 \lstinputlisting[label=atomicInterface, caption=AtomicInterface]{./src/atomicInterface.h}
45
48561c7a2036 add src
mir3636
parents: 44
diff changeset
311
46
mir3636
parents: 45
diff changeset
312 AtomicInterface での CAS の実際の実装を Code\ref{atomicImpl} に示す。
mir3636
parents: 45
diff changeset
313 実際の実装では \_\_sync\_bool\_compare\_and\_swap 関数を呼び出すことで CAS を行う(Code\ref{atomicImpl} 2行目)。
45
48561c7a2036 add src
mir3636
parents: 44
diff changeset
314 この関数は第一引数に渡されたアドレスに対して第二引数の値から第三引数の値ヘ CAS を行う。
48561c7a2036 add src
mir3636
parents: 44
diff changeset
315 CAS に成功した場合、true を返し、失敗した場合は false を返す。
46
mir3636
parents: 45
diff changeset
316 Code\ref{atomicImpl} では CAS に成功した場合と失敗した場合それぞれに対応した Code Gear へ継続する。
45
48561c7a2036 add src
mir3636
parents: 44
diff changeset
317
46
mir3636
parents: 45
diff changeset
318 \lstinputlisting[caption=CAS の実装, label=atomicImpl]{./src/atomicImpl.cbc}
45
48561c7a2036 add src
mir3636
parents: 44
diff changeset
319
46
mir3636
parents: 45
diff changeset
320 SynchronizedQueue の Data Gear の定義を Code\ref{synchronizedQueue} に示す。
45
48561c7a2036 add src
mir3636
parents: 44
diff changeset
321 SynchronizedQueue はデータのリストの先頭と、終端のポインタを持っている。
48561c7a2036 add src
mir3636
parents: 44
diff changeset
322 Queue を操作する際はこのポインタに対して CAS をすることでデータの挿入と取り出しを行う。
48561c7a2036 add src
mir3636
parents: 44
diff changeset
323
46
mir3636
parents: 45
diff changeset
324 \lstinputlisting[caption=SynchronizedQueue の定義, label=synchronizedQueue]{./src/synchronizedQueue.h}
45
48561c7a2036 add src
mir3636
parents: 44
diff changeset
325
43
mir3636
parents: 42
diff changeset
326 \section{並列構文}
51
7880e4a8895b add src
mir3636
parents: 50
diff changeset
327 Gears OS の並列構文は par goto文で用意されている(Code\ref{pargoto})。
7880e4a8895b add src
mir3636
parents: 50
diff changeset
328 \lstinputlisting[caption=par goto による並列実行, label=pargoto]{./src/parGotoCreateTask.cbc}
43
mir3636
parents: 42
diff changeset
329 par goto の引数には Input/Output Data Gear と 実行後に継続する \_\_exit を渡す。
mir3636
parents: 42
diff changeset
330 par goto で生成された Task は \_\_exit に継続することで終了する。
44
mir3636
parents: 43
diff changeset
331 par goto文でも 通常の goto 分と同様にメタへの goto 文へ置き換えられるが、par goto 文では通常の goto 文とは異なるメタへと継続する。
43
mir3636
parents: 42
diff changeset
332 Gears OS の Task は Output Data Gear を生成した時点で終了するので、par goto では直接 \_\_exit に継続するのではなく、
mir3636
parents: 42
diff changeset
333 Output Data Gear への書き出し処理(Commit)に継続される。
mir3636
parents: 42
diff changeset
334
44
mir3636
parents: 43
diff changeset
335 Code Gear は Input に指定した Data Gear が全て書き込まれると実行され、実行した結果を Output に指定した Data Gear に書き出しを行う。
mir3636
parents: 43
diff changeset
336 Code Gear の引数である\_\_next が持つ引数の Data Gear が Output Data Gear となる。
mir3636
parents: 43
diff changeset
337
43
mir3636
parents: 42
diff changeset
338 書き出し処理は Data Gear の Queue から、依存関係にある Task を参照する。
44
mir3636
parents: 43
diff changeset
339 参照した Task が持つ実行に必要な Input Data Gear カウンタのデクリメントを行う。
43
mir3636
parents: 42
diff changeset
340 カウンタが0になると Task が待っている Input Data Gear が揃ったことになり、
mir3636
parents: 42
diff changeset
341 その Task を TaskManager 経由で 実行される Worker に送信する。
mir3636
parents: 42
diff changeset
342
mir3636
parents: 42
diff changeset
343 この par goto 文は通常のプログラミングの関数呼び出しのように扱うことができる。
mir3636
parents: 42
diff changeset
344
mir3636
parents: 42
diff changeset
345
57
mir3636
parents: 56
diff changeset
346 %\section{比較}
mir3636
parents: 56
diff changeset
347 %
mir3636
parents: 56
diff changeset
348 %従来のプログラミングスタイルとの比較。
mir3636
parents: 56
diff changeset
349 %Gears のプログラミングは関数呼出を中心とするプログラミングとはかなり異なる。
mir3636
parents: 56
diff changeset
350 %Gears は関数呼出を禁止しているわけではなく、使用する資源の制御に問題がないなら普通に関数呼出して良い。
mir3636
parents: 56
diff changeset
351 %%Linux kernel などでは関数呼出の大半はインライン展開されることを期待してプログラミングされており、
mir3636
parents: 56
diff changeset
352 %関数呼出で予測できないスタックの爆発やCPU資源の浪費が起きないようにプログラミングされている。
mir3636
parents: 56
diff changeset
353 %Gears では Gears 間のプログラミングは戻り先や使用する資源を明示する必要がある。
mir3636
parents: 56
diff changeset
354 %
mir3636
parents: 56
diff changeset
355 %goto 文での引数は通常の関数呼出と異なり、スタック(環境)に積むことができない。引数に必要な情報を含むData Gearを
mir3636
parents: 56
diff changeset
356 %持ち歩くスタイルとなる。一つのインタフェース内部では、これらは共通している。実際、これらはメタレベルでは、
mir3636
parents: 56
diff changeset
357 %Context というMeta Data Gear にすべて格納されている。メタレベルは、Data Gear の詳細な型は使用されない。
mir3636
parents: 56
diff changeset
358 %ノーマルレベルに移行する際に stub Code Gear を通して詳細な型が接続される。
mir3636
parents: 56
diff changeset
359 %
mir3636
parents: 56
diff changeset
360 %インタフェースを再利用する際には、呼び出すインタフェースが持つ引数は保存される必要がある。これらは、実際には
mir3636
parents: 56
diff changeset
361 %Context 内にあるので自動的に保存されている。ノーマルレベルの記述では、... の部分にその意味が込めれている。
mir3636
parents: 56
diff changeset
362 %これは、可変長引数の...と同じ意味だと考えても良い。ただ、LLVM/GCC レベルでそれを実装するのは比較的難しい。
mir3636
parents: 56
diff changeset
363 %なので、今回はScriptによる変換を採用している。
mir3636
parents: 56
diff changeset
364 %
mir3636
parents: 56
diff changeset
365 %ノーマルレベルの記述と関数型プログラミングの記述の比較。Gear は必ず継続を渡す必要がある。これは一段の
mir3636
parents: 56
diff changeset
366 %関数呼出を許しているのと同等である。70年代の Fortan の関数呼出は決まった場所に戻り先を格納するので
mir3636
parents: 56
diff changeset
367 %再起呼出ができなかったのと同じである。例えば Code Gears 以下のような型を持つ。ここで t は継続の型である。
mir3636
parents: 56
diff changeset
368 %Stack は Stack を受けとる Stack \verb|->| t という Code Gear を継続として引数で受けとる。popStack はこの引数を
mir3636
parents: 56
diff changeset
369 %呼び出す。
mir3636
parents: 56
diff changeset
370 %
mir3636
parents: 56
diff changeset
371 %\verb|popStack : {a t : Set} -> Stack |
mir3636
parents: 56
diff changeset
372 %
mir3636
parents: 56
diff changeset
373 %\verb| -> (Stack -> t) -> t|
mir3636
parents: 56
diff changeset
374 %
mir3636
parents: 56
diff changeset
375 %つまり、Code Gear は制限された関数の形式を持っている。Data Gear は、関数型言語の直積や排他的論理和(Sum)を含むデータ型に
mir3636
parents: 56
diff changeset
376 %対応する。しかし、一つの Context で実行される Data Gear は、一つの巨大なSumに含まれるようになっている。これを
mir3636
parents: 56
diff changeset
377 %メタレベルでは、中の型の詳細に立ち入ることなく実行する。
mir3636
parents: 56
diff changeset
378 %
mir3636
parents: 56
diff changeset
379 %%Context はノーマルレベル のData Gear の他に様々なメタ情報を持つ。例えば、メモリ管理情報や実行される CPU 、あるいは、Task の
mir3636
parents: 56
diff changeset
380 %状態、待ち合わせている Data Gear などである。これらの情報は C やアセンブラのレベルで実装されるのと同時に、通常の Gear の
mir3636
parents: 56
diff changeset
381 %プログラミングにも対応する。例えば、CPU をかそうてきに Gears で記述すればソフトウェア的な並列実行を実現し、実際の
mir3636
parents: 56
diff changeset
382 %GPU を用いれば GPU による並列実行となる。この実行をモデル検査的な状態数え上げに対応させればモデル検査を実行できる。
mir3636
parents: 56
diff changeset
383 %
mir3636
parents: 56
diff changeset
384 %Haskell などを実行可能仕様記述として用いる OS の検証\cite{Klein:2009:SFV:1629575.1629596,Chen:2015:UCH:2815400.2815402}と、Code Gear を用いる手法は類似>しているが、Code Gear の場合は、
mir3636
parents: 56
diff changeset
385 %記述を制限し、Code と仕様の対応、さらにCodeと資源の対応が明確になる利点がある。
mir3636
parents: 56
diff changeset
386 %
mir3636
parents: 56
diff changeset
387 %型つきアセンブラ\cite{Yang:2010:SLI:1806596.1806610}は、より低レベルの関数型の記述であると言える。アセンブラの記述自体は小さく扱いやすいが、
mir3636
parents: 56
diff changeset
388 %OS レベルあるいはアプリケーションレベルからの距離が大きい。型の整合性を保証するだけでは OS の検証としては
mir3636
parents: 56
diff changeset
389 %不十分なので、証明やモデル検査を用いることになるが、記述量が多いのが、その際に欠点となる。
mir3636
parents: 56
diff changeset
390 %Code Gear は、より大きな単位であり、プログラミングレベルの抽象化が可能になっているので、これらの記述の
mir3636
parents: 56
diff changeset
391 %大きさの欠点をカバーできる可能性がある。
mir3636
parents: 56
diff changeset
392 %
mir3636
parents: 56
diff changeset
393 %証明手法は、従来では Hoare Logic \cite{Chen:2015:UCH:2815400.2815402}のような Post Condition / Pre Condition を用いる方法が使われている。
mir3636
parents: 56
diff changeset
394 %現在のGearsは、Agda への変換は考えているが、その上の具体的な証明方法はまだ用意されていない。
mir3636
parents: 56
diff changeset
395 %
40
mir3636
parents: 38
diff changeset
396
57
mir3636
parents: 56
diff changeset
397 \section{Gears OS の評価}
mir3636
parents: 56
diff changeset
398
mir3636
parents: 56
diff changeset
399 \subsection{実験環境}
mir3636
parents: 56
diff changeset
400 今回 Twice、 BitonicSort をそれぞれ CPU、GPU環境で Gears OS の測定を行う。
mir3636
parents: 56
diff changeset
401
mir3636
parents: 56
diff changeset
402 使用する実験環境を表\ref{tab:powerEdge}、 GPU 環境を表\ref{tab:gtx1070} に示す。
mir3636
parents: 56
diff changeset
403 また、今回は LLVM/Clang で実装した CbC コンパイラを用いて Gears OS をコンパイルする。
40
mir3636
parents: 38
diff changeset
404
57
mir3636
parents: 56
diff changeset
405 \begin{table}[htbp]
mir3636
parents: 56
diff changeset
406 \begin{center}
mir3636
parents: 56
diff changeset
407 \begin{tabular}{|l|l|} \hline
mir3636
parents: 56
diff changeset
408 Model & Dell PowerEdgeR630 \\ \hline
mir3636
parents: 56
diff changeset
409 OS & CentOS 7.4.1708 \\ \hline
mir3636
parents: 56
diff changeset
410 Memory & 768GB \\ \hline
mir3636
parents: 56
diff changeset
411 CPU & 2 x 18-Core Intel Xeon 2.30GHz \\ \hline
mir3636
parents: 56
diff changeset
412 \end{tabular}
mir3636
parents: 56
diff changeset
413 \caption{実行環境}
mir3636
parents: 56
diff changeset
414 \label{tab:powerEdge}
mir3636
parents: 56
diff changeset
415 \end{center}
mir3636
parents: 56
diff changeset
416 \end{table}
mir3636
parents: 56
diff changeset
417
mir3636
parents: 56
diff changeset
418 \begin{table}[htbp]
mir3636
parents: 56
diff changeset
419 \begin{center}
mir3636
parents: 56
diff changeset
420 \begin{tabular}{|l||l|} \hline
mir3636
parents: 56
diff changeset
421 GPU & GeForce GTX 1070 \\ \hline
mir3636
parents: 56
diff changeset
422 Cores & 1920 \\ \hline
mir3636
parents: 56
diff changeset
423 Clock Speed & 1683MHz \\ \hline
mir3636
parents: 56
diff changeset
424 Memory Size & 8GB GDDR5 \\ \hline
mir3636
parents: 56
diff changeset
425 Memory Bandwidth & 256GB/s \\ \hline
mir3636
parents: 56
diff changeset
426 \end{tabular}
mir3636
parents: 56
diff changeset
427 \caption{GPU 環境}
mir3636
parents: 56
diff changeset
428 \label{tab:gtx1070}
mir3636
parents: 56
diff changeset
429 \end{center}
mir3636
parents: 56
diff changeset
430 \end{table}
mir3636
parents: 56
diff changeset
431
mir3636
parents: 56
diff changeset
432 \subsection{Twice}
mir3636
parents: 56
diff changeset
433 Twice は与えられた整数配列のすべての要素を2倍にする例題である。
40
mir3636
parents: 38
diff changeset
434
57
mir3636
parents: 56
diff changeset
435 Twice の Task は Gears OS のデータ並列で実行される。
mir3636
parents: 56
diff changeset
436 CPU の場合は配列ある程度の範囲に分割してTaskを生成する。
mir3636
parents: 56
diff changeset
437 これは要素毎に Task を生成するとその分の Context を生成するために時間を取ってしまうからである。
mir3636
parents: 56
diff changeset
438
mir3636
parents: 56
diff changeset
439 Twice は並列実行の依存関係もなく、データ並列での実行に適した課題である。
mir3636
parents: 56
diff changeset
440 そのため、 通信時間を考慮しなければ CPU よりコア数が多い GPU が有利となる。
mir3636
parents: 56
diff changeset
441
mir3636
parents: 56
diff changeset
442 要素数$2^{27}$ のデータに対する Twice の実行結果を 表\ref{tab:wice}、図\ref{fig:twice}に示す。
mir3636
parents: 56
diff changeset
443 CPU 実行の際は $2^{27}$ のデータを 64個のTask に分割して並列実行を行っている。
mir3636
parents: 56
diff changeset
444 GPU では1次元の block 数を $2^{15}$、 block 内の thread 数を $2^{10}$ で kernel の実行を行った。
mir3636
parents: 56
diff changeset
445 ここでの ``GPU`` は CPU、GPU 間のデータの通信時間も含めた時間、 ``GPU(kernel only)`` は kernel のみの実行時間である。
40
mir3636
parents: 38
diff changeset
446
57
mir3636
parents: 56
diff changeset
447 \begin{table}[htbp]
mir3636
parents: 56
diff changeset
448 \begin{center}
mir3636
parents: 56
diff changeset
449 \begin{tabular}{|l||l|} \hline
mir3636
parents: 56
diff changeset
450 Processor & Time(ms) \\ \hline
mir3636
parents: 56
diff changeset
451 1 CPU & 1181.215 \\ \hline
mir3636
parents: 56
diff changeset
452 2 CPUs & 627.914 \\ \hline
mir3636
parents: 56
diff changeset
453 4 CPUs & 324.059 \\ \hline
mir3636
parents: 56
diff changeset
454 8 CPUs & 159.932 \\ \hline
mir3636
parents: 56
diff changeset
455 16 CPUs & 85.518\\ \hline
mir3636
parents: 56
diff changeset
456 32 CPUs & 43.496 \\ \hline
mir3636
parents: 56
diff changeset
457 GPU & 127.018\\ \hline
mir3636
parents: 56
diff changeset
458 GPU(kernel only)& 6.018 \\ \hline
mir3636
parents: 56
diff changeset
459 \end{tabular}
mir3636
parents: 56
diff changeset
460 \caption{$2^{27}$ のデータに対する Twice}
mir3636
parents: 56
diff changeset
461 \label{tab:twice}
mir3636
parents: 56
diff changeset
462 \end{center}
mir3636
parents: 56
diff changeset
463 \end{table}
40
mir3636
parents: 38
diff changeset
464
57
mir3636
parents: 56
diff changeset
465 \begin{figure}[htbp]
mir3636
parents: 56
diff changeset
466 \begin{center}
mir3636
parents: 56
diff changeset
467 \includegraphics[width=70mm]{./pic/twice.pdf}
mir3636
parents: 56
diff changeset
468 \end{center}
mir3636
parents: 56
diff changeset
469 \caption{$2^{27}$ のデータに対する Twice}
mir3636
parents: 56
diff changeset
470 \label{fig:twice}
mir3636
parents: 56
diff changeset
471 \end{figure}
mir3636
parents: 56
diff changeset
472
mir3636
parents: 56
diff changeset
473 ある程度の台数効果があると考えられる。
mir3636
parents: 56
diff changeset
474
mir3636
parents: 56
diff changeset
475 GPU での実行は kernel のみの実行時間は 32 CPU に比べて 約 7.2 倍の速度向上が見られた。
mir3636
parents: 56
diff changeset
476 しかし、通信時間を含めると 16 CPU より遅い結果となってしまった。
mir3636
parents: 56
diff changeset
477 CPU、GPU の通信時間かオーバーヘッドになっている事がわかる。
40
mir3636
parents: 38
diff changeset
478
57
mir3636
parents: 56
diff changeset
479 \subsection{BitonicSort}
mir3636
parents: 56
diff changeset
480 BitonicSort は並列処理向けのソートアルゴリズムである。
mir3636
parents: 56
diff changeset
481 代表的なソートアルゴリズムである Quick Sort も並列処理 を行うことが可能であるが、 QuickSort では ソートの過程で並列度が変動するため、台数効果が出づらい。
mir3636
parents: 56
diff changeset
482 一方でBitonic Sort は最初から最後まで並列度が変わらずに並列処理を行う。
mir3636
parents: 56
diff changeset
483 図\ref{fig:bitonicNetwork} は要素数8のデータに対する BitonicSort のソートネットワークである。
mir3636
parents: 56
diff changeset
484
mir3636
parents: 56
diff changeset
485 \begin{figure}[htbp]
mir3636
parents: 56
diff changeset
486 \begin{center}
mir3636
parents: 56
diff changeset
487 \includegraphics[width=70mm]{./pic/bitonicNetwork.pdf}
mir3636
parents: 56
diff changeset
488 \end{center}
mir3636
parents: 56
diff changeset
489 \caption{要素数8の BitonicNetwork}
mir3636
parents: 56
diff changeset
490 \label{fig:bitonicNetwork}
mir3636
parents: 56
diff changeset
491 \end{figure}
mir3636
parents: 56
diff changeset
492
mir3636
parents: 56
diff changeset
493 BitonicSort はステージ毎に決まった2点間の要素の入れ替えを並列に実行することによってソートを行う。
mir3636
parents: 56
diff changeset
494 Gears OS ではこのステージ毎に Output Data Gear を書き出し、 次のステージの Code Gear の Input Data Gear として記述することで BitonicSort を実現する。
40
mir3636
parents: 38
diff changeset
495
57
mir3636
parents: 56
diff changeset
496 要素数$2^{24}$ のデータに対する BitonicSort の実行結果を 表\ref{tab:bitonicSort}、図\ref{fig:bitonicSort}に示す。
mir3636
parents: 56
diff changeset
497 こちらも Twice と同じくCPU 実行の際は $2^{24}$ のデータを 64個のTask に分割して並列実行を行っている。
mir3636
parents: 56
diff changeset
498 つまり生成される Task は 64 * ステージ数 となる。
mir3636
parents: 56
diff changeset
499 GPU では1次元の block 数を $2^{14}$、 block 内の thread 数を $2^{10}$ で kernel の実行を行った。
mir3636
parents: 56
diff changeset
500
mir3636
parents: 56
diff changeset
501 \begin{table}[htbp]
mir3636
parents: 56
diff changeset
502 \begin{center}
mir3636
parents: 56
diff changeset
503 \begin{tabular}{|l||l|} \hline
mir3636
parents: 56
diff changeset
504 Processor & Time(s) \\ \hline
mir3636
parents: 56
diff changeset
505 1 CPU & 41.416 \\ \hline
mir3636
parents: 56
diff changeset
506 2 CPUs & 23.340\\ \hline
mir3636
parents: 56
diff changeset
507 4 CPUs & 11.952\\ \hline
mir3636
parents: 56
diff changeset
508 8 CPUs & 6.320\\ \hline
mir3636
parents: 56
diff changeset
509 16 CPUs & 3.336\\ \hline
mir3636
parents: 56
diff changeset
510 32 CPUs & 1.872\\ \hline
mir3636
parents: 56
diff changeset
511 GPU & 5.420\\ \hline
mir3636
parents: 56
diff changeset
512 GPU(kernel only)& 0.163\\ \hline
mir3636
parents: 56
diff changeset
513 \end{tabular}
mir3636
parents: 56
diff changeset
514 \caption{$2^{24}$ のデータに対する BitonicSort}
mir3636
parents: 56
diff changeset
515 \label{tab:bitonicSort}
mir3636
parents: 56
diff changeset
516 \end{center}
mir3636
parents: 56
diff changeset
517 \end{table}
mir3636
parents: 56
diff changeset
518
mir3636
parents: 56
diff changeset
519 \begin{figure}[htbp]
mir3636
parents: 56
diff changeset
520 \begin{center}
mir3636
parents: 56
diff changeset
521 \includegraphics[width=70mm]{./pic/bitonicSort.pdf}
mir3636
parents: 56
diff changeset
522 \end{center}
mir3636
parents: 56
diff changeset
523 \caption{$2^{24}$ のデータに対する BitonicSort}
mir3636
parents: 56
diff changeset
524 \label{fig:bitonicSort}
mir3636
parents: 56
diff changeset
525 \end{figure}
40
mir3636
parents: 38
diff changeset
526
57
mir3636
parents: 56
diff changeset
527 1 CPU と 32 CPU で 約22.12 倍 の速度向上が見られた。
mir3636
parents: 56
diff changeset
528 GPU では通信時間を含めると 8 CPU の約1.16倍となり、 kernel のみの実行では 32 CPU の約11.48倍となった。
mir3636
parents: 56
diff changeset
529 現在の Gears OS の CUDA 実装では、 Output Data Gear を書き出す際に一度 GPU から CPU へ kernel の実行結果の書き出しを行っており、その処理の時間で差が出たと考えられ
mir3636
parents: 56
diff changeset
530 る。
mir3636
parents: 56
diff changeset
531 GPU で実行される Task 同士の依存関係の解決の際はCuDevicePtr などのGPU のメモリへのポインタを渡し、CPU でデータが必要になったときに初めて GPU から CPU へデータの通
mir3636
parents: 56
diff changeset
532 信を行うメタ計算の実装が必要となる。
mir3636
parents: 56
diff changeset
533
mir3636
parents: 56
diff changeset
534 \subsection{OpenMP との比較}
mir3636
parents: 56
diff changeset
535 OpenMP\cite{openmp} は C、 C++ のプログラムにアノテーションを付けることで並列化を行う。
mir3636
parents: 56
diff changeset
536 アノテーションを Code \ref{code:openMP} のように for 文の前につけることで、ループの並列化を行う。
mir3636
parents: 56
diff changeset
537
mir3636
parents: 56
diff changeset
538 \lstinputlisting[caption=OpenMP での Twice, label=code:openMP]{./src/openMP.c}
40
mir3636
parents: 38
diff changeset
539
57
mir3636
parents: 56
diff changeset
540 OpenMP は既存のコードにアノテーションを付けるだけで並列化を行えるため、変更が少なくて済む。
mir3636
parents: 56
diff changeset
541 しかし、 ループのみの並列化ではプログラム全体の並列度が上がらずアムダールの法則により性能向上が頭打ちになってしまう。
mir3636
parents: 56
diff changeset
542 OpenMP はループの並列化 ではなくブロック単位での並列実行もサポートしているが、アノテーションの記述が増えてしまう。
mir3636
parents: 56
diff changeset
543 また、 OpenMPはコードとデータを厳密に分離していないため、データの待ち合わせ処理をバリア等のアノテーションで記述する。
mir3636
parents: 56
diff changeset
544
mir3636
parents: 56
diff changeset
545 Gears OS では Input Data Gear が揃った Code Gear は並列に実行されるため、プログラム全体の並列度を高めることが出来る。
mir3636
parents: 56
diff changeset
546 また 並列処理のコードとデータの依存関係を par goto 文で簡潔に記述することが出来る。
mir3636
parents: 56
diff changeset
547
mir3636
parents: 56
diff changeset
548 Gears OS と OpenMP で実装した Twice の実行結果の比較を図\ref{fig:vsopenmp} に示す。
mir3636
parents: 56
diff changeset
549 実行環境は 表\ref{tab:powerEdge}、 $2^{27}$ のデータに対して行い、Gears OS 側は配列を 64個のTaskに分割し、OpenMP は for 文を static スケジュールで並列実行した。
mir3636
parents: 56
diff changeset
550 static スケジュールはループの回数をプロセッサーの数で分割し、並列実行を行う openMP のスケジュール方法である。
mir3636
parents: 56
diff changeset
551
mir3636
parents: 56
diff changeset
552 \begin{figure}[htbp]
mir3636
parents: 56
diff changeset
553 \begin{center}
mir3636
parents: 56
diff changeset
554 \includegraphics[width=70mm]{./pic/vsopenmp.pdf}
mir3636
parents: 56
diff changeset
555 \end{center}
mir3636
parents: 56
diff changeset
556 \caption{vs OpenMP}
mir3636
parents: 56
diff changeset
557 \label{fig:vsopenmp}
mir3636
parents: 56
diff changeset
558 \end{figure}
40
mir3636
parents: 38
diff changeset
559
57
mir3636
parents: 56
diff changeset
560 実行結果として OpenMP は 1CPUと 32CPU で約10.8 倍の速度向上がみられた。
mir3636
parents: 56
diff changeset
561 一方 Gears OS では約 27.1 倍の速度向上のため、台数効果が高くなっている。
mir3636
parents: 56
diff changeset
562 しかし、Gears OS は 1CPU での実行時間がOpenMP に比べて大幅に遅くなっている。
mir3636
parents: 56
diff changeset
563
mir3636
parents: 56
diff changeset
564 \subsection{Go 言語との比較}
mir3636
parents: 56
diff changeset
565 Go 言語 は Google社が開発しているプログラミング言語である。
mir3636
parents: 56
diff changeset
566 Go 言語によるTwice の実装例を code \ref{code:go}に示す。
mir3636
parents: 56
diff changeset
567
mir3636
parents: 56
diff changeset
568 \lstinputlisting[caption=Go 言語での Twice, label=code:go]{./src/go.go}
mir3636
parents: 56
diff changeset
569
mir3636
parents: 56
diff changeset
570 Go 言語は並列実行を ``go function(argv)'' のような構文で行う。
mir3636
parents: 56
diff changeset
571 この並列実行を goroutine と呼ぶ。
40
mir3636
parents: 38
diff changeset
572
57
mir3636
parents: 56
diff changeset
573 Go 言語は goroutin 間のデータ送受信をチャネルというデータ構造で行う。
mir3636
parents: 56
diff changeset
574 チャネルによるデータの送受信は ``\textless-'' を使って行われる。
mir3636
parents: 56
diff changeset
575 例えばチャネルのデータ構造であるchannel に対して ``channel \textless- data'' とすると、 data を channel に送信を行う。
mir3636
parents: 56
diff changeset
576 ``\textless- channel'' とすると、 channel から送信されたデータを1つ取り出す。
mir3636
parents: 56
diff changeset
577 channel にデータが送信されていない場合はchannel にデータが送信されるまで実行をブロックする。
mir3636
parents: 56
diff changeset
578 Go 言語はチャネルにより、データの送受信が簡潔に書ける。
mir3636
parents: 56
diff changeset
579 しかし、チャネルは複数の goroutine で参照できるためデータの送信元が推測しづらい。
mir3636
parents: 56
diff changeset
580
mir3636
parents: 56
diff changeset
581 Gears OS では goroutine は par goto 文とほぼ同等に扱うことが出来る。
mir3636
parents: 56
diff changeset
582 また、Code Gear は par goto 文で書き出す Output Data Gear を指定して実行するため、Data Gear の書き出し元が推測しやすい。
mir3636
parents: 56
diff changeset
583
mir3636
parents: 56
diff changeset
584 Go 言語での OpenMP と同様に Twice を実装しGears OS と比較を行う。
mir3636
parents: 56
diff changeset
585 こちらも実行環境は 表\ref{tab:powerEdge}、 $2^{27}$ のデータに対して行い、Gears OS、Go 言語両方とも配列を64個のTask、 goroutineに分割して並列実行を行った。
mir3636
parents: 56
diff changeset
586
mir3636
parents: 56
diff changeset
587 \begin{figure}[ht]
mir3636
parents: 56
diff changeset
588 \begin{center}
mir3636
parents: 56
diff changeset
589 \includegraphics[width=70mm]{./pic/vsgo.pdf}
mir3636
parents: 56
diff changeset
590 \end{center}
mir3636
parents: 56
diff changeset
591 \caption{vs Go}
mir3636
parents: 56
diff changeset
592 \label{fig:vsgo}
mir3636
parents: 56
diff changeset
593 \end{figure}
mir3636
parents: 56
diff changeset
594
mir3636
parents: 56
diff changeset
595 実行結果として Go 言語は 1CPUと32CPU で約4.33 倍の速度向上が見られた。
mir3636
parents: 56
diff changeset
596
38
mir3636
parents:
diff changeset
597
52
mir3636
parents: 51
diff changeset
598 \section{結論}
mir3636
parents: 51
diff changeset
599 本論文では Gears OS のプロトタイプの設計と実装、メタ計算である Context と stub の生成を行う Perl スクリプトの記述、並列実行機構の実装を行った。
40
mir3636
parents: 38
diff changeset
600 Code Gear 、Data Gear を処理とデータの単位として用いて Gears OS を設計した。
mir3636
parents: 38
diff changeset
601 Code Gear、Data Gear にはメタ計算を記述するための Meta Code Gear、Meta Data Gear が存在する。
mir3636
parents: 38
diff changeset
602 メタ計算を Meta Code Gear、によって行うことでメタ計算を階層化して行うことができる。
mir3636
parents: 38
diff changeset
603 Code Gear は関数より細かく分割されてるためメタ計算を柔軟に記述できる。
52
mir3636
parents: 51
diff changeset
604 Gears OS は Code Gear と Input/Output Data Gear の組を Task とし、並列実行を行う。
40
mir3636
parents: 38
diff changeset
605
mir3636
parents: 38
diff changeset
606 Code Gear と Data Gear は Interface と呼ばれるまとまりとして記述される。
mir3636
parents: 38
diff changeset
607 Interface は使用される Data Gear の定義と、それに対する操作を行う Code Gear の集合である。
mir3636
parents: 38
diff changeset
608 Interface は複数の実装をもち、Meta Data Gear として定義される。
mir3636
parents: 38
diff changeset
609 従来の関数呼び出しでは引数をスタック上に構成し、関数の実装アドレスを Call するが、
mir3636
parents: 38
diff changeset
610 Gears OS では引数は Context 上に用意された Interface の Data Gear に格納され、操作に対応する Code Gear に goto する。
mir3636
parents: 38
diff changeset
611
mir3636
parents: 38
diff changeset
612 Context は使用する Code Gear、Data Gear をすべて格納している Meta Data Gear である。
mir3636
parents: 38
diff changeset
613 通常の計算から Context を直接扱うことはセキュリティ上好ましくない。
mir3636
parents: 38
diff changeset
614 このため Context から必要なデータを取り出して Code Gear に接続する Meta Code Gear である stub Code Gear を定義した。
mir3636
parents: 38
diff changeset
615 stub Code Gear は Code Gear 毎に記述され、Code Gear 間の遷移に挿入される。
mir3636
parents: 38
diff changeset
616
52
mir3636
parents: 51
diff changeset
617 並列処理を行う際は Context を生成し、 Code Gear と Input/Output Data Gear を Context に設定して TaskManager 経由で各 Worker の SynchronizedQueue に送信される。
mir3636
parents: 51
diff changeset
618 Context の設定はメタレベルの記述になるため、ノーマルレベルでは par goto 文という CbC の goto 文に近い記述で並列処理を行える。
57
mir3636
parents: 56
diff changeset
619 この par goto は通常のプログラミングの関数呼び出しのように扱える。
52
mir3636
parents: 51
diff changeset
620
40
mir3636
parents: 38
diff changeset
621 これらのメタ計算の記述は煩雑であるため Perl スクリプトによる自動生成を行なった。
mir3636
parents: 38
diff changeset
622 これにより Gears OS のコードの煩雑さは改善され、ユーザーレベルではメタを意識する必要がなくなった。
38
mir3636
parents:
diff changeset
623
57
mir3636
parents: 56
diff changeset
624 Twice と BitonicSort の例題の測定結果では 1CPU と 32CPU で Twice では約 27.1 倍、BitonicSort では 約 22.12 倍の速度向上が見られた。
mir3636
parents: 56
diff changeset
625 また、GPU 実行の測定も行い、kernel のみの実行時間では 32 CPU より Twice では約 7.2 倍、BitonicSort では約 11.48 倍の速度向上がみられ、
mir3636
parents: 56
diff changeset
626 GPU の性能を活かすことができた。
mir3636
parents: 56
diff changeset
627
mir3636
parents: 56
diff changeset
628 今後の課題は、
mir3636
parents: 56
diff changeset
629 Go、OpenMP との比較から、 Gears OS が1CPU での動作が遅いということがわかった。
mir3636
parents: 56
diff changeset
630 Gears OS は par goto 文を使用することで Context を生成し、並列処理を行う。
mir3636
parents: 56
diff changeset
631 しかし、Context はメモリ空間の確保や使用する全ての Code/Data Gear を設定する必要があり、生成にある程度の時間がかかってしまう。
mir3636
parents: 56
diff changeset
632 そこで、 par goto のコンパイルタイミングで実行する Code Gear のフローをモデル検査で解析し、処理が軽い場合はContext を生成せずに、関数呼び出しを行う等の最適化を行>うといったチューニングが必要である。
mir3636
parents: 56
diff changeset
633
38
mir3636
parents:
diff changeset
634
mir3636
parents:
diff changeset
635 \nocite{*}
mir3636
parents:
diff changeset
636 \bibliographystyle{ipsjunsrt}
mir3636
parents:
diff changeset
637 \bibliography{sigos}
mir3636
parents:
diff changeset
638
mir3636
parents:
diff changeset
639 \end{document}