annotate paper/anatofuz-sigos.md @ 20:ca6506bdcda4

...
author anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
date Sat, 02 May 2020 16:30:15 +0900
parents 099e7864ee79
children 7c9cac61b14c
Ignore whitespace changes - Everywhere: Within whitespace: At end of lines:
rev   line source
10
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
1 # OSの信頼性
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
2 様々なアプリケーションはOSの上で動作するのが当たり前になってきた。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
3 アプリケーションの信頼性を向上させるのはもとより、 土台となるOS自体の信頼性は高く保証されていなければならない。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
4 OSそのものも巨大なプログラムであるため、 テストコードを用いた方法で信頼性を確保する事が可能である。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
5 しかし並列並行処理などに起因する動かしてみないと発見できないバグなどが存在するため、 テストで完全にバグを発見するのは困難である。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
6 また、OSを構成する処理も巨大であるため、 これら全てをテスト仕切るのも困難である。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
7 テスト以外の方法でOSの信頼性を高めたい。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
8
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
9 数学的な背景に基づく形式手法を用いてOSの信頼性を向上させることを検討する。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
10 OSを構成する要素をモデル検査してデッドロックなどを検知する方法や、 定理証明支援系を利用した証明ベースでの信頼性の確保などの手法が考えられる。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
11 形式手法で信頼性を確保するには、 まずOSの処理を証明などがしやすい形に変換して実装し直す必要がある。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
12 これに適した形として、 状態遷移モデルが挙げられる。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
13 OSの内部処理の状態を明確にし、 状態遷移モデルに落とし込むことでモデル検査などを通して信頼性を向上させたい。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
14 既存のOSはそのままに処理を状態遷移モデルに落とし込む為には、 まず既存のOSの処理中の状態遷移を分析する必要がある。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
15 分析の結果を定理証明支援系などによって証明を行うか、 仕様記述言語を用いて再実装することで仕様の整合性を検証する事が可能である。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
16 しかしこれらの方法では、 実際に動くOSと検証用の実装が別の物となってしまうために、 C言語などの実装の段階で発生するバグを取り除くことができない。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
17 実装のソースコードと検証用のソースコードは近いセマンティクスでプログラミングする必要がある。
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
18
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
19 実装用の言語と証明用の言語の両方に適した言語としてContinuation Based C(CbC)がある。
11
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 10
diff changeset
20 CbCはCと互換性のあるCの下位言語であり、 状態遷移をベースとした記述に適したプログラミング言語である。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 10
diff changeset
21 Cとの互換性のために、 CbCのプログラムをコンパイルすることで動作可能なバイナリに変換が可能である。
15
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
22 またCbCの基本文法は簡潔であるため、 Agdaなどの定理証明支援系との相互変換や、 CbC自体でのモデル検査が可能であると考えられる。
12
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 11
diff changeset
23 すなわちCbCを用いて状態遷移を基本とした単位でプログラミングをすると、 形式手法で証明が可能かつ実際に動作するコードを記述できる。
10
d43b107ad199 fix new line encode
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 8
diff changeset
24
11
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 10
diff changeset
25 現在小さなunixであるxv6 kernelをCbCを用いて再実装している。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 10
diff changeset
26 再実装の為には、 既存のxv6 kernelの処理の状態遷移を分析し、継続を用いたプログラムに変換していく必要がある。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 10
diff changeset
27 本論文ではこの書き換えに伴って得られたxv6 kernelの継続を分析し、 現在のCbCによる書き換えについて述べる。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 10
diff changeset
28
12
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 11
diff changeset
29 # xv6 kernel
11
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 10
diff changeset
30
12
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 11
diff changeset
31 xv6とはマサチューセッツ工科大学でv6 OSを元に開発された教育用のUNIX OSである。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 11
diff changeset
32 xv6はANSI Cで実装されており、 x86アーキテクチャ上で動作する。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 11
diff changeset
33 Raspberry Pi上での動作を目的としたARMアーキテクチャのバージョンも存在する。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 11
diff changeset
34 本論文では最終的にRaspberry Pi上での動作を目指しているために、 ARMアーキテクチャ上で動作するxv6を扱う。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 11
diff changeset
35
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 11
diff changeset
36 xv6は小規模なOSだがファイルシステム、 プロセス、システムコールなどのUNIXの基本的な機能を持つ。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 11
diff changeset
37 またユーザー空間とカーネル空間が分離されており、 シェルやlsなどのユーザーコマンドも存在する。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 11
diff changeset
38
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 11
diff changeset
39 本論文ではxv6のファイルシステム関連の内部処理と、システムコール実行時に実行される処理について分析を行う。
17
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
40 xv6 kernelのファイルシステムは階層構造で表現されており、 最も低レベルなものにディスク階層、 抽象度が最も高いレベルのものにファイル記述子がある。
13
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 12
diff changeset
41
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 12
diff changeset
42
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 12
diff changeset
43 # Continuation Based C
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 12
diff changeset
44
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 12
diff changeset
45 Continuation Based C(CbC)とはC言語の下位言語であり、 関数呼び出しではなく継続を導入したプログラミング言語である。
17
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
46 CbCでは通常の関数呼び出しの他に、 関数呼び出し時のスタックの操作を行わず、次のコードブロックに`jmp`命令で移動する継続が導入されている。
13
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 12
diff changeset
47 この継続はSchemeなどの環境を持つ継続とは異なり、 スタックを持たず環境を保存しない継続である為に軽量である事から軽量継続と呼べる。
17
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
48 またCbCではこの軽量継続を用いた再帰呼び出しを利用することで`for`文などのループ文を廃し、 関数型プログラミングに近いスタイルでプログラミングが可能となる。
13
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 12
diff changeset
49 現在CbCはGCC及びLLVM/clang上にそれぞれ実装されている。
14
dff5f09c28c7 use listings
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 13
diff changeset
50
dff5f09c28c7 use listings
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 13
diff changeset
51
17
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
52 CbCでは関数の代わりにCodeGearという単位でプログラミングを行う。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
53 CodeGearは通常のCの関数宣言の返り値の型の代わりに`__code`で宣言を行う。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
54
15
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
55 CbCで階乗を求める例題をCode \ref{src:cbc_example}に示す。
17
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
56 例題ではCodeGearとして`factorial`を宣言している。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
57 `factorial`はCodeGearの引数として`struct F`型の変数`arg`を受け取り、`arg`のメンバー変数によって`factorial`の再帰呼び出しを行う。
18
099e7864ee79 fix md2tex
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 17
diff changeset
58 `arg`の様なCodeGearの引数のことを`DataGear`と呼ぶ。
17
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
59 CodeGearの呼び出しは`goto`文によって行われる。
14
dff5f09c28c7 use listings
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 13
diff changeset
60
dff5f09c28c7 use listings
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 13
diff changeset
61
18
099e7864ee79 fix md2tex
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 17
diff changeset
62 ``` src:cbc_example, CbCで階乗を求める処理
15
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
63 __code factorial(struct F arg) {
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
64 if (arg.n<0) {
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
65 exit(1);
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
66 }
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
67 if (arg.n==0) {
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
68 goto arg.next(arg);
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
69 } else {
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
70 arg.r *= arg.n;
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
71 arg.n--;
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
72 goto factorial(arg);
14
dff5f09c28c7 use listings
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 13
diff changeset
73 }
dff5f09c28c7 use listings
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 13
diff changeset
74 }
15
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
75 ```
14
dff5f09c28c7 use listings
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 13
diff changeset
76
17
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
77 CodeGearは関数呼び出し時のスタックを持たない為、一度あるCodeGearに遷移してしまうと元の処理に戻ってくることができない。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
78 しかしCodeGearを呼び出す直前のスタックは保存されるため、 部分的にCbCを適用する場合はCodeGearを呼び出す`void`型などの関数を経由することで呼び出しが可能となる。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
79
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
80 この他にCbCからCへ復帰する為のAPIとして、 環境付きgotoという機能がある。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
81 これはGCCでは内部コードを生成、 LLVM/clangでは`setjmp`と`longjmp`を使うことでCodeGearの次の継続対象として呼び出し元の関数を設定することが可能となる。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
82 したがってプログラマから見ると、通常のCの関数呼び出しの返り値をCodeGearから取得する事が可能となる。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
83
20
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 18
diff changeset
84 # CbCを用いたOSの実装
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 18
diff changeset
85
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 18
diff changeset
86 軽量継続を持つCbCを利用して、 証明可能なOSを実装したい。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 18
diff changeset
87 その為には証明に使用される定理証明支援系や、 モデル検査機での表現に適した状態遷移単位での記述が求められる。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 18
diff changeset
88 CbCで使用するCodeGearは、 状態遷移モデルにおける状態そのものとして捉えることが可能である。
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 18
diff changeset
89 これらの状態をまとめる構造体として、 CbCの`context`を導入した。
18
099e7864ee79 fix md2tex
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 17
diff changeset
90
099e7864ee79 fix md2tex
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 17
diff changeset
91
099e7864ee79 fix md2tex
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 17
diff changeset
92
15
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
93 # xv6のファイルシステムの一部の分析
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
94
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
95 xv6のファイルシステムに関する定義ファイルはfs.c中に記述されている。
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
96 この中に出てくる関数に着目し、 この関数をさらにCodeGearに変換していくことで状態遷移単位での記述を試みた。
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
97
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
98 まず関数内でif文などの分岐を持たない基本単位であるBasic Blockに着目した。
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
99 CbCのCodeGearの粒度はCの関数とアセンブラの中間であるといえるので、 BasicBlockをCodeGearに置き換える事が可能である。
17
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 15
diff changeset
100 したがって特定の関数内の処理のBasicBlockを分析し、 BasicBlockに対応したCodeGearへ変換することで状態遷移系への変換を行った。
15
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
101
875bf4bc5059 fix example code
anatofuz <anatofuz@cr.ie.u-ryukyu.ac.jp>
parents: 14
diff changeset
102