Papers/2019/anatofuz-prosym: Paper/anatofuz.tex comparison

comparison Paper/anatofuz.tex @ 20:2bf64cfb91b1

add CbC evaluation and CbCinterp fig

author	Takahiro SHIMIZU <anatofuz@cr.ie.u-ryukyu.ac.jp>
date	Thu, 08 Nov 2018 14:57:59 +0900
parents	3e4ffa621ae9
children	5ba21dfc6e0c

comparison

equal deleted inserted replaced

-:3e4ffa621ae9
+:2bf64cfb91b1
 CbCではCの関数の代わりにCodeSegmentを導入する．
 CodeSegmentはCの関数宣言の型名の代わりに\_\_codeと書くことで 宣言できる．
 \_\_codeはCbCコンパイラの扱いはvoidと同じ型であるが，CbCプログラミングではCodeSegmentである事を示す識別子としての意味で利用する．
 \subsection{軽量継続}
-TBD
+CbCでは次のCodeSegmentに移行する際，Cの
 \subsection{現在の実装}
 CbCは現在主要なCコンパイラであるgcc及びllvmをバックエンドとしたclang上の2種類の実装が存在する．
 gccはバージョン9.0.0に,clangは7.0.0に対応している．
 ラベル遷移を利用する場合はラベルテーブルにアクセスし，テーブルに登録されているアドレスを取得し，NEXTで遷移する．
 このラベルテーブルの中身はラベルが変換されたアドレスであるため，Cレベルでのデバッグ時にはアドレスと実際に呼ばれる箇所を確認する事に手間がかかる．
 巨大なcase文として実行された場合，実行時間が遅いだけでなく，ラベル遷移と共存させて記述を行っている為Cのソースコードにおける可読性も低下する．
-CbCMoarVMではこの問題を解決するために，それぞれの命令に対応するCodeSegmentを作成し，これらへのポインタを持つCbCのCodeSegmentのテーブルを作成した．
+CbCMoarVMではこの問題を解決するために，それぞれの命令に対応するCodeSegmentを作成し，CodeSegment名前を要素として持つCbCのCodeSegmentのテーブルを作成した．
 \subsection{命令実行箇所のCodeSegmentへの変換}
 ラベルテーブルやcase文のswitch相当の命令実行箇所をCbCに変換し，CodeSegmentの遷移として利用する．
 interp.cは?に示す様なスタイルで記述されている．
 OP(.*)の.*に該当する箇所はバイトコードの名前である．通常このブロックにはLABELから遷移する為，バイトコードの名前はLABELSの配列の添字に変換されている．
 そのため対象となるCodeSegmentをLABLESの並びと対応させ，配列CODESに設定すればCodeSegmentの名前は問わない．
 今回はCodeSegmentである事を示す為にsuffixとしてcbc\_をつける．
+\begin{figure}[ht]
+\begin{center}
+\includegraphics[width=70mm]{fig/cbc_next.pdf}
+\end{center}
+\caption{CbCにおけるインタプリタの関数遷移}
+\label{fig:sendTask}
+\end{figure}
 \subsection{MoarVMのBytecodeのデバッグ}
 moarに対してmoarvm bytecodeをdumpオプションを付けて読み込ませるとmoarvmのbytecodeがアセンブラの様に出力される．
 しかしこれはmoarvmが実行したbytecodeのトレースではなくmoarvm bytecodeを変換したものに過ぎない．
 また，明らかに異なる挙動を示す両者のmoarを利用しても同じ結果が返ってきてしまう．
 そのため今回のMoarVMBytecodeインタプリタの実装のデバッグにはこの方法は適さない．
 従って実際に実行した命令を確認するにはgdbなどのCデバッガを利用してMoarVMを直接トレースする必要がある．
+\lstinputlisting[label=debug_origmoar, caption=オリジナル版MoarVMのバイトコードのトレース]{./src/origin_breakpoint.txt}
 \subsection{MoarVMの並列デバッグ手法}
 しかしMoarVMが実行する命令は膨大な数がある．
 その為gdbでMoarVMをCbCとオリジナル版での並列デバッグを人間が同時に行うことは困難である．
 Perlなどのスクリプトを用いて自動的に解析したいため，ログを残す為にscriptコマンドを実行した状態でgdbを起動する．
 PerlccはPerlのバイトコードをCに変換しただけであり，Cで実装されているPerl経由で実行した場合と処理速度はほぼ変わらない．
 またPerlccで生成されたCのソースコードは難解であり，これをデバッグするのが困難でもある．
 MoarVMでthreaded codeを実現出来た場合，その箇所のみCbCプログラムとして切り出す事が可能である為perlccと似たツールを作成することも可能である．
 この場合,Perl6を通常動かした際とは異なりバイトコードインタプリタに到達する前の処理が無くなる為多少の高速化が望めると推測できる.
-\section{CbCを用いる事についての評価}
+\section{CbCを用いる事についての利点と欠点}
-Perl6処理系はまずPerl6の豊富な文法に対応する物を作成せねばならず，類似する他のプログラミング言語処理系と比較してもより複雑となっている．
+MoarVMの様な巨大なスクリプト言語処理系にCbCを適応した所現在までに複数の利点と欠点が発見された．
-実際にPerl5を始めとしたスクリプト言語とPerl6がどのような処理時間の違いが見られるかを実測する．
+本章ではまず利点を述べ，次に現段階でのCbCを適応した場合の欠点について考察する．
+\subsection{利点}
+\subsection{コード分割}
+オリジナルのMoarVMでは命令コードに対応する箇所はラベルジャンプ，もしくはswitch文で実装されていた．
+その為同じCファイルに命令コードの実行の定義が存在しなければならない．
+今後MoarVMに新たなバイトコードが導入されていく事を考えるとinterp.cが巨大になる可能性がある．
+関数単位での処理の比重が偏る事に加え，
+switch文中に書かれている処理は他の関数から呼ぶ事が出来ないため，余計な手間がかかる箇所が発生すると考えられる．
+CbCMoarVMの場合，CodeSegmentとして基本ブロックを記述出来る為オリジナルのMoarVMの様にswtich文のブロック中に書く必要性が無くなる．
+その為類似する命令系をコード分割し，モジュール化する事が可能である．
+これは通常のインタプリタの実装と比べ可読性と言う意味とモノリシックアーキテクチャをマイクロ化出来るという意味でも利点である．
+\subsubsection{MoarVMのデバッグ}
+MoarVMのバイトコードインタプリタの箇所はオリジナルの実装ではラベルジャンプを用いて実装されている．
+その為，直接ラベルにbreak pointをかける事が出来ない．
+作業者がデバッガが読み込んでいるCソースコードの位置を把握し，行番号を指定してdebug pointを設定する必要があった．
+CbCMoarVMの場合，CodeSegment単位でバイトコードの処理単位を記述している為，通常の関数と同じく直接CodeSegmentにデバッグポイントをかける事が可能である．
+これはCプログラミングの関数に対してのデバッグで，状態ごとにbreak pointをかける事が出来ることを意味する．
+通常のC言語で言語処理系を実装した場合と比較して扱いやすくなっていると言える．
+さらにラベルテーブルでの管理場合，次のバイトコード箇所は数値でしか確認できず，実際にどこに飛ぶのかはラベルテーブル内と数値を作業者が手作業で確認する必要があった．
+スクリプトなどを組めば効率化は出来るがデバッガ上で完結しない為手間がかかる．
+CbC実装ではCODESテーブル内は次のCodeSegmentの名前が入っている為，数値からCodeSegmentの名前をデバッガ上で確認する事が出来る．
 % \subsection{単純なループ処理の測定}
 % 簡単な例題としてfor文を用いて100000回ループさせ，ある変数をインクリメントするというプログラムを作成する．
 % 今回の評価対象としてPerl6は2018年4月にリリースされたMoarVM,NQP,Rakudoの実装を用いる．
 % Perl5は5.26.2を利用した．
-%
 % \begin{table}[htb]
 % 	\begin{tabular}{|c|c|c|} \hline
 % 	 ループ回数 & Perl5 (sec) & Perl6(sec) \\  \hline \hline
 % 	 1000000 & 0.131 & 1.444 \\ \hline
 % 	 10000000 & 0.131 & 1.444 \\ \hline
 % 	 100000000 & 3.258 & 124.69 \\ \hline
 % 	\end{tabular}
 % \end{table}
+\subsection{欠点}
+\subsubsection{CbCコンパイラ}
+前章までに複数述べた通りCbCコンパイラが現在非常にバグを発生させやすい状態になっている．
+CbCコンパイラはgccとllvm/clangに実装している為，これらのアップデートに追従する必要がある．
+しかしコンパイラのバージョンに応じてCbCで利用するコンパイラ内のAPIが異なる場合が多く，APIの変更に伴う修正作業などを行う必要がある．
+CbCMoarVMではCからCbCへ，CbCからCへの遷移などが複数回繰り返されているが，CodeSegmentでのtail callの強制が非常に難関である．
+tail callの強制には関数定義の箇所や引数，スタック領域のサイズ修正などを行う必要がある．
+この実装の為にはどのケースで関数が定義されているかをCbCコンパイラで明確に分割する必要がある．
 \section{今後の課題}
 本論文ではCbCによってPerl6の処理系であるMoarVMインタプリタの一部改良とその手法を示した．
 CbCのCodeSegment部分を用いることできめ細やかな記述が出来，デバッグし辛い箇所もbreakpointの設定などが容易になった．

Mercurial > hg > Papers > 2019 > anatofuz-prosym

comparison Paper/anatofuz.tex @ 20:2bf64cfb91b1