view Paper/chapter/1-Christie.tex @ 10:39cc44ae7917

add image
author riono <e165729@ie.u-ryukyu.ac.jp>
date Fri, 07 Jan 2022 14:44:02 +0900
parents 1e12b3e710d6
children a82543f1da47
line wrap: on
line source

\chapter{Christie}

ChristieとはJavaで記述された並列分散通信フレームワークである。Aliceという前身のプロジェクトが開発されていたが、以下のような問題があった。
データを送受信するAPIはインスタンスを生成して関数を呼び出す様に設計されているが、外部Classからも関数が実行できてしまうため、
受信する際どのkeyに紐づいたデータを受け取るのか、直感的にわからない。
データを管理しているlocalDataSegmentがシングルトンで設計されており、Localで接続を行う際に複数のアプリケーションで立ち上げる必要がある。
データを受け取る際にObject型で受け取っているため、送信元を辿らない限り何の型が送信されているか不明瞭である。


それらの問題点を解消するためにAliceを再設計され、作成されたものがChristieである。
ChristieではAliceの機能や概念を維持しつつ、Aliceで発生していた問題点やプログラムを煩雑さなどを解消している。


\section{Christieの基礎概念}
Chrisiteはタスクとデータを細かい単位に分割してそれぞれの依存関係を記述し、
タスク実行に必要な入力が揃った順から並列実行するというプログラミング手法を用いている。

将来的に当研究室で開発しているGearsOSのファイルシステムに組み込まれる予定があるため、GearsOSを構成する言語 Continuation based Cと
似た概念を持っている。Christieに存在する概念として以下の様なものがある。

\begin{itemize}
  \item CodeGear
  \item DataGear
  \item CodeGearManager (以下CGM)
  \item DataGearManager (以下DGM)
\end{itemize}

\begin{figure}[htb]
  \begin{center}
    \includegraphics[width=150mm]{images/GearsRelationships.pdf}
  \end{center}
  \caption{各Gearの関係性}
  \label{fig:GearRelationships}
\end{figure}

図\ref{fig:GearRelationships}はそれぞれのGearの関係性を図示したものである。
CodeGearはクラスやスレッドに相当する。
DataGearは変数データに相当し、CodeGear内でJavaのannotationの機能を用いてkeyに紐づいた変数データを取得できる。
CodeGear内に記述した全てのDataGearにデータが格納された際に、初めてそのCodeGearが実行されるという仕組みになっている。

CGMはノードに相当し、CodeGear、DataGear、DGMを管理している。
DGMはDataGearを管理しており、putという操作によって変数データ、つまりDataGearをDGMに格納できる。
DGMのput操作を行う際にはLocalとRemoteのどちらかを選び、変数のkeyとデータを引数として渡す。
LocalであればLocalのCGMが管理しているDGMに対してDataGearを格納していく。
Remoteであれば、接続したRemote先のCGMが管理しているDGMにDataGearを格納する。

\begin{figure}[htb]
  \begin{center}
      \includegraphics[width=150mm]{images/ChristieClass.pdf}
  \end{center}
  \caption{同一プロセスでのChristieの複数インスタンス立ち上げ}
  \label{fig:MultiInstance}
\end{figure}

図\ref{fig:MultiInstance}は、Christieを同一プロセスで複数のインスタンスを生成した際のDGMやCGMの接続構造を示している。
全てのCGMはThreadPoolと他のCGMをListとして共有している。
ThreadPoolとはCPUに合わせた並列度でqueueに入ったThreadを順次実行していく実行機構である。
ThreadPoolが増えると、CPUコア数に合わない量のThreadを管理することになり並列度が下がるため、1つのThreadPoolで全てのCGMを管理している。
またCGMのListを共有することでメタレベルで全てのCodeGear/DataGearにアクセス可能となっている。
CGを記述する際はCodeGear.classを継承する。
CodeGearはRunnableインターフェースを持っており、runメソッド内に処理を記述することでマルチスレッドで処理が行われる。
CGに記述したkeyと一致するDGが全て揃った時、runに記述された処理が実行される。
runメソッドの引数にCGMを指定しており、そのCGMを経由してChristieのAPIにアクセスする。 
GearsOSではCG間でContextを受け渡すことによってCGはDGにアクセスを行なっているため、Christieでもそのアクセス方法が採用されている。

通常のRunnableクラスでは引数を受け取ることができないが、
CodeGearExecutorというRunnableのMeta Computationを挟んだことでCGMを受け渡しながらの記述を可能にしている。


DGMに対してput操作を行うことでDGM内のqueueにDGを保管できる。
DGを取り出す際には、CG内で宣言した変数データにannotationを付ける。
DGのannotationには以下の4種類がある。

\begin{description}
  \item[Take] 先頭のDGを読み込み、そのDGを削除する。
  \item[Peek] 先頭のDGを読み込むが、DGは削除されない。そのため、特に操作をしない場合には同じDGを参照し続ける。
  \item[TakeFrom(Remote DGM name)] Takeと処理動作は同じであるが、Remote DGM nameを指定することで、その接続先(Remote)のDGMからTake操作を行うことができる。
  \item[PeekFrom(Remote DGM name)] Peekと処理動作は同じであるが、 Remote DGM nameを指定することで、その接続先(Remote)のDGMからPeek操作を行うことができる。 
\end{description}

\section{}