view meeting20130802/index.html @ 47:533180cea89f

add pic/put.png
author Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
date Fri, 02 Aug 2013 10:18:34 +0900
parents 0c6ef18bf2e8
children
line wrap: on
line source

<!DOCTYPE html>
<html>
  <head>
    <style type="text/css">
      .center {
      margin-left: auto;
      margin-right: auto;
      text-align: center;
      }
    </style>

    <title>Presentation</title>

    <meta charset='utf-8'>
    <script
       src='./slides.js'></script>
  </head>
  
  <style>
    /* Your individual styles here, or just use inline styles if that’s
    what you want. */
    
    
  </style>

  <body style='display: none'>

    <section class='slides layout-regular template-default'>
      
      <!-- Your slides (<article>s) go here. Delete or comment out the
	   slides below. -->
      
      
      <article>
	<h1><font size=10em>
Data Segment の分散データベースへの応用
	  </font>
	</h1>
	<p>
	  琉球大学 大城信康
	  <br>
	 30 July 2013
	</p>
      </article>

      <article>
	  <h3>研究の目的と背景</h3>
	  <ul>
	      <li>当研究室では並列・分散プログラムに向いたプログラミングを目指し,
		  タスクを Code Segment, データを Data Segment によるプログラミング手法の提案を行なっている</li>
	      <li>Code Segment, Data Segment によるプログラミングの提供をする実装として分散ネットワークフレームワーク Alice 
	      を開発をしている</li>
	  </ul>
      </article>

      <article>
	  <h3>研究の目的と背景</h3>
	  <ul>
	      <li>また, 当研究室では非破壊的木構造を用いたデータベースである Jungle の開発も行なっている</li>
	      <li>Jungle はデータの編集を TreeOperationLog という単位で行う</li>
	      <li>Alice を使いこの TreeOperationLog を各ノード間で送受信することでデータの分散を行うことができる.</li>
	      <li>本研究では, Alice と Jungle を用いて分散データベースの実装を行う</li>
	      <li>さらに, 例題アプリケーションとして掲示板を作成し, 評価を行う</li>
	  </ul>
      </article>

      <article>
	  <h3>分散ネットワークフレームワーク Alice</h3>
	  <ul>
	      <li>当研究室で開発している分散管理フレームワーク</li>
	      <li>Data Segment と Code Segment による並列・分散プログラミングを提供</li>
	      <br>
	      <li>まず Data Segment と Code Segment, それと Alice におけるデータ表現について説明を行う</li>
	  </ul>
      </article>

      <article>
	  <h3>Data Segment</h3>
	  <ul>
	      <li>計算に必要なデータ</li>
	      <li>Alice は Data Segment を文字列の Key で管理</li>
	      <li>Key 毎にリストが用意され, put された順番で Data Segment は取り出される</li>
	      <li>Data Segment Manager(DSM) により管理される</li>
	      <p class="center">
		  <img src="./pic/put.png">
	      </p>
	  </ul>
      </article>

      <article>
	  <h3>Code Segment</h3>
	  <ul>
	      <li>Data Segment を受け取り計算を行うコード</li>
	      <li>並列プログラミングにおけるタスクにあたる</li>
	      <li>Code Segment は計算に使う Data Segment の Key を登録してその Key にあたる Data Segment
	      が用意され次第処理が実行される</li>
	      <p class="center">
		  <img src="./pic/dsandcs.png">
	      </p>
	      <li>計算を行った結果を新たな Data Segment として出力する</li>
	  </ul>
      </article>

      <article>
	  <h3>Alice上でのデータ表現:MessagePack</h3>
	  <ul>
	      <li>Data Segment のデータ表現には MessagePack を利用</li>
	      <li>Messagepack はバイナリをベースにしたシリアライズライブラリー</li>
	      <li>独自のクラスでも @Message アノテーションを付けることでシリアライズ可能<br>
	      (その際にはシリアライズできる型のみのフィールドをもつこと)</l>
	      <li>MessagePack を使用することで Alice 以外のプログラムでの Data Segment を扱うことが可能になる</li>
	  </ul>
      </article>

      <article>
	  <h3>非破壊的木構造を用いたデータベース Jungle</h3>
	  <ul>
	      <li>Jungle はスケーラビリティのある CMS の開発を目指している</li>
	      <li>一般的なコンテンツマネジメントシステムのウェブサイトの構造は大体が木構造</li>
	      <br>
	  </ul>
      </article>


      <article>
	  <h3>破壊的木構造</h3>
	  <ul>
	      <li>木構造で保持するデータを直接書き換える</li>
	      <li>編集を行う際にロックをかける必要がある</li>
	      <p class="center">
		  <img src="./pic/destructive_tree.png">
	      </p>
	      <li>データを受け取ろうと木を走査するスレッドは編集時には書き換えの終了をまつ必要がある</li>
	      <li><font color=red>スケールしにくい</font></li>
	  </ul>
      </article>

      <article>
	  <h3>非破壊的木構造</h3>
	  <ul>
	      <li>一度作成したデータの破壊は行わない</li>
	      <li>データの編集は, 編集が行われるノードまでをルートからコピーを行い新しい木構造を作ることで行う</li>
	      <p class="center">
		  <img src="./pic/non_destructive_tree.png">
	      </p>
	      <li>非破壊的木構造ではデータの編集中に走査をすることが可能なためスケールすると考えている</li>
	  </ul>
      </article>

      <article>
	  <h3>Jungle におけるデータ編集: API</h3>
	  <ul>
	      <li>Jungle ではデータの編集を行う Editor を提供している</li>
	      <li>Editor が提供するデータ編集のメソッドは次のようなものがある</li>
	      <ul>
		  <li>Nodeの追加を行う<br><font color=blue>addNewChildAt(NodePath _path, int _pos)</font></li>
		  <li>Nodeの削除を行う<br><font color=blue>deleteChildAt(NodePath _path, int pos)</font></li>
		  <li>Nodeにattributeを追加する<br><font color=blue>putAttribute(NodePath _path, String _key,<br> ByteBuffer _value)</font></li>
		  <li>Nodeのattributeを削除する<br><font color=blue>deleteAttribute(NodePath _path, String _key)</font></li>
	      </ul>
	  </ul>
      </article>

      <article>
	  <h3>Jungle におけるデータ編集: NodePath</h3>
	  <ul>
	      <li>NodePath は root から編集を行う Node までの道を示す</li>
	      <li>例えば NodePath が -1,1,2,3 の場合は次の Node を示す</li>
	      <p class="center">
		  <img src="./pic/nodepath.png">
	      </p>
	      <li>Jungle におけるデータ編集はこの NodePath を Editor が提供する API に渡すことで行われる</li>
 	  </ul>
      </article>

      <article>
	  <h3>TreeOperationLog</h3>
	  <ul>
	      <li>Editor による編集の命令はある程度の塊で扱われる</li>
	      <li>この編集の塊を TreeOperatinLog という</li>
	      <li>今回実装した掲示板では, 書き込み時に次のような TreeOperaitonLog が作られる</li>
	      <pre>
[APPEND_CHILD:<-1>:pos:1] 
[PUT_ATTRIBUTE:<-1,1>:key:author,value:oshiro] 
[PUT_ATTRIBUTE:<-1,1>:key:mes,value:hello] 
[PUT_ATTRIBUTE:<-1,1>:key:key,value:hoge] 
[PUT_ATTRIBUTE:<-1,1>:key:timestamp,value:0]     </pre>
	      <li>大文字の英字は実行した API を示す</li>
	      <li>&lt;&gt;で囲まれた数字は NodePath を示す</li>
	      <li>key と value は attribute に格納する内容を示す</li>
	  </ul>
      </article>

      <article>
	  <h3>Alice を用いた Jungle の分散実装</h3>
	  <ul>
	      <li>Alice により TreeOperationLog を Data Segment として扱うことで行う</li>
	      <li>他Nodeがその Data Segment にアクセスを行えるようにする</li>
	      <li>アクセスできるようにするためには次の作業が必要</li>
	      <ul>
		  <li>トポロジーの形成</li>
		  <li>TreeOperationLog を MessagePack によりシリアライズ</li>
		  <li>TreeOperationlog を扱う Data Segment の作成</li>
	      </ul>
	  </ul>
      </article>

      <article>
	  <h3>トポロジーの形成</h3>
	  <ul>
	      <li>トポロジーの形成は Alice の機能を用いる</li>
	      <li>Alice ではトポロジー設定用ファイルに従いノード同士を接続させる</li>
	      <li>5ノード2分木のノードを組みたいときは次のようなファイルになる</li>
	      <pre style="overflow:scroll; height:300px;">
digraph test {
node0 -> node1
node0 -> node2
node1 -> node0
node1 -> node3
node1 -> node4
node2 -> node0
[label="child1"]
[label="child2"]
[label="parent"]
[label="child1"]
[label="child2"]
[label="parent"]
node3 -> node1 [label="parent"]
node4 -> node1 [label="parent"]
}
	      </pre>
	  </ul>
      </article>

      <article>
	  <h3>トポロジーの形成</h3>
	  <ul>
	      <p>生成されるトポロジー</p>
	      <p class="center">
		  <img src="./pic/tree_topology.png">
	      </p>
	      <li>子供となるノードは parent キーにより親の DSM にアクセスできる</li>
	      <li>親となるノードは child0, child1 キーにより子供のノードの DSM にアクセスできる</li>
	      <li><font color=blue>Alice が提供する機能により楽にトポロジーの形成と他のノードがもつデータへのアクセスができる</font></li>
	  </ul>
      </article>

      <article>
	  <h3>TreeOperationLog の MessagePack によるシリアライズ</h3>
	  <ul>
	      <li>TreeOperationLog を Data Segment で扱うために MessagePack によるシリアライズ可能にする必要がある</li>
	      <li>MessagePack によりクラスをシリアライズするためには, そのクラスがもつフィールド全てがシリアライズできるものでないといけない</li>
	      <li>TreeOperationLog が保持するフィールドを全てシリアライズして保持する container を用意</li>
	      <li>TreeOperationLog は一度その container で Value 型へと変換されて保持されることで Data Segment として扱えるようにした</li>
	  </ul>
      </article>

      <article>
	  <h3>ログを扱う Data Segment</h3>
	  <ul>
	      <li>Data Segment にされた TreeOperaiontinLog はAlice上で "log", "childLog" というキーで扱われる</li>
	      <li>"log" にはそのノードが行った木の編集ログが入る</li>
	      <li>子供となるノードは "parent" キーを使うことで親のノードの DSM にアクセスできる</li>
	      <p class="center">
		  <img src="./pic/alice_topology.png">
	      </p>
	      <li>子供となるノードは親の "log" を見張る Code Segment が走らせており, ログが put されると
	      そのデータを受け取り自身の Tree へと反映を行う</li>
	  </ul>
      </article>

      <article>
	  <h3>ログを扱う Data Segment</h3>
	  <ul>
	      <li>"childLog" には子供となるノードが行った編集のログが入れられる</li>
	      <li>各ノードでは "childLog" を見張る Code Segment が走っており, データが put され次第
	      Tree へのログの反映が行われる</li>
	      <li>親ノードの "log" と自身がもつ "childLog" を Code Segment でみはることでデータの分散を
	      行う</li>
	      <table>
		  <tr style="width:100%;">
		  <td style="width:50%;">
		      <p>
			  <img src="./pic/putLog.png">
		      </p>
		  </td>
		  <td style="width:50%;">
		      <p>
			  <img src="./pic/putChildLog.png">
		      </p>
		  </td>
		  </tr>
	      </table>
	  </ul>
      </article>

      <article>
	  <h3>Merge algorithm の設計</h3>
	  <ul>
	      <li>Jungle はログの衝突が起きた場合に Merge を行うことで衝突を解決する</li>
	      <li>今回実装した掲示板における Merge algorithm は単純な実装</li>
	      <li>書き込むデータと既に書き込まれたデータのタイムスタンプをみてMergeを行う</li>
	      <br>
	      <li>掲示板においてのMergeはそれで十分だが, ブログやWikiといったCMSを設計するさいには
	      もっと複雑なMergeになる</li>
	      <li>どのようにMerge algorithmを実装していくかはよく考えていかなければならない</li>
	  </ul>
      </article>

      <article>
	  <h3>Cassandra との比較</h3>
	  <ul>
	      <li>Cassandra ではデータの書き込みはノードの過半数に行われるのを待つ</l>
	      <li>読み込みに関しても過半数のノードを調べ, 最も新しいタイムスタンプを持つデータを返す</li>
	      <p class="center">
		  <img src="./pic/cassandra.png">
	      </p>
	  </ul>
      </article>

      <article>
	  <h3>Cassandra との比較: Jungle の場合</h3>
	  <ul>
	      <li>Jungle ではデータはノードが手元に持っているものを返す</li>
	      <li>データの編集が行われた場合は, 他ノードへとログを伝搬していく</li>
	      <li>ログの衝突が起きた場合は衝突を検知したノードがMergeを行い, Mergeを行ったログを伝搬させる</li>
	      <p class="center">
		  <img src="./pic/distribute_jungle.png">
	      </p>
	  </ul>
      </article>

      <article>
	  <h3>Cassandra との比較</h3>
	  <ul>
	      <li>Jungle では非破壊により過去のデータを保持しているためMergeを行うことが可能</li>
	      <li>それにより最新のデータなくてもデータを返すことができる</li>
	      <li><font color=blue>ロックが少なくなりスケーラビリティに繋がると考えている</font></li>
	  </ul>
      </article>

      <article>
	  <h3>掲示板によるJungleの性能評価</h3>
	  <ul>
	      <li>Jungle の例題のアプリケーションとして掲示板を作成した</li>
	      <li>組み込みウェブサーバである jetty をフロントエンドに実装</li>
	      <li>今回作成した分散バージョンと元のバージョンをシングルサーバ上で動かし, 2つの
	      ベンチマークをとり性能比較を行う</li>
	      <li>ベンチマークは学科の提供するVMのクラスタを用いる</li>
	  </ul>
      </article>

      <article>
	  <h3>実験方法</h3>
	  <ul>
	      <li>複数のクラスタから並列に5000回アクセス(HTTP Request)を行い, 平均時間をとる</li>
	      <li>クラスタ1台から45台まで順次並列にアクセスを行った結果をグラフ化する</li>
	  </ul>
      </article>


      <article>
	  <h3>実験環境</h3>
    <table style="font-size: 0.7em;">
     <tr>
      <th></th><th>掲示板を動かすサーバのスペック</th>
     </tr>
     <tr>
      <td>CPU</td>
      <td>Intel(R) Xeon(R) CPU X5650@2.67GHz</td>
     </tr>
     <tr>
      <td>コア数</td>
      <td>24</td>
     </tr>
     <tr>
      <td>Memory</td>
      <td>132GB</td>
     </tr>

    <table style="font-size: 0.7em"/>
     <tr>
      <th></th><th>VMWareクラスタ(リクエストをおくるサーバ)</th>
     </tr>
     <tr>
      <td>台数</td><td>45</td>
     </tr>
     <tr>
      <td>CPU</td>
      <td>Intel(R) Xeon(R) CPU X5650@2.67GHz</td>
     </tr>
     <tr>
      <td>コア数</td>
      <td>4</td>
     </tr>
     <tr>
      <td>Memory</td>
      <td>8GB</td>
     </tr>
     <tr>
      <td>OS</td>
      <td>Fedora 16</td>
     </tr>
     <tr>
      <td>HyperVisor</td>
      <td>VMWare ESXi</td>
     </tr>
    </table>



      </article>

      <article>
	  <h3>実験結果: 読み込み</h3>
	  <table style="text-align:center; font-size:0.7em;">
	      <tr>
		  <td> <img style="height:300px;" src="./pic/read_result.png"> </td>
	      </tr>
	      <tr>
		  <td>サーバの読み込み実験結果</td>
	      </tr>
	  </table>
	  <ul>
	      <li>今回の実装では読み込みに関する部分は無い</li>
	      <li>そのため分散サーバ版とシングルサーバ版もに似た結果となっている</li>
	      <li>グラフも両方とも平行にあがっている</li>
	  </ul>
      </article>

      <article>
	  <h3>実験結果: 書き込み</h3>
	  <table style="text-align:center; font-size:0.7em;">
	      <tr>
		  <td > <img style="height:300px;" src="./pic/write_result.png"> </td>
	      </tr>
	      <tr>
		  <td>サーバの書き込み実験結果</td>
	      </tr>
	  </table>
	  <ul>
	      <li>分散サーバ版がシングルサーバ版よりも遅い</li>
	      <li>これは分散版は書き込まれた内容をData Segment にする作業がはいる為とおもわれる</li>
	  </ul>
      </article>

      <article>
	  <h3>まとめ</h3>
	  <ul>
	      <li>今回, Alice を用いて Jungle の分散データベースの実装を行った</li>
	      <li>Jungle の編集のログを Data Segment として Alice 上で他ノードへと送ることで実装</li>
	      <li>今回シングル版から分散版への変更は1000行程度のコードの追加で行うことができた</li>
	      <li>これは Alice によりトポロジーの形成部分を書く必要がなかったことがあげられる</li>
	      <li>Alice を用いてると比較的楽に分散プログラムの作成ができることが確認できた</li>
	  </ul>
      </article>

      <article>
	  <h3>まとめ 2</h3>
	  <ul>
	      <li>また, 実装を行った分散データベースで掲示板の作成を, 元の Jungle との性能比較も行った</li>
	      <li>読み込み速度に差は無いが, 書き込み速度は分散版が遅いことを確認した</li>
	  </ul>
      </article>

      <article>
	  <h3>今後の課題</h3>
	  <ul>
	      <li>次回は, Cassandra でも同じ分散プログラムを作り, 分散環境における性能比較を行いたい</li>
	      <li>そのためには分散データベースにおけるベンチマークの取り方の検証から行う必要がある</li>
	      <br>
	      <li>また, Alice 内部では java.util.concurrent.Executorを使用している</li>
	      <li>Alice を使用してのプログラムは Alice 自身の Thread Pool との調和も考えていく必要もある</li>
	      <li>Alice の Thread Pool との競合性についての懸賞も行なって行きたい</li>
	  </ul>
      </article>


  </body>
</html>