view paper/introduciton.tex @ 67:2fa14ca42ca6

fix
author Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
date Sat, 01 Feb 2014 20:34:46 +0900
parents 493c5c90ca55
children 01fadc801c18
line wrap: on
line source

\chapter{序論}
\pagenumbering{arabic}

巨大なウェブサービス程データベースは必須であり, ウェブサービスの規模
に比例してデータベースへの負荷も大きなものとなっている. 
そのため, データベースの処理能力の高さはそのままウェブサービスの質にも繋がってくるため重要な
項目となっている.
データベースの処理能力をスケールさせる方法としてスケールアップ(垂直スケール)と
スケールアウト(水平スケール)の考えがある.
スケールアップはハードウェア的に高価な単一のマシンを用意することで処理性能を上げることをさす.
スケールアウトは汎用的なマシンをいくつも用意し, 処理を分散させることで処理性能を上げることをさす.
単純に処理能力をあげたいのならば, スケールアップは有効である.
しかし, 単一のマシンを高性能にしても限界がある. 
いずれはそのマシン単体が処理できない程負荷が増えるかもしれないし, ネットワーク帯域といったマシン
以外のハードウェアでボトルネックが発生するかもしれない. 
なによりコストがかかってしまう.

それに対しスケールアウトは, 処理が重くなるにつれて汎用的なマシンを順次追加していくことで
性能をあげていく.
1つのマシンに対して負荷が重くなるということを避けるため, ハードウェア的に高性能なマシンを要求
せずにすみ, 柔軟な対応をとることができる.
ウェブサービスに使用されるデータベースの性能をあげる方法としては, このスケールアウトが求められている.

本研究で扱うスケーラビリティはこのスケールアウトのことをさす.
そういう意味では最も使われているデータベースであるRelational Databaseはスケーラビリティを持つのは困難である.
Relational Databaseにはないスケーラビリティを持つデータベースとしてNoSQLと呼ばれるデータベースがある.
NoSQLデータベースはConsistency HashinやShardingといった方法を使いデータを分散させスケーラビリティを得ている.
データベースにおいてデータを分散させスケーラビリティを上げることはもはや必須となっている.

本論文では, スケーラビリティのあるデータベースを目指して木構造データベースJungleの研究を行った.
Jungleに分散と永続性の実装を行った.
既存の分散データベースであるCassandraとの比較を行うため, 簡易掲示板を作成し並列環境から負荷をかけることで
性能比較を行った.

\newpage

\section{本論文の構成}
本論文では, 始めに分散データベースについて既存の製品を例に上げながら述べる.
RDBとNoSQLについて説明し, 既存のNoSQLデータベースの特徴について説明する.
第3章では, Jungleの持つデータ構造, 非破壊的木構造について説明し, Jungleにおけるデータ編集について述べる.
第4章では, 非破壊的木構造による Jungle の基本設計と, 分散バージョン管理システムを参考にした分散設計
について述べる.
第5章では, 第4章で行った設計を元にJungleへ行った分散実装について述べる.
第6章では, 第5章で実装した分散データベースJungleの評価を行うため, 簡易掲示板プログラムを実装する.
この掲示板プログラムはJungleとCassanraそれぞれのデータベースを使うものを用意した.
学科の並列環境上で開発した掲示板プログラムを複数のノードで実行させ, 負荷をかけることで Jungle と Cassandra の
性能比較を行う.
第6章は, 本研究におけるまとめと今後の課題について述べる.