Mercurial > hg > Papers > 2014 > nobuyasu-master
annotate paper/chapter1.tex @ 15:7df3a9a13b22
Writed research
author | Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp> |
---|---|
date | Sun, 19 Jan 2014 15:23:05 +0900 |
parents | df59b2af84e6 |
children | 5316b4791570 |
rev | line source |
---|---|
4
d42d2acf5d1d
Added some tex files
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
1 \chapter{既存の分散データベース} |
d42d2acf5d1d
Added some tex files
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
0
diff
changeset
|
2 |
13 | 3 % NoSQL の説明はどこかで必要。 |
4 | |
5 \section{Cassandra} | |
15
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
6 Cassandra は2008年7月に Facebook によってオープンソースとして公開された Key-Value なデータベースである. |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
7 Amazon の Dynamo という分散キーバリューデータベースの影響を受けて作られている. |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
8 スキーマレスな NoSQL データベースになる. |
13 | 9 |
15
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
10 Cassandra はサーバノードの配置にコンシステント・ハッシングアルゴリズムを用いる. |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
11 コンシステント・ハッシングによりノードは論理的にリング上に配置される. |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
12 リングには数値で表される位置がある. |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
13 データを書き込む際には, キーとなるハッシュ値に従いそのリングの位置から時計回りに近いサーバノードへと書き込まれる. |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
14 コンシステント・ハッシングを用いることで, ノードの数が増減した場合に, 再配置をしなくてもよいという利点がある. |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
15 データの偏りにより少数のサーバへの負荷が大きい場合に, 負荷が高いハッシュ値が指すリング上に |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
16 新たなノードを追加することで負荷を下げるといった手段もとれる. |
13 | 17 |
15
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
18 また Cassandra はデータの読み込み, 書き込みの際に Consistency Level を指定することができるのも Cassandra の特徴である. |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
19 データ取得の際に, いくつのノードに問い合わせを行うのか設定するのが Consistentcy Level である. |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
20 Consistency Level には ONE, QUORAM, ALL があり, それぞれ1つのノード, 全体のノードの過半数+1, 全体のノード |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
21 への処理を設定することができる. |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
22 Cassandra は高い可用性と分断耐性をもつ. |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
23 |
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
24 % Consistency Level を変更できるところ |
13 | 25 \section{MongoDB} |
26 MongoDB は2009年に公開された NoSQL のデータベースである. | |
15
7df3a9a13b22
Writed research
Nobuyasu Oshiro <dimolto@cr.ie.u-ryukyu.ac.jp>
parents:
14
diff
changeset
|
27 JSON フォーマットのドキュメントデータベースであり, これはスキーマが無い |
13 | 28 リレーショナルテーブルに例えられる. |
29 スキーマが無いため, 事前にデータの定義を行う必要がない. | |
30 そのためリレーショナルデータベースに比べてデータの追加・削除 | |
31 が行いやすい. | |
32 | |
33 MongoDB は保存したデータを複数のサーバに複製をとる(replicate). | |
34 これはレプリケーション(replication)と呼ばれる. | |
35 また, 1つのサーバが全てのデータを持つのでなく, ある範囲の値を別々の | |
36 サーバに分割(シャード)させて保持する. | |
37 これをシャーディング(sharding)という. | |
38 MongoDB はレプリケーションとシャーディングにより分散データベースとして機能する. | |
39 | |
40 % クエリ言語として JavaScript を採用しており, 演算子を自分作れるという利点を持つ. | |
41 % スペルミスに弱い | |
14 | 42 |
43 \section{Neo4j} | |
44 No4j は, グラフデータベースと呼ばれる NoSQL のデータベースである. | |
45 データをグラフとして保存する. | |
46 グラフはノードとリレーションシップにより表され, それぞれがプロパティを持つことができる. | |
47 リレーションシップはグラフでいうところのエッジにあたる. | |
48 ノードからリレーションシップを辿り, 各プロパティをみることでデータの取得を行うことができる. | |
49 通常データベースでは, データの取り出しに価の結合や条件の判定を行う. | |
50 だが, グラフデータベースグラフはどれだけデータが大きくなろうがノードからノードへの移動は1ステップですむ. | |
51 そのため, どれだけデータが大きくなろうと, データが小さい時と同じ計算量でデータの取得が行える. | |
52 | |
53 Neo4j はマスターとスレーブの関係になるクラスタを構成することで分散データベースとして機能する. | |
54 マスターに書かれたデータはスレーブに書き込まれるが, すぐに全てのスレーブに書き込まれるわけではない. | |
55 したがってデータの整合性が失われる危険がある. | |
56 スレーブサーバは現在保持しているデータを返すことができる. | |
57 それにより高い読み取り性能の要求に答えることができる高可用性を実現している. |