# HG changeset patch # User Shoshi TAMAKI # Date 1278857377 -32400 # Node ID 664f03da38c356e7edf271350528968c0629b37b hg init diff -r 000000000000 -r 664f03da38c3 Health Information.mm --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/Health Information.mm Sun Jul 11 23:09:37 2010 +0900 @@ -0,0 +1,4 @@ + + + + diff -r 000000000000 -r 664f03da38c3 cr.html --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/cr.html Sun Jul 11 23:09:37 2010 +0900 @@ -0,0 +1,174 @@ + + + + + + + +琉球大学並列信頼研の紹介 + + + + + + + + + + + + + + + + + + +
+
+
+ + +
+ +
    + + +
  1. +

    Cassandra Project

    +

    琉球大学情報工学科並列信頼研
    +

    准教授 河野真治
    +

  2. +
  3. +

    琉球大学って

    +
    +

    +
        沖縄本島の中部
    + 普天間基地のそば
    + 那覇から30分ぐらい
    + 宜野座はさらに北へ30分
    +
    +

    +


    +

  4. +
  5. +

    琉球大学って

    +
        もちろん偏差値的に高い大学ではないですが...
    + 沖縄にある7つの大学の中ではトップ
    + 優秀な学生は優秀です (沖縄に残りたい学生がいる)
    + そうでなければ沖縄になんか来てません
    +
    +
  6. +
  7. +

    並列信頼研の研究テーマ

    +

    並列実行がテーマですが、動くだけでなく「信頼性」がなければいけません。
    +

        プログラミング言語 (CbC)
    + PS3 (Cell) のTask Manager/Rendering Engine
    + 分散プログラム (Federated Linda)
    + プログラム検証
    +
    +
  8. +
  9. +

    プログラミング言語 (CbC)

    +

        継続と言う概念を基本とした C 言語
    + 状態遷移系、ハードウェア、並列処理
    + などに向いてます。gcc を変更する形で実装。
    +
    +
  10. +
  11. +

    PS3 (Cell) のTask Manager

    +

        Software Rendering Engine
    + ゲームを作るための環境
    + Cell は 6 Core => 並列処理が必須
    + Task 単位でパイプラインで実行
    + (Gameやりたくて入って来る学生も...)
    +
    +
  12. +
  13. +

    分散プログラム (Federated Linda)

    +

        Linda Server
    + Tuple を in/out/read する簡単なデータベース
    + Single Threaded な Linda Server 多数接続
    + Linda Serverを相互に接続するメタエンジン
    + 分散プログラムの実験に使う
    + Cassandra に継る研究
    +
    +
  14. +
  15. +

    Cassandra に関する共同研究

    +

    Cassandra とは?
    +

        分散データベース
    + 複数のノードにレコードが複数格納される
    + Key Value Store
    + SQLではなく、get/set と言う簡潔なAPI
    + Java で実装された Open Source
    + Linux 等と同様、Community により開発されている
    + SEDA staged event-driven architecture
    +
    +
  16. +
  17. +

    SEDA staged event-driven architecture

    +

    2001年にUCBで提案された、複数のスレッドを非同期に繋げることによるScalable なサーバの実装方法。
    +

    当時は、Java 1.3 で性能はそれほど良くはなかった
    +

    Java 1.6 で Thread や java.nio の性能向上
    +

    Cassandra は SEDA を採用している
    +

  18. +
  19. +

    SEDA staged event-driven architecture

    +Multi Thread でパイプライン的に実行
    +


    +

    複数のrequestが同時にたくさんに来るような場合に有効。
    +

  20. +
  21. +

    Cassandra に関する共同研究

    +
         Scalability を評価する環境を構築する
    + Key Value Store の経験を積む
    + 移植
    + データベース設計
    + 運用
    + 構成
    + 優秀な学生を育てる
    +
    +
  22. +
  23. +

    研究プラン

    +

    1Q Cassandra の評価
    +

    2Q Cassandra に向いたメタ文書管理情報データ構造設計
    +

    3Q 設計したデータ構造を扱う Web Service を構築する
    +

    4Q 構築したサービスの可用性とスケーラビリティの測定を行なう
    +

  24. +
  25. +

    Scalability

    +ユーザやデータ量が増加しても、サービスの質と信頼性を維持すること
    +

        一見、余計なコストがかかる
    + 簡単には測定できない
    +
    +

    +

    Scalability を測定する実験環境
    +

    システム構成 (WWW Server, Memcache, Database)
    +

  26. +
  27. +

    Cassandra 実験環境

    +琉球大学情報工学科のPCクラスタ
    +

       NEC Express Server 180 台
    + CoreDuo 2GHz, Memory 1GB, HD 160GB x 2
    + Gigabit Ether, AlaxalA switch
    + TORQUE/Maui によるjob管理 (自動実験投入)
    + 90 台使えるが、落ちているものも多く 70-80台が使用可能
    +
    +
  28. +
  29. +

    現在迄の成果

    +

    次の発表で...
    +

    \ No newline at end of file diff -r 000000000000 -r 664f03da38c3 cr.ind --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/cr.ind Sun Jul 11 23:09:37 2010 +0900 @@ -0,0 +1,171 @@ +-title: 琉球大学並列信頼研の紹介 + +--author: 准教授 河野真治 + +-- Cassandra Project + +琉球大学情報工学科並列信頼研 + +准教授 河野真治 + +--琉球大学って + + +

    + 沖縄本島の中部 + + 普天間基地のそば + + 那覇から30分ぐらい + + 宜野座はさらに北へ30分 +
    + + + +--琉球大学って + + もちろん偏差値的に高い大学ではないですが... + + 沖縄にある7つの大学の中ではトップ + + 優秀な学生は優秀です (沖縄に残りたい学生がいる) + + そうでなければ沖縄になんか来てません + +--並列信頼研の研究テーマ + +並列実行がテーマですが、動くだけでなく「信頼性」がなければいけません。 + + プログラミング言語 (CbC) + + PS3 (Cell) のTask Manager/Rendering Engine + + 分散プログラム (Federated Linda) + + プログラム検証 + +--プログラミング言語 (CbC) + + 継続と言う概念を基本とした C 言語 + + 状態遷移系、ハードウェア、並列処理 + + などに向いてます。gcc を変更する形で実装。 + +--PS3 (Cell) のTask Manager + + Software Rendering Engine + + ゲームを作るための環境 + + Cell は 6 Core => 並列処理が必須 + + Task 単位でパイプラインで実行 + + (Gameやりたくて入って来る学生も...) + +--分散プログラム (Federated Linda) + + Linda Server + Tuple を in/out/read する簡単なデータベース + + Single Threaded な Linda Server 多数接続 + + Linda Serverを相互に接続するメタエンジン + + 分散プログラムの実験に使う + + Cassandra に継る研究 + +--Cassandra に関する共同研究 + +Cassandra とは? + 分散データベース + 複数のノードにレコードが複数格納される + + Key Value Store + SQLではなく、get/set と言う簡潔なAPI + + Java で実装された Open Source + Linux 等と同様、Community により開発されている + + SEDA staged event-driven architecture + +--SEDA staged event-driven architecture + +2001年にUCBで提案された、複数のスレッドを非同期に繋げることによるScalable なサーバの実装方法。 + +当時は、Java 1.3 で性能はそれほど良くはなかった + +Java 1.6 で Thread や java.nio の性能向上 + +Cassandra は SEDA を採用している + +--SEDA staged event-driven architecture + +Multi Thread でパイプライン的に実行 + +
    + +複数のrequestが同時にたくさんに来るような場合に有効。 + + +--Cassandra に関する共同研究 + + Scalability を評価する環境を構築する + + Key Value Store の経験を積む + 移植 + データベース設計 + 運用 + 構成 + + 優秀な学生を育てる + +--研究プラン + +1Q Cassandra の評価 + +2Q Cassandra に向いたメタ文書管理情報データ構造設計 + +3Q 設計したデータ構造を扱う Web Service を構築する + +4Q 構築したサービスの可用性とスケーラビリティの測定を行なう + +--Scalability + +ユーザやデータ量が増加しても、サービスの質と信頼性を維持すること + + 一見、余計なコストがかかる + + 簡単には測定できない + +
    + +Scalability を測定する実験環境 + +システム構成 (WWW Server, Memcache, Database) + + +--Cassandra 実験環境 + +琉球大学情報工学科のPCクラスタ + + NEC Express Server 180 台 + CoreDuo 2GHz, Memory 1GB, HD 160GB x 2 + Gigabit Ether, AlaxalA switch + + TORQUE/Maui によるjob管理 (自動実験投入) + + 90 台使えるが、落ちているものも多く 70-80台が使用可能 + +--現在迄の成果 + +次の発表で... + + + diff -r 000000000000 -r 664f03da38c3 ebook.ind --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/ebook.ind Sun Jul 11 23:09:37 2010 +0900 @@ -0,0 +1,9 @@ +-title: 電子出版 + +スキャン + +縦書き + +HTML5 + +iPad diff -r 000000000000 -r 664f03da38c3 experiment.ind --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/experiment.ind Sun Jul 11 23:09:37 2010 +0900 @@ -0,0 +1,95 @@ +-title: + +血液サンプル + 検査項目 2-30 + +平均、一日 15万検体 + + 40 / sec + +2-3時間の処理 + + 4,500,000 + +100万件 + 7年残す + データは2年 + + +1,642,500,000 + + 100GB 年間 + + 160GB x 3 + +Cent OS + +--Postgress SQL + +1万トランザクシション/sec (SSL) + +--データベースの信頼性の評価 + + 85台 + + ちゃんと書き込まれてる? + デバイス + バグ + + 評価検証 + + PPB Part per biliion + +--90台 Mac Mini + +2*4*15000 +33 + +--Cassandra + + 動かすのは簡単 + API がシンプル + + conf にhost 1部/全部? + 試す? + + host の追加 + +--CbC による実装 + +来年 + +--THInKS + +THInKS データベース + +--顔合せ + +--Database + +DEIM2009 + +知識共有サイトにおける参加者の貢献度に着目したコミュニティ分析手法: 佐藤 弘樹, 島田 諭(筑波大), 伏見 卓恭(静岡県立大), 福原 知宏(東大), 斉藤 和巳(静岡県立大), 佐藤 哲司(筑波大) + +撮影状況メタデータを用いた制約付きクラスタリングによる画像検索結果提示手法の検討と評価: 廣田 雅春, 横山 昌平, 福田 直樹, 石川 博(静岡大) +HOSVDにおける自己相関行列の補正を用いた高階データ分類手法: 森垣 潤一, 片山 薫(首都大) + +QueueLinker: パイプライン型アプリケーションのための分散処理フレームワーク: 上田 高徳, 片瀬 弘晶, 森本 浩介, 打田 研二(早稲田大), 油井 誠(日本学術振興会), 山名 早人(早稲田大,NII) + +分散ストリーム処理環境における適応的高信頼化手法: 塩川 浩昭, 北川 博之, 川島 英之(筑波大) +仮想マシンPCクラスタのロードバランスに関する評価と実クラウドへの適用の検討: 豊島 詩織(お茶大), 山口 実靖(工学院大), 小口 正人(お茶大) +スケーラビリティと高効率性を備えたクラウド基盤を実現するデータセントリック分散制御: 菅 真樹, 小林 大, 鳥居 隆史, 小川 周吾, 板橋 康雄, 宮田 美知太郎, 山川 聡, 長谷部 賀洋(NECシステムプラットフォーム研究所) +メディア処理向けクラウド基盤「虹雲」: 松田 基弘, 赤間 浩樹, 毛受 崇, 長谷川 知洋, 内藤 一兵衛, 山室 雅司(NTTR&D) +MapReduceを利用した決定木生成処理の負荷分散: 福本 佳史, 藤岡 健吾, 鬼塚 真(NTTR&D) +Kogumo: 軽量クラウド環境の構築: 加藤 雅一, 石山 直毅, 井出 真広, 倉光 君郎(横浜国立大) +座長:山名早人(早稲田大) +リンクを含むつぶやきに着目したTwitterの分析: 吉田 光男, 乾 孝司, 山本 幹雄(筑波大) +タプルストリームからのデータキューブの構築: 嶋田 鉄兵, 佐々原 秀男, 都司 達夫, 樋口 健(福井大) +多次元的なWeb空間マイニングを行うデータベースシステムの実現:制約条件の一般化: 齋藤 太陽, 大森 匡, 星 守(電気通信大) +A New Parallel MOLAP Data Cube Construction Scheme: Jin Dong, Tsuji Tatsuo, Higuchi Ken(福井大) +最小コストフローアルゴリズムを用いた並列スケルトン処理の最適配置: 中台 慎二(NECサービスプラットフォーム研究所) +分散ファイルシステムHadoopの広域環境への適用: 百瀬 明日香, 小口 正人(お茶大)