# HG changeset patch # User tobaru # Date 1526951619 -32400 # Node ID d4e58a38aae79f347c518a8dd17c1981634c6d53 # Parent 5790bdc1d515c10d046c445de3871510f847895c fix diff -r 5790bdc1d515 -r d4e58a38aae7 Slide/prosym.html --- a/Slide/prosym.html Mon May 21 17:18:19 2018 +0900 +++ b/Slide/prosym.html Tue May 22 10:13:39 2018 +0900 @@ -86,7 +86,7 @@ @@ -106,11 +106,16 @@
-

API と実装の分離

+

スライドの流れ

@@ -131,14 +136,31 @@

Gears OS の Interface

+ + +
+
+ +

スライドの流れ

+ @@ -147,18 +169,24 @@

並列API

-

スライドの流れ

+

スライドの流れ

-

スライドの流れ

+

スライドの流れ

+
+ Gears OS の構造 +
-

par goto

+

TaskManager

+
+ Gears OS の構造 +
+ + +
+
+ +

Worker

+ +
+ Gears OS の構造 +
@@ -306,19 +370,21 @@
  • このような実行になるように Gears OS の実装を行う
  • - +
    + Gears OS の構造
    -
    - -

    __exit

    -
    -

    スライドの流れ

    +

    スライドの流れ

      +
    • Interface
    • +
    • 並列API
    • CbC
    • Gears OS における並列実行
    • @@ -404,7 +459,7 @@
    • CPU : 2 × 18-Core Intel Xeon 2.30GHz
    -
  • CPU 環境 +
  • GPU 環境
    • GPU : GeForce GTX 1070
    • Cores : 1920
    • @@ -477,13 +532,62 @@
  • -

    評価の考察

    +

    評価の考察

      -
    • コア数が上がるごとに、処理速度が上がっている。
    • +
    • コア数が上がるごとに、処理速度が上がっている。 +
        +
      • 台数効果が見られる
      • +
      +
    • GPUでの実行は 32CPU に比べて約7.2倍の速度向上が見られた。
    • -
    • 通信速度を含めると 16CPU より遅い。
    • +
    • 通信速度を含めると 16CPU より遅い。 +
        +
      • 通信速度によるオーバーヘッド
      • +
      +
    + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
    ProcessorTime(ms)
    1 CPU1181.215
    2 CPUs627.914
    4 CPUs324.059
    8 CPUs159.932
    16 CPUs85.518
    32 CPUs43.496
    GPU127.018
    GPU(kernel only)6.018
    +
    @@ -502,7 +606,23 @@
    -

    スライドの流れ

    +

    スライドの流れ

    +
      +
    • Interface
    • +
    • 並列API
    • +
    • CbC
    • +
    • Gears OS における並列実行
    • +
    • 比較
    • +
    • + 今後の課題 +
    • +
    + + +
    +
    + +

    スライドの流れ

    • CbC
    • Gears OS における並列実行
    • @@ -516,13 +636,57 @@
    -

    今後の課題

    +

    今後の課題

    • Go 言語との比較から 1CPU での動作が遅いことがわかった。
    • par goto 文を使用することで、Contextを生成し、並列処理を行う。
    • しかし、Context はメモリ空間の確保や使用する全ての Code Gear Data Gear の設定をする必要があり、生成に時間がかかってしまう事が原因。
    • 処理が軽い場合は Context を生成しないようなチューニングが必要である。
    + + +
    +
    + +

    Perlスクリプトによる変換

    +
    __code code1(struct Context *context, Integer *integer1, Integer *integer2, Integer *output) {
    +    // create context
    +    context->task = NEW(struct Context);
    +    initContext(context->task);
    +
    +    // set task parameter
    +    context->task->next = C_add;
    +    context->task->idgCount = 2;
    +    context->task->idg = context->task->dataNum;
    +    context->task->maxIdg = context->task->idg + 2;
    +    context->task->odg = context->task->maxIdg;
    +    context->task->maxOdg = context->task->odg + 1;
    +
    +    // create Data Gear Queue
    +    GET_META(integer1)->wait = createSynchronizedQueue(context);
    +    GET_META(integer2)->wait = createSynchronizedQueue(context);
    +    GET_META(integer3)->wait = createSynchronizedQueue(context);
    +
    +    // set Input Data Gear
    +    context->task->data[context->task->idg+0] = (union Data*)integer1;
    +    context->task->data[context->task->idg+1] = (union Data*)integer2;
    +
    +    // set Output Data Gear
    +    context->task->data[context->task->odg+0] = (union Data*)integer3;
    +
    +    // add taskList Element
    +    struct Element* element;
    +    element = &ALLOCATE(context, Element)->Element;
    +    element->data = (union Data*)context->task;
    +    element->next = context->taskList;
    +    context->taskList = element;
    +    
    +    // set TaskManager->spawns parameter
    +    Gearef(context, TaskManager)->taskList = context->taskList;
    +    Gearef(context, TaskManager)->next1 = C_code2;
    +    goto meta(context, C_code2);
    +}
    +
    diff -r 5790bdc1d515 -r d4e58a38aae7 Slide/prosym.md --- a/Slide/prosym.md Mon May 21 17:18:19 2018 +0900 +++ b/Slide/prosym.md Tue May 22 10:13:39 2018 +0900 @@ -30,10 +30,10 @@ % 拡張性と信頼性を実現する時に Interfaceと par goto 構文がなぜ必要なのかに繋げる話が必要 % APIと実装の分離が望ましい理由は? -## API と実装の分離 -- Gears OS は Continuation based C(以下、CbC)によって記述されている。 -- CbC は Code Gear と Data Gear の単位でプログラムを記述していて、システムやアプリケーションを作る際に、この2つは柔軟に再利用する必要がある。 -- この時に、機能を接続する API と実装の分離が可能であることが望ましい。 +% ## API と実装の分離 +% - Gears OS は Continuation based C(以下、CbC)によって記述されている。 +% - CbC は Code Gear と Data Gear の単位でプログラムを記述していて、システムやアプリケーションを作る際に、この2つは柔軟に再利用する必要がある。 +% - この時に、機能を接続する API と実装の分離が可能であることが望ましい。 % 上と繋がってない % なんでモジュールシステムが必要? @@ -48,6 +48,16 @@ % Interfaceはほとんどかかない % TaskScheduler の図も入れる Gears の構成のやつ + +## スライドの流れ +- Interface +- 並列API +- CbC +- Gears OS における並列実行 +- 比較 +- 今後の課題 + + ## Gears OS での形式化とInterfaceの導入 - 形式化とは仕様、実装、実行を Logic で記述する事である。 - Gears OS では、継続を使った関数型プログラムとして実装を記述する @@ -56,25 +66,39 @@ ## Gears OS の Interface - Code Gear と Deta Gear は Interface と呼ばれるまとまり(モジュール)で記述される。 -- Interface 作成時に Code Gear の集合を指定することにより複数の実装を持つことができる。 + - Gears OS のモジュール化 +- Interface 作成時に Code Gear の集合を指定することにより複数の実装(並列処理)を持つことができる。 - Interface は Data Gear で記述されて、Meta Deta Gear と呼ばれる。 - Java などの Class に相当する。 -% - Interface を外から呼び出すための Code Gear 群の型 -- Interface を呼び出す時に必要となる引数を全て格納する Data Gear +- Data Gear に Interface を呼び出す時に必要となる引数を全て格納する % - 実装に使う Code Gear の番号が含まれている。 % - Code Gear の番号を変更することによって異なる実装を実現できる +% - Interface を外から呼び出すための Code Gear 群の型 + % Interface は実行時に実装を入れ替える事ができる % 呼び出すものはStack 上に積めない % Contextも集合 +## スライドの流れ +- Interface +- 並列API +- CbC +- Gears OS における並列実行 +- 比較 +- 今後の課題 + + ## 並列API -- Geas OS 信頼性を保証するために、モジュールシステムが必要である。 +- Geas OS 信頼性を保証(テスト)するために、モジュールシステムが必要である。 - 本研究では、モジュールシステムとその応用である並列APIについて考察する。 -- 並列APIは継続を基本とした関数型プログラミングと両立する必要があり、ここでは CbC の goto 文を拡張した par goto を導入する。 +- 並列APIは継続を基本とした関数型プログラミングと両立する必要があり、ここでは CbC の goto 文を拡張した **par goto** を導入する。 + - Interface でモジュール化 + - 応用として par goto を使って 並列API を実装 ## スライドの流れ - Interface +- 並列API - CbC - Gears OS における並列実行 - 比較 @@ -85,14 +109,14 @@ ## CbC -- ノーマルレベルとメタレベルの計算を1つの言語で表現できる言語として、本研究室で設計した CbC を用いる。 -- ノーマルレベルの計算 - - コンピュータの計算はプログラミング言語で行われる。 - - その部分をノーマルレベルの計算と呼ぶ。 -- メタレベルの計算 - - コードが実行される際の以下の部分が、メタレベルの計算という。 - - 処理系の詳細や使用する資源 - - コードの仕様や型などの部分 +- ノーマルレベルとメタレベルの計算をまとめて表現できる言語として、本研究室で設計した CbC を用いる。 + - ノーマルレベルの計算 + - コンピュータの計算はプログラミング言語で行われる。 + - その部分をノーマルレベルの計算と呼ぶ。 + - メタレベルの計算 + - コードが実行される際の以下の部分が、メタレベルの計算という。 + - 処理系の詳細や使用する資源 + - コードの仕様や型などの部分 % ノーマルレベルとメタレベルの違い % 以外 = メモリ @@ -107,7 +131,10 @@ ## CbC - CbC を用いることで、ノーマルレベルの計算の信頼性をメタレベルから保証できるようになる。 + - 処理の詳細やコードの型を数え上げる事による信頼性の保証 - CbC を用いてCode Gear と Data Gear を導入する。 + - Code Gear は並列処理の単位として利用 + - Data Gear はデータそのもの % - 検証には 定理証明支援系である Agda を用いる。 @@ -145,14 +172,14 @@ % par goto を使えば並列実行されたGears の形式化ができる - ## スライドの流れ +- Interface +- 並列API - CbC - Gears OS における並列実行 - 比較 - 今後の課題 - ## Gears における並列実行 - Gears OS ではメタ計算を柔軟に記述するためのプログラミングの単位として Code Gear と Data Gear を用いる。 - それぞれにメタレベルの単位が存在し、Meta Data Gear と Meta Code Gear と呼ぶ。 @@ -183,12 +210,34 @@ - 1つのスレッド内で使われる Interface の Code Gear と Data Gear は Meta Data Gear に格納される。 - この Meta Data Gear を Context と呼ぶ。 - Context を複製して複数の CPU に割り当てることにより並列実行が可能になる。 +- ノーマルレベルでは見る事ができない。 - Context は Task でもある。 - Task は実行する Code Gear と Data Gear を全て持っている。 +
    + Gears OS の構造 +
    -## par goto -- Context の複製には par goto を用いる。 -- 他に、入力の同期、タスクスケジューラへの Context の登録が行われる。 + + +## TaskManager +- Task を実行する Worker の生成 +- Worker の管理 +- Task の送信 +
    + Gears OS の構造 +
    + + + +## Worker +- TaskQueue から Task である Context を取得 +- Task の Code Gear を実行 +- Output Data Gear への書き出し +
    + Gears OS の構造 +
    + + % exit が説明不足 % code gear の実行は他のシープに邪魔されない。 @@ -209,12 +258,15 @@ -## __exit -- 複数実行した時に、共有 Data Gear に書き込みを成功したかを確認する(commit) + +# par goto +- Context(Task) の複製には par goto を用いる。 +- 他に、入力の同期、タスクスケジューラへの Context の登録が行われる。 +- 複数実行した時に、共有 Data Gear に書き込みを成功したかを確認(commit)するために __exit を使用する。 - par goto で生成された Task は __exit に継続することで終了する - GearsOS の Task は Output Data Gear を生成した時点で終了する - そのため、par goto では直接 __exit に継続せず、Output Data Gear への書き出し処理に継続される。 -- Code Gear と Data Gear の依存関係をノーマルレベルで記述できるようになる。 +% - Code Gear と Data Gear の依存関係をノーマルレベルで記述できるようになる。 ```c __code code1(Integer *integer1, Integer * integer2, Integer *output) { par goto add(integer1, integer2, output, __exit); @@ -241,26 +293,21 @@ context->task->maxIdg = context->task->idg + 2; context->task->odg = context->task->maxIdg; context->task->maxOdg = context->task->odg + 1; - - // create Data Gear Queue - GET_META(integer1)->wait = createSynchronizedQueue(context); - GET_META(integer2)->wait = createSynchronizedQueue(context); - GET_META(integer3)->wait = createSynchronizedQueue(context); - - // set Input Data Gear - context->task->data[context->task->idg+0] = (union Data*)integer1; - context->task->data[context->task->idg+1] = (union Data*)integer2; - - // set Output Data Gear - context->task->data[context->task->odg+0] = (union Data*)integer3; - - +... // set TaskManager->spawns parameter Gearef(context, TaskManager)->taskList = context->taskList; Gearef(context, TaskManager)->next1 = C_code2; goto parGotoMeta(context, C_code2); } ``` +% // set Input Data Gear +% context->task->data[context->task->idg+0] = (union Data*)integer1; +% context->task->data[context->task->idg+1] = (union Data*)integer2; +% +% // set Output Data Gear +% context->task->data[context->task->odg+0] = (union Data*)integer3; + + % // add taskList Element % struct Element* element; % element = &ALLOCATE(context, Element)->Element; @@ -270,7 +317,7 @@ % 失敗した時はmeta compitation で処理する - +% *** % ## Interface @@ -280,11 +327,14 @@ % ## 並列構文 ## スライドの流れ +- Interface +- 並列API - CbC - Gears OS における並列実行 - 比較 - 今後の課題 + ## Gears OS の評価(目的) - 並列構文とそれを実現する Meta Compitation が十分に揃っているかを確認したい - 並列処理の台数効果を確認する @@ -297,7 +347,7 @@ - Model : Dell PowerEdgeR630 - Memory : 768GB - CPU : 2 × 18-Core Intel Xeon 2.30GHz - - CPU 環境 + - GPU 環境 - GPU : GeForce GTX 1070 - Cores : 1920 - ClockSpeed : 1683MHZ @@ -353,8 +403,51 @@ ## 評価の考察 - コア数が上がるごとに、処理速度が上がっている。 + - 台数効果が見られる - GPUでの実行は 32CPU に比べて約7.2倍の速度向上が見られた。 - 通信速度を含めると 16CPU より遅い。 + - 通信速度によるオーバーヘッド + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
    ProcessorTime(ms)
    1 CPU1181.215
    2 CPUs627.914
    4 CPUs324.059
    8 CPUs159.932
    16 CPUs85.518
    32 CPUs43.496
    GPU127.018
    GPU(kernel only)6.018
    % なんでGo言語? ## Go 言語との比較 @@ -367,6 +460,15 @@ ## スライドの流れ +- Interface +- 並列API +- CbC +- Gears OS における並列実行 +- 比較 +- 今後の課題 + + +## スライドの流れ - CbC - Gears OS における並列実行 - 比較 @@ -377,3 +479,46 @@ - par goto 文を使用することで、Contextを生成し、並列処理を行う。 - しかし、Context はメモリ空間の確保や使用する全ての Code Gear Data Gear の設定をする必要があり、生成に時間がかかってしまう事が原因。 - 処理が軽い場合は Context を生成しないようなチューニングが必要である。 + + + +## Perlスクリプトによる変換 +```c +__code code1(struct Context *context, Integer *integer1, Integer *integer2, Integer *output) { + // create context + context->task = NEW(struct Context); + initContext(context->task); + + // set task parameter + context->task->next = C_add; + context->task->idgCount = 2; + context->task->idg = context->task->dataNum; + context->task->maxIdg = context->task->idg + 2; + context->task->odg = context->task->maxIdg; + context->task->maxOdg = context->task->odg + 1; + + // create Data Gear Queue + GET_META(integer1)->wait = createSynchronizedQueue(context); + GET_META(integer2)->wait = createSynchronizedQueue(context); + GET_META(integer3)->wait = createSynchronizedQueue(context); + + // set Input Data Gear + context->task->data[context->task->idg+0] = (union Data*)integer1; + context->task->data[context->task->idg+1] = (union Data*)integer2; + + // set Output Data Gear + context->task->data[context->task->odg+0] = (union Data*)integer3; + + // add taskList Element + struct Element* element; + element = &ALLOCATE(context, Element)->Element; + element->data = (union Data*)context->task; + element->next = context->taskList; + context->taskList = element; + + // set TaskManager->spawns parameter + Gearef(context, TaskManager)->taskList = context->taskList; + Gearef(context, TaskManager)->next1 = C_code2; + goto meta(context, C_code2); +} +``` diff -r 5790bdc1d515 -r d4e58a38aae7 Slide/prosym.pdf.html --- a/Slide/prosym.pdf.html Mon May 21 17:18:19 2018 +0900 +++ b/Slide/prosym.pdf.html Tue May 22 10:13:39 2018 +0900 @@ -70,7 +70,7 @@ @@ -90,11 +90,16 @@
    -

    API と実装の分離

    +

    スライドの流れ

      -
    • Gears OS は Continuation based C(以下、CbC)によって記述されている。
    • -
    • CbC は Code Gear と Data Gear の単位でプログラムを記述していて、システムやアプリケーションを作る際に、この2つは柔軟に再利用する必要がある。
    • -
    • この時に、機能を接続する API と実装の分離が可能であることが望ましい。
    • +
    • + Interface +
    • +
    • 並列API
    • +
    • CbC
    • +
    • Gears OS における並列実行
    • +
    • 比較
    • +
    • 今後の課題
    @@ -115,14 +120,31 @@

    Gears OS の Interface

      -
    • この時、Code Gear と Deta Gear は Interface と呼ばれるまとまり(モジュール)で記述される。
    • -
    • Interface 作成時に Code Gear の集合を指定することにより複数の実装を持つことができる。
    • +
    • Code Gear と Deta Gear は Interface と呼ばれるまとまり(モジュール)で記述される。 +
        +
      • Gears OS のモジュール化
      • +
      +
    • +
    • Interface 作成時に Code Gear の集合を指定することにより複数の実装(並列処理)を持つことができる。
    • Interface は Data Gear で記述されて、Meta Deta Gear と呼ばれる。
    • Java などの Class に相当する。
    • -
    • Interface を外から呼び出すための Code Gear 群の型
    • -
    • Interface を呼び出す時に必要となる引数を全て格納する Data Gear
    • -
    • 実装に使う Code Gear の番号が含まれている。
    • -
    • Code Gear の番号を変更することによって異なる実装を実現できる
    • +
    • Data Gear に Interface を呼び出す時に必要となる引数を全て格納する
    • +
    + + +
    +
    + +

    スライドの流れ

    +
      +
    • Interface
    • +
    • + 並列API +
    • +
    • CbC
    • +
    • Gears OS における並列実行
    • +
    • 比較
    • +
    • 今後の課題
    @@ -131,18 +153,24 @@

    並列API

      -
    • Geas OS 信頼性を保証するために、モジュールシステムが必要である。
    • +
    • Geas OS 信頼性を保証(テスト)するために、モジュールシステムが必要である。
    • 本研究では、モジュールシステムとその応用である並列APIについて考察する。
    • -
    • 並列APIは継続を基本とした関数型プログラミングと両立する必要があり、ここでは CbC の goto 文を拡張した par goto を導入する。
    • +
    • 並列APIは継続を基本とした関数型プログラミングと両立する必要があり、ここでは CbC の goto 文を拡張した par goto を導入する。 +
        +
      • Interface でモジュール化
      • +
      • 応用として par goto を使って 並列API を実装
      • +
      +
    -

    スライドの流れ

    +

    スライドの流れ

    • Interface
    • +
    • 並列API
    • CbC
    • @@ -157,19 +185,22 @@

      CbC

        -
      • ノーマルレベルとメタレベルの計算を1つの言語で表現できる言語として、本研究室で設計した CbC を用いる。
      • -
      • ノーマルレベルの計算 +
      • ノーマルレベルとメタレベルの計算をまとめて表現できる言語として、本研究室で設計した CbC を用いる。
          -
        • コンピュータの計算はプログラミング言語で行われる。
        • -
        • その部分をノーマルレベルの計算と呼ぶ。
        • -
        -
      • -
      • メタレベルの計算 -
          -
        • コードが実行される際の以下の部分が、メタレベルの計算という。 +
        • ノーマルレベルの計算
            -
          • 処理系の詳細や使用する資源
          • -
          • コードの仕様や型などの部分
          • +
          • コンピュータの計算はプログラミング言語で行われる。
          • +
          • その部分をノーマルレベルの計算と呼ぶ。
          • +
          +
        • +
        • メタレベルの計算 +
            +
          • コードが実行される際の以下の部分が、メタレベルの計算という。 +
              +
            • 処理系の詳細や使用する資源
            • +
            • コードの仕様や型などの部分
            • +
            +
        @@ -182,8 +213,17 @@

        CbC

          -
        • CbC を用いることで、ノーマルレベルの計算の信頼性をメタレベルから保証できるようになる。
        • -
        • CbC を用いてCode Gear と Data Gear を導入する。
        • +
        • CbC を用いることで、ノーマルレベルの計算の信頼性をメタレベルから保証できるようになる。 +
            +
          • 処理の詳細やコードの型を数え上げる事による信頼性の保証
          • +
          +
        • +
        • CbC を用いてCode Gear と Data Gear を導入する。 +
            +
          • Code Gear は並列処理の単位として利用
          • +
          • Data Gear はデータそのもの
          • +
          +
        @@ -211,8 +251,10 @@
    -

    スライドの流れ

    +

    スライドの流れ

      +
    • Interface
    • +
    • 並列API
    • CbC
    • Gears OS における並列実行 @@ -264,19 +306,41 @@
    • 1つのスレッド内で使われる Interface の Code Gear と Data Gear は Meta Data Gear に格納される。
    • この Meta Data Gear を Context と呼ぶ。
    • Context を複製して複数の CPU に割り当てることにより並列実行が可能になる。
    • +
    • ノーマルレベルでは見る事ができない。
    • Context は Task でもある。
    • Task は実行する Code Gear と Data Gear を全て持っている。
    +
    + Gears OS の構造 +
    -

    par goto

    +

    TaskManager

      -
    • Context の複製には par goto を用いる。
    • -
    • 他に、入力の同期、タスクスケジューラへの Context の登録が行われる。
    • +
    • Task を実行する Worker の生成
    • +
    • Worker の管理
    • +
    • Task の送信
    +
    + Gears OS の構造 +
    + + +
    +
    + +

    Worker

    +
      +
    • TaskQueue から Task である Context を取得
    • +
    • Task の Code Gear を実行
    • +
    • Output Data Gear への書き出し
    • +
    +
    + Gears OS の構造 +
    @@ -290,19 +354,21 @@
  • このような実行になるように Gears OS の実装を行う
  • - +
    + Gears OS の構造
    -
    - -

    __exit

    -
      -
    • 複数実行した時に、共有 Data Gear に書き込みを成功したかを確認する(commit)
    • + +

      par goto

      +
        +
      • Context(Task) の複製には par goto を用いる。
      • +
      • 他に、入力の同期、タスクスケジューラへの Context の登録が行われる。
      • +
      • 複数実行した時に、共有 Data Gear に書き込みを成功したかを確認(commit)するために __exit を使用する。
      • par goto で生成された Task は __exit に継続することで終了する
      • GearsOS の Task は Output Data Gear を生成した時点で終了する
      • そのため、par goto では直接 __exit に継続せず、Output Data Gear への書き出し処理に継続される。
      • -
      • Code Gear と Data Gear の依存関係をノーマルレベルで記述できるようになる。
      -
      __code code1(Integer *integer1, Integer * integer2, Integer *output) {
      +
      +
      __code code1(Integer *integer1, Integer * integer2, Integer *output) {
           par goto add(integer1, integer2, output, __exit);
           goto code2();
       }
      @@ -326,20 +392,7 @@
           context->task->maxIdg = context->task->idg + 2;
           context->task->odg = context->task->maxIdg;
           context->task->maxOdg = context->task->odg + 1;
      -
      -    // create Data Gear Queue
      -    GET_META(integer1)->wait = createSynchronizedQueue(context);
      -    GET_META(integer2)->wait = createSynchronizedQueue(context);
      -    GET_META(integer3)->wait = createSynchronizedQueue(context);
      -
      -    // set Input Data Gear
      -    context->task->data[context->task->idg+0] = (union Data*)integer1;
      -    context->task->data[context->task->idg+1] = (union Data*)integer2;
      -
      -    // set Output Data Gear
      -    context->task->data[context->task->odg+0] = (union Data*)integer3;
      -
      -   
      +...
           // set TaskManager->spawns parameter
           Gearef(context, TaskManager)->taskList = context->taskList;
           Gearef(context, TaskManager)->next1 = C_code2;
      @@ -351,8 +404,10 @@
       
    -

    スライドの流れ

    +

    スライドの流れ

      +
    • Interface
    • +
    • 並列API
    • CbC
    • Gears OS における並列実行
    • @@ -388,7 +443,7 @@
    • CPU : 2 × 18-Core Intel Xeon 2.30GHz
    -
  • CPU 環境 +
  • GPU 環境
    • GPU : GeForce GTX 1070
    • Cores : 1920
    • @@ -461,13 +516,62 @@
  • -

    評価の考察

    +

    評価の考察

      -
    • コア数が上がるごとに、処理速度が上がっている。
    • +
    • コア数が上がるごとに、処理速度が上がっている。 +
        +
      • 台数効果が見られる
      • +
      +
    • GPUでの実行は 32CPU に比べて約7.2倍の速度向上が見られた。
    • -
    • 通信速度を含めると 16CPU より遅い。
    • +
    • 通信速度を含めると 16CPU より遅い。 +
        +
      • 通信速度によるオーバーヘッド
      • +
      +
    + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
    ProcessorTime(ms)
    1 CPU1181.215
    2 CPUs627.914
    4 CPUs324.059
    8 CPUs159.932
    16 CPUs85.518
    32 CPUs43.496
    GPU127.018
    GPU(kernel only)6.018
    +
    @@ -486,7 +590,23 @@
    -

    スライドの流れ

    +

    スライドの流れ

    +
      +
    • Interface
    • +
    • 並列API
    • +
    • CbC
    • +
    • Gears OS における並列実行
    • +
    • 比較
    • +
    • + 今後の課題 +
    • +
    + + +
    +
    + +

    スライドの流れ

    • CbC
    • Gears OS における並列実行
    • @@ -500,13 +620,57 @@
    -

    今後の課題

    +

    今後の課題

    • Go 言語との比較から 1CPU での動作が遅いことがわかった。
    • par goto 文を使用することで、Contextを生成し、並列処理を行う。
    • しかし、Context はメモリ空間の確保や使用する全ての Code Gear Data Gear の設定をする必要があり、生成に時間がかかってしまう事が原因。
    • 処理が軽い場合は Context を生成しないようなチューニングが必要である。
    + + +
    +
    + +

    Perlスクリプトによる変換

    +
    __code code1(struct Context *context, Integer *integer1, Integer *integer2, Integer *output) {
    +    // create context
    +    context->task = NEW(struct Context);
    +    initContext(context->task);
    +
    +    // set task parameter
    +    context->task->next = C_add;
    +    context->task->idgCount = 2;
    +    context->task->idg = context->task->dataNum;
    +    context->task->maxIdg = context->task->idg + 2;
    +    context->task->odg = context->task->maxIdg;
    +    context->task->maxOdg = context->task->odg + 1;
    +
    +    // create Data Gear Queue
    +    GET_META(integer1)->wait = createSynchronizedQueue(context);
    +    GET_META(integer2)->wait = createSynchronizedQueue(context);
    +    GET_META(integer3)->wait = createSynchronizedQueue(context);
    +
    +    // set Input Data Gear
    +    context->task->data[context->task->idg+0] = (union Data*)integer1;
    +    context->task->data[context->task->idg+1] = (union Data*)integer2;
    +
    +    // set Output Data Gear
    +    context->task->data[context->task->odg+0] = (union Data*)integer3;
    +
    +    // add taskList Element
    +    struct Element* element;
    +    element = &ALLOCATE(context, Element)->Element;
    +    element->data = (union Data*)context->task;
    +    element->next = context->taskList;
    +    context->taskList = element;
    +    
    +    // set TaskManager->spawns parameter
    +    Gearef(context, TaskManager)->taskList = context->taskList;
    +    Gearef(context, TaskManager)->next1 = C_code2;
    +    goto meta(context, C_code2);
    +}
    +