# HG changeset patch # User Tatsuki IHA # Date 1518500122 -32400 # Node ID 0b7cf219ebfa44de9c3af716d17dd260fd2e2748 # Parent 2d411c46eeb9c2723b24a4cb04495b0cb8828e8f Fix diff -r 2d411c46eeb9 -r 0b7cf219ebfa slide/slide.html --- a/slide/slide.html Tue Feb 13 14:15:31 2018 +0900 +++ b/slide/slide.html Tue Feb 13 14:35:22 2018 +0900 @@ -87,7 +87,7 @@ @@ -406,11 +406,7 @@
  • Gearef マクロは Context から Interface の引数格納用の Data Gear を取り出す
  • Context には Interface の引数を渡すための Data Gear が予め用意されている
  • -
  • goto meta では Interface の Code Gear の番号を Code Gear へのポインタに変換して継続を行う - -
  • +
  • goto meta では Interface の Code Gear の番号を Code Gear へのポインタに変換して継続を行う
  • __code code1(struct Context *context) {
    @@ -430,9 +426,10 @@
     
     

    Interface での stub Code Gear

      -
    • meta Code Gear では引数に指定された Code Gear の番号から stub Code Gear を取り出し、 継続を行う
    • +
    • meta Code Gear では引数に指定された Code Gear の番号から stub Code Gear への関数ポインタを取り出し、 継続を行う
    • メタ計算で格納された引数は stub Code Gear で Code Gear に渡される
    • Interface を実装した Code Gear は Interface の定義から stub Code Gear の自動生成が可能
    • +
    • 必要ならばメタ計算を meta Code Gear か stub Code Gear に埋め込むことができる
    // implement put code gear
    @@ -462,10 +459,14 @@
     
    • 今回は並列処理機構である
        -
      • Task
      • +
      • Task +
          +
        • 1つの Context 上で goto で遷移しながら実行される Code Gear の列
        • +
        +
      • TaskManager
          -
        • Worker の生成、依存関係を解決したTask を Worker に送信する
        • +
        • 依存関係を解決したTask を Worker SynchronizedQueue に送信する
      • Worker @@ -476,12 +477,12 @@
      • SynchronizedQueue
          -
        • マルチスレッド環境でもデータの同期処理が行われる Queue
        • +
        • Gears OS で記述されたマルチスレッド環境でもデータの同期処理が行われる Queue
    • -
    • をInterface を用いて実装した
    • +
    • これらを Interface として実装した
    @@ -491,11 +492,12 @@

    Task

    • Gears OS では Context が並列実行の Task に相当する
    • -
    • Context は Task用の情報として以下の情報をもっている +
    • Context は Task用の情報として以下の情報を付け加えた
      • 実行する Code Gear
      • Input/Output Data Gear の格納場所
      • 待っている Input Data Gear の数
      • +
      • この Task を実行する Worker
    @@ -506,11 +508,7 @@

    TaskManger

      -
    • Worker を作成、終了処理を行う -
        -
      • CPU、 GPU の数分生成する
      • -
      -
    • +
    • Worker をCPU、 GPU の数分生成する
    • 依存関係を解決した Task を各 Worker の Queue に送信する
    @@ -558,9 +556,13 @@

    Synchronized Queue

      -
    • Worker で使用される Queue は Task を送信するTaskManager と Task を取得する Worker 毎で操作される
    • -
    • そのためマルチスレッドでのデータの同期処理を行える SynchronizedQueue として実装する
    • -
    • Gears OS では CAS(Check and Set、 Compare and Swap) を使用した実装を行った +
    • TaskManager と Worker 間の通信を行うための Queue +
        +
      • Queue は Worker の数だけ生成される
      • +
      +
    • +
    • マルチスレッド間でのデータの同期処理を行える
    • +
    • Gears OS では 同期機構として CAS(Check and Set、 Compare and Swap) を使用した実装を行った
      • CAS は値を更新する際に更新前の値と実際に保存されているメモリ番地の値を比較し、変化がなければ値を更新する
      • メモリ番地の値が変わっているなら、もう一度 CAS を行う
      • @@ -645,7 +647,7 @@
      • GPU で性能を出すためには GPU に合わせた並列プログラミングが必要になる
      • CUDA は GPU を Device、 CPU を Host として定義する
      • CUDA は処理の最小の単位を thread とし、それをまとめた block を展開し Device 上で実行されるプログラム(Kernel)を実行する
      • -
      • 今回、CUDA に合わせた並列処理機構である CUDAWorker、 CUDAExecutor をInterface を用いて実装し、 CPU、GPU間のデータのマッピングのために CUDABuffer を用意した
      • +
      • 今回、CUDA に合わせた並列処理機構である CUDAWorker、 CUDAExecutor をInterface を用いて実装し、 CPU、GPU 間のデータのマッピングのために CUDABuffer を用意した
      diff -r 2d411c46eeb9 -r 0b7cf219ebfa slide/slide.md --- a/slide/slide.md Tue Feb 13 14:15:31 2018 +0900 +++ b/slide/slide.md Tue Feb 13 14:35:22 2018 +0900 @@ -201,7 +201,6 @@ - Gearef マクロは Context から Interface の引数格納用の Data Gear を取り出す - Context には Interface の引数を渡すための Data Gear が予め用意されている - goto meta では Interface の Code Gear の番号を Code Gear へのポインタに変換して継続を行う - - goto meta にはメタ計算をいれることができる ``` c __code code1(struct Context *context) { @@ -216,9 +215,10 @@ ``` ## Interface での stub Code Gear -- meta Code Gear では引数に指定された Code Gear の番号から stub Code Gear を取り出し、 継続を行う +- meta Code Gear では引数に指定された Code Gear の番号から stub Code Gear への関数ポインタを取り出し、 継続を行う - メタ計算で格納された引数は stub Code Gear で Code Gear に渡される - Interface を実装した Code Gear は Interface の定義から stub Code Gear の自動生成が可能 +- 必要ならばメタ計算を meta Code Gear か stub Code Gear に埋め込むことができる ``` c // implement put code gear @@ -243,25 +243,26 @@ ## 並列処理の構成 - 今回は並列処理機構である - Task + - 1つの Context 上で goto で遷移しながら実行される Code Gear の列 - TaskManager - - Worker の生成、依存関係を解決したTask を Worker に送信する + - 依存関係を解決したTask を Worker SynchronizedQueue に送信する - Worker - SynchronizedQueue から Task を一つずつ取得し、実行する - Worker 毎に POSIX Therad などを生成し、それぞれのスレッドで Code Gear を実行する - SynchronizedQueue - - マルチスレッド環境でもデータの同期処理が行われる Queue -- をInterface を用いて実装した + - Gears OS で記述されたマルチスレッド環境でもデータの同期処理が行われる Queue +- これらを Interface として実装した ## Task - Gears OS では Context が並列実行の Task に相当する -- Context は Task用の情報として以下の情報をもっている +- Context は Task用の情報として以下の情報を付け加えた - 実行する Code Gear - Input/Output Data Gear の格納場所 - 待っている Input Data Gear の数 + - この Task を実行する Worker ## TaskManger -- Worker を作成、終了処理を行う - - CPU、 GPU の数分生成する +- Worker をCPU、 GPU の数分生成する - 依存関係を解決した Task を各 Worker の Queue に送信する
      @@ -297,9 +298,10 @@
      ## Synchronized Queue -- Worker で使用される Queue は Task を送信するTaskManager と Task を取得する Worker 毎で操作される -- そのためマルチスレッドでのデータの同期処理を行える SynchronizedQueue として実装する -- Gears OS では CAS(Check and Set、 Compare and Swap) を使用した実装を行った +- TaskManager と Worker 間の通信を行うための Queue + - Queue は Worker の数だけ生成される +- マルチスレッド間でのデータの同期処理を行える +- Gears OS では 同期機構として CAS(Check and Set、 Compare and Swap) を使用した実装を行った - CAS は値を更新する際に更新前の値と実際に保存されているメモリ番地の値を比較し、変化がなければ値を更新する - メモリ番地の値が変わっているなら、もう一度 CAS を行う @@ -353,7 +355,7 @@ - GPU で性能を出すためには GPU に合わせた並列プログラミングが必要になる - CUDA は GPU を Device、 CPU を Host として定義する - CUDA は処理の最小の単位を thread とし、それをまとめた block を展開し Device 上で実行されるプログラム(Kernel)を実行する -- 今回、CUDA に合わせた並列処理機構である CUDAWorker、 CUDAExecutor をInterface を用いて実装し、 CPU、GPU間のデータのマッピングのために CUDABuffer を用意した +- 今回、CUDA に合わせた並列処理機構である CUDAWorker、 CUDAExecutor をInterface を用いて実装し、 CPU、GPU 間のデータのマッピングのために CUDABuffer を用意した ## CUDAWorker - CUDA で実行する Task を受け取る Worker