comparison paper/abstract.tex @ 19:d17943f59cc3 draft

fix
author Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date Sun, 12 Feb 2012 00:37:32 +0900
parents 98313b0fdda6
children fe88829c8fe3
comparison
equal deleted inserted replaced
18:140aec35135c 19:d17943f59cc3
1 \begin{abstract} 1 \begin{abstract}
2 並列プログラミングフレームワーク Cerium の改良を行った。 2 Cell Broad band Engine 用の並列プログラミングフレームワーク Cerium の改良を行った。
3 プログラムは、PPE から Mail 機能を用いて各 SPE に処理が割り振られ並列実行される。 3 プログラムは、2 台の汎用 CPU である PPE から Mail 機能を用いて6台ある Vector CPU SPE に処理が割り振られ並列実行される。
4 しかし、 PPE からの Mail 応 答が遅い場合、 SPE の待ち時間が発生し、処理性能が低下する。 4 SPEは共有メモリを持たない Cerium ではPPE上での処理が多いことがあり、PPE のMail チェック頻度が下がり、
5 また、Ceirum ではアーキテクチャ依存の記述が避けにくい。 5 SPE の待ち時間が増し処理性能が低下する問題があった。これをMailQueueにより解決した。
6 これらを改良するために TaskArray, ソフトウェアMailQueue, MemorySegment の実装を行った。 6 さらに、SPUのタスク終了をまとめるために、複数のTaskをまとめたTaskArrayを導入しタスク終了メールを削減した。
7 その結果、例題を用いた計測では、Mail 待ちが解消され、FPSが向上し、アーキテクチャ依存の記述を隠蔽することに成功した。 7 その結果、例題を用いた計測では、Mail 待ちが解消され、性能が向上した。
8 Cell では、DMA転送を明示的に行うが、これはアーキテクチャ依存な処理になる。メインメモリのキャッシュに相当する
9 機能を持つ MemorySegment を導入し、アーキテクチャ依存の記述を隠蔽することに成功した。
10 これにより、Core i7や Xeon のような汎用のメニーコアでもCeriumを有効に使えるする設計となった。
8 11
12 We have developed parallel programming framework Cerium for Cell Broad Band Engine.
13 Six SPE (Vector CPU) work in parallel by mails from two SPU (PowerPC). Since
14 SPE has no shared memory, not a few operation have to be executed in PPE. This makes
15 mail check interval rather large, resulting SPU waiting time and low performance.
16 We implemented MailQueue and TaskArray which is a group of task. It reduces number of mails for task finish and
17 hides mail delay, and we have good bench mark result.
9 18
10 We have developed parallel programming framework Cerium. Program is alloted processing to each SPE using Mail function from PPE, and It's excuted in parallel. 19 Cell uses explicit DMA transfer which is rare in shared memory multi processor. We introduce
11 But when Mail reply from PPE is late, the waiting time of SPE occurs, and the treatment performance fails. 20 MemorySegment which is similar to the main memory cache, which hides architecture dependent
12 Moreover, in Ceirum, it is hard to avoid description of architecture dependence. 21 description. By this, Cerium is now usable on general many core architecture such as Core i7 or Xeon.
13 To improve these, We implemented TaskArray, Software MailQueue and MemorySegment. 22
14 As a result, in the measurement using an exercise, the waiting for Mail was reduced, FPS improved and it succeeded in concealing description of architecture dependence.
15 \end{abstract} 23 \end{abstract}
16 24