# HG changeset patch
# User Yutaka_Kinjyo
# Date 1284080423 -32400
# Node ID 87b8bb4d104cc210f48c27e0ca64d091f59cd8f6
# Parent c770f569a801bd685d16656ede625087e4e778f4
fix
diff -r c770f569a801 -r 87b8bb4d104c presen/presen.html
--- a/presen/presen.html Fri Sep 10 02:43:57 2010 +0900
+++ b/presen/presen.html Fri Sep 10 10:00:23 2010 +0900
@@ -95,6 +95,23 @@
研究目的 と 背景
+CPUのクロック周波数の増加は、発熱や消費電力の増大により難しくなっている
+
+
+-
+クロック周波数を上げる代わりに、CPUコア数を増やす傾向になった。
+
+
+- マルチコアにあったプログラミングが必要になる
+
+
+
そこで、プログラミングを支援するフレームワークが必要になってくる
+
+
+
+
+
研究目的 と 背景
+
現在 Cell/PS3またはMac OS X上で動作するOpen CL 的なFine Grain Task Manager である Cerium Task Manager を開発中である。
@@ -359,6 +376,7 @@
- キューのサイズは1
- 書き込む際にキューがいっぱいの場合はPPEから呼び出されるまで待つ
- PPEからのMail呼び出しがないと、SPEは待ち続ける
+- SPEの待ち時間が増えると、処理速度の低下につながる
@@ -428,6 +446,27 @@
WordCount
+構成Task
+
+
+ - WordCountTask(TaskArray化)
+
+ - Input data であたえられたデータをwcし、output data に書き出す
+
+
+ - PrintTask
+
+ - 各SPEから書き出されたwcデータを集計し、出力する
+ - dependency に WordCountTaskを設定
+
+
+
+
+
+
+
+
WordCount
+
- wcするfileをマッピングし、Taskに割り振る
- WordCountTaskの終了をまって、PrintTaskが実行される
@@ -443,9 +482,11 @@
WordCount
+計測条件
+
- TaskArrayのサイズは64
- - WC対象は166Mのテキスト
+ - Word count対象は166Mのテキスト
- TaskArrayの適応の有無を比較
@@ -457,7 +498,7 @@
- time : 実行時間
- dma wait : dma転送待ちの割合
- - time wait : mail待ちの割合
+ - mail wait : mail待ちの割合
@@ -538,9 +579,8 @@
- 一度にファイルマッピングをしない
- - 何度かに分けてマッピングする
- - 同じ領域を切り替えて使う
- - スワップを減らし、アクセス時間を短縮する
+ - 同じ領域を切り替えて、何度かに分けてマッピングする
+ - スワップを減らし、アクセス時間を短縮できる
- dma wait の割合が減る
@@ -554,8 +594,17 @@
- CreatePolygonTask
+
- CreateSpanTask
+
+ - Polygonを水平な線(Span)に分割する
+
- DrawSpanTask(TaskArray化)
+
@@ -600,9 +649,9 @@
- - mail wait 割合が減った
+ - mail wait 割合が減少した
- レンダリングエンジンの場合、PPE側で実行するTaskがあるので、
- mailチェックが遅れ気味
+ mailチェックが遅れ気味になっている
@@ -613,7 +662,7 @@
- 複数のTaskをまとめるTaskArrayを提案、実装した。
- - PPE側が忙しく、mailチェックが遅れる場合に効果的
+ - PPE側が忙しく、mailチェックが遅れる場合に効果がある
- PPE側にTaskがない場合は、mailチェックは間に合う
- WordCountはdma転送がネックになっている
- マッピングの方法、Taskのスケジューリングを工夫して、dma転送時間を削減できる