Papers/2012/yutaka-master: paper/conclusion.tex annotate

annotate paper/conclusion.tex @ 34:472f45ab9fca draft default tip

fix

author	Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp>
date	Thu, 16 Feb 2012 23:46:16 +0900
parents	3c0f43537ca6
children

rev	line source
0 6d80c2c895e4 first commit Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	1 \chapter{結論} \label{chapter:conclusion}
6d80c2c895e4 first commit Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	2 \section{まとめ}
1 5dbcea03717e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	3 本研究では並列プログラミングフレームワーク Cerium の改良を行った。Cerium は並列プログラミングをサポートする TaskManager、ソフトウェアレンダリングを行う RenderinEngine, ゲームのシーンを記述していく、SceneGraph から構成されている。学生実験で行うCell上でのゲーム作成を考慮にいれた並列プログラミングフレームワークである。Ceirum 開発後に学生実験での使用や、例題を実装していく上で、仕様通りの稼働率がでないことや、アーキテクチャ依存の記述が避けづらいことなど、フレームワークとしての信頼性が十分でないことが明らかになった。
4 6cf0f731cbde fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	4 特に Cell上での実行の場合には、SPE との通信の待ち時間が約70\%と、処理性能に関わっている。そこで SPE と PPE の通信部分である Mail について、TaskArray の実装と使用、ソフトウェア MailQueue の実装をし改良を行った。その結果 FPS の向上、Mail 待ち時間の減少に効果が見られた。
6cf0f731cbde fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	5 また、Task 内でのアーキテクチャ依存の記述を　MemorySegment によって、避けることに成功した。また MemorySegment を用いることでメモリ管理を抽象化することができる。その他の先行研究の改良として、Task のパイプライン化、Texutre のキャッシュなどがある。これらの改良によっても、FPS の向上や、DMA 転送の待ち時間が改善された。Cerium の改良を重ね、結果として約17 FPS の向上に成功した。また Mail の待ち時間は約18\%削減できた。
1 5dbcea03717e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	6
0 6d80c2c895e4 first commit Daichi TOMA <toma@cr.ie.u-ryukyu.ac.jp> parents: diff changeset	7 \section{今後の課題}
12 3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	8
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	9 \subsection{Task 化による並列化率の向上}
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	10
4 6cf0f731cbde fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	11 各コアの稼働率の向上のためには、さらに Mail の待ち時間を削減する必要がある。Mail の通信の待ち時間は内訳は
1 5dbcea03717e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	12
5dbcea03717e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	13 \begin{description}
5dbcea03717e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	14 \item PPE の対応が遅れる
5dbcea03717e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	15 \item SPE が他の SPE を待つ
5dbcea03717e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	16 \end{description}
5dbcea03717e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	17
5dbcea03717e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	18 の二つの要素がある。PPE の対応が遅れる場合には PPE側に処理するべきプログラムがあり、Mail の対応が遅れる原因がある。
12 3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	19 そのため制御用の PPE は処理するべきプログラムは排除し、Mail 通知の対応や、Task の割り振りを専門に PPE が行うことによって、SPE の稼働率向上を果たせると考える。
4 6cf0f731cbde fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	20
9 b69eefd9156e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 4 diff changeset	21 PPE での Task 管理以外の処理を排除するため、具体的には、プログラムの Task化を行い Task の部分を SPE で処理する方法がある。現在 RenderingEngien 部分のほとんどが Task 化されているが、ScenenGraph 部分は Task 化されていない。今後の課題として SceneGraph 部分の Task 化が必要である。
1 5dbcea03717e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	22
12 3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	23 \subsubsection{Task 化の問題点}
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	24 処理をTask 化していく上で、Task の構成が複雑化してきている。それは、TaskArray などの導入によるものである。Task を構成するには以下の注意点がある
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	25 \begin{itemize}
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	26 \item Task が扱う I/O データの分割と、16アラインメントに合わせた、適切なデータ構造の構成する。
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	27 \item データはランダムアクセスしてはいけない。
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	28 \item Task の同期のための、Task を生成する必要がある。
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	29 \item 扱う Data を考慮した適切な Task の依存関係の設定がある。
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	30 \item Task が仕様通りに動作するか、テストを行う必要がある。
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	31 \end{itemize}
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	32 など、Task の構成には幾つかの注意点があり、これらを守らなければ仕様通りの性能はでない。より簡潔にプログラミングを行えるように、Task と　Task が扱うデータに対して、新たなデータ構造が必要だと考える。
1 5dbcea03717e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	33
12 3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	34 \subsection{Taskの粒度}
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	35 バリア同期の際に処理が早く終わった SPE が他の SPE を待つ時間を削減するために、Task はなるべく粒度を細かく設定することで解決できると考える。
4 6cf0f731cbde fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	36 粒度を細かくすることは、各 SPE への均等な Task の分散のために必要であり、並列化部分の特定にも繋がる。
6cf0f731cbde fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	37
6cf0f731cbde fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 1 diff changeset	38 \subsection{自動的な依存関係の解決}
12 3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	39 Task 同士の依存関係の設定は、ユーザが、TaskManager の API を用いて行なっている。依存関係を設定するのは、処理するデータの整合性を保つためである。つまり、依存関係は Task が扱うデータと紐付けることができる。Task に設定されたデータを元に、Task の同士の依存関係関係を自動で解決することができると考える。
1 5dbcea03717e fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 0 diff changeset	40
12 3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	41 \subsection{SPE の LS の利用方法}
3c0f43537ca6 fix Yutaka_Kinjyo <yutaka@cr.ie.u-ryukyu.ac.jp> parents: 9 diff changeset	42 現在は定義された Task は SPE の LS へ一括ロードされ、保持されている。それによって処理の Task が増えるにつれて、LS を占有してしまう問題がある。特に SPE の LS は 256KB と一般的な CPU のメモリ容量に比べると小さく、同じようにプログラミングはできない。LS の容量を常に考慮したプログラミングが必要である。また Task だけではなく、扱うデータやSPEに常駐するカーネルプログラムもすべてメモリを消費するものなので、それらを扱う包括的なデータ構造が必要である。

Mercurial > hg > Papers > 2012 > yutaka-master

annotate paper/conclusion.tex @ 34:472f45ab9fca draft default tip