3
|
1 \documentclass[twocolumn,twoside,9.5pt]{jarticle}
|
|
2 % \usepackage[dvips]{graphicx}
|
|
3 \usepackage[dvipdfm]{graphicx}
|
|
4 \usepackage{fancyhdr,picins}
|
7
|
5 \usepackage{comment}
|
3
|
6 \pagestyle{fancy}
|
|
7 \lhead{\parpic{
|
|
8 \includegraphics[height=1zw,clip,keepaspectratio]{pic/emblem-bitmap.pdf}}
|
|
9 琉球大学主催 工学部情報工学科 卒業研究発表会}
|
|
10 \rhead{}
|
|
11 \cfoot{}
|
|
12
|
|
13 \setlength{\topmargin}{-1in \addtolength{\topmargin}{15mm}}
|
|
14 \setlength{\headheight}{0mm}
|
|
15 \setlength{\headsep}{5mm}
|
|
16 \setlength{\oddsidemargin}{-1in \addtolength{\oddsidemargin}{11mm}}
|
|
17 \setlength{\evensidemargin}{-1in \addtolength{\evensidemargin}{21mm}}
|
|
18 \setlength{\textwidth}{181mm}
|
|
19 \setlength{\textheight}{261mm}
|
|
20 \setlength{\footskip}{0mm}
|
|
21 \pagestyle{empty}
|
|
22
|
|
23 \begin{document}
|
12
|
24 \title{マルチコア CPU における\\ SceneGraph を用いたゲームの作成}
|
3
|
25 \author{065746J 仲宗根広樹 指導教員 : 河野真治}
|
|
26 \date{\today}
|
|
27 \maketitle
|
|
28 \thispagestyle{fancy}
|
|
29
|
|
30 \section{概要}
|
|
31 近年のゲームマシンは高度な並列性を持つようになっており、
|
15
|
32 ゲームプログラムでは様々なレベルでの並列処理が必須となっている。
|
|
33 ゲームマシンの性能の活かすためには、定常的な並列度を提供する
|
|
34 必要がある。しかし、並列プログラムは
|
|
35 データが処理される順番を把握することができないので出力結果などが特定しづらく、
|
|
36 データ転送やタスクの生成、管理等の技術が多く存在するため従来のプログラムに比べて難易度が高い。\\
|
|
37 \if 0
|
|
38 近年のゲームマシンは高度な並列性を持つようになっており、
|
3
|
39 ゲームプログラムでの様々なレベルでの並列処理が必須となっている。
|
|
40 プログラムの一部を並列処理するのではなく、定常的な並列度を提供する
|
|
41 必要がある。しかし、
|
|
42 データが処理される順番を把握することができないので出力結果などが特定しづらく、
|
|
43 逐次型に比べて難易度が高い
|
7
|
44 データ転送やタスクの生成、管理等の技術が多く存在する。\\
|
15
|
45 \fi
|
7
|
46 現在、学生実験にて PlayStation 3(PS3) で動作するゲーム開発を行っている。
|
15
|
47 短期間の学生実験では新しい技術を習得することに時間を割かれ、ゲームの完成度を上げることが難しい。\\
|
9
|
48 そこで本研究では、
|
3
|
49 SceneGraph と言うゲーム中の1つの場面(Scene) を構成するオブジェクトやその振る舞い、ゲームのルールの集合を導入する。
|
9
|
50 SceneGraph の処理を並列に行なうことにより、完成度の高いゲームの作成を可能とする。
|
3
|
51
|
|
52 \section{SceneGraph を使ったゲーム作成}
|
|
53 SceneGraph のノードは親子関係を持つ tree で構成される(図\ref{fig:SceneGraph})。
|
|
54
|
|
55 SceneGraph を使用すると、ゲーム内のオブジェクトは個別に SceneGraph ノードに分けられているので、ノードを別個に処理すると自然と並列度がでてくる。
|
|
56
|
|
57 SceneGraph ノード は以下のようなデータと動作を持つ。
|
7
|
58 \\\\
|
|
59 {\small
|
|
60 \begin{tabular}{|l|l|}
|
|
61 \hline
|
9
|
62 データ & 説明 \\ \hline
|
7
|
63 Vertex & ポリゴンオブジェクトの頂点座標 \\ \hline
|
|
64 Texture & ポリゴンオブジェクトのテクスチャ座標 \\ \hline
|
|
65 TextureImage & テクスチャイメージ \\ \hline
|
|
66 TransMatrix & ポリゴンオブジェクトの変換行列 \\ \hline
|
|
67 Coordinates & オブジェクトの座標 \\ \hline
|
|
68 Angle & オブジェクトの角度 \\\hline
|
9
|
69 Property & オブジェクトの内部状態 \\
|
7
|
70 \hline
|
|
71 \end{tabular}
|
|
72 \\\\\\
|
|
73 \begin{tabular}{|l|l|}
|
|
74 \hline
|
9
|
75 動作 & 説明 \\ \hline
|
7
|
76 Move & 自律的なオブジェクトの動く \\ \hline
|
|
77 Collision & 他のノードとの衝突判定をする \\ \hline
|
|
78 \end{tabular}
|
|
79 }
|
|
80 \\\\
|
|
81 \begin{comment}
|
3
|
82 \begin{itemize}
|
|
83 \item データ
|
|
84 \begin{enumerate}
|
|
85 \item Vertex :ポリゴンオブジェクトの頂点座標
|
|
86 \item Texture:ポリゴンオブジェクトのテクスチャ座標
|
|
87 \item TextureImage:テクスチャイメージ
|
|
88 \item TransMatrix :ポリゴンオブジェクトの変換行列
|
|
89 \item Coordinates :オブジェクトの座標
|
|
90 \item Angle:オブジェクトの角度
|
|
91 \item Property:オブジェクトのゲームに係わる内部状態
|
|
92 \end{enumerate}
|
|
93 \item 動作
|
|
94 \begin{enumerate}
|
|
95 \item Move:自律的なオブジェクトの動き
|
|
96 \item Collision:他のノードとの衝突判定をする
|
|
97 \end{enumerate}
|
|
98 \end{itemize}
|
7
|
99 \end{comment}
|
3
|
100
|
4
|
101 SceneGraph の親子関係に沿って TransMatrix を計算し、Move, Collision を実行することで SceneGraph 内のオブジェクトが変化する。Collision によって Move が変更され、Move によって Coordinates や Angle が変更される。これらをどのように変更させるかがゲームのルールになる。
|
|
102
|
3
|
103 \begin{figure}[htb]
|
|
104 \begin{center}
|
|
105 \includegraphics[scale=0.4]{image/SceneGraph.pdf}
|
4
|
106 \caption{tree 構造の SceneGraph}
|
3
|
107 \label{fig:SceneGraph}
|
|
108 \end{center}
|
|
109 \end{figure}
|
|
110
|
|
111
|
|
112 \section{Cell Broadband Engine} \label{sec:cell}
|
|
113 Cell\cite{cell} は1基の PowerPC Processor Element (PPE) と8基の Synergistic Processor Element (SPE) で構成されるヘテロジニアスマルチコアプロセッサである。各プロセッサは高速バスで接続されている。本研究では6基の SPE が使用可能となっている。
|
|
114
|
|
115 \section{Cerium}
|
16
|
116 Cerium\cite{wataru} とは当研究室で開発した Cell 上で動作するゲームフレームワークである。
|
3
|
117 Cerium は SceneGraph、OSMesa に代表される Rendering Engine、そしてそれらの実行単位を Task とし、動的に全てのコアが動作する様な割り振りを行うカーネル TaskManager で構成されている。
|
|
118
|
|
119 現在、Cerium では SceneGraph の Move, Collision を PPE でシーケンシャルに処理しているので、この部分の処理を SPE を用いて並列に処理するように変更する。
|
|
120
|
5
|
121 \section{SceneGraph の並列処理}
|
|
122 \subsection{Property}
|
12
|
123 オブジェクトの動作(move, collision) に必要になるのは Coordinates や Angle であり、Polygon や Texture のデータは不要になる。そこで、ゲームに必要なオブジェクトの内部状態を持った配列 Property を用いる。Property には Coordinates, Angle の他に、tree を再生成する時に必要な親子関係、オブジェクト生成消滅のパラメータなどが含まれる。\\
|
|
124 Move, Collsion の処理をする際は Property を SPE に送り、変更されて返された Updated Property を元に PPE 側で SceneGraphTree を構成する。 (図\ref{fig:sgtask})\\
|
|
125 \begin{figure}[htb]
|
|
126 \begin{center}
|
|
127 \includegraphics[scale=0.7]{image/SceneGraphTask.pdf}
|
|
128 \caption{SceneGraphTree の生成}
|
|
129 \label{fig:sgtask}
|
|
130 \end{center}
|
|
131 \end{figure}
|
|
132 \subsection{chain}
|
|
133 SceneGraph の処理の例題として、学生実験で作成された鎖のシミュレーション chain を使用する。
|
|
134 この例題では、動作は Move の処理のみ行い、処理に使用する SPE は1基となっている。
|
|
135 \begin{figure}[htb]
|
|
136 \begin{center}
|
|
137 \includegraphics[scale=0.3]{image/chain.png}
|
|
138 \caption{chain の画面}
|
|
139 \label{fig:chain}
|
|
140 \end{center}
|
|
141 \end{figure}
|
3
|
142
|
12
|
143 [Move] chain のオブジェクトの値は一つ前のオブジェクトの値から算出されるので、複数 SPE に分割して並列処理することができない。
|
|
144 \\
|
|
145 Move の処理を SPE で行った場合と PPE で行った場合の FPS の比較を以下に示す。
|
16
|
146 \vspace{3mm}
|
|
147 \begin{table}[htb]
|
|
148 \begin{center}
|
|
149 \vskip -\lastskip \vskip -20pt
|
|
150 \caption{SPE と PPE で FPS の比較}
|
|
151 \hbox to\hsize{\hfil
|
|
152 \begin{tabular}{|l|l|}
|
|
153 \hline
|
|
154 & FPS(Frame Per Second) \\ \hline
|
|
155 PPE & 2.708696 \\ \hline
|
|
156 SPE & 2.893348 \\
|
|
157 \hline
|
|
158 \end{tabular}\hfil}
|
|
159 \label{tb:fps}
|
|
160 \end{center}
|
|
161 \end{table}
|
|
162 \vspace{-5mm}
|
|
163 \\
|
|
164 PPE より、SPE で処理した方の FPS が若干向上した。
|
9
|
165 \if 0
|
3
|
166 \subsection{vacuum}
|
|
167 SceneGraph の処理の例題として、学生実験で作成されたゲーム vacuum を使用する。
|
|
168 vacuum には自機と吸収ブロック、敵ブロックの3種類のオブジェクトがあり、自機を上下左右に移動させ、ボタンを押している間は自機の周りのブロックを引き寄せ、うまく吸収ブロックだけを自機と衝突させるゲームである。このゲームのMoveとCollisionは以下のようになる。
|
|
169
|
|
170 \begin{figure}[htb]
|
|
171 \begin{center}
|
|
172 \includegraphics[scale=0.7]{image/vacuum.png}
|
|
173 \caption{vacuum のゲーム画面}
|
|
174 \label{fig:vacuum}
|
|
175 \end{center}
|
|
176 \end{figure}
|
|
177
|
|
178 [Move] vacuum のオブジェクトは全て独立して動くので、使用する SPE に均等に Property を割り振る。
|
|
179 SPE でオブジェクトの種類毎の Move 処理を行い、Property を更新して PPE に返す。
|
|
180
|
|
181 \if0
|
|
182 \begin{figure}[htb]
|
|
183 \begin{center}
|
|
184 \includegraphics[scale=0.43]{image/Move.pdf}
|
|
185 \caption{vacuum の Move}
|
|
186 \label{fig:Move}
|
|
187 \end{center}
|
|
188 \end{figure}
|
|
189 \fi
|
|
190
|
|
191 [Collision]
|
|
192 vaccum の Collision は自機と吸収ブロック(Collision A)、自機と敵ブロック(Collision B)の二つがある。
|
|
193 Collision の種類毎に SPE で動作する Collision Task を作成する。どちらの Collision も自機とブロックの衝突判定しか行わないので SPE には自機とブロックの Property を送り、SPE で2者間の衝突判定を行い、Property を更新して PPE に返す。(図\ref{fig:Collision})\\
|
|
194
|
|
195 \begin{figure}[htb]
|
|
196 \begin{center}
|
|
197 \includegraphics[scale=0.43]{image/Collision.pdf}
|
|
198 \caption{Collision に使う Property を各 SPE に渡す}
|
|
199 \label{fig:Collision}
|
|
200 \end{center}
|
|
201 \end{figure}
|
|
202
|
|
203 Move, Collision を SPE で処理する際に、SPE には SceneGraph ノードは送らない。代わりに vacuum の Move, Collision に必要な情報をまとめた Property を送る。
|
|
204 Property は SceneGraph ノードと1対1で対応しており、Coordinates, Angle, 親子関係の情報, ノードの生成消滅の情報を持つ。
|
|
205 PPE 側では返されてきた Property を元に SceneGraph を作成し Tree を再構成して Rendering に渡す。
|
9
|
206 \fi
|
3
|
207
|
|
208 \section{まとめと今後の課題}
|
13
|
209 PPE で行っていた Move の処理を SPE で行うことで速度の向上が見られた。複数 SPE を用いることでさらに速度の向上が期待できる。
|
3
|
210 \begin{itemize}
|
12
|
211 \item SPE 1基で SceneGraph を処理する例題はできたので、複数 SPE に均等に処理を割り振る例題の作成および、SPE での演算の SIMD 化。
|
3
|
212 \item Property から SceneGraph を生成し tree を構築する部分において、SceneGraph の新規生成と削除を考慮した設計を行う。
|
|
213 \end{itemize}
|
|
214
|
|
215 \thispagestyle{fancy}
|
|
216 \begin{thebibliography}{9}
|
|
217
|
|
218 \bibitem{cell}Sony Corporation.
|
|
219
|
|
220 Cell BroadbandEngine \texttrademark アーキテクチャ, 2006
|
|
221
|
16
|
222 %\bibitem{spursengine}TOSHIBA: SpursEngine
|
3
|
223
|
16
|
224 %\verb|http://www.semicon.toshiba.co.jp|\\
|
|
225 %\verb|/product/assp/selection/spursengine/index.html|
|
3
|
226
|
|
227 \bibitem{cerium} SourceForge.JP: Cerium Rendering Engine
|
|
228
|
|
229 \verb|https//sourceforge.jp/projects/cerium/|
|
|
230
|
16
|
231 %\bibitem{opencl} OpenCL
|
3
|
232
|
16
|
233 %\verb|http://www.khronos.org/opencl/|
|
3
|
234
|
|
235 \bibitem{wataru} Wataru MIYAGUNI.
|
|
236
|
|
237 Cell 用の Fine-Grain Task Manager の実装, 2009
|
|
238
|
|
239 \end{thebibliography}
|
|
240 \end{document}
|