0
|
1 \documentclass[twocolumn,twoside,9.5pt]{jarticle}
|
|
2 \usepackage[dvips]{graphicx}
|
|
3
|
|
4 \usepackage{fancyhdr}
|
|
5 \pagestyle{fancy}
|
|
6 \lhead{\parpic{\includegraphics[height=1zw,clip,keepaspectratio]{pic/emblem-bitmap.eps}}琉球大学主催 工学部情報工学科 卒業研究発表会}
|
|
7 \rhead{}
|
|
8 \cfoot{}
|
|
9
|
|
10 \setlength{\topmargin}{-1in \addtolength{\topmargin}{15mm}}
|
|
11 \setlength{\headheight}{0mm}
|
|
12 \setlength{\headsep}{5mm}
|
|
13 \setlength{\oddsidemargin}{-1in \addtolength{\oddsidemargin}{11mm}}
|
|
14 \setlength{\evensidemargin}{-1in \addtolength{\evensidemargin}{21mm}}
|
|
15 \setlength{\textwidth}{181mm}
|
|
16 \setlength{\textheight}{261mm}
|
|
17 \setlength{\footskip}{0mm}
|
|
18 \pagestyle{empty}
|
|
19
|
|
20 \begin{document}
|
1
|
21 \title{ソフトウェアRenderingEngineの高機能化と高速化}
|
0
|
22 \author{065725F 金城裕 {}{} 指導教員 : 河野真治}
|
|
23 \date{}
|
|
24 \maketitle
|
|
25 \thispagestyle{fancy}
|
|
26
|
|
27 \section{概要}
|
|
28 近年、CPUの消費電力増加や、クロック周波数対効果の停滞により、 CPUコア数は増加傾向にある。コア数の増加にともない処理速度の向上が見込める。
|
|
29 しかし、 CPUのコア数が増加すると、コア数に見合った並列プログラミングを行う必要がある。
|
|
30
|
1
|
31 並列プログラミングを行う際、Amdahl則より、並列化を意識してプログラミングしなければならない。しかし、並列化を問題毎に毎回考えるのは手間がかかる。そこで並列プログラミングを裏でサポートしてくれるソフトウェアを開発する。
|
0
|
32
|
1
|
33 研究では、Cellの並列プログラミングサポートフレームワークを開発する。当研究室で開発したCeriumは現在十分な並列化、実行速度、機能をサポートできていない。Cerium、特にRenderingEngine部分を改良し、信頼できる並列化サポートフレームワークを目指す。
|
0
|
34
|
1
|
35 \vspace{-5mm}
|
0
|
36 \section{Cell}
|
|
37 Cellは「ヘテロジニアス・マルチコアプロセッサ構成」を採用し、1基の制御系プロセッサコア (PPE:PowerPc Processor ELement) と8基の演算系プロセッサコア (SPE:Synergistic Processor Element) で構成される。各プロセッサコアは、EIB (Element Interconnect Bus) と呼ばれる高速なバスで接続されている。また、EIBはメインメモリや外部入出力デバイスとも接続されていて、各プロセッサコアはEIBを経由してデータアクセスをおこなう。
|
|
38
|
|
39 この2種類のCPUをプログラマ自身が用途に合わせて適切に使い分けるように考慮する必要がある。
|
|
40
|
|
41 \vspace{0mm}
|
|
42 \begin{figure}[htbp]
|
|
43 \begin{center}
|
|
44 \includegraphics[scale=0.6]{pic/cell1.eps}
|
|
45 \caption{Cellプロセッサの構成} \label{cell1}
|
|
46 \end{center}
|
|
47 \end{figure}
|
|
48
|
|
49 \vspace{-6mm}
|
|
50 \section{Cerium}
|
1
|
51 当研究室ではCeriumと呼ばれるゲーム開発フレームワークがあり、以下の3つの要素から構成されている。\\
|
0
|
52
|
1
|
53 \vspace{-6mm}
|
0
|
54 \begin{itemize}
|
|
55 \item SceneGraph
|
1
|
56 \vspace{-3mm}
|
0
|
57 \item Rendering Engine
|
1
|
58 \vspace{-3mm}
|
0
|
59 \item Task Manager
|
|
60 \end{itemize}
|
|
61
|
|
62 Ceriumは独自にRenderingEngineを持つ。ゲーム中のオブジャクトの振る舞いやルールはSceneGraphで管理し、それらの動きやレンダリングの処理を動的にSPEに割り振るカーネルとして、TaskMnagerが用いられる。
|
|
63 TaskManagerは、Taskと呼ばれる、分割された各プログラムを管理する。Taskの単位はサブルーチンまたは関数とし、Task同士の依存関係を考慮しながら実行していく。
|
|
64 現在Ceriumはlinux,macosx上で動作し、コンパイル方法によってCellのspeを使うかどうかを選択できる。
|
|
65
|
1
|
66 \vspace{-5mm}
|
|
67 \section{TaskManagerを使った例題}
|
|
68 TaskMangerを使った例題としてWordCountを実装した。inputされたfileをmmapでメモリにマッピングし、そのdataを分割。各SPEに、WordCountのTaskと分割されたdataを渡す。SPEは渡されたdataをwordcountし、指定されたoutput領域に書き込む。全てのwordcountが実行し終えるとその結果をppe側で集計し、結果を出力する。その流れを以下に示す。
|
|
69
|
|
70 \vspace{0mm}
|
|
71 \begin{figure}[htbp]
|
|
72 \begin{center}
|
|
73 \includegraphics[scale=0.3]{pic/wc_graf3.eps}
|
|
74 \caption{WordCountのTask生成、実行の流れ} \label{wordcount}
|
|
75 \end{center}
|
|
76 \end{figure}
|
|
77
|
|
78
|
0
|
79 \section{RenderingEngine}
|
|
80 RenderingEngineでは、SceneGraphから、実際に表示するポリゴンの抽出、ポリゴンからSpanの生成、SpanにRGBをマッピングし描画する部分と3つに分ける事ができる。ここでいうSpanとは、ポリゴンに対するある特定のY座標に関するデータを抜き出したものである。
|
1
|
81 \subsection{高機能化}
|
|
82 RenderingEngineの高機能化に関して、以下のような案を提案する。
|
0
|
83 \vspace{-3mm}
|
1
|
84 \subsubsection{光源}
|
|
85 RenderingEngineで、未実装だった光源の計算を実装した。各オブジェクトには自身の座標や親子関係などの情報を持っており、その中に法線がある。法線と光のベクトルとの内積をrgbにかけ算することにより光の計算を行っている。以下に光源の計算をした画像を示す。
|
0
|
86
|
|
87 \vspace{0mm}
|
|
88 \begin{figure}[htbp]
|
|
89 \begin{center}
|
|
90 \includegraphics[scale=0.4]{pic/ball.eps}
|
|
91 \caption{光源計算をした描画画像} \label{ball}
|
|
92 \end{center}
|
|
93 \end{figure}
|
|
94
|
|
95
|
|
96 現在、光源はppeだけを使ったfifo形式のみに実装されている。
|
|
97
|
|
98 \subsection{高速化}
|
1
|
99 RenderingEngineの高速化に関して、以下のような案を提案する。
|
|
100 \vspace{-3mm}
|
|
101 \subsubsection{描画ルーチン}
|
0
|
102 CeriumのRenderingEngineは描画する対象がない部分も毎フレーム描画計算をしている。それでは計算する必要のない部分も計算してしまい、無駄な時間が生じる。そこで、描画する対象がない部分の計算は行わないようにすれば高速化が望める。
|
1
|
103 また画面に背景を描画する場合は、オブジェクトとは別に背景専用のルーチンを設け高速化を計る。さらにオブジャクトが重なり描画する必要のない部分は描画計算を行わない。
|
|
104
|
|
105 \newpage
|
0
|
106
|
|
107 \vspace{0mm}
|
|
108 \begin{figure}[htbp]
|
|
109 \begin{center}
|
1
|
110 \includegraphics[scale=0.45]{pic/rendering1.eps}
|
|
111 \caption{描画計算の範囲} \label{rendering1}
|
0
|
112 \end{center}
|
|
113 \end{figure}
|
|
114
|
1
|
115 \vspace{-7mm}
|
|
116 \subsubsection{SceneGraphからSpanを作るまで}
|
|
117 CeriumではSceneGraphからRenderingに至るまでに以下の図で示すような流れがある。
|
|
118
|
|
119 \vspace{0mm}
|
|
120 \begin{figure}[htbp]
|
|
121 \begin{center}
|
|
122 \includegraphics[scale=0.4]{pic/rendering2.eps}
|
|
123 \caption{SceneGraphからRenderingするまでの流れ} \label{rendering2}
|
|
124 \end{center}
|
|
125 \end{figure}
|
|
126
|
2
|
127 以上の工程でそれぞれSPEにTaskを渡し、処理を行っているが、Taskは一つにまとめられて一基のSPEで実行されている。この部分のTaskを複数に分割、複数のSPEに割当て並列処理を行うことによって高速化を計る。
|
0
|
128
|
|
129
|
|
130 \thispagestyle{fancy}
|
|
131 \begin{thebibliography}{9}
|
|
132
|
|
133 \bibitem{1} 宮國渡 "Implementation of Fine-grain Task Manager for Cell" 平成20年度 学位論文(修士)
|
|
134
|
|
135 \bibitem{2} 多賀野海人 "並列プログラミングを用いたゲームフレームワークの設計と実装" 2008年 卒業研究中間報告資料
|
|
136
|
|
137 \bibitem{3} fixstars:
|
|
138 http://cell.fixstars.com/ps3linux/index.php/メインページ
|
|
139
|
|
140 \end{thebibliography}
|
|
141 \end{document}
|