view sigos.tex @ 2:bff486ef0e8c

commit
author Shohei KOKUBO <e105744@ie.u-ryukyu.ac.jp>
date Mon, 21 Apr 2014 03:30:37 +0900
parents a0fad656a7ea
children 2921110c23aa
line wrap: on
line source

\documentclass[techrep]{ipsjpapers}
\usepackage[dvipdfm]{graphicx}
\usepackage{url}
\usepackage{listings}
\lstset{%
  language={C++},%使用言語
  basicstyle={\small},%書体
  commentstyle={\small\itshape},%コメントの書体
  keywordstyle={\small\bfseries},%キーワードの書体
  %identifierstyle={\small},%
  %ndkeywordstyle={\small},%
  stringstyle={\small},%文字列の書体
  frame={trlb},%外枠
  breaklines=true,%改行
  columns=[l]{fullflexible},%
  xrightmargin=0zw,%
  xleftmargin=3zw,%
  %numbers=none,%行番号の表示
  %numberstyle={\scriptsize},%行番号の書体
  %numbersep=1zw,%
  %stepnumber=1,
  lineskip=-0.5ex,%
  captionpos=b,%キャプションの位置
}
\renewcommand{\lstlistingname}{Code}
\input{dummy.tex} %% Font 

% ユーザが定義したマクロなど.
\makeatletter

\begin{document}

% 和文表題
\title{並列プログラミングフレームワーク Cerium の\\ OpenCL, CUDA 対応}
% 英文表題
\etitle{Support OpenCL, CUDA of parallel programming framework Cerium}

% 所属ラベルの定義
\affilabel{1}{琉球大学大学院理工学研究科情報工学専攻 \\Interdisciplinary Infomation Engineering, Graduate School of Engineering and Science, University of the Ryukyus.}
\affilabel{2}{琉球大学工学部情報工学科\\Infomation Engineering, University of the Ryukyus.}

% 和文著者名
\author{
  小久保 翔平\affiref{1}\and
  河野 真治\affiref{2}
}

% 英文著者名
\eauthor{
  Shohei KOKUBO\affiref{1}\and
  Shinji KONO\affiref{2}
}

% 連絡先(投稿時に必要.製版用では無視される.)
\contact{小久保 翔平\\
        〒903-0213 沖縄県西原町千原1番地\\
	琉球大学工学部情報工学科\\
        TEL: (098)895-2221\qquad FAX: (098)895-8727\\
        email: kokubo@cr.ie.u-ryukyu.ac.jp}

% 和文概要
\begin{abstract}
  当研究室では、PS3, Linux 及び MacOS X 上で動作する並列プログラミングフレームワーク Cerium を提案している。
  MacOS X 上で GPGPU を行うには、OpenCL または CUDA を用いる方法が考えられる。
  OpenCL, CUDA の API に対応した API を Cerium に用意することでデータ並列に対応した。
  タスク並列で実行する場合、データ転送がオーバーヘッドになる。
  この問題を解決するためには、kernel の実行中にデータ転送を行うことでデータ転送をオーバーラップする必要がある。
  OpenCL では CommandQueue、CUDA では Stream を複数用いることでデータ転送や kernel の実行を並列に行うことができる。
  複数の CommandQueue, Stream を用いて、自動で並列実行を行うスケジューラーを実装した。
  実装したスケジューラーを WordCount、FFT を例題に測定し、考察を行う。
\end{abstract}

% 英文概要
\begin{eabstract}
  In our labaratory, proposal parallel programming framework Cerium that is running on the PS3, Linux and Mac OS X.
  In order to GPGPU on Mac OS X, it is thought that use OpenCL or CUDA.
  Supported Data Parallel prepare API on Cerium that correspond OpenCL and CUDA API.
  In case execute Task Parallel, data transfer causes overhead.
  To resolve this problem, need to overlaped data transfer.
  OpenCL and CUDA are possible parallel execution use of multiple CommandQueue and Stream.
  We implement scheduler to automatically parallel execution, be use multiple CommandQueue and Stream.
  We evaluate scheduler, be use WordCount and FFT.
\end{eabstract}

% 表題などの出力
\maketitle

% 本文はここから始まる

\input{introduction}
\input{opencl}
\input{cerium}
\input{cerium_gpu}
\input{benchmark}
\input{conclusion}

\nocite{toma:2012a}
\nocite{opencl}
\nocite{opencl:ref}
\nocite{opencl:applied}
\nocite{yutaka:os}
\bibliographystyle{ipsjunsrt}
\bibliography{sigos}
%\bibliography{cerium,book}
%\input{bibliography}   % 参考文献


\end{document}