view sigos.tex @ 4:593671347b01

fix
author Shinji KONO <kono@ie.u-ryukyu.ac.jp>
date Mon, 21 Apr 2014 22:16:31 +0900
parents 2921110c23aa
children 679859bf2fe8
line wrap: on
line source

\documentclass[techrep]{ipsjpapers}
\usepackage[dvipdfm]{graphicx}
\usepackage{url}
\usepackage{listings}
\lstset{%
  language={C++},%使用言語
  basicstyle={\small},%書体
  commentstyle={\small\itshape},%コメントの書体
  keywordstyle={\small\bfseries},%キーワードの書体
  %identifierstyle={\small},%
  %ndkeywordstyle={\small},%
  stringstyle={\small},%文字列の書体
  frame={trlb},%外枠
  breaklines=true,%改行
  columns=[l]{fullflexible},%
  xrightmargin=0zw,%
  xleftmargin=3zw,%
  %numbers=none,%行番号の表示
  %numberstyle={\scriptsize},%行番号の書体
  %numbersep=1zw,%
  %stepnumber=1,
  lineskip=-0.5ex,%
  captionpos=b,%キャプションの位置
}
\renewcommand{\lstlistingname}{Code}
\input{dummy.tex} %% Font 

% ユーザが定義したマクロなど.
\makeatletter

\begin{document}

% 和文表題
\title{並列プログラミングフレームワーク Cerium の\\ OpenCL, CUDA 対応}
% 英文表題
\etitle{Supporting OpenCL, CUDA in  Parallel programming framework Cerium}

% 所属ラベルの定義
\affilabel{1}{琉球大学大学院理工学研究科情報工学専攻 \\Interdisciplinary Infomation Engineering, Graduate School of Engineering and Science, University of the Ryukyus.}
\affilabel{2}{琉球大学工学部情報工学科\\Infomation Engineering, University of the Ryukyus.}

% 和文著者名
\author{
  小久保 翔平\affiref{1}\and
  河野 真治\affiref{2}
}

% 英文著者名
\eauthor{
  Shohei KOKUBO\affiref{1}\and
  Shinji KONO\affiref{2}
}

% 連絡先(投稿時に必要.製版用では無視される.)
\contact{小久保 翔平\\
        〒903-0213 沖縄県西原町千原1番地\\
	琉球大学工学部情報工学科\\
        TEL: (098)895-2221\qquad FAX: (098)895-8727\\
        email: kokubo@cr.ie.u-ryukyu.ac.jp}

% 和文概要
\begin{abstract}
  当研究室では、PS3, Linux 及び MacOS X 上で動作する並列プログラミングフレームワーク Cerium を提案している。
  MacOS X 上で GPGPU を行うには、OpenCL または CUDA を用いる方法が考えられる。
  OpenCL, CUDA の API に対応した API を Cerium に用意することでデータ並列に対応した。
  タスク並列で実行する場合、データ転送がオーバーヘッドになる。
  このオーバヘッドを解決するためには、kernel の実行中にデータ転送を行うことでデータ転送をオーバーラップする必要がある。
  OpenCL では CommandQueue、CUDA では Stream を複数用いることでデータ転送や kernel の実行を並列に行うことができる。
  複数の CommandQueue, Stream を用いて、自動で並列実行を行うスケジューラーを実装した。
  実装したスケジューラーを WordCount、FFT を例題に測定し、考察を行う。
\end{abstract}

% 英文概要
\begin{eabstract}
  We are develpping parallel programming framework Cerium, that is running on the PS3, Linux, Mac OS X and GPGPU.
  As GPGPU support on Mac OS X, OpenCL or CUDA can be used in an API set.
  Data Parallel on GPUGPU is also working on CPUs.
  In Task Parallel, data transfer causes overhead.
  To resolve this, pipeline data transfer is used both on GPGPU and Many Cores.
  OpenCL and CUDA have  slightly different behaviour on Data Parallel and out of order task execution.
  In WordCount and FFT examples, we  show the different and its analysis.
\end{eabstract}

% 表題などの出力
\maketitle

% 本文はここから始まる

\input{introduction}
\input{opencl}
\input{cerium}
\input{cerium_gpu}
\input{benchmark}
\input{conclusion}

\nocite{*}
%\nocite{opencl}
%\nocite{opencl:ref}
%\nocite{opencl:applied}
%\nocite{yutaka:os}
\bibliographystyle{ipsjunsrt}
\bibliography{sigs}
%\bibliography{cerium,book}
%\input{bibliography}   % 参考文献


\end{document}