view paper/abstract.tex @ 97:c1738511433c

add tSearch Source code
author Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
date Thu, 18 Feb 2016 20:40:30 +0900
parents
children 94ec38d9bdc6
line wrap: on
line source

\begin{abstract}
Cerium は当研究室で開発している並列プログラミングフレームワークである。

従来はファイル読み込みを mmap で実装していたが、本論文では並列処理向け I/O の Blocked Read を実装を行った。
Blocked Read とは、ファイルを一度に読み込まずに、あるサイズに分割して読み込む手法である。

Cerium にはファイルを読み込んで文字列処理を行う例題があり、Word Count 、Boyer-Moore String Search 、正規表現を実装し測定した。
それぞれの例題によって結果の整合性を取る必要があるが、どのように整合性を取るかは問題によって考慮する必要がある。

本研究で実装した正規表現は、正規表現から正規表現木を生成し、その正規表現木に状態を割り振りながらNFA を生成する。
もし NFA が生成した場合は Subset Construction で DFA に変換する。
そして、DFA の生成後、ファイルとマッチングさせる。

それぞれの例題と Mac に built-in されている wc、egrep と比較し測定を行なった。
\end{abstract}

\begin{abstract_eng}
Cerium is a parallel programming framework, which developed by our laboratory.
We implemented file read with mmap in parallel string search.
It is easy to use mmap system call to read from file, but current implementation of mmap sometimes does work well.
So we implement `Blocked Read', that is reading file separated by a certain size.

Examples of parallel string search are included in Cerium.
They are Word Count, Boyer-Moore String Search and Regular Explession.

It needs to check for correct result in devided file every examples.

Implemented Regular Explession sequential execute.
At first, convert Regular Explession to binary tree.
Second, allocated state to binary tree.
Third, convert state with Subset Construction.
Finally, implement parallel regular expression.

We evaluate examples of Cerium, wc of Mac built-in, and egrep.



\end{abstract_eng}