changeset 67:9c16f6b18100

add result
author Masataka Kohagura <kohagura@cr.ie.u-ryukyu.ac.jp>
date Tue, 16 Feb 2016 17:54:07 +0900
parents 5defec0399f9
children 4caaa1c0779c
files paper/c5.tex paper/master_paper.pdf
diffstat 2 files changed, 12 insertions(+), 14 deletions(-) [+]
line wrap: on
line diff
--- a/paper/c5.tex	Tue Feb 16 17:29:28 2016 +0900
+++ b/paper/c5.tex	Tue Feb 16 17:54:07 2016 +0900
@@ -83,16 +83,14 @@
 \section{正規表現}
 当実験では、Mac の egrep 、C で実装した逐次に DFA の状態遷移と照らし合わせる CGrep、Cerium で並列処理をする CeriumGrep を比較している。
 
-表\ref{table:AZaz} '[A-Z][A-Za-z0-9]*s'
-ファイルサイズの側のかっこ書き内は与えられた正規表現にマッチした数
-1GBのファイルには約1.7 億の単語が存在する。
+表\ref{table:AZaz} は正規表現 '[A-Z][A-Za-z0-9]*s' を 500MB(単語数約8500万)、1GB(単語数約1.7億語)のファイルに対してマッチングを行なった。
 
 \begin{tiny}
   \begin{table}[ht]
     \begin{center}
       \begin{tabular}[t]{|c|r|r|r|}
         \hline
-        実行方式/File Size(Match Num) & 500MB(500万) & 1GB(1000万) \\
+        実行方式/File Size(Match Num) & 500MB(536万) & 1GB(1072万) \\
         \hline
         CGrep & 20.62 & 40.10\\
         \hline
@@ -103,7 +101,7 @@
         egrep & 59.51 & 119.23\\
         \hline
       \end{tabular}
-  \caption{[A-Z][A-Za-z0-9]*s のマッチングの結果}
+  \caption{ファイルサイズを変化させた各 grep の結果}
   \label{table:AZaz}
     \end{center}
   \end{table}
@@ -111,8 +109,9 @@
 
 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 
-表\ref{table:metachar}
-
+表\ref{table:metachar} 500MB(単語数約8500万) のファイルに対して正規表現 '[A-Z][A-Za-z0-9]*s' をマッチングした結果である。
+これはファイル読み込みを含めた結果と読み込みを含めていない結果の比較である。
+egrep は実行するたびにファイル読み込みを行うため、ファイル読み込み無しの測定はなし。
 \begin{tiny}
   \begin{table}[ht]
     \begin{center}
@@ -129,7 +128,7 @@
         egrep & 59.51 & --- \\
         \hline
       \end{tabular}
-      \caption{実装したそれぞれのプログラムと egrep との比較}
+      \caption{ファイル読み込み有りと無しを変化させた各 grep の結果}
       \label{table:metachar}
     \end{center}
   \end{table}
@@ -137,7 +136,8 @@
 
 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 表\ref{table:abab}
-約500 MB 、単語数約2300万 abab がめちゃくちゃ含まれているファイル
+aとb が多く含まれている約500MB(単語数約2300万)のファイルに対して、正規表現の状態数を変化させてみた。
+これは読み込みを含んでいる結果で、CeriumGrep のファイル読み込みは Blocked Read、CPU 数 12 にて実行した。
 
 \begin{tiny}
   \begin{table}[ht]
@@ -155,7 +155,7 @@
         '(a \textbar b)*a(a \textbar b)(a \textbar b)(a \textbar b)(a \textbar b)(a \textbar b)'   & 約1550万 & 38.68 & 104.82 \\
         \hline
       \end{tabular}
-  \caption{状態を増やした結果}
+  \caption{正規表現の状態数を増やした Grep の結果}
   \label{table:abab}
     \end{center}
   \end{table}
@@ -164,9 +164,7 @@
 %%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%%
 
 表\ref{table:nomatch} ab の文字列がならんでいるところに (W \textbar w)ord の正規表現
-
-全くマッチしないパターン
-Filesize:500MB
+aとb が多く含まれている約500MB(単語数約2300万)のファイルに対して、全くマッチしない正規表現を与えてパターンマッチングさせてみた。
 
 \begin{tiny}
   \begin{table}[ht]
@@ -184,7 +182,7 @@
         egrep & 28.332\\
         \hline
       \end{tabular}
-  \caption{(W \textbar w)ork のマッチング}
+  \caption{全くマッチングしないパターンを grep した結果}
   \label{table:nomatch}
     \end{center}
   \end{table}
Binary file paper/master_paper.pdf has changed