Sun Jan 31 20:37:49 JST 2016 masa 並列処理時のバグ (mili|have) のsubset construction のミス tSearch の segv '(main|int) ' '(main|int)\(' とかが動かない。 Sat Jan 2 15:29:16 JST 2016 kono stateよりもstate transitionの方が大きいので、subset contructionで CharClassWalkするのは良くない。 mergeTransition した時に、state listに新しいものを接続してやれば、CharClassWalkの必要はない。 その時に、stateArray には入れないでおく。sateArrayは処理済みなので。 EOF stateには cc がないので特別扱いする必要がある。 Tue Dec 29 17:55:17 JST 2015 kono Todo は上に付け加えていく。 abc*d + / \ + d / \ + * / \ | a b c Parserを書き換えて、 abc*d + / \ a + / \ b + / \ * d | c とすることもできる。たぶん、こっちの方が良い。でも、 ((ab)(c*))d と書いても良いはずで、しかも、これは abc*d とおなじになるので解決になってない。 sub treeは、最初の状態を返す必要がある。そうでないと、 (ab*|bc*) とかがうまく動かない。 最後が*で終わっている時には、次の式と重ねる必要がある。なので、 最後の*があれば、それを持ち歩く 方式が良いと思います。 stateAllocateをgenerateTransitionは1 passにすると stateArrayの大きさを徐々に増やす必要がある。 少なくともループは一つにした方が間違いが少ないだろう。 2015年 12月27日 日曜日 19時31分03秒 JST 例題 特定の IP のアクセス数をカウントする concordance regex をつかった条件付き concordance regex をつかった条件付き wordcount これを行う perl スクリプトと比較 2015年 12月26日 土曜日 18時07分00秒 JST TODO CharClassWalker の routine test を作成する TODO CharClassMerge の routine test を作成する TODO searchBit の routine test を作成する TODO subsetConstraction の routine test を作成する