# HG changeset patch # User Takahiro SHIMIZU # Date 1533029280 -32400 # Node ID 49a9086fc7e9c9bf5607700484d387c1e1fc4f3e # Parent bc8b0482c14f04e7a727808d304b844d2f2c94cd auto-Update generated slides by script diff -r bc8b0482c14f -r 49a9086fc7e9 hoge.txt --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/hoge.txt Tue Jul 31 18:28:00 2018 +0900 @@ -0,0 +1,2 @@ +You are right. +Since Mozilla::CA does not exist,it is impossible to https connection,but HTTP::Tinyish tried to connect HTTPS for LWP::Protocol::HTTPS. diff -r bc8b0482c14f -r 49a9086fc7e9 slides/2018/07/07/slide.md --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/slides/2018/07/07/slide.md Tue Jul 31 18:28:00 2018 +0900 @@ -0,0 +1,82 @@ +title: CbCによるMoarVMの改良 +author: Takahiro Shimizu +profile: +lang: Japanese + + +# 復習回 +- ssid `perl-entrance` pw `metacpan` +- 復習していきます +- 一応スライドも作りながらやっているので講義をするかもしれません +- 基本各自で復習や予習をやってみてください +- わからないことがあれば適宜サポーターに聞いてください +- 今日の終わりに今日の成果をちょっと発表してみましょう(できれば) + + + +# シェルコマンド + +- `pwd` + - カレントディレクトリを表示 +- `ls` + - カレントディレクトリの中身を表示 +- `cd` + - ディレクトリを移動する + +# 引っかかりポイント +- unixはカレントディレクトリという概念がある + - finderで今見ているディレクトリの表示と対応している +- `pwd`はカレントディレクトリの場所を表示する +___ +# お約束 + + +```perl +#!/usr/bin/env perl +use ustrict; +use warnings; +``` + +- シェバン +- `use strict` + - 行儀の良い文法 +- `use warnings` + - 間違った時に警告 + + +# 変数 +- スカラ変数 +- 配列 +- ハッシュ + +# スカラ変数 + +- 宣言するときは`my`をつける +- シジルは`$` +- `my $hoge = 4;`みたいに宣言する +- `=`は右を左に代入する + + +# if文 + +- 条件で処理を分岐させたい時に使う +- `if ()`の`()`の部分が真か偽か判定する + - 真の時にブロックが実行される +- これじゃないとき==> `elsif ( )` + +# 真偽値 + +- perlの偽は +- 0 +- undef +- "" +- `()` + + +# 配列 + +- 変数のまとまり的なもの +- シジルは`@` +- 配列の要素にアクセスするときはスカラー変数なので`$` +- `my @array = (1..10)` +- `print $array[3]` diff -r bc8b0482c14f -r 49a9086fc7e9 slides/2018/07/10/memo.txt --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/slides/2018/07/10/memo.txt Tue Jul 31 18:28:00 2018 +0900 @@ -0,0 +1,26 @@ +* if文とJIT +* ログアナライザー /var/log/ をエイヤッと見てみる + * この中から特定のパターンを確認する + * デーモンを判定 + * 日付を判定 + * 回数を数えるか + +* ファイルを分割して並列実行 +* golang + +* for文の中で+するなら一旦受け皿を用意しておけば良さそう +* javaのstreamingで分割すると良さそう + +* バッカス-> FP (データ並列を実行する) +* 並列シンタックスをいれるか + +* 並列処理しても + +* 指針-->Javaの代わりのCbCを吐く + +CbCなので最初はGCいれなくても作って良さそう + +* どんな風なCbCを吐くか--> Basic Block単位で生成すると良さそう +Basic blockをcode segment + +if文とかcallまでの間の部分をbasic blockという diff -r bc8b0482c14f -r 49a9086fc7e9 slides/2018/07/10/slide.md --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/slides/2018/07/10/slide.md Tue Jul 31 18:28:00 2018 +0900 @@ -0,0 +1,123 @@ +title: CbCによるMoarVMの改良 +author: Takahiro Shimizu +profile: +lang: Japanese + + +# 研究目的 +- Perl5の後継言語として開発されているPerl6はMoarVMと呼ばれるVMを搭載している. +- Perl6はMoarVM,JVM,JavaScript上で動くRakudoと呼ばれる実装と,コンパイラ開発者用のサブセットであるNQPが主な実装となっている. +- 現在Perl6及びMoarVMは全体的な速度がPerl5と比較し低下しており,実務として利用できるレベルに達していない. +- さらにPerl6の実装自体巨大なcase-switch文など見通しが悪くなっている. +- この問題を解決するために現在当研究室で開発している継続を中心にしたContinuation based Cを用いて改良を行う +- CbCの設計理念からVMの実装と親和性が高い事も推測できる為,実際にCbCを用いてどのようにVMが実装できるかを検証する + +# 今週の進捗 +* 評価用のスクリプトを作成して計測していました + +# 評価の例題 +* 青空文庫のテキストファイルを1つ読み込んで,かなと漢字を正規表現でキャプチャ,総数をカウントする +* 例 `蜜蜂《みつばち》` +* 今回はPerl5,Perl6,Rubyで実装しベンチマークを計測した + +# Perl5実装 + +```perl +#!/usr/bin/env perl +use strict; +use warnings; +use utf8; +use feature 'say'; +use Encode; + +my $filename = "./dogura_magura.txt"; +open my $fh,'<:encoding(utf-8)',$filename or die qw/can't open/; + +my @kana; + +while (my $line = <$fh>) { + chomp $line; + while( $line =~ m![、。]?(\p{Han}+)《(\p{Hiragana}+)》!g){ + push @kana,[$1,$2]; + } +} + +print scalar @kana; +``` + +# Ruby実装 + +```ruby +#!/usr/bin/env ruby + +File.open("./dogura_magura.txt",'r') do |f| + hoge = f.read.scan(/[、。]?(\p{Han}+)《(\p{Hiragana}+)》/) + p hoge.count +end +``` + +# Perl6実装 + +``` +#!/usr/bin/env perl6 +use v6; + +my $file = "./dogura_magura.txt"; +my $fh = open $file, :r; +my $hoge; + +for $fh.lines -> $line { + if ($line ~~ m:g/<[、。]>?(<:Han>+)"《"(<:Hiragana>+)"》"/ ) { + say $/[0]; + $hoge += $/.conj; + } +} + +say $hoge; + +$fh.close; +``` + +# 測定結果 + +``` +sh test.sh +perl +6726 + +real 0m0.209s +user 0m0.153s +sys 0m0.045s + +ruby +6726 + +real 0m0.206s +user 0m0.147s +sys 0m0.048s + +perl6 +6726 + +real 0m3.052s +user 0m3.176s +sys 0m0.057s +``` + +# 測定結果 + +``` + zsh test.zsh +perl +6726 +perl test.pl 0.15s user 0.04s system 95% cpu 0.196 total +ruby +6726 +ruby test.rb 0.17s user 0.06s system 94% cpu 0.235 total +perl6 +6726 +/Users/anatofuz/workspace/cr/Basic/build_perl6/bin/perl6 test.p6 3.21s user 0.07s system 106% cpu 3.090 total +``` + +* Perl6ではuser timeが圧倒的にかかっているが,systemは他と同レベル +* 生成されたprofilerを見た所JITも吐いているらしい diff -r bc8b0482c14f -r 49a9086fc7e9 slides/2018/07/13/memo.txt --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/slides/2018/07/13/memo.txt Tue Jul 31 18:28:00 2018 +0900 @@ -0,0 +1,23 @@ +C +Files=142, Tests=12933, 47 wallclock secs ( 1.18 usr 0.33 sys + 55.57 cusr 3.40 csys = 60.48 CPU) + +tags/2018/04.1の状態ではJVMのmoarはtestで死ぬことがわかった + +nqp ) perl Configure.pl --backends=jvm +rakudo ) perl Configure.pl --backends=jvm --with-nqp=/Users/anatofuz/workspace/cr/Basic/jvm/nqp/install/bin/nqp --prefix=/Users/anatofuz/workspace/cr/Basic/jvm/jvm_install + + +書いた + +perl6 +950 +/Users/anatofuz/workspace/cr/Basic/build_perl6/bin/perl6 log_analyze.p6 0.94s user 0.05s system 128% cpu 0.769 total +perl5 +950 +perl log_analyze.pl 0.04s user 0.04s system 86% cpu 0.098 total +ruby +950 +ruby log_analyze.rb 0.16s user 0.06s system 92% cpu 0.243 total + + +驚きの20倍遅い!!!! diff -r bc8b0482c14f -r 49a9086fc7e9 slides/2018/07/14/memo.txt diff -r bc8b0482c14f -r 49a9086fc7e9 slides/2018/07/15/memo.txt --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/slides/2018/07/15/memo.txt Tue Jul 31 18:28:00 2018 +0900 @@ -0,0 +1,8 @@ +jvm +./perl6 ~/workspace/cr/Basic/perl6/sandbox/log/log_analyze.p6 17.51s user 0.61s system 439% cpu 4.118 total + +moar +/Users/anatofuz/workspace/cr/Basic/build_perl6/bin/perl6 log_analyze.p6 0.72s user 0.07s system 114% cpu 0.689 total + +perl5 +perl log_analyze.pl 0.04s user 0.04s system 77% cpu 0.103 total diff -r bc8b0482c14f -r 49a9086fc7e9 slides/2018/07/17/memo.txt diff -r bc8b0482c14f -r 49a9086fc7e9 slides/2018/07/17/slide.md --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/slides/2018/07/17/slide.md Tue Jul 31 18:28:00 2018 +0900 @@ -0,0 +1,334 @@ +title: CbCによるMoarVMの改良 +author: Takahiro Shimizu +profile: +lang: Japanese + + +# 研究目的 +- Perl5の後継言語として開発されているPerl6はMoarVMと呼ばれるVMを搭載している. +- Perl6はMoarVM,JVM,JavaScript上で動くRakudoと呼ばれる実装と,コンパイラ開発者用のサブセットであるNQPが主な実装となっている. +- 現在Perl6及びMoarVMは全体的な速度がPerl5と比較し低下しており,実務として利用できるレベルに達していない. +- さらにPerl6の実装自体巨大なcase-switch文など見通しが悪くなっている. +- この問題を解決するために現在当研究室で開発している継続を中心にしたContinuation based Cを用いて改良を行う +- CbCの設計理念からVMの実装と親和性が高い事も推測できる為,実際にCbCを用いてどのようにVMが実装できるかを検証する + +# 今週の進捗 + +* JVM版Perl6をBuildしました +* logアナライザーを作成して時間計測を行いました +* 院試出願しました +* 趣味でPerl2をbuildしてます + +# ログアナライザー(Perl5) + +```perl5 +#!/usr/bin/env perl +use strict; +use warnings; +use Time::HiRes qw/gettimeofday tv_interval/; + +my $t0 = [gettimeofday]; + +my $file = "/var/log/system.log"; + +if(@ARGV == 2){ + if ( $ARGV[0] eq "-f"){ + $file = $ARGV[1]; + } +} + +my $user_name = qr/anatofuzMBP|anatofuz-15/; +open my $fh, "<",$file; +my $count = {}; + +while (my $line = <$fh>) { + if ( $line =~ /\w \d{0,2} (?:\d{2}:?){3} $user_name ([\w.]+)\[\d+\]/){ + $count->{$1}++; + } +} + +my $sum = 0; + +for my $key (keys %$count){ + $sum += $count->{$key}; +} + +print "$sum\n"; +my $t1 = [gettimeofday]; + +my $evec_time = tv_interval($t0,$t1); +print "$evec_time\n"; + +``` + +# ログアナライザー(Ruby) + +```ruby +#!/usr/bin/env ruby + +require 'benchmark' + +result = Benchmark.realtime do + file = "/var/log/system.log" + + user_name = Regexp.new("anatofuzMBP|anatofuz-15") + count = Hash.new(0) + + File.open(file,'r') do |f| + f.each_line do |line| + if line =~ /\w+ \d{0,2} (?:\d{2}:?){3} #{user_name} ([\w.]+)\[\d+\]/ + count[$1] += 1 + end + end + end + + + sum = 0 + + for key in count.keys + sum += count[key] + end + + p sum +end +#p "#{Time.now - start_time}" +puts "#{result}" + +``` + +# ログアナライザー(Perl6) + +```perl6 +#!/usr/bin/env perl +use v6; + +my $start = DateTime.now; + +unit sub MAIN(:f($file) where { .IO.f } = '/var/log/system.log'); + +my $user_name = /'anatofuzMBP'|'anatofuz-15'/; +my $fh = open $file,:r; +my %count =(); + +for $fh.lines -> $line { + if ( $line ~~ /\w+ \s \d**0..3 \s [\d**2\:?]**3 \s $user_name \s (<[\w.]>+)\[\d+\]/) { + %count{$0}++; + } +} +$fh.close; +my $sum = 0; + +for %count.keys -> $key { + $sum += %count{$key}; +} + +$sum.say; + +my $end = DateTime.now; + +my $time = $end - $start; +say $time; + +``` + +# ログアナライザー(Python) + +```python +#!/usr/bin/env python +import re +import sys +from collections import defaultdict +import time + +start_time = time.time() + +file_path = "/var/log/system.log" +args = sys.argv + +if args == 3: + if args[1] == "-f": + file_path = args[2] + +count = defaultdict(int) + +with open(file_path) as f: + for line in f: + match = re.search(r'\w+ \d{0,2} (?:\d{2}:?){3} (?:anatofuzMBP|anatofuz-15) ([\w.]+)\[\d+\]',line) + if match: + count[match.group(1)]+=1 + +total = 0 + +for key in count.keys(): + total +=count[key] + +print(total) + +end_time = time.time() + +print(end_time - start_time) + +``` + +# ログアナライザー(java) + +```java +package com.google.anatofuz; + +import java.io.File; +import java.io.FileReader; +import java.io.BufferedReader; +import java.io.FileNotFoundException; +import java.io.IOException; +import java.util.*; +import java.util.regex.Pattern; +import java.util.regex.Matcher; + +public class LogAnalyzer { + + public static void main(String args[]) { + + long start = System.currentTimeMillis(); + File file = new File("/var/log/system.log"); + + if (args.length != 0) { + if (args[0].equals("-f")) { + file = new File(args[1]); + } + } + + try { + FileReader filereader = new FileReader(file); + BufferedReader bufferedReader = new BufferedReader(filereader); + + String line; + Map map = new HashMap(0); + Pattern p = Pattern.compile("\\w+ \\d{0,2} (?:\\d{2}:?){3} (?:anatofuzMBP|anatofuz-15) ([\\w.]+)\\[\\d+\\]"); + + + while ((line = bufferedReader.readLine()) != null) { + Matcher matcher = p.matcher(line); + if (matcher.find()) { + map.merge(matcher.group(1),1,Integer::sum); + } + } + + int sum = 0; + + for (String key :map.keySet()){ + sum += map.get(key); + } + + System.out.println(sum); + + long end = System.currentTimeMillis(); + + System.out.println("0.0" + (end - start)); + + } catch (FileNotFoundException ex){ + System.out.println(ex); + } catch (IOException ex){ + System.out.println(ex); + } + } +} + +``` + +# 計測結果 + +* 結果をブログに載せたら起動時間の比較と突っ込まれる + +``` +perl6(moar) +950 +/Users/anatofuz/workspace/cr/Basic/build_perl6/bin/perl6 log_analyze.p6 0.94s user 0.05s system 128% cpu 0.769 total + +perl6(jvm) +./perl6 ~/workspace/cr/Basic/perl6/sandbox/log/log_analyze.p6 17.51s user 0.61s system 439% cpu 4.118 total + + +perl5 +950 +perl log_analyze.pl 0.04s user 0.04s system 86% cpu 0.098 total + +ruby +950 +ruby log_analyze.rb 0.16s user 0.06s system 92% cpu 0.243 total + +java +java -jar java/build/libs/anatofuz-1.0-SNAPSHOT.jar 0.27s user 0.05s system 149% cpu 0.212 total + +time python log_analyze.py +python log_analyze.py 0.07s user 0.05s system 77% cpu 0.153 total +``` + + + +# 内部処理 + +* 内部処理時間のみ計測 +* perl5 + * 0.003434s +* Ruby + * 0.046458s +* Python + * 0.0097 +* Java + * 0.047 +* Perl6(Moar) + * 0.2649 +* Perl6(JVM) + * 0.687 + +``` +perl5 +0.003434 +perl log_analyze.pl 0.04s user 0.04s system 76% cpu 0.105 total + +===== +ruby +0.04645899997558445 +ruby log_analyze.rb 0.15s user 0.05s system 85% cpu 0.239 total +===== + +python log_analyze.py +0.009788036346435547 + +===== + +java +0.047 +java -jar java/build/libs/anatofuz-1.0-SNAPSHOT.jar 0.27s user 0.05s system 151% cpu 0.209 total + +===== +perl6 +0.2649038 +/Users/anatofuz/workspace/cr/Basic/build_perl6/bin/perl6 log_analyze.p6 0.86s user 0.08s system 109% cpu 0.856 total + +===== +perl6(jvm) +WARNING: An illegal reflective access operation has occurred +WARNING: Illegal reflective access by org.perl6.nqp.runtime.Ops (file:/Users/anatofuz/workspace/cr/Basic/jvm/nqp/install/share/nqp/runtime/nqp-runtime.jar) to field sun.management.RuntimeImpl.jvm +WARNING: Please consider reporting this to the maintainers of org.perl6.nqp.runtime.Ops +WARNING: Use --illegal-access=warn to enable warnings of further illegal reflective access operations +WARNING: All illegal access operations will be denied in a future release +0.687 +/Users/anatofuz/workspace/cr/Basic/jvm/rakudo/perl6 21.48s user 0.72s system 436% cpu 5.087 total + +``` + + +# 院試 + +* 出願しました +* 過去問やってます + +# Perl2 + +* Perl5のgitリポジトリにtagとして残っていました +* gcc/cc1でbuild出来るようにパッチを書いてます + * gccを参照するように変更 + * ``というヘッダーファイルを削除 + * `sprintf`などの関数の返り値を修正 + * yaccのシンタックスエラーを解消 diff -r bc8b0482c14f -r 49a9086fc7e9 slides/2018/07/17/zip.txt --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/slides/2018/07/17/zip.txt Tue Jul 31 18:28:00 2018 +0900 @@ -0,0 +1,69 @@ +2018-07-10---- +* if文とJIT +* ログアナライザー /var/log/ をエイヤッと見てみる + * この中から特定のパターンを確認する + * デーモンを判定 + * 日付を判定 + * 回数を数えるか + +* ファイルを分割して並列実行 +* golang + +* for文の中で+するなら一旦受け皿を用意しておけば良さそう +* javaのstreamingで分割すると良さそう + +* バッカス-> FP (データ並列を実行する) +* 並列シンタックスをいれるか + +* 並列処理しても + +* 指針-->Javaの代わりのCbCを吐く + +CbCなので最初はGCいれなくても作って良さそう + +* どんな風なCbCを吐くか--> Basic Block単位で生成すると良さそう +Basic blockをcode segment + +if文とかcallまでの間の部分をbasic blockという + +---------- +2018-07-13---- +C +Files=142, Tests=12933, 47 wallclock secs ( 1.18 usr 0.33 sys + 55.57 cusr 3.40 csys = 60.48 CPU) + +tags/2018/04.1の状態ではJVMのmoarはtestで死ぬことがわかった + +nqp ) perl Configure.pl --backends=jvm +rakudo ) perl Configure.pl --backends=jvm --with-nqp=/Users/anatofuz/workspace/cr/Basic/jvm/nqp/install/bin/nqp --prefix=/Users/anatofuz/workspace/cr/Basic/jvm/jvm_install + + +書いた + +perl6 +950 +/Users/anatofuz/workspace/cr/Basic/build_perl6/bin/perl6 log_analyze.p6 0.94s user 0.05s system 128% cpu 0.769 total +perl5 +950 +perl log_analyze.pl 0.04s user 0.04s system 86% cpu 0.098 total +ruby +950 +ruby log_analyze.rb 0.16s user 0.06s system 92% cpu 0.243 total + + +驚きの20倍遅い!!!! + +---------- +2018-07-14---- + +---------- +2018-07-15---- +jvm +./perl6 ~/workspace/cr/Basic/perl6/sandbox/log/log_analyze.p6 17.51s user 0.61s system 439% cpu 4.118 total + +moar +/Users/anatofuz/workspace/cr/Basic/build_perl6/bin/perl6 log_analyze.p6 0.72s user 0.07s system 114% cpu 0.689 total + +perl5 +perl log_analyze.pl 0.04s user 0.04s system 77% cpu 0.103 total + +---------- diff -r bc8b0482c14f -r 49a9086fc7e9 slides/2018/07/24/memo.txt --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/slides/2018/07/24/memo.txt Tue Jul 31 18:28:00 2018 +0900 @@ -0,0 +1,9 @@ + +** MoarVMのCbCをswithch文をCに書き換える + +moar VMのcode segmentを順番に呼び出していくコードを書く + +**JITしないMoarVMを見てみる + +CbC +JIT diff -r bc8b0482c14f -r 49a9086fc7e9 slides/2018/07/31/memo.txt --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/slides/2018/07/31/memo.txt Tue Jul 31 18:28:00 2018 +0900 @@ -0,0 +1,7 @@ +* Perl6が動いている特定のコードを早くする +* --> Regular Expression 周り + +* ある特定のパターンを検知してそこだけ早くする +* ファイル分割 + +TODO: masaさんの論文を読む diff -r bc8b0482c14f -r 49a9086fc7e9 slides/2018/07/31/slide.md --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/slides/2018/07/31/slide.md Tue Jul 31 18:28:00 2018 +0900 @@ -0,0 +1,49 @@ +title: CbCによるMoarVMの改良 +author: Takahiro Shimizu +profile: +lang: Japanese + + +# 研究目的 +- Perl5の後継言語として開発されているPerl6はMoarVMと呼ばれるVMを搭載している. +- Perl6はMoarVM,JVM,JavaScript上で動くRakudoと呼ばれる実装と,コンパイラ開発者用のサブセットであるNQPが主な実装となっている. +- 現在Perl6及びMoarVMは全体的な速度がPerl5と比較し低下しており,実務として利用できるレベルに達していない. +- さらにPerl6の実装自体巨大なcase-switch文など見通しが悪くなっている. +- この問題を解決するために現在当研究室で開発している継続を中心にしたContinuation based Cを用いて改良を行う +- CbCの設計理念からVMの実装と親和性が高い事も推測できる為,実際にCbCを用いてどのようにVMが実装できるかを検証する + +# 今週の進捗 +* 院試の勉強していました + * 来週なんで頑張ります +* 3GBのファイルでログアナライザーの計測しました + +# 計測(3GB) + +* Perl5 + * 41.35s +* Ruby + * 574.52s +* Python + * 101.16s +* Java + * 48.85s +* Perl6(Moar) + * 2331.08s +* Perl6(JVM) + * 1665.56s + +# 参考(231K) + +* Perl5 + * 0.04s +* Ruby + * 0.15s +* Python + * 0.06s +* Java + * 0.27s +* Perl6(Moar) + * 0.86s +* Perl6(JVM) + * 21.48s +