my @found = grep ( /$patten/, @chapter); print $#found+1, "\n"; foreach $found (@found) { print $found,"\n"; if ($found=~/^(第)(.+?)(章)/){ #if ($found=~/(.*第)(.+?)(章.*)/){ my $ch = $2; print {ch}."\n"; print $found,"\n"; } print $found,"\n"; }
Category Archive: 正規表現
テキストエディタ正規表現 メモ
14.7.2 司天 celestial control 司天之气 客气中主司上半年气候、物候等变化的主岁之气。 14.7.3 在泉 terrestrial effect 在泉之气 客气中主司下半年气候、物候等变化,与司天相对之气 ーーーーーーーーーーー 上記の文の「与司天相对之气」の最後に「。」がありませんでした。 いくら Abbyy FineReader 11 の精度が高くてもこのように抜けるところも出てきます。 こうこうパターンを探すのは下記の正規表現を使います。(テキストエディタは Mac 用の mi です。) ^[^0-9][^\r\n]+[,|、|。][^\r\n]+[^。a-z]$ ^[^0-9] ⇒ 行頭に数字ではない。 [^\r\n]+ ⇒ 改行ではない文字が続く [,|、|。] ⇒ 「,」「、」「。」が改行以外の文字に挟まれている [^\r\n]+ ⇒ 改行ではない文字が続く [^。a-z]$ ⇒ 行末に「。」「a-z」のアルファベットではない ーーーーーーーーーーーー このようなやり方は実に面白く強力ですね。わざわざプログラミングしなくても綺麗に整形できるからです。 ちなみに、iPad のアプリ Textastic Code Editor も正規表現の置換えができます。