post by yamamoto | 0 | 1,189 views

テキストエディタ正規表現 メモ

14.7.2
司天 celestial control
司天之气
客气中主司上半年气候、物候等变化的主岁之气。
14.7.3
在泉 terrestrial effect
在泉之气
客气中主司下半年气候、物候等变化,与司天相对之气

ーーーーーーーーーーー

上記の文の「与司天相对之气」の最後に「。」がありませんでした。

いくら Abbyy FineReader 11 の精度が高くてもこのように抜けるところも出てきます。

こうこうパターンを探すのは下記の正規表現を使います。(テキストエディタは Mac 用の mi です。)

^[^0-9][^\r\n]+[,|、|。][^\r\n]+[^。a-z]$

^[^0-9] ⇒ 行頭に数字ではない。

[^\r\n]+ ⇒ 改行ではない文字が続く

[,|、|。] ⇒ 「,」「、」「。」が改行以外の文字に挟まれている

[^\r\n]+ ⇒ 改行ではない文字が続く

[^。a-z]$ ⇒ 行末に「。」「a-z」のアルファベットではない

ーーーーーーーーーーーー

このようなやり方は実に面白く強力ですね。わざわざプログラミングしなくても綺麗に整形できるからです。

ちなみに、iPad のアプリ Textastic Code Editor も正規表現の置換えができます。

Comments are closed.