スキップしてメイン コンテンツに移動

awk で DPC EFファイルの先頭に年月を追加する

  • ある病院のDPC EFファイルの件数
$ wc -l EFn_000000000_14*.txt
  380502 EFn_000000000_1404.txt
  390134 EFn_000000000_1405.txt
  423224 EFn_000000000_1406.txt
  450589 EFn_000000000_1407.txt
  429559 EFn_000000000_1408.txt
  412329 EFn_000000000_1409.txt
  435993 EFn_000000000_1410.txt
  391426 EFn_000000000_1411.txt
  403304 EFn_000000000_1412.txt
 3717060 total
  • 年月を先頭につけて、UTF-8に変換し、1つのファイルに出力する
awk '{print "20" substr(FILENAME,15,4) "\t" $0}' EFn_000000000_14* | nkf -x > DPC_EFn_201404-12.txt
【解説】ファイル名の年月はYYMMなので、先頭に"20"を追加します。年月YYMMはファイル名の15文字目から4文字をとります。TAB("\t")を挟んで元の行($0)とくっつけます。それから、パイプ | を通して nkf コマンドで 文字コードをUTF-8(-x)に変換してから、DPC_EFn_201404-12.txt というファイルに出力(>)します。

コメント

このブログの人気の投稿

Excel Power Query 英数字の全角から半角への変換

最近仕事上でExcelのPower Queryを始めました。しかし、英数字の全角から半角への変換関数がないため、下記のサイトを参考して、 作っちゃいました。  https://qiita.com/baku2san/items/8041d0259fe0db680e7e https://www.yoheim.net/blog.php?q=20191101 (original as text) as text =&gt; let    originalText = Text.Combine({original, ""}),    replaceResult =  Web.Page("<script>var originalText="&"'"&originalText&"'"&";var result=originalText.replace(/[A-Za-z0-9]/g, function(s) {return String.fromCharCode(s.charCodeAt(0) - 0xFEE0);});document.write(result);</script>")       [Data]{0}[Children]{0}[Children],    result = if (List.Count(replaceResult) &lt;= 1) then    {        "" as text // 変換して何も残らない場合    } else if (replaceResult{1}[Text]{0} = null) then    {       originalText   as text// 何も見つからない場合    }  else {       replaceResult{1}[Text]{0} as text    } in     result{0}  

自己流思い付き

 長年契約してきたさくらインターネットのVPSに稼働しているWordpressが何らかのものに削除されました。幸い残したいものはこのブログに移したので、あまり困ったことはありませんでした。もうVPSを解約しようと思いますが、今年の11月までの契約なので、正直って迷っております。  職場のホームページサーバがMacmini上のピュアDebianなので、実験台としてVPSを契約したのですが、もう実験しないし、解約してもよいだと思います。   このブログもこれをきっかけにタイトルを変えました。

余裕ですかね。

  いまの自分はやることが多いが、意外と慌てず一歩一歩現場と歩んでいき、地道にデータ入力から可視化までの利便性、完全性と正確性を追求する余裕が出ております。SpotfireというBIツールにハマり、人に使い方を教えながらもまたその恩恵を受けているといういい循環も大きいですね。大体自分のようなポストにいる人たちはあまりプログラムを書く余裕もないだが、自分は幸せのほうと思います。