スキップしてメイン コンテンツに移動

awk で DPC EFファイルの先頭に年月を追加する

  • ある病院のDPC EFファイルの件数
$ wc -l EFn_000000000_14*.txt
  380502 EFn_000000000_1404.txt
  390134 EFn_000000000_1405.txt
  423224 EFn_000000000_1406.txt
  450589 EFn_000000000_1407.txt
  429559 EFn_000000000_1408.txt
  412329 EFn_000000000_1409.txt
  435993 EFn_000000000_1410.txt
  391426 EFn_000000000_1411.txt
  403304 EFn_000000000_1412.txt
 3717060 total
  • 年月を先頭につけて、UTF-8に変換し、1つのファイルに出力する
awk '{print "20" substr(FILENAME,15,4) "\t" $0}' EFn_000000000_14* | nkf -x > DPC_EFn_201404-12.txt
【解説】ファイル名の年月はYYMMなので、先頭に"20"を追加します。年月YYMMはファイル名の15文字目から4文字をとります。TAB("\t")を挟んで元の行($0)とくっつけます。それから、パイプ | を通して nkf コマンドで 文字コードをUTF-8(-x)に変換してから、DPC_EFn_201404-12.txt というファイルに出力(>)します。

コメント

このブログの人気の投稿

iPhoneのカレンダーに見知らぬアカウントによるフィティングリンクの恐れ

 昨日突然妻から、iPhoneのカレンダーに怪しい予定はいっぱい書き込まれました。 最初はメールアドレスの盗用されたと思って、メールアカウントのパスワードと、そのメールアドレスのApple IDのパスワードを急遽変更しました。しかし、書き込みが消えず、よくカレンダーの設定のアカウントを調べると下記の画像のような気持ち悪いアカウントがいつの間にか設定されてしまいました。おそらく料理紹介のホームページにある怪しい広告をクリックしたかもしれません。くれぐれもご注意ください。 幸い、このアカウントを削除すれば、書き込みも消えました。なにが違和感を感じたときは、絶対にリンク等をクリックしないほうが身のためでしょう。 さらにnslookupで ylevelsoft.funを調べてみるとIPは13.226.77.* セグメント内の4つのようです。 $ nslookup ylevelsoft.fun Server:         192.168.11.1 Address:        192.168.11.1#53 Non-authoritative answer: Name:   ylevelsoft.fun Address: 13.226.77.19 Name:   ylevelsoft.fun Address: 13.226.77.33 Name:   ylevelsoft.fun Address: 13.226.77.8 Name:   ylevelsoft.fun Address: 13.226.77.15 これらのIPアドレスを調べると、東京にあるIPアドレスがわかって、Amazonにホスティングしてるようです。 13.226.77.19 IP Address Details - IPinfo.io カレンダーのアカウントに登録したサーばをnslookupを調べると13.33.9.*セグメントの4つが使われて、Amazonにホスティングしてるようです。 このホスト名は、server-13-33-9-105.nrt57.r.cloudfront.net 上記のIPのホスト名server-13-...

閉域網の電子カルテにJitsiを稼働させてみた!(続き)

 前回は、 閉域網の電子カルテにJitsiを稼働してみた! を紹介しました。 サーバは古いMacminiですが、今回はインターネット環境のWindows 10のHyper-VでDebian 10を入れて、仮想サーバを電子カルテネットワーク内の、Windows server 2019とWindows server 2008のHyper-Vに移植する試みを紹介します。 Hyper-Vにすることで、新しい研究用仮想基盤や古いサーバ(旧国立大バックアップシステム等)の仮想基盤化で必要数に応じて簡単にJitsiサーバを増やすことが可能という利点があります。それから、故障した場合も簡単に他のHyper-V仮想基盤にすぐ再稼働することが可能なので耐障害になります。 今回利用したDebianのインストーラは、 debian-10.7.0-amd64-netinst.iso です。 基本のDebianのインストールはインストーラの指示通りでできますので、こちらで割愛します。必要なサービスは、VNCやSSHあたりです。GUIが利用したい場合、お好みのデスクトップで構いません。 Jitsi Meetのインストールは、 こちらのサイト(英文) を参考していますが、 こちらの環境では、下記のコマンドでやってみました。ドメイン名を使わず、IPアドレスのみでの設定なので、Hyper-Vのチェックポインの機能でIP変更のたびにJitsiをインストールします。 $ wget https://download.jitsi.org/jitsi-key.gpg.key $ sudo apt-key add jitsi-key.gpg.key $ sudo nano /etc/apt/sources.list.d/jitsi-stable.list #下記の一行を追記 deb https://download.jitsi.org stable/ $ sudo apt update $ sudo apt -d install jitsi-meet #電子カルテから簡単にインターネットからダウンロードできない環境を考えるととりあえず-dでダウンロードオンリーにします #ここでHyper-Vのチェックポインにします。 $ sudo apt install jitsi-meet イン...

さくらインターネットのレンタルサーバにMysqlの大きいdumpファイルのインポート

 さくらインターネットのレンタルサーバはFreeBSDをつかっています。 LAMP の環境が揃っています。 基本的にFTPアカウントが発行されて、Webベースでファイルの転送もデータベースの作成および管理(phpMyAdmin)ができます。 しかし、phpMyAdminは、dumpファイルをインポートする場合、最大16MBのファイルしかアプロードできません。 明確的にSSHアカウントは提示されていないが、実際にSSHでの接続も可能だと確認しました。しかし、SSHで接続してもmysqlでリモートMysqlサーバへの接続はできなかったようです。 そこで、dumpファイルの中身はSQL文なので、 A5m2 というSQLクライアントからインポートすることを試しました。 もちろん、自宅のパソコンから直接Mysqlサーバを接続できるとは思いませんが、一応試してみました。案の定、当たり前に制限がかけられています。 で、よく考えるとレンタルサーバからアクセスできるから、そのIPは許可されているだろうと思います。 なので、SSHトンネルを Bitvise SSH Client で掘ろうと考えていました。 BitviseのSSH設定はそんなに難しくないので、割愛しますが、 C2Sのタブの設定は下記の通りです。 listen interface => 127.0.0.1 List Port => 3306 (ローカルにMysqlが稼働している場合、3326とかに設定してください) Destination Host => レンタルサーバが提供しているMysqlサーバ mysql~.~.ac.jp Dest. Port => 3306 A5m2のデータベース設定は、Mysql直接接続で、IPを127.0.0.1にすれば、接続できるはずです。 それから、Dumpファイルを読み込んで「先頭からすべて」実行をすれば、いまのところ500MB位のファイルでも実行できました。だが、1.2GBのファイルは読み込みの途中にエラーになったが、ファイルが大きい過ぎたか、それともUTF8コードの問題なのか調査中です。結果がわかった次第追記します。