スキップしてメイン コンテンツに移動

DPC公開データのクレンジング(汎用性のある横持ち表を縦持ちデータに変換するツールとしてのつもり^^;)

 厚労省が公開したデータがいけていない(さらに複雑な分析ができない)からDPC公開データのクレンジングのためにExcel のVBAプログラミングで簡単なツールを作りました。

https://www.mhlw.go.jp/stf/shingi2/0000196043_00003.html

抽出手順
1.データの範囲を検知(行数、列数)
2.表頭を値として取得
3.値が2種類(件数、在院日数。8/4=2)があるから同時に2列を書き出す
4.次の表頭グループからデータを抽出

Excelファイルを下記からダウンロードできます。

 Excel xlsm

公開するか未定ですが、自動的に厚労省のURLからダウンロードして、表側と表頭を自動的に判別してCSVに吐き出すか、データベースに入れる拡張をする予定です。

【20210309追記】

MDC04の表の場合、件数・在院日数の下位項目数は均等ではない(4列か3列か)以前公開のExcelでは処理できないことが判明しました。修正バージョンは下記にアップロードしました。昨年10月に直したのに、アップロードするのはずっと忘れていました。

修正版


コメント

このブログの人気の投稿

さくらインターネットのレンタルサーバにMysqlの大きいdumpファイルのインポート

 さくらインターネットのレンタルサーバはFreeBSDをつかっています。 LAMP の環境が揃っています。 基本的にFTPアカウントが発行されて、Webベースでファイルの転送もデータベースの作成および管理(phpMyAdmin)ができます。 しかし、phpMyAdminは、dumpファイルをインポートする場合、最大16MBのファイルしかアプロードできません。 明確的にSSHアカウントは提示されていないが、実際にSSHでの接続も可能だと確認しました。しかし、SSHで接続してもmysqlでリモートMysqlサーバへの接続はできなかったようです。 そこで、dumpファイルの中身はSQL文なので、 A5m2 というSQLクライアントからインポートすることを試しました。 もちろん、自宅のパソコンから直接Mysqlサーバを接続できるとは思いませんが、一応試してみました。案の定、当たり前に制限がかけられています。 で、よく考えるとレンタルサーバからアクセスできるから、そのIPは許可されているだろうと思います。 なので、SSHトンネルを Bitvise SSH Client で掘ろうと考えていました。 BitviseのSSH設定はそんなに難しくないので、割愛しますが、 C2Sのタブの設定は下記の通りです。 listen interface => 127.0.0.1 List Port => 3306 (ローカルにMysqlが稼働している場合、3326とかに設定してください) Destination Host => レンタルサーバが提供しているMysqlサーバ mysql~.~.ac.jp Dest. Port => 3306 A5m2のデータベース設定は、Mysql直接接続で、IPを127.0.0.1にすれば、接続できるはずです。 それから、Dumpファイルを読み込んで「先頭からすべて」実行をすれば、いまのところ500MB位のファイルでも実行できました。だが、1.2GBのファイルは読み込みの途中にエラーになったが、ファイルが大きい過ぎたか、それともUTF8コードの問題なのか調査中です。結果がわかった次第追記します。

Redmine 4.1.1-5 Textile の外部リンクを新しいタブで開く

\Bitnami\redmine-4.1.1-5\apps\redmine\htdocs\lib\redmine\wiki_formatting\textile にある、redcloth3.rb の850行目を下記のように   target='_blank' を追加して、Redmineを再起動してください。             "#{pre}<a#{atts}#{external} target='_blank' >#{text}</a>#{post}"

plantuml node procedure アーキテクチャ図の部品化

 最近よくアーキテクチャ図を描くようになりました。 一々Node名とリンクやIP、データベースの設定するのもいいのですが、 Node数が多すぎると大変な作業になります。そこで、plantumlのprocedureを作れました。 他の部品も同じ方法で作れますので、興味ある方はご参考ください。 SVG画像 @startuml !procedure $node($alias, $name="mynode",$ip="", $database="", $namelink="", $dbtype="", $dblink="", $fontsize=14, $color="#bafcc8") !include skinparam node { backgroundColor $color FontSize $size } !if ($namelink != "") !$name = "[[" + $namelink + " " + $name + "]]" !endif !if ($ip != "") !$name = $name + "\n(" + $ip + ")" !endif node "$name" <<$archimate/technology-node>> as $alias { !if ($database != "") !$dbalias = $alias + "DB" !if ($dblink != "") !$database = "[[" + $dblink + " " + $databas...