MongoDBはスキーマを定義しなくても下記のように簡単にコマンド一行でCSVをインポートできます。
C:\Users\user\Desktop>mongoimport /db:dpc /collection:facilities /type:csv /file:facilities.csv /headerline
2020-09-01T14:49:28.410+0900 connected to: localhost
2020-09-01T14:49:29.428+0900 [#####...................] dpc.facilities 144KB/659KB (21.9%)
2020-09-01T14:49:30.485+0900 [#######################.] dpc.facilities 659KB/659KB (100.0%)
2020-09-01T14:49:30.486+0900 imported 4764 documents
MongoDBシェルで二つのコレクションをJOINさせるのもいいのですが、データのJOINに強いBIツール、Spotfireを使えば、複雑なシェルやSqlを書く必要もなくなります。
MongoDBは普通のSqlを使うデータベースのようにBIツールから接続するには、有償のODBCドライバーもありますが、こちらは無償のBIコネクターを使います。
ただ、このコネクターは、MySQL ODBC Unicode Driverに依存しているのと、Mysqlのドライバーのインストールは、Visual Studio 2015、2017、および 2019 用 Microsoft Visual C++ 再頒布可能パッケージが必要なので、両方も用意しましょう。
MongoDBがインストールされている前提で話を進みたいので、インストールは下記のページを参考してください。個人的にTB単位の外付けSSDをMongoDBを持ち歩くので、ポータルバージョンを使っています。
まず、BIコネクターに下記のコマンドで
schema.drdlを作ります。(コレクションが増えた場合、作り直す必要があるようです)
C:\Program Files\MongoDB\Connector for BI\2.14\bin>mongodrdl.exe --host localhost --db dpc --out schema.drdl
そして、下記のコマンドでlocalhost 3307
C:\Program Files\MongoDB\Connector for BI\2.14\bin>mongosqld.exe
うまくリスナーが待機状態になる場合は、下記のようにコマンドプロンプトに吐き出されます。
2020-09-01T17:42:24.887+0900 I CONTROL [initandlisten] mongosqld starting: version=v2.14.0 pid=66988 host=DESKTOP-T5OEMLV
2020-09-01T17:42:25.168+0900 I CONTROL [initandlisten] git version: 6fa82d07a176aeee28f685c3f8e8806832c769b0
2020-09-01T17:42:25.168+0900 I CONTROL [initandlisten] OpenSSL version OpenSSL 1.0.2n-fips 7 Dec 2017 (built with OpenSSL 1.0.2s 28 May 2019)
2020-09-01T17:42:25.168+0900 I CONTROL [initandlisten] options: {}
2020-09-01T17:42:25.168+0900 I CONTROL [initandlisten] ** WARNING: Access control is not enabled for mongosqld.
2020-09-01T17:42:25.168+0900 I CONTROL [initandlisten]
2020-09-01T17:42:25.172+0900 I NETWORK [initandlisten] waiting for connections at 127.0.0.1:3307
2020-09-01T17:42:25.909+0900 I SCHEMA [sampler] sampling MongoDB for schema...
2020-09-01T17:42:26.635+0900 I SCHEMA [sampler] mapped schema for 4 namespaces: "node_memo_demo" (1): ["memos"]; "test" (1): ["test"]; "dpc" (2): ["facilities", "mdc01ope"]
そして、odbcを検索して、ODBCデータソース(64ビット)を起動してください。
データソース名、データベース名は自分の環境に合わせて変更してください。
問題がなければ、Testをクリックすれば、接続成功のような表示がされます。
MongoDBのCSVインポートは、下記の記事を参考してください。
Spotfireは画像の感じになります。
データを追加:その他>ODBC~
データソース:ODBC~>mongodb
OKをクリック、また下の窓のOKをクリックして、次のSQLステートメント画面に
select * from facilities を入力して、データソース名を指定してOKをクリックすれば、
施設概要が取り込まれます。
それから、MDC01手術のデータ(mdc01ope)も最初の+>その他>ODBC~の手順から上記と似た手順で取り込みましょう。
両方のデータが取り込まれたら、データキャンパスの画面からJIONさせます。(詳細手順は割愛します)
JOINしたデータは下記の画像のように、施設概要の情報がMDC01の件数や在院日数に結合している形になりました。
あとは、自由に結合した項目を軸にいろいろなビジュアライゼーションが作れます。
【関連するURL等】
MySQL ODBC Unicode Driver
https://dev.mysql.com/downloads/file/?id=497108
mysql-connector-odbc-8.0.21-winx64.msi
のダウンロード
https://support.microsoft.com/ja-jp/help/2977003/the-latest-supported-visual-c-downloads
コメント
コメントを投稿