2020/07/08

仮説は大外れだったけど、記事にしちゃいました

CBnewsに記事を掲載いただいた。

高齢化と効率性係数の関係、筆者の予想は大外れ - CBnewsマネジメント 高齢化と効率性係数の関係、筆者の予想は大外れ - CBnewsマネジメント

仮説を立て、分析し、記事にまとめる。いつも、大体、この流れ。

仮説通りの結果が出ないと、記事自体の主張がブレブレになるので、当たり前だが、ボツにする。正直、分析結果は微妙なことも多い(毎回、毎回、完璧な結果が出てくるわけがない)。

今回は「院内の高齢化の進展は、効率性係数にはネガティブな影響をおよぼす」と仮説を立てて分析を始めたものの、想定通りの結果は得られなかった。

いつもなら、原稿をボツにして、違うネタで書き直す。だが、今回は、想定通りの結果ではなかったものの、興味深い結果だったので、そのまま原稿を書いてみた。(決して、やり直すのをサボったわけではない)

このような経緯で「筆者の予想は大外れ」というタイトルにして、主張内容を明確にしてみた。

効率性係数がなかなか上がらない病院において、高齢化をどう捉えればよいか、参考にしていただける内容になったと信じている。

2020/07/05

PDFデータは分析に向かない

PDFデータで公開されている資料を分析することがある。
たまに・・・という頻度ではなく、かなりの頻度で。

最近書いた記事の例では、オンライン診療について触れた下記がそうだ。
オンライン診療の未来は読めない? - 株式会社メディチュア Blog

4月10日の通知で対応している医療機関のリストを分析したものだが、なかなか厄介なPDFだった。

うちでは、PDFの表データをCSVやエクセルのデータにするのは、次の3つの方法で対応している。

1.コピペ
ちょっとしたものは、コピペで。区切り位置などの調整は、テキストエディタなどで行う。表1つだけであれば、この方法で何とかしてしまうのが早い。

2.AdobeのAcrobatでEXCELデータに変換
量があるときは、次にこれを試す。オフィシャルなツールなので、ある程度信頼できる。有料サービスだが、時間短縮を思えば、十分価値がある。表だけでなく、WORDへの変換などもできるので、便利だ。

3.pythonで処理する
1、2でうまく処理できれば良いのだが、そういうわけにはいかない資料がある。そこでプログラムを組む。PyPDF2、tabula-pyなどを使っている。比較的きれいな表であれば、前者でさくっと処理できる。後者はパラメータを調整すれば、汚い表であっても強引に処理できる。

これら3つの方法をうまく使い分け、データ分析をしている。
ただ、これらの作業には難点がある。結局、どの方法で処理したとしても、数値があっているか検証しなければならない。少しの量なら、それほど時間はかからないが、膨大になると・・・、検証もすごいことになる。

PDFは印刷して配布する目的にはベストな手段であるが、データ分析には向かない。できれば、色々な資料はエクセルやCSVでデータを配布して欲しい。
(国も、そういってるし・・・ オープンデータをはじめよう 〜 地⽅公共団体のための最初の⼿引書 (案)〜 内閣官房 情報通信技術(IT)総合戦略室 siryou2-4.pdf

でも色々なPDFがあるおかげで、プログラムで処理するスキルは向上している。どんなデータが来ても、怖気づかなくなったという点は良かった??のかもしれない。

2020/06/24

今回は簡単な分析です、主旨は重いですが

CBnewsに記事を掲載いただいた。

高齢化のスピードの速さが戦略見直しのきっかけに - CBnewsマネジメント 高齢化のスピードの速さが戦略見直しのきっかけに - CBnewsマネジメント

2020年度改定で急性期病棟でサブアキュート・ポストアキュート患者を看ることは難しくなった。

「他は対策しているけど、うちはまだ大丈夫」と思っているところもあるかもしれない。でも大丈夫なのは、今だけで、そう遠くない将来に、対策が必要になるのではないだろうか。

ということを述べるために、ある地域のデータを整理した。極端に高齢化が進んでいる地域ではないし、首都圏のようなところでもない。県庁所在地に、大学病院・県立病院・市立病院・公的病院が揃っている点も、考察する上で大事なポイントだと考え、地域を選定した。

基幹病院みなが、高度急性期・急性期、総合入院体制加算を届出するような方向に突き進むのは厳しいかもしれない。データ分析を通じて、すでにその予兆が出始めていることを感じた次第だ。

自分の地域に当てはめて分析することも容易なので、参考にいただけると幸いだ。