2020/02/13

データを疑ってみることの重要性

先日のブログ(年2000件、クリアできる病院は900施設程度か)、病床機能報告のデータ、他にもおかしな数値があった。MMオフィス工藤氏に指摘された。鋭い!!

厚労省のサイト(https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/open_data_00002.html)の注意書きには、下記のようにあるので、都道府県のデータを確認する必要があるのはやむを得ない。
2.当ホームページの情報は、平成30年6月15日時点において病床機能報告事務局が把握している報告内容を基に作成されています。
ただし、都道府県庁において個別に情報を更新している場合もあることから、
最新の報告内容については、各都道府県庁のホームページにてご確認ください。
自分が情けないのは、医師数を縦軸に取り散布図にしているので、外れ値を拾い上げることができたはずだ。それなのに、チェックが甘かった。明らかに件数分布から外れていた国保旭は気づけたのに、諏訪赤十字は気づかなかった。他にも1病院気づいたが、これは確信が持てない(2016年が1800件程度なのに、2017年度は9,000件超え)。

分布から外れた病院をチェックしていて、首都圏で医師数や病床数はあまり多くないものの、救急車の受入台数が極めて多い病院などに気がつけたのは個人的に収穫だった。

下のグラフは、先日のブログのグラフを、現時点でわかっている範囲で修正したもの。

データを疑ってみることの重要性を再認識した。反省。