2015/12/06

【初心者向け企画】分析の初歩を学ぼう 第3回 多峰性のヒストグラム(実践的なヒストグラム作成の続き)

2015/12/6 コメントを書きました (Masaru Watanabe)

多峰性ということは、ピークが複数あるということと理解しています。お年寄りと子供は病院に行く回数が多そうなので、年齢を横軸にとり受療率をヒストグラムにしたら、多峰性の図になるのではないかと思い、図を作成して見ました。

→関節リウマチの在院日数分布が面白いのでは?と前回提案したつもりだったのですが、完全無視ですか・・・

外来受療率(平成23年度 患者調査を基に作成)

何となく、想像通りの結果になりました!!

→きれいなグラフになりましたね!・・・・と言いたいところですが、これはただの棒グラフです。一見、縦軸は度数分布のように見えますが、実際は16%、14%・・・といった割合を表しています。つまり、事象の分布を表しているのではなく、あくまでも比率を年代ごとに比較したグラフで、これは棒グラフでも折れ線グラフでも構わないものです。

 ヒストグラム: データのちらばり具合を示すために使う
 棒グラフ: データの大小を比較するために使う
 折れ線グラフ: 連続的に変化するデータの大小を比較するために使う


前回の課題までは、それぞれの数値をまとめる作業部分も含め、「データ」タブの「データ分析」をクリックしてヒストグラム作成していましたが、今回使用した外来受療率のデータは年齢5歳刻み(0歳、1~4歳までは除く)で人口10万人に対する人数を集計してくれているので、単純に縦棒グラフの作成するだけでヒストグラムになりました。

→単純な棒グラフを作ったので、「データ分析」が要らなかったんですね。残念!!

次回は散布図を作る予定です。

多峰性という形にばかり気を取られてしまったのかもしれませんが、ヒストグラムやりなおしです。