記事は間違っていないし、その基の報告書も間違っていない。しかし、実感と異なるのは、データ処理のマジックかもしれない。このマジックを悪用すれば(決して悪意はなくても)騙すこともできる。⇒中小規模の療養型病院はV字回復どころか厳しいまま から引用
主食はおにぎり以外食べてはいけないという謎の「おにぎりダイエット」の効果を検証した。5人が1月におにぎりダイエットをスタートさせ、半年後、また体重を計った。その結果が下のものだ。(言うまでもないと思うが、おにぎりダイエットも、データも、全部空想だ)
おにぎりダイエットは失敗! まぁ当然か。低炭水化物ダイエットが流行っている時代の流れに完全に逆行しているし・・・(ま、完全に空想のシナリオ・データなので、どうでもいいのだが)。
しかし、標準体重(この場合は全員共通で58kgだったとしている)を下回っているか否かで判断してみた。
なんと、おにぎりダイエット後の方が標準体重以内の人が増えている。おにぎりダイエット成功!?
基準値を超えるか否かという指標を作れば、ちょっとした値の変動で、超えたり超えなかったりする。そのため、100人が100人、全員同じ変化をしていれば判断に困らないが、ばらばらに変化していれば、集団の傾向を評価することは困難になるケースもあると認識しておくべきだろう。
おにぎりダイエットを適切に評価するには、ヒストグラムでの比較や、散布図で見るのが望ましいだろう。下の散布図は、横軸に1月、縦軸に6月として5人をプロットしたものだ。
赤の点線は1月と6月が同じ体重だったことを示している。赤点線より上にあれば6月に体重が増えた人、下にあれば減った人を意味している。3人は体重が増え、1人は体重が減った。おにぎりダイエットは体重減少にあまり意味はなさそうだ。特に65kg以上の人はふたりとも体重が増えてしまった・・・といったように、適切な評価をすることができる。
すなわち、療養型病院の黒字か否かを見た「黒字病院比率」は、おにぎりダイエットの標準体重以下比率みたいなもので、微妙な評価になっている可能性が否定できない。平均値も外れ値などの影響を受けやすい。理想はヒストグラムや散布図で見るべき、と言えるだろう。
読み手を騙すことも可能だし、都合のいいデータを作ることも可能だ。騙されないように、読み手側もこういった分析を理解するスキルを身に着けなければならないと言えるのかもしれない。