読書録 いまさら誰にも聞けない医学統計の基礎のキソ1
いまさら誰にも聞けない医学統計の基礎のキソ1
まずあるグループAと、別グループBとの間に、差がないと仮定する。
この「グループ間に差がない」とするのが、帰無仮説である。
このあたり、正直ややっこしい。帰無仮説というのは「差がない」と同時に「個体差しかない」「偶然できた差しかない」という意味を持つ。
帰無仮説(null hypothesis)は別名ゼロ仮説ともいい、僕のイメージでは、「懐疑主義」的な態度をまず取るという感じに見える。
その帰無仮説にもとづき、本当に差がないといえるかを調べる統計検定法を、仮説検定と言う。
この本は「医療統計」にもとづいているので、新薬と従来薬に差があるかどうか、みたいな検査をしたいときを想定しているので、まさに「新しい区別か、それとも大した区別ではないか?」を検定したいときに役に立つだろう。
さて、この帰無仮説は確率で表されるが、それがP値だ。
このP値が(一般に)5%より低いなら、それは差があると考えるのが妥当だろう──と考えるのが、仮説検定である
グループ間に差がある確率(%) = 100% - 帰無仮説が正しい確率(%)
差があるとする確率が95%以上であれば、信頼性が高いといなる。
グループ間に、有意な差があると表現する。
有意差あり・なしの判定する基準は、しばしば0.05だったり0.01であったりするので、それを有意水準と呼ぶ。
ここで重要なのは、
仮説検定では、グループ間の差の程度は求められない
ということだ。
本書では「非常な大きな有意差があった」という表現を戒めている。
P値を見ても、差の程度は分からない。
グループ間の差は信頼区間で
真の差がどの辺にあるのかは、信頼区間(confidence interval)で求める。
差の程度は信頼区間で求める
信頼区間とは……
得られたグループ間の差がどれくらい大きくなったり、小さくなったりする可能性があるかを示す。
仮に95%という数字であったら
95%の確率で「真の差」を含む値の範囲を示す。
例えば40%の確率で真の差は12.7-12.9cmのどこかにあります
これだと真の差がどこにあるか微妙だ。
だからもっと確率を高めて
95%の確率で真の差は12.4-13.2cmのどこかにあります。
となると、うーん、たぶん8センチとかではまずないなぁと確信を持てるようになる。
一般には95%信頼区間を用いられるのが慣例。