とげまる日記

九州の大学で数学の博士課程に通ってます。自分の日記として使っています。

二項検定を具体例で考えてみた

初めましてPandaです!

先日大学の同期とテニスの試合をしたのですが、結果として7勝1敗で私の圧勝となりました。

嬉しかった私は「俺の方が強かったね」と同期に言ったのですが、彼は「まだサンプル数が少ないから本当に強いかどうか分からない」と負けを認めませんでした。

何としてでも自分が強いことを示したかった私は、二項検定を用いて数学的に私の強さを証明することにしました。

まず問題設定から。 X: Pandaの勝利数を表す確率変数, p: Pandaの勝つ確率. この時立てる仮説は

H_0: p=0.5,  H_1: p=0.7.

この時臨界値kを計算する。

 P(X\geq k |n=8, p=0.5) < 0.95となる最小のkは

 P(X\geq k |n=8, p=0.5)= \sum_{i=1}^{8} \binom{8}{i} p^{i} (1-p)^{8-i} < 0.95

を計算するとk=6であることがわかる. つまり私が6回以上勝つと帰無仮説を棄却できる。今回は7回勝ったので p=0.7を採択できた。

次にこの検定の信頼性を調べるために検出力を計算する。検出力とは帰無仮説が正しくないときに帰無仮説を棄却できる確率である。

 Power = 1 - P(X&lt;5 | n=8, p=0.5) \fallingdotseq 0.552.

以上の結果から残念ながら現時点でのサンプル数では検出力が0.552であり、多くの場合検出力として設定される0.8に遠く及ばない。

そのため今後有意に私の方が強いと示せるようにテニスの試合数を増やし勝利数を増やしていきたいと考えている。