〔質問〕仮説検定の範囲で、対立仮説と帰無仮説という語句を習いましたが、それぞれどういうものなのか教えてほしいです。 |
〔回答〕品質調査やアンケートを行った際、その結果についてどういう判断を下すべきかが問題となります。 例えば、アンケートで「70%の人が『はい』」と答えたとき、ふつうは単に「『はい』が多い」くらいで処理すると思いますが、 要は、そもそも一部分のデータにすぎないアンケート結果をそのまま信じていいのかどうかという話です。 このときの「実態は50%」という、(ふつうは)却下したい・そうでなかって欲しいと思うものが「帰無仮説」で、 |
〔詳細〕
そもそもの話として、一番正確なのは「全員を調査する」ことです。
例えば10,000人全員にアンケートを取れば正確なデータが得られます。
ただ、それはあまり現実的でないため数人に限り、しかもふつうは1回(~数回)のアンケートしかとれません。
そういう事情の下で、例えば「7人が『はい』、3人が『いいえ』」のアンケート結果が得られたときに、
(1)「本当は7,000人が『はい』、残り3,000人が『いいえ』」で、アンケートとしても「7人が『はい』、3人が『いいえ』」だった。
(2)「本当は5,000人が『はい』、残り5,000人が『いいえ』」で、アンケートとしては「7人が『はい』、3人が『いいえ』」だった。(不覚にもアンケートの対象者に偏りがあった)
みたいなパターンがいくらでも考えられるわけです。
たしかに (2) のようなケースは「たまには」起こってしまうわけです。
ただ、アンケートを何回もするわけにもいきませんので、その「たまには」がどれくらいのものなのかを、コイントスなど(← 実際の問題で与えられているもの)で代わりに実験してみるわけです。
実験の結果、例えば「(確率が1/2の下で10枚中7枚が表になることは)100回に5回くらいは起こること」というのを得たとすると、アンケート結果としても (2) になることは「アンケート100回につき5回くらいは起こること」というように考えることができます。
この「100回に5回」が頻度として少ない(=事故みたいなもの)と考えるなら、アンケート結果が (2) パターンだったとは考えづらい(つまり、ふつうに実態としても『はい』が多い」)と結論付ければいいですし、
「100回に5回」が頻度として高い(「100回に5回も起こりうるのか!」)と考えるなら、アンケート結果は (2) パターンだった可能性もある、と考えることになります。
(※ 実際の問題で「基準となる確率」として与えられているものとの比較)
※ 理解を優先するために、あえて大雑把に書いてある場合があります |
---|
アンケートへのご協力をお願いします(所要2~3分) |
---|
「将来設計・進路」に関するアンケートを実施しています。ご協力いただける方はこちらよりお願いします (Googleフォームにアクセスします) |