〔質問〕 データの最大値から最小値の差から判断する散らばり度合いの大きさと、四分位範囲から判断する散らばり度合いの大きさの違いはなんですか? |
〔回答〕 ポイントとしては「例外的なデータの扱い」と考えてください。 一般に、データを集めると「例外的なもの」が混ざることが多々あります。 例えば、比較的低身長な人が多いクラスで、一人だけ高身長な人がいたときに、全データで考えるとクラスの特徴を読み違えてしまう危険性があります。特に散らばりを「最大値-最小値」で捉える場合は顕著です。計算するのが楽というメリットはありますが… (低身長に偏っているはずなのに、散らばりが大きいことになってしまう) それよりは、例外的なものを除いた「平均的なもの」を考えた方が、グループの特徴をより正しく捉えることができます。これが四分位偏差を考えるメリットです(真ん中の半数のデータを扱っている) ただ、散らばりを捉えるにはこれでもまだ雑ですので、通常は「分散」または「標準偏差」を計算します。 |
アンケートへのご協力をお願いします(所要2~3分) |
---|
「将来設計・進路」に関するアンケートを実施しています。ご協力いただける方はこちらよりお願いします (Googleフォームにアクセスします) |