算数解説
平均・最頻値・中央値の違いと代表値の求め方|算数クイズ対策
3つの代表値
| 代表値 | 説明 | 計算方法 |
|---|---|---|
| 平均値(へいきんち) | 全データの合計を個数で割った値 | 合計÷個数 |
| 最頻値(さいひんち・モード) | 最も多く現れる値 | 一番頻度が高い値 |
| 中央値(ちゅうおうち・メジアン) | データを順番に並べた中央の値 | 奇数個:真ん中の値 / 偶数個:中央2つの平均 |
例題で確認
テストの点数:40, 55, 60, 70, 70, 80, 90
- 平均値=(40+55+60+70+70+80+90)÷7=465÷7=約66.4点
- 最頻値=70点(最も多く現れる)
- 中央値=70点(7個中4番目)
✅ 外れ値の影響
極端に大きい/小さい値(外れ値)があるとき、平均値は影響を受けるが中央値は影響を受けにくい。実社会では中央値の方が実態を反映することがある。
極端に大きい/小さい値(外れ値)があるとき、平均値は影響を受けるが中央値は影響を受けにくい。実社会では中央値の方が実態を反映することがある。
範囲・散らばりの指標
- 範囲(レンジ)=最大値−最小値
- 四分位範囲=第3四分位数−第1四分位数
ヒストグラム
データを区間(階級)ごとに棒グラフで表した図。横軸が階級、縦軸が度数(人数・個数)を表します。
⚠ 棒グラフとヒストグラムは違う
棒グラフは各項目を独立した棒で表す。ヒストグラムは連続するデータを区間に区切って表す(棒の間に隙間なし)。
棒グラフは各項目を独立した棒で表す。ヒストグラムは連続するデータを区間に区切って表す(棒の間に隙間なし)。
代表値の比較と使い分け
| 代表値 | 定義 | 向いているデータ |
|---|---|---|
| 平均値 | すべての値の合計÷個数 | 外れ値が少ない均質なデータ |
| 中央値(メジアン) | 並べたとき中央の値 | 外れ値がある(平均が歪む)データ |
| 最頻値(モード) | 最も多く現れる値 | カテゴリーデータ・流行調査 |
例:給与のデータで一部の高給取りがいる場合、平均は高くなるが中央値は実態に近い。
度数分布表とヒストグラム
- 階級:データをいくつかの区間に分けたもの(例:60点以上70点未満)
- 度数:各階級に入るデータの個数
- 相対度数:度数÷総数(割合で比較できる)
- 累積度数:ある階級までの度数の合計
✅ 中央値の求め方(度数分布表)
データが偶数個の場合、中央の2つの値の平均。度数分布表の場合は累積度数が50%になる階級を探す。
データが偶数個の場合、中央の2つの値の平均。度数分布表の場合は累積度数が50%になる階級を探す。
範囲と四分位範囲
範囲(レンジ):最大値−最小値。データのばらつきの簡単な指標。
四分位数:データを4等分する3つの値。Q1(第1四分位)・Q2(中央値)・Q3(第3四分位)。
四分位範囲:Q3−Q1。中央の50%のデータのばらつきを表す。外れ値の影響を受けにくい。箱ひげ図で視覚化できる。
データの活用と標本調査
全数調査:対象全部を調べる(例:国勢調査)。費用・時間がかかる。
標本調査:一部のみを調べ全体を推定する(例:視聴率・品質検査)。
- 母集団:調査の対象全体
- 標本:調査した一部
- 無作為抽出:偏りなく標本を選ぶ方法(乱数表・くじ引き)
推定の例:池の魚を100匹捕まえて印をつけて戻す。次に80匹捕まえると印ありが4匹→池の魚の総数≒100×80÷4=2000匹と推定できる。
統計の試験対策まとめ
度数分布表の読み取り:「40点以上50点未満の生徒が8人、合計40人のクラス」→相対度数=8÷40=0.2=20%。中央値の求め方:40人なら20番目と21番目の平均。箱ひげ図の読み方:箱の左端がQ1(第1四分位数)、箱の中の線がQ2(中央値)、箱の右端がQ3(第3四分位数)。ひげの両端が最小値・最大値。外れ値は別途●で表示。2つのグループを比較するとき「平均値が同じでもばらつき(四分位範囲)が違う」ことがあるため、代表値だけでなくばらつきも確認することが重要。