久しぶりに「統計勉強会」に参加してきました。
<前回のおさらい『社内開催の「統計勉強会」に参加してみた』>
「統計勉強会」の開催自体が2週間ぶりとなっており、私自身がさらにその前の週に休んだことで、3週間ぶりの参加。
私が不参加だった前回は、どうやら「推定について」だったようです。
今回は前回の復習も冒頭で行われたのですが、すでに苦戦気味。。。
今回のbitWaveでは、私が不参加ゆえに苦戦した “推定の基本” についてご紹介いたします。
そもそも「推定」とは?
統計学では「推定」を一言で言うと、標本データから母集団の “何か?” を予測していくことを意味しているようです。
ここで言う “何か?” とは様々なケースがあり、例えば母集団の以下のようなものが対象となります。
- 平均
- 分散 etc..
つまり、こういった “何か?” を標本データを使って予測していくことが「推定」なのです。
また、「推定」もいくつか種類があるようです。
- 点推定 →母集団の値を1つ確定する(今回の勉強会ではやらず)
- 区間推定 →母集団の値を範囲で導き出す
つまり、今回の勉強会のテーマは『区間推定』です。
『区間推定』では、推定結果は以下のような範囲で示されることになります。
90 <= 母平均 <= 110 (95%)
これは “「母平均」が90~110の間に95%の信頼度で存在する” ということを意味しているらしいです。
果たして今回の勉強会の内容についていけるのか……。
中心極限定理
『区間推定』を行う上で、必要となる数式があります。
これは “どんな分布でもその標本データの平均は正規分布する” ということを意味しています。