直前の「統計勉強会」を不参加したことにより悪戦苦闘してしまった、前回の “「母平均」の推定”。
<前回のおさらい『社内開催の「統計勉強会」に参加してみた②』>
そして今回は2つのデータを使った “「母平均の差」の推定” でした。
ちなみに今回は休まなかったので大丈夫……なハズです!
「母平均の差」って?
「東京」と「大阪」の平均年収の差は?
上記例題のような2つのエリアの平均値に、違いがあるのかどうかを推定していきます。
今回の演習では「どちらの先生に教れば、テストの点数が上がるのか?」を推定することになりました。
先生にしてみれば、なかなか残酷な推定ですね……w
■テストの点
パッと見た感じでは「教師B」の方が良さそうな感じですが、果たしてこの直感は正しいものなのでしょうか?
次にこれを推定していくことになります。
実際の計算説明
この差を式にしていきます。
左辺の記号は「デルタ」、右辺の記号は「ミュー」というらしいです。
- デルタ:母平均の差
- ミュー:母平均(1、2はそれぞれの集団を表しています)
ただし、まだ母平均が分からないので、標本平均からこれを推定していく必要があります。
式は上記のようなものとなり、この「d」の分布は “正規分布する” らしい。。。
そして上記は “「d」は正規分布する” という式になり、それぞれの変数(文字記号)は以下のような意味を持ちます。
- d:先の式の通り、標本平均の差に当たる
- N:正規分布という意味
- デルタ:先の通りで「母平均の差」
- M:1つ目の集団の標本数
- N:2つ目の集団の標本数
- シグマ:この場合は二乗してるので集団の分散 ※本来は差を取っていくものだが、分散が大きくなってバラつくので和にしているらしい