社内開催の『統計勉強会』に参加してみた

社内開催の『統計勉強会』に参加してみた

現在、ショーケース・ティービーでは有志による勉強会がいくつか開催されています。
<bitWave関連記事『「技術書読書会」ノススメ』>
今回はその中でも一風変わった勉強会についてご紹介させていただきます。

「統計に関する入門勉強会」開催の経緯

その “一風変わった勉強会” とは「統計に関する入門勉強会」です。
ショーケース・ティービーのサービスの中にはコンサルティングが要となるサービスもいくつかあるのですが、当然ながら社内コンサルだけが統計学を習得していればいいというものでもありません。また、開発員も統計学を知っていて “ソン” はない状態ですし、世の中的にもビッグデータの時代ですから、データサイエンティストのニーズは高まる一方。これは今学んでおくべき学問と言えるのではないでしょうか。

自身でも独学で学習を開始していましたが、やはり独学では限界があります。
腑に落ちなかったり、覚えたつもりでもすっかり忘れていることもあったりと、身についていない状態でした。しかし、社内で自発的に社会人数学教室へ通っているメンバーが在籍していたため、彼なりに理解できた知識を社内に還元するという目的で勉強会開催に至ったわけです。非常にありがたい……。

既にこの「統計に関する入門勉強会」は数回開催されています。
回を重ね、R言語を使った形式で進み始めるようになったことで、bitWave上でも紹介しやすい内容になってきました。
今回の紹介内容は「Rに慣れましょう」という感じではありますが、“統計” に関する知識を必要とされる方の背中を押せる記事であることを祈るばかりです。

基礎計算:その1「基礎的な足し引き算やsin関数を試してみた」

これまで私はR言語を使ったことがなかったのですが、意外に記述が少なく、非常に便利な言語であるという印象を受けました。
今回の学習用に専用の環境を「Jupyter」に用意しています。

最初は基本的な足し算や引き算、sin関数に値を入れて、結果を確認という初歩的なところからスタートしています。

基礎計算:その2「ベクトル(配列)を試してみた」

次はベクトルを用意しました。
プログラマーの方であれば、「配列」と言った方がしっくりくるかもしれませんね。

代入が「=」ではないのが少し印象的でした。

基礎計算:その3「代表値を試してみた」

代表値(平均値、中央値、最頻値)を出してみました。

足し算や引き算、sin関数といった基礎的なものだけでなく、これなら標準偏差や分散、四分位数なんかでもカンタンに出すことができますね。

基礎計算:その4「CSVファイルから描画してみた」

少しばかり応用編を。
予め用意したCSVファイルを読み込み、それを描画してみました。

ご覧の通り、カンタンに読み込むことに成功しました。

また、二次元とはなっていますが、下図のように代表値なんかも出すことができます。

該当データの「平均気温」のヒストグラムを容易に出すこともできますね。

【週刊bitWave】(メルマガ)始めました!
登録はこちらからメールアドレスを入力してお申込みください。

ご登録いただいたメールアドレスは 【週刊bitWave】の更新情報の配信にのみ使用します。

個人情報の取扱いに関しては、「プライバシーポリシー」をご確認ください。解除はいつでこちらから行うことが可能です。

あなたにおすすめ

社内開催の『統計勉強会』に参加してみた⑦... 3回連続の「検定」についてのお話になります。 <前回のおさらい『社内開催の「統計勉強会」に参加してみた⑥』> 今回は “母平均の差” の「検定」についてご紹介いたします。 早速例題 突然ですが問題です。 ...
社内開催の『統計勉強会』に参加してみた⑥... 前回に引き続き、今回も『検定』について。 前回は出題をしたところで記事を終えておりますので、今回は前回の復習とその出題に対しての計算を行います。 <前回のおさらい『社内開催の「統計勉強会」に参加してみた⑤』> 前回の出題...
社内開催の『統計勉強会』に参加してみた⑤... 前回の予告どおり、今回のテーマは『検定』です。 <前回のおさらい『社内開催の「統計勉強会」に参加してみた④』> 『検定』とは? 『検定』……。勉強会ではなく、ついに試験なのか……と思われた方、ちょっと気が早いです! 『検定』...
社内開催の『統計勉強会』に参加してみた④... 前回に引き続き、今回も「母平均の差」でした。 <前回のおさらい『社内開催の「統計勉強会」に参加してみた③』> 通常算出に用いられる「student(スチューデント)の推定」や「welch(ウェルチ)の推定」とは異なり、より精度の高い...