統計学を学ぶ

頑張りやさんのがるたろう
立派なトラになるために
日々学んでいます
今日は何を学ぶのでしょうか

今日はポカポカで気持ちいいなあ!
ひさびさにシバ先生のところ楽しみだ!

カタカタカタ

さて、そろそろがるたろうくんが来るころかな。
仕事を仕上げてしまいましょう。


シバ先生はポメラステッド研究所ではたらく研究者
がるたろうはシバ先生から学問を教わっています

・・・ウロウロ・・・

あら、がるちゃん。どうしたの?

あっ、ラビさんこんにちは!

今日からシバ先生に「統計学」を教わる約束してて!

トウケイガク!
がるちゃんは相変わらず勉強熱心でえらいわね!

シバ先生は部屋にいるわ。
ちょうどお仕事終わる頃だと思うわよ。

ありがとうございます!

コンコン!

シバ先生こんにちは!!
今日から統計学を学びにきました!

やあ、がるたろうくん。お待ちしておりました。
変わらず元気そうですね。

今日から統計学ですね。
しっかり学んでいきましょうか!

はい!よろしくお願いします!

お飲みもの置いておきますね〜。

わあ、ありがとうございます!
ラビさんのバナナジュース大好き!

さて、まずはじめに
がるたろうくんが統計学に興味をもった
きっかけを聞かせてもらえますか?

むかしお父さんが言ってたんです、
「統計学はおもしろい」って!

そのとき「データを見るんだ、見ないためにな」
って言ってて、、

それがどういうことなのか、ずっと気になってたんです。

ガルぞう、あいつらしい表現だなあ。

統計学を学んでいけば、
何を言っていたのかわかりますよ。

やっと謎が解けるんですね!
しっかり学びたいと思います!

本日は統計学の概要と
これからの学習手順をお話しますね。

よろしくお願いします!

統計学の概要

データを現実の問題解決に役立てる
これが統計学の中心となるテーマです。

統計学が活用されている具体例をいくつか見て、イメージをつかみましょう。

予測

回転寿司「江戸前カワウソ」では、
いつ、どの寿司のネタを、どれだけレーンにのせるべきか?という問題に統計学を活用しています。

えっあの美味しいお寿司屋さんが統計学を!?

もともとは職人のカンに任せてレーンに流すネタを決めていたそうですが、お客さんに食べられず、けっきょく廃棄してしまう、という問題がけっこうあったようです。

もったいないですね、、、あんな美味しいお寿司が。

そこで、曜日、時間帯、客の年齢層、性別、といった、様々な切り口から過去のデータを分析して、状況に応じて求められる寿司ネタの傾向を探りました。

そして、過去のデータにもとづき、いまどの寿司ネタがどれだけ求められているか予測する仕組みをつくったのです。

これで職人さんは握りに集中することができ、廃棄が減って、売上も大幅にアップとなりました。

スゴイ!そんなことができるんですか!

過去のデータにもとづき将来を予測することは、生産計画、まちづくり、防災対策、リスク管理、レコメンドサービスの提供など、さまざまな場面で必要になっています。

シバ先生の補足
  • 統計学基礎編では予測の基礎となるモデルパラメータ推定を学びます
  • データを使った予測は近年脚光を浴びている機械学習という分野でも中心となるテーマです。
  • 統計学と機械学習は異なる目的で別々に発展しましたが、方法論としては共通する考えが非常に多いので、統計学を学ぶことで機械学習も理解しやすくなります。

判断

インフルエンザ治療の画期的新薬の開発で話題になった「シュレイティンガー製薬」の事例をみてみましょう。

先週ニュースになっていましたね!
ここでも統計学が出てくるんですか?

薬は健康に関わるため、「本当に効果があるのか」を慎重に判断する必要があります。最終的には国が承認しますが、この判断に統計学が使われます。

どうすれば効果があると言えるでしょうか。
いくら開発者が「効果がある!」と主張しても、客観的証拠がないと、受け付けられません。

みんなを納得させないといけないんですね

そこで客観性のあるデータに基づいた判断をします。統計学はデータの取得から判断まで、客観的な手続きを提供しています。

統計学による判断手続きを省略することは認められていません。私たちが安心してお薬が飲めるのは、統計学のおかげなのです。

統計学が僕たちの健康も支えてたんですね!

シバ先生の補足
  • 適切な効果比較ができるように試験方法を工夫しデータを得る一連の取り組みは、ランダム化比較試験と呼ばれます。薬の効果は個体差があるため、個々の結果で判断せず集団全体で見たときの効果を見ます。比較するために2つの同じような集団をつくりますが、その際にくじ引きに似た方法が使われます。
  • 判断の手続きは、仮説検定と呼ばれる手法が使われています。統計学の基礎編で詳しく学びます。

新薬開発におけるデータを使った判断と同様の方法が、勢いのあるインターネット系ベンチャーでも応用されています。

例えばスマホアプリの新機能やデザインにA案とB案があるとき、両方つくってみて、ユーザーに使ってもらいます。ユーザーの反応に関するデータを収集・分析し、売上向上に効果があると判断された案を正式に採用します。

担当者の思い込みではない、データによる客観的な判断を高速に大量に繰り返してサービスを改善していくのです。マーケティングの世界でA/Bテストと呼ばれています。

昨年大流行した物々交換アプリのベンチャー「ラビオリ」は年に1000回A/B テストを実施したようです。

あのアプリ、僕も使ってます!あの使いやすいサービスのウラには統計学があったんですね!

データをうまく使って、予測や判断など、現実の問題解決に役立てる統計学の事例をいくつか見てきました。

データを使うことで色んなことができるんですね!

データは大変役に立ちますが、やっかいな「クセ」があります。このクセを理解せずになんとなくデータを使っていると間違った結論になる可能性が高くなります。

データにもクセってあるんですね

統計学ではデータのクセとその対処法を学べます。データを正しく読んで、正しく使うことができるようになるのです。

データを現実の問題解決に役立てることの重要性は、学問やビジネスでどんどん高まっています。統計学を学びデータを正しく扱えるようにすることは今後必ず役にたつでしょう。

色々なところで活躍できそうでワクワクしてきました!
僕も統計学をマスターしたいです!!

学習ステップ

それでは学習の道筋をみていきましょう!

統計学の基礎編は以下の3ステップで学んでいきます。

スタート!
ステップ1
データを理解する
データを使うためにはまずは手元のデータを理解することが出発点です。グラフで目で確認したり、データを少数の値にサマリーすることで理解する手法を学びます。
ステップ2
データから離れる
データを使うためにはいったんデータから離れる必要があります。モデルという現実の問題に立ち向かう強力な武器を手に入れます。 
ステップ3
データを使う
いよいよデータを使って現実の予測や判断に役立てます。統計学の基礎である推定と仮説検定をマスターします。
ゴール!

ステップ2の「データから離れる」というのがなんか独特な気がしますね。

このステップが大変重要になります。ここをマスターすると、お父さんの言っていた「データを見るのはデータを見ないため」という意味がわかるでしょう。

ほんとですか!学ぶのが楽しみです!

まとめ

さて、今日はここまでにしておきましょうか。
統計学の概要と今後の学習手順をお話しました。

統計学が様々な場面で使われてることがわかりました!
しっかり学びたいと思います!

がるたろうはこれから
統計学を学んでいくようです
頑張れ!

ことらノート
  • データを現実の問題解決に役立てることが統計学の中心テーマ。お寿司屋さん、お薬、スマホアプリ、僕の身近なところでも統計学が使われていた。データを使った予測や判断は他にもたくさんの場面で使われているようだ。
  • データは「クセ」があるみたいだ。クセを理解しないままデータを使うと間違う可能性が高くなるらしい(怖い)!データのクセとその適切な扱い方を統計学で学べるようだ。
  • データを使うためには、データを理解することがまず大事。そしてデータから離れる必要があるようだ。これは何を意味するかは今はわからないけどお父さんの言っていたことがわかるようだからしっかり学んでいきたい!