Press "Enter" to skip to content

[Review]数学ガールの秘密ノート/やさしい統計

数学ガールの秘密ノート/やさしい統計 (数学ガールの秘密ノートシリーズ)

数学ガールの秘密ノート/やさしい統計

目次
第1章 グラフのトリック
第2章 平らに均す平均
第3章 偏差値の驚き
第4章 コインを10回投げたとき
第5章 投げたコインの正体は

「数学ガール」シリーズの、スピンオフ本です。
本書は、統計の初歩〜中級を扱っています。

古代から現代まで、主張を強引に通したい人は、
自分に都合のいいようにデータを見せる傾向があります。

たとえば、現代日本の多くのメディアは、
結婚したら「マイホーム+車+子供+旅行」というセットを、「普通の家族」のあかしのように演出する傾向があります。
大きな買い物をたくさんしてほしいからです。

そしてたしかに、そうした「普通の家族」の割合が多い時代もありました。
統計データを集める時期を1970〜1990年代くらいに限定すれば、そういう結果になるでしょう。

けれど、歴史的に見れば、
そのような裕福な「普通の家族」を、普通の庶民が実現できた時代は、非常に短いのです。
スパンを拡げて、100年前から現在までのデータを集めれば、そのことがハッキリするはずです。

けれども、「普通の家族」を演出したい人は、そのような長いスパンではデータを切り取りませんし、グラフにもしません。
自分の主張に都合のいいデータが残るスパンだけを切り取り、容姿端麗なタレントにラッピングしてもらって、ネット広告や街のポスターで私たちの目の前に差し出すのです。

ただし、それは決して「許されないこと」ではないのが、統計の難しいところです。
なぜなら「データ自体は間違っていない」からです。あくまでも「見せ方」を変えただけなのです。

ですから今後も、そうした「都合のいい演出」が消えてなくなることはないでしょう。
(100年後にも残っていると思いますし、AIがそうした手法を真似る可能性すらありますね)
だからこそ私たちは、統計のトリックを知り、備えておく必要があります。

本書の第1章・第2章では、そうした統計トリックの数々を解説してくれています。
メッタ切りの爽快感があります。
しかも第2章までは、中学生にも分かる数学で構成されているので、長いあいだ数学に触れてこなかった人でも、簡単に理解できるでしょう。

また、そうした統計トリックを知っていれば、
自分の文章でデータを演出するときにも役に立ちます。
罪のない範囲で、どのようにすれば効果的に主張を通すことができるのか。
逆に、どのような演出は、読み手に不信感を与えてしまうのか。

データを背景とした主張を展開するときに役に立ちます。

第3章では、偏差が登場します。
偏差をきちんと理解するということは、分散を理解するということです。
この分散の理解によって、
あるデータの特徴を見るには平均値だけでは足りない、ということが理解できます。

たとえば平均50点のクラスがあったとします。
何も知らない人が平均点だけを見れば、良くも悪くもないクラスだと感じるかもしれません。
けれど実は、0点と100点が半分ずついるのかもしれません。
つまり、極端に2極化しているクラスです。

平均50点だけを見ていると、そのことが分かりません。

データ全体が平均からどれくらい乖離しているか、その度合いを出すのが分散や標準偏差です。
メディアの偏向報道を見抜くときにも威力を発揮します。

たとえば、
ある会社の全社員の平均年収が公務員並だと募集要項に示されていたとしても、それだけを信じて入社するのは危険です。
給与格差の大きい、極端に2極化した社会かもしれないからです。

これは私が実際に見聞きした例ですが、
人手不足にあえいでいる会社は、たまにこの手法で人集めをすることがあります。
入社直後だけは、新入社員にしてはそこそこ多い給与を払っておいて、その後20年以上ほとんど昇給しない仕組みにするのです。そして、上層部の人間たちだけに高い給与を支払えば、あら不思議、平均年収の高い会社の出来上がりです。

世の中に出回っている企画書や稟議書など、ありとあらゆる文章で平均値のトリックは使われます。
平均は使いやすいからです。
でも、分散や偏差の考え方を知っていれば、その平均値が本当に意味のある数値なのかを判断できるようになります。

私たちはビジネス文章を書く前に、
様々なデータを集めて、自分の主張に織り込むことがよくあります。
そういうとき、データの良し悪しを判断するためにも、分散や偏差が強力な武器になります。

第4章では、期待値が登場します。
この概念を理解すると、宝くじがいかに無謀な賭けであるかが理解できて、有益です。
(計算すれば、競馬は意外にも割のいい賭けであることも理解できるでしょう。単勝賭けの場合ですが)

そして第5章では、期待値から確率分布へと発展し、正規分布や仮説検定という、統計で重要な概念が登場します。
これらは、ビジネスパーソンならば是非とも知っておいたほうがいいでしょう。
概念だけでも理解しておけば、ネットで出回っている健康情報などのソースを辿って、元の論文の意味が理解しやすくなります。

科学の世界では、仮説を立てて、その仮説の「起こりやすさの度合い」を検定することがよくあります。
「有意水準」という言葉をどこかで聞いたことがあるかもしれませんが、その意味を正確に理解しておけば、健康情報の信頼度を自分なりに判断しやくなるでしょう。

統計は法律に似ています。
知らなければ騙されてしまうことがあるからです。
そしてどちらも、すべての情報は無料で公開されているので、知らない人のほうが悪いと言われることさえあります。

たとえば、
期待値や正規分布の考え方を知らないばかりに、必要のない生命保険プランに加入させられてしまうこともあります。
それだけで生涯に何百万円も損をしてしまったとしても、きちんと考えなかったほうが悪い、自己責任だ、と言われてしまうのです。

私たちは、自分で人生の選択を行うようになったあとで、60年以上も生きます。
(20代で親元から独立するとすれば)
その長い年月で、一体いくつの決断を下さなければならないのでしょうか。

統計は間違いなく、人生のそこかしこで、賢い決断をする助けになります。

そして本書は、その賢い決断の(いしずえ)になる内容です。
とりわけ1章2章は、数ある統計本の中でも無類の分かりやすさでしょう!
私は中学生のときに読みたかったです。

数学ガールの秘密ノート/やさしい統計 (数学ガールの秘密ノートシリーズ)