統計学的思考(ちょっと大げさ!)のすすめ

 このところアイルランドは、北海に張り出した高気圧のお陰で、晴天続きです。 あとまだ3・4日続くそうです。 快適です。 でも、朝晩の気温は、3-4度ぐらいにまで低下してます。 
 
 去年、このブログを休止していた時、たしか9時のニュースの中だったか、統計学がブームになっている、というものがありました。 ホントにそうであればいいなあ、と思ってましたが、私も、このブログで、そのことをずっと以前から書きたいと思っていました。
 
 また、先日、NHKのプロフェッショナル・仕事の流儀という番組で、ユニバーサル・スタジオ・ジャパンのジェネラルマネージャーのような方が、統計の数式を駆使したマーケティング方式を採用している場面があり、そこで、まあいい機会だと思い、今ここに書くことにしました。
 
 と言っても、学生時代の勉強と、仕事で少し使ったというだけで、この私は、特に統計学をよく知っているというワケでもありませんし、現役を離れて20年近くなり、数式や細かい理論などは忘れましたが、物事をより客観的に見るとか、科学的に考えるとかいう場合に、この学問は非常に有意義である、と私は思っています。
 
 もし、算数や数学の授業の時に、この統計学的な考えが全然分からなかったという人のために、ホンの少しでもという気持ちですが、もちろん、この私が書くことですから、初歩のレベルのことしか書けませんので、どうかご了承をお願いしたいのと、よくご存知の方は、私の書くことなど無視してください、また、間違いがあったら、どうぞ指摘してください。 (ただし、言葉や数字は、分かりやすく簡便にしていきますがーーー。)
 
 さて、統計学と言っても、結構、幅は広いです。 で、一番入りやすい所からでいきますと、
 
① 平均値 と 標準偏差 です。
 
 例えば、よく出てくる日本人の平均身長は、高校3年生男子で、今は、171cmぐらいですかね。 この数字、実は、ここ40年ぐらいあまり変わってないのですよ。 私の高校時代の少し前でもほぼ同じでした。 だから、今、芸能界では、背の高い人が多いと、もし感じている人がいるなら、それは、そこに背の高い人たちが、集まる傾向がより強くなっただけのことを勘違いしているのである、と言えるでしょう。
 
 で、この日本人の平均身長のバラツキを示す数字が、標準偏差(SD)です。 この場合、戦後から現在までの日本人の身長では、このSDは、約5.5cmです。 で、その理論ややり方は、省きますが、平均値からこの標準偏差(±)の間の数値は、全体の集団の数の約70%(前後35%ずつ)占め、まあ、だいたい常識的な範囲の数字だということです。
 で、この場合では、
    171.0cm±5.5cm ⇒ 165.5cm ~ 176.5cm つまり、この範囲の身長の人は、まあまあ日本人では、平均的ということです。 
 
 そこで、ちなみに先ほど出した芸能人の身長は、どうなのか? 昔は、石原裕次郎は、高身長の代表でした。 今は、いっぱいいるけど、まあ、大河の母里太兵衛役の速水もこみちに出てもらいましょう。 ウィキペディアでは、裕ちゃんの身長は、183cm、もこみちは、186cmとなってます。 でも、芸能人は年齢や身長、そして出自など、サバ読むのが当たり前なので、これはニワカには信用できません。 特に、裕ちゃんは、高くても180cmぐらいでしょう。 もこみちの場合は、かなり正確に申告しているようですが、まあ185cmにしておきましょう。
 
 で、ここからですが、裕ちゃんが18歳頃の時代の日本人の平均身長は、163cmほどです。 この時代の標準偏差(SD)は、上記のとおり、やはり約5.5cmです。
 
 裕ちゃんの時代: 163 ± 5.5 ⇒ 157.5 ~ 168.5 これが、当維の平均的な身長です。
次に、この標準偏差の2倍の値は、全体の約95%の数をカバーします。
 
 つまり、 163±5.5×2  ⇒ 152 ~ 174 この範囲の身長の人は、全体の95%を占めるということです。 で、身長の高い方だけ見ると、裕ちゃんの場合、これよりもはみ出しています。 つまり、高身長の上位2.5%以内に入っているというわけです。 
 
 さらに、お気づきかと思いますけど、標準偏差の3倍を足した数値よりも、裕ちゃんは、背が高い。 この場合、1%未満でしたが、正確な数値は忘れました。 
 
 で、もこみちの場合(185cm)は、 171 ± 5.5×2 ⇒ 160 ~ 182 と、標準偏差の2倍の数値よりも、やはり高いですね。 でも、3倍値よりは、低いみたいです。 
 
 ということで、今と昔の背の高い芸能人の相対的な高さを比べましたが、この場合は、裕ちゃんの方が、周りより一段高かったということになります。(最も、最初の設定値の正確さが問題ですけど)
 
 で、外国に住んでいる私は、外国人の身長もよく気になるところですが、アイルランド人では、男子の平均は、175cmぐらいです。 イギリス人やアメリカ人もだいたい同じで、175か6cm程度です。 今は便利な時代で、このアメリカ人の身長の標準偏差を調べてみたら、約7.5センチというのがありました。 
 実は、移民の国なので、もっとこの偏差が大きいものであると思っていましたが、それほどでもない印象です。 
 で、アメリカ人としては、 175± 7.5 ⇒ 167.5 ~ 182.5 ぐらいは平均的な身長ということですね。
 
 私も、実際、アイルランドにいて、こちらでは、185cmを超えると平均よりまあちょっと高いなあという感じで、明らかに背が高いと周りから思われるのには、188cm以上でないと難しいです。 私なんか、全くの平均身長範囲ですが、体重では、さらに、軽量級になると思います。(ただし、体重は、身長のようにキレイな分布にならないようなので、この標準偏差などは、あまり有効ではないでしょう。 とくに昨今の肥満ブーム?の時代には、そうでしょう!)
 
 また、平均身長が、180センチを超えるオランダなどは、どんなもんなんでしょう? そう思うと、オランダのサッカー代表メンバーは、どれも平均的な身長という感じですね、彼の国では。
 
② 偏差値
 
 大学入試などで使われる偏差値のやり方では、平均値を50とし、標準偏差を10としています。 つまり、受験生の中で、まったく平均的な学力の生徒の数値を偏差値50とし、偏差値40 ~ 60 の範囲の生徒たちは、全体の70%の範囲内にあるということです。 
 
 で、東大は、どの学部も大体偏差値70前後ですが、これは、標準偏差の2倍ですから、さっきの裕ちゃんのところで言ったように、全体中で上位2.5%以内に入れば、合格がかなうという感じですね。 1000人中、25人ですから、そんなに難しい感じはしませんが、実際は、そう簡単ではないのは、皆さんご存知でーーー。
 
③ 集団間の比較
 
 例えば、ある薬を飲んで、元気になったとか、という場合、この薬の効果を科学的に判定するのに統計学的な手法があります。 この場合も、その数値の平均や標準偏差などをだした後に、比較するための特別な検定式があります。 t検定とかχ2(カイジジョウ)検定などです。 
 
 こういうものを使って、ある物質の効果を科学的に評価することはできるのですが、ここでは、その数式などより、その比較を行う際には、他の要因が紛れ込まないように、きちっとその物質(材料、条件など)だけが比較の対象になっているかを、チェックしておかなければならない、という点が一番大事だと思います。 
 
 まあ、常識でわかることですが、なかなか現実の生活では、そういうことを見落としがちですし、見つけにくいです。 例えば、ある薬を飲むことで体重が減ったと言っても、それを飲んだ時と、飲まなかったの時のありとあらゆる条件を同一にしないと、その効果の判定は難しいということです。 ストレスのある無しも関係しますしーーー。
 
 それと、これに関連して、プラシーボ効果という名をご存知の方もいらっしゃるでしょう。 つまり、メリケン粉でも、風邪薬の代わりになるという、皆さんよくご存知のアレです。 ユーミンは、「魔法のくすり」という曲で、「恋の媚薬は、ふくらし粉」だったと言ってます。 この効果の試験・実験を、私達が学生の頃は、2重盲検(もうけん)試験と言ってました。 
 
 これは、単に、心理的にそう思い込むことで、身体の調子さえ変化させる可能性があることを物語っています。 ただし、これも、多くの比較する数を揃えるなどをすれば、科学的な効果と心理的な影響を区別することは可能になります。
 
 ただ、こういうことがありますから、霊感商法的なものは、どこにでも誰にでも入っていく余地が出来てしまうのです。 我々は、本当に気をつけなければなりません。
 
 
 ちょっと長くなってしまいました。 まだ、もう少し書きたいので、続きは次回へということに。