理系的ダメな議論について
アンチ「理系的ダメな議論」として「統計学的な有意性検定の意味のなさ」ってのがある。
http://takenaka-akio.cool.ne.jp/etc/stat_test/
結論
雑誌の編集者やレフェリーは,「統計学的な手法を使え」と言うだけでは不十分で,「適切な統計学的な手法を使え」と言わないといけない.一番よく見る不適切な統計手法は仮説検定,とくに,もともと偽だと分かってるような仮説の検定だ.
この論文には,何も新しいことは書いてない.すでに数多の論文で主張されてきたことばかりだ.でも,そのメッセージは野生生物の研究者にはじゅうぶん伝わってこなかったようだ.私たちがやってる研究は重要だ.だから,いちばんいい道具を使わなきゃいけない.統計学的仮説検定がいちばんいい道具だってことはほとんどないと言ってよい.
現在の理系科学者のスキルが低すぎて、こんな当たり前の事を言われないとわからないレベルだったり意味のない作業を強要される事も普通であり、非科学的な言説を垂れ流しているからこの論文は学会賞まで取ってしまった。
統計学はつい最近まで数学ではなかった。多要素がからんで、どうがんばってもいろんな影響がnegligibleにならない農学分野で生物測定学(biometrics)として産まれた物だ。
農学は理学じゃない。人口が急増していた近代国家でいかに国民の飢え死にを防ぐかを提言する総合政策科学だった。*1
新政策の効果をゆっくり確かめていたら政策投入が遅れて飢え死にが出るかも知れない。ある新政策(たとえば化学肥料の投入)によって収穫量が増える可能性があるとして、その新政策が役に立たない可能性はどのくらいあるかを限定するため、実験結果を整理する必要があっただけだ。*2
危険率が5%で10%の収量増が見込めるなら、社会実験をしてみる価値があるかもしれない。危険率が3%なら危険率5%の政策に優先して採用する価値がある。危険率が1%ならば、他の手法との組み合わせで効果を発揮するような政策の在り方も検討できる。
他に提案される政策を折伏し、最良の政策を選択するためには、ベネフィットとリスクを明確に示すべきという考え方から産まれた実学である。うまくやらなければなければ餓死者が増えるのだ。コンピュータもない時代から統計的手法が要求されたのはそういうわけである。
第二次世界大戦頃から統計の実学における有用性が認識されて応用されはじめ、生物測定学は統計学として農学から独立していった*3。コンピュータの普及によって利用できる場面が増えると医学、薬学、心理学、工学、経済学などの実学分野に浸透し、やがて理学者などにも広まった。ところが、統計的手法をとる事の意味、というのはちっとも浸透していないのだ。*4
各分野の興味はそれぞれ違うだろう、だから、形式的に真似をしてもしょうがない。まず志があって、それから信念に沿って統計を使うべきなのだ。*5
えんえんと、統計的手法の信念のない間違った使い方をしてきて、いまだになおらない。それが理系の現状なのだ。
*1:だから経済学までその内部に内包する必要があった
*2:参考:http://ja.wikipedia.org/wiki/ロナルド・フィッシャー
*3:追記:統計学者となった彼らが農学の枠の外に出たとたん、優生学者として人種差別の急先鋒となった事も併せて書いておく
*4:普及期にはhttp://www.s.fpu.ac.jp/u-sano/morrison.htmlなんてのも出てる。
*5:どっかで「普通の科学では危険率3%なんて議論をしているが、最新の物理学では危険率0.1%以上のデータは相手にされない」と得意げに語る物理学者を見たような気がするが、そもそも農場の大根の収穫量データ整理用の手法があんたのデータにどう有用なのか?アホかと...バカかと....