実験心理学と統計的仮説検定

霊魂仮説とESP仮説

ある初老の女性が、不思議な夢を見たという。

亡くなった母親が夢に出てきて「二階にある簞笥の下から二番目の引き出しの奥に、赤い帯があるから、和服を着るときに使いなさい」と言った。翌朝、簞笥の引き出しを開けてみると、積み重なっていた和服の下に、見たことのない赤い帯があるのを見つけた。[*1]

この超常的な夢は、どのように解釈できるだろうか。

  1. 霊魂仮説:死んだ母親の霊魂が夢の中に入ってきた。
  2. ESP仮説:夢を見た女性が、夢を見ている間に引き出しの中の帯をESPによって透視した。
  3. 通常感覚仮説:夢を見た女性は、以前に引き出しに赤い帯が入っているのを見て知っていたのだが、忘れていた。それを夢の中で思い出した。

通常感覚仮説では説明できないからといって、すぐに霊魂仮説が正しいということにはならない。というのは、肉体の死後も霊魂が存続すると考えるよりは、生きている人間に通常の感覚ではない知覚能力があると仮定したほうが無理がないからである。

霊魂の死後存続をテーマにしていた心霊研究から人間の未知能力を研究する超心理学へとパラダイムが移行したのは、そのためでもある。しかし、超心理学が霊魂の死後存続を否定しようとしているわけでもない。もし人間に透視能力があり、かつ、距離によって減衰するとか、特定の物質によって遮蔽されるとかいう制限があれば、その制約が強ければ強いほど、霊魂仮説が有力になるからである。

心の科学と行動主義

心は観測不能である。観測可能なのは、生体に対する刺激と反応の関係だけである。だから科学的心理学では、刺激と反応だけを研究する。この考えを推し進めたのが行動主義(behaviourism)であり、現在の実験心理学の出発点になった思想である。現代物理学における操作主義(operationalism)の影響も看過できない(→「操作主義」)

心自体は不可知だが、以下のような、いくつかの立場を分類できる。
 

 刺激→心→反応

心という実体は存在するが、観測できない。単純な実在論
 

 刺激→(?)→反応

心という実体が存在するのかしないのかは、観測できないからわからない。実証主義的な不可知論。
 

 刺激→反応

刺激と反応の関数が心であるとする。根本的行動主義(radical behaviourism)。これはもっともラディカルな立場だが、しかし誰しもが主観的には心というものを持っているという実感がある。そこで、
 

 刺激→(錯覚)→反応

「心を持っている」という感覚は錯覚にすぎない、という折衷案も考えられる。消去主義という考えかたがこれに近い。

行動主義に対する反省として起こってきたのが認知心理学認知科学である。刺激と反応の間には心という実体はない、あるいは不可知かもしれないが、コンピュータのような情報処理が行われているというモデルを考えることはできる。

PKとESPの操作的定義

行動主義的な超心理学の立場に依拠すれば、PKやESPという能力が実在するかどうかについて議論する必要はない。

決められた手続きの実験を行い、その結果を統計的に処理した結果、偏りが出れば、それを操作的(operational)にPKやESPと名づけて議論を進めることができる[*2]

これは超心理学という分野が特殊だからではなく、行動主義の影響を受けた実験心理学全般と同じ方法論である。

しかし、とりわけ超心理学の場合にはその傾向が顕著であり、逆にいえば、心的現象を操作的[(())]、統計的に処理していく、もっとも典型的な分野だともいえる。

コインを投げる→PK

たとえば「表が出るように」と念じてコインを投げる、という実験によってPKを操作的に定義することができる[*3]

1回投げて表が出ても、たまたま表が出る確率は\frac{1}{2}だから、偶然かもしれない。では、何回投げて、何回表が出れば「PK」が働いたといえるのだろうか。2回投げて2回とも表が出る確率は\frac{1}{4}、3回なら\frac{1}{8}と、まぐれ当たりの確率は下がっていくが、何回投げても0にはならない。

この場合、一般にn回投げてn回表が出る確率pは\frac{1}{2^{n}}であり、果てしなくコインを投げつづけても、つまりn→∞としても、p→0、つまり、まぐれ当たりの確率は限りなく0に近づくけれども、決して0にはならない。

帰無仮説を立てる

統計的な仮説検定の手続きでは、最初に仮説を立てるのだが「実験協力者はPK能力を持っている」という仮説は立てない。それは、何回コインを投げても完全には証明できないからである。

そうではなく「実験協力者はPK能力を持っていない」という、逆の仮説を立て、表が多数出た場合に、それが偶然に起こった確率を計算し、その確率が充分に低ければ、「『実験協力者はPK能力を持っていない』とはいえない」と、議論を進める。

つまり、一般に

「『データが偏っている』ので『二つの変数の間に関係がある』」

という積極的な仮説を立てるのではなく、逆に

「『二つの変数の間には関係がない』ので『データの偏りは偶然生じた』」

という「帰無仮説 null hypothesis」を立て、その帰無仮説

「『データの偏りが偶然生じた』といえる確率は無視できるほど低い」

という論理で帰無仮説を棄却することによって、つまり、二重否定の論理によって議論を進めていく。

有意確率の計算

実験が終わってデータが得られたら、その偏りが帰無仮説によって説明できる、つまり「データの偏りが偶然生じた」確率(有意確率)を計算する。

この有意確率(たんにp(probabilityの略)と表されることも多い)が0になれば帰無仮説は完全に棄却されるのだが、すでに述べたように、有意確率は限りなく0に近づくことはできても、決して0にはならない[*4]

そこで、ある一定の水準(有意水準 level of significance)を決めて、pがその基準より小さい場合に、それは充分に小さく、0とみなせるとして、帰無仮説を捨てることにする。

有意水準としてはふつう、0.05(5%)か0.01(1%)が用いられる。心理学など、人文社会系の学問で、厳密な分析が難しい場合には、より緩やかな5%が用いられたり、場合によっては0.1(10%)が「有意傾向」として用いられることもある。逆に、失敗が大きな問題になる医学系の分野や、疑いの目で見られやすい超心理学の分野でも、より厳しく、0.001(0.1%)以下を有意とする場合もある。 P<0.1、* p<0.05、** p<0.01、*** p<0.001、といった記号をつけることもある。

いずれにしても、これらの数字は十進法を基準に決めた便宜的な値であって、数学的な必然性があるわけではない。

たとえば、有意水準を5%とすると

p≧0.05なら
 →「『データの偏りは偶然生じた』といえる」
 →「5%水準で有意ではない」という

p<0.05なら
 →「『データの偏りは偶然生じた』とはいえない」
 →「5%水準で有意」という

けっきょく、この方法では「データの偏りが必然的に生じた」という積極的な結果を示すことはできない。つまり、統計的に有意な結果が出ても、二つの変数の間に「ある有意水準を基準にすれば」「関係がないとはいえない」と控えめに言えるだけで、「関係がある」とは言い切れない。

具体的な計算の例

たとえば「表が出るように」と念じてコインを投げた場合はどうだろうか。

すでに述べたように、1回コインを投げて表が出ても、p=\frac{1}{2}なので、有意確率は\frac{1}{2}でしかない。それでは、100回投げることにしたらどうだろうか。もし100回とも表が出れば、p=\dfrac {1}{2^{100}}〜0.00…(小数点以下に0が101個!)…005となり、きわめて低い確率になるが、0ではない。偶然にそんなことが起こる確率は、ほとんどない、ということである。

では、99回表が出て、1回だけ裏が出てしまった場合はどうだろう。p=\dfrac {1}{2^{99}}だろうか。そうではない。1回裏が出たといっても、最初に裏が出て、その後99回表が出た場合から、最初から99回表が出続けて、最後に裏が出た場合の100通りがあるから、p=100\left( \dfrac {1}{2^{99}}\right)である。そして「99回以上」表が出る確率は、2個を足し合わせてp=\dfrac {1}{2^{100}}+100\left( \dfrac {1}{2^{99}}\right)となる。

さらに、98回表が出た場合には、2回裏が出たということであり、それは、最初の2回で裏が続けて出た場合から、最後の2回で裏が続けて出た場合を、足し合わせなければならない。

一般にn回の試行でk回の当たりが起こるのは\begin{eqnarray}
{}_n C _k
\end{eqnarray}ということになる。しかし、ここから先の計算の手順は端折る。計算方法を詳述するのがここでの目的ではなく、そうすると議論の道筋がわかりにくくなってしまうからである。(確率論や統計学の入門書やWEBサイトは無数に存在する。)

途中を省略すると、コインを100回投げて表が出る回数の期待値(μ)、分散(\sigma ^{2})、標準偏差\sigma)は、それぞれ

μ=50
\sigma ^{2}=25
\sigma=5

となる。X回表が出た場合の標準正規分布(μ=0、σ=1)

Z=\dfrac {x-\mu }{\sigma }

では、おおよそ、Z>3.08>2.33>1.65>1.29と、p<0.001<0.01<0.05<0.1が対応しているので、この公式にμ=50、\sigma=5を代入すると、それぞれの確率に対して、表が出た回数が、66回以上、62回以上、59回以上、57回以上と対応している。

カードの模様を当てる→ESP

あるいは、5種類の模様が印刷されているトランプのようなカードの模様を当てる実験によってESP(透視[*5])能力を操作的に定義してみることができる。これは、ラインが行った方法である[*6][*7][*8]


ラインがESPの実験に使ったゼナーカード。今でも同じものがライン研究所で販売されている。

一般に、1回の試行で当たる確率がpである場合、n回の試行でk回の当たりが出る確率は、\begin{eqnarray}
{}_n C _k p^{k}\left( 1-p\right) ^{n-k}
\end{eqnarray}

であるから、カード当ての場合は、

\begin{eqnarray}
{}_n C _k \left(\frac{1}{5}\right)^k\left(\frac{4}{5}\right)^{n-k}
\end{eqnarray}

となり、コイン投げと同様の計算ができる。

ゼナーカードは5種類の模様が印刷されたカードが5枚ずつ、合計25枚で1セットになっている。

たとえば25枚のカードの模様を当てるという実験を行った場合、期待値(μ)、分散(\sigma ^{2})、標準偏差\sigma)は、それぞれ

μ=5
\sigma ^{2}=4
\sigma=2

となり、コイン投げと同じように計算すると、当たりの枚数が3枚以上、9枚以上、10枚以上、12枚以上の場合、有意確率が0.1、0.05、0.01、0.001を下回る。


蛭川は、授業での実演で25枚のうち16枚を当てて見せた。もちろん有意確率はp<0.001である。しかし、これは蛭川に透視能力があることの証明にはならないし、また、トリックを使ったことの証明にもならない。あるいは、A君はちょうど期待値の5枚を当てた。これは特殊能力なのだろうか?

第一種の誤りと第二種の誤り

すでに議論したとおり、統計的な仮説検定は、原理的に完全な方法ではない。ときには誤った結論に導かれることもある。この誤りの可能性には二種類ある。

データの偏りが偶然なのに、偶然ではないと結論してしまう
 → 第一種の誤り type one error

データの偏りが偶然ではないのに、偶然だと結論してしまう
 → 第二種の誤り type two error

第二種の誤りは、実験データに含まれる貴重な可能性を見過ごしてしまうことを意味している。

第一種の誤りでは、何もないところに関係性を見いだしてしまうということ意味している。

第一種の誤りを冒す確率は設定した有意水準と同じで、有意水準の確率が高いほどその危険性は増す。たとえば、有意水準が5%、つまり二十分の一の場合、20回に1回はこの誤りが起こる。つまり、無関係なはずの変数の組み合わせを手当たり次第に20通り試せば、1回ぐらいは5%で有意な結果が出てもおかしくないことになる。

実証主義反証主義

なぜ、二重否定という回りくどい論理を使うのだろうか。この考え方は、統計的な仮説検定法だけではなく、科学的な方法論一般の考え方でもある。

たとえば「黒いカラスが存在する」という「特称命題」は、黒いカラスを一匹見つければ証明できるが、「すべてのカラスは黒い」という「全称命題」を実証するためには、地球上のすべてのカラスを観察して、全部が黒いことを示さなければならないので、事実上、不可能である。しかし、これを反証するためには、白いカラスを一匹見つけるだけで良い。全称命題は経験的に検証(verify)することはできないが、反証(falsify)することはできる。

実証主義(positivism)がより洗練されたものが反証主義(falsificationism)である。ポパーは「実証可能性(verifiability)ではなく反証可能性(falsifiability)が境界設定の基準として採用されるべきである[*9]」としている。(「境界設定」というのは、科学と科学ではないものを分ける基準という意味である。)

科学的な研究には、理論を証明することはできない。「理論はけっして経験的に実証できない[*10]」のであり、反証しかできない。有意確率が決して0にはならない以上、どれだけ実験結果が出ていても、超能力が存在する、とはいえない。そもそも、すべての科学理論は完全には証明できないし、されていない。逆に、超心理学実験が否定的な数字を示していることについて、科学では説明できないことがある、と語ることにも意味がない。というのも、全ての科学理論は反証可能である以上、説明不可能な部分を持っているからである。



記述の自己評価 ★★★☆☆
(長いページの中に沢山の話題が入っており、混乱気味。複数のページに分割したほうが良い。)
2006/12/08 JST 作成
2019/06/06 JST 最終更新
蛭川立

*1:蛭川が実際に日本人女性から聞いた話である。

*2:おおよそ、ESPについては、カード当て→夢テレパシー→ガンツフェルト実験、PKについてはサイコロ実験→放射性元素を使った乱数発生器実験→ダイオードを使った乱数発生器実験、と実験方法が変わってきている。

*3:日本の硬貨は、数字が書いてあるほうが裏ということになっているらしい(出典不詳)。

*4:歪みのないコインを99回投げて99回表が出ても、次に表が出る確率は、やはり\frac{1}{2}である。「99回続けて表が出たのだから、次もまた表が出るだろう」とか、逆に「99回続けて表が出たのだから、次こそは裏が出るだろう」と考えてしまう認知バイアスを「ギャンブラーの誤謬」という。

*5:透視とテレパシーと予知を併せてESPと呼ぶが、これらの区別は難しい。

*6:Rhine, J. B. (1934, reprinted in 1964). Extra-Sensory Perception. Bruce Humphries.(ESP実験の報告書。Google Booksによるオンライン復刊)

*7:Rhine, J. B. & Pratt, J. G. 湯浅泰雄(訳)(1964).『超心理学概説―心の科学の前線―』宗教心理学研究所出版部.(日本語で読める概説)

超心理学概説―心の科学の前線

超心理学概説―心の科学の前線

*8:Horn, S. 石川幹人(監修)・ナカイサヤカ(訳)(2011).『超常現象を科学にした男―J.B.ラインの挑戦―』紀伊國屋書店.(ラインの伝記)

超常現象を科学にした男――J.B.ラインの挑戦

超常現象を科学にした男――J.B.ラインの挑戦

*9:ポパー, K. R. 大内義一・森博(訳)(1971).『科学的発見の論理 (上)』恒星社厚生閣, 49. (Popper, K. R. (1934). Logik der Forschung. Mohr Siebeck.)

科学的発見の論理 上

科学的発見の論理 上

*10:前掲書, 48.