■相関係数の値はなぜ [ -1 〜 +1 ] の範囲か(証明)

 相関係数:r(correlation coefficient)は2つの変数間の相関すなわち類似性を示す指標で、次式で定義されます。

 実数データ:(xi, yi), i = 1, 2, .., n に対して
  r = Σ(xi-xm)(yi-ym)/sqrt[Σ(xi-xm)2・Σ(yi-ym)2]
  ここで、
   煤F i = 1 から i = n までの総和
   xm: x の平均、xm = Σxi/n
   ym: y の平均、ym = Σyi/n
   sqrt: 平方根

 相関係数の値の範囲の証明には、 Schwartz(シュワルツ)の不等式(下記注)や多次元ベクトルの内積を利用した方法などが知られていますが、ここでは2次関数の判別式を利用する簡単な方法を紹介します。

|r| ≦ 1 の証明
変数tを含む次の式:
 Q = Σ[(xi-xm) + t(yi-ym)]2
を展開すると、変数tに関する2次式が得られます。
 Q = Σ(xi-xm)2 + 2tΣ(xi-xm)(yi-ym) + t2Σ(yi-ym)2

Qの値は実数値の2乗和ゆえ、正または0です。
従って、上記2次式の判別式Dは負または0でなければなりません。
 D = [Σ(xi-xm)(yi-ym)]2 - Σ(xi-xm)2Σ(yi-ym)2 ≦ 0

 [Σ(xi-xm)(yi-ym)]2 ≦ Σ(xi-xm)2Σ(yi-ym)2

  |Σ(xi-xm)(yi-ym)| ≦ sqrt[Σ(xi-xm)2・Σ(yi-ym)2]

  |Σ(xi-xm)(yi-ym)|/sqrt[Σ(xi-xm)2・Σ(yi-ym)2] ≦ 1

よって、
  -1 ≦ Σ(xi-xm)(yi-ym)/sqrt[Σ(xi-xm)2・Σ(yi-ym)2] ≦ 1

となり、相関係数の値が -1〜+1の範囲であることが証明されました。

(注)Schwartz(シュワルツ)の不等式:
     蚤i2巴i2 ≧ (蚤i・bi)2
  において、ai = xi-xm, bi = yi-ym とおけば直ちに証明できます。
  この不等式は Cauchy-Schwarz(コーシー=シュワルツ)の不等式とも呼ばれています。
相関係数の値が +1 または -1 になるのはどんな時か
ホーム