■相関係数の値が +1 または -1 になるのはどんな時か

 相関係数:r(correlation coefficient)は2つの変数間の相関すなわち類似性を示す指標で、次式で定義されます。
 実数データ:(xi, yi), i = 1, 2, .., n に対して
  r = Σ(xi - xm) (yi - ym) / sqrt[Σ(xi - xm)2・Σ(yi - ym)2]  ・・・(式1)

  ここで、
   煤F i = 1 から i = n までの総和
   xm: x の平均、xm = Σxi/n
   ym: y の平均、ym = Σyi/n
   sqrt: 平方根

 相関係数の値の範囲が[ -1 〜 +1 ] であることは
  相関係数の値はなぜ [ -1 〜 +1 ] の範囲か(証明)

で示されていますが、ここでは値が +1 または -1 になるのはどんな時かを考えてみます。

 さて、
  ai = xi - xm
  bi = yi - ym

と置くと、
  r = Σai bi / sqrt[Σai2・Σbi2]

となりますが、
  a = (a1, a2, .., an)
  b = (b1, b2, .., bn)

をn次元のベクトルと考えると、Σai bi はそれらの内積であり、従って
  Σai bi = |a||b|cosθ
       = sqrt[Σai2]・sqrt[Σbi2] ・cosθ

  ここで、θ: 2つのベクトルのなす角

 ∴ r = cosθ   ・・・(式2)

となります。

 この式からも相関係数の値の範囲が[ -1 〜 +1 ] であることがわかりますが、特に値が +1 あるいは -1 になるのはθ = 0°またはθ = 180°の時であることがわかります。

 θ = 0°とは、ベクトル ab が互いに平行で同方向であること、すなわち k を正の定数として
  bi = k ai
 or
  yi - ym = k (xi - xm)

また、θ = 180°とは、ベクトル ab が互いに平行で逆方向であること、すなわち
  bi = -k ai
 or
  yi - ym = -k (xi - xm)
を意味します。

 以上により、相関係数の値が +1 または -1 になるのは(xi, yi)が1直線上にある時、即ち
  yi - ym = c (xi - xm)   ・・・(式3)
  ここで c : 任意の定数(c ≠ 0)
が成立する時であることがわかります。

 (xi, yi)が(式3)を満たす時、これを(式1)に代入すると、
  r = Σ[(xi - xm) c(xi - xm)] / sqrt[Σ(xi - xm)2・Σ[c(xi - xm)]2]
   = c / |c|
   = ±1
となることが確認できます。
相関係数と回帰直線 [ Ver 1.0 ]
相関係数の値はなぜ [ -1 〜 +1 ] の範囲か(証明)
ホーム