■相関係数の値が +1 または -1 になるのはどんな時か
相関係数:r(correlation coefficient)は2つの変数間の相関すなわち類似性を示す指標で、次式で定義されます。
実数データ:(xi, yi), i = 1, 2, .., n に対して
r = Σ(xi - xm) (yi - ym) / sqrt[Σ(xi - xm)2・Σ(yi - ym)2] ・・・(式1)
ここで、
煤F i = 1 から i = n までの総和
xm: x の平均、xm = Σxi/n
ym: y の平均、ym = Σyi/n
sqrt: 平方根
相関係数の値の範囲が[ -1 〜 +1 ] であることは
相関係数の値はなぜ [ -1 〜 +1 ] の範囲か(証明)
で示されていますが、ここでは値が +1 または -1 になるのはどんな時かを考えてみます。
さて、
ai = xi - xm
bi = yi - ym
と置くと、
r = Σai bi / sqrt[Σai2・Σbi2]
となりますが、
a = (a1, a2, .., an)
b = (b1, b2, .., bn)
をn次元のベクトルと考えると、Σai bi はそれらの内積であり、従って
Σai bi = |a||b|cosθ
= sqrt[Σai2]・sqrt[Σbi2] ・cosθ
ここで、θ: 2つのベクトルのなす角
∴ r = cosθ ・・・(式2)
となります。
この式からも相関係数の値の範囲が[ -1 〜 +1 ] であることがわかりますが、特に値が +1 あるいは -1 になるのはθ = 0°またはθ = 180°の時であることがわかります。
θ = 0°とは、ベクトル a、b が互いに平行で同方向であること、すなわち k を正の定数として
bi = k ai
or
yi - ym = k (xi - xm)
また、θ = 180°とは、ベクトル a、b が互いに平行で逆方向であること、すなわち
bi = -k ai
or
yi - ym = -k (xi - xm)
を意味します。
以上により、相関係数の値が +1 または -1 になるのは(xi, yi)が1直線上にある時、即ち
yi - ym = c (xi - xm) ・・・(式3)
ここで c : 任意の定数(c ≠ 0)
が成立する時であることがわかります。
(xi, yi)が(式3)を満たす時、これを(式1)に代入すると、
r = Σ[(xi - xm) c(xi - xm)] / sqrt[Σ(xi - xm)2・Σ[c(xi - xm)]2]
= c / |c|
= ±1
となることが確認できます。
相関係数と回帰直線 [ Ver 1.0 ]
相関係数の値はなぜ [ -1 〜 +1 ] の範囲か(証明)
ホーム