相関係数:r(correlation coefficient)は2つの変数間の相関すなわち類似性を示す指標で、次式で定義されます。
実数データ:(xi, yi), i = 1, 2, .., n に対して
r = Σ(xi-xm)(yi-ym)/sqrt[Σ(xi-xm)2・Σ(yi-ym)2]
ここで、
煤F i = 1 から i = n までの総和
xm: x の平均、xm = Σxi/n
ym: y の平均、ym = Σyi/n
sqrt: 平方根
相関係数の値の範囲の証明には、 Schwartz(シュワルツ)の不等式(下記注)や多次元ベクトルの内積を利用した方法などが知られていますが、ここでは2次関数の判別式を利用する簡単な方法を紹介します。
|r| ≦ 1 の証明
変数tを含む次の式:
Q = Σ[(xi-xm) + t(yi-ym)]2
を展開すると、変数tに関する2次式が得られます。
Q = Σ(xi-xm)2 + 2tΣ(xi-xm)(yi-ym) + t2Σ(yi-ym)2
Qの値は実数値の2乗和ゆえ、正または0です。
従って、上記2次式の判別式Dは負または0でなければなりません。
D = [Σ(xi-xm)(yi-ym)]2 - Σ(xi-xm)2Σ(yi-ym)2 ≦ 0
[Σ(xi-xm)(yi-ym)]2 ≦ Σ(xi-xm)2Σ(yi-ym)2
|Σ(xi-xm)(yi-ym)| ≦ sqrt[Σ(xi-xm)2・Σ(yi-ym)2]
|Σ(xi-xm)(yi-ym)|/sqrt[Σ(xi-xm)2・Σ(yi-ym)2] ≦ 1
よって、
-1 ≦ Σ(xi-xm)(yi-ym)/sqrt[Σ(xi-xm)2・Σ(yi-ym)2] ≦ 1
となり、相関係数の値が -1〜+1の範囲であることが証明されました。
(注)Schwartz(シュワルツ)の不等式:
蚤i2巴i2 ≧ (蚤i・bi)2
において、ai = xi-xm, bi = yi-ym とおけば直ちに証明できます。
この不等式は Cauchy-Schwarz(コーシー=シュワルツ)の不等式とも呼ばれています。