最小二乗法
出典: フリー百科事典『ウィキペディア(Wikipedia)』
最小二乗法(さいしょうにじょうほう、さいしょうじじょうほう;最小自乗法とも書く)は、測定で得られた数値の組を、適当なモデルから想定される一次関数、対数曲線など特定の関数を用いて近似するときに、想定する関数が測定値に対してよい近似となるように、残差の二乗和を最小とするような係数を決定する方法、あるいはそのような方法によって近似を行うことである。
目次 |
[編集] 基礎的な考え方
話を簡単にするため、測定値は x, y の二次元の平面に分布するものとし、想定される分布が y = f(x) の形である場合を述べる。想定している関数 f は、既知の関数 g(x) の線型結合で表されていると仮定する。すなわち、
たとえば、gk(x)=xk-1 は、多項式近似であり、特に m=2 の時は f(x) = a1 + a2x という直線による近似(線形回帰)になる。図は多項式近似で m を 1 から 10 まで増やした例。
今、測定で得られた、次のような数値の組の集合があるとする。
これら (x, y) の分布が、y = f(x) という関数に従うと仮定したとき、想定される理論値は (x1, f(x1)), (x2, f(x2)), ..., (xn, f(xn)) ということになり、実際の測定値との残差は、各 i につき |yi - f(xi)| ということになる。 この残差の大きさは、xy-平面上での (xi, yi) と (xi, f(xi)) との距離でもある。
ここで、理論値からの誤差の分散の推定値は残差の平方和
で与えられるから、J が最小になるように想定分布 f を定めればよい。すなわち akを、定めればよいということになる。
それには、上式は ak を変数とする関数と見なすことができるので、J を ak について偏微分したものをゼロと置く。こうして得られた m 個の連立方程式(正規方程式)を解き、ak を決定すればよい
[編集] 一次方程式への近似
いま、
という測定結果が得られたとする。求めたい一次方程式の式を
とおくと、aとbは次式で求められる。
[編集] 正規方程式による解法
当てはめたい関数 f は、
と、行列で表すことができる。ここに上つき添字 T は転置行列を表す。 すると、最小にする関数 J は
- J = (Ga − y)T(Ga − y)
と、表される。ここに、G は、Gij = gj(xi) なる成分を持つ行列、 で、
。
前章で述べたように J を a のそれぞれの成分で偏微分してゼロと置いた m 個の式(正規方程式)は行列を用いて、
- GTGa = GTy
と、表される。行列 GT G の逆行列が存在すれば、それを用いて a を求めることができる。数値的に解くには、LU分解 や、コレスキー分解 を用いることができる。
J の行列表現は、優決定の連立一次方程式 Ga = y を近似的に解くという意味にも解釈できる。これは特異値分解(あるいは擬逆行列)を用いて解ける。こうすれば、正規方程式の行列 GT G が正則でない場合も解くことができる。
[編集] 拡張
[編集] 多次元
想定される分布が媒介変数 t を用いて (x, y) = (f(t), g(t)) の形(あるいは f, g は複数の媒介変数によって決まるとしても同様)であっても考察される。
すなわち、測定値 (xi, yi) がパラメータ ti に対する (f(ti), g(ti)) を理論値として近似されているものと考えるのである。
この場合、各点の理論値 (f(ti), g(ti)) と測定値 (xi, yi) の間に生じる残差は
である。ゆえに、残差平方和は
となるから、この値が最小であるように、f, g を決定するのである。
このように、n 組の (x, y) の測定値 (xi, yi) (i = 1, 2, ..., n) を n 組の (x1, x2, xm) の測定値 (x1i, x2i, ..., xmi) (i = 1, 2, ..., n) に拡張したものも考察することができる。
[編集] 測定の誤差が既知の場合
n 回の測定における誤差があらかじめわかっている場合を考える。毎回の測定の誤差は同じである必要がない。誤差が正規分布していると考え、その標準偏差 で、誤差の大きさを表す。すると、誤差が大きい測定より、誤差が小さい測定の結果により重みがあるべきだから、
を、最小にするように f を定めるのが合理的である。
毎回の測定が独立ならば、測定値の尤度は exp(-J') に比例する。そこで、上記の J' を最小にする f は、最尤推定値であるとも解釈できる。また、J' は自由度 n-m のカイ二乗分布に従うので、それを用いてモデル f の妥当性を検定することもできる。
毎回の測定誤差が同じ場合、J' を最小にするのは J を最小にするのと同じ意味になる。
[編集] 非線型最小自乗法
もし、f が、ak の線型結合で表されないときは、正規方程式を用いた解法は使えず、数値的に ak を求める必要がある(たとえば Levenberg-Marquardt 法)。
カテゴリ: 数学関連のスタブ項目 | 最適化 | 統計学 | 数学に関する記事