Pienimmän neliösumman menetelmä#

Pienimmän neliösumman menetelmän avulla voidaan muodostaa yksinkertainen funktio, joka kuvaa mahdollisimman hyvin jotakin pistejoukkoa. Pisteet voivat olla erilaisia mittaustuloksia. Esimerkiksi kunnan väkiluku voitaisiin laskea vuosittain, ja tällöin funktio \(f(x)\) kuvaisi karkeasti kunnan asukaslukua vuonna \(x\). Voisi olla hyödyllistä pystyä arvioimaan, mikä on väkiluku vaikkapa 10 vuoden kuluttua, jos kunnan kehitys jatkuu samantapaisena. Tällaisessa matemaattisessa mallinnuksessa ei pyritä muodostamaan monimutkaista funktiota, joka kuvaisi aineistoa tarkasti, vaan tavoitteena on riittävän tarkka, mahdollisimman yksinkertainen malli. Tarkastellaan tässä, miten pistejoukkoon voidaan sovittaa suora.

Väkiluvun kehitys kunnassa

Oletetaan, että väkiluku on laskettu vuosina \(x_0, x_1, \dots, x_n\) ja vastaavat asukasluvut ovat \(y_0, y_1, \dots, y_n\). Väkiluvussa tapahtuu satunnaisia notkahduksia tai hyppäyksiä. Tavoitteena on löytää malli \(y=ax+b\), joka kuvaa mahdollisimman hyvin koko dataa \((x_0,y_0 ),(x_1,y_1 ),\dots, (x_n,y_n)\), vaikka se ei osuisi kohdalleen minkään vuoden todellisen asukasluvun kanssa.

Virheen minimointi#

Pienimmän neliösumman menetelmässä yritään minimoimaan mittausdatan ja mallin antaman ennusteen välinen erotus. Yksittäisen pisteen \((x_i,y_i)\) poikkeama suoran antamasta ennusteesta on \(y_i-(ax_i+b)\). Koska osa oikeista arvoista on suurempia kuin suoran yhtälön avulla lasketut arvot ja osa pienempiä, niin pisteiden eri suuntaiset poikkeamat suoralta voivat kumota toisensa. Tämä ei ole toivottavaa. Siksi menetelmässä lasketaan erotusten neliöiden summa ja pyritään minimoimaan se. Yksittäiselle pisteelle \((x_i,y_i)\) erotuksen neliö on \((y_i-(ax_i+b))^2 \). Kaikkien pisteiden ja mallin antaman ennusteen erotuksen neliöiden summaa merkitään lyhyemmin \(E=\Sigma_{i=1}^n (y_i-ax_i-b)^2\).

Kokonaisvirheen \(E=\Sigma_ {i=1}^n (y_i-ax_i-b)^2\) pienimmän arvon löytämiseksi on laskettava virheen osittaisderivaatat kerrointen \(a\) ja \(b\) suhteen. Koska summan derivaatta on derivaattojen summa, niin osittaisderivaatat saadaan seuraavasti:

\(\frac{\partial E}{\partial a}=-2 \Sigma_{i=1}^n x_i (y_i-ax_i-b)^2\)

\(\frac{\partial E}{\partial b}=-2 \Sigma_{i=1}^n (y_i-ax_i-b)\)

Asettamalla osittaisderivaatat nolliksi saadaan yhtälöt:

\(nb+\Sigma_{i=1}^n x_i a=\Sigma_{i=1}^n y_i\),

\(\Sigma_{i=1}^n x_i b + \Sigma{i=1}^n x_i^2 a=\Sigma_{i=1}^n x_i y_i\)

Esimerkki

Etsi suora, joka kuvaa parhaiten seuraavaa pistejoukkoa: \((1,2), (2,5), (3,3), (4,6)\).

Suoran sovitus matriisiyhtälönä#

Voidaan todeta, että yhtälöparia

\(\begin{equation}\begin{cases}nb+\Sigma_{i=1}^n x_i a=\Sigma_{i=1}^n y_i \\ \Sigma_{i=1}^n x_i b + \Sigma{i=1}^n x_i^2 a=\Sigma_{i=1}^n x_i y_i\end{cases}\end{equation}\)

vastaa matriisiyhtälö \(A^T AX=A^T Y\),

missä

\(Y=\begin{bmatrix} y_0 \\ y_1 \\ \vdots \\ y_n \end{bmatrix}, A=\begin{bmatrix} x_0 & 1\\ x_1 & 1 \\ \vdots \\ x_n & 1 \end{bmatrix}, X=\begin{bmatrix}a \\ b\end{bmatrix}\).

Parhaan suoran kertoimien \(a\) ja \(b\) löytämiseksi riittää siis ratkaista \(X\) yhtälöstä \(A^T AX=A^T Y\), siis \(X=(A^T A)^{-1} A^T Y\).

Esimerkki

Etsi paras sovitussuora edellisen esimerkin pistejoukolle ratkaisemalla matriisi \(X=(A^T A)^{-1} A^T Y\).