You are on page 1of 5

CAPITULO

3
Metodo de mnimos cuadrados

En un experimento tpico que envuelve la medicion de varios valores de dos variables fsicas es
investigar la funcionalidad entre las dos variables. En terminos generales, sea la variable de entrada x
y la variable de salida y, por simplicidad, las dos estan relacionadas linealmente y que la incertidumbre
en la medicion de x es mucho menor que la respectiva incertidumbre en y, e. d.:
y[x] = a + bx

(3.1)

donde la pendiente b y el intercepto a son parametros que deben determinarse mediante un criterio.
La fig. 3.1 muestra la situacion a estudiar.
y

pendiente b

y[x]

yi y[xi ]

yi
a

x
xi
Figura 3.1: Gr
afico de datos asociados a un modelo lineal. La cantidad yi y[xi ] representa la desviaci
on de
cada observaci
on de yi respecto del valor predicho por el modelo yi [xi ].

Cuando se hace una serie de medidas del tip descrito, se puede preguntar:
1. Como elegir ((la mejor recta)) que ajuste una serie de datos experimentales?
2. Con que exactitud se determinan el intercepto a y la pendiente b?
El metodo analtico de encontrar la mejor lnea recta que ajuste una serie de datos experimentales
n lineal o m
se denomina regresio
etodo de mnimos cuadrados y la exactitud de determinar a
y b es a traves de metodos estadsticos.
La regresion lineal consiste en suponer que la incertidumbre en una de las mediciones de las
variables es despreciable frente a la otra. Esta suposicion es razonable ya que las incertidumbres en
3-1

3-2

una de las variables a menudo son mayores que en la otra y, por tanto, se pueden ignorar.Tambien se
asume que las incertidumbres en una de las variables son todas del mismo orden, lo cual es razonable
en muchos experimentos,pero no necesariamente cierta. Sea la variable x la que tiene incertidumbre
despreciable y las mediciones de cada yi estan gobernadas por la distribucion (1.21), con el mismo
parametro y para todas las mediciones.
Si se conoce las constantes a y b,para cualquier valor dado de xi (que se ha asumido no tiene
incertidumbre), se puede calcular el valor verdadero de la correspondiente ti ,
(valor verdadero de yi ) = a + bxi
La desviacion entre el i-esimo valor experimental yi [xi ] y la respectiva ordenada a + bxi en la supuesta
recta de ajuste es:
yi = yi (a + bxi ), con i = 1, 2, . . . , n
(3.2)
Entre todas las posibles rectas de intercepto a y pendiente b que ajusta a la serie de datos experiemtnales, se escoge aquella para la cual tiene lugar el siguiente criterio:
La suma de los cuadrados de las desviaciones yi debe ser mnima, es decir,
n
X

(yi )2 = mn

i=1

Teniendo en cuenta la relacion (3.2):


n
X
i=1

(yi a bxi )2 = mn

La condicion de existencia del mnimo de esta expresion exige que sus derivadas parciales con respecto
a los parametros a y b se anulen, es decir:
!
!
n
n
X
X
2
2
(yi a bxi )
=0
;
(yi a bxi )
=0
a i=1
b i=1
Al realizar la operacion indicada, se obtiene
n
X
i=1

(yi a bxi ) = 0

n
X
i=1

(yi a bxi )xi = 0

Estas dos ecuaciones pueden ser reescritas como ecuaciones simultaneas lineales para a y b:
X
X
X
X
X
an + b
xi =
yi
;
a
xi + b
x2i =
xi yi
donde se ha omitido los lmites i = 1 a n en los signos de la sumatoria
escritura de las ecuaciones. La solucion de este sistema es:
P 2P
P P
xi
yi xi (xi yi )
a=
P
P 2
n x2i ( xi )
b=

P P
xi yi xi yi
P 2
P 2
n xi ( xi )

, por comodidad en la

(3.3)

De esta manera se encuentra el intercepto y la pendiente de la recta que minimiza la suma


Del analisis estadstico, la incertidumbre en y es:
rP
(yi a bxi )2
sy =
n

(3.4)
P

(yi )2 .

3-3

pero este estimativo no es correcto porque los n


umeros a y b son los valores verdaderos desconocidos.
En la practica, estos n
umeros deben reemplazarse por los mejores estimativos dados por (3.3) y 3.4,
esto conduce a una reduccion en sy al reemplazar n n 2:
rP
(yi a bxi )2
sy =
(3.5)
n2
La razon es que se ha hecho n medidas pero se deben calcular dos cantidades a y b.
Teniendo sy , las incertidumbres de a y b se obtienen de
s
P 2
xi
sa = sy
P 2
P 2
n xi ( xi )
sb = sy

n
n

x2i

(3.6)

(3.7)

P 2
( xi )

De esta forma, el metodo de mnimos cuadrados permite calcular de manera inequvoca las incertidumbres del intercepto a y de la pendiente b con base en los datos medidos y no en las apreciaciones
basadas en las incertidumbres de los valores medios de los datos.
Que tan valido es aproximar un conjunto de datos mediante una dependencia lineal de la forma
como se ha planteado? La respuesta a esta pregunta se obtiene mediante el calculo del llamado
n lineal, el cual se define de la siguiente manera:
coeficiente de correlacio
P
P P
n xi yi xi yi
 q

r = q
(3.8)
P
P 2
P
P 2
n x2i ( xi )
n yi2 ( yi )

Esta magnitud, en cierta medida caracteriza el grado de dependencia lineal de la variable y con
respecto a la variable x. Si r = 1, significa que la correlacion entre x e y es perfecta. Al contrario, si
r = 0, entre x e y no hay correlacion. Una correlacion imperfecta significa que 0 < r < 1.
Ejemplo 3.1 Se quiere investigar la dependencia de la resistencia R de un material con respecto a
la temperatura T . Los resultados se muestran en la tabla 3.1 y la grafica en la fig. 3.2:
T ( C)
R ()

10
12,3

20
12,9

30
13,6

40
13,8

50
14,5

60
15,1

70
15,2

80
15,9

Tabla 3.1: Datos de la temperatura T ( C) y la resistencia R .

Como suele suceder en muchos problemas, las variables no llamadas x e y, pero debe tenerse
cuidado enla identificacion de cada una. Para el presente caso, se tiene el reemplazo:
xi Ti

yi Ri

Un vistazo a la distribucion de estos datos permite afirmar que estos se pueden ajustar mediante una
recta. El objetivo es determinar dicha recta mediante
etodo P
de mnimos
P
P el m
P
P cuadrados. De acuerdo
con las ecs. (3.3) y (3.4), se necesita conocer
Ti ,
Ri ,
Ti2 ,
Ri2 y
Ti Ri :
Con base en estos valores, se puede determinar los valores de la pendiente b y el intercepto a:
P 2P
P P
Ti
Ri Ti Ti Ri
(20 400)(113, 3) (360)(5 308)
a=
=
= 11,91
P 2
P 2
8(20 400) (360)2
n Ti ( Ti )
P
P P
n Ti Ri Ti Ri
8(5 308) (360)(113, 3)
b=
= 4, 98 102 / C
P 2
P 2 =
8(20 400) (360)2
n Ti ( Ti )

3-4

16

Resistencia

R(

15

14

13

12

15

30

45

Temperatura

60

T (C)

75

Figura 3.2: Gr
afica de los datos de la tabla 3.1.

Ti
Ri
Ti2
Ri2
Ti Ri
2
( C) () ( C )
(2 )
( C )
10
12,3
100
151.29
123
20
12,9
400
166,41
258
30
13,6
900
184,96
408
40
13,8 1 600 190,44
552
50
14,5 2 500 210,25
725
60
15,1 3 600 228,01
906
70
15,2 4 900 231,04
1 064
80
15,9 6 400 252,81
1 272
P
P
P 2 P 2 P
Ti
Ri
Ti
Ri
Ti Ri
60 13,3 20 400 1 615,21 5 308

Tabla 3.2: Datos para calcular las ecs. (3.3) y (3.4).

De los anteriores resultados, se puede determinar las magnitudes Ri = Ri (a + bTi ) y

Estos
datos se encuentran en la tabla 3.3.
Con base en estos valores, se puede determinar sy (3):
rP
r
(yi )2
0, 15
sy =
=
= 0, 16
n2
82

(Ri )2 .

y as se puede determinar las desviaciones estandar de la pendiente y el intercepto:


s
s
P 2
xi
20 400
sa = sy
= 0, 13
P 2
P
2 = 0, 16
8(20 400) (360)2
n xi ( nxi )
sb = sy

x2i

P 2 = 0, 16
( xi )

8
= 2, 47 103 / C
8(20 400) (360)2

Por tanto, la recta R = a + bT que ajusta los datos de la fig. 3.2 de acuerdo con el criterio de
mnimos cuadrados tiene la forma:
R[T ] = (11,9 0, 1) + (5, 0 0, 3) 102 T

3-5

Ti
( C)
10
20
30
40
50
60
70
80

Ri
()
12,3
12,9
13,6
13,8
14,5
15,1
15,2
15,9

a + bTi
()
12,4
12,9
13,4
13,9
14,4
14,9
15,4
15,9

Ri
()
0.1
0
0,2
0,1
0,1
0,2
0,2
0

(Ri )2
(2 )
0,01
0
0,04
0,01
0,01
0,04
0,04
0
P
( Ri )2
0,15

Tabla 3.3: Datos para calcular la magnitud sy dada por (3).

15

Resistencia

R(

16

14

13

12

15

30

45

Temperatura

60

T (C)

75

Figura 3.3: Regresi


on lineal usando el metodo de mnimos cuadrados de la fig 3.2.

y se presenta en la fig. 3.3.


Finalmente, para el coeficiente de correlacion se tiene:
P
P P
n xi yi xi yi
 q

r = q
P
P 2
P
P 2
n x2i ( xi )
n yi2 ( yi )
8(5 308) (360)(113, 3)
p
= p
8(20 400) (3602 ) 8(1 615, 2) (113, 32)
= 0, 9934

lo cual indica que la resistencia del material considerado esta bien correlacionada con la temperatura.

You might also like