You are on page 1of 65

Introduccin

Los primeros y ms importantes estudios al respecto se deben a los cientficos Francis Galton (1822-1911) y
Karl Pearson (1857-1936). Fue Galton quien utiliz por primera vez el trmino regresin para indicar que,
aunque influida por la estatura de sus padres, la estatura de los hijos "regresaba" a la media general.
La regresin examina la relacin entre dos variables, pero restringiendo una de ellas con el objeto de estudiar
las variaciones de una variable cuando la otra permanece constante. En otras palabras, la regresin es un
mtodo que se emplea para predecir el valor de una variable en funcin de valores dados a la otra variable.
En estadstica la palabra predecir no se utiliza en el sentido empleado por los astrlogos, futurlogos y
mentalistas, sino mas bien en un sentido lgico como es el de utilizar el conocimiento del comportamiento de
una variable para obtener informacin sobre otra variable. Por ejemplo, puede predecirse el resultado que
obtendr un estudiante en su examen final, basados en el conocimiento de las calificaciones promedio de sus
exmenes parciales, o predecir la preferencia de los estudiantes por profesiones cientficas, conociendo los
promedios de sus calificaciones en los estudios escolares.
En todos los casos de regresin existe una dependencia funcional entre las variables. En el caso de dos
variables, siendo una de ellas (X) variable independiente y la otra (Y) la dependiente, se habla de regresin de
Y sobre X; Por ejemplo, los ingenieros forestales utilizan la regresin de la altura de los rboles sobre su
dimetro, lo cual significa que midiendo el dimetro (variable independiente) y reemplazando su valor en una
relacin definida segn la clase de rbol se obtiene la altura, y aun sin necesidad de clculos aprecian la
altura utilizando grficas de la funcin de dependencia, altura = funcin del dimetro.
La parbola de los mnimos cuadrados
La parbola de mnimos cuadrados que aproxima el conjunto de puntos (X1,Y1) , (X2,Y2),
(X3,Y3),..(XN,YN) tiene ecuacin dada por Y=a0+a1X+a2X2, donde las constantes a0, a1 y a2 se
determinan al resolver simultneamente el sistema de ecuaciones que se forma al multiplicar la ecuacin
Y=a0+a1X+a2X2por 1, X, Y sucesivamente, y sumando despus.

EJEMPLO ILUSTRATIVO
La siguiente tabla muestra la poblacin de un pas en los aos 1960-2010 en intervalos de 5 aos.
Ao 1960 1965 1970 1975 1980 1985 1990 1995 2000 2005 2010
Poblacin
(millones)
4,52 5,18 6,25 7,42 8,16 9,12 10,92 11,62 12,68 13,12 13,97
1) Ajustar una parbola de mnimos cuadrados de la forma Y=a0+a1X+a2X2
2) Calcular los valores de tendencia para los aos dados.
3) Estimar la poblacin para los aos 2015 y 2020.
4) Calcular el coeficiente de determinacin.
5) Elaborar un diagrama de dispersin, y en el mismo diagrama graficar la parbola de los mnimos
cuadrados.
Nota: Se recomienda codificar o cambiar la numeracin de los aos, eligiendo X de modo que el ao central,
1985, corresponda a X= 0, para que se hagan ms fciles los clculos.
Solucin:
1) Para ajustar una parbola de mnimos cuadrados se llena la siguiente tabla:

Se reemplaza valores en el sistema y se obtiene:

Resolviendo el sistema empleando determinantes (regla de Cramer) se obtiene:

a0=22175524,8+0+0-12349986-0-02369180+0+0-1331000-0-0=9825538,81038180=9,464

a1=23577549,48+0+0-1324466-0-01038180=2357549,481038180=0,995

a2=1234998,6+0+0-1245816-0-01038180=-10817,41038180=-0,01
El sistema resuelto en Excel se muestra en la siguiente figura:

Reemplazando los valores encontrados se obtiene la ecuacin de la parbola de mnimos cuadrados:
Y=a0+a1X+a2X2?? Y = 9,464 + 0,995X - 0,01X2
2) Los valores de tendencia se obtienen al reemplazar los valores de X en la ecuacin de la parbola de
mnimos cuadrados, los cuales se presenta en la siguiente tabla:
Ao X Y
Valores de tendencia
Y = 9,464 + 0,995X - 0,01X2
1960 -5 4,52 4,24
1965 -4 5,18 5,32
1970 -3 6,25 6,39
1975 -2 7,42 7,43
1980 -1 8,16 8,46
1985 0 9,12 9,46
1990 1 10,92 10,45
1995 2 11,62 11,41
2000 3 12,68 12,36
2005 4 13,12 13,28
2010 5 13,97 14,19
3) Para estimar la poblacin de los aos 2015 y 2020 se transforma estos aos a X siguiendo la secuencia de
la tabla anterior, siendo X = 6 para el ao 2015 y X= 7 para el 2020
Entonces para el 2015 se tiene:
Y = 9,464 + 0,995X - 0,01X2 =9,464 + 0,995(6) - 0,01(6)2 = 9,464 + 5,97-0,36 =15,074
Para el 2020 se tiene:
Y = 9,464 + 0,995X - 0,01X2 =9,464 + 0,995(7) - 0,01(7)2 = 9,464 + 6,965-0,49 =15,939
4) Se llena la siguiente tabla y se aplica la ecuacin para calcular el coeficiente de Pearson
Ao X Y X2 XY Y2
1960 -5 4,52 25 -22,6 20,430
1965 -4 5,18 16 -20,72 26,832
1970 -3 6,25 9 -18,75 39,063
1975 -2 7,42 4 -14,84 55,056
1980 -1 8,16 1 -8,16 66,586
1985 0 9,12 0 0 83,174
1990 1 10,92 1 10,92 119,246
1995 2 11,62 4 23,24 135,024
2000 3 12,68 9 38,04 160,782
2005 4 13,12 16 52,48 172,134
2010 5 13,97 25 69,85 195,161
S 0 102,96 110 109,46 1073,490
r=NXY-XYNX2-X2NY2-Y2=11109,46-0102,9611110-02111073,490-102,962
r=0,996
Elevando al cuadrado coeficiente de Pearson queda calculado el coeficiente de determinacin.
Coeficiente de determinacin = r2=0,9962=0,992
El coeficiente de determinacin calculado en Excel se muestra en la siguiente figura:

5) El diagrama de dispersin y la parbola de los mnimos cuadrados mediante el programa Graph se muestra
en la siguiente figura:

Referencias bibliogrficas
SPIEGEL, Murray, (2000), Estadstica, Serie de Compendios Schaum, Ed. McGraw-Hill, Mxico.
SUREZ, Mario, (2011), Interaprendizaje de Estadstica Bsica,
TAPIA , Fausto Ibarra, Ecuador.
SUREZ, Mario, (2004), Interaprendizaje Holstico de Matemtica, Ed. Grficas Planeta, Ibarra,
Ecuador.



Leer ms: http://www.monografias.com/trabajos86/analisis-regresion-parabola-minimos-cuadros/analisis-
regresion-parabola-minimos-cuadros.shtml#laparabola#ixzz3HMYmCcpJ

V I E R NE S , 2 8 D E MA R Z O D E 2 0 0 8
3: La parbola de mnimos cuadrados



El ajuste de datos a frmula usando un modelo linear es excelente cuando los datos
sigan una tendencia linear. Sin embargo, en muchas ocasiones los datos no siguen
una tendencia linear. Considrese como ejemplo la siguiente coleccin de diez
datos:


Si graficamos esta coleccin de diez datos, obtendremos lo siguiente:


De la grfica no resulta claro cmo podamos describir esta coleccin de datos con
una frmula emprica linear. Podemos forzar una lnea recta sobre esta coleccin
de datos llevando a cabo el anlisis de regresin, haciendo ciegamente los clculos
matemticos usuales para obtener el "mejor ajuste" linear. Sin embargo, la frmula
as obtenida tal vez no nos ser de mucha utilidad para estimar lo que ocurrir con
otros valores no graficados.

Si nos hacemos a la idea de que esta coleccin de datos puede ser mejor descrita
por un modelo no-linear, entonces un primer paso hacia esta direccin consistira
en utilizar un polinomio de grado n:
Y = a + bx + cx
2
+ dx
3
+ ex
4
+ ...

Lo primero que se nos podra ocurrir sera utilizar un polinomio cuyo grado
corresponda directamente con la cantidad de puntos que hay en la grfica. De este
modo, as como en una grfica en la que hay nicamente dos puntos utilizaramos
una lnea recta para unir dichos puntos, en una grfica en la que hay tres puntos
usaramos un polinomio cuadrtico de grado 2, en una grfica en la que hay cuatro
puntos usaramos un polinomio cbico de grado 3, y as sucesivamente. Este
procedimiento matemtico es conocido como la interpolacin. Esto ciertamente
hara pasar la curva exactamente por cada uno de los puntos de la grfica, como se
muestra a continuacin:


Veamos a continuacin dos ejemplos de ello.


PROBLEMA: Para un experimento del cual estn nicamente disponibles los
tres datos que aparecen en la siguiente grfica:


Cul ser la frmula emprica que mejor se pueda ajustar a estos datos?

Intentar llevar a cabo un ajuste de mnimos cuadrados para obtener la lnea de
regresin que mejor se aproxime a los tres datos mostrados en la grfica ser una
prdida de tiempo, ya que los puntos no muestran tendencia alguna de agruparse
en las proximidades de una lnea recta. Sin embargo, podemos tratar de llevar a
cabo aqu un ajuste utilizando como modelo un polinomio cuadrtico, haciendo
pasar los tres puntos exactamente a lo largo del polinomio:
P(X) = a0 + a1X + a2X
2


Sustituyendo los tres pares de datos A(X1, Y1)=(1,1), B(X2, Y2)=(2,8) y C(X2,
Y2)=(3,2) en el polinomio cuadrtico:
1 = a0 + a1(1) + a2(1)
2


8 = a0 + a1(2) + a2(2)
2


2 = a0 + a1(3) + a2(3)
2


obtenemos el siguiente conjunto de ecuaciones que se pueden resolver como
ecuaciones simultneas:
a0 + a1 + a2 = 1

a0 + 2a1 +4a2 = 8

a0 + 3a1 + 9a2 = 2

De estas tres ecuaciones obtenemos como solucin los siguientes coeficientes:
a0 = -19

a1 = 26.5

a2 = -5.5

La frmula cuadrtica que modela exactamente los tres pares de datos es entonces:
P(X) = -19 + 26.5X - 6.5X
2


La grfica de esta frmula cuadrtica superimpuesta sobre los tres puntos discretos
que la produjeron es la siguiente:


Si los datos que produjeron la frmula cuadrtica que forzada sobre dichos datos
fueron recabados de la vida real, la dificultad con el mtodo del ajuste exacto es que
si se recaban posteriormente datos adicionales para valores de Y en otros puntos de
X tales como X=1.5 y X=2.5, tales puntos adicionales no pueden ser utilizados para
refinar el modelo, ya que su derivacin no admite ms que tres pares de datos; en
cuyo caso la recabacin de datos adicionales slo servir para confirmar o desechar
la frmula cuadrtica obtenida, no para mejorarla y refinarla.


PROBLEMA: Llevar a cabo un ajuste exacto de los siguientes datos
X1 = -1, Y1 = 0
X2 = 0, Y2 = 0
X3 = 1, Y3 = 0.1
X4 = 1.3, Y4 = 1

a un polinomio cbico:
P(X) = a0 + a1X + a2X
2
+ a3X
3


Hay tantos datos como coeficientes ai en el polinomio, lo cual nos permite llevar a
cabo un ajuste exacto que de otro modo no se podra llevar a cabo si hubiese menos
datos que coeficientes o ms datos que coeficientes. Para llevar a cabo el ajuste
exacto, simplemente substitumos los pares de valores en el polinomio cbico para
obtener as cuatro ecuaciones que se pueden resolver como ecuaciones lineares
simultneas:
a0 + a1(-1) + a2(-1)
2
+ a3(-1)
3
= 0

a0 + a1(0) + a2(0)
2
+ a3(0)
3
= 0

a0 + a1(1) + a2(1)
2
+ a3(1)
3
= 0.1

a0 + a1(1.3) + a2(1.3)
2
+ a3(1.3)
3
= 1

De estas cuatro ecuaciones obtenemos los siguientes coeficientes:
a0 = 0

a1 = -0.898

a2 = 0.05

a3 = 0.948

El polinomio cbico que representa los cuatro pares de datos es entonces:
P(X) = -.898X + 0.05X
2
+ 0.948X
3


La grfica del polinomio cbico superimpuesto sobre los cuatro puntos discretos
que lo produjeron es la siguiente:


Todos los puntos caen exactamente sobre la curva, tal y como lo habamos
anticipado.

Una inspeccin de la curva nos muestra que tres de los puntos parecen estar
agrupados en torno a lo que parece ser una lnea casi horizontal. La nica nota
discordante la d el punto situado en X4 = 1.3, lo cual nos debe poner a reflexionar.

Si los cuatro puntos proporcionados para hacer un ajuste exacto a un polinomio
cbico hubiesen sido obtenidos experimentalmente, el hecho de que tres de los
cuatro puntos parecen estar situados en torno a una lnea recta nos debe hacer
preguntarnos: no cabe la posibilidad de que el cuarto punto no situado cerca de
dicha recta haya sido el resultado de algn grave error experimental en vez de un
error de naturaleza estadstica? De cualquier manera, es necesario mantener la
mente abierta a la posibilidad de que el punto discordante sea un dato genuino, de
modo tal que si repetimos el experimento nicamente para dicho punto
volveramos a obtener un resultado cercano al que obtuvimos anteriormente. Como
una alternativa para resolver esta incgnita, podemos recabar ms datos
experimentales obteniendo informacin para otros puntos que no haban sido
considerados, por ejemplo X=-0.5, y X=+0.5. Pero en tal caso ya no es posible
tratar de llevar a cabo un ajuste exacto a una frmula cbica; requeriramos en todo
caso un polinomo de quinto grado. Y si recabamos once datos experimentales,
requeriramos un polinomio de grado diez para poder llevar a cabo un ajuste exacto
haciendo pasar la curva sobre todos los diez puntos. Independientemente de la
complejidad matemtica de estar manejando polinomios de orden creciente, est el
hecho de que le estemos dando tanta importancia al hecho de forzar la curva que
estamos modelando a pasar exactamente sobre todos los puntos, lo cual ignora
rotundamente el hecho de que los datos experimentales siempre tienen alguna
dosis de "ruido" estadstico, alguna dosis de error aleatorio que les impide caer de
modo exacto sobre una curva si es que existe una curva derivada tericamente
capaz de describir lo que estamos observando. Por otro lado, la desventaja de los
polinomios de alto grado es su tendencia a oscilar violentamente no solo fuera del
rango de valores considerados en un experimento, sino inclusive entre las zonas
intermedias a los puntos en los cuales se llevaron a cabo las mediciones. Obsrvese
en la curva del polinomio de tercer grado cmo para valores inferiores a X=-1.5 el
valor vertical se desploma bruscamente, ocurriendo algo similar para valores de X
superiores a X=+1.5 en donde los valores de P(X) ascienden en forma aguda. Para
polinomios de alto grado, este comportamiento oscilatorio violento se puede
convertir en un asunto completamente impredecible, consecuencia directa de estar
insistiendo en llevar a cabo un modelaje exacto que haga pasar todos los datos
experimentales sobre una curva.

El procedimiento de interpolacin resulta adecuado para resolver problemas
analticamente exactos, lo cual no ocurre con los datos experimentales en donde los
datos rara vez "caen" exactamente en un valor que podra considerarse ideal, en
donde la dispersin de los datos con respecto a un ajuste "ideal" es debida al error
experimental y en donde carece de sentido el tratar de ajustar exactamente una
cantidad determinada de datos a una frmula polinmica. Es por ello que, as como
en el ajuste de una frmula linear a una coleccin de datos que parecen seguir una
tendencia linear recurrimos al mtodo de los mnimos cuadrados, este mismo
mtodo de los mnimos cuadrados es extendido para poder ser aplicado a frmulas
polinmicas, lo cual nos permite mantener el grado del polinomio bajo control sin
permitirle que crezca desmesuradamente al ir agregando pares adicionales de
puntos (en otras palabras, bajo el criterio de los mnimos cuadrados podemos
tratar de ajustar 101 pares de puntos a un polinomio cuadrtico o a un polinomio
cbico en vez de vernos forzados a tener que recurrir a un polinomio de grado 100
si insistimos en tratar de llevar a cabo un ajuste exacto de los datos a la frmula
que estamos desarrollando).

Si un conjunto de pares de datos al ser graficados no muestra un agrupamiento en
torno a una lnea recta sino en torno a una curva, como primera aproximacin
podemos intentar hacer un "ajuste" a la curva ms elemental de todas, la
parbola, lo cual en trminos sencillos significa intentar llevar a cabo el ajuste de
los datos a un polinomio cuadrtico como el siguiente:
Y = a0 + a1X + a2X

Se ha llevado a cabo un ligero cambio de notacin en los parmetros del polinomio,
en preparacin para la eventual generalizacin hacia un "ajuste" de mnimos
cuadrados con una curva correspondiente a un polinomio de grado p.

Procediendo exactamente de la misma manera como lo hicimos con la recta de
mnimos cuadrados, podemos postular la diferencia entre cada valor real de
Y=Y1,Y2,Y3,...,YN y cada valor calculado para su correspondiente Xi usando la
ecuacin cuadrtica de mnimos cuadrados, lo cual nos d la "distancia" vertical Di
que aleja a ambos valores:
D1 = a0 + a1X1 + a2X1 - Y1

D2 = a0 + a1X2 + a2X2 - Y2

D3 = a0 + a1X3 + a2X3 - Y3

.
.
.

DN = a0 + a1XN + a2XN - YN

Y al igual que como lo hicimos al buscar la recta de los mnimos cuadrados,
tambin aqu extendemos el criterio de buscar el polinomio cuadrtico que sea tal
que la suma de los cuadrados de las distancias verticales de cada uno de los puntos
"reales" a los puntos calculados de acuerdo a dicho polinomio sea un mnimo. En
pocas palabras, queremos minimizar la funcin:
S = [a0 + a1X1 + a2X1 - Y1] + [a0 + a1X2 + a2X2 - Y2] + [a0 + a1X3 + a2X3
- Y3]
_______+ ... + [a0 + a1XN + a2XN - YN]

Puesto que ahora tenemos tres parmetros en lugar de dos, tenemos que llevar a
cabo tres diferenciaciones parciales, las cuales nos conducen eventualmente a los
siguientes tres sistemas de ecuaciones:
a0N + a1X + a2X = Y

a0X + a1X + a2X
3
= XY

a0X + a1X
3
+ a2X
3
= XY

Este conjunto de ecuaciones es conocido como las ecuaciones normales para la
parbola de mnimos cuadrados. De nueva cuenta, tenemos un sistema de
ecuaciones simultneas, con tres incgnitas, los parmetros a0, a1 y a2, que
definirn la curva de los mnimos cuadrados para un conjunto dado de datos que
parezcan seguir un crecimiento exponencial de segundo grado.


PROBLEMA: Ajustar, segn convenga, a una recta o a una parbola de
mnimos cuadrados los datos dados por la siguiente tabla:


El primer paso obligado antes de tratar de ajustar una serie de datos a una frmula
consiste en poner los datos sobre una grfica para intentar descubrir la tendencia
mostrada por los datos. En este caso, la grfica resulta ser:


Aunque a primera vista nuestro primer impulso sea el tratar de llevar a cabo un
ajuste utilizando una recta de mnimos cuadrados, el punto que aparece en la
grfica para X0=0 si realmente representa no una equivocacin en la toma de una
lectura sino un dato genuinamente vlido nos debe llevar a pensar en la posibilidad
de que los datos en vez de estar modelados por una lnea recta tal vez estn
modelados por una curva. Y la curva ms sencilla de todas es la proporcionada por
un polinomio de segundo grado, un polinomio cuadrtico. Utilizando las
ecuaciones normales derivadas arriba, la parbola de mnimos cuadrados resulta
ser:
Y = 2.51 - 1.20X + .733X

El graficado de esta curva, sobrepuesta sobre los datos experimentales, presenta el
siguiente aspecto:


Podemos ver que el ajuste de los datos a una frmula cuadrtica es bastante bueno.
Y no slo eso, sino que nos permite detectar la presencia de lo que parece ser un
mnimo. Este mnimo muy bien podra ser un punto ptimo para minimizar las
prdidas en un proceso industrial, obtener el mayor grado de pureza en un proceso
qumico, o lograr la mejor calidad en una aleacin. Y pudimos utilizar los siete
pares de datos experimentales para llevar a cabo el modelaje sin necesidad de tener
que recurrir a un polinomio de grado seis si hubiramos insistido en un ajuste
exacto de los datos. Podemos ver de inmediato en la grfica que el punto mnimo
de la parbola est situado aproximadamente en el punto X=0.25, y podemos
obtener una mejor aproximacin numrica mediante el clculo diferencial tomando
la derivada de la parbola de los mnimos cuadrados e igualando a cero la derivada.
Armados con esta informacin, podemos planear la conduccin de un solo
experimento en el cual le demos a la variable X (que se presume est bajo nuestro
control) el valor 0.25 con el fin de confirmar si realmente hay all un punto
mnimo. Obsrvese el paso trascendental que estamos dando aqu. De una serie de
puntos discretos, tras llevar a cabo el ajuste de los datos a una frmula estamos
anticipando la existencia de un mnimo, y no solo ello sino que estamos
anticipando la zona en la cual est localizada dicho punto mnimo. Este es
precisamente uno de los objetivos en ajustar una serie de datos a una frmula, el
poder utilizar dicha frmula para intentar hacer predicciones dentro de los rangos
estudiados, o inclusive extrapolar la frmula fuera de los rangos estudiados.


PROBLEMA: Con el fin de determinar el valor de la constante g, la aceleracin
causada por la accin de la gravedad sobre la superficie de la Tierra, un grupo de
estudiantes llev a cabo un experimento en el cual se midi el tiempo que tardaba
en caer un objeto desde un edificio a lo largo de alturas diferentes, midindose el
tiempo a distancias prefijadas. Si los resultados obtenidos fueron los siguientes:


Considerando a t como la variable independiente y a y como la variable
dependiente, cul ser la parbola que mejor se ajuste a estos datos? Sabiendo
que la frmula terica es y=gt en donde g es la aceleracin de la gravedad,
obtener el valor de g a partir de estos datos experimentales. Calcular asimismo
las alturas que, segn la curva de mnimos cuadrados, deberan de haber
obtenido los estudiantes para cada uno de los tiempos transcurridos.

El graficado de los puntos obtenidos experimentalmente es el siguiente:


La grfica nos indica que, dentro de los mrgenes de error que se pueden esperar
de cualquier experimento que se lleva a cabo, los datos parecen ajustarse mejor a
una curva parablica que a una lnea recta. Utilizando las ecuaciones normales
derivadas arriba, la parbola de mnimos cuadrados resulta ser:
Y = 5.089t
2


La grfica continua de esta frmula superimpuesta sobre los datos experimentales
con los que fu obtenida es la siguiente:



Si la frmula terica de la aceleracin causada por la gravedad de la Tierra es
y=gt, entonces el valor de dicha aceleracin g ser:
g = 5.089

g = 10.178

Este valor compara favorablemente con el valor conocido de g=9.8
metros/segundo. El problema demuestra que un ajuste de mnimos cuadrados se
encarga de "promediar" la tendencia con respecto a los datos experimentales, y
entre ms datos experimentales se tengan, tanto mejor.

Este problema es representativo de aquellos problemas en los cuales se ha derivado
ya previamente un modelo terico que explica cierto comportamiento de alguna
fenmeno natural, y en los cuales el propsito de llevar a cabo un ajuste de datos a
una frmula es obtener un valor para alguna constante como lo es en este caso la
aceleracin de la gravedad sobre la superficie terrestre.

http://www.amstat.org/publications/jse/v3n1/datasets.dickey.html


PROBLEMA: En la investigacin de accidentes automovilsticos, el tiempo total
requerido para el frenado total de un automvil despus de que el conductor ha
percibido un peligro est compuesto de su tiempo de reaccin (el tiempo que
transcurre en su deteccin del peligro y la aplicacin de los frenos) ms el tiempo
de frenado (el tiempo que tarda el automvil en detenerse despus de la
aplicacin de los frenos). La siguiente tabla proporciona la distancia de frenado D
en pies de un automvil que viaja a diversas velocidades V en millas por hora al
momento en el cual el conductor detecta un peligro.


Obtener la parbola de mnimos cuadrados en la forma
D = a0 + a1V + a2V

que describe al conjunto de datos. En base a esta frmula, estimar la distancia D
de frenado cuando el automvil se est desplazando a 45 millas por hora y a 80
millas por hora.

La parbola de mnimos cuadrados resulta ser:
D = 41.77 - 1.096V + .08786V

La grfica de esta frmula superimpuesta sobre los datos dados es la siguiente:



En base a esta frmula, las distancias de frenado cuando el automvil se est
desplazando a 45 millas por hora y a 80 millas por hora son:
D = 41.77 - 1.096(45) + .08786(45)

D = 170 pies

D = 41.77 - 1.096(80) + .08786(80)

D = 516 pies

Obsrvese que en este problema al hacer el clculo de la distancia de frenado D
para una velocidad V= 80 millas/hora estamos extrapolando los datos yendo
ms all de la velocidad V= 70 millas/hora para la cual fueron obtenidos, haciendo
una prediccin que v ms all de lo que podramos llamar nuestra "zona de
confianza". Siempre hay un riesgo al hacer este tipo de extrapolaciones, y ms de
un estadstico ha quedado en el ridculo al hacer este tipo de extrapolaciones,
aunque en este caso el buen ajuste de los datos a una frmula cuadrtica nos debe
dar cierta tranquilidad de que el resultado real no estar alejado de lo que estamos
prediciendo.

Este problema es representativo de aquellos problemas en los cuales las
conclusiones que se puedan sacar de los mismos pueden tener inclusive
repercusiones de carcter legal.

El procedimiento que hemos estudiado en esta seccin se puede extender para
llevar a cabo un ajuste de un conjunto de datos a un polinomio de tercer grado, un
polinomio cbico cuya representacin general es la siguiente:
Y = a0 + a1X + a2X + a3X
3


Procedemos ahora de la misma manera como lo hicimos con la parbola de
mnimos cuadrados, postulando la diferencia entre cada valor real de
Y=Y1,Y2,Y3,...,YN y cada valor calculado para su correspondiente Xi usando lo
que vendr siendo la ecuacin cbica de mnimos cuadrados, lo cual nos d la
"distancia" vertical Di que aleja a ambos valores:
D1 = a0 + a1X1 + a2X1 + a3X1
3
- Y1

D2 = a0 + a1X2 + a2X2 + a3X2
3
- Y2

D3 = a0 + a1X3 + a2X3 + a3X3
3
- Y3

.
.
.

D1 = a0 + a1XN + a2XN + a3XN
3
- Y1

Y al igual que como lo hicimos al buscar la recta de los mnimos cuadrados,
tambin aqu extendemos el criterio de buscar el polinomio cuadrtico que sea tal
que la suma de los cuadrados de las distancias verticales de cada uno de los puntos
"reales" a los puntos calculados de acuerdo a dicho polinomio sea un mnimo. En
pocas palabras, queremos minimizar la funcin:
S = [a0 + a1X1 + a2X1 + a3X1
3
- Y1] + [a0 + a1X2 + a2X2 + a3X2
3
- Y2]

+ [a0 + a1X3 + a2X3 + a3X3
3
- Y3] + ... + [a0 + a1XN + a2XN + a3XN
3
- YN]

Ahora tenemos cuatro parmetros en lugar de tres, lo cual significa que tenemos
que llevar a cabo cuatro diferenciaciones parciales con respecto a a0, a1, a2 y a3, las
cuales nos conducen eventualmente a cuatro sistemas de ecuaciones simultneas.
La resolucin de estas ecuaciones simultneas procede exactamente de la misma
manera que la forma en la cual se resolvieron los casos para la ecuacin de
regresin linear y la parbola de mnimos cuadrados, y no ser repetido aqu. El
resultado final de todo esto es, como ya lo deberamos de haber sospechado, un
conjunto de ecuaciones normales para el polinomio cbico:
a0N + a1X + a2X + a3X
3
= Y

a0X + a1X + a2X
3
+ a3X
4
= XY

a0X + a1X
3
+ a2X
4
+ a3X
5
= XY

a0X
3
+ a1X
4
+ a2X
5
+ a3X
6
= X
3
Y

Obsrvese que la formacin de las ecuaciones normales para polinomios de grado
superior va siguiendo un patrn definido, e inclusive podemos formularnos una
"regla" para obtener las ecuaciones normales para un polinomio cualquiera de
grado n. Sin embargo, para polinomios de grado mayor que 4, este ejercicio resulta
futil por la cantidad excesiva de clculos aritmticos repetitivos que tendramos
que estar llevando a cabo si recurrimos directamente a las ecuaciones normales tal
y como estn expresadas arriba, siendo esta la razn por la cual nos vemos en la
necesidad de desarrollar tcnicas un poco ms sofisticadas que nos permitan
resolver las ecuaciones normales de una manera abreviada.

Al igual que como ocurri cuando la tcnica para la obtencin de la recta de
mnimos cuadrados en una sola variable independiente X fue extendida para cubrir
una regresin mltiple en dos o ms variables X1, X2, X3, etc., tambin la parbola
de mnimos cuadrados puede ser extendida para llevar a cabo un ajuste a una
frmula con dos o ms variables en trminos lineares y cuadrticos. La frmula de
regresin mltiple general ms sencilla posible involucrando trminos lineares y
cuadrticos, con slo dos variables independientes X1 y X2 e ignorando la
posibilidad de trminos de interaccin, es la siguiente:
Y = + 1X1 + 2X2 + 11X1
2
+ 22X2
2


Dadas las dificultades para poder visualizar las relaciones que toman lugar cuando
estamos manejando o modelando frmulas cuadrticas que involucran regresiones
mltiples, el Departamento de Matemticas y Estadstica de la Universidad York en
Ontario, Canad, ha puesto a disposicin de sus alumnos y de la comunidad
acadmica mundial una pgina en la cual se pueden ver en forma dinmica (ya sea
girando tridimensionalmente las superficies que corresponden a una regresin
mltiple o variando parmetros tales como los trminos de interaccin) utilizando
para ello archivos animados GIF generados con la ayuda del paquete
computacional SAS desarrollado y vendido por la divisin Academic Technology
Services (ATS) de la University of California at Los Angeles (UCLA). Esta pgina se
puede descargar del siguiente domicilio:

http://www.math.yorku.ca/SCS/spida/lm/visreg.html

De esta pgina se ha tomado un archivo que grafica en tres dimensiones la
siguiente frmula:
Y = 20 - 2X1 + 2X2 - 0.2X1
2
- 0.2X2
2


El archivo es el siguiente (el archivo con efectos animados se puede obtener
recurriendo a la pgina de donde fue obtenido):

Aunque el modelaje de datos a superficies cuadrticas se puede llevar a cabo
resolviendo el conjunto de ecuaciones normales producido por el modelo
matemtico que est siendo considerado, los clculos pueden resultar engorrosos y
hasta fastidiosos cuando son hechos a mano a este nivel de complejidad, razn por
la cual es preferible recurrir a otro mtodo en el cual todo lo que tengamos que
hacer es montar algn vector o alguna matriz de valores sobre los cuales podamos
llevar a cabo los clculos en una serie breve de pasos con la ayuda de algn
programa computacional para manejar vectores y matrices. Esto es precisamente lo
que veremos en la siguiente seccin en donde trataremos acerca de un mtodo
matricial general que abrevia los pasos que deben llevarse a cabo para este tipo
de modelajes.
-
I. MTODOS DE INTERPOLACIN Y
AJUSTE
I.1. INTRODUCCIN
Es frecuente la necesidad de buscar funciones apropiadas a partir de datos que proceden de
una poblacin en la que se ha realizado un registro de informaciones o estudio estadstico,
para que cumplan determinadas condiciones que nos interesen, como que sean continuas,
derivables, etc. Con este objetivo trataremos de plantear distintos procedimientos para
realizar la bsqueda de estas funciones, bien buscando una funcin que pase exactamente
por una serie de puntos (funcin de interpolacin) o bien que esa funcin elegida por
nosotros se adapte lo mejor posible a una serie o a una nube de puntos (funcin de ajuste o
regresin).
La finalidad del clculo de las funciones de interpolacin se centra en la necesidad de
obtener valores intermedios (INTERPOLACIN) o de valores fuera del intervalo para el
que se dispone de datos (EXTRAPOLACIN).
I.2. MTODOS DE INTERPOLACIN
Un problema clsico de la matemtica, se plantea al querer calcular el valor de una funcin
en un punto cuando no se conoce la funcin o incluso cuando la funcin no existe,
conocindose nicamente una serie de puntos. La resolucin aproximada del problema
consiste en encontrar una funcin fcil de construir y de evaluar, que coincide con la
funcin objeto del problema con los datos de que se dispone. Se dice que la funcin as
construida interpola a la funcin dada con respecto a los datos.
Se trata de determinar fundamentalmente dos cosas:
1. Los datos que se desea que sean comunes a la funcin desconocida y a la funcin
interpoladora.
2. Que tipo de funcin se va a utilizar como funcin interpoladora o funcin de
interpolacin.
I.2.1. Interpolacin polinmica.
Se puede plantear como ejemplo lo siguiente: Sea f una funcin de una variable cuyo valor
se conoce en n + 1 puntos: , llamaremos:

y se desea calcular su valor aproximado para una valor cualquiera de x.
La literatura matemtica clsica, utiliza una funcin interpoladora de tipo polinmico de
grado no mayor que n, siendo n el nmero de puntos conocidos menos uno.

I.2.1.1. Mtodo matricial
As, dada una funcin , de la que se conocen en n+1
puntos . Se trata de buscar un polinomio de
grado n que pase por los puntos de forma que:

las condiciones impuestas determinan que los coeficientes deben verificar:


para i = 0,1,....., n
la existencia y unicidad del sistema depende del determinante de Vandermonde siguiente:

que desarrollndolo, obtenemos:

si los son distintos, se tendr con lo que el sistema tendr solucin nica.
Expresndolo en forma matricial:
e
, por tanto, despejando
Ejemplo:
Construir el polinomio interpolador que pase por los puntos:

construyendo la matriz:

y el vector de ordenadas:

se comprueba que:

siendo su inversa:

Por tanto:


obtenindose el polinomio interpolador:

Ahora bien, para obtener los polinomios de interpolacin existen otros mtodos, como los
siguientes:
- Polinomios de Lagrange
- Polinomios de Interpolacin parablica progresiva.
- Polinomios de Newton.
- Polinomios de Gauss.
I.2.1.2. Mtodos de Interpolacin parablica progresiva:
El mtodo de Interpolacin parablica progresiva es recurrente y se basa en la idea de
utilizar la interpolacin introduciendo progresivamente dos, tres, cuatro puntos, etc. Esto
es:

donde:

Ejemplo:
Construir el polinomio interpolador por el mtodo de Interpolacin parablica
progresiva, que pase por los puntos:

Se construyen los polinomios introduciendo progresivamente los puntos, de la siguiente
manera:
- En primer lugar se calcula la recta que pasa por los puntos:




- A continuacin se construye una parbola cuadrtica que pase por los puntos:


siendo:

y sustituyendo:


- Y finalmente la parbola cbica que pasa por los cuatro puntos:


siendo:

sustituyendo:

obtenindose el polinomio interpolador para los cuatro puntos:

I.2.1.3. Polinomios de Lagrange.
Se trata de construir un polinomio de grado n, que se anule en los puntos (que pase por los
puntos): salvo en uno en el que valdr 1.
Dicho polinomio ser de la forma: siendo a un nmero real
cualquiera.
Para se tendr , lo que determina el valor de a, por tanto:

As, el polinomio que buscamos ser de la forma:

y para que el polinomio interpolador de grado n, que buscamos, tome los valores y
0
, y
1
, ... ,
y
n
en los puntos x
0
,x
1
, ... , x
n
, es suficiente con que se verifique:

si los valores Y
k
proceden de una funcin f, en los puntos X
k
, se tendr:

llamndose dicha expresin frmula de Lagrange del polinomio de interpolacin y a los l
k

polinomios de Lagrange.
Ejemplo:
Construir el polinomio interpolador por el mtodo de Lagrange, que pase por los puntos:

siendo el polinomio interpolador:

As mismo:

y

por tanto:

Por ello, introduciendo los datos:




Se obtienen finalmente el polinomio interpolador:


I.2.1.4. Frmula de Newton para el polinomio de interpolacin
Sea el polinomio que interpola a f(x) en los puntos , y el
polinomio que interpola a f(x) en . La diferencia entre ambos es un
polinomio de grado no mayor que n, que se anula para , ya que en dichos
puntos , y en consecuencia:

obtenindose:

dando a x el valor , por ser , se tiene:

como se puede llamar , construyndose a partir de la frmula
anterior . Obtenemos, por tanto, la expresin del polinomio de interpolacin
siguiente:

Por convenio se llama diferencia dividida a la expresin:

siendo:


La Frmula de Newton, por tanto, sera:

que recibe el nombre de frmula de Newton del polinomio de interpolacin.
El clculo de las diferencias divididas se realizara as:

por simetra:

Por tanto, tendramos las diferencias divididas siguientes:

Ejemplo:
Construir el polinomio interpolador por el mtodo de Newton, que pase por los puntos:

siendo el polinomio interpolador:

que en nuestro caso ser:

Obtenemos las diferencias divididas :

Por tanto, el polinomio interpolador sera:

Finalmente:

I.2.1.5. Frmula de Gauss para el polinomio de interpolacin usando
diferencias finitas:
Para definir las diferencias finitas, consideramos una funcin f(x) de una sucesin de
valores de x equidistantes entre s, esto es: donde .
siendo:

Se llama diferencia progresiva de f(x) en a:

la segunda diferencia progresiva, ser:

en general:

que se llama diferencia progresiva de orden n
As, se puede construir una tabla con las diferencias progresivas de rdenes sucesivos de la
forma siguiente:

El polinomio de interpolacin usando diferencias finitas sera:

que reciben el nombre de frmulas de Newton progresivas.
Ejemplo:
Construir el polinomio interpolador por el mtodo de Newton con diferencias progresivas
de f(x), que pase por los puntos: siendo el polinomio
interpolador:

en el problema, siendo el polinomio de interpolacin:

Calculando las diferencias progresivas:

sustituyendo tenemos:

y operando se obtiene el polinomio:

I.3. MTODOS DE AJUSTE
Es el conjunto de mtodos que permiten ajustar los datos de forma que se puedan realizar
clculos estimativos posteriores. Lo ms frecuente, es que no sea posible encontrar una
funcin sencilla que pase por todos los puntos que representan a los datos y sea capaz de
representar adecuadamente el perfil deseado. En estos casos, se recurre a los MTODOS
DE AJUSTE , que pretenden obtener una funcin que cumpla los requerimientos de
suavidad (continuidad y derivabilidad) y que se parezca lo ms posible a los datos, aunque
no pase exactamente por ellos.
Los mtodos para la bsqueda de estas funciones de ajuste, se pueden clasificar en:
. Mtodos grficos
. Mtodos paramtricos.
. Mtodos no paramtricos
Describimos brevemente cada uno de ellos.
Mtodos grficos:
Se basan en la descripcin de la grfica que muestre valores de una variable dependiente en
funcin de los valores de una variable independiente, por ejemplo, las tasas o
probabilidades (variable dependiente) en funcin de la edad, la fecha, etc. (variable
independiente).
Estas grficas, permiten una fcil comparacin entre diferentes estudios, sobre un mismo
fenmeno, en distintas situaciones (pases, pocas, etc.).
Mtodos paramtricos:
Los valores de la variable dependiente, como tasas o probabilidades, se especifican
mediante una funcin, con un nmero de parmetros finito, que depende de la variable
independiente, como la edad, fecha, etc..
El ajuste de dicha funcin a los datos, se suele realizar utilizando los mtodos clsicos, si se
desea que la funcin pase por unos puntos dados, o mtodos de ajuste, si se desea
aproximar una determinada funcin a una serie de puntos, que nos permiten, en ambos
casos, estimar los parmetros.
Mtodos no-paramtricos:
No proponen ningn modelo de funcin para describir el comportamiento de los datos. Las
tasas o probabilidades se obtienen mediante mtodos de suavizado recurrentes, que utilizan
los datos conocidos en edades adyacentes.
Veamos, a continuacin, algunos de los mtodos de ajuste paramtricos de los datos
empricos.
I.3.1. Mtodos de ajuste paramtricos
Son mtodos alternativos a los mtodos de interpolacin. Distinguiremos entre los mtodos
de regresin, en los que se tratar de adaptar una funcin a una masa de datos empricos
(nube de puntos) y los mtodos de ajuste, en los que se adaptar una funcin a un conjunto
limitado de puntos empricos observados o bien procedentes de funciones biomtricas:
, obligando a que la funcin represente suficientemente los
datos, suavizando los puntos. Es decir, se tratar de describir la evolucin de los datos con
ciertas funciones, que utilicen hiptesis referentes al comportamiento de los datos.
I.3.1.1 Regresin y ajuste lineales
Regresin lineal por el mtodo de los mnimos cuadrados.
Dado un conjunto de pares de puntos: Los valores de
ajuste tericos calculados, segn el modelo lineal, seran:

La discrepancia o diferencia vertical entre los valores y empricos y los valores
tericos sera:

Y la funcin como suma de las diferencias o discrepancias al cuadrado sera:

que se minimiza respecto de , para que las diferencias sean lo menores posibles,
obtenindose estimadores mnimo cuadrticos de :

y

siendo:
la covarianza muestral
la varianza muestral de la variable independiente x
son las medias mustrales.
As la recta de regresin ser:

Para dar una medida de la discrepancia global entre los datos empricos y los datos tericos,
se utiliza la varianza residual (VR), como media de las discrepancias al cuadrado:

para evitar su dependencia de la escala de medida, se mejora utilizando una medida
relativa, que sera adimensional:

o bien:

medida que oscila entre 0 y 1, siendo mejor el ajuste cuando ms se aproxime a 1 el
coeficiente R
2
.
Ajuste lineal por el mtodo de los mnimos cuadrados.
Dado un conjunto de pares de puntos: , donde a cada valor de
la variable x le corresponde un solo valor de la variable y. Los valores tericos
calculados, segn el modelo lineal, seran,:
La discrepancia o diferencia vertical entre los valores y los valores tericos segn el
ajuste, sera:

Y la funcin como suma de las diferencias o discrepancias al cuadrado sera:

que se minimiza respecto de , obtenindose los estimadores:

y

siendo:
la covarianza muestral
la varianza muestral de la variable independiente
son las medias muestrales.
As la recta de regresin ser:

Para dar una medida de la discrepancia global entre los datos empricos y los datos tericos,
se utiliza la varianza residual (VR), como en el caso anterior, como media de las
discrepancias al cuadrado:

De la misma forma, para evitar su dependencia de las escalas de medida, utilizamos una
medida relativa, que sera adimensional, esto es:

o bien:

medida que oscila entre 0 y 1, siendo mejor el ajuste cuando ms se aproxime a 1 el valor
de R
2

En los mtodos que estamos describiendo, nos referimos a mtodos de ajuste sobre
colectivos de puntos cuando para cada valor de la variable x solo exista un valor de la
variable y, frente a los mtodos de regresin sobre conjuntos de puntos (nubes de puntos)
donde para cada valor de la variable x existen varios valores de la variable y.
I.3.1.2 Ajustes no lineales
Veamos ajustes no-lineales por el mtodo de los mnimos cuadrados. Dependiendo de la
funcin que se desea ajustar, tendremos:
Funcin exponencial
Utilizando una funcin del tipo:

Que se puede linealizar utilizando logaritmos (por ejemplo logaritmos neperianos)

llamando:
, ,
,

se tiene:

que se puede tratar como un ajuste lineal por el mtodo de los mnimos cuadrados,
obtenindose , a partir de las que se calculan:
a=e
a'
y b=e
b'

Funcin potencial
Utilizando una funcin del tipo:

que se linealiza mediante logaritmos neperianos:

llamando:


b'=In b
se obtiene:

que se puede tratar como un ajuste lineal por el mtodo de los mnimos cuadrados,
obtenindose:

y

y finalmente tenemos:
a=e
a'
y b
Ejemplo:
Construir una funcin del tipo: , que se ajuste por el mtodo de mnimos
cuadrados a los puntos:



A partir de los datos tenemos:



Se obtiene:

y

deshaciendo el cambio

siendo la funcin de ajuste potencial:

Funciones polinmicas de grado superior a la unidad.
Se trata de ajustar la funcin polinmica: por el mtodo
de los mnimos cuadrados, de forma similar al ajuste de la funcin lineal, utilizando para
mayor comodidad la notacin matricial.
Siendo:
;

se tiene la solucin matricial para los coeficientes del polinomio:

Ejemplo:
Construir una funcin polinmica que se ajuste por el mtodo de mnimos cuadrados a los
puntos:
;

siendo la solucin matricial:

finalmente:

siendo el polinomio de ajuste:

I.3.1.3 Ajustes por el mtodo de las sumas (King y Hardy)
Este procedimiento permite ajustar cierto tipo de funciones no lineales al conjunto de
puntos: . Se utiliza para ello la estructura en progresin
geomtrica que se puede obtener al aplicar la funcin de ajuste a la variable x y sumar las
variables dependientes estimadas. Es un mtodo que se utiliza para ajustar
fundamentalmente funciones biomtricas y que permite combinarlo con los mtodos de
ajuste por mnimos cuadrados.
Sin embargo, el procedimiento para agrupar los datos que van a participar en las sumas no
es nico. La eleccin del tipo de funcin a ajustar condiciona el nmero de agrupamientos
en sumas o la utilizacin de mtodos por mnimos cuadrados en las fases posteriores.
Primera Ley de Makehm.
Se trata de ajustar la funcin:

a un conjunto de datos: en los que supondremos que los datos
de la variable x estn igualmente espaciados: .
El mtodo comienza por dividir los n datos en tres grupos (al menos) de h datos
consecutivos (si el nmero no es mltiplo de tres, se eliminaran uno o dos datos del inicio
o del final). Llamaremos a la suma de los h datos de la variable y del grupo i-esimo,
as:

siendo para el primer grupo (i = 1):

y para el resto de las sumas:


obteniendo las diferencias primeras de las sumas:


dividiendo las diferencias primeras:

y despejando la constante C:

siendo h el nmero de elementos de la suma y k la amplitud o distancia entre los
datos.
Utilizando los datos empricos , se calculan las sumas:

,

,

,

,

,

y finalmente:

Conocido C, se puede obtener B:

despejando:

tambin se puede utilizar , de tal forma:

o haciendo el promedio entre ambos, para suavizar la posible diferencia entre los dos
valores de la B.

Finalmente se calcula la tercera constante A.

Tambin es posible calcular A y B utilizando el mtodo de ajuste lineal por mnimos
cuadrados, a partir de la expresin

obtenindose , una vez conocido C

y

siendo:


la covarianza muestral


la varianza muestral de la
variable independiente z


son las medias muestrales.
Ejemplo:
Dado el conjunto de datos: se desea ajustarlos con
la primera ley de Makehm.
La expresin algebraica de la primera de ley de Makehm es de la forma ,
siendo necesario calcular los tres parmetros A, B y C que la caracterizan.
Planteando una tabla con los datos y utilizando el mtodo de las sumas, se utilizan tres
grupos de datos, con dos datos cada uno (h = 2), siendo los valores de la x consecutivos (k
= 1). As:

siendo:

A continuacin calculamos el parmetro B, del que tendremos dos valores:


obtenindose B como el promedio entre ambos valores

de forma similar se obtiene A del que se dispondr de tres valores:



aceptaremos como valor de A el promedio de los tres valores obtenidos, as

la funcin ajustada a los datos iniciales con la primera de la ley Makehm ser:

Atrs - Siguiente
-
AJUSTE DE FUNCIONES, (MTODO DE MINIMOS CUADRADOS).
INTRODUCCIN
Cuando se trata de aproximacin polinomial se establecen los mtodos de interpolacin de
Newton y La Grange. Para encontrar la ecuacin de la cuna que contiene a todos y cada uno
de los n puntos que definen a una fusin tabular dada, como la que se presenta en la tabla
siguiente y que se representa con todos los puntos de la figura tambin siguiente. Esta
ecuacin resulta ser algebraica de grado (n-1). r
,.j-0.
Obsrvese que en la tabla aparecen n puntos y que en la figura curva continua representa la
aproximacin polinomial de estos; es decir, la representacin geomtrica de los mtodos de
interpolacin. Ahora se trata de encontrar la ecuacin de una curva que, aunque no pase por
todos los puntos, tenga pocas variaciones (sea suave, como la curva de los trazos de la figura
anterior). y pase lo mas ceca posible de todos. Generalmente" lo mas cerca posible se obtiene
imponiendo el criterio de los mnimos cuadrados. Antes de aplicar este criterio, debe de
escogerse la forma de curva ms suave que se va a ajustar al conjunto de puntos dados. La
ecuacin de esa curva puede obtenerse por conocimiento previo del problema, es decir, o la
interpretacin fsica del fenmeno, o en forma arbitraria observando que ecuacin conocida
describe aproximadamente a esta curva. En lo que sigue, la curva que se va a ajustar, es la
grfica de un polinomio de grado conocido m.
METODO DE LOS MNIMOS CUADRADOS
Dada la funcin tabular definida por la tabla anterior se trata de obtener los valores de los
coeficientes de la funcin:
Y=F(x)=ao+a1X+a2X2+a3X3+ amxn-1........(1)
Cuya grfica es una curva que se acerca a la mayora de los puntos (curva de trazos de la
figura anterior).
Se llama residuos a la diferencia de ordenadas de la curva para x=xi menos la del punto xi, yi
representado por Ri a este residuo, se tiene Ri=f(xi)-yi..t2),es decir:
Ri= a0+a1X+a2X2+a3X3+.....amxn-yi ........ (3) ,donde i=1 ,2,3,..n.
El mtodo de los mnimos cuadrados consiste en determinar los valores de los parmetros
a0,a1 ,a2,a3,.....am; de manera que haga mnima la suma de Ios cuadrados de los
residuos.Esta suma vale Re=( o+Xj+Xi+Xi+... +mXi-Yi)...... (4)
Se tiene el mnimo de esta igualdad a cero sus primeras derivadas parciales con .
respecto a todo y cada uno de sus parmetros .Derivando con respecto a ai, donde
j=0,1,2,3,...m; se obtiene :
Ri= (a0+a1X+ a2X2+a3X3+.....amxn-yi )2............ (4)
Ri = 2(a0+a1X+ a2X2+a3X3+.....amxn-yi ) Xi
igualando con cero esta derivada a:
a0+a1Xj+1+ a2Xj+2+a3Xj+3+.....amxyi+m ............ (5)
Finalmente, considerando j=0,1,.2,3,....,m; se obtiene el siguiente sistema de ecuaciones
normales.
na0+a1X+a2X2+a3X3+.....+amxm = y
a0x+a1X2+a2X3+a3X4+.....+amxm = xy
a0X2+a1X3+a2X4+a3X5+.....+amxm = x2y
a0X3+a1X4+a2X5+a3X6+.....+amxm = x3y
a0Xm+ a1Xm+1+a2Xm+2+ a3Xm+3 +..+amxm = xmy.......... (6)
en donde, por simplicidad se ha omitido los ndices de X y Y, y los limites de las sumatorias ,
pero debe de entenderse que estas son sobre todo los valores de X y Y dados la tabla inicial.
Problema 1.-Encontrar la mejor recta que se ajuste a Ias puntos de la siguiente tabla:
X 0 1 2 3 4 5 6 7
Y 2 4 3 6 5 7 9 8
Y=F(X)=ao+a1X
nao+a1 X= Y
ao y+a1 X2
= XY
8ao+28 a1 =44
28ao+140a1=193
mtodo de gauss -jordan
8 28 44 1 3.5 5.5 1 0 2.249
28 140 193 0 42 34 0 1 0.929
R1 - R1/8 R2 - R2/42
R2 - R2(-28)R1 R1 - (-35)R2+R1
ao= 2.249
a1= 0.929 ,por lo tanto Y=F(x)= 2.249+.929X
SUMA
X 0 1 2 3 4 5 6 7 25
Y 2 4 3 6 5 7 9 8 44
X2 0 1 4 9 16 25 36 49 140
Y2 0 4 6 18 20 35 54 56 193
Por regla de cramer se tiene que:
Y=F(X)= 2.250+ .929X
Sustituyendo se tiene que para :
X=0
Y=F(X)= 2.250+ .929(0)=2.250
X=1
Y=F(X)= 2.250+ .929(1)=3.179
X=2
Y=F(X)= 2.250+ .929(2)=4.108
X=3
Y=F(X)= 2.250+ .929(3)=5.037
X=4
Y=F(X)= 2.250+ .929(4)=5.966
X=5
Y=F(X)= 2.250+ .929(5)=6.895
X=6
Y=F(X)= 2.250+ .929(6)=7.824
X=7
Y=F(X)= 2.250+ .929(7)=8.753
Problema 2.- Nmero de graduados en una escuela durante un periodo de 5 aos es el
siguiente:
Ao: 1 2 3 4 5
Numero: 260 400 420 490 650
a) Encontrar las ecuaciones algebraicas de primero, segundo y tercer grado que mejor se
ajusten a los datos.
b) Si:
pc2/cn-m-1)
Es una medida del grado de aproximacin cual de las tres ecuaciones se aproxima mas a los
datos?
c) Grafique los puntos y las curvas de las tres aproximaciones obtenidas en a).

a) Para el primer grado se tiene la forma general siguiente:
y = f (x) = a0 a1x
*la cual genera el siguiente sistema de ecuaciones.
na0 + a1 x = y
a0 x + a1 x2
= xy
b) Para el segundo grado se tiene:
y=f (x) = a0 + a1x+ a2x2
*la cual genera el siguiente sistema de ecuaciones:
na0 + a1 x+ a2 x2=
y
a0 x + a1 x2+
a2 x3= y
a0 x2 + a1 x3+
a2 x4= x2y
C) Para el tercer grado se tiene lo siguiente:
f=(x)= a0 +a1x + a2 x2+a3x3
* y su sistema de ecuaciones ser:
na0 + a1 x+ a2 x2
a3 x3 = y
a0 x + a1 x2+
a2 x3 a3 x4 =
xy
a0 x2 + a1 x3+
a2 x4 +a3 x5 =
x2y
a0 x3 + a1 x4+
a2 x5 +a3 x6 =
x3y
Lo cual genera la funcin tabular ampliada siguiente:
X y x2 x3 x4 x5 x6 xy x2y x3y
1 260 1 1 1 1 1 260 260 260
2 400 4 8 16 32 64 800 1600 3200
3 420 9 27 81 243 729 1260 3780 11340
4 490 16 64 256 1024 1960 1960 7840 31360
5 650 25 125 625 3125 15625 3250 16250 81250
15 2,220 55 225 979 4425 20515 7530 29730 127410
Sustituyendo los valores de la tabla en el sistema de ecuaciones de primer grado se tiene:
5a0 +15a1=2220
15a0 +55a1=7530
Utilizando el mtodo de eliminacin completa de Gauss- Jordan se tiene:
5 15 220 1 3 444
15 55 7530 0 10 870
1 0 183
0 1 87
ao= 183
a1=87
Y=f (x)=183+87x Ecuacin de primer grado.
Para la obtencin de la ecuacin de segundo grado se tiene:
5ao+ 15 a1+ 55a2=2,220
15 ao+ 55 a1+ 255 a2=27,530
55 ao+ 255 a1+ 979 a2=29,730
El mtodo de Gauss Jordan .
5 15 55 2220 1 3 11 444
15 55 225 7530 0 10 60 870
55 225 979 29930 0 60 374 5310
R1/5; R2- 15R1:R3-55R1 R2/10; R1- 3R2:R3-60R2
1 0 -7 183 1 0 0 228,603
0 1 6 87 0 1 0 48,426
0 0 14 90 0 0 1 6,429
R/14; R1+ 7R3:R2-6R3
ao =228,003
a1=48.426
a2=6.429 : .Y=f (x)=228.003+48.426x+6:429
Para la obtencin de la ecuacin de tercer grado, se obtiene.
5 ao+ 15 a1+ 55 a2 +225 a3 =2,220
15 ao+ 55 a1+ 225 a2 +979 a3 =7,530
55 ao+ 225 a1+ 979 a2+4.425 a3 =29J730
225 ao+ 979 a1+ 4.425 a2 +20.515 a3 =127410
Utilizando el mtodo de Gauss- Jordan, se tiene:
5 15 55 225 2220 1 3 11 45 444
15 55 225 979 7530 0 10 60 304 870
55 225 979 4425 29930 0 60 374 1950 5310
22 5 979 4425 20515 127410 0 304 1950 10390 27510
R1/5; R2- 15R1 R3-55R1; R4-225R1 R2/10; R1- 3R2:~-60R2 :R4-304R2
0 -7 -46.2 183 1 0 0 16.8 228,603
0 1 6 30.8 87 0 1 0 -23.6 48!426
0 0 14 126 90 0 0 1 9 6,429
0 0 126 1148.4 1062 0 0 0 14.4 251,946
R314; R1+ 7R3' :R2-6R3: R4-.,126R3 R4/14.4; R1'f1'78" R4:R2+23.6 R4:R3- 9R4
1 0 0 -65.930 55
0 1 0 461.332
0 0 0 -151.0355
0 0 1 -17.496
a0 =65.930
a1=461.332
a2=151.035
a2;;: 1 7.496
:. Y=f (x)=-65.930+461.332x-151.035~ +17.496x2
Sustituyendo en la ecuacin de primer grado se tiene:
Para X=1 Para X=3
Y=f(x)=183+87(1)=270 Y=f(x)=183+87(3)=444
Para X=2 Para X= 4
Y=f(x)=183+87(2)=357 Y=f(x)=183+87(4)=531
Para X=5
Y=f(x)=183+87(5)=618
Sustituyendo para la ecuacin de segundo grado se tiene:
Para X=1
Y=f (x)=228.003+48.426(1)+6.429(1)2 =282.858
Para X=2
Y=f (x)=228.003+48.426(2)+6.429(2)2 =350.571
Para X=3
Y=f (x)=228.003+48.426(3)+6.429(3)2 =431.142
Para X=4
Y=f (x)=228.003+48.426(4)+6.429(4)2 =524.571
Para X=5
Y=f (x)=228.003+48.426(5)+6.429(5)2 =630.858
Sustituyendo para la ecuacin de tercer grado se tiene:
Para X=1
Y=f (x)=65.930+401.332(1 )-151.035(1 )2 +17.496(1 )3=261.863
Para X=2
Y=f (x)=65.930+401.332(2)-151.035(2)2 +17.496(2)3=392.562
Para X=3
Y=f (x)=65.930+401.332(3)-151.035(3)2 +17.496(3)3=431.143
Para X=4
Y=f (x)=65. 930+401.332(4)-151.035(4)2 +17.496(4)3=482.582
Para X=5
Y = f (x)=65.930+401.332(5)-151.035(5)2 +17.496(5)3=651.855
Como el grado de aproximacin esta determinado por ER1/(n-m-1)
Donde: R1 =diferencia de ordenadas o residuos y:
R1 =f(x1) -Y1
f(x1)=EI valor de ordenada de la curva suave.
Ao #de egresados ec.de1er grado ec.de2 grado ec.de 3 grado
X y y y y
1 260 270 282.858 261.863
2 400 357 350.571 392.562
3 420 444 431.142 431.143
4 490 531 524.571 482.582
5 650 618 630.858 651.855
Si : R=f(x1)-y1 (valor de la ordenada de la curva a tratar).
yi= Valor de la ordenada de la funcin tabular.
n=N de pares ordenados (puntos) de la funcin tabular.
M= Grado de la ecuacin



:. Se observa a travs de los resultados obtenidos que la ecuacin con mayor grado de
aproximacin es la del tercer grado, ya que hace mnima la diferencia entre los cuadrados de
las diferencias de sus ordenadas con las de funcin tabular.
C) Aplicando el mtodo de los mnimos cuadrados obtener las expresiones que permitan
valuar los parmetros de la curva de ecuacin y=a+bx+c/x que mejor se ajusta al conjunto de
n
A puntos dados (x1,y,) para ajustar a los puntos:
.X -2 -1 1 2 4
Y -6 -5 9 10 15

You might also like