You are on page 1of 19

REGULADOR PTIMO CUADRTICO LQR

Ing. Alonso Chica Leal

El Control ptimo Cuadrtico es una estrategia de control que busca


minimizar un ndice de desempeo en un sistema de control. Recordando el
significado de un ndice de desempeo, se puede decir que ste es la
similitud entre el desempeo deseado y el desempeo real de un sistema o
proceso. Este tipo de ndice es directamente proporcional a las diferencias
existentes entre ellos. De esta manera, si las diferencias son grandes entre
desempeo real y el desempeo deseado, entonces el ndice ser grande y si
por el contrario las diferencias son pequeas el ndice ser pequeo. Debido
a esto, se busca minimizar este ndice ya que al hacerlo se logra llevar el
desempeo real a un punto muy cercano del desempeo deseado.

ndice de desempeo para LQR:

1 *
1 N 1
x ( N ) Sx( N ) x * (k )Qx(k ) u * (k ) Ru (k )
2
2 k 0

(6.1)

El trmino cuadrtico en LQR se debe al trabajo con matrices, ya que las


matrices pueden representar sistemas lineales de orden n, haciendo lo
siguiente.
n

xT Ax aij xi x j
i 0 j 0

(6.2)

Lo que dice la ecuacin (2), es que cualquier forma cuadrtica se puede


T
*
escribir siempre como x Ax para matrices simtricas y x Ax para matrices

hermticas o hermitianas.

Si se observa con atencin el ndice de desempeo (6.1) se puede ver


que existen un S, Q y R que estn siendo multiplicados por trminos de
*
la forma x Ax , entonces (6.1) es una forma cuadrtica de un sistema

matricial y por eso se habla de control ptimo cuadrtico.

Ahora considerando un sistema de control definido por


x(k ) Gx(k ) Hu (k ); _ x(0) c

(6.3)

en este sistema se identifican los siguientes elementos:


x(k ) es el vector de estado, u (k ) es el vector de control, G es una matriz
nxn y H es una matriz nxr.

El problema del control ptimo cuadrtico esta en encontrar un valor de


secuencia de u(k) que minimice el ndice de desempeo (6.1).

Tambin se pueden definir las matrices Q, R y S as:


J

1 *
1 N 1
x ( N ) Sx( N ) x * (k )Qx(k ) u * (k ) Ru (k )
2
2 k 0

(6.4)

Q es una matriz hermtica definida positiva o semidefinida positiva


*
(esto quiere decir que x Ax 0 para x 0 , en el caso de ser definida
*
positiva y x Ax 0 para x 0 para el caso

en que es semidefinida

positiva). Esta matriz va ligada a la importancia de los estados durante


la transicin.

R es una matriz definida positiva de r x r, y esta ligada a la importancia


de la entrada. S es una matriz definida positiva de n x n que va ligada
al estado final.

Existen varios mtodos para minimizar el ndice de desempeo pero el


ms comn es empleando los multiplicadores de Lagrange.

El mtodo de los multiplicadores de Lagrange busca encontrar valores


extremos de funciones de varias variables que tienen algn grado de
restriccin.

En trminos generales este procedimiento hace que los

valores extremos de una funcin f(x,y,z), cuyas variables estn sujetas a


una restriccin g(x,y,z)=0, se encuentran sobre la superficie g=0 en los
puntos donde:
f g
Para algn escalar llamado multiplicador de Lagrange.

Una forma muy comn de encontrar los reguladores cuadrticos para


tiempo discreto con horizonte finito es:
x k 1 Ax k Bu k ,

co x0 conocido

(6.5)

Siendo (6.5) muy parecida a (6.3) con la salvedad de que se le han dado
otros nombres a las matrices.

Por otro lado la funcin de costo tambin se puede encontrar de la


forma:
JN

1 T
1 N 1
x N Px N xkT Qxk u kT Ru k
2
2 k 0

(6.6)

La ecuacin (6.6) es similar a (6.1), la diferencia radica en que (6.6)


trabaja con matrices transpuestas pero no conjugadas.

Si a (6.6) se le aplica el mtodo de los multiplicadores de Lagrange se


obtiene la siguiente ecuacin:
JN

1 T
1 N 1
x N Px N xkT Qxk u kT Ru k Tk 1 ( xk 1 Axk Buk )
2
2 k 0

(6.7)

Donde (k+1) es el conjunto de multiplicadores de Lagrange, se deriva


esta funcin con respecto a u(k), (k+1) y x(k) y luego por tratarse de un
mtodo para hallar mnimos se iguala a cero obteniendo:
J N
u T (k ) R T (k 1) B 0
u (k )

(6.8)

J N
x(k 1) Ax(k ) Bu (k ) 0
(k 1)

(6.9)

J N
x T (k )Q T (k ) T (k 1) A 0
x (k )

(6.10)

J N
Px( N ) ( N ) 0
x ( N )

(6.11)

Este problema se debe plantear como un sistema de ecuaciones de


T
Despejando (k 1) de la

diferencia con condiciones de frontera.


ecuacin (6.8) se obtiene

(k 1) u (k ) RB 1

(6.12)

el exponente negativo significa que es un denominador que se paso a


numerador
T
Ahora despejando (k 1) de (6.10) se obtiene

T (k 1) T (k ) x (k )Q A1

(6.13)

Despejando x(k+1) de (6.9)


x(k 1) Ax(k ) Bu (k )

(6.14)

Si se despeja u(k) de la ecuacin (6.12) y esta se reemplaza en (6.14)


quedara

x(k 1) Ax(k ) B R 1 (k 1) B

(6.15)

Ahora reemplazando (6.12) en la ecuacin anterior se llega a

x(k 1) Ax(k ) B R 1 T (k ) x (k )Q A1 B

Realizando los productos del parntesis

x(k 1) Ax(k ) B R 1 (k ) A1 B R 1 A1 Bx(k )Q

T
Recordando que en matrices B*B es igual a BB ese producto de B

queda
x(k 1) Ax(k ) BB T R 1 A1 (k ) BB T R 1 A1Qx(k )
Factorizando x(k) y (k) finalmente se llega a

x(k 1) A B T BR 1 AT Q x(k ) BB T R 1 AT (k )
Siendo la anterior una condicin de frontera y ahora si se despeja

(k 1) de (6.10)
(k 1) AT Qx(k ) AT (k )
Siendo la anterior la otra condicin de frontera.

Teniendo en cuenta las siguientes condiciones:


x0 conocido, ( N ) Px( N ) y (k ) P (k ) x(k ) , la entrada ptima del
sistema esta dada por:
Despejando Ru(k) de la ecuacin (6.8) y reemplazando (k ) tenemos que
Ru (k ) (k 1) B T
Ru (k ) P (k 1) x(k 1) B T

(6.16)

Reemplazando (6.14) en (6.15)


Ru (k ) P (k 1) Ax(k ) Bu (k ) B T
Ru (k ) P( k 1) Ax( k ) B T P (k 1) Bu (k ) B T

P (k 1) Ax(k ) B T u (k ) R P (k 1) BB T
u (k )

P (k 1) Ax(k ) B T
R P (k 1) BB T si se hace S (k 1) R P (k 1) BB T entonces queda

u (k ) S 1 (k 1) P (k 1) Ax(k ) B T

(6.17)

Ahora se toma la ecuacin (6.9) y se reemplaza (k ) P (k ) x(k )

(k ) (k 1) AT x(k )Q
P (k ) x (k ) P( k 1) x (k 1) AT x(k )Q

(6.18)

reemplazando nuevamente la ecuacin (6.14) en la anterior tenemos


que
P (k ) x (k ) P (k 1) Ax(k ) Bu ( k ) AT Qx(k )

(6.19)

Ahora se reemplaza (6.16) en (6.17) y se tiene que

P (k ) x (k ) P (k 1) Ax( k ) B S 1 ( k 1) P( k 1) Ax(k ) B T AT Qx( k )


Si se hace x(k)=1 y se hacen las respectivas operaciones de la ecuacin
anterior quedara

P (k ) AAT P (k 1) P (k 1) BB T S 1 (k 1) P (k 1) Q
Esta es una ecuacin de Riccati usando el mtodo de barrido (invertir
limites de integracin) se resuelve a partir de las condiciones de frontera
del estado final ( N ) Px( N ) P ( N ) x( N ) y se pueden calcular todos los
valores de P(k) hasta P(0), la entrada esta descrita como una
realimentacin de estado
u (k ) K (k ) x(k )
K (k ) R 1 B T ( AT ) 1[ P (k ) Q]

(6.20)

Evaluando el ndice de desempeo mnimo. Por ecuacin de frontera


P ( N ) S entonces,
1
1 N 1
min J min[ xT ( N ) P ( N ) x( N ) [ xT (k )Qx(k ) u T (k ) Ru (k )]]
2
2 K 0

(6.21)

T
Multiplicando x (k ) por la ecuacin (6.19)

P (k ) x (k ) x T (k ) P (k 1) x(k 1) AT x T (k ) x (k )QxT (k )
(6.22)

Remplazando (k 1) P (k 1) x(k 1) en
factorizamos x(k 1) , despejamos

la

ecuacin

(6.15),

luego

Ax(k ) para finalmente tener como

resultado la siguiente ecuacin:


Ax( x) x(k 1)[1 BR 1 P( k 1) B T ] AT xT (k ) xT ( k 1)[1 BR 1 P (k 1) B T ]

T
De la ecuacin (6.22) despejamos x(k )Qx (k ) y a la vez remplazamos

AT xT (k ) , encontrada anteriormente en la misma ecuacin (6.22):


xT (k )Qx(k ) P (k ) x(k ) xT (k ) P (k 1) x(k 1) xT ( k 1) P (k 1) x(k 1) xT ( k 1) BR 1 P (k 1) B T
(6.23)

Por otra parte tomando u (k ) de la ecuacin (6.16) y hallando el


T
T
respectivo u (k ) , se desea tener la ecuacin u (k ) Ru (k ) , entonces,

u (k ) R 1 B T P (k 1) x(k 1) u T (k ) R 1 BP (k 1) xT ( k 1)
u (k ) Ru T ( k ) R 1 B T P (k 1) x(k 1) BP (k 1) x T (k 1)

(6.24)

Sumando (6.23) con (6.24) y remplazando la suma en la ecuacin (6.21)


J min

1
1 N 1
x( N ) P ( N ) xT ( N ) [ P (k ) x(k ) xT (k ) P (k 1) x(k 1) xT ( k 1)]
2
2 K 0

Desarrollando la sumatoria quedara


1
1
x( N ) P ( N ) xT ( N ) [ P (0) x (0) x T (0) P (1) x(1) x T (1) P (1) x (1) x T (1) P( 2) x(2) xT (2) .
2
2
....................P( N 1) x( N 1) xT ( N 1) P ( N ) x ( N ) x T ( N )
J min

Cancelando trminos tenemos que


J min

1
1
1
x( N ) P ( N ) xT ( N ) P (0) x(0) xT (0) x( N ) P ( N ) xT ( N )
2
2
2

Cancelando el primer trmino con el ltimo, el ndice de desempeo


mnimo sera:
J min

1
P (0) x(0) x T (0)
2

Para el caso de horizonte infinito en sistemas discretos se asume que


P (k ) alcanza una condicin de estado estable, por lo tanto se parte de la
misma ecuacin de Jmin y se hace el mismo desarrollo pero teniendo en
cuenta el cambio del nuevo P.

J min

1
1 N 1
x( N ) PxT ( N ) [ Px(k ) xT (k ) Px(k 1) x T (k 1)]
2
2 K 0

De la misma manera que para el caso anterior se hace el desarrollo


correspondiente
1
1
x( N ) Px T ( N ) [ Px (0) xT (0) Px(1) xT (1) Px(1) xT (1) Px( 2) x T (2) .
2
2
.................... Px( N 1) x T ( N 1) Px ( N ) x T ( N )
J min

Cancelando trminos el Jmin para caso este sera


J min

1
Px(0) x T (0)
2

Ejemplo de minimizacin de una funcin para horizonte infinito

Considerando el sistema de control definido por:


x(k 1) 0.3679 x(k ) 0.6321u (k )

x (0) 1

Determinar la ley de control que minimiza el siguiente ndice de


desempeo
J

1
1 9
[ x(10)] 2 [ x 2 (k ) u 2 (k )]
2
2 k 0

Solucin
En este ejemplo se puede observar que S= 1, Q = 1, R=1
T
1 T
1
Mediante la siguiente ecuacin P (k ) Q A P (k 1)[1 BR B P (k 1)] A se

obtiene lo siguiente
P (k ) 1 0.3637 P( k 1)[1 0.6321(1)0.6321P (k 1)]1 (0.3679)
Simplificando

P (k ) 1 0.1354 P (k 1)[1 0.3996 P (k 1)]1

Teniendo en cuenta la condicin de frontera P ( N ) S , donde P (10) 1


Se calcula P (k ) desde k=9 hasta k=0
P (9) 1 0.1354 P (10)[1 0.3996 P(10)]1
P (9) 1 0.1354(1)[1 0.3996(1)]1 1.0967
P (8) 1 0.1354(1.0967)[1 0.3996(1.0967)]1 1.1032

P (7) 1 0.1354(1.1032)[1 0.3996(1.1032)]1 1.1036


P (6) 1 0.1354(1.1036)[1 0.3996(1.1036)]1 1.1037
P (k ) 1.1037, parak 5,4,3,2,1,0
Observe que P(k) se aproxima al valor de estado estacionario, el cual
1
esta dado por P ( ss ) 1 0.1354 P ( ss )(1 0.3996 P ( ss ))

Factorizando queda
0.3996 P 2 ( ss ) 0.4650 P ( ss ) 1 0
Resolviendo la cuadrtica obtenemos P ( ss ) 1.1037

La ganancia de realimentacin se puede calcular de la ecuacin (6.20)


K (k ) 1(0.6321)(0.3679) 1[ P (k ) 1]
K (k ) 1.7181P (k ) 1
Al sustituir los valores de P(k) se obtiene
K (10) 1.7181(1 1) 0
K (9) 1.7181(1.0967 1) 0.1662
K (8) 1.7181(1.1032 1) 0.1773
K (7) 1.7181(1.1036 1) 0.1781
K (6) K (5) ....... K (0) 0.1781
La ley de control ptimo esta dada por: U (k ) k (k ) x(k )

Como: x(k 1) 0.3679 x (k ) 0.6321u ( k ) [0.3679 0.6321K (k )]x (k ) se obtiene


x(1) [0.3679 0.6321K (0)]x(0)
(0.3679 06321(0.1781)(1) 0.2553
x(2) (0.3679 0.6321(0.1781))(0.2553) 0.0652
x(3) (0.3679 0.6321(0.1781))(0.0652) 0.0166
x(4) (0.3679 0.6321(0.1781))(0.0166) 0.00424
Para k=5,6.10 se aproxima a cero.
Ahora hallamos la secuencia de control u(K)

u (0) K (0) x(0) 0.1781(1) 0.1781


u (1) K (1) x(1) 0.1781(0.2553) 0.0455
u (2) K (2) x(2) 0.1781(0.0652) 0.0116
u (3) K (3) x(3) 0.1781(0.0166) 0.00296
u (4) K (4) x(4) 0.1781(0.00424) 0.000756
u (k ) 0, paraK 5,6,.....10
El valor mnimo del ndice de desempeo es:
J min

1 T
1
x (0) P (0) x(0) (1)(1.1037)(1) 0.5518
2
2

Ejemplo Diseo de Control ptimo


Ecuaciones de Estado y Optimizacin por el mtodo LQR

Descripcin del modelo.


La figura 9 presenta un sistema de pndulo invertido en el cual el
objetivo consiste en controlar la respuesta de la barra, descrita por el
ngulo (t) por medio de la fuerza F(t) aplicada al carro.

Figura 9. Modelo del pndulo invertido

Para este ejemplo se tomarn los siguientes valores para el modelo


fsico:
Masa del carro (Mcarro)=0.5Kg.
Masa de la barra (Mbarra)=0.2Kg.
Coeficiente de friccin del carro (b)=0.1N/m/s.
Longitud de la barra (2L)=0.3m.
Inercia de masa de la barra (Ibarra)=0.006Kg.m 2.
Entrada (F): Fuerza aplicada al carro.
Salida 1 (x): Desplazamiento del carro.
Salida 2 (): rotacin de la barra.

Ecuaciones de movimiento.

Para determinar las ecuaciones de movimiento del sistema se elabora el


diagrama de cuerpo libre (DCL) para cada una de las partes en estudio
(i.e. carro y barra). La figura 10 muestra el DCL para cada una de estas
partes.

La segunda ley de Newton relaciona la accin de las fuerzas aplicadas a


un cuerpo con la aceleracin de sta.

En trminos de una igualdad

vectorial esta ley se define como:


r
r
F
m a

(E.1)

M I

(E.2)

Figura 10. DCL de las partes que componen el sistema (derecha: carro, izquierda:

Donde

r
F

barra)

es la sumatoria de las fuerzas aplicadas al cuerpo,

M la

sumatoria de momentos, m la masa del cuerpo, I inercia de masa del


r
r
cuerpo, a la aceleracin lineal y la aceleracin angular. Para el caso
del carro, puesto que nicamente se traslada y no rota, la ecuacin
r
(E.2) no aporta informacin importante al problema. Tomando f como
la fuerza de friccin que es ejercida sobre el carro, la relacin vectorial
obtenida a partir de la ecuacin (E.1) es:

r
F N f M carro acarro

(E.3)
Para el caso de la barra se obtienen al aplicar las ecuaciones (E.1) y
(E.2) las siguientes relaciones vectoriales:

N M barra abarra

(E.4.1)

M
(E.4.2)

M barra L sen( ).g ( I barra M barra .L2 ) barra

El desplazamiento de la barra est relacionado con el movimiento del


carro y la rotacin de la misma como se muestra en la figura 3. Con
base en eso se pueden construir las ecuaciones siguientes:
xbarra ( t ) x( t ) L sen( ( t ))
(E.5.1)
dxbarra ( t ) dx( t )
d ( t )

L
cos( ( t ))
dt
dt
dt
(E.5.2)
d 2 xbarra ( t ) d 2 x( t )
d 2 ( t )
d 2 ( t )

cos(

(
t
))

L
2
dt 2
dt 2
dt 2
dt

sen(
( t ))

(E.5.3)

Figura 11. Desplazamiento del centro de masa de la barra

Conociendo que la friccin del carro es proporcional a la velocidad del


mismo las ecuaciones (E.3), (E.4) y (E.5) permiten expresar las
siguientes igualdades:
M carro

r
r
d2x
dx
F b
N
dt
dt 2

(E.6.1)
2
d2x

d 2
d
M barra

cos(

sen(
)

2
2
dt

dt
dt

(E.6.2)

M barra L sen( ) g Ibarra barra

Mbarra L2

(E.6.3)
Al reacomodar las ecuaciones precedentes se obtienen las ecuaciones de
movimiento:
d2x
dx
d 2
M

M
L

cos(

barra
carro
barra
dt
dt 2
dt 2

dt

Mbarra L sen( )

(E.7.1)
d 2
2
I

barra barra dt 2

M barra L g sen(
) Mbarra L
cos( )

d2x

dt 2
(E.7.2)

Si se asumen ngulos pequeos para el movimiento de la barra, las


siguientes relaciones pueden ser asumidas:
cos( ) 1

(E.8.1)

sen( )

d dt

(E.8.2)

(E.8.3)

Al Linealizar las ecuaciones (E.7.1 y E.7.2)


d2x
dx
d 2
M

M
L

barra
carro
barra
dt
dt 2
dt 2

M barra L

barra

d 2
d2x
2 M barra L 2
dt
dt

Mbarra L F
Mbarra L g

(E.9.1)
(E.9.2)

Luego de manipular las ecuaciones (E.9.1 y E.9.2) se obtiene:


d2x
dx
2 b I barra M barra L2
dt
dt

barra
M

L g
I barra

M barra
L2 F

(E.10.1)
d 2
dx
2 M barra L b
dt
dt

Mbarra L g M barra

M carro

M barra
L F

(E.10.2)
donde
(E.10.3)

I barra M barra M carro M carro M barra L2

Modelo representado por ecuaciones de estado.


Para la representacin del sistema por medio de ecuaciones de estado
se definen las siguientes variables de estado:
x1 ( t ) x( t )
(E.11.1)
x2 ( t )

dx( t )
dt

(E.11.2)
x3 ( t ) ( t )
(E.11.3)
x4 ( t )

d ( t )
dt

(E.11.4)
de donde se obtienen las ecuaciones de la forma:
r
dx( t )
r
A x( t ) B F( t )
dt
(E.12)
0

I barra M barra L2
0

A
0
0

M
L b
0
barra

M barra L

0
M barra L g M barra M carro

I barra M barra L2

M barra L

donde

I barra M barra M carro M carro M barra L2

Para el anlisis del sistema, se toman como salidas el desplazamiento


del carro junto con el ngulo de la barra. La entrada al sistema est
descrita por la fuerza que sobre sta se ejerce.

La salida queda entonces representada por


y1 ( t ) x( t ) x1 ( t )
y2 ( t ) ( t ) x3 ( t )
De esta manera, las matrices que definen la salida quedan definidas
por:
r
r
r
y( kT ) C x( kT ) D u( kT )
donde
1 0 0 0

0 0 1 0

0
D
0
Requerimientos de diseo:
Para controlar el movimiento del pndulo se supondrn algunos
requerimientos. El requerimiento bsico es el de no exceder un error en
estado estacionario del 2% en ninguna de las salidas. El tiempo que
demore la posicin del carro en alcanzar el punto estable no debe
superar un segundo.

Finalmente, el sobresalto permitido no debe

superar el 5% para el ngulo del pndulo.

SI simulamos la referencia de entrada con una funcin escaln,


entonces se debe cumplir que:
Tiempo de estabilizacin para x y <5%.
Tiempo de subida para x<1seg.
Sobresalto para <0.35 rad.
Error de estado estable para x y <2%.

Respuesta del sistema de pendulo invertido a entrada escalon

100

Carro (x)
Barra (teta)

90
80
70
60
50
40
30
20
10
0

0.2

0.4

0.6

0.8

1
1.2
Tiempo (s)

1.4

1.6

1.8

Figura 12. Respuesta del pndulo ante la entrada escaln

Diseo de control por medio de LQR


El diagrama de bloques del sistema realimentado es el siguiente:

Figura 13. Diagrama de bloques del sistema con realimentacin de estado

Para estimar la realimentacin del sistema se emplear la tcnica del


Regulador Lineal Cuadrtico (LQR). Este mtodo permite encontrar la
matriz de realimentacin ptima basada en un balance entre el error en
el sistema y el esfuerzo requerido por el control. Para el empleo de este
mtodo se requiere definir tres parmetros: Matriz de ndice de
desempeo (R), matriz de costo-estado (Q) y factores de ponderacin (a 0
y a1). Por simplicidad se emplearn los parmetros tales que:

R=1
a0
0
Q
0

0 0
0 0
0 a1
0 0

0
0
0

Asumiendo inicialmente los valores para el ndice de desempeo y la


ponderacin unitarios, se obtiene la siguiente matriz de realimentacin
K:
K 0.9384 1.5656 18.0351 3.3368

10

Respuesta sin realimentacion

x 10

Carro (x)
Barra (teta)

1.5
1
0.5
0

0.5

1.5

2.5

3.5

4.5

Respuesta con realimentacion

0.4

Carro (x)
Barra (teta)

0.2
0
-0.2
-0.4

0.5

1.5

2.5

3.5

4.5

Figura 14. Pndulo con realimentacin y con realimentacin

Influencia de los parmetros de optimizacin


Al variar los parmetros del mtodo de optimizacin se pueden obtener
diferentes respuestas del sistema. La figura 7 presenta algunos de estos
resultados.

x=1 y=1 R=1

0.1

Carro (x)
Barra (teta)

-3
x 10 x=5000 y=100 R=1

Carro (x)
Barra (teta)

-0.1
-5

-0.2
-0.3

x=1 y=1 R=100

-0.02

-2

-0.04
0

-0.06

x=5000 y=100 R=100


Carro (x)
Barra (teta)

-1

-3

0.02

Carro (x)
Barra (teta)

-10

Figura 15. Cambio de los parmetros de optimizacin

Resultado del diseo


De los resultados obtenidos y presentados en la figura 7, se puede
determinar que una realimentacin definida por el vector K tal que
K 36.7238 20.7851 63.9704 12.6117
5000
0
Q
0

0
Obtenido con los parmetros de diseo R=1 y

0 0 0
0 0 0
0 100 0

0 0 0

Se obtiene una respuesta que satisface los requerimientos de diseo


estipulados anteriormente:
Tiempo de estabilizacin para x y <5%.
Tiempo de subida para x<1seg.
Sobresalto para <0.35 rad.
Error de estado estable para x y <2%.

You might also like