Professional Documents
Culture Documents
Rsum Dans cet article, la commande optimale des systmes elle ncessite la rsolution de deux quations : lune dans le
commutations est base sur une approche hybride sens direct et lautre dans le sens rtrograde du temps [4].
comprenant une mthode conventionnelle et une mta-
heuristique. Les Essaims Particulaires (EP) et les Colonies de Xu et Antsaklis [5] ont propos en 2004 une approche
Fourmis (CF) sont utiliss pour loptimisation des instants de base sur la mthode du gradient. Cette approche transforme
commutation en minimisant une fonction de performance, le problme en un problme quivalent paramtr par les
dpendant de ces instants, dans un horizon fini. La instants de commutation. Deux tapes ont t proposes,
comparaison entre lOptimisation par Essaims Particulaires ltape (a) traite un problme conventionnel de la commande
(OEP) et lOptimisation par Colonies de Fourmis (OCF) est optimale qui dtermine le cot optimal en fonction des
tudie, travers un exemple numrique, en termes de vitesse
squences dactivation de sous-systmes et des instants de
de convergence et defficacit lobtention dune solution
optimale globale. commutation. Ltape (b) traite un problme doptimisation
non linaire, qui dtermine les instants de commutation en se
Mots-clssystme commutation, commande optimale, basant sur la mthode du gradient. La difficult majeure de
instants de commutation optimaux, Optimisation par Essaims cette approche est la non disponibilit dune forme explicite
Particulaires (OEP), Optimisation par Colonies de Fourmis de la drive premire de la fonction cot [4]. Aussi, la
(OCF). mthode du gradient exige des rgularits sur la fonction
optimiser (continuit, convexit) et ne garantit pas
I. INTRODUCTION ncessairement une solution optimale globale [6].
Les systmes commutations reprsentent une classe Face aux difficults de mise en uvre de certaines
particulire des systmes hybrides o la variable discrte mthodes conventionnelles, et compte tenu du
nest pas vue comme une variable dtat mais comme une dveloppement de la technologie informatise et de
variable de contrle [1]. La formalisation hybride couvre de lintelligence artificielle, des algorithmes sont apparus,
nombreux domaines applicatifs : trafic routier arien, appels mta-heuristiques, ont pour but doptimiser les lois
robotique, informatique temps rels, cryptage, chane de de commande de systmes complexes [7, 8]. En particulier,
production, etc [2]. on distingue lOptimisation par essaims particulaires (OEP)
Le problme de la commande optimale a rcemment et lOptimisation par Colonies de Fourmis (OCF).
attir un certain nombre de chercheurs. Dans [3], les auteurs En effet, lOCF a t dveloppe dans [9] et compare
ont prsent une mthode de recherche directe de loptimum la mthode du gradient [5]. Il est dmontr que les rsultats
des instants de commutation, associe une approche obtenus par lOCF sont proche que ceux obtenus par la
itrative de programmation dynamique. La mise en uvre de mthode du gradient. Dans [10], la comparaison entre lOEP
cette procdure est relativement dlicate et est simplifie et lOAG (Optimisation par Algorithmes Gntiques) a
dans le cas dun nombre de pas dchantillonnage rduit ; car montr que les deux algorithmes convergent vers la solution
1
e-STA copyright 2011 by see
Volume 8, N1, pp 23-30
optimale globale mais lOEP prsente un temps dexcution i. pour t t0 , t f , les quations des variables dtat et
infrieur. Par consquent, il semblerait judicieux de
comparer les performances des algorithmes bass sur les CF les quations des variables adjointes issues de la
et les EP pour rsoudre les problmes complexes en termes fonction Hamiltonienne sont :
de convergence et defficacit lobtention dune solution
optimale globale pour loptimisation des instants de tels
dx ( t )
T
H
systmes. = k ( x (t ) , p (t ) , u (t ))
Dans la section suivante nous formulons le problme de
dt p (4)
la commande optimale des systmes commutations. LOEP = fk ( x (t ) , u (t ))
et lOCF sont dveloppes respectivement dans la section III
et la section IV. Un exemple numrique est illustr pour
comparer lefficacit des algorithmes proposs.
dp ( t )
T
H
= - k ( x (t ) , p (t ) , u (t ))
II. FORMULATION DU PROBLEME dt x
T T
(5)
Considrons le systme commutations suivant : f L
=- k p - k
x x
x& = f i ( x, u ) , i I = {1, 2,..., M } (1)
avec :
avec I est un ensemble fini des variables discrtes indiquant
les M configurations du systme. H k ( x , p, u ) = L ( x , u ) + p T f k ( x , u ) (6)
Le systme commute du sous-systme ik -1 au sous-
systme ik . Le sous-systme ik est actif dans lintervalle de ii. pour t t0 , t f , la condition de stationnarit est
temps [tk , tk +1 )
( tk , t f si k = K , 0 K < ) . Les donne par :
squences des sous-systmes actifs sont dcrites par :
T
H
0 = k ( x (t ) , p (t ) , u (t ))
s = ( ( t0 , i0 ) , ( t1 , i1 ) ,..., ( tk , ik ) ,..., ( t K , iK ) ) (2) u
T T
(7)
f L
= k p+ k
avec t0 t1 ... t K t f et ik I pour k = 0, 1,..., K . u u
En fixant lintervalle de temps t0 , t f et les squences iii. t f , le vecteur p satisfait la condition limite :
s , nous devons trouver le signal de commande optimal u
et les instants de commutation t1 ,..., t K minimisant la
T
y
fonction cot dcrite par : p (t f ) =
x
(
x (t f ))
(8)
(
J = y x (t f ) ) + L ( x ( t ) , u ( t ) )dt
tf
(3) iv. tout tk , k = 1, 2,..., K , la condition de continuit
t0
est donne par :
Afin de rsoudre ce problme, deux tapes sont
proposes. Ltape (a), traite un problme classique de
commande optimale et ltape (b) traite un problme ( )
p tk - = p t k + ( ) (9)
doptimisation des instants de commutation.
Les quations (4)-(7) ainsi que la condition aux limites
A. Signal de Commande Optimal Continu (8) et la condition de continuit (9) font intervenir deux
Pour ltape (a), nous appliquons le principe de quations diffrentielles algbriques avec des conditions
maximum [5], pour que u soit optimal, o il est ncessaire initiales et finales. Ces quations peuvent tre rsolues en
utilisant les mthodes appeles shooting methods ou
p ( t ) = p1 ( t ) ,..., pn ( t ) tel que les
T
davoir un vecteur directement en utilisant la fonction bvp4c de Matlab.
conditions suivantes sont satisfaites :
2
e-STA copyright 2011 by see
Volume 8, N1, pp 23-30
sections suivantes.
k +1
22 (
c r pgbest - p s
s
k k )
III. OPTIMISATION DES INSTANTS DE COMMUTATION PAR
ESSAIMS PARTICULAIRES
ps = ps +n s (12)
Lalgorithme dOEP optimise une fonction objectif en k +1 k k +1
3
e-STA copyright 2011 by see
Volume 8, N1, pp 23-30
n
t ija t ij (1 - r )t ij + Dt ijf (15)
pij = (14)
l j
t il f =1
4
e-STA copyright 2011 by see
Volume 8, N1, pp 23-30
( )
actualiser lespace de recherche space 1
H1 ( x, p, u ) = ( x1 - 1)2 + ( x2 + 1)2 + u 2 +
Etape 5 : Condition dArrt 2 (21)
( x1 + u sin x1 ) p1 + ( - x2 - u cos x2 ) p2
lalgorithme rpte les tapes 3 et 4 jusqu ce que
k = k max o il donne la meilleure squence de
et les quations diffrentielles sont:
commutations trouve.
(22)
x& = x1 + u sin x1 dp1 = - ( ( x - 1) + ( p + up cos x ) )
sous-systme 1: 1 (17) dt 1 1 1 1
x&2 = - x2 - u cos x2 dp
2 = - ( ( x2 + 1) + ( - p2 + up2 sin x2 ) )
dt
5
e-STA copyright 2011 by see
Volume 8, N1, pp 23-30
n = 40 et nc = 2 ;
avec
kmax = 15 et space = [ 0, 3s ] .
u = - p1 sin x2 + p2 cos x1 (26)
En Appliquant les algorithmes proposs, nous observons
que lalgorithme dOCF converge vers le cot minimal
pour [ t2 , 3s ] , la fonction Hameltonienne est la litration 6, figure 2, avant lalgorithme dOEP qui converge
suivante : litration 9, figure 1. Ceci revient la prcision du premier
algorithme puisquil modifie son espace de recherche
chaque itration.
H 3 ( x, p , u ) =
1
2
(( x1 - 1)2 + ( x2 + 1)2 + u 2 (t ) + ) (27) 6.6
6.2
5.8
J(k) 5.6
dx1
dt = - x1 - u sin x1 5.4
5.2
dx2 = x + u cos x
dt 2 2 5
(28)
dp1 = - ( ( x - 1) + ( - p - up cos x ) )
4.8
dt 1 1 1 1 4.6
0 5 10 15
dp k
2 = - ( ( x2 + 1) + ( p2 - up2 sin x2 ) )
dt
Figure 1. Convergence de lalgorithme dOEP
avec 5.7
5.6
5.4
5.2
J(k)
p1 ( 3) = x1 ( 3) - 1 (30) 5.1
4.9
p2 ( 3) = x2 ( 3) + 1 (31) 4.8
4.7
0 5 10 15
k
Afin doptimiser les instants de commutation, nous
fixons les paramtres de lalgorithme dOEP tels que : Figure 2. Convergence de lalgorithme dOCF
6
e-STA copyright 2011 by see
Volume 8, N1, pp 23-30
Les rsultats obtenus des instants de commutation sont proches. Le temps dexcution de lalgorithme dOCF
optimaux ainsi que la valeur de cot pour chaque algorithme est plus grand que celui de lalgorithme dOEP puisquil met
sont prsents dans le tableau 1. jour lespace de recherche. De plus, sa mise en uvre est
plus dlicate.
TABLEAU I. COMPARAISON DES RESULTATS OBTENUS
0.5
-1.5
Les rsultats prsents montrent que les deux algorithmes
convergent vers la solution minimale globale puisquils ont -2
non convexe.
Figure 4. Signal de commande optimal u obtenu par lalgorithme dOCF
Pour le temps dexcution, lalgorithme dOEP prsente
une valeur infrieure celle de lalgorithme dOCF puisquil
prsente une tape de mise jour de lespace de recherche 3
qui nest pas utilise dans le premier algorithme. 2.5
1.5
x
1
2
0.5
-0.5
-1
-1.5
0 0.5 1 1.5 2 2.5
x1
J ( t1 , t2 )
0.5
Figure 3. Fonction cot
0
7
e-STA copyright 2011 by see
Volume 8, N1, pp 23-30