You are on page 1of 106

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L'ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE MENTOURI - CONSTANTINE

FACULTE DES SCIENCES DE L'INGENIEUR DEPARTEMENT D'ELECTROTECHNIQUE N d'ordre : .. Srie : ..

MEMOIRE Prsent pour obtenir le diplme de Magister En Electrotechnique OPTION Modlisation et commande des machines lectriques Par

Abla Bouguerne
THEME

Diagnostic automatique des dfauts des moteurs asynchrones

Soutenu le : - - / - - / 2009 Devant le Jury : Prsident : Rapporteur : Monsieur Monsieur Aissa Bouzid Abdessalem Lebaroud Prof. (Univ. Constantine) MC (Univ. Skikda) Prof. (Univ. Constantine) Prof. (Univ. Constantine)

Examinateurs :Monsieurs Abdelmalek Khazzar Ammar Bentounsi

Sommaire

Sommaire

Tables des matires


Introduction gnrale 5 Chapitre I . La machine asynchrone et les mthodes de diagnostic
1.1 Introduction.........................................................................................................................8 1.2 La machine asynchrone......................................................................................................9 1.2.1 Constitution de la machine asynchrone.............................................................9 1.2.1.1 Le stator ..............................................................................................10 1.2.1.2 Ie rotor cage.....................................................................................11 1.2.1.3 Les organes mcanique.......................................................................12 1.2.2 Etude statistique des dfaillances de la machine asynchrone........................13 1.2.2.1 Dfaillances au stator..........................................................................15 1.2.2.2 Dfaillances au rotor...........................................................................17 1.2.2.3 Dfaillances mcaniques.....................................................................20 1.3 Mthodes de surveillance et de diagnostic de la machine asynchrone.........................21 1.3.1 Mthodes bases sur une approche systme....................................................22 1.3.1.1 Rseaux de neurones...........................................................................22 1.3.1.2 Reconnaissance de forme (RdF)........................................................24 1.3.1.3 Analyse temps-frquence : outil privilgi de dtection..................25 1.3.2 Mthodes de prises de dcision (classification)..............................................27 1.3.2.1 Discriminant Linaire ACP............................................................27 1.3.2.2 Les K plus proches Voisins (K- Nearest Neighbors)........................28 1.3.2.3 Rseaux de Neurones .........................................................................28 1.3.2.4 Mthodes de coalescence (clustering)................................................29 1.4 Choix de la mthode de classification.............................................................................30 1.4.1 Reprsentation temps-frquence et classification...........................................31 1.4.2 RTF dite "Dpendante de la Classe du Signal (DCS) ".............................32 1.4.3 La dcision.........................................................................................................33 1.5 Conclusion.........................................................................................................................33

Sommaire

Chapitre II. Extraction des paramtres de diagnostic par la reprsentation temps-frquence optimise
2.1 Introduction..35 2.2 La reprsentation temps-frquence (RTF).35 2.2.1 Reprsentation temps-frquence noyau paramtrique..37 2.2.2 Reprsentation temps-frquence noyau non paramtrique..38 2.3 Choix de la mthode de diagnostic.38 2.3.1 Reprsentation temps-frquence et classification...38 2.3.2 RTF dite "Dpendante de la Classe du Signal (DCS) "....40 2.3.3 La dcision.40 2.4 Vers une mthode temps-frquence de classification....41 2.4.1 La classe de Cohen.41 2.4.1.1 La classe de Cohen par la RTF..42 2.4.1.2 La classe de Cohen par la fonction d'ambigut..43 2.4.2 Existence et signification des interfrences.45 2.4.3 Conception des noyaux pour la classification......45 2.4.4 Le critre de dcision.46 2.5 RTF optimise pour la classification...47 2.6 Application de la RTF optimise pour la classification des dfauts de la machine asynchrone50 2.6.1 Application du RDF dans le plan Doppler-retard.50 2.6.2 Discrimination optimale des classes par le critre de Fisher51 2.6.2.1 Expression du Contraste de Fisher de la troisime variante53 2.6.2.2 Conception des noyaux discriminants de Fisher54 2.6.2.3 Rsultats de calcul.57 2.6.3 Rsultats exprimental...58 2.7 Conclusion ....61

Chapitre III. Mthodes de la prise de dcision


3.1 Introduction...63 3.2 Dtermination dune mthode de dcision..63 3.3 Mthodes de prise de dcision..63

Sommaire 3.3.1 Rseau de neurone63 3.3.1.1 Mise en uvre dun modle de rseaux de neurones.64 3.3.1.2 Apprentissage du rseau : Algorithme de rtropropagation de gradient...65 A. Mise en quation ..65 B. Principe de la rtropropagation .65 C. Acclration de la rtropropagation...67 3.3.1.3 Lapplication de rseau de neurone pour la classification des dfauts de la machine asynchrone.67 3.3.2 Rgle des k plus proches voisins (k ppv)71 3.3.2.1 Choix de la distance dans la rgle des k ppv..71 3.3.2.2 Choix du nombre de plus proches voisins k 72 3.3.2.3 Rgle des k plus proches voisins avec rejet72 3.3.2.3.1 Rejet dambigut..75 3.3.2.3.2 Rejet de distance...75 3.3.2.4 La prise de dcision par les k-ppv pour les nouvelles observations.. ...76 3.3.2.5 Classification non exclusive81 3.3.2.5.1 Rejet dambigut.84 3.3.2.5.2 Rejet dappartenance...85 3.3.2.5.3. La dcision pour les nouvelle observation 86 3.4 Perspectifs et conclusion...91

Conclusion gnrale...93 Bibliographie..95

Introduction gnrale

Introduction gnrale

Introduction gnrale
Le diagnostic automatique consiste en la dtection dun changement anormal dans le comportement ou dans ltat dun systme et dans la localisation de sa cause. Les systmes de diagnostic automatique peuvent tre mis en uvre en cours dexploitation (en ligne) ou pendant les phases normales darrt dexploitation. En cours dexploitation, le but est de garantir la scurit et la continuit de service et denregistrer les vnements utiles pour la maintenance curative ou le retour dexprience. En arrt dexploitation (hors ligne), lobjectif est dvaluer le degr de vieillissement de certains lments, de dcider dune opration de maintenance prventive ou curative. Le dveloppement de systme de diagnostic automatique parat une solution un peu plus coteuse linvestissement, mais elle samortit sur le long terme. Les signaux mesurables tels que les courants, les tensions, la vitesse, les vibrations ou bien encore la temprature peuvent fournir des informations significatives sur les dfauts et ainsi servir dterminer un ensemble de paramtres reprsentant les signatures de dfauts du moteur. A partir de ces paramtres, la mise en place de mthodes dcisionnelles peut permettre de concevoir des systmes de diagnostic performants. La reprsentation temporelle classique du signal ne donne pas une bonne perception des composantes oscillantes multiples, tandis que la representation frquentielle (transforme de Fourier) ne permet pas la localisation temporelle de ces composantes. Ainsi, partant des proprits de ces signaux et des limitations de la transforme de Fourier (TF), il est naturel de sorienter vers un schma danalyse temps-frquence. Afin de rendre cette approche automatique, il lui faut rajoute des mthodes ou techniques de prise de dcision. Cest dans cette perspective que ce mmoire est orient. Il sintresse au diagnostic automatique par classification des dfauts de la machine asynchrone et plus particulirement sur les mthodes de prise de dcision. Ce mmoire sarticule autour de trois chapitres : Le premier chapitre prsente la constitution de la machine asynchrone et aussi leurs diffrentes dfaillances qui peuvent se produisent sur ce type de machine. Ce chapitre se dcompose en deux partie : la premire partie fait tat des diffrentes origines (lectriques,

Introduction gnrale mcaniques,) des dfaillances qui peuvent se produire sur la machine asynchrone; la deuxime partie traite des techniques qui permettent la mise en oeuvre dune procdure de diagnostic. On sest tal sur deux approches principales, savoir lapproche signal et lapproche systme, lapproche privilgie est dtaille dans le second chapitre. Le deuxime chapitre propose une approche systme qui consiste en lautomatisation de la procdure de dtection des dfauts partir de la reprsentation Temps-frquence; notre approche est base sur la classification de signaux aprs apprentissage. La reprsentation temps-frquence employe dans ce chapitre est dite "dpendante de la classe du signal (DCS)" dont le plan dambigut est liss par un noyau conu spcialement afin de raliser une sparation maximale entre le dfaut et la machine saine. Le contraste de Fisher est utilis pour la sparation de classe. Des vecteurs formes reprsentatives des diffrents dfauts sont extraits pour les besoins de la prise de dcision du troisime chapitre. Le troisime chapitre est ddi aux mthodes de prise dcision. Deux mthodes sont traits savoir les rseaux de neurone et les k plus proche voisins. Ltude est plus concentr sur la mthode les k-plus proches voisins vu leurs simplicits et leurs performances.

Chapitre I
La machine asynchrone et les mthodes de diagnostic

La machine asynchrone et les mthodes de diagnostic

1.1 Introduction
Le diagnostic est une composante principale dun module de supervision. Il consiste dterminer chaque instant le mode de fonctionnement dans lequel le systme se trouve. Il sappuie sur une connaissance a priori des modes de fonctionnement et sur une connaissance instantane matrialise par une nouvelle observation de ltat du systme. Il existe plusieurs approches pour raliser le diagnostic, le choix dune approche est li au mode de reprsentation de la connaissance. La premire partie de ce chapitre fait tat des diffrentes origines (lectriques, mcaniques,) des dfaillances qui peuvent se produire sur la machine asynchrone. Dbute par un rappel sur la constitution des machines lectriques, et plus particulirement sur celle de la machine asynchrone cage d'cureuil. Nous voquerons essentiellement des dfauts qui peuvent survenir tant au stator qu'au rotor et denroulements de la machine. Dans la deuxime partie de ce chapitre, nous arborons sur les diffrentes approches de diagnostic est leurs domaines dapplications. A partir de ces considrations, nous proposons une classification non exhaustive des mthodes de diagnostic selon trois axes : les mthodes reposant sur une approche signal, les mthodes bases sur une approche systme et les mthodes de prises de dcision.

La machine asynchrone et les mthodes de diagnostic

1.2 La machine asynchrone


Le moteur asynchrone est la machine la plus utilise dans le domaine des puissances suprieures quelques kilowatts car il prsente de nombreux avantages tels que sa puissance massique, sa robustesse, sa facilit de mise en oeuvre, son faible cot, etc. Lapparition dans les annes 1980 des variateurs permettant de faire varier la frquence de rotation dans une large gamme a grandement favoris son dveloppement. En effet, il entre dans la conception de nombreux procds industriels associant des convertisseurs statiques et des machines lectriques (traction lectrique, laminoirs, levage, pompage, etc.). Bien que la machine asynchrone ait la rputation dtre robuste, elle peut prsenter comme toute autre machine lectrique, des dfaillances dordre lectrique ou mcanique. Ainsi, en raison des consquences importantes et coteuses que peut engendrer lapparition dun dfaut sur les processus industriels, le diagnostic des dfauts fait lobjet dun engouement prononc depuis les deux dernires dcennies.

1.2.1 Constitution de la machine asynchrone


La machine asynchrone, souvent appele moteur induction comprend un stator et un rotor, constitus de tles d'acier au silicium et comportant des encoches dans lesquelles on place les enroulements. Le stator est fixe ; on y trouve les enroulements relis la source. Le rotor est mont sur un axe de rotation. Selon que les enroulements du rotor sont accessibles de l'extrieure ou sont ferms sur eux mmes en permanence, on dfinit deux types de rotor : bobin ou cage d'cureuil. Toutefois, nous admettrons que sa structure est lectriquement quivalente celle d'un rotor bobin dont les enroulements sont en court-circuit. Dans ce travail, nous nous intressant la machine asynchrone cage d'cureuil. Les lments de constitution d'une machine asynchrone cage d'cureuil sont illustrs dans la Figure 1.1.

La machine asynchrone et les mthodes de diagnostic

10

Boite bornes

Tles+ cage rotorique Roulements billes

Ailette de ventilation

Anneaux de court circuit Tte de bobine statorique Tles statoriques Ventilateur de refroidissement Carter en vente avec ailettes de refroidissement

Encoches statoriques

Figure 1.1. Elments de constitution d'une machine asynchrone cage d'cureuil

1.2.1.1 Le stator Il est constitu dun enroulement bobin rparti dans les encoches du circuit magntique. Ce circuit magntique est constitu dun empilage de tles dans lesquelles sont dcoupes des encoches parallles laxe de la machine (figure 1.2). Le bobinage statorique peut se dcomposer en deux parties : les conducteurs dencoches et les ttes de bobines. Les conducteurs dencoches permettent de crer dans lentrefer le champ magntique lorigine de la conversion lectromagntique. Les ttes de bobines permettent, quant elles, la fermeture des courants en organisant la circulation judicieuse des courants dun conducteur dencoche lautre. Lobjectif est dobtenir la surface de lentrefer une distribution de courant la plus sinusodale possible, afin de limiter les ondulations du couple lectromagntique

10

La machine asynchrone et les mthodes de diagnostic

11

Empilement de tles magntiques Spires en court-circuit

Seconde paire de ples de la phase c

Mise en sries des sections

Premire paire de ples de la phase c Tte de bobines section Prises intermdiaires de court-circuit

Figure 1.2. vue schmatique en perspective du stator(circuit magntique, conducteurs dencoches, tte de bobines).(enroulement statorique dune machine a 4 ples).[SCH99]

1.2.1.2 Ie rotor cage Dans le rotor cage, les anneaux de court-circuit permettent la circulation des courants dun conducteur dencoche (barre rotoriques) lautre. Ces barres conductrices sont rgulirement rparties, et constituent le circuit du rotor (figure 1.3). Cette cage est insre lintrieur dun circuit magntique constitu de disques en tles empils sur larbre de la machine analogue celui du moteur rotor bobin. Dans le cas de rotors cage dcureuil, les conducteurs sont raliss par coulage dun alliage daluminium, ou par des barres massives de cuivre prformes et fretts dans les tles du rotor. Il ny a gnralement pas, ou trs peu, disolation entre les barres rotoriques et les tles magntiques, mais leur rsistance est suffisamment faible pour que les courants de fuite dans les tles soient ngligeables, sauf lorsquil y a une rupture de barre [Ker 84]. Le moteur cage dcureuil est beaucoup plus simple construire que le moteur rotor bobin et, de ce fait, son prix de revient est infrieur. De plus, il dispose dune plus grande robustesse. Il constitue la plus grande partie du parc de moteurs asynchrones actuellement en service.

11

La machine asynchrone et les mthodes de diagnostic

12

Son inconvnient majeur est quil a, au dmarrage, de mauvaises performances (courant lev et faible couple). Cest pour remdier cette situation quont t dvelopps deux autres types de cages (rotor double cage et rotor encoches profondes).

Conducteurs rotoriques (barres)

Tles magntiques du rotor

Anneaux de court-circuit Figure 1.3 vue schmatique en perspective du rotor (tles magntiques, conductrices
dencoches (barres) et anneaux de court-circuit [SCH99].

1.2.1.3 Les organes mcaniques La carcasse sert de support, elle joue le rle denveloppe et assure la protection contre lenvironnement extrieur. Larbre est un organe de transmission. Il comprend une partie centrale qui sert de support au corps du rotor et un bout darbre sur lequel est fix un demi accouplement. Il est gnralement constitu en acier moul ou forg. Son dimensionnement est fonction des efforts de flexion (force centrifuge qui sexerce sur lui, attraction magntique radiale, etc.), des efforts radiaux et tangentiels dus aux forces centrifuges, des efforts de torsion (couple lectromagntique transmis en rgime permanent, transitoire). Il est support par un ou plusieurs paliers. Ces paliers soutiennent le rotor et assurent la libre rotation. Le second palier est libre pour assurer les dilatations thermiques de larbre. Une isolation lectrique de lun des paliers assure llimination des courants dans larbre d aux dissymtries des rluctances du circuit magntique. Ils sont gnralement roulements pour les machines de petite et moyenne puissance.

12

La machine asynchrone et les mthodes de diagnostic

13

Afin dassurer la variation de vitesse des moteurs lectriques mais aussi la conversion de lnergie, de nombreuses machines se voient associer un convertisseur. Ainsi, de nos jours, on trouve dans un grand nombre de procds industriels, des associations entre des convertisseurs statiques et des machines lectriques (pompage, levage,). Cela permet de fournir aux moteurs des tensions et des courants de frquence variable servant commander la machine en couple ou en vitesse.

1.2.2 Etude statistique des dfaillances de la machine asynchrone


Les dfaillances peuvent tre dorigines diverses, lectriques, mcaniques ou bien encore magntiques. Leurs causes sont multiples et peuvent se classer en trois groupes [ODo 85] : les gnrateurs de pannes ou initiateurs de dfauts : surchauffe du moteur, dfaut lectrique (court-circuit), survoltage dalimentation, problme disolation lectrique, usure des lments mcaniques (roulements billes), rupture de fixations, etc. les amplificateurs de dfauts : surcharge frquente, vibrations mcaniques, environnement humide, chauffement permanent, mauvais graissage, vieillissement, etc. les vices de fabrication et les erreurs humaines : dfauts de fabrication, composants dfectueux, protections inadaptes, mauvais dimensionnement de la machine, etc. Une tude statistique, effectue en 1988 par une compagnie dassurance allemande de systmes industriels [All 88] sur les pannes des machines asynchrones de moyenne puissance (de 50 kW 200kW) a donn les rsultats suivants (figure 1.4) :

Rotor 22%

Autres18%

Stator60%

Figure 1.4. Proportion des dfauts

13

La machine asynchrone et les mthodes de diagnostic

14

La rpartition des pannes dans les diffrentes parties du moteur est prsente sur la figure 1.5:

Figure 1.5. Rpartition des pannes sur les machines de faibles et moyennes puissances Une autre tude statistique [Tho 95] faite sur des machines de grande puissance (de100 kW 1 MW) donne des rsultats qui sont prsents sur la figure 1.6.

Figure 1.6. Rpartition des pannes sur les machines de fortes puissances Les contraintes mcaniques sont plus grandes pour ces types de machines ce qui explique le taux lev des pannes dues aux roulements. Celles-ci exigent une maintenance mcanique accrue.

14

La machine asynchrone et les mthodes de diagnostic

15

1.2.2.1 Dfaillances au stator


Pour le stator, les dfaillances sont principalement dues un problme : thermique (surcharge,) lectrique (dilectrique,) mcanique (bobinage,) environnemental (agression,) Les dfauts qui sont les plus rcurrents, localiss au niveau du stator, peuvent tre dfinis comme suit : A. Dfauts disolant dans un enroulement La dgradation des isolants dans les enroulements peut provoquer des courts-circuits. En effet, les diffrentes pertes (Joule, fer, mcanique,) engendrent des phnomnes thermiques se traduisant par une augmentation de la temprature des diffrents constituants du moteur. Or les matriaux disolation ont une limite de temprature, de tension et mcanique. De ce fait, si lenvironnement de travail dun matriau disolation dpasse une de ces limites, ce matriau se dgrade de manire prmature ou acclre, puis finit par ne plus assurer sa fonction. Les diffrentes causes pour ce type de dfaut sont : dgradation de lisolant la fabrication. tension de lenroulement suprieure la limite du matriau disolation. vibrations mcaniques. courant lev dans lenroulement d un court-circuit, un dfaut du convertisseur, une surcharge. Ceci entrane une lvation de la temprature dgradant prmaturment le matriau disolation. vieillissement naturel des isolants. Tous les matriaux isolants ont une dure de vie limite. Mme dans une utilisation normale, lisolant finit naturellement par se dgrader. fonctionnement dans un environnement svre.

15

La machine asynchrone et les mthodes de diagnostic

16

B. Court-circuit entre spires Un court-circuit entre spires de la mme phase est un dfaut assez frquent. Cette dfaillance a pour origine un ou plusieurs dfauts disolant dans lenroulement concern. Il entrane une augmentation des courants statoriques dans la phase affecte, une lgre variation de lamplitude sur les autres phases, modifie le facteur de puissance et amplifie les courants dans le circuit rotorique. Ceci a pour consquence une augmentation de la temprature au niveau du bobinage et, de ce fait, une dgradation acclre des isolants, pouvant provoquer ainsi, un dfaut en chane (apparition dun 2me court-circuit). Par contre, le couple lectromagntique moyen dlivr par la machine reste sensiblement identique hormis une augmentation des oscillations proportionnelle au dfaut. C. Court-circuit entre phases Ce type de dfaillance peut arriver en tout point du bobinage, cependant les rpercussions ne seront pas les mmes selon la localisation. Cette caractristique rend difficile une analyse de lincidence de ce dfaut sur le systme. Lapparition dun court-circuit proche de lalimentation entre phases, induirait des courants trs levs qui conduiraient la fusion des conducteurs dalimentation et/ou la disjonction par les protections. Dautre part, un court-circuit proche du neutre entre deux phases engendre un dsquilibre sans provoquer la fusion des conducteurs. Les courants statoriques sont totalement dsquilibrs et ce dsquilibre est proportionnel au dfaut qui apparat. Les courants dans les barres ainsi que dans les anneaux sont augments lors de lapparition de ce dfaut. La dtection de ce type de dfaut peut reposer sur le dsquilibre des courants de phases. D. Court-circuit phase/bti Le bti a gnralement un potentiel flottant, mais pour des raisons de liaisons mcaniques, il est souvent reli la masse. Si le potentiel est flottant, un court-circuit entre lenroulement et le bti na pas dimportance du point de vue matriel, except les effets capacitifs, le bti prend alors le potentiel de lenroulement lendroit du court-circuit.

16

La machine asynchrone et les mthodes de diagnostic

17

Par contre, au niveau de la scurit des personnes, ce type de dfaut peut tre trs dangereux et il est alors ncessaire de mettre en place des dispositifs de protection (disjoncteurs diffrentiels). En prsence de ce type de dfaillance, la tension de la phase concerne ne change pas. Cependant le courant circulant dans cette phase augmente avec la rduction de la rsistance et de linductance. Cette augmentation du courant se traduit par une augmentation de la temprature pouvant entraner des dfauts disolant dans lenroulement. De plus, cette dfaillance va gnrer une composante homopolaire entranant lapparition dun couple pulsatoire. Une mesure du courant de fuite pourrait permettre de dtecter ce type de dfaut. E. Dfauts de circuit magntique Ces dfauts aboutissent dans la plupart des cas une dissymtrie au niveau du fonctionnement de la machine, qui son tour peut accentuer le problme par des phnomnes de surchauffe, de surtension, dlvation importante du courant, etc.

1.2.2.2 Dfaillances au rotor


Pour le rotor, les dfaillances sont essentiellement dues un problme : thermique (surcharge,) lectromagntique (force en B 2 (t ) ,) rsiduel (dformation,) dynamique (arbre de transmission,) mcanique (roulement,) environnemental (agression,) Les dfauts qui sont les plus rcurrents, localiss au niveau du rotor, peuvent tre dfinis comme suit :

17

La machine asynchrone et les mthodes de diagnostic

18

A. Ruptures de barres [Na 00], [Elk 92] La cassure ou rupture de barre est un des dfauts les plus frquents au rotor. Elle peut se situer soit au niveau de son encoche soit lextrmit qui la relie lanneau rotorique. La dtrioration des barres rduit la valeur moyenne du couple lectromagntique et augmente lamplitude des oscillations, qui elles-mmes provoquent des oscillations de la vitesse de rotation, ce qui engendre des vibrations mcaniques et donc, un fonctionnement anormal de la machine. La grande amplitude de ces oscillations acclre la dtrioration de la machine. Ainsi, le couple diminue sensiblement avec le nombre de barres casses induisant un effet cumulatif de la dfaillance. Leffet dune cassure de barre crot rapidement avec le nombre de barres casses. B. Ruptures danneaux La rupture de portion danneau est un dfaut qui apparat aussi frquemment que la cassure de barres. Ces ruptures sont dues soit des bulles de coules ou aux dilatations diffrentielles entre les barres et les anneaux. Comme il est difficile de le dtecter [Yah 95], ce dfaut est gnralement group, voir confondu, avec la rupture de barres dans les tudes statistiques. Ces portions danneaux de court-circuit vhiculent des courants plus importants que ceux des barres rotoriques. De ce fait, un mauvais dimensionnement des anneaux, une dtrioration des conditions de fonctionnement (temprature, humidit,) ou une surcharge de couple et donc de courants, peuvent entraner leur cassure. La rupture dune portion danneau dsquilibre la rpartition des courants dans les barres rotoriques et de ce fait, engendre un effet de modulation damplitude sur les courants statoriques similaire celui provoqu par la cassure de barres. C. Excentricit statique et dynamique Parfois, la machine lectrique peut tre soumise un dcentrement du rotor, se traduisant par des oscillations de couple (dcalage entre le centre de rotation de larbre et le centre du rotor, figure 1.8).

18

La machine asynchrone et les mthodes de diagnostic

19

Excentricit statique

Excentricit dynamique (plusieurs positions du rotor au cours de la rotation)

Figure 1.8. Modlisation schmatique de lexcentricit statique et dynamique Ce phnomne est appel excentricit (statique et dynamique) dont lorigine peut tre lie un positionnement incorrect des paliers lors de lassemblage, un dfaut roulement (usure), un dfaut de charge, ou un dfaut de fabrication (usinage). Trois cas d'excentricit [Sob 98], [Dev 01] sont gnralement distingus : - l'excentricit statique, le rotor est dplac du centre de l'alsage stator mais tourne toujours autour de son axe. - l'excentricit dynamique, le rotor est positionn au centre de l'alsage mais ne tourne plus autour de son axe. - l'excentricit qu'on pourrait qualifier de mixte, associant les deux cas prcdemment cits. Ce dfaut modifie le comportement magntique ainsi que mcanique de la machine. En effet, laugmentation de lexcentricit dans lentrefer induit une augmentation des forces lectromagntiques qui agissent directement sur le noyau statorique ainsi que lenroulement correspondant, ce qui engendre une dgradation de son isolation. Dautre part, cette augmentation peut avoir comme consquence des frottements entre le stator et le rotor en raison des forces dattraction magntique qui dsquilibrent le systme. Ceci donne naissance des niveaux de vibration considrables dans les enroulements.

19

La machine asynchrone et les mthodes de diagnostic

20

1.2.2.3 Dfaillances mcaniques


A. Dfauts roulements Les roulements billes jouent le rle dinterface lectromcanique entre le stator et le rotor. En outre, ils reprsentent llment de maintien de laxe de la machine permettant dassurer une bonne rotation du rotor. Dans larticle [Bon 93], lauteur prsente la plupart des dfauts survenant dans les roulements des moteurs induction ainsi que les raisons de leur vieillissement. Comme il a t prsent prcdemment, ce type de dfaut est le plus frquent sur les machines de fortes puissances. Il est gnralement li lusure du roulement et plus prcisment une dgradation des billes, ou de la bande de roulement. Ses causes possibles : lusure due au vieillissement la temprature de fonctionnement leve la perte de lubrification lhuile contamine (par des paillettes mtalliques issues de la dgradation des billes ou de la bande de roulement) le dfaut de montage les courants darbres (Shaft Current) Les consquences directes de cette dfaillance sur les roulements sont : des trous dans les gorges de roulement intrieures et extrieures londulation de leur surface de roulement lattaque des billes la corrosion due leau dfaut de graissage, problme d la temprature dcollement, effritement de surface provoqu par une surcharge Sur le systme, ce type de dfaut se traduit par des oscillations du couple de charge, une apparition de pertes supplmentaires et un jeu entre la bague interne et la bague externe du roulement entranant des vibrations par les dplacements du rotor autour de laxe longitudinale de la machine. Dans le cas le plus dfavorable, la prsence dun roulement dfectueux peut amener au blocage du moteur.

20

La machine asynchrone et les mthodes de diagnostic

21

B. Autres dfaillances mcaniques Au stator, il ny a pas de pices mobiles donc a priori pas de dfaillances mcaniques. Cependant, il peut apparatre des phnomnes doxydation lis lenvironnement de la machine et plus prcisment au taux de salinit qui influe sur ltanchit et les contacteurs.

1.3 Mthodes de surveillance et de diagnostic de la machine asynchrone


La maintenance ncessite de connatre les rgimes de fonctionnement des systmes alors que la surveillance donne une rponse aux besoins dinformation de la maintenance dans le but de garantir le bon fonctionnement des systmes. Le diagnostic sintgre la surveillance en ayant pour objectif de dterminer les causes de dysfonctionnement. La surveillance et le diagnostic des dfauts ncessitent dobtenir des symptmes caractristiques du fonctionnement de lentranement surveill et de les analyser pour en dduire ltat du systme. Ltablissement des symptmes se fait souvent en rfrence la connaissance du comportement sain dont on dispose. La forme et la mthode de gnration des symptmes sont tributaires de la forme prise par cette connaissance. Par exemple si le fonctionnement dfaillant est mis en vidence par lapparition des nouvelles raies spectrales dans une grandeur lectrique, une analyse en traitement de signal permettra une acquisition des symptmes. Le mode de traitement des symptmes dpend de leur type mais aussi de la forme prise de la connaissance. La classification des mthodes de surveillance et le diagnostic se fait gnralement en fonction de la forme prise par la connaissance et bien entendu, en fonction de la mthode danalyse qui en dcoule. Traditionnellement, les symptmes du dfaut sont recherchs dans les signaux mesurs: ce sont les mthodes reposant sur une approche signal. Elles traitent en grande partie des informations issues de lexprience. Les mthodes de surveillance et de diagnostic mises en uvre sorientent donc naturellement sur lanalyse du signal (sans ajout de capteur).

21

La machine asynchrone et les mthodes de diagnostic

22

Une autre approche, appele systme base sur des mthodes heuristiques, issues de lexprience et de lexpertise. Des techniques daide la gnration et la formalisation des symptmes (mesures) ont permis de fournir une aide lexpertise en quantifiant les symptmes (analyse de signaux lectrique, vibratoire, thermique) mais lanalyse reste une affaire de rgles et de classification (reconnaissance de forme, systme expert..). Ces mthodes de surveillance ncessitent une bonne connaissance du systme composants et de ces

1.3.1 Mthodes bases sur une approche systme


Les mthodes dites systme repose sur une connaissance du comportement du systme sain et dfaillant cest--dire leffet dun dfaut sur les variables mesures. Ces mthodes exploitent les paramtres issus des mthodes dites signal . Ces paramtres constituent alors une signature caractristique du dfaut. Elles ncessitent une base dapprentissage intgrant des signatures du systme dans ses diffrents modes de fonctionnement. Un nouveau point de fonctionnement est compar avec les points de la base de fonctionnement. Plusieurs mthodes ont t dvelopp dans la littrature base sur les rseaux de neurones [Rai 00], la reconnaissance de formes (RDF) [Cas 03], [Ond 06], le neuro-floue, les algorithmes gntiques [Der 02], les reprsentations temps frquence (RTF). Toutes ces mthodes tendent automatiser le processus de diagnostic depuis lacquisition des donnes sur la machine jusqu la prise de dcision sans lintervention dun expert. Dans cette partie, nous allons prsenter quelques unes de ces techniques ainsi que leur application dans le domaine du diagnostic de la machine lectrique. 1.3.1.1 Rseaux de neurones Le principe des rseaux de neurones sinspire des neurones biologiques. le modle du neurone formel se comporte comme un oprateur effectuant une somme pondre de ses entres, suivie dune non linarit, appele fonction dactivation, responsable du comportement du neurone.

22

La machine asynchrone et les mthodes de diagnostic

23

Un rseau de neurones comprend un certain nombre de couches de neurones interconnects. Couches dentrs, couches cache et couches de sortie. Lentre reprsente par les nuds de sources fournit des poids daccs physiques pour lapplication des signaux dentres. Les neurones dans la couche cache, se comportent en dtecteurs de caractristique, tandis que, les neurones dans la couche de sortie prsentent lutilisateur les conclusions obtenues par le rseau, ou la rponse aux signaux dentres (figure 1.9). Une loi dapprentissage permet dajuster les poids des connexions afin davoir les performances dsires. Linitialisation du rseau de neurones est un processus itratif dajustement des poids et des biais dapprentissage. de manire minimiser un critre derreur. Elle constitue la phase

y1 y2
Couche Couche Couche Couche dentreFigure 1.9 Structure d'un rseau 2 neuronesortie cache de de cache 1

figure 1.9 la structure gnrale de rseau de neurone Les avantages des rseaux de neurones - la rapidit, trs utile lorsque le diagnostic doit tre conduit en ligne. - un rseau de neurone est robuste surtout vis--vis du bruit. Toutefois un rseau de neurone prsente des inconvnients [Rai 00] - lapprentissage peut tre long et difficile. - lapprentissage est gourmand en temps de calcul. Par ailleurs, il doit tre ralis sur toutes les donnes la fois, avec le risque que le rseau oublie les rsultats prcdents. - il est ncessaire de possder des jeux de donnes sur toutes les conditions de fonctionnement et en particulier pour les fonctionnements dfaillants.

23

La machine asynchrone et les mthodes de diagnostic

24

- un rseau de neurones ne fonctionnera pas forcment correctement hors de sa plage dapprentissage. - une fois entran, un rseau de neurone nest pas flexible. Si de nouvelles donnes interviennent, il faudra recours un nouvel apprentissage. Cependant celui-ci peut tre effectu en ligne. Lintrt des rseaux de neurones dans le domaine de diagnostic se rsume en deux points : - le premier point est la facult de rseau de neurones dtre utilis en tant que rgle de dcision dans un processus dautomatisation de lopration du diagnostic, - le second point est la facult dapprentissage et de mmorisation dun grand volume dinformation. Dailleurs, en ce qui concerne le diagnostic des machines lectriques, cette mthode a t largement utilise. [Sit 04] a propos un systme didentification et de classification des dfauts de la machine asynchrone. Ce systme est bas sur les rseaux de neurones base radiale (RBF). Le systme dvelopp par cet auteur, permet la dtection des dfauts lectriques et mcaniques de la machine asynchrone. Quatre vecteurs caractristiques ont t extraits partir des spectres de puissance des signaux vibratoires de la machine. Ces vecteurs sont fournis lentre du rseau de neurones. Le systme propos permet galement destimer la svrit des dfauts dtects. [Nej 00] exprimente la dtection du dsquilibre de lalimentation alors que [Sch 95] sintresse lexcentricit. Dans ces deux cas, leurs essais prouvent lintrt des rseaux de neurones pour la classification et la prise de dcision. [Fil 95], a utilis les rseaux de neurones, notamment pour la dtection et lestimation du nombre de barres casses. 1.3.1.2 Reconnaissance de forme (RdF) La Reconnaissance des Formes (RdF) repose sur le classement des objets ou formes en les comparants des formes-types. De manire gnrale, deux types de RdF se distinguent :

24

La machine asynchrone et les mthodes de diagnostic

25

- la RdF structurelle qui se base sur une reprsentation des formes laide de grammaires [Fu 74]. Cette approche ne sera pas dveloppe par la suite, - la RdF statistique qui sappuie sur une reprsentation numrique des formes [Dub 90]. Lauteur [Cas 03] a appliqu la RdF, pour le diagnostic des dfauts de la machine asynchrone. Un vecteur de paramtres, appel vecteur forme, a t extrait de chacune des mesures effectues sur la machine. Les rgles de dcisions utilises ont permis de classer les observations dcrites par le vecteur forme, par rapport aux diffrents modes de fonctionnement connus avec ou sans dfaut. Cette approche permet une classification avec un taux derreur presque nul. Toutefois les performances de cette mthode sont lies au choix du vecteur forme. [Ond 06] propose une mthode de slection des paramtres base sur un lalgorithme gntique. Il permet une rduction notable de la dimension de ce vecteur sans perte sensible dinformation. Lapproche RdF est une mthode bien adapte au domaine du diagnostic des dfauts. Elle requiert une phase dapprentissage qui peut tre non supervis. Mais ces mthodes requirent des volumes de calcul important, parfois incompatible avec une exploitation temps rel. Nous avons fait voluer ces mthodes de classification dans un souci de rduction du temps de calcul et defficacit. Nous avons contribu au dveloppement dune nouvelle approche, systme, exploitant une reprsentation Temps-frquence et un critre de dcision. Cette mthode est souple, facile mettre en uvre. Elle se base uniquement sur le traitement du courant de phase statorique. Par consquent, cette mthode se prte bien pour diagnostic en ligne. 1.3.1.3 Analyse Temps-frquence : outil privilgi de dtection La reprsentation temporelle du signal ne donne pas une bonne perception des composantes oscillantes multiples, tandis que la reprsentation frquentielle (transforme de Fourier) ne montre pas clairement la localisation temporelle de ces composantes. Il semble donc naturel de penser que ces limitations pourraient tre surmontes par une analyse tempsfrquence o le signal est reprsent comme une fonction conjointe du temps et de la frquence- cest--dire dans un plan temps-frquence plutt quune fonction du temps ou de la frquence. un

25

La machine asynchrone et les mthodes de diagnostic

26

Une telle analyse devrait constituer un outil majeur pour la comprhension de nombreux processus et phnomne, dans des problmes destimation, de dtection ou de classification. Cependant, Le temps-frquence se trouve confronter au problme de la transformation mathmatique qui permet de passer du signal analys sa reprsentation temps-frquence. Cest une limitation fondamentale, connue sous le nom de principe dincertitude dHeisenberg, qui exclut toute localisation temporelle prcise dune frquence. Cette ambigut qui a donn lieu la dfinition dune grande diversit de transformation temps-frquence. Les reprsentations temps-frquences (RTF), prsentes dans ce contexte, sont issues de la classe de Cohen [Coh 95]. Elles dcrivent le contenu nergtique pour une frquence un instant donn.
RTFx (t , f ) =

( , )

Ax ( , ) e j 2 (t f ) d d

(1.1)

Les RTF base sur la classe de Cohen sont caractrises par un noyau que lon peut choisir pour une application particulire, ce qui permet une interprtation visuelle intuitive facilitant la conception de procdures de traitement automatique. De nombreux travaux sappuient dailleurs sur cette qualit pour proposer des algorithmes de dcision tempsfrquence [Fla 88], [Boa 90], [Hei 95], [Lem 95] a) Reprsentation temps-frquence noyau paramtrique La recherche en temps-frquence a essentiellement porte sur la conception de fonction de lissage ou des noyaux paramtrs qui permettent notamment la rduction maximale des interfrences quadratiques [Coh 95], qui rendent difficile linterprtation de limage. Bien qu'une partie de ces RTF puisse offrir des avantages pour la classification de certains types de signaux [Wan 95],[Ben 98], la conception du systme de dtection ou de classification a rarement eu pour but la conception de noyau. Ces quelques mthodes qui proposent doptimiser le noyau pour la classification contraignent la forme du noyau aux fonctions paramtriques prdfinies avec les symtries qui peuvent ne pas tre appropries la dtection ou la classification [Hei 95], [Dav 98].

26

La machine asynchrone et les mthodes de diagnostic

27

b) Reprsentation temps-frquence noyau non paramtrique Pour raisonner en termes de diagnostic et de classification, il n'est pas ncessairement souhaitable de reprsenter avec prcision la distribution d'nergie d'un signal en tempsfrquence. En fait, une telle reprsentation peut tre lencontre de lobjectif de la classification. Il peut tre avantageux de concevoir une RTF qui accentue spcifiquement les diffrences entre les classes (le terme classe est utilis pour dfinir un groupe, arbitraire ou autre, des donnes "semblables"). Cette approche a t employe dans les domaines du radar, du sonar, de l'astronomie par radio, des communications et des systmes optiques .

1.3.2 Mthodes de prises de dcision (classification)


De manire gnrale, on peut diviser les mthodes de classification entre mthodes avec apprentissage supervis et mthodes avec auto-apprentissage. Les mthodes avec apprentissage supervis ont besoin de connatre a priori les classes associes aux donnes dentranement. Dans tous les cas, un vecteur rsumant l'information (individu) qui correspond aux chantillons du systme, est analys pour trouver les caractristiques des classes. La diffrence entre les deux types de mthodes est la phase dapprentissage. Dans le contexte des mthodes bases sur la fouille de donnes, les mthodes qui se situent dans le Machine Learning permettent dobtenir des rgles ou des expressions de classification plus simples, de telle sorte que les rsultats obtenus soient facilement interprtables. Un des objectifs de ces mthodes est que lintervention humaine dans la phase dentranement soit minimale et quen mme temps, les classes obtenues soient facilement interprtables. 1.3.2.1 Discriminant Linaire ACP Il sagit dun algorithme standard et qui est le plus utilis dans diffrents systmes de diagnostic industriel.

27

La machine asynchrone et les mthodes de diagnostic

28

Le but principal de IACP est donc de trouver un ensemble de facteurs (composantes) qui ait une dimension infrieure celle de lensemble original de donnes et qui puisse dcrire correctement les tendances principales. LACP est une procdure qui ne prend en compte que les variables du processus. Parfois, un ensemble additionnel de donnes est disponible. Le discriminant linaire [Fis 36] suppose une distribution normale des donnes avec des moyennes diffrentes. Ce type de distribution est justifi quand il y a une grande quantit de donnes. L'objectif est de trouver les hyperplans qui divisent l'espace des donnes. En principe, un hyperplan de dimension d (avec d gal au nombre de descripteurs) est trac de telle manire quil passe par le milieu de la ligne qui unit les centres de chaque classe. Lalgorithme cherche obtenir des fonctions discriminantes paramtriques (hyperplans), partir de la minimisation de l'erreur quadratique de classification. Par consquent, c'est une technique qui requiert de connatre a priori les classes de l'ensemble des donnes d'entranement. Une fois la partition de l'espace obtenue, de nouvelles donnes peuvent tre classes. 1.3.2.2 Les K plus proches Voisins (K- Nearest Neighbors) C'est la premire mthode de classification qui ne suppose pas un type de distribution des donnes et cest la premire proposer une analyse de similitude entre des donnes en utilisant la distance entre elles [Fix 51]. L'algorithme fait un calcul de distance entre tous les individus et chaque objet est class dans le groupe o se trouvent ses K plus proches voisins. Les k plus proches voisins sont des individus de lensemble des donnes dentranement. Habituellement, la distance employe pour lanalyse est la distance euclidienne. Normalement le nombre des K voisins est un ou trois, mais cette valeur dpend de lapplication [Dud 01]. 1.3.2.3 Rseaux de Neurones La structure gnrale dun rseau de neurones utilise pour le diagnostic de systmes, est gnralement constitue de trois couches : une couche dentre, une couche cache et une couche de sortie (Figure 1.10).

28

La machine asynchrone et les mthodes de diagnostic

29

w ji
x1 x2

wkj
y1 y2
y1

x n 1

ym

Input layer (i )

Hidden layer

Output layer (k )

Figure I.10 les trios couches de RNA Le nombre de neurones de la premire couche correspond au nombre de descripteurs du problme (d=nombre de descripteurs de chaque individu x n ) et le nombre de neurones de la couche de sortie correspond aux K classes. Normalement, les performances du rseau sont directement lies la taille de la couche cache. L'quation gnrale dun neurone est la suivante : y i (t ) = wij x j (t )
j =1 N

....(1-2)

u i (t ) = f ( y i (t )) y i (t ) est l'tat interne du neurone i et u i (t ) est son tat de sortie ou lactivation de sortie. Les applications des RNA dans le cas du diagnostic automatique montrent que grce la capacit de gnralisation de cette technique, les rsultats sont satisfaisants. Les inconvnients avec les RNA sont le temps dapprentissage et la difficult, dinterprtation de la structure des classes, interprtation souvent ncessaire dans limplmentation dune technique de classification pour le diagnostic. 1.3.2.4 Mthodes de coalescence (clustering) Ces algorithmes ont comme paramtre d'entre le nombre de classes. Ils partagent lensemble de N objets en K groupes, ainsi la similarit lintrieur dun mme groupe est leve mais faible entre les diffrentes classes. Pour ce faire, ces algorithmes itrent en deux tapes, dabord ils calculent les centres des groupes et deuximement ils assignent chaque objet au centre le plus proche.

29

La machine asynchrone et les mthodes de diagnostic

30

Chaque classe est caractrise par le centre ou prototype et par ses lments. Le prototype des classes est le point dans l'espace de dimension d (d correspond au nombre de descripteurs) o la somme des distances tous les objets dun mme groupe est minimale.

K-Means est sans nul doute lalgorithme le plus connu Parmi les diffrentes mthodes
bases sur la distance. Il effectue une sparation stricte de l'espace (cest--dire chaque objet nest associ qu une seule classe). La mesure de similarit utilise est la distance, pour le calcul plusieurs mesures peuvent tre utilises (e.g. euclidienne, Mahalanobis, etc.),par consquent la forme gomtrique change en fonction de la mesure employe (e.g. pour le cas euclidien la gomtrie des groupes est une hypersphre) [Gen 07].

le Fuzzy K-Means (FKM) qui permet d'avoir un regroupement de type flou. FKM est
un processus itratif qui permet dobtenir comme rsultat la matrice de partition floue ( U = [u kn ] ) laquelle contient les degrs dappartenance de chaque objet x n chacune des K classes.

GK-Means [Gus 92] est Un autre algorithme, reconnu pour ses trs bonnes
performances. Cet algorithme utilise une norme adaptative de la distance, en obtenant des classes de gomtrie hyper-ellipsodale avec des axes qui ne sont pas ncessairement parallles aux axes de l'espace des donnes. Ceci constitue un avantage face l'algorithme FKM parce que le GK-Means permet chaque groupe dadapter sa norme de distance en fonction de la structure topologique locale des donnes. Chaque groupe a une matrice de norme induite Ak qui permet dobtenir la
2 norme de distance Dnk propre chaque classe.

1.4 Choix de la mthode de classification


Parmi les mthodes systme exposes ci-dessus, notre choix sest port pour lanalyse temps frquence noyau non paramtrique en tant quoutil de surveillance et de diagnostic. Celui-ci est justifi pour les raisons suivantes : la mthode est pratique mettre en uvre, elle est conome en temps de calcul,

30

La machine asynchrone et les mthodes de diagnostic

31

1.4 .1 Classification par la reprsentation temps-frquence Dans la classification traditionnelle, les donnes taient souvent transformes en une Reprsentation Temps-Frquence (RTF) standard (par exemple, le spectrogramme ou le Wigner-Ville TFR); puis, une projection tait applique la RTF pour aboutir un espace de dimension rduite [Hay 97]. Le choix dune RTF et d'un algorithme de projection doivent tre conjointement optimiss. Pour diminuer le temps de calcul, il est plus pertinent dutiliser une RTF optimise par un noyau appropri et qui puisse tre directement classifie sans rduction de la dimension de la RTF. Un signal peut tre reprsent par un nombre infini de RTF (figure 1.11 a). Cependant, une RTF optimale pour une tache de classification savre ncessaire pour l'extraction des motifs. Il a t montr que, par exemple, le spectrogramme (une des RTF trs utilise), n'est pas optimal en terme de classification de signaux [Dav 00]. En effet, lobjectif d'un spectrogramme est de dcrire la densit d'nergie d'un signal simultanment dans des domaines de temps et de frquence alors que le but d'une classification RTF est de maximiser la sparabilit des signaux de diffrentes classes [Wan 04]. Par consquent, il est souhaitable de concevoir une RTF qui permet une classification optimale cest--dire une RTF (figure 1.11 b) qui maximise les distances entre classes.

Signal 1

Signal 2

Signal 3

RTF1

Signal, x

RTF2 M

(RTFi )1
(b)

(RTFi )2
Classifieur

(RTFi )3

(a)

RTFn M

Classe 1

Classe 2

Classe 3

Figure 1.11 RTF oriente vers la classification

31

La machine asynchrone et les mthodes de diagnostic

32

1.4.2 RTF dite "Dpendante de la Classe du Signal (DCS) " La RTF dite "dpendante de la classe du signal " nexige priori aucune forme paramtrique et prdfinie du noyau. La mthode propose ncessite deux tapes principales : l'extraction de motif et la classification. L'extraction de motif saisit l'information pertinente des signaux classifier et fournit les motifs comme des entres pour le systme de classification. Dans notre cas la classification repose sur le calcul des distances de Mahalanobis entre le vecteur motif classer et les vecteurs motifs d'apprentissage des diffrentes classes. Nous proposons une mthode pour concevoir des noyaux optimiss, et par consquent des RTF optimises pour la discrimination entre les ensembles prdfinis de classes. Les noyaux rsultants ne sont restreints aucune fonction prdfinie mais, plutt, sont arbitraires dans leur forme. Au lieu de faire des hypothses priori au sujet du type de lissage temps frquence, notre approche tablit le lissage appropri pour raliser la meilleure performance de la classification. 1.4.3 La dcision Automatiser implique comprendre, dtecter, reconnatre ou classer, ce sont autant de formes courantes dune problmatique unique : la classification de signaux. En effet, la comprhension fait appel implicitement un apprentissage et une comparaison [Dud 73], la dtection dun vnement consiste affecter le signal la classe vnement prsent ou la classe absent [Van 68], etc. dans ce type de procdure, ce qui est attendu est une dcision, une affectation une classe. Une dcision ncessite un classifieur. Celui-ci fait appel des indices de divergences. Il existe plusieurs classifieurs. Nous traiterons particulirement la classification par les rseaux de neurones et les k-plus proches voisin. La premire phase du processus de classification est une phase dapprentissage partir des observations effectues sur des signaux dont la nature est connue. La seconde phase dun processus de classification consiste la prise de dcision concernant laffectation dun signal non class.

32

La machine asynchrone et les mthodes de diagnostic

33

1.5 Conclusion
Ce chapitre est essentiellement consacr l'tat de lart de la machine asynchrone et sur les mthodes de diagnostic. Nous avons scind ce chapitre en deux parties: la premire concerne la constitution de la machine asynchrone et leurs dfaillances ; la deuxime partie traite des techniques qui permettent la mise en oeuvre dune procdure de diagnostic. Les techniques et autres outils de diagnostic tant trs nombreuses, nous les avons classes en deux approches: (i) une approche signal base sur le traitement de signal des grandeurs mesurables, savoir le courant et la tension, (ii) une approche systme. Parmi les mthodes systme exposes ci-dessus, notre choix sest port pour lanalyse temps frquence noyau non paramtrique en tant quoutil de surveillance et de diagnostic. Celui-ci est justifi pour les raisons suivantes : la mthode est pratique mettre en uvre et elle est conome en temps de calcul.

33

Chapitre II
Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

35

2.1 Introduction
La reprsentation temporelle du signal ne donne pas une bonne perception des composantes oscillantes multiples, tandis que la reprsentation frquentielle (transforme de Fourier) ne montre pas clairement la localisation temporelle de ces composantes. Il semble donc naturel de penser que ces limitations pourraient tre surmontes par une analyse tempsfrquence o le signal est reprsent comme une fonction conjointe du temps et de la frquence- cest--dire dans un plan temps-frquence plutt quune fonction du temps ou de la frquence. Une telle analyse devrait constituer un outil majeur pour la comprhension de nombreux processus et phnomne, dans des problmes destimation, de dtection ou de classification par extraction des paramtres pertinents au diagnostic.

2.2 La Reprsentation temps-frquence (RTF)


Il est aujourdhui bien admis que les reprsentations dun signal conjointement en temps et en frquence offrent un rel intrt : elles permettent une description des signaux non stationnaires, cest dire lanalyse des lois de comportement frquentiel du signal au cours du temps. Suite aux travaux fondamentaux de Ville et de Wigner sur les RTF, le sujet est quasiment devenu une discipline scientifique a part entire [Boa 03],[Boa 92], [Che 02], [Coh 98], [Fla 93], [Hla 05], [Pap 02]. Par RTF, nous entendons la mise en correspondance dune fonction mono-variable (en t) avec une fonction a deux variables : le temps t et la frquence . Contrairement a la TF, qui donne le contenu frquentiel global dun signal, les RTF situent lnergie dans le plan tempsfrquence [Fla 93], [Hla 05]. Parmi les RTF, la classe de Cohen tient une place particulire [Coh 95]: [elle] peut tre construite de manire objective et [elle] contient lensemble des reprsentations bilinaires covariantes par translations dans le plan temps-frquence (extrait de P. Flandrin [Fla 93], page 108). Lexpression gnrique de la classe de Cohen peut scrire [Coh 95], [Fla 93], [Hla 05] :

C x (t , ; ) = (u t , )w x (u, )dud ....(2.1)

35

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

36

ou wx (u , ) est la Distribution de Wigner-Ville (WVD):


wx (t , ) = x t + x * t e j 2 d .(2.2) 2 2
est le noyau de la reprsentation temps-frquence. Le choix de dtermine les

proprits de C x (t , , ) : conditions marginales, FI . . . Ainsi, toute reprsentation de la classe de Cohen sobtient par la double convolution temps-frquence de la WVD qui apparat comme la distribution quadratique centrale pour lensemble de la classe de Cohen. Il existe de nombreuses distributions appartenant a la classe de Cohen comme par exemple le spectrogramme, la WVD (et ses extensions : PWVD et SPWVD), la distribution de Choi-Williams, celle de Born-Jordan, ou la B-distribution de Barkat-Boashash [Boa 03] Dans labsolu,cette description simultane en temps et en frquence rend linterprtation plus facile. Toutefois, de par leur bilinarit, ces distributions engendrent des termes dinterfrences pouvant nuire a la lisibilit des reprsentations obtenues. Ainsi , la WVD fournit dexcellents rsultats pour des signaux mono-composante mais pour les signaux a composantes multiples, elle pressente des interfrences indsirables. Supposons que x1 et x 2 soient deux composantes dun seul signal x . La WVD est alors :
wx1 + x2 (t , ) = wx1 (t , ) + wx2 (t , ) + 2 wx1 , x2 (t , ) ....(2.3) avec :
* wx1 , x2 (t , ) = x1 t + x 2 t e j 2 d .....(2.4) 2 2

wx1 , x2 (t , ) prsente une structure oscillante contrairement aux composantes propres du signal en gnral plus rguliers. On peut montrer que les structures interfrentielles sont places a mi-distance des composantes x1 et x 2 et oscillent suivant laxe des temps et/ou des frquences [Fla 93]. La rgle du point milieu rsume la contribution des interfrences : deux points du plan interfrent pour crer une contribution en un troisime, leur milieu gomtrique.

36

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

37

En consquence, lorsque le signal est complexe ,les interfrences compliquent lanalyse et la rduction de celles-ci est ralise de diffrentes manires [Bas 02] ,[Coh 95],[Fla 93]. Lune des solutions consiste appliquer un lissage dans le plan temps-frquence afin de les attnuer. Ainsi la distribution pseudo Wigner-Ville (PWVD) effectue un lissage en frquence tandis que la pseudo Wigner-Ville lisse (SPWVD) applique un lissage bidimensionnel sparable en temps et en frquence. Une autre solution, plus gomtrique , permettant damliorer la lisibilit des distributions de la classe de Cohen (et de la classe affine) est base sur la mthode de la rallocation [Cha 98]. Le principe est de rarranger le plan temps-frquence pour y amliorer la localisation des composantes dun signal. De manire gnrale, ces reprsentations, quoique diffrentes reposent sur un concept identique a savoir la re-criture du noyau de lissage selon des critres prdfinis a lavance. Ces critres sont souvent choisis selon les caractristiques connues des signaux a analyser ou de la problmatique envisage (dtection [Lem 95],[ Ric 98], classification [Dav 00] . . . ). Des approches ont t proposes pour choisir automatiquement, parmi un ensemble de RTF, celle qui dcrit de manire optimale le signal selon un critre donne [Coh 95],[IOA 03] [Mal 00]. Pour illustrer certaines RTF, nous dfinissons un signal synthtique x(n) comme
tant la combinaison linaire de quatre atomes gaussiens lmentaires . Un atome gaussien lmentaire x i , i sexprime comme le produit dune fonction sinusodale module par une gaussienne :
n i x i , i (n ) = cos(2 i (n i )) exp 2 N
2

......(2.5)

avec N le nombre de points.

2.2.1 Reprsentation temps-frquence noyau paramtrique


La recherche en temps-frquence a essentiellement porte sur la conception de fonction de lissage ou des noyaux paramtrs qui permettent notamment la rduction maximale des interfrences quadratiques [Coh 95], qui rendent difficile linterprtation de limage.

37

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

38

Bien qu'une partie de ces RTF puisse offrir des avantages pour la classification de certains types de signaux [Wan 95],[ Ben 98], la conception du systme de dtection ou de classification a rarement eu pour but la conception de noyau. Ces quelques mthodes qui proposent doptimiser le noyau pour la classification contraignent la forme du noyau aux fonctions paramtriques prdfinies avec les symtries qui peuvent ne pas tre appropries la dtection ou la classification [Hei 95], [Dav 98].

2.2.2 Reprsentation temps-frquence noyau non paramtrique


Pour raisonner en termes de diagnostic et de classification, il n'est pas ncessairement souhaitable de reprsenter avec prcision la distribution d'nergie d'un signal en tempsfrquence. En fait, une telle reprsentation peut tre lencontre de lobjectif de la classification. Il peut tre avantageux de concevoir une RTF qui accentue spcifiquement les diffrences entre les classes (le terme classe est utilis pour dfinir un groupe, arbitraire ou autre, des donnes "semblables"). Cette approche a t employe dans les domaines du radar, du sonar, de l'astronomie par radio, des communications et des systmes optiques .

2.3 Choix de la mthode de diagnostic


Parmi les mthodes systme exposes ci-dessus, notre choix sest port pour lanalyse temps frquence noyau non paramtrique en tant quoutil de surveillance et de diagnostic. Celui-ci est justifi pour les raisons suivantes : - la mthode est pratique mettre en uvre, - elle est conome en temps de calcul,

2.3.1 Reprsentation temps-frquence et classification


Dans la classification traditionnelle, les donnes taient souvent transformes en une Reprsentation Temps-frquence (RTF) standard (par exemple, le spectrogramme ou le Wigner-Ville TFR); puis, une projection tait applique la RTF pour aboutir un espace de dimension rduite [Hay 97].

38

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

39

Le choix dune RTF et d'un algorithme de projection doivent tre conjointement optimiss (figure 2.1 (a)). Pour diminuer le temps de calcul, il est plus pertinent dutiliser une RTF optimise par un noyau appropri et qui puisse tre directement classifie (figure 2.1 (b)) sans rduction de la dimension de la RTF.

RTF classique RTF optimise pour la classification Rduction de dimensions de la RTF Critre de Dcision

Critre de Dcision Estimation de la classe

Estimation de la classe

(b)

(a)

Figure 2.1 Procdure de classification par la RTF

Un signal peut tre reprsent par un nombre infini de RTF (figure 2.2(a)). Cependant, une RTF optimale pour une tache de classification savre ncessaire pour l'extraction des motifs. Il a t montr que, par exemple, le spectrogramme (une des RTF trs utilise), n'est pas optimal en terme de classification de signaux [Dav 00]. En effet, lobjectif d'un spectrogramme est de dcrire la densit d'nergie d'un signal simultanment dans des domaines de temps et de frquence alors que le but d'une classification RTF est de maximiser la sparabilit des signaux de diffrentes classes [Wan 04]. Par consquent, il est souhaitable de concevoir une RTF qui permet une classification optimale cest--dire une RTFi (figure 2.2(b)) qui maximise les distances entre classes.

39

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

40

Signal 1

Signal 2

Signal 3

RTF1

(RTFi )1
Signal, x RTF2 (b)

(RTFi )2
Classifieur

(RTFi )3

(a)

RTFn

Classe 1

Classe 2

Classe 3

Figure 2.2 RTF oriente vers la classification

2.3.2 RTF dite "Dpendante de la Classe du Signal (DCS) "


La RTF dite "dpendante de la classe du signal " nexige priori aucune forme paramtrique et prdfinie du noyau. La mthode propose ncessite deux tapes principales : l'extraction de motif et la classification. L'extraction de motif saisit l'information pertinente des signaux classifier et fournit les motifs comme des entres pour le systme de classification. Nous proposons une mthode pour concevoir des noyaux optimiss, et par consquent des RTF optimises pour la discrimination entre les ensembles prdfinis de classes. Les noyaux rsultants ne sont restreints aucune fonction prdfinie mais, plutt, sont arbitraires dans leur forme. Au lieu de faire des hypothses priori au sujet du type de lissage temps frquence, notre approche tablit le lissage appropri pour raliser la meilleure performance de la classification.

2.3.3 La dcision
Automatiser implique comprendre, dtecter, reconnatre ou classer, ce sont autant de formes courantes dune problmatique unique : la classification de signaux.

40

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

41

En effet, la comprhension fait appel implicitement un apprentissage et une comparaison [Dud 73], la dtection dun vnement consiste affecter le signal la classe vnement prsent ou la classe absent[Van 68], etc. dans ce type de procdure, ce qui est attendu est une dcision, une affectation une classe. Une dcision ncessite un classifieur. Celui-ci fait appel des indices de divergences. Il existe plusieurs classifieurs. Nous traiterons particulirement : la mthode de rseau de neurone et la mthode de k- plus proche voisin (chapitre 3) .

2.4 Vers une mthode temps-frquence de classification 2.4.1 La classe de Cohen


la formulation historique de la classe de Cohen [Coh 66] consiste dfinir un ensemble de distributions conjointes temps-frquence, l'image de distributions de probabilit conjointes de deux variables alatoires. La construction de Cohen repose sur cette ide: le spectre d'nergie X ( f ) et l'nergie
2

instantane x(t ) d'un signal sont interprts comme des distributions de probabilit, qui
peuvent tre vues comme les densits marginales d'une distribution conjointe tempsfrquence, dpendante du signal. Dans le cas de la frquence, la valeur moyenne d'une application g ( f ) est le moment du premier ordre du carr de la transforme de Fourier d'un signal x :
g ( f )x, x =
+

g( f ) X ( f )

dtdf = g (F ) x .(2.6)

Dans le cas d'une distribution conjointe des variables t et f pour un signal x (note C x (t , f ) , la valeur moyenne d'une application g du temps et de la frquence s'crit : g (t , f )x, x =
+ +

g (t , f )C (t , f )dtdf ........................(2.7)
x

La distribution C x (t , f ) est ici inconnue, et l'on cherche la construire. On peut prsent se poser la question des rgles de correspondance. Comment associer g (t , f ) un ventuel oprateur dans le domaine dual ?

41

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

42

L'ide originale de Wigner reprise et tendue par Cohen [Coh 66] est de proposer d'associer g (t , f ) l'oprateur G (t , f ) (dont la forme est pour l'instant inconnue) dans les domaines temporel et frquentiel de la faon suivante :
g (t , f )x, x = G (T , F )x, x = G (T , F )X , X .....(2.8)

2.4.1.1 La classe de cohen par la RTF


La localisation temps-frquence se trouve confronte au problme de la transformation mathmatique qui permet de passer du signal analys sa reprsentation temps-frquence. Cest une limitation fondamentale, connue sous le nom de principe dincertitude, qui exclut toute localisation temporelle prcise dune frquence. Il a pour consquence quon ne pourra jamais considrer une transformation comme la seule transformation temps-frquence correcte parce que la localisation temps-frquence ne peut pas tre vrifie de manire exacte. Cette ambigut qui a donn lieu la dfinition dune grande diversit de transformations temps-frquence se caractrise aujourdhui par une multitude de transformations (ou reprsentation) diffrentes. Elles sont regroupes dans diffrentes classes, en loccurrence la classe affine, la classe Cohen,la classe hyperbolique. Parmi ces classes, nous avons choisi la classe de Cohen qui admet une formulation en termes de noyau. La classe de Cohen est particulirement intressante car elle fournit un ensemble illimit de reprsentations connues et paramtrables par la simple donne d'une fonction bidimensionnelle (le noyau). L'expression gnrale de la classe est :
+ +

C x (t , f ) =

(s t , f )w (s, )dsd .....(2.9)


x

o est le noyau de la reprsentation temps-frquence, et ws (t , f ) est la distribution de Wigner-Ville. Dans le cas de deux signaux x et y , cette dernire s'crit :
+

ws (t , f ) =

x t + 2 y

j 2 f d ....(2.10) t + e 2

42

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

43

Toute reprsentation temps-frquence s'obtient par la double convolution temps-frquence de la distribution de Wigner-Ville. On remarque que le choix du noyau est arbitraire; de ce choix dcoulent les proprits de la reprsentation temps-frquence de Wigner-Ville ws (t , f ) . Le respect des proprits particulires de la distribution de ws (t , f ) , est conditionn par des contraintes imposes au noyau. Pour que ce soit effectivement des distributions d'nergie il faut vrifier la condition [Leb 06]:
+ +

(t; f )dtdf

= 1 .(2.11)

2.4.1.2 La classe de Cohen par la fonction d'ambigut


La dfinition de la classe de Cohen par la fonction d'ambigut est trs intressante car elle permet en pratique l'optimisation du noyau, rendant la longueur des calculs acceptable. En effet, dans le plan des ambiguts, on peut crire : C x (t , f ) =

++

( , )A ( , )e
x

i 2 ( t f )

dd ....(2.12)

O est la transformation de Fourier de et Ax ( , ) la fonction d'ambigut du signal, dfinie par :


+ Ax ( , ) = x t + x * t e j 2t dt 2 2 .....(2.13)

+ +

wx (t ; f )e j 2 (t + f ) dd

Ainsi, le produit de convolution temps-frquence de l'quation (2.9) est diagonalis : il s'exprime comme le produit simple de Ax et obtenus par transformations de Fourier directes et inverses de wx et de . En pratique, il est minemment plus rapide de passer dans le plan des ambiguts, multiplier Ax par et revenir dans le plan temps-frquence par transformations de Fourier.

43

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

44

La figure 2.3 donne les notations et les rgles de passage entre les domaines tempsfrquence et doppler-retard [Leb 06]. Les domaines temps-frquence et doppler-retard sont duaux, mais on utilise souvent en dernier lieu le domaine temps-frquence. L'une des raisons majeures est que la fonction d'ambigut est gnralement valeurs complexes, le module et la phase portant des informations de nature diffrentes, alors que l'on peut s'arranger pour obtenir des reprsentations temps-frquence valeurs relles. domaine

( , )

(t , )
Transformation

(t, f )

Ax ( , )

x t + x * t 2 2 noyaux

wx (t , f )

( , )

(t + )

(t, f )

Figure 2.3 Rgle des passage et notations pour les domaines temps-frquence et dopplerretard (les flches indiquent les transformes de Fourier directes) [Dav 00].

En pratique, il est minemment plus rapide de passer dans le plan des ambiguts, et revenir dans le plan temps-frquence par transformations de Fourier. L'atout principal du plan doppler-retard est son invariance en module aux translations temporelles et frquentielles des signaux, tout en contenant la mme information que le plan temps-frquence cest--dire en tenant compte cette fois du module et de la phase [Leb 06]. Dans le plan d'ambigut le temps de calcul est peu coteux car la dimension de l'espace de reprsentation est rduite N po int / 4 ; en effet, la fonction d'ambigut d'un signal est symtrique par rapport au point

( = 0;

= 0 ) , elle est donc redondante.

44

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

45

2.4.2 Existence et signification des interfrences


La reprsentation dun signal gal une somme de deux signaux nest pas gale la somme des reprsentations de chacun des deux signaux : Si y (t ) = x1 (t ) + x 2 (t ) RTFy (t , f ) = RTFx1 (t , f ) + RTFx2 (t , f ) + RTFx1 x2 (t , f ) + RTFx2 x1 (t , f ) ........(2.14) RTFx2 x1 (t , f ) =
+ +

(t , ) x1 + x 2 e j 2 f d d ..(2.15)
2 2

Les termes supplmentaires RTFx1 x2 (t , f ) et RTFx2 x1 (t , f ) de l'quation (2.14) sont appels termes croiss dinterfrence, alors que les termes dus aux composantes prises indpendamment sont appels les termes propres ou motif. la reprsentation temps-frquence conserve lnergie du signal, ces termes croiss dinterfrence distribuent le produit scalaire des deux composantes ainsi :


Donc

+ +

RTFy (t , f ) dt df =

x (t ) + x (t )
1 2

dt .....(2.16)

[RTF (t , f ) RTF (t , f ) RTF (t , f )]dt df


+ + y x1 x2

* = 2 Re x1 (t ) x 2 (t ) dt ....(2.17)

Leur prsence est donc une condition sine qua non pour que la proprit de conservation de lnergie soit vrifie [Hla 97]. Mais la localisation et limportance de ces termes supplmentaires constitue souvent un gne qui ne facilite pas lutilisation et linterprtation de ces reprsentations, et peut mme linterdire lorsque le signal comporte un grand nombre de composantes.

2.4.3 Conception des noyaux pour la classification


Supposant qu'il y ait N exemples dapprentissage dans un ensemble dapprentissage pour une classe particulire. Notons que yi(c ) dcrit le ime exemple dapprentissage de la cth classe.

45

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

46

Le but est de concevoir un classifieur pour dterminer l'appartenance de classe d'un vecteur x . Ceci est fait en utilisant les exemples dapprentissage, sachant que le vecteur x ne figure pas dans l'ensemble de dapprentissage. Thoriquement, le classifieur est ralis par l'intermdiaire d'une fonction de dcision

( x ) { ...c...C} [Dud 73]. Celle-ci est habituellement ralise, dans la pratique, par 1
lextraction des motifs partir d'une RTF standard (par exemple, le spectrogramme) et par la classification directe de ces motifs. Cela suppose des hypothses implicites concernant le type de lissage temps-frquence requis pour la classification. Comme nous l'avions indiqu, ceci peut dgrader les performances de la classification si la RTF standard n'est pas rgulire. Nous proposons de concevoir un classifieur directement dans le plan d'auto ambigut. Puisque toutes les RTF peuvent tre drives du plan d'auto-ambigut, aucune hypothse priori n'est faite concernant le lissage exig pour la classification. Le noyau DCS [ , ] est conu pour chaque tache spcifique de classification. Ce procd de conception utilise Ay (c ) (la reprsentation de matrice de la fonction d'auto-ambigut
i

calcule partir des exemples y i(c ) ) pour dterminer directement le lissage exig. x est class via ( DCS o Ax ) { ...c....C} , o o est le produit lment par lment. 1

2.4.4 Le critre de dcision


Pour valider les mthodes de dcision mises en place, nous avons utilis deus mthode de classification lune et la mthode de rseau de neurone et lautre et la mthode de k- plus proche voisin (chapitre 3) : La dcision par rseau de neurone est galement justifie par dautres proprits intressantes, entre autres, une convergence d'apprentissage rapide et stable et les dveloppements mathmatiques qui lui ont t consacrs. La dcision par les k-plus proche voisin consiste associer une mesure la classe majoritairement reprsente parmi les mesures voisines les plus proches (au sens dune distance qui peut tre euclidienne ou de Mahalanobis). Lassociation cette rgle, dune fonction dappartenance dfinie pour chaque classe, permet de dterminer un indice de fiabilit (confiance) laffectation ralise.

46

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

47

2.5 RTF optimise pour la classification


La mthode choisie est la RTF dite "dpendante de la classe du signal (DCS)". Celle-ci nexige priori aucune forme paramtrique et prdfinie du noyau. La mthode propose ncessite deux tapes principales : l'extraction de motif et la classification. L'extraction de motif saisit l'information pertinente des signaux classifier et fournit les motifs comme des entres pour le systme de classification. Plusieurs classifieurs sont adapts au procd de la classification; nous opterons ici pour la distance Mahalanobis, entre le vecteur forme du signal classer et ceux des classes des dfauts, en tant que critre de dcision. Nous proposons une mthode pour concevoir des noyaux optimiss, et par consquent des RTF optimises pour la discrimination entre les ensembles prdfinis de classes. Les noyaux rsultants ne sont restreints aucune fonction prdfinie mais, plutt, sont arbitraires dans la forme. Au lieu de faire des hypothses priori au sujet du type de lissage temps-frquence, notre approche tablit le lissage appropri pour raliser la meilleure performance de la classification. La conception de la RTF rsulte d'une transforme de Fourier inverse discrte en n (temps discret) applique la fonction dauto-corrlation instantane : R [n, ] = x* [n] x[(n + )N ] ..(2.18) Ainsi, la fonction d'auto ambigut est dfinie par : A[ , ] = Fn1 {R [n, ]} = R [n, ]e
n =0 N 1 j 2 n N

... (2.19)

et sont respectivement les Doppler et retard discrets. La RTF correspondante qui est une version discrte de la RTF du Rihaczek est donne par :
1 R[n, k ] = F n {F k {A[ , ]}} =

1 N 1 N 1 A[ , ]e j (2 N =0 =0

N )k

e j ( 2

N )n

(2.20)

47

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

48

O k est la frquence discrte et N le nombre dchantillons de lenregistrement. La fonction caractristique [Coh 95] de la RTF discrte du Rihaczek est A[ , ] . Il existe un noyau [ , ] qui opre par la multiplication bidimensionnelle sur la fonction d'auto-ambigut [Cla 80]. La RTF correspondante est donne par :
1 G[n, k ] = Fn {F k { [ , ] A[ , ]}} =

1 N 1 N 1 [ , ]A[ , ]e j (2 N =0 =0

N )k

.e j (2

N )n

(2.21)

La fonction caractristique de G[n, k ] est [ , ]A[ , ]. Tout lment non nul du noyau

[ , ] en termes de et/ou peut effectuer un lissage sur la RTF originale (quation 2.17)
de Rihaczek, R[n , k ] , en temps et/ou en frquence respectivement. G[n , k ] est une version lisse de R[n , k ] . L'avantage du noyau est que toutes les RTF peuvent tre obtenues partir de R[n , k ] par l'application dun noyau appropri. Ainsi G[n , k ] peut tre considr comme RTF gnralise [Coh 95]. Le plan dambigut a des proprits trs appropries pour la classification. Une seule position ( i , i ) dans ce plan offre des informations "globales" sur la structure tempsfrquence du signal. Si [ , ] = 0 pour toutes les valeurs exceptes celles sur l'axe = 0 , alors toute l'information temporelle est lisse, et seulement l'information de la frquence stationnaire est maintenue dans G[n ,k ] (RTF rsultante lisse). Si [ , ] = 0 pour toutes les valeurs exceptes celles sur l'axe = 0 , alors toute l'information spectrale est lisse et seulement l'information temporelle est retenue. Les points qui ne sont pas sur l'un ou l'autre axe correspondent une structure temps-frquence non stationnaire. Quand le noyau [ , ] est conu dans le but de la classification, nous nous rfrons lui en tant que noyau dpendant de la classe du signal (DCS). Ce noyau est dcrit par DCS [, ] .

48

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

49

En outre, nous nous rfrons la RTF correspondante, RTFDCS [ , ] comme la RTF dpendante de la classe du signal; elle est dcrite par :
1 RTFDCS [n, k ] = Fn {Fk { DCS [, ]A[, ]}} ....(2.22)

Il est possible de visualiser la RTF dpendante de la classe du signal et d'observer la structure de temps-frquence exploit par un classifieur.

La RTF de Rihaczek sert de reprsentation de base puisque la fonction d'ambigut et la fonction caractristique de la RTF Rihaczek sont les mmes. Gnralement, d'autres RTF peuvent tre utiliss comme des reprsentations de base.

Pour dcrire cette gnralisation, dfinissons un noyau multiplicatif de transformation

T [ , ] qui transforme la RTF de Rihaczek en une autre RTF quadratique: T [ , ]A[ , ]


est la fonction caractristique de cette nouvelle RTF. Puisque le noyau de transformation est impos avant l'application du noyau dpendant de la classe du signal, le "nouveau" noyau dpendant de la classe du signal DCS ' [ , ] , li la nouvelle reprsentation de base, est donn par :

DCS [ , ] =
'

DCS [ , ] T [ , ]

(2.23)

Ce noyau produit une RTF dpendante de la classe du signal par :


1 RTFDCS [n, k ] = F n {F k { DCS ' [ , ](T [ , ]A[ , ])} (2.24) }

Daprs (2.23), lunique critre pour toute RTF de base est que

T [ , ] 0 .(2.25)
pour tout et , prservant toute l'information dans la fonction originale d'autoambigut.

49

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

50

2.6 Application de la RTF optimise pour la classification des dfauts de la . machine asynchrone
Le noyau DCS souffre de manque de prcision car il ne prend pas en considration la variance intra classe, ce qui peut engendrer une classification incorrecte. Le noyau discriminant linaire offre une forte discrimination de classe et sapproche ainsi du critre optimal de Bayes; mais il ncessite des grands ensembles dapprentissages, ce qui est rare dans les applications industrielles. La conception dun noyau par le rapport discriminant de Fisher (RDF) offre lavantage de traiter des exemples dapprentissage de nombre limit et de prendre en considration la fois la sparation entre classes et la variance intra classe [Leb 08], [Leb 09]. .

Notre dmarche consiste constituer un ensemble dapprentissage partir des signaux de courant statorique. Ceux-ci reprsentent les diffrents tats de fonctionnement de la machine saine et en dfaut. Cet ensemble dapprentissage servira comme base de donnes qui permettra laffectation dun nouveau signal non class, par le biais dun classifieur.

2.6.1 Application du RDF dans le plan Doppler-retard


Le contraste de Fisher pour les s points qui maximise JF (s) est : J F (s ) =

(m1 m2 )2
V12 + V22

.(2.26)

m reprsente la moyenne des classes 1 et 2, V2 reprsente la variance des classes 1 et 2 Soit un ensemble de signaux qui reprsentent les courants statoriques dans le cas sain, dsquilibre rotorique et dsquilibre statorique. Un nombre total de N 1 noyaux doit tre conu pour N classes. Dans notre cas nous avons quatre classes: classe moteur sain, classe dfaut rotor, classe dfaut stator et classe dfaut de roulement. Ces classes sont conues pour un rgime de fonctionnement du moteur vide et en charge. La discrimination entre classes par le critre de Fisher est lucide par la figure 2.4.

50

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

51

Lobjectif est de concevoir des noyaux qui permettent de maximiser lcart entre classes et de minimiser la variance intra classe. Supposant qu'il y ait n classes et un total de N i exemples dapprentissage pour la classe i . La notation Aij [ , ] reprsente le plan dambigut du jth exemple dapprentissage dans la ith classe.

(Signal)i

(Fonction dauto corrlation A)i


Contraste de Fisher

Noyau i

(Signal)i+1

(Fonction dauto corrlation A)i+1


1

(Signal)n

(Fonction dauto corrlation A)n


1

Figure 2.4 Conception des noyaux

2.6.2 Discrimination optimale des classes par le critre de Fisher


Un nombre total de N-1 noyaux doit tre conu pour un systme de classification des dfauts de N classe. Un Noyau K S peut tre soit sparateur de simple classe ou un sparateur de groupe de classe. Dans le cas de sparateur de simple classe, le noyau K i est conu pour discriminer la classe i des classes {i + 1,L, N }. Dans le cas de sparateur de groupe de classe, le noyau K i est conu pour discriminer un groupe de classe {i, i + 1,L, i + m} de toutes les classes restantes {i + m + 1, i + m + 2, L , N }. [Leb 08], [Leb 09]. Pour le sparateur de simple classe. Trois variantes sont proposes pour une discrimination optimale des classes. Dans notre tude quatre classes ont t envisages savoir :

51

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

52

classe dfaut rotor, classe dfaut stator, classe dfaut roulement et classe moteur sain.

La discrimination entre diffrentes classes est faite par la sparation de la classe i de toutes les classes restantes {i + 1,L, N } (figure 2.5). Dans ce cas de figure le noyau dfaut stator est conu pour discriminer la classes dfaut stator du reste des classes

{dfaut rotor ,dfaut roulement et moteur sain} .


Le noyau dfaut rotor est conu pour discriminer la classe dfaut rotor du reste des classes {dfaut roulement et moteur sain} . Le noyau dfaut roulement est conu pour discriminer la classe dfaut roulement de la classe moteur sain. Lavantage de la mthode rside dans la sparation optimale entre les diffrentes classes.

Classe dfaut stator

J 1 [ , ]
Classe dfaut rotor

J 2 [ , ]
Classe dfaut roulement

J 3 [ , ]
Classe moteur sain

Figure 2.5 Conception des noyaux du premier niveau par la sparation des classes

52

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

53

2.6.2.1 Expression du Contraste de Fisher


Le contraste de Fisher sexprime alors par :
J i ( , ) =

(m [ , ] m
i

[ , ]) 2 2 Vi 2 [ , ] + Vi res tan t [ , ]
i res tan t

..(2.27)

o mi [ , ] et mi res tan t [ , ] reprsentent deux moyenne dan le plan Doppler- retard ( , ) mi [ , ] = 1 Ni

A [ , ]
j =1 ij 4 Nk

Ni

..... (2.28)

mi res tan t [ , ] =

k =i +1 j =1 4

A [ , ]
kj k =i +1

. (2.29)
k

2 Vi 2 [ , ] et Vi res tan t [ , ] reprsentent deux variances dans le plan Doppler- retard ( , )

Vi 2 [ , ] =

1 Ni

(A [ , ] m [ , ])
j =1 ij i 4 Nk

Ni

... (2.30)

2 Vi res tan t [ , ] =

k =i +1 j =1

(A [ , ] m
kj k = i +1

i res tan t

[ , ])2
... (2.31)

La troisime variante est optimale par rapport aux deux autres variantes, car elle permet une discrimination non redondante entre les diffrentes classes.

53

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

54

2.6.2.2 Conception des noyaux discriminants de Fisher


La conception des Noyaux Discriminants de Fisher (NDF) seffectue en plusieurs tapes (figure 2.6) :

Signaux de la machine

Sous chantillonnage des signaux ncessaire

Fonction dautocorrection instantane

Plan ambigut doppler- Retard

Conception du noyau discriminant de Fisher

Extraction des motifs

Critre de dcision (la distance)

Figure 2.6 Dmarche de la classification a. Signaux pour apprentissage

Lensemble des signaux dapprentissage a t acquis avec une frquence dchantillonnage de 400 Hz et une dure dobservation de 10s. De ce fait, le nombre dchantillons par signal slve N=4000. Le moteur est aliment par deux types dalimentation: une alimentation rseau ou une alimentation convertisseur. La dimension de la matrice dautocorrection 10 instantane comportera la dimension de N 2 = 16. 6 .

54

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

55

La frquence dchantillonnage est compatible avec les frquences caractristiques des dfauts. En effet, la frquence des ruptures de barres se situe dans la plage frquentielle 35 50 Hz, et la frquence de dfaut statorique correspond, en module, la frquence fondamentale 50Hz.
b. Sous chantillonnage des signaux

Le sous chantillonnage consiste rduire la frquence dchantillonnage initiale si la frquence dacquisition est trop leve (certaines de nos mesures ont t effectues 10 kHz); celle-ci contient des frquences qui ne sont pas utiles notre tude, seule la plage des frquences recherche est prserve. La frquence des ruptures de barres se situe dans la plage frquentielle 35 50 Hz, et la frquence de dfaut statorique correspond, en module, la frquence fondamentale 50Hz. Afin de conserver toutes ces frquences caractristiques, le signal original est sous chantillonn 25 fois la frquence dchantillonnage initiale. Par consquent, la dimension de signal va tre considrablement rduite, ainsi que le temps de calcul. Par ce procd, nous rduisons de 500 fois le signal initial; de mme, chaque signal de lensemble dapprentissage comportera 200 points avec la conservation des signatures frquentielles des signaux originaux.
c. Fonction instantane d'auto corrlation et le plan dambigut

Nous calculons la fonction instantane d'auto corrlation R[n, t ] de signal i (2.32) par lexpression (2.19); le signal de courant est donn par le vecteur : i = [i1 i2 i3 Lin1 in ] (2.32) Le plan dauto-ambigut du signal est obtenu par la transforme de Fourier inverse de la fonction d'auto corrlation instantane (2.11). La dimension du plan dauto ambigut est 200x200. Nous choisissons des points directement de N partir de ce plan en tant que vecteur de motif. Les points sur laxe = 0 rsultent une structure temps-frquence stationnaire dans le temps. De mme, les points sur l'axe = 0 correspondent une structure de temps- frquence stationnaire en frquence [Gil 99].

55

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

56

d. Conception du noyau discriminant de Fisher

Les plans dauto-ambiguts sont distincts pour chaque signal de courant (sain et avec dfaut). Nous voulons dterminer les coordonnes des N points du plan d'ambigut N X N, telles que les valeurs en ces endroits soient trs semblables pour des signaux de la mme classe, alors qu'elles changent de manire significative pour des signaux de diffrentes classes. La conception du noyau est base sur la fonction discriminante de Fisher pour obtenir les coordonns de N points du plan d'ambigut. Ici le noyau est conu par les signaux dapprentissage de chaque classe. La fonction de Fisher est maximise quand la sparation entre les moyennes des classes est grande et la variance interclasse est faible. La fonction de Fisher est conue pour un ensemble dapprentissage dans un plan de dimension N x N. Nous transformons la fonction de Fisher en matrice binaire (le noyau) en remplaant les points les plus levs par 1 et les autres points par 0. Lopration de transformation est automatique, elle est faite par le choix de N premiers points de plus fort contraste de la matrice de Fisher, ces positions de points seront maintenu par 1 le reste seront annuls par zro.
e. Extraction des motifs

Des motifs peuvent tre extraits directement partir de A[ , ] i [ , ] . Le noyau i [ , ] a les mmes dimensions que le plan d'ambigut. Dans cette application, le noyau i [ , ] est dfini comme une matrice binaire o chaque lment est soit 1 ou 0 :
A[ , ], si i [ , ] = 1 A[ , ] i [ , ] = si i [ , ] = 0 0,

. (2.33)

Les points de motif sont les points du plan d'ambigut de position ( , ) quand

i [ , ] = 1 . Par consquent, le processus d'extraction de motifs doit choisir les points A[ , ]


qui sont optimaux pour la tache de la classification dans le plan d'ambigut [Wan 04].

56

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

57

En multipliant la forme binaire de la fonction de Fisher avec le plan de l'ambigut dun certain signal, nous trouverons N points de motif pour ce signal qui sont prsents par un ordre dcroisant dans un vecteur motif (figure 2.7). On peut interprter la slection de points dans le plan Doppler-retard comme le masquage de la fonction d'ambigut d'un signal par une fonction binaire adapte, laquelle peut tre vue comme un noyau optimal. Cette mthode est peu coteuse en termes de temps de calcul, puisqu'elle rduit l'espace de reprsentation N po int 2 dimensions, soit ici 3 points par noyau.

ap 11 ap 21 ap31 A = P M apn1,1 apn1

ap L L ap,n1 apn 12 1 1 ap 11 ap22 L L ap2,n1 ap2n ap32 L L ap n1 ap3n ap32 3, P A = M OO M M apn1,2 L L apn1,n1 apn1,n apn2 apn2 L L apnn1 apnn ,

ap2,n1

apn1,n1

ap2n

ap2,n1 ap 2n ap11 ap32 apn2 apn1,n1

Figure 2.7 Illustration d'extraction du vecteur motif

2.6.2.3 rsultats de calcul


Lensemble dacquisition des donnes sur la machine est constitu de 15 exemples de courant du stator, enregistrs diffrents niveau de charge (0%,25%,50%,75%,100%) ceci pour chaque tat de fonctionnement de la machine ; saine, dfaut stator, dfaut de rupture de barre et dfaut de roulement. La base dapprentissage est ralise par 10 exemples de courant, les cinq derniers exemples de courant servent pour le test.

57

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

58

2.6.3 Rsultats exprimentaux


Un banc moteur a t mont pour effectuer diffrents essais (figure 2.8), il est constitu du moteur asynchrone de 5.5 KW, 230V, 50 Hz, p=4, 1470 t/Mn.

Figure 2.8 Banc dessai de la machine induction

Lacquisition des signaux des courants statoriques a t ralise par une frquence dchantillonnage de 10Khz et un temps dacquisition de 10 s. ceci afin dobtenir une trs bonne rsolution spectrale 0.1Hz.

Figure 2.9 dfaut roulement

58

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

59

Figure 2.10 rupture de barre

Le processus de conception des noyaux du premier niveau est montr dans la figure 2.6. Trois noyaux sont ncessaire pour le premier niveau de classification, un noyau pour le dfaut stator, un noyau pour le dfaut rotor et un noyau pour le dfaut de roulement. La base dapprentissage du dfaut stator a t constitue par 10 exemples de courant vide et 10 autres exemples en charge. Nous avons donc 20 exemples dapprentissage pour chaque dfaut. La conception des noyaux a t ralise selon la troisime variante (2.6.2.1 ). Le noyau dfaut stator est donc conu afin dobtenir une sparation maximale entre la classe dfaut stator et le reste des classes, savoir, dfaut rotor, dfaut roulement et la classe saine. Le noyau dfaut rotor est conu afin dobtenir une sparation maximale entre la classe dfaut rotor le reste des classes, savoir, dfaut roulement et la classe saine. Enfin le noyau dfaut roulement est conu afin dobtenir une sparation maximale entre la classe dfaut roulement et la classe saine. La dimension du plan Doppler-retard contient initialement 200 x 200= 40000 points; vu la symtrie par rapport lorigine, nous prenons le quart des valeurs de la matrice ce qui correspond N=10000. Les positions des points de Fisher de fort contraste sont prsentes dans le plan Doppler retard figure 2.11.

59

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

60

Nous avons obtenu, aprs slection, trois positions de points pour chaque noyau {( , )1 ,L, ( , )9 } . Les positions et les contrastes de ces points caractristiques sont montrs dans le tableau 2.1. Ces derniers servent lapprentissage des positions caractristiques du dfaut. La slection des positions est ralise sur la base de deux critres : sur la valeur du contraste et sur la base de rapprochement des positions dans le plan Doppler-retard. La slection des positions caractristiques est base sur le principe de Fisher, cest dire maximation de la sparation interclasse et la minimisation de la variance lintra classe.

150

Doppler (Hz)

100

Dfaut de Roulement

50

Dfaut rotor Dfaut stator

0 0

50

100

150

Retard

Figure 2.11 Plan dambigut liss par trois noyaux

Points Dfauts du forme Dfaut roulement 3 4 5 4 Dfaut stator 5 6 2 Dfaut rotor 3 4 vecteur

Positions Doppler-retard

Contraste

(101,104) (101,105) (101,119) (45,10) (54,13) (56,11) (60,41) (68,49) (70,57)

22.18 21.81 17.64 9.75 10.2 9.2 12.91 15.63 14.65

Tableau 2.1. Les positions et les contrastes des points caractristiques

60

Extraction des paramtres de diagnostic par la reprsentation Temps-frquence optimise

61

s2.7. Conclusion

Dans ce chapitre nous avons propos une mthode de reprsentation temps-frquence dite "dpendante de la classe du signal" pour lextraction des paramtres de diagnostic. Nous avons montr que les RTF classiques ont des noyaux paramtriques et priori prdfinis donc inappropris la classification, do lorientation vers le plan dambigut doppler-retard o toutes les RTF peuvent tre drives par un choix appropri dun noyau. Dans cette application, le choix du noyau est crucial car il permet davoir une RTF optimise et par consquent une classification prcise des signaux. Nous avons opt pour le noyau

discriminant de Fisher. Les positions et les contrastes des points caractristiques des paramtres de diagnostic des trois dfauts : statorique, rotorique et de roulement sont rsums dans le tableau 2.1.

61

Chapitre III
Mthodes de la prise de dcision

Mthodes de la prise de dcision

3.1 Introduction
Le diagnostic automatique ncessite au moins deux tapes principales, la premire consiste lextraction de linformation pertinente du signal traiter, chose qui a t faite dans le deuxime chapitre via la reprsentation temps-frquence. La seconde tape consiste la prise de dcision, les dtailles de cette tape ferons lobjet du troisime et dernier chapitre. Nous avons prsent dans ce chapitre des mthodes de prise de dcision, savoir les rseaux de neurones et la mthode statistique les k-plus proches voisins.

3.2 Dtermination dune mthode de dcision


Soit
X a = ( X 1 , X 2 ,..., X N ) lensemble dapprentissage initial et

(1 , 2 ,..., 3 )

lensemble des M classes connues. Le problme pos est alors daffecter une nouvelle observation X u lune des M classes laide dune rgle de dcision. Toutefois, l'affectation ne doit pas tre systmatique car des erreurs peuvent tre commises. L'algorithme de dcision doit donc bnficier de solutions alternatives afin de diminuer le risque de mauvaise classification. Ces solutions sont fournies par les options de rejets d'ambigut et de distance. Il s'agit en ralit de diffrer la dcision car les observations dont l'appartenance aux classes est ambigu ou insuffisante, pourraient tre prcurseur de l'apparition de nouvelles classes.

3.3 Mthodes de prise de dcision 3.3.1 Rseau de neurone


Un rseau de neurones est un outil danalyse statistique permettant de construire un modle de comportement partir de donnes qui sont des exemples de ce comportement. Un rseau de neurones est constitu dun graphe pondr orient dont les noeuds symbolisent les neurones. Ces neurones possdent une fonction dactivation qui permet dinfluencer les autres neurones du rseau. Les connexions entre les neurones, que lon nomme liens synaptiques,

Mthodes de la prise de dcision propagent lactivit des neurones avec une pondration caractristique de la connexion. On appelle poids synaptique la pondration des liens synaptiques. Notre but ici est lutilisation des rseaux de neurones en tend quoutil de prise de dcision pour la classification de trois type de dfaut de la machine asynchrone savoir le dfaut roulement, dfaut statorique et dfaut rotorique.

3.3.1.1 Mise en uvre dun modle de rseaux de neurones


Les neurones peuvent tre organiss de diffrentes manires, cest ce qui dfinit larchitecture et le modle du rseau. Larchitecture la plus courante est celle dite du perceptron multicouche. Avant de pouvoir utiliser les capacits de classification dun rseau de neurones, il faut le construire. Ceci se droule en quatre temps: 1. La construction de la structure du rseau (gnralement empirique). 2. La constitution dune base de donnes de vecteurs reprsentant au mieux le domaine modliser. Celle-ci est scinde en deux parties : une partie servant lapprentissage du rseau (on parle de base dapprentissage) et une autre partie aux tests de cet apprentissage (on parle de base de test). 3. Le paramtrage du rseau par apprentissage. Au cours de lapprentissage, les vecteurs de donnes de la base dapprentissage sont prsents squentiellement et plusieurs fois au rseau. Un algorithme dapprentissage ajuste le poids du rseau afin que les vecteurs soient correctement appris. Lapprentissage se termine lorsque lalgorithme atteint un tat stable. 4. La phase de reconnaissance qui consiste prsenter au rseau chacun des vecteurs de la base de test. La sortie correspondante est calcule en propageant les vecteurs travers le rseau. La rponse du rseau est lue directement sur les units de sortie et compare la rponse attendue. Une fois que le rseau prsente des performances acceptables, il peut tre utilis pour rpondre au besoin qui a t lorigine de sa construction.

Mthodes de la prise de dcision La dcision par rseaux de neurones implique deux tapes majeures : Lapprentissage du rseau de neurones, afin dapprendre les dfauts par laccouplement (association) des entres et des sorties dsires. Le test du rseau de neurones (valuation) afin destimer lexactitude du modle propos pour des vnements qui nont pas t prsents lors de la phase dapprentissage.

3.3.1.2 Apprentissage du rseau : Algorithme de rtropropagation de gradient


La rtropropagation est actuellement loutil le plus utilis dans le domaine de rseaux de neurones. C'est une technique de calcul des drives qui peut tre applique nimporte quelle structure de fonctions drivables. Mathmatiquement, cette mthode est base sur lalgorithme de descente du gradient et utilise les rgles de drivation des fonctions drivables. Dans cette mthode, lerreur commise en sortie du rseau sera rtro propage vers les couches caches do le nom de rtropropagation.

A. Mise en quation
Avant de dfinir la rgle dapprentissage, on doit dfinir la relation entre les sorties du rseau dune part, et les entres et les poids dautre part. Dans un rseau (l) couches ayant (n) entres et (m) sorties les tats des diffrents neurones sont donns par :

U il (k ) = f l Pi l (k ) .....(3.1)
Avec

Pi l (k ) = Wijl U lj1 (k ) ........(3.2)


j =1

N l 1

Ou

i = 1,2,..., N l j = 1,2,..., N l 1 q = 1,2,..., N l +1

et et

Mthodes de la prise de dcision


N nombre de neurones dans la couche l .

N 11 nombre de neurones dans la couche l-1 . N 1+1 nombre de neurones dans la couche l+1 .
L nombre de couches .

U il (k ) sortie du neurone i de la couche l .


Wijl (k ) cfficient synaptique (poids )de la j me entre du neurone (i) de la couche (l) .

U i0 (k ) = X i (k )
U i0 (k ) = Yi (k )

i = 1,2,..., n ......(3.3)
i = 1,2,..., m ........(3.4)

Ou : X i (k ) et y i (k ) sont respectivement les entres et les sorties du rseau . L'objectif de la mthode de la rtropropagation est d'adapter les paramtres Wij1 de faon a minimiser une fonction de cot donn par :
E (W ) = E P (W ) .....(3.5)
P =1 T

avec
E P (W ) =
2 1 m d yi (k ) yi (k ) .....(3.6) 2 i =1

o y id (k ) est le vecteur de sortie dsir , y i (k ) le vecteur de sortie de rseau et T le nombre d'exemples ou longueur de l'ensemble d'entranement.

B. Principe de la rtropropagation
Lapproche la plus utilise pour la minimisation de la fonction E est base sur la mthode du gradient. On commence lentranement par un choix alatoire des vecteurs initiaux du poids. On prsente le premier vecteur dentre, une fois on a la sortie du rseau, lerreur correspondante et le gradient de lerreur par rapport tous les poids sont calculs. Les poids sont

Mthodes de la prise de dcision alors ajusts. On refait la mme procdure pour tous les exemples dapprentissage. Ce processus est rpt jusqu ce que les sorties du rseau soient suffisamment proches des sorties dsires.

C. Acclration de la rtropropagation
Bien que l'algorithme de rtropropagation soit le plus utilis pour l'apprentissage supervis des MLP, son implantation se heurte plusieurs difficults techniques. Il n'existe pas de mthodes permettant de : - Trouver une architecture approprie (nombres de couches, nombre de neurones). - Choisir une taille et une qualit adquate d'exemples d'entranement. - Choisir des valeurs initiales satisfaisantes pour les poids, et des valeurs convenables pour les paramtres d'apprentissage permettant d'acclrer la vitesse de convergence. - Problme de la convergence vers un minimum local, qui empche la convergence et cause l'oscillation de l'erreur. Plusieurs approches ont t proposes pour remdier ces problmes, Une des techniques d'acclration est celle de la cration dynamique des neurones, un neurone est ajout chaque fois que l'erreur se stabilise un niveau inacceptable.

3.3.1.3 Lapplication de rseau de neurone pour la classification des dfauts de la machine asynchrone
Position du problme
Lobjectif de cette phase est lapplication des rseaux de neurones pour la classification des nouvelles observations lune des classes existantes des dfauts de la machine asynchrone (dfaut roulement, dfaut statorique et dfaut rotorique). Le problme consiste dcider ou non, daffecter une nouvelle observation lune des classes connues. Pour se faire nous avons labors un programme de rseaux de neurones sur MATLAB et qui consiste notamment calculer lerreur quadratique moyenne pour les deux tapes suivantes : Premier tape est la phase dapprentissage qui consiste utiliser les donnes obtenues dans le second chapitre (Tableau. 3.1) pour construire lensemble dapprentissage.

Mthodes de la prise de dcision La seconde tape est la phase de test qui consiste classifier les nouvelles observations (exemple tableau 3.2).

Points Dfauts Dfaut roulement du vecteur forme 3 4 5 4 Dfaut stator 5 6 2 Dfaut rotor 3 4

Positions Doppler-retard (101,104) (101,105) (101,119) (45,10) (54,13) (56,11) (60,41) (68,49) (70,57)

Contraste

22.18 21.81 17.64 9.75 10.2 9.2 12.91 15.63 14.65

Tableau. 3.1 Trois noyaux dapprentissage par type de dfaut


Les nouvelles observations Contraste

Xu1

12.36 20.45 15.23

Xu 2

5.7 15.2 10.8

Tableau 3.2 : les nouvelles observations Xu

Mthodes de la prise de dcision


Choix dune architecture de rseau :

erreur quadratique moyenne

nombre de neurone cach


Figure 3.1 lerreur quadratique moyenne pour les deux tapes dapprentissage et de test en fonction de nombre de neurone cach

Les rseaux de neurones comme il est montr sur la figure 3.1

prsentent un

comportement alatoire en fonction du nombre de neurones dans la couche cache en termes derreur. Laugmentation du nombre de neurones cachs (ou augmentation des interconnexions) nimplique pas obligatoirement lobtention dune meilleure performance, bien que ce constat va lencontre de certains rsultats publis. Donc on choisir un architecture de rseau 7-3 qui ncessite 09 itrations de calcul et une erreur quadratique moyenne minimale par rapport aux autres structures (Figure 3.2, 3.3).

Mthodes de la prise de dcision

Figure 3.2 lapprentissage de rseau chois 7-3

Figure 3.3 lerreur quadratique moyenne pour lapprentissage dun rseau

Mthodes de la prise de dcision

Figure 3.4 lerreur quadratique moyenne pour le test dun rseau

La principale critique sur les rseaux de neurones est que les rsultats de l'apprentissage, c'est--dire le calcule par lalgorithme de rtropropagation , n'est pas interprtable par l'utilisateur : on ne peut pas donner d'explication au calcul d'une sortie sur un vecteur d'entre. On parle de << bote noire >>. Ceci est la principale diffrence entre rseaux de neurones et dautres mthodes de prise de dcision. Afin de donner un sens et une lisibilit la mthode de prise de dcision nous proposons une autre mthode savoir les k plus proche voisin (k ppv).

3.3.2 Rgle des k plus proches voisins (k ppv)


Soit
X a = ( X 1 , X 2 ,..., X N ) lensemble dapprentissage compos de N vecteurs

indpendants, chacun tiquet lune M classes connues. Le principe de la rgle des k ppv est daffecter une nouvelle observation X u la classe majoritairement reprsente parmi ses k - plus proches voisins.

Mthodes de la prise de dcision En ralit, La manire la plus simple dlaborer cette rgle, est de mesurer la distance entre la nouvelle observation et chacun des vecteurs de lensemble dapprentissage. La nouvelle observation sera alors affecte la classe majoritairement reprsente parmi ses k ppv. La dfinition de la notion de plus proche voisin est lie au choix dune distance.

3.3.2.1 Choix de la distance dans la rgle des k - ppv


Diffrentes distances peuvent tre utilises, dfinies par la formulation gnrale :

d 2 ( X , Y ) = ( X Y ) A( X Y ) ......(3.7)
t

avec :

A est une matrice dfinie positive. d ( X , Y ) :distance entre X et Y X et Y : vecteur de dimension d

Plusieurs cas particuliers peuvent tre tirs de cette formulation : La distance euclidienne o A est une matrice identit :
2 d E ( X , Y ) = ( X Y ) A( X Y ) ...(3.8) t

La distance de Mahanalobis o A est linverse de la matrice variance- covariance totale :


2 d M ( X ,Y ) = (X Y ) t

( X Y ) ....(3.9)

Lintroduction de la matrice de variance-covariance dans lexpression (3.9) signifie que cette mesure prend en compte la dispersion de lensemble dapprentissage, dans chaque dimension.

3.3.2.2 Choix du nombre de plus proches voisins k


Le choix de k est un choix dlicat souvent effectu un peu au hasard. Deux compromis sont satisfaire cependant : prendre k grand pour obtenir une estimation fiable , et tre certain

Mthodes de la prise de dcision que les k voisins sont proches de la nouvelle observation pour sassurer de ne pas effectuer un diagnostic erron. Le choix reste souvent arbitraire, k est pris relativement faible par rapport la taille de lensemble dapprentissage N. k est toujours ramen un nombre impair, pour viter lambigut dindcision. k gal N [Dub 90] ralise un bon compromis. Il est possible de faire une tude sur k [Ond 06] qui valuer la valeur de k permettant dobtenir les meilleurs rsultats en terme de classification et il est obtenue que quelque soit le nombre k de voisins, le taux de classification est lev (varie de 98 99%). Ceci permet de valider, dune part, le choix des paramtres formant le vecteur forme optimal. Ces paramtres prsentent un fort pouvoir de sparation entre les diffrentes classes de Xa1, rendant la classification plus efficace. Dautre part ce fort taux permet de montrer la robustesse de notre approche et notamment de la rgle de dcision.

3.3.2.3 Rgle des k plus proches voisins avec rejet


En ralit, il existe deux grandes notions de rejet : le rejet en ambigut qui concerne une nouvelle observation situe entre deux ou plusieurs classes de X a et le rejet en distance qui correspond une nouvelle observation situe une distance loigne des classes de X a . Ces rejets ont t introduits dans la rgle des k ppv et plus gnralement, dans les mthodes de diagnostic afin de diminuer les erreurs de classification et, par consquent, les erreurs de diagnostic. Globalement, la rgle de dcision incluant les deux options de rejets sera applique pour (M + 2) classes : X u c (c = 1, M ) : X u est class dans c . X u est rejet en ambigut alors : X u 0 . X u est rejet en distance alors : X u d . avec

d : classe fictive des observations rejetes en distance 0 : classe fictive des observations rejetes en ambigut

Mthodes de la prise de dcision

3.3.2.3.1 Rejet dambigut


Lorsque deux tats de fonctionnement du systme sont reprsents par deux classes proches dans d et que lobservation X u du systme linstant t se trouve la limite de la frontire de dcision entre ces deux classes (figure 3.5), il semble intuitivement plus sr de ne pas prendre de dcision sur laffectation de X u . Par contre le classifieur indiquera lutilisateur quil y a ambigut sur la dcision. Appliqu la rgle des k ppv, le rejet dambigut se dfinit ainsi [Hel, 70], [Tom, 76] : X u est associ la classe c si k au moins parmi ses k plus proches voisins appartiennent c

X u 0 si k c = max k r k ' r =1, M ..(3.10) ' X u c si k c = max k r k r =1, M Avec: k le nombre de plus proches voisins du vecteur X u . k c le nombre de plus proches voisins de X u (parmi k) dans la classe c . Les observations rejetes en ambigut seront affectes une nouvelle classe fictive 0 , appele classe de rejet en ambigut. Plus k' est proche de k, plus le rejet en ambigut est important. La rgle de rejet d'ambigut a t par la suite gnralise par [Dev 77] en fixant un nombre minimal de voisin propre chacune des classes. D'autre part si k' = 0, alors le rejet n'est pas appliqu.

3.3.2.3.2 Rejet de distance


Seule, la notion de rejet en ambigut est insuffisante. Il faut ajouter la possibilit de dcision sur des observations rsultant de lapparition de nouvelles classes.

Mthodes de la prise de dcision Ces nouvelles classes correspondent gnralement des zones de lespace inexplores, au sens o aucune observation de X a ny a t rencontre. Dans ce cas, une deuxime possibilit de rejet a t utilise, appele rejet en distance [Dub 90]. Ce rejet en distance est bas sur la notion de distance aux classes, qui doit tre grande. Lide la plus simple consiste effectuer un seuillage de distance. Lobservation X u est rejete si la distance ses k ppv est suprieure un seuil T. Le seuil de distance est dfini par lutilisateur. Il est compar par exemple : la distance moyenne de X u ses k plus proches voisins y h (h = 1, k ) :

X u d si

1 k d ( X u , y h )T .....(3.11) k h 1

ou la distance entre Xu et le centre de gravit de sa classe daffectation : X u d si

1 k d ( X u , m c )T ....(3.12) k h 1

mc tant le centre de gravit de la classe daffectation de X u

Le seuil T peut dpendre de la classe, donc tenir compte de sa gomtrie et tre li au diamtre de la classe o a des considrations statistiques. Ainsi une premire solution peut tre dassimiler le seuil de rejet en distance Tc de la classe c au diamtre de cette classe. Pour cela, il est ncessaire de calculer les distances entre les vecteurs de celle-ci et son centre de gravit mc :
Tc = max[d ( X cv , m c )] avec = 2 par exemple
v =1, Nc

Avec : N c , le nombre de vecteurs de la classe c X cv , le V ime vecteur de la classe c

Mthodes de la prise de dcision La marge de scurit (facteur ) permet de prendre en compte les incertitudes sur la dimension exacte de la classe mais aussi sur le bruit lors de lacquisition des mesures. La deuxime solution consiste dfinir les caractristiques statistiques relles des classes pour ensuite sen servir lors de la dtermination du seuil. Finalement, la rgle des k ppv incluant les deux options de rejet peut sexprimer par :

X u d si d ( X u , m c )Tc ' X u 0 si d ( X u , m c ) Tc et k c = max k r k ..(3.13) r =1, M X u c si d ( X u , m c ) Tc et k c = max k r k ' r =1, M

3.3.2.4 la prise de dcision par les k-ppv pour les nouvelles observations
Il sagit maintenant de valider la mthode de dcision les k-ppv mises en place. Comme prcis au dbut de ce chapitre, nous utilisons les mesures ne faisant pas partie de lensemble dapprentissage. Ainsi, le diagnostic final de la rgle des k ppv est tabli pour les mme nouvelles observations illustr dans le tableau 3.2.on utilise les deux distance la distance euclidienne et la distance mahanalobis. Dans ce travail nous avons choisis trois procdures de dcision par les k-ppv. La premire, cest la classification du vecteur test point par point. la seconde classification se contente de vrifier deux points au lieu de tout le vecteur test afin de prendre une dcision. La troisime est la classification par le centre de gravit de vecteur test. La dcision point par point La dcision par deux points La dcision par le centre de gravit

Mthodes de la prise de dcision


La dcision point par point
la dcision point par point 6

classes

* *

* **

* **

**

10

contrastes

15

20

25

Figure 3.5 la dcision point par point par la distance euclidienne


la dcision point par point 6

4 classes

* *

* **

**

10 contrastes

15

20

25

Figure 3.6 la dcision point par point par la distance Mahanalobis

Mthodes de la prise de dcision


La dcision par deux points
la dcision par deux point 6

classes

* *

* **

* **

**

10

15

20

25

contrastes

Figure 3.7 La dcision par deux point satisfait par la distance euclidienne
la dcision par deux point 6

4 classes

* *

* **

* **

**

10 contrastes

15

20

25

Figure 3.8 La dcision par deux point satisfait par la distance Mahanalobis

Mthodes de la prise de dcision


La dcision par le centre de gravit
la dcision par le centre de gravit de vecteur test 6

classes

* ** *

**

10

contrastes

15

20

25

Figure 3.9 La dcision par le centre de gravit par la distance euclidienne


la dcision par le centre de gravit de vecteur test 6

4 classes

* **

1
1 * **

10 contrastes

15

20

25

Figure 3.10 La dcision par le centre de gravit par la distance Mahanalobis

Mthodes de la prise de dcision les figure 3.5 prsente la classification de deux nouvelles observation Xu1 et Xu2 par la procdure point par point ceci par lutilisation de la distance euclidienne. Nous constatons que le premier point du vecteur Xu1 est affect a la classe 3 qui correspond au dfaut rotorique mais les deux autres points sont rejets en ambigit, de ce fait la dcision est la rejet de vecteur par ambigit avec un taux derreur 33% ( le taux derreur correspond au nombre des points mal classs sur le nombre des points du vecteur observ), en revanche la deuxime point du vecteur Xu2 est affect la classe 2 cest dire le dfaut statorique et les autres points sont rejets en distance, par consquent le vecteur est rejet en distance avec un taux derreur 33%. La figure 3.6 prsente la classification de deux nouvelles observations Xu1 et Xu2 par la procdure point par point mais cette fois-ci par lutilisation de la distance Mahanalobis. Nous constatons que la dcision est le mme que la distance euclidienne, c'est--dire le vecteur Xu1 est rejet en ambigut et le vecteur Xu2 est rejet en distance. Cette similitude des rsultats entre les deux distances sexplique par le principe de Fisher, la sparation entre les classes est plus grand et les point de la mme classe est plus proche. Les points dapprentissage sont issus du principe Fisher de plus fort contraste. Les figures 3.7et 3.8 illustrent les cas de deux points quelconques prisent des vecteurs Xu1 ou Xu2, par consquent le vecteur Xu1 est affect la classe 3 et donc la classe de dfaut rotorique mais avec un taux derreur 66% et le vecteur Xu2 est rejet en distance avec un taux derreur de 33%. Dans la troisime tape, nous avons utiliss le centre de gravit de chaque vecteur. Les figures 3.9 et 3.10 illustrent la classification des vecteurs dans les diffrentes classes possible. Nous observons que le vecteur Xu1 est rejet en ambigut, ce rsultat correspond la classification point par point comme nous lavons vu prcdemment et le vecteur Xu2 est rejet en ambiguit avec un taux derreur 66% ceci est cause de lloignement entre les points de vecteur Xu2.

Mthodes de la prise de dcision le tableau (3.3) rsum laffectation des nouvelles observations aux diffrentes classes de l'ensemble dapprentissage : la classe dfaut roulement 1 , la classe dfaut statorique 2 , la classe dfaut rotorique 3 , la classe de rejet en ambiguit a et la classe de rejet en distance
d .

La dcision par la distance Euclidienne Par Point Le Deux Le de gravit Xu1


po int 1 3

La dcision par la distance Mahanalobis Par point Le vecteur Deux points Le centre de gravit
po int 1 3

vecteur points centre

po int 2 a po int 3 a

po int 2 1 po int 3 a po int 1 d

Xu2

po int 1 d po int 2 1 po int 3 d

po int 2 a po int 3 d

3.3.2.5 Classification non exclusive


Le fait dutiliser une classification exclusive renseigne sur lappartenance dune observation une classe, mais ne donne aucune indication sur sa localisation dans la zone de la classe concerne. En effet, une observation situe au centre dune classe et une observation situe en bordure (proche du seuil limite de rejet en distance) de celle-ci nont pas la mme reprsentativit, et pourtant, ces deux observations sont affectes de la mme manire cette classe.

Mthodes de la prise de dcision De mme, une observation situe en bordure de classes contigus, ou entre deux classes disjointes, peut signifier un tat transitoire entre ces deux classes. Quantifier cette information permet de donner la probabilit dappartenance la classe retenue et, de ce fait, fournit un degr de confiance dans la classification ralise. Cela permet aussi de suivre lvolution dobservations successives lintrieur dune classe, cest--dire de donner une mesure de lvolution du systme vis--vis des tats connus. Pour ces raisons, la mise en place dune rgle de dcision non exclusive peut tre intressante. Nous disposerons de plus dinformations sur lappartenance dune observation, ce qui permettra dune part, de donner un diagnostic plus en adquation avec la ralit dvolution du processus et dautre part, dassocier un degr de confiance la classification. Le passage de laffectation exclusive laffectation non exclusive doit se caractriser par une gradation entre la non appartenance absolue et lappartenance totale. Pour rpondre ces contraintes, plusieurs solutions sont envisageables. Une des solutions possibles, qui na pas t utilise par la suite, se base sur lutilisation dune fonction gaussienne centre sur le centre de gravit de la classe. Lexpression de cette fonction pour notre problme prendrait la forme suivante :
1
X ,m d u c 2 c
2

f c (X u ) =

c 2

..(3.14)

Avec c , lcart type de la classe c . En supposant que les classes soient caractrises par une distribution gaussienne (ce qui et gnralement le cas), il est possible de fixer d seuilc , correspondant une appartenance totale, trois fois lcart type (ce qui englobe 99% des observations de la classe) et ensuite, de fixer le seuil Tc pour obtenir une appartenance dcroissante jusquau rejet en distance. Ceci est reprsent sur la figure 3.11 Ainsi, la fonction dappartenance de la classe c pourrait se dfinir comme suit : Si d ( X u , mc ) 3 alors c ( X u ) = 1

Mthodes de la prise de dcision Si 0 3 d ( X u , m c ) d seuil alors c ( X u ) = f c ( X u ) ..(3.15) sinon

Figure 3.11 Fonction dappartenance dfinie laide dune fonction gaussienne centre sur
mc [ond 06]. La solution qui a t retenue par la suite dfinie une fonction dappartenance laide dune fonction multidimensionnelle. Cette fonction dappartenance est dcrite par la formulation suivante (3-16) :
g d (X u , m c ) 1 (1 ) d seuil c g d seuil d ( X u , m c ) g c c ( X u ) = 1 d seuil c 0

si 0 d ( X u , m c ) d seuil c si d seuil c d ( X u , m c ) d seuil c ...( 3 .16 ) si non

avec : d ( X u , m c ) est la distance entre une observation X u et le centre de gravit mc de la classe c .

Mthodes de la prise de dcision d seuilc est le paramtre qui dfinit la position des points dinflexion. Il correspond la distance maximale entre le centre de gravit de la classe c et le point le plus loign de cette mme classe.

d seuilc = max[d ( X cv , m c )].......(3.17)


v =1, N c

c ( X u ) = si d ( X u , m c ) = d seuil ....(3.18)
c

est le paramtre servant fixer le plateau de la fonction . est un paramtre ( + 1) qui


permet de dfinir la largeur de bande de la fonction (les points darrt de la fonction ).g est un paramtre permettant de faire varier la pente de la fonction. Cette rgle nautorise pas la notion de rejet dambigut. Pour diminuer le risque de mauvaise classification, il convient donc de dfinir de nouvelles rgles de dcision non exclusive permettant de contrler ce type de rejet.

3.3.2.5.1 Rejet dambigut


Une rgle de dcision non exclusive incluant la notion de rejet dambigut doit tre base sur une analyse non binaire des fonctions dappartenance. Lide la plus simple consiste dcider de laffectation dune observation X u aux diffrentes classes par comparaison des valeurs des fonctions c ( X u ) (c=1,M) un seuil dappartenance. Pour que ce rejet puisse tre appliqu, il est ncessaire que les k plus proches voisins soient issus dau moins deux classes diffrentes. Ainsi, une nouvelle observation est rejete en ambigut . Les quations rgissant ce rejet sont : Si c ( X u ) 0 ....(3.19)
c =1, M

Alors

{X u 0

si c ( X u ) r ( X u ) Tne
c =1, M r =1, M r c

......(3.20)

Mthodes de la prise de dcision Remarque : Plus Tne 0(1) , moins (plus) les observations sont rejetes en ambigut. Une information supplmentaire est apporte pour lutilisateur concernant lincertitude sur laffectation dune nouvelle observation. En effet, une rgle peut tre mise pour alerter sur la classification ralise. Elle ne sapplique que lorsque les k plus proches voisins sont issus dau moins deux classes. Elle indique que les degrs dappartenance de lobservation aux classes sont infrieurs lincertitude, ce qui laisse penser que lobservation se situe dans une zone de lespace faiblement reprsente par les classes de X a . La rgle met donc une alerte si :

c ( X u ) 1 c ( X u ) ..(3.21)
c =1 c =1

3.3.2.5.2 Rejet dappartenance


Un vecteur se situant loin dune classe doit avoir un faible degr dappartenance cette classe. La notion de rejet de distance peut donc tre exprime en terme dappartenance. Nous introduisons donc la notion de rejet dappartenance, comparable au rejet de distance, mais spcialement ddie aux rgles de dcision non exclusive. Il peut tre dfini comme suit : Une observation est rejete en appartenance si son appartenance toutes les classes possibles est infrieure un seuil dappartenance, not Tra

X u d si c ( X u ) Tra c = 1, M ... (3.22)


Une observation X u nest pas rejete en appartenance sil existe au moins une classe

c telle que c ( X u ) Tra . Lquation 3.48, reprsentant le rejet en appartenance, peut donc
scrire :

X u d si max( c ( X u )) Tra . (3.23)


c =1, M

Finalement, la rgle des k ppv non exclusive incluant les deux options de rejet peut tre formule de la manire suivante :

Mthodes de la prise de dcision

X u c si c ( X u ) = max( r ( X u )) et c ( X u ) Tra et 3.46 soit satisfaite r =1, M .......... (3.24) X u d si max( c ( X u )) Tra c =1, M X u 0 si c ( X u ) r ( X u ) Tne r =1, M c =1, M r c La gradualit de la fonction dappartenance permet dune part, de quantifier la fiabilit de
la classification et dautre part, de suivre lvolution des nouvelles observations dans lespace de reprsentation pour ventuellement construire un pronostic.

3.3.2.5.3. La dcision pour les nouvelles observations


La prise de dcision par les k-plus proche voisin non exclusif est ralise comme les kppv simple et nous avons utiliss les mme nouvelles observations donc les vecteur motifs Xu1 et Xu2 de tableau 3.2.

La dcision point par point


la dcision point par point 6

classes

* *

* **

* **

**

10

contrastes 15

20

25

Figure 3.12 la dcision point par point par la distance euclidienne

Mthodes de la prise de dcision


la dcision point par point 6

classes

* *

* **

* **

**

10

contrastes

15

20

25

Figure 3.13 la dcision point par point par la distance Mahanalobis La dcision par deux points
la dcision par deux point 6

classes

* *

* **

* **

**

10

contrastes

15

20

25

Figure 3.14 La dcision par deux points par la distance euclidienne

Mthodes de la prise de dcision

la dcision par deux point 6

classes

* **

**

10

contrastes

15

20

25

Figure 3.15 La dcision par deux point par la distance Mahanalobis la dcision par le centre de gravit

la dcision par le centre de gravit de vecteur test 6

4 classes

* **

1
1 * **

10 contrastes

15

20

25

Figure 3.16 La dcision par le centre de gravit par la distance euclidienne

Mthodes de la prise de dcision

la dcision par le centre de gravit de vecteur test 6

classes

* *

* **

* ** *

**

10

15

20

25

contrastes

Figure 3.17 La dcision par le centre de gravit par la distance Mahanalobis


Dans le cas de la classification par les k-ppv non exclusif, nous avons fais le mme travail que les k-ppv simple sauf que nous avons dfinis une fonction dappartenance fp qui donne une performance lors de la prise de dcision plus que les k-plus proche voisin simple. Le seuil de rejet en appartenance prend de fois plus que le seuil de rejet en distance cette caractristique offre une dcision plus prcise. Dans les figures 3.12 et 3.13, la classification point par point des nouvelles observations, le vecteur Xu1est affect la classe 3 c'est--dire la classe de dfaut rotorique avec un taux derreur 33% et le vecteurXu2 est rejet en appartenance avec un taux derreur 33%. Dans les figures 3.14 et3.15, la classification par deux points est satisfaisante pour la prise de dcision. Le vecteur Xu1 est encore affect la classe 3 avec un taux derreur 33% et le vecteur Xu2 est rejet en appartenance avec un taux derreur 33%. Finalement les figures 3.16 et 3.17 illustrent la classification par le centre de gravit des vecteurs. Le vecteur Xu1est rejet en ambigut et Le vecteur Xu2 est affect dans la classe 2 .

Mthodes de la prise de dcision Nous observons que la classification par le centre de gravit de chaque vecteur est diffrente des autres classifications (point par point et deux point de vecteur ) ceci est cause de lloignement entre les points dans le mme vecteur. On note que les rsultats obtenus par lutilisation de la distance mahanalobis sont similaires de ceux obtenus par la distance euclidienne car les points de lensemble dapprentissage est les points de plus fort contraste sont relativement proches les unes des autres. Le tableau (3.4) rsume la prise de dcision pour la classification observations. des nouvelles

La dcision par la distance Euclidienne Par Point Le vecteur Deux Le centre points de gravit Xu1
po int 1 3 po int 2 1 po int 3 3

La dcision par la distance mahanalobis Par point Le vecteur deux points Le centre de gravit

po int 1 3

po int 2 1 po int 3 3

Xu2

po int 1 d
po int 2 1

po int 1 d

po int 2 3

po int 3 d

po int 3 d

Mthodes de la prise de dcision


3.4 Conclusion

lobjectif de ce chapitre est la mise en place dune rgle de dcision pour valider la mthode de classification et pour rattacher toute nouvelle observation lune des classes existantes des dfauts de la machine asynchrone (dfaut roulement, dfaut statorique et dfaut rotorique). Nous avons utilis deux mthodes de prise de dcision, la premire mthode est les rseaux de neurones, lerreur quadratique moyenne obtenu pour les phases dapprentissage et de test montre que cette mthode est performante la classification mais elle a un inconvnient majeur en loccurrence linterprtation des rsultats. Ceci nous avons amen propos une deuxime mthode statistique savoir les k-plus proche voisin . Nous avons appliqu la mthode pour deux types de classification : exclusif et non exclusif. Nous avons propos trois procdures pour classifier les nouvelles observations ; classification point par point, classification par les deux points et la classification par le centre de gravit. Deux distances ont t utilises savoir la distance euclidienne et la distance mahanalobis. Les rsultats montrent que la classification par le centre de gravit du vecteur test est la plus simple et la plus performante. La classification par les k-plus proches voisin est la mthode la plus performante et la plus interprtable en termes de rsultats de classification.

Conclusion gnrale

Conclusion gnrale

Conclusion gnrale
Ce travail a port sur le diagnostic par la classification des dfauts de la machine asynchrone. Trois types de dfauts ont t traits savoir le dfaut statorique, le dfaut rotorique et le dfaut de roulement. Les techniques et autres outils de diagnostic tant trs nombreuses, nous les avons classes en deux approches: une approche signal base sur le traitement de signal des grandeurs mesurables, savoir le courant et la tension. Une approche systme, en loccurrence la classification par les reprsentations optimises temps-frquence. Dans ce travail, la classification automatique des dfauts de la machine asynchrone a t ralise partir de la reprsentation temps-frquence dite "dpendante de la classe du signal". Nous avons montr que les RTF classiques ont des noyaux paramtriques et priori prdfinis donc inappropris la classification, do lorientation vers le plan dambigut doppler-retard o toutes les RTF peuvent tre drives par un choix appropri dun noyau. Aprs avoir montr les limites du noyau DCS de moyenne carre et du noyau discriminant linaire, cause respectivement du non prise en considration de la variance interclasse pour le premier noyau et la ncessit des grands ensembles dapprentissage pour le second noyau, nous avons opt pour le noyau discriminant de Fisher afin de palier ces deux inconvnients. La premire phase du processus de classification est la phase dextraction des points pertinents. La seconde phase consiste la prise de dcision concernant laffectation dun signal non class. Deux mthodes de la prise de dcision ont t utilises savoir les rseaux de neurones et les k-plus proches voisin. Cette dernire t retenus vu ces performances et linterprtation de ces rsultats.

93

Bibliographie

Bibliographie

Bibliographie
[All 88] "Prsentation des avaries. Machines lectriques tournantes" cahier des prventions. CP2, Allianz, 1988. [Bas 02] M.J. Bastiaans, T. Alieva et L. Stankovic : On rotated time-frequency kernels. IEEE Signal Processing Letters, 9(11):378381, 2002. [Ben 98] Bentounsi A., Nicolas A, " Transient and steady-state analysis of induction motors with cage faults", IMACS, Multiconference, CESA98, April 1-4, pp.3511-3514, Tunisia, 1998. [Ben 98] Bentounsi A., Nicolas A., " On line diagnosis of defaults on squirrel cage motors using FEM ", Magnetics, IEEE Transactions on ,vol. 34 , n 5 , septembre 1998, p. 3511-3514. [Boa 90] B. Boashash and P. O'Shea. A Methodology for Detection and Classification of Some Underwater Acoustic signals Using Time-Frequency Analysis Techniques. IEEE Trans. on Acoustics, Speech and Signal Processing, 38(11) :2872_ 2883, Novembre 1990. [Boa 92] B. Boashash : Time-Frequency Signal Analysis-Methods and Applications. Longman-Cheshire, Melbourne and John Wiley Halsted Press, New York, 1992. [Boa 03] A. Boashash : Time-Frequency Signal Analysis and Processing : A Comprehensive Reference. Elsevier Ltd., Oxford, UK, 2003.Time-Frequency Signal Analysis and Processing : A Comprehensive Reference. Elsevier Ltd., Oxford, UK, 2003. [Bon 93] A. H. Bonnett, "Cause and analysis of Anti-Friction Bering Failures in A.C Induction Motors" IEEE Transactions on Industry Application, pp 14 - 23, Sept/Oct 1993. [Cas 03] R. Casimir, "Diagnostic des dfauts des machines asynchrones par reconnaissance des formes" Thse de lEcole Centrale de Lyon, CEGELY, 2003.

95

Bibliographie [Cha 98] E. Chassande-Mottin : Mthodes de rallocation dans le plan temps-frquence pour lanalyse et le traitement de signaux non-stationnaires. Thse de doctorat, Universite de Cergy-Pontoise, 1998. [Che 02] V.C. Chen et Hao Ling : Time-Frequency Transforms for Radar Imaging and Signal Analysis. Artech House, Boston, London, janvier 2002. [Cla 80] Claasen T. A. C. and. Mecklenbruker W. F. G, The Wigner distributionA tool for timefrequency signal analysisPart III: Relations with other time frequency signal transformations, Philips J. Res., vol. 35, no. 6, pp. 372389, 1980. [Coh 66] L. Cohen. Generalised Phase-Space Distribution Functions. Journal of Mathematical Physics, 7(5) :781 _ 786, Mai 1966. [Coh 95] L. Cohen : Time-Frequency Analysis. Englewood Cliffs, NJ : Prentice-Hall, 1995, 1995.
[Dav 98] Davy M. and Doncarli C., Optimal kernels of time-frequency representations for

signal classification, in Proc. IEEE-SP Int. Symp. Time-Freq. Time-Scale Anal., 1998, pp. 581 584. [Dav 00] Davy M.," Noyaux optimiss pour la classification dans le plan temps-frquenceProposition d'un algorithme constructif et d'une rfrence baysienne base sur les mthodes MCMC Application au diagnostic d'enceintes acoustiques", thses de doctorat, Ecole Centrale de Nantes, 2000. [Der 00] Derrhi M., Modlisation de la machine asynchrone par rseaux de permances, validation par le diagnostic, Thse de doctorat, Universit de Picardie Jules Verne, 2000. [Dev 77] P. A. Devijver, "Reconaissance des formes par la mthode des plus proches voisins", Thse de 3me cycle, Universit Paris 6, juin 1977. [Dev 01] V. Devanneaux, H. Kabbaj, B. Dagues et J. Faucher, "An accurate model of squirrel cage induction machines under static, dynamic or mixed eccentricity" Proc. IEEE SDEMPED 2001 Symposium on Diagnostics for Electric Machines, Power Electronics and Drives, pp.121-126, 1-3 Septembre 2001 Grado, Italie

96

Bibliographie [Dud 73] Duda R. O. and. Hart P.E, Pattern Classification and Scene Analysis. New York: Wiley, 1973. [Dub 90] B. Dubuisson, Diagnostic et Reconnaissance des Formes. Trait des nouvelles technologies. Srie diagnostic et Maintenance. Herms, Paris,1990 [Dub 90a] B. Dubuisson, "Decision with reject options", Eusipco, Barcelone, 1990.
[Dud 01] Duda R., Hart P., Stork D., Pattern Classification, Willey Interscience Second

edition, 2001. [Elk 92] N. M. Elkasabgy, A. R. eastham, G. E. Dawson, "Detection of broken bars in the cage rotor on an induction machine" IEEE Transactions on Industry Applications, Vol.28, no.1, Part 1, pp. 165-171, Jan.-Fv. 1992 [Fil 95] F. Filippetti, G. Fanceschini, C. tassoni, "Neural networks aided on-line diagnostics of induction motor rotor faults" IEEE Transactions on Industry Applications, Vol. 31, Issue 4, pp. 892-899, July/August 1995.
[Fis 36]

Fisher R.A., The use of multiple measurements in taxonomic problems. Annals of Eugenics, v.7, p. 179-188 Cambridge University Press, 1936

[Fix 51] Fix E., Hodges,J.L., Discriminatory analysis. Non-parametric discrimination. USAF

School of Aviation Medicine, Randolph Field, TX, 4 Technical Report 4, 1951. [Fla 88] P. Flandrin. A Time-Frequency formulation of Optimal Detection. IEEE Trans. on Acoustics, Speech and Signal Processing, 36(9) :1377 _ 1384, Septembre 1988. [Fla 93] P. Flandrin : Temps-Frquence. Editions Hermes, Paris, 1993. [Fu 74] K. S. Fu, "Syntactic Methods in Pattern Recognition" Academic Press, Inc, New York, 1974. [Gen 07] Gentil S., Celse B., Charbonnier S., Cocquempot V., Hamelin F., Lesecq S., Maquin D., Montmain J., Ragot J., Sauter D., Supervision des Procds Complexes, Lavoisier, 2007.

97

Bibliographie [Gil 99] Gillespie B. W. and Atlas L., Optimization of time and frequency resolution for radar transmitter identification, in Proc. IEEE Int. Conf. Acoustics, Speech, and Signal Processing, vol. 3, 1999, pp. 13411344. [Gus 92] Gustafson D., Kessel W., Fuzzy Clustering with a Fuzzy Covariance Matrix. IEEE Fuzzy Models for Pattern Recognition, 1992 reprinted from Proc. IEEE CDC 1979.
[Hay 97] Haykin S. and Bhattacharya T. K., Modular learning strategy for signal detection

in a nonstationary environment, IEEE Trans. Signal Processing, vol. 45, pp. 16191637, June 1997. [Hei 95] C. Heitz. Optimum time-frequency representations for the classification and detection of signals. Applied Signal Processing, 3 :124 _ 143, 1995. [Hel 70] M. E. Hellman, "The nearest neighbor classification rule with a reject option", IEEE. Trans on System, Man and Cybernetics, pp 179 185, Vol 6, no 3, July 1970. [Hla 97] Hlawatsch F, Papandreou-Suppappola A., and. Boudreaux-Bartels G. F. The Hyperbolic Class of Quadratic Time-Frequency Representations - Part II : Subclasses, Intersection with the Affine and Power Class, Regularity and Unitarity. IEEE Transactions on Signal Processing, 45(2) :303 _ 315, Fvrier 1997. [Hla 05] F. Hlawatsch et F. Auger : Temps-Frquence : Concepts et Outils. Traite IC2, serie Traitement du signal et de limage, Hermes, Lavoisier, Paris, France, 2005. [Ioa 03] C. IOANA : Contribution la caractrisation optimale des structures tempsfrquence non-linaires. These de doctorat, Universite de Bretagne Occidentale, septembre 2003
[Ker 84] L. Kerszenbaum et C. F. Landy, "The existence of large inter bar currents in the three phase squirrel cage motors with rotor-bar and en-ring faults" IEEE Transactions on Power Apparatus Systems, Vol. PAS-103, n7, pp.1854- 1862, July 1984.

98

Bibliographie [Leb 06] A.Lebaroud ," Modlisation et techniques orientes vers le diagnostic de la machine asynchrone associe des sources variables", thses de doctorat, Universit de Constantine, 2006. [Leb 08] Lebaroud. A , Clerc. G, Classification of Induction Machine Faults by Optimal TimeFrequency Representations, IEEE Transactions, Industrial Electronics vol. 55, no. 12, pp. 4290-4298, December 2008. [Leb 09] Lebaroud. A , Clerc. G, Accurate Diagnosis of Induction Machine Faults Using Optimal Time-Frequency Representations, ELSEVIER, Engineering

Applications of Artificial Intelligence, Volume 22, Issues 4-5, June 2009, Pages 815-822 [Lem 95] O. Lemoine : Dtection de signaux non stationnaires par reprsentation tempsfrquence. These de doctorat, Universite de Nice - Sophia antipolis, septembre 1995. [Mal 00] S. Mallat : Une Exploration Des Signaux En Ondelettes. Ellipses, Paris, France, 2000. [Na 00] M. S. Nat-Sad, M. E. H. Benbouzid et A. Benchaib, "Detection of broken bars in induction motors using an extended kalman filter for rotor resistance sensorless estimation" IEEE Transactions on Energy Conversion, Vol.15, no 1, pp.66-70, Mars 2000. [Nej 00] Nejjari H., Benbouzid M.E.H., " Monitoring and diagnosis of induction motors electrical faults using a current Park's vector pattern learning approach ", Industry Applications, IEEE Transactions on, vol. 36 , n : 3 , mai/juin 2000. p.730-735. [O'do 85] P. O'Donnell, "Report of large reliability survey of industrial and commercial installations, Part 1", IEEE Transaction on Industry Applications, Vol. IA 21, N 4, july/august 1985 pp 853 864. [Ond 06] O. Ondel, "Diagnistic par Reconnaissance des Formes: Application a un Ensemble Convertisseur-Machine ", Thse de Doctorat, L'Ecole Centrale de Lyon, October 2006.

99

Bibliographie [Pap 02] A. Papandreou-Suppappola : Applications in Time-Frequency Signal Processing. CRC Press, 2002. [Rai 00] B. Raison, "Dtection et localisation de dfaillances sur un entranement lectrique" Thse de doctorat de lInstitut National Polytechnique de Grenoble, Septembre 2000. [Ric 98] C. Richard : Une mthodologie pour la dtection structure impose. Applications au plan temps-frquence. These de doctorat, Universite de Technologie de Troyes, decembre 1998. [Sch 95] R. R. Schoen, T. G. Habetler, "Effect of time-varying loads on rotor fault detection in induction machines" IEEE Transaction on Industry applications, Vol. 31, Issue 4, pp.900-906, July-Aug. 1995. [Sch 99] E. Schaeffer, "Diagnostic des machines asynchrones : modles et outils paramtriques ddis la simulation et la dtection des dfauts", Thse de doctorat, Ecole Centrale de Nantes, 1999. [Sob 98] T. J. Sobczyk, A. Izworski, "Recognition of rotor eccentricity of induction motor based on the fourier spectra of phase currents" Proc. ICEM'98, pp. 408 413 , Vol 1, september 2 - 4 1998 Istanbul Turkey [Tho 95] O. V. Thorsen, M. Dalva, "A survey of fault on induction motors in offshore oil industry, petrochemical industry, gas terminals, and oil refineries" IEEE Transactions on Industry Applications, Vol.31, no.5, pp.1186-1196, September 1995. [Tom 76] I. Tomek, "A generalisation of the kNN rule", IEEE Trans on System, Man and Cybernetics, Vol. 6, no 2, pp 121 126, february 1976. [Van 68] H. L. Van Trees. Detection, Estimation, and Modulation Theory. Part I. John Wiley & Sons, 1968.
[Wan 95]

Wang W. J. and McFadden P. D., Application of orthogonal wavelets to early gear damage detection, Mech. Syst. Signal Process., vol. 9, no. 5, pp. 497507, 1995.

100

Bibliographie [Wan 04] Wang M., Rowe G. I., and Mamishev A. V., Classification of power quality events using optimal time-frequency representationsPart 2: application, IEEE Trans. Power Delivery, vol. 19, pp. 14961503, 2004. [Yah 95] H. Yahoui, J. Seetohul, G. Grellet, A. Jammal, "Detection of broken bar or endring fault in asynchronous machines by spectrum analysis of the observed electromagnetic torque through supply cable" Revue Europenne de Diagnostic et Sret de Fonctionnement, Vol.5, no.4, 1995

101


. . . - : -k . : -

Rsum

Les entranements lectriques utilisent de plus en plus les moteurs asynchrones cause de leur robustesse, de leur puissance massique et de leur cot. Leur maintenance et leur diagnostic deviennent donc un enjeu conomique. Il est important de dtecter de manire prcoce les dfauts qui peuvent apparatre dans ces machines et donc de dvelopper des mthodes de surveillance de fonctionnement ou de maintenance prventive.
Notre approche repose sur l automatisation dune procdure de dtection des dfauts des moteurs asynchrone partir de la reprsentation temps- frquence optimise puis la prise de dcision pour les nouvelles observation par deux mthodes :les rseau de neurone et les k-plus proches voisin. Mots cls :

les moteurs asynchrones diagnostic


reprsentation temps- frquence les rseau de neurone les k-plus proches voisin

Abstract
Electrical tractions use more and more the asynchronous machines because of their robustness, their power weight ratio. Their maintenance as well as their diagnosis then became an economic state. It is important to early detect the faults likely to appear in those motors and therefor to implement a preventive maintenance. Our approach is based about a procedure of the automation for classification of induction machine faults by optimal time-frequency representation then the decision for the news observations used two methods :the neurons networks and the k-plus nearest neighbor. Key words: asynchronous machines diagnosis time-frequency representations neurons networks k-plus nearest neighbor

You might also like