You are on page 1of 7

Clasicacin lineal mediante

algoritmo de perceptrn difuso


Valeria Paola Gonzlez Duez
Divisin de Admn. y Sistemas
vpaola@me.uanl.mx
scar Leonel Chacn Mondragn
Programa de Postgrado en Ingeniera de Sistemas FIME-UANL.
ochacon@mail.uanl.mx

RESUMEN
La clasicacin es una de las herramientas necesarias para llevar a cabo un
buen reconocimiento de patrones. Las Redes de Neuronas Articiales (RNA),
como una seccin del rea de Inteligencia Articial (IA), dispone del perceptrn
que es un mtodo simple y eciente para aprender a travs de ejemplos, a
realizar clasicaciones lineales. Sin embargo, ste no es tan exible cuando
existen datos con gran incertidumbre. El Perceptrn Difuso (APD) resuelve
este problema de convergencia utilizando la teora de conjuntos difusos. En
estas condiciones el APD presenta sus ventajas sobre los otros mtodos.
PALABRAS CLAVE
Inteligencia articial, clasicacin lineal, reconocimiento de patrones, redes
neuronales articiales, perceptrn difuso.

ABSTRACT
The classication is a necessary tool to carry out good Pattern Recognition.
The Articial Neural Networks, as an Articial Intelligence section, has the
Perceptron, a simple and efcient method for learning a linear classier from
training examples. Although it is simple, it is non exible when there are data
of high uncertainty. The Fuzzy Perceptron solves convergence problem above
using Fuzzy Theory. Under such conditions, the fuzzy perceptron overcomes
other methods.
KEYWORDS
Articial Intelligence, Linear Classication, Pattem Recognition, Articial
Neural Networks, Fuzzy Perceptron.

INTRODUCCIN
Actualmente el rea de inteligencia articial estudia el comportamiento
inteligente del ser humano representando y simulando este comportamiento
mediante la creacin de modelos y algoritmos computacionales a n de
aplicarlo en la solucin de problemas y en el caso de la industria1,2 con buen
xito; en s la industria actualmente se ha apoyado principalmente, para el

Ingenieras, Enero-Marzo 2006, Vol. IX, No. 30 47


Clasicacin lineal mediante algoritmo... / Valeria Paola Gonzlez Duez, scar Leonel Chacn Mondragn

rea de toma de decisiones, con sistemas expertos, que contiene las caractersticas dadas del patrn
robtica, redes neuronales articiales, lgica difusa, acta como entrada al sistema, que el sistema opera
reconocimiento de patrones, etc. sobre dicha entrada para producir una salida, la cual
El presente estudio est relacionado con el rea es una identicacin nica asociada con la clase
de reconocimiento de patrones. Es importante del objeto a la cual pertenece. El reconocimiento
mencionar que el reconocimiento de un objeto est basado en la medida de los atributos fsicos o
como miembro de una clase o grupo se denomina mapeo de los mismos. Las N caractersticas de una
identicacin. A su vez, la clasicacin es el poblacin de objetos pueden considerarse tomadas
proceso de aprendizaje de agrupamiento de como dimensiones dentro de un espacio vectorial,
objetos en clases de acuerdo a su similitud. El rea segn se ilustra en la gura 1, para el caso de N =
de reconocimiento de patrones incluye ambas: 2, con dos clases.
clasicacin e identicacin.3 Existen diferentes tcnicas que pueden utilizarse
Para su identicacin el proceso de aprendizaje en el sistema de reconocimiento de patrones,
se lleva de manera implcita; ste se utiliza en siempre y cuando se tenga denido un espacio
aquellos sistemas en los cuales el registro de sus de rasgos distintivos, o caractersticas asociadas
experiencias, dentro de un sistema interno, cambia a una poblacin de objetos. El modo operacional
de acuerdo a su comportamiento. La clasicacin del reconocimiento es un sistema de mapeo, donde
es una forma de aprendizaje que se inicia a partir cada vector de entrada a travs de un proceso,
de los antecedentes que existen de las clases. El
razonamiento es un proceso en el que se aplican
reglas generales, ecuaciones, relaciones y tambin
una coleccin inicial de datos o hechos para
deducir resultados o tomar decisiones. La lgica
difusa utiliza el concepto de incertidumbre y
mapeo de rasgos distintivos para la formacin de
agrupamientos denominndolos difusos.4-7 En el
proceso de reconocimiento de patrones, al objeto se le
asigna un grado caracterstico o grado de membresa,
identicando -en cada agrupamiento y de forma
nica- la similitud entre los atributos del objeto y los
atributos de los agrupamientos o clases.8
a) Lineal

REPRESENTACIN DE PATRONES
El concepto de patrn puede establecerse como
un grupo de datos que contienen rasgos distintivos
asociados a una clase, que los hacen nicos e
irrepetibles. Un objeto contiene atributos que son
medidos para producir un patrn (vector), para
asignarle un grado de membresa respecto a las
clases en consideracin o para denir un espacio
caracterstico que se utilizar para efectuar el
proceso de reconocimiento. En general, los atributos
de los objetos producen un grupo de caractersticas
a las cuales se les aplican tcnicas de similitud para
lograr su reconocimiento.6
Un mecanismo para el reconocimiento de b) No lineal
objetos o patrones es un sistema en el cual, el vector Fig. 1. Separacin de clases.

48 Ingenieras, Enero-Marzo 2006, Vol. IX, No. 30


Clasicacin lineal mediante algoritmo... / Valeria Paola Gonzlez Duez, scar Leonel Chacn Mondragn

distingue o asocia los rasgos distintivos en un


vector, para cada grupo de objetos. La accin que w T x j + b < 0, si x j A2 (2)
determina la regin de aceptacin se conoce como T
donde w representa transposicin del vector w.
proceso de reconocimiento. En la clasicacin se Por lo tanto, si w y b existen, se puede decir que A1
involucra el proceso de entrenamiento conocido y A2 son grupos o regiones linealmente separables;
como mecanismo de aprendizaje. w es llamado tambin vector de separacin y es
Las categoras de un mecanismo de aprendizaje el encargado de separar (identicar) los datos o
se conocen como: entrenamiento supervisado y elementos pertenecientes a los grupos A1 y A2.
entrenamiento no supervisado. En el entrenamiento
supervisado cada vector de entrada del sistema
se identica con un vector asociado de salida, SEPARACIN LINEAL DE CLASES DIFUSAS
el sistema aprende con cada vector presentado al La condicin para llevar a cabo la separacin
sistema asocindolo a la salida correspondiente. En de clases difusas es considerar a los grupos A1, A2
el aprendizaje no supervisado el sistema incluye
como una particin difusa de
ambos procesos entrenamiento y clasicacin para
, el cual es el grupo que contiene la totalidad
cualquier entrada, asociando un prototipo para
cada clase de objetos.3 Este aprendizaje realiza un de los datos como

vectores aumentados y j = [x j 1] . Consideremos


proceso de agrupamiento donde se dene un vector T

de rasgos distintivos a partir de las clases llamado


clustering. Cuando un vector de rasgos distintivos
es una entrada en el sistema, se determinan las
as mismo el vector en relacin a las
distancias a los centros de todos los agrupamientos
ecuaciones (1) y (2).
generando una identicacin del grupo al que
pertenece, basado en la distancia mnima.8 Las clases difusas A1 y A2 sern linealmente
separables si existe un vector , vlido para
CLASES LINEALMENTE SEPARABLES cada , tal que,
Teniendo en cuenta que dentro de un espacio 2 ( y ) > 0.5 T y > 0 (3)
existen caractersticas o rasgos distintivos, un T
2 ( y ) > 0.5 y < 0 (4)
sistema clasicador puede describirse por una
funcin discriminante, la cual identica de manera donde y representan una funcin
nica cada grupo.
equivalente a y se localizan en las
El caso ms simple de un mecanismo de ecuaciones (8) y (10). Si no se cumplen las
entrenamiento es el que utiliza datos linealmente condiciones anteriores, A1 y A2 sern considerados
separables. Por ejemplo consideremos a X grupos difusos no lineales y por lo tanto es necesario
como un grupo de datos de entrenamiento aplicar otras herramientas de clasicacin.
. A partir de
este conjunto se forman dos grupos (conjunto de
vectores) A1 y A2, que contienen los datos que sern ALGORITMO DE PERCEPTRN DIFUSO
identicados de acuerdo a su grado de membresa.
Es posible mencionar el modelo ms simple de
Cuando ocurre el proceso de identicacin se
redes neuronales difusas; en este caso, el algoritmo
deber obtener un vector que separe linealmente a
de perceptrn difuso, el cual puede ser entrenado
estos grupos. El resultado de la etapa de aprendizaje
con los agrupamientos difusos A1 y A2.
est representado en el siguiente planteamiento:
encontrar un vector w y un escalar b, tal que, todos En la gura 2 se presenta el peso asociado
los datos xj , satisfagan las siguientes condiciones:
a la k-sima conexin de entrada as como ,
w T x j + b > 0, si x j A1 (1) el umbral del perceptrn difuso. Para un elemento

Ingenieras, Enero-Marzo 2006, Vol. IX, No. 30 49


Clasicacin lineal mediante algoritmo... / Valeria Paola Gonzlez Duez, scar Leonel Chacn Mondragn

m
v k +1 = v k + 1 ( z k ) 2 ( z k ) cz k
(7)
considerado ste como un entrenamiento clsico
f (d k 2 d k 1 )
exp exp( f )
1 ( z k ) = 0.5 + d (u1 , u2 )
2[exp( f ) exp( f )]
(8)
2 (z k ) = 1 1 ( z k )
(9)
donde d (u1, u2) es la distancia entre dos vectores y f
es una constante positiva. Si zx es la clase 2 tenemos
que
Fig. 2. Diagrama de perceptrn difuso. f (d k 1 d k 2 )
exp exp( f )
d (u1 , u2 )
2 ( z k ) = 0.5 +
2[exp( f ) exp( f )]
(10)
, cada una de las conexiones de entrada
se conectan en el perceptrn difuso, etiquetadas con y
el grado de membresa correspondiente, segn el 1 (zk ) = 1 2 (zk )
agrupamiento A1 y A2. (11)
Considerando la normalizacin del signo, sea donde la constante f controla el rango en el cual el
entonces grado de membresa decrece a 0.5.
Si el vector zk es considerado de la clase 1 y es
y j , si 2 ( y j ) > 0.5 equidistante de los 2 prototipos, dk1 = dk2, entonces
zj = el grado de membresa para A1 es;
y j , por el contrario
(5) 1 (z k ) = 0.5 + B (12)
y sea el grupo de datos y si zk es considerado de la clase 2, el grado de
normalizados. Se puede establecer que los membresa para A2 es
agrupamientos difusos A1, A2. son linealmente (13)
separables, si existe un vector de separacin 2 (z k ) = 0.5 + B
en ambos casos
, tal que
1 e f
z j > 0,
T
j = 1,..., p (6) B=
2(e f e f ) (14)
dados A1, A2 como grupos difusos linealmente
separables en un espacio Z. La clasicacin incorrecta de un punto depende
de la clase que se desee considerar teniendo en
cuenta la siguiente condicin:
DETERMINACIN DE LOS GRADOS DE kT
MEMBRESA zk 0 ( 1 (z k ) 0 . 5 + B
El APD establece que para un grupo de vectores 1 ( z k ) 0 .5 B )
(15)
simples, cada clase difusa se encuentra etiquetada
Es necesario considerar situaciones en las cuales
como clase 1 y clase 2. Los vectores de la clase se requiere eliminar algunos puntos atpicos; en
2, tal como se muestra en la relacin (5), estn tal caso, la constante B debe ser reemplazada por
multiplicados por 1. , donde e es un margen positivo. Bajo
La regla de aprendizaje generaliza el modelo de esta consideraciones, el APD utiliza la siguiente
perceptrn clsico, de la siguiente manera: regla de entrenamiento:

50 Ingenieras, Enero-Marzo 2006, Vol. IX, No. 30


Clasicacin lineal mediante algoritmo... / Valeria Paola Gonzlez Duez, scar Leonel Chacn Mondragn

m
k + c 1 ( z k ) 2 ( z k ) z k , los datos segn el comportamiento de las variables
(I, V y Z), se tom una muestra proporcional para
[
si (v k ) T z k 0 ] el estado de falla y de oscilacin, descartando la
v k +1
= ( 1 ( z k ) 0.5 + ) situacin de pre-falla. Se seleccion una muestra
( 1 ( z k ) 0.5 + ) de 350 datos, donde 170 pertenecen al estado de falla
(16) y 180 al estado de oscilacin. Quedando para esta
vk
situacin el espacio representado por la gura 5.
Si las clases son linealmente separables, este Para cada caso, ya sea falla u oscilacin se obtuvo
procedimiento converge a la separacin de los el centro medio de cada agrupamiento, llamndolos
vectores.8 u1 y u2 respectivamente.
1 170
PRUEBA Y RESULTADOS u1 = yk
170 k =1 (17)
Los datos usados para prueba se obtuvieron 1 350
por simulacin digital de un estudio de estabilidad u2 = yk
180 k =171 (18)
para una falla trifsica de secuencia positiva
realizado con anterioridad. En ellos se representa
el comportamiento de las diferentes variables
elctricas, como la resistencia (R), reactancia (X),
corriente (I), voltaje (V), impedancia (Z) y ngulo
de desfasamiento, segn lo muestra la gura 3.
Los datos de la gura 4 no contienen un pre-
procesamiento para el ACP. Para esta muestra,
se realiz un preprocesamiento de los datos
determinndose el subespacio de los dos mayores
componentes principales, en donde se encontr el
estado de falla y oscilacin.9
Despus del pre-procesamiento, los datos se
encuentran distribuidos en cantidad no proporcional
para los 3 estados: pre-falla, falla y oscilacin de
potencia; de las 2746 observaciones, 80 sealan el
estado de pre-falla, 174 el estado de falla y 2491 el Fig. 4. Situacin de prefalla, falla y oscilacin.
estado de oscilacin. Despus de haber identicado

Fig. 5. Representacin grca de los estados de falla y


Fig. 3. Comportamiento de las variables elctricas. oscilacin.

Ingenieras, Enero-Marzo 2006, Vol. IX, No. 30 51


Clasicacin lineal mediante algoritmo... / Valeria Paola Gonzlez Duez, scar Leonel Chacn Mondragn

calculndose las distancias promedio entre los los datos de entrenamiento de falla y oscilacin
centros medios de cada agrupamiento, la funcin lineal obtenida es ,
d u1u2 = (u1 u2 ) (u1 u2 )
T
(19)
Es importante mencionar que la simulacin del
donde la cual se representa
algoritmo se realiz en Matlab. Se inicializaron los
grcamente en un perodo de 2.5 a 2.5 en las
siguientes parmetros: f = 3 de la ecuacin (14),
ordenadas, en la gura 6.
e = 0.001 para en (16), c = 0.1 y m = 3, stas
ltimas mencionadas en la relaciones (7) y (16).
Para efectuar la clasicacin, se requieren los
grados de membresa de cada agrupamiento (falla
y oscilacin), por lo que es necesario calcular las
distancias de los datos con respecto a cada uno de
los centros, mediante las siguientes expresiones:

dk1 = ( y k u1 ) T ( y k u1 )
(20)

dk 2 = ( y k u2 )T ( y k u2 )
(21)
Para realizar la clasicacin, se utilizaron
los datos de oscilacin y falla, identicndolos Fig. 6. Separacin lineal de falla y oscilacin.
previamente segn su grado de membresa. Para
realizar la clasicacin se tomaron los datos (los CONCLUSIONES
cuales son rasgos distintivos para cada situacin
La nalidad de la aplicacin del algoritmo es
diferente) y el valor asociado ,+1 o 1, oscilacin o
lograr una clasicacin correcta, o determinar
falla, respectivamente. Se realiza la normalizacin
el hiperplano que logre la discriminacin de los
del signo para obtener el dato zk de acuerdo con
datos pertenecientes a cada grupo. Cuando se haya
la ecuacin (5). Con estos datos se calculan los
encontrado una separacin lineal dentro de su fase
grados de membresa para las fallas mediante
de aprendizaje, el algoritmo termina generando
las ecuaciones (7) y (8), y para las oscilaciones
los parmetros w (gradiente) y b (umbral) del
mediante las ecuaciones (9) y (10).
hiperplano de separacin logrando as el proceso
El proceso iterativo de la regla de aprendizaje del de clasicacin. Es necesario continuar con el
estudio de los grados de membresa para los
patrones de entrenamiento, principalmente cuando
APD (16) requiere de un vector inicial , los datos no tienen muy bien denido su grado de
sugirindose la siguiente estimacin: pertenencia.

cd
w0 = BIBLIOGRAFIA
c d donde c d = u1 u2 (22) 1. Elaine Rich, Articial Intelligence, McGraw-
cT u + u2
b 0 = d cm cm = 1 Hill, 1983.
cd donde 2 (23) 2. Stuart Russell, Peter Norving, Inteligencia
Cuando se aplic el APD al total de los datos Articial. Un enfoque moderno, Prentice-Hall
(ecuacin(6)), stos fueron plenamente identicados 1996.
obteniendo una funcin lineal de separacin. Para 3. Carl G. Looney, Pattern Recognition Using

52 Ingenieras, Enero-Marzo 2006, Vol. IX, No. 30


Clasicacin lineal mediante algoritmo... / Valeria Paola Gonzlez Duez, scar Leonel Chacn Mondragn

Neural Networks. Theory and Algorithms for 7. Timothy J. Ross, Fuzzy Logic with Engineering
Engineers and Scientists, Oxford University Applications. McGraw Hill, New York, New
Press 1997. York 1995
4. R. R. Yager, R.M. Tong, H. T. Nguyen, S. 8. D. Dumitrescu, B. Lazzerini, L. C. Jain, Fuzzy
Ouchinnikov, Fuzzy Sets and Applications, Sets and Their Application to Clustering and
John Willey & Sons 1987. Training, CRC 2000.
9. V. Gonzlez. Tesis de maestra Clasicacin
5. Kevin M. Passino, Stephen Yurkovich, Fuzzy
de Fallas y Oscilaciones en un Sistema Elctrico
Control, Addison-Wesley 1998.
utilizando el Algoritmo de Perceptrn Difuso.
6. Tina A. Folger, Fuzzy Sets, Uncertainty and Divisin de Posgrado, Facultad de Ingeniera
Information,Prentice-Hall 1988. Mecnica y Elctrica, UANL 2004.

http://www.uanl.mx/publicaciones/ciencia-uanl/
rciencia@mail.uanl.mx
Tel. 01 (81) 8329 4000 Ext. 6622, Fax 6623

Ingenieras, Enero-Marzo 2006, Vol. IX, No. 30 53

You might also like