Professional Documents
Culture Documents
ResumenAbstract.-El reconocimiento facial ha tenido muchas aristas de estudio en tiempos recientes, se han usado
muchas tecnicas para lograr reconocer rostros.Esta tarea llegara
a ser muy difcil o practicamente imposible sin el uso de las
Redes Neuronales.En este paper analizaremos y profundizaremos
en el analisis de las tecnicas, metodos y algoritmos utilizados
para el reconocimiento facial con el uso de una Red Neuronal RBF(Radial Basis Function).Para esto basamos nuestra
investigacion en el desarrollo analtico de la arquitectura y el
entrenamiento de una red RBF, tambien se analiza las tecnicas
usadas para la extraccion de patrones que se utilizaran para el
ingreso de patrones hacia la Red Neuronal,tecnicas como PCA y
el mejoramiento de esta tecnica con FLD.Ademas se comparan
resultados de experimentos realizados con la tecnica PCA de
manera individual y con el mejoramiento de la misma usando
FLD.
I. I NTRODUCCI ON
En los u ltimos anos se han realizado multiples investigaciones y desarrollos en lo que respecta al reconocimiento facial,
esto se debe a la gran cantidad de aplicaciones en las que
encajara tales como: pasaportes, tarjetas de credito, control
de asistencia, y sobretodo en el tema de seguridad. En reconocimiento facial empieza a ser una tarea complicada por dos
razones: 1)El tratamiento de imagenes de grandes dimensiones
aumenta la complejidad computacional.2)La variabilidad a la
que estan sometidas estas imagenes ya que estan expuestas a
variaciones de la posicion facial, expresion facial o variaciones
en la iluminacion.[1] Para resolver los problemas expuestos
anteriormente se usa el metodo PCA(Principal Components
Analisis).En el metodo PCA las imagenes son proyectadas
sobre el valor facial y llamadas EigenFaces.El enfoque PCA
reduce la dimension de los datos por medio de metodos basicos
de compresion de datos y revela la estructura dimensional mas
eficaz de los patrones faciales.[2] Ademas de esto el metodo
PCA produce direcciones de proyeccion que maximizan la
dispersion total a traves de todas las clases, es decir, en todas
las imagenes de la cara.En la eleccion de la proyeccion, lo
que maximiza la dispersion total el PCa mantiene variaciones
no deseados causados por la iluminacion, expresion facial,
y otros factores.[3] Se puede mejorar el rendimiento de el
metodo PCA con el analisis FLD(Fisers Linear Discriminant),
el cual sirve para superar el inconveniente de no tener una
discriminacion de clases cuando se usa solamente PCA, mientras se mantiene la idea de la reduccion de dimensionalidad
significativa usada para la obtencion de la EigenFaces.[4]
II.
Zi = QT Yi , i=1,2,3,...,R (2)
Donde Yi es la imagen media-sustrada de Xi .
Con el fin de reconocer las imagenes de prueba, cada una
de estas imagenes de prueba se transforma en el espacio
Eigenface usando el ecuacion (2) y luego alimenta a las redes
neuronales RBF como entradas para la clasificacion.[3]
Determinacion de la Estructura
El numero de unidades RBF es igual a la salida, asumiendo que cada clase tiene solo una subclase.
Para cada clase k, el centro de los nodos RBF es
seleccionado como el valor medio de las muestras de
datos pertenecientes a la clase:
PN k
pk (r,i)
(3)
C k = i=1N k
En donde en la ecuacion anterior el numerador pertenece
a la i-esima muestra con dimension r perteneciente a la
clase k y N k es el numero de patrones de la clase k.
Para cualquier clase k, calculamos la distancia dk desde
la media al punto mas lejano pkf pertenecientes a la clase
k.
dk = pkf C k (4)
Para cada clase:
(a)Se calcula la distancia dc(k,j)entre la media de la clase
k, y la media de otra clase.
dc (k, j) = C k C j j = 1, 2, ..., s
j 6= k (5)
(b)Se encuentra:
dmin (k, l) = arg min (dc (k, j)) (6)
Ahora se analiza la relacion entre dmin (k, l) y dk ,dl . (7)
Si dk + dl dmin (k, l) , entonces la clase k no se
solapara sobre otras clases. Si dk + dl > dmin (k, l), la
clase k se solapara con otras clases y en este caso pueden
existir errores en la clasificacion.
Para todo el set de entrenamiento se verifica como se
realizo la clasificacion.Si dos funciones de una misma
clase se solapa, no hay problema.Si existe un error de
clasificacion grande entre dos clases se deben tomar en
cuenta una nueva division. En la figura tomada de la [5]
se muestra este concepto graficamente.
Estimacion de Pesos.
dk
(8)
Para el analisis de este metodo nos basamos en los experimentos realizados en la [3].Los datos que se utilizan
para el entrenamiento y cuando las rotaciones del rostro son
pequenas,pertenecen a una base de datos de los Laboratorios
AT&T de Cambridge.Y la base da datos usada para rotaciones
de rostro mayores son usadas de la UMIST. La tasa de
reconocimiento se define como la razon del numero total de
reconocimientos faciales correctos obtenidos con este metodo,
dividido para el numero total de imagenes para el set de
entrenamiento para un solo experimento.Asi:
Rprom =
Pq
i
i=1 ncls
qntot
(11)
p
Sensibilidad = Tp +F
(12)
N
TN
Especif icidad = TN +Fp (13)
Donde Tp es el numero total de rostros reconozidos correctamente, FN es el numero de rostros que se reconocieron incorrectamente como intrusos. TN es el numero de rostros de otras
clases que se reconocieron correctamente como intrusos,y Fp
es el numero de rostros reconozidos falsamente como propios
de una clase.
IV-A.
Pn
Donde X = n1 i=1 Xi es es la imagen media del conjunto,que se haba tambien definido anteriormente, y X i =
Pni
1
i
j=1 Xj es la imagen media de la i-esima clase y c es
ni
el numero de clases. El subespacio optimo Eopt ,determinado
por FLD esta dado como,X
|E t Sb E |
Eopt = argmax |E t SW E| = [e1 , e2 , e3 , ..., ec1 ]
Donde [e1 , e2 , e3 , ..., ec1 ] es el conjunto de eigenvectores
generalizados de SB y SW correspondientes a los mayores
eigenvalores generalizados i = 1, 2, 3, ..., c 1.
SB Ei = i Ei SW
i = 1, 2, ...c 1 (17)
El PCA no proporciona ninguna informacion para la discrimincaion de clases, sino que solamente produce una reduccion
de dimensionalidad. Por consiguiente, FLD se aplica a la
proyeccion del conjunto de muestras del entrenamiento en el Figura8 .Diagrama esquematico RBF, usando el metodo propuesto
espacio Eigenface X. Donde:
VI. R ESULTADOS E XPERIMENTALES O BTENIDOS CON
X = (X1 , X2 , ...., Xn ) RRxn (14)
PCA Y FLD.
Este enfoque encuentra un subespacio o ptimo para la clasificaLos resultados que se muestran a continuacion son tomados
cion en que la relacion de la dispersion entre clase y dispersion
de
la [4], la cual realiza experimentos para el reconocimiento
dentro de la clase se maximiza.La matriz de dispersion entre
facial
utilizando el enfoque propuesto en el punto anterior. Se
clase se define como:
utiliza una base de datos de imagenes de la universidad YALE.
T
Pn
(15)
SB = i=1 ni Xi X Xi X
La precision obtenida en este experimento es comparada con
Y la matriz de dispersion dentro de la clase se define como: los resultados obtenidos por el clasificador de vecinos mas
cercanos que se basan en la distancia Euclidiana.
T
Pn
(16)
En la siguiente figura se muestra las imagenes de la base de
SW = i=1 Xk X Xk X
datos YALE.
Los experimentos se realizaron con 6 imagenes de entrenamiento y 8 imagenes de prueba para cada persona de la base de
datos de la Universidad de Yale.La tasa de verificacion correcta
promedio es de aproximadamente 80.9 % solo utilizando los
Eigenfaces usando la distancia. La tasa de rechazo es de 5,3 %.
Mejores resultados se lograron cuando la aplicacion de PCA +
FLD en la red RBF. La tasa de reconocimiento es de 92 % y la
tasa de rechazo es de 4,2 %. La mejora se debe principalmente
a la capacidad de aprendizaje de la red neuronal RBF. Ademas
de alta precision de reconocimiento, el metodo propuesto es
eficiente en el calculo. La identificacion de una imagen facial
toma menos de un segundo (se espera que el algoritmo para
funcionar incluso mas rapido despues de la optimizacion de
codigo). El enfoque Eigenface, o solo con el uso de PCA para
el mismo problema lleva mucho mas tiempo que el metodo
propuesto.[4]
VII.
C ONCLUSIONES