You are on page 1of 23

UNIVERSIDAD DE SALAMANCA MASTER DE GEOTECNOLOGAS CARTOGRFICAS EN INGENIERA Y ARQUITECTURA

2. PROCESAMIENTO DE IMGENES

Diego Gonzlez Aguilera Departamento de Ingeniera Cartogrfica y del Terreno Escuela Politcnica Superior de vila

INDICE

2.1 Realce y mejora de la imagen 2.2 Extraccin de caractersticas

Tema 2: Procesamiento de imgenes


El procesamiento de imgenes tiene que ver con la adquisicin, transmisin, procesamiento y representacin de las imgenes. Las tcnicas de proceso de imgenes se utilizan para mejorar la apariencia visual de las imgenes para un observador y para preparar convenientemente el contenido fotogrfico de cara a la percepcin por parte de mquinas. El proceso digital de imgenes se puede dividir en las siguientes reas: Adquisicin o captura que se ocupa de los diferentes caminos para la obtencin de imgenes; por ejemplo, utilizando cmaras digitales o digitalizando imgenes analgicas (fotografas). Realce y mejora son las tcnicas que se usan para mejorar la apariencia visual de las imgenes para recuperar o restaurar las imgenes degradadas. Segmentacin que se ocupa de la divisin de las imgenes en regiones o reas significativas. Extraccin de caractersticas que se ocupa de la deteccin y localizacin de entidades geomtricas simples y complejas. Desde entidades simples como lneas y puntos hasta geometras complejas como curvas y cudricas. El propsito de este tema es presentar los aspectos relevantes del procesamiento de imgenes, centrndose en torno a las herramientas y procesos del Realce y Mejora y la Extraccin de caractersticas.

2.1 Realce y mejora de la imagen


El propsito de las tcnicas de realce de la imagen es mejorar la apariencia de la misma para el observador. Es un proceso subjetivo, realizado habitualmente de una forma interactiva. La seleccin de los mtodos apropiados y la eleccin de los parmetros adecuados dependen de la calidad de la imagen original y de la aplicacin. Existe una gran cantidad de transformaciones u operaciones que se pueden realizar sobre las imgenes con el propsito de realzarlas y mejorarlas. Existen varios criterios para clasificar estas operaciones. Frecuentemente se dividen en cuatro categoras: Transformaciones puntuales: El resultado de una operacin puntual depende slo del nivel de gris de entrada de un punto. Las operaciones tpicas puntuales incluyen la manipulacin de los pxeles, por ejemplo la binarizacin, la umbralizacin, etc. Transformaciones locales: Aqu, los valores de entrada de varios pxeles vecinos contribuyen al resultado del pxel de salida. Muchas operaciones son locales, por ejemplo, suavizado (media o promedio), extraccin de caractersticas y realce de bordes. Transformaciones globales: El total de datos de la imagen como valor de entrada contribuye al resultado de salida. Las operaciones globales se realizan a menudo en el dominio de la frecuencia. Un ejemplo es la compresin de imgenes que tomando el total de una imagen entrada obtiene una imagen comprimida de salida.

Transformaciones geomtricas: El resultado de una transformacin geomtrica depende de las diferentes posiciones de los niveles de gris en la imagen de entrada. Ejemplos tpicos son rotacin, traslacin, cambios de escala y rectificacin, aunque sta ltima tambin incluye transformaciones radiomtricas de los pxeles. Otro criterio de clasificacin, del realce y la mejora de la imagen, tiene como base las aplicaciones que se van a efectuar. Este sistema de clasificacin propone las tres categoras siguientes: Suavizado: Incluye tcnicas que proporcionan una apariencia ms suave de la imagen, por ejemplo eliminando el ruido suprimiendo detalles. Definicin: El propsito es remarcar las caractersticas de algunos objetos de la imagen, hacindolas ms ntidas, por ejemplo los bordes. Correccin de efectos: Estas operaciones tratan de conseguir la correccin de los defectos de la imagen, por ejemplo eliminar ruido y errores groseros en los niveles de gris.

Operadores de suavizado o correccin


Los operadores de suavizado se utilizan para eliminar o rehuir ruido. Por ejemplo, si el ruido de una imagen es un fenmeno de alta frecuencia se puede reducir con filtros de paso bajo. Describiremos a continuacin los siguientes:

g ( x, y ) =

2 2 2 1 e ( x + y ) / 2 2 2

G ( , v) = e (

+ v 2 ) / 2 2

Operadores de realce
Para algunas aplicaciones es conveniente realzar pequeos detalles, que son componentes de alta frecuencia, de una imagen. Un ejemplo tpico es el resalte o subrayado de los bordes, para dotarles de mejor nitidez. Operador Gradiente. El gradiente de una funcin continua f(x,y) es un vector y su magnitud expresa el ratio de cambio por unidad de distancia en la direccin del vector. El objetivo de los operadores gradiente es detectar cambios en los niveles de gris que tienen lugar en zonas o regiones reducidas. El gradiente y la magnitud se expresan por:

grad [ f ( x, y )] = [f / x, f / y ]

T 1/ 2

f x
f y

f 2 f 2 grad [ f ( x, y )] = + x y

A la magnitud del gradiente se la conoce como fuerza del borde y junto con la orientacin del gradiente constituyen datos cruciales en la extraccin de este tipo de caractersticas. Sustituyendo las diferencias obtenidas en la ecuacin anterior por las derivadas se obtiene el gradiente de la imagen:

grad [ f ( x, y )] = ( f ( x + 1, y ) f ( x, y )) 2 + ( f ( x, y + 1) f ( x, y )) 2
En algunas ocasiones se aproxima por:

1/ 2

grad [ f ( x, y )] f ( x + 1, y ) f ( x, y ) + f ( x, y + 1) f ( x, y )
Es de notar que el gradiente de imagen o gradiente a secas es un escalar, la magnitud del vector gradiente. De lo anterior se deduce que la ventana del operador gradiente se define por:

0 1 0 Gx = 0 0 1 0 0 0

0 0

Gy = 1 1 0 0 0 0

Las transformaciones basadas en diferencias entre vecinos son muy sensibles al ruido. Para reducir este efecto se han propuesto diferentes ventanas. Se presentan a continuacin algunas de las ms populares.
Mtodos basados en la primera derivada: Operador Gradiente. Constituyen los mtodos con ms proliferacin dentro de la Comunidad del Anlisis de Imagen y la Visin Computacional. Se fundamentan en que un borde existe s hay una discontinuidad en la funcin de intensidad de la imagen, es decir, si la derivada de los valores de intensidad de la imagen es un mximo. Operadores Gradiente Roberts
0 0 0 0 0 1 0 1 0

Ventajas - Buena respuesta en bordes horizontales y verticales. - Buena localizacin. - Simpleza y rapidez de clculo.

Desventajas - Mala respuesta en bordes diagonales. - Sensible al ruido. - Empleo de mscaras pequeas. - No da informacin acerca de la orientacin del borde. - Anchura del borde de varios pxeles. - Mala respuesta en bordes diagonales. - Lentitud de clculo. - No da informacin acerca de la orientacin del borde. - Anchura del borde de varios pxeles. - Mala respuesta en bordes diagonales. - Lentitud de clculo. - Anchura del borde de varios pxeles.

1 0 0 0 1 0 0 0 0

Sobel
1 0 1 1 2 0 2 4 1 0 1

1 2 1 1 0 0 0 4 1 2 1

- Buena respuesta en bordes horizontales y verticales. - Diversidad de tamaos en las mscaras. - Poco sensible al ruido. - Buena respuesta en bordes horizontales y verticales. - Poco sensible al ruido. - Proporciona la magnitud y direccin del borde.

Prewitt
1 0 1 1 1 0 1 3 1 0 1 1 1 1 1 0 0 0 3 1 1 1

Desventajas genricas de la deteccin de bordes basada en el Gradiente - La fijacin por parte del usuario de los umbrales y el tamao de la mscara, afectar a la posicin del borde. - El gradiente presenta una excesiva dependencia con respecto a la direccin de barrido, por ello, las aristas cuyas pendientes estn prximas a la direccin de barrido no se detectan fcilmente. - La debilidad del Gradiente en los puntos esquina provocar la prdida de puntos relevantes y marcado de junturas.

Operador Laplaciano. Los distintos operadores presentados hasta ahora son operadores de primeras derivadas (gradiente), y por ello dependen de la direccin. Para detectar discontinuidades en todas las direcciones, se deben utilizar diferentes mscaras. Por ejemplo, el operador gradiente tiene dos mscaras y detecta discontinuidades en filas columnas. En algunas aplicaciones es recomendable utilizar un operador que sea independiente de la

orientacin. Uno de ellos es el operador de Laplace Laplaciano. Para una funcin continua f(x,y) se define por:

2 =

2 f ( x , y ) 2 f ( x, y ) + x 2 y 2

Para una funcin discreta se obtiene tomando las segundas derivadas en filas y columnas. Es decir se hacen las diferencias de los gradiente tal y como se indica:

2 x = [ f ( x + 1, y ) f ( x, y )] [ f ( x, y ) f ( x 1, y )] = f ( x + 1, y ) 2 f ( x, y ) + f ( x 1, y )

2 y = [ f ( x, y + 1) f ( x, y )] [ f ( x, y ) f ( x, y 1)] = f ( x, y + 1) 2 f ( x, y ) + f ( x, y 1)

Sumando los componentes de las dos ecuaciones se obtiene el Laplaciano


0 0 1 1 0 0

L= 1 4 1

Puesto que el Laplaciano es un operador de segundas derivadas, es mucho ms sensible al ruido que los operadores antes citados. Al igual que con el operador Gradiente existen multitud de ventanas correspondientes a operadores Laplacianos, se describen a continuacin las ms populares:
Mtodos basados en la segunda derivada: Operador Laplaciano. Constituyen operadores ideales para detectar bordes independientemente de la orientacin o direccin de los mismos. Se fundamentan en que cuando la imagen presenta un cambio de intensidades a lo largo de una determinada direccin, existir un mximo en la primera derivada a lo largo de dicha direccin y un paso por cero en la segunda derivada. Operadores Laplacianos
0 1 0 1 4 1 0 1 0
1 1 1 1 8 1 1 1 1

0 1 0 1 1 4 1 4 0 1 0
2 1 2 1 1 4 1 3 2 1 2

1 1 1 1 1 8 1 4 1 1 1
2 1 2 1 1 4 1 3 2 1 2

- Buena localizacin siempre que las aristas estn bien separadas y la relacin sealruido sea alta. - Anchuras de bordes ptimas. - Independiente de la orientacin del borde: buena respuesta en bordes horizontales, verticales y diagonales.

- Sensible al ruido. - Fiabilidad baja, pudiendo aparecer como identificados falsos bordes.

La siguiente figura ilustra la representacin matemtica de ambas funciones (Gradiente y Laplaciana) aplicadas a una funcin imagen.

Finalmente acabaremos el apartado destinado a los operadores de realce especificando algunos mtodos ms complejos como los operadores DroG y LoG.
Mtodos complejos: Operadores DroG (Derivada de la gaussiana). Operadores resultantes de combinar suavizado y gradiente. El grado de suavizado vendr controlado por el parmetro de la desviacin tpica de la gaussiana. Mientras que el gradiente depender de la mscara aplicada. Para aplicar el operador DroG se realizar la convolucin entre la primera derivada de la funcin imagen con la gaussiana, o bien la funcin imagen con la primera derivada de la gaussiana. Mtodos complejos: Operadores LoG (Derivada de la laplaciana). Operadores resultantes de combinar suavizado y lapalaciano. Para aplicar el operador LoG se realizar la convolucin entre la segunda derivada de la funcin imagen con la gaussiana, o bien la funcin imagen con la segunda derivada de la gaussiana.

Transformaciones geomtricas
A diferencia de las operaciones descritas hasta ahora, las transformaciones geomtricas cambian la teselacin. La imagen resultante difiere en tamao y quizs en forma con respecto a la original. Existen varios modelos matemticos que establecen las relaciones geomtricas entre las imgenes. Una transformacin genrica puede expresarse como:

x' = S R x + t
donde x es el vector de la imagen de entrada, x el vector correspondiente de la imagen transformada, S un factor de escala, R una matriz de rotacin (no necesariamente ortogonal) y t el vector de la translacin. Giro de una imagen. Traslacin de una imagen Escalado de una imagen

F ' = F cos + Csen C ' = C cos + Fsen

F ' = F + y C ' = C + x

F ' = F y C ' = C x

Remuestreo (interpolacin radiomtrica)


La mayora de las transformaciones geomtricas dan lugar a pxeles que no coinciden con la posicin de los de la imagen original. El problema es asignar el nivel adecuado de gris existente en la imagen original o interpolando a partir de los pxeles vecinos. Existen varias alternativas:

Vecino ms prximo. Este mtodo consiste en asignar el nivel digital de un pxel de la imagen transformada a un pxel de la imagen corregida cuyo centro geomtrico est ms cercano a su homlogo en la imagen transformada. Para ello se calculan las distancias entre el centro del pxel de la imagen corregida de coordenadas (m,n), y los centros de los cuatro pxeles ms cercanos en la imagen transformada, tomando el nivel digital correspondiente a aquel pxel que proporcione la menor distancia.
(x+1,y) (x,y) (m,n)

(x,y+1)

(x+1,y+1 )

Las ventajas de este mtodo son: No se altera el valor del nivel de gris de la imagen original. Es el ms rpido de los 3 mtodos. nico mtodo utilizable en la correccin de imgenes con informacin cualitativa o temtica. Se emplea en los cambios de escala con magnificacin (Zoom).

Como inconveniente presenta el denominado efecto escalera (stair stepped), distorsin que se manifiesta en los elementos lineales de la imagen, presentando stos un aspecto quebrado.

Interpolacin Bilineal. En este mtodo se consideran los niveles de gris de los cuatro pxeles ms cercanos en la imagen transformada al pxel de la imagen corregida.
En la siguiente Figura se han dibujado tan slo los centros de los pxeles. El punto P(m,n) es el centro del pxel de la imagen corregida, los puntos 1, 2, 3 y 4 son los cuatro pxeles ms cercanos. x e y son las diferencias entre los puntos P y 1 en x e y respectivamente, y se han de tomar en valor absoluto. D indica el ancho y alto de la celda, suponiendo pxeles cuadrados. Los puntos A y B son puntos con la misma ordenada que P, perteneciendo A a la recta que une los puntos 1 y 3, y B a la que une los puntos 2 y 3. Este procedimiento de interpolacin est basado en una doble interpolacin lineal. Se aplica una interpolacin lineal en la alineacin 1-3 para calcular el nivel de gris en el punto A (NDA).
1 2 ND3
ND A

y
A

ND3 ND1 = y + ND1 D

P(m,n)

NDA ND1
NDB

ND4 ND2 = y + ND2 D

3 D

Y1

YA D

Y3

Este mtodo de interpolacin produce resultados ms suavizados y precisiones espaciales mayores que el del Vecino Ms Prximo. Tiene los inconvenientes de suavizar tambin los bordes y de que los valores extremos de los niveles de gris no permanecen en la imagen.
ND2 ND1 NDP NDA ND4 ND3 NDB

Convolucin Cbica. Tiene el mismo fundamento que el mtodo anterior, pero en este caso se consideran los diecisis pxeles ms cercanos en la imagen transformada al pxel de la imagen corregida al cual queremos asignar el valor de nivel digital. El algoritmo interpola linealmente cada grupo de lneas en el sentido de las abcisas y obtiene cuatro valores: f(m-1), f(m), f(m+1), f(m+2); luego toma esos cuatro valores resultantes e interpola linealmente en el sentido de las ordenadas resultando f(m,n). Se puede apreciar en la figura siguiente una representacin en perspectiva del procedimiento de interpolacin. La tercera dimensin la proporciona el valor del nivel digital, y se observa los cuatro valores interpolados para cada fila. El valor digital que se asigna a la celda en la imagen corregida es el de trazo ms grueso.

f(m-1) f(m,n) f(m) f(m+1) f(m+2

)
Este mtodo presenta la ventaja de introducir un suavizado de la imagen menos fuerte que con la Interpolacin Bilineal, pero presenta el inconveniente de necesitar mayor tiempo para su aplicacin.

2.2 Extraccin de caractersticas


La extraccin de informacin de las imgenes Information from imagery a travs del procesamiento digital constituye hoy en da un inmenso campo de estudio e investigacin en diversas disciplinas con mltiples aplicaciones. En este sentido, fotogrametristas, matemticos, fsicos, informticos y dems, continan investigando en cuestiones que van desde la aplicacin de simples filtros lineales hasta la automatizacin del reconocimiento semntico de objetos. No obstante, ha sido la disciplina de la Visin Computacional donde se han conseguido los mayores logros, de hecho la deteccin automtica de caractersticas sobre imgenes tiene aqu una dilatada tradicin y cuenta multitud de mtodos para tal propsito. Desafortunadamente, a pesar de la gran proliferacin de mtodos, no existe un mtodo universal para la deteccin

10

automtica de caractersticas, sino que sern los requerimientos del propio problema los que nos obligarn a desarrollar y personalizar nuestro mtodo. Una imagen contiene una gran cantidad de datos la mayora de los cuales proporciona muy poca informacin para interpretar la escena. Un sistema que incorpore visin artificial debe, en un primer paso, extraer de la forma ms eficaz y robusta posible determinadas caractersticas que nos proporcionen la mxima informacin posible. Estas caractersticas deben cumplir, entre otras, las siguientes condiciones: Su extraccin a partir de la imagen no debe suponer un coste excesivo al sistema en el cual est integrado. El tiempo total de extraccin debe ser lo ms pequeo posible. Su localizacin debe ser muy precisa. El error cometido en la estimacin de las caractersticas tambin debe ser lo ms pequeo posible. Deben ser robustas y estables. Deberan permanecer a lo largo de una secuencia. Contendrn la mxima informacin posible de la escena, es decir, debemos ser capaces de extraer informacin de tipo geomtrico a partir de ellas.

A continuacin analizaremos la extraccin de caractersticas ms importantes en el anlisis de imagen: los puntos, las lneas y los crculos como geometras bsicas en la extraccin de caractersticas.

Extraccin de puntos
Desde el punto de vista computacional se han propuesto dos enfoques para la deteccin de este tipo de caractersticas geomtricas: Mtodos que obtienen los puntos como interseccin de aristas o como cambio de pendiente sustancial entre dos aristas y por tanto vienen precedidos de una extraccin de bordes. Mtodos que trabajan directamente sobre imgenes de gris, es decir, y no requieren una extraccin previa de aristas.

A continuacin se comentan algunos de estos mtodos empleados para la extraccin de puntos caractersticos, especialmente puntos de fuga y puntos esquina. Puntos caractersticos a partir de aristas: puntos de fuga. Los puntos de fuga constituyen el soporte estructural y geomtrico de una imagen en perspectiva u oblicua. En este sentido representan puntos de inters que vendrn determinados por la interseccin de aristas o lneas de fuga. A continuacin se comentan brevemente los dos mtodos ms sencillos para su clculo: Mtodo de la interseccin de rectas. Se trata del mtodo ms sencillo de todos, ya que su clculo computacional se limita a determinar la interseccin de dos rectas perspectivas.

11

A partir de la figura anterior, en el que una recta queda identificada geomtricamente mediante su distancia al origen y el ngulo que dicha recta forma con los ejes cartesianos se obtiene la expresin de la misma y sus versiones lineales:

Ecuacin punto pendiente y = ax + b

Ecuacin normal Ax + By + 1 = 0

con valores (a, 1, b) para los coeficientes de la X, de la Y y del trmino independiente, respectivamente con valores (A, B, 1) para los mismos trminos. La resolucin matemtica del problema pasa por el planteamiento y resolucin del siguiente sistema de ecuaciones:

[ a 1]

x =b y

[A

x B] = [ 1] y

siendo x,y las coordenadas del punto de fuga a calcular. Mtodo de la minimizacin del rea del tringulo. El mtodo consiste en el clculo y minimizacin de la superficie de los tringulos formados por cada uno de los segmentos extrados y por el punto de fuga, como vrtice opuesto de cada tringulo y comn a todos ellos. El rea de cada tringulo (S) se calcula a travs del determinante formado por las coordenadas de los dos puntos extremos de la lnea de fuga (P1, P2) y las coordenadas del punto de fuga (PF).

Si =

x1 1 x2 2 x0

y1 1 y2 1 = 0 y0 1 i

= Mnimo

Si

=0 x Si =0 y

En general, la eficiencia de estos mtodos dependen directamente de la calidad del mtodo empleado para la obtencin de aristas: si este ltimo no localiza correctamente los puntos de arista difcilmente podremos detectar puntos de fuga de forma exacta. Adems se aade un tiempo extra de procesamiento previo de las aristas.

12

Desarrollando este determinante se establece el sistema de observacin siguiente:

0 = x i1 y i 2 x i1 y 0 x i 2 y i1 + x i 2 y 0 + x 0 y i1 x 0 y i 2 x 0 ( y i1 y i 2 ) + y 0 ( x i 2 x i1 ) + x i1 y i 2 y i1 x i 2

[ y1 y 2

x x 2 x1 ]i 0 [ y1 x 2 x1 y 2 ]i = [S ]i y0

donde cada lnea aade al sistema una ecuacin. Al ser dos las incgnitas, coordenadas del punto de fuga (x0, y0), se necesitan al menos dos lneas, tres si queremos hacer un ajuste por mnimos cuadrados. En este caso, tratamos de hacer mnima la suma de las reas al cuadrado de los distintos tringulos (Si) con el objetivo de obtener las coordenadas de los puntos de fuga. Puntos caractersticos a partir de la propia imagen: puntos esquina. Existen otros mtodos que obtienen los puntos de mxima curvatura de una imagen utilizando directamente los valores de la imagen, sin realizar el paso previo de obtencin de aristas. Estos mtodos definen una medida que suelen denominar de esquinidad la cual se calcula para todos los puntos de la imagen. Cuando esta medida supera un cierto umbral se considera que el punto es una esquina. La mayora de estos mtodos utilizan operadores diferenciales. Uno de los primeros mtodos para la obtencin de puntos caractersticos se describe en (Moravec, 1977). Dada una ventana rectangular, este operador calcula el valor de cambio de la intensidad de la imagen cuando desplazamos ligeramente esta ventana. Una esquina viene caracterizada por elevados cambios de intensidad. Es altamente sensible a ruido. El detector establece sumas cuadrticas de las diferencias de los niveles de grises en las cuatro direcciones principales (horizontal, vertical y dos diagonales), y asigna al pxel central el mnimo M de los cuatro valores calculados. M = mnimo {V1,V2,V3,V4} siendo: V1=(gi,j-gi,j+1)2 V2=(gi,j-gi+1,j)2 V3=(gi,j-gi+1,j+1)2 V4=(gi,j-gi+1,j-1)2

moravec(i, j ) =

( x , y )N ( i , j )

min (var( x, y ))

V1

(x,y)

En (Beaudet, 1978) se propone un operador que calcula el determinante de una matriz y queda definido como: DET = IxxIyy-Ixy2 donde Ixy es la derivada parcial de la imagen con respecto al eje x y despus con respecto al eje y, y Ixx y Iyy es la segunda derivada con respecto a x e y, respectivamente. Este operador presenta ciertas caractersticas de curvatura interesantes. Las esquinas se obtienen aplicando este operador y realizando una umbralizacin. En un posterior trabajo (Deriche y Giraudon, 1993) se ampla este mtodo incorporando conocimiento de arista y multiresolucin y se realiza un estudio analtico del modelo de esquina. Posteriormente, en (Harris y Stephens, 1988) se contina investigando sobre las propiedades del determinante antes mencionado. En este ltimo

13

trabajo se presenta un nuevo mtodo de deteccin de puntos caractersticos que presenta robustez frente al ruido. La definicin de este mtodo se realiza de manera similar al operador de Moravec, pero calculando las derivadas de primer orden de la imagen. La localizacin de los puntos no es del todo exacta. En (Kitchen y Rosenfeld, 1982) se presentan tres mtodos que obtienen esquinas y que, de manera esquemtica, se detallan a continuacin: 1. Uso del producto del gradiente de intensidad y del gradiente de la direccin en un punto de la imagen como una medida de esquinidad. 2. Uso de la diferencia entre las direcciones de gradiente de puntos vecinos, los cuales son perpendiculares a la direccin gradiente del punto, como una medida de esquinidad. 3. En una vecindad 3 3 localizar 2 puntos A y B con valor de gris similar al punto C bajo consideracin. La diferencia en la direccin entre los vectores CA y CB es una medida de esquinidad. Una vez aplicada esta medida realizan una supresin de falsos candidatos para quedarse con un nico punto en la vecindad. Un enfoque similar se sigue en (Zuniga y Haralick, 1983) donde se detectan esquinas en aquellos puntos donde se producen cambios significativos de gradiente a lo largo de las aristas. En los trabajos de (Koenderink y Richards, 1988), (Mehrota y Nichani,1990) y (Dreschler y Nagel, 1982) se definen operadores de clculo de curvatura sobre una determinada vecindad haciendo uso de derivadas de primer, segundo y tercer orden de alguna funcin Gaussiana. En (Rangarajan et al., 1989) utilizan 12 mscaras distintas para detectar distintas clases de esquinas. Hacen uso de un detector de aristas para eliminar falsos candidatos. En (Vasselle et al., 1994) se introduce el concepto de espacio escala y determina la localizacin de esquinas estudiando las caractersticas de stas en dicho espacio. En (lvarez y Morales, 1997) tambin se basan en el concepto de espacio escala para determinar la localizacin de una esquina. Por ltimo, el enfoque de SUSAN (Smith y Brady, 1997) proporciona un mtodo rpido, robusto frente al ruido (no utiliza derivadas de la imagen) y la localizacin de los puntos caractersticos presenta buenos resultados. Los puntos esquina son caractersticas de la imagen en las que la variacin de la funcin intensidad f(x,y) es alta en ambas direcciones X e Y.

X Y
De los diferentes detectores de puntos esquina que existen, describiremos a continuacin en detalle el detector de Haralick. Este detector de puntos esquina mantiene grandes semejanzas con el Operador de Frstner, muy popular en el campo de la Fotogrametra.

Detector de puntos esquinas de Haralick. El detector de esquinas que a continuacin se presenta en detalle se corresponde con el desarrollado por Haralick en 1993 (Haralick, 1993). Este detector de esquinas selecciona en primer lugar una ventana de inters y despus calcula de manera ms precisa la posicin de los puntos dentro de la ventana seleccionada.
Los diferentes pasos del detector de Haralick son:

14

Seleccin del tamao de la mscara por parte del usuario (5x5, 7x7) Clculo de las derivadas de la imagen usando el operador gradiente para cada fila y columna (r,c):
f r (r , c) : gradiente horizontal f c (r , c) : gradiente vertical

Habitualmente el operador gradiente utilizado es el operador de Sobel. Determinacin de la matriz normal para cada ventana segn el tamao elegido para la mscara del operador:
2 af r (r , c) ven tan N = f (r , c) f c (r , c) ven tan a r

ven tan a

(r , c) f c (r , c) 2 afc (r , c) ven tan


r

Calculo del peso (w) y circularidad (q) de cada ventana.


w(r , c) = det( N )

El peso w se puede considerar como una funcin proporcional al contraste existente en la ventana; cuanto mayor sea, mejor definido estar el punto. El peso w es tambin conocido como Beaudet measure for cornerness y es proporcional a la variacin del gradiente dentro de la ventana. Ser alto en aquella ventanas donde la variacin del gradiente es importante (puntos potenciales de inters).
2 4 det( N ) = 1 1 q (r , c) = 2 + tr ( N ) 2 1
2

donde 1 2 son los valores propios de la matriz normal N, q representa la circularidad de la elipse asociada a la matriz normal N. Este valor es proporcional al ratio del cociente entre el eje menor/eje mayor de la elipse; ser alto si los dos ejes tienen el mismo tamao (1 si son iguales) y menos en otros casos. La circularidad es usada para rechazar puntos localizados en bordes. En esta situacin, la elipse tiene su eje mayor en la direccin del borde y q es menor de 1. Umbralizacin. La umbralizacin es llevada a cabo siguiendo la regla:
w(r , c) w* ( r , c ) = 0 s w(r , c) > wmin y q (r , c) > qmin en otros casos

Supresin no mxima de peso (w*) dentro de la ventana especificada por el usuario.

Para poder seleccionar la ventana de inters, el algoritmo necesita conocer los siguientes parmetros: El operador gradiente, aqu el operador de Sobel ser el elegido: El tamao de la ventana del operador ser de 5x5 pxeles. El umbral para la circularidad ser qmin de 0.9.

15

El nmero mximo de puntos esquina a detectar. Este valor es usado para calcular la vecindad para localizar extremos locales. El mnimo peso wmin es calculado dinmicamente, usando la desviacin estndar de todos los pesos. Las esquinas son ordenadas usando sus pesos y un mximo nmero de esquinas es devuelto de acuerdo con esta orden.

En un segundo paso, el algoritmo encuentra el punto esquina ms probable dentro de la ventana de inters. Esto es relativamente simple: el punto es determinado como el centro de gravedad ponderado de todos los puntos dentro de la ventana con el producto del gradiente de filas y columnas como peso. Las coordenadas (x,y) del punto esquina dentro de la ventana de inters sern calculadas como:
x=
ven tan a

( f (r , c) f (r , c) c) f (r , c) f (r , c)
r c r c ven tan a

y=

ven tan a

( f (r , c) f (r , c) r ) f (r , c) f (r , c)
r c r c ven tan a

Extraccin de lneas
Los mtodos de gradiente y laplaciano vistos hasta ahora no proporcionan por si solos una solucin de calidad para la extraccin de lneas, de ah que tengamos que recurrir a estrategias ms complejas. A continuacin, se describen tres metodologas para la extraccin automtica de lneas: Canny + Burns RANSAC + MMCC Transformada de Hough

Canny & Burns. Extraccin de lneas siguiendo un proceso multifase jerrquico que se basa en la extraccin de bordes mediante el algoritmo de Canny y en la segmentacin posterior de dichos bordes mediante el algoritmo de Burns. Deteccin de bordes: Filtro de Canny. El detector de bordes de Canny (Canny, 1986) resulta el ms idneo para la deteccin de bordes en imgenes donde existe la presencia de geometras regulares, ya que mantiene tres criterios vitales para nuestros propsitos: Precisin en la localizacin del contorno, garantizando la mayor proximidad de los bordes detectados a los bordes verdaderos. Fiabilidad en la deteccin de los puntos de contorno, minimizando la probabilidad de deteccin de falsos bordes causados por el ruido, as como tambin la prdida de bordes reales. Unicidad en la obtencin de un nico borde para el contorno, garantizando bordes con una achura mxima de un pxel.

Bsicamente, el filtro de deteccin de bordes de Canny consiste en un proceso multifase, en el que el usuario deber introducir tres parmetros bsicos: una desviacin estndar y dos valores umbral. El resultado ser una imagen binaria, en la que aparecern en negro los pxeles correspondientes a los bordes y en blanco el resto de pxeles.
16

A continuacin se pasan a describir cada una de las fases que intervienen en la aplicacin del filtro de Canny: Fase 1: Suavizacin de la imagen. En primer lugar, la imagen original es suavizada mediante la convolucin con una funcin gaussiana de anchura especificada por el usuario con el objetivo de atenuar posibles ruidos de la imagen. La desviacin estndar considerada como parmetro de entrada en el filtro de Canny definir el tamao o anchura de la mscara gaussiana. Fase 2: Realce de la imagen. La imagen suavizada en la primera fase es convolucionada mediante un operador gradiente en las direcciones de los ejes X e Y, de forma que obtengamos una imagen con los cambios de intensidad detectados sobre la que calcular los componentes del borde relativos a la fuerza y orientacin de la normal al borde. La fuerza del borde nos proporcionar una medida del contraste local de la imagen, mientras que la orientacin del borde nos identificar la direccin perpendicular al borde en forma de vector unitario. Fase 3: Eliminacin de los no mximos. Sobre la imagen realzada con los cambios de intensidad de la fase anterior, encontraremos la direccin que mejor se aproxima a la direccin normal al borde. Si la fuerza del borde es menor que al menos uno de los dos vecinos a lo largo de esa direccin suprimiremos el punto como punto perteneciente a un borde. El resultado es una imagen con los bordes adelgazados como consecuencia de la supresin. Fase 4: Umbralizacin de bordes. La asignacin del umbral es quizs la fase ms delicada del filtro de Canny, ya que deberemos evitar la posible presencia de bordes ruidosos. La mayora de los detectores de bordes emplean un simple umbral, ocasionando la particin de las lneas siempre que los valores flucten arriba y abajo del valor umbral. La umbralizacin empleada por el operador de Canny es conocida como Histresis y consiste en la aplicacin de dos posibles umbrales, de forma que, dado un segmento lineal, si un valor permanece por encima del umbral superior ser inmediatamente aceptado, mientras que si el valor permanece por debajo ser rechazado. Los puntos que permanezcan entre los dos lmites sern aceptados si pueden ser conectados con pxeles vecinos. De esta forma la posibilidad de particin del borde ser reducida drsticamente, debiendo fluctuar por encima y por debajo del borde para que se produzca la rotura. Segmentacin de bordes: Burns. Los segmentos de una imagen constituyen una de las caractersticas geomtricas ms relevantes del procesamiento digital ya que suponen la base para una interpretacin 3D de la escena. No obstante, el proceso de segmentacin no resulta obvio; la presencia de ruido y la propia distorsin radial de la imagen complicarn su ejecucin. Implementar una segmentacin de calidad demandar de forma implcita extraer como extremos del segmento aquellos puntos que mejor definen la lnea que se ajusta al borde. Para ello, el proceso de segmentacin que se ha desarrollado presenta de nuevo una estructura multifase, encadenando una serie de operaciones con el objetivo de obtener un conjunto de segmentos (1D) definidos por sus coordenadas extremas. El tiempo de procesamiento de la fase de segmentacin depender linealmente del nmero de pxeles detectados como bordes en la fase anterior, de ah que resulte vital la eleccin que se haya hecho de los tres parmetros bsicos del filtro de Canny. La fase de segmentacin comienza con un barrido de la imagen de bordes en sentido lexicogrfico (de arriba abajo y de izquierda a derecha), en busca de pxeles candidatos de ser etiquetados como pxeles pertenecientes a un mismo grupo. La idea bsica, consiste en etiquetar cada pxel de borde en grupos que soporten segmentos basndose en la similitud de las orientaciones del gradiente, este paso guarda cierta semejanza con el mtodo de Burns (Burns, 1986). De esta forma, cada pxel de borde ser analizado con respecto a sus ocho vecinos en cada una de las direcciones posibles resultantes del gradiente. Aquel conjunto de pxeles que

17

mantengan una orientacin similar sern etiquetados como pertenecientes a un mismo borde, obteniendo una primera agrupacin de los bordes en funcin de su gradiente. A continuacin, con el objetivo de depurar y adaptar la segmentacin a nuestras necesidades, los bordes resultantes de la fase de etiquetacin sern filtrados mediante el parmetro de mnima longitud de un borde. Para ello, se calcula la longitud de los bordes previamente etiquetados y se compara con la tolerancia en longitud fijada. Si dicha longitud es igual o superior a la tolerancia fijada por el usuario, el borde ser transformado a segmento, el cual tendr como extremos las coordenadas del centro del pxel correspondientes al inicio y fin del borde. Por el contrario, si la longitud es inferior a la tolerancia fijada, el borde ser eliminado, no generando el correspondiente segmento.

RANSAC+MMCC. RANSAC (RANmdom SAmple Consensus), es un estimador robusto desarrollado por (Fischler and Bolles, 1981) que se basa en la aplicacin de una tcnica de votacin resultante de un muestreo aleatorio, con el objetivo de determinar el nmero de observaciones vlidas inliers y el nmero de observaciones errneas outliers. En nuestro caso la aplicacin de RANSAC servir para determinar posibles errores groseros que de ser incluidos en el proceso mnimo cuadrtico deparara gravsimos errores en la extraccin de las lneas. Los pasos a considerar por parte de RANSAC seran los siguientes: 1. Seleccin aleatoria de dos puntos aleatorios para constituir una posible recta candidata. 2. Validacin de la recta, en funcin del nmero de puntos que ms menos una cierta tolerancia tengan una variacin mnima de su distancia ortogonal a la recta candidata. 3. Repeticin del paso 1 y 2 un determinado nmero de veces. 4. El mximo resultante del proceso de votacin despus de un nmero aleatorio de combinaciones se corresponder con la recta candidata y por consiguiente los votos favorables inliers del mximo contendrn los puntos favorables a constituir una recta. Los segmentos que superen la tolerancia en los tres grupos generados sern considerados como segmentos errneos outliers y sern eliminados. MMCC. Una vez determinados los errores groseros se llevar a cabo una extraccin de las lneas mediante la estrategia de MMCC. Partiendo de la consideracin de que entre x e y existe la relacin lineal y = ax + b, el objetivo ser determinar los parmetros a y b a partir de n-medidas de x e y; donde a es la pendiente de la recta, es decir, la tangente del ngulo que forma con el eje de abscisas (eje x), y b la ordenada en el origen, es decir la altura a la que corta la recta al eje de ordenadas (eje y).

18

RANSAC

MMCC

A la vista del grfico puede apreciarse que las dos variables siguen una relacin lineal. Se ha dibujado la recta que parece representar mejor la relacin. Para un valor de x determinado, la recta de ajuste proporciona un valor diferente de y del medido en el experimento. Esta diferencia ser positiva para algunos puntos y negativa para otros, puesto que los puntos se disponen alrededor de la recta. Por este motivo, la suma de estas diferencias para todos los puntos es poco significativa (las diferencias negativas se compensan con las positivas); as pues, para medir la discrepancia entre la recta y los puntos, se emplea la suma de los cuadrados de las diferencias, con los que nos aseguramos que todos los trminos son positivos. Esta suma tiene la forma:

= ( yi axi b )
i =1

donde n es el nmero de parejas de valores de que se parte para determinar la recta. De todas las posibles rectas que podemos trazar, caracterizadas por los parmetros a y b, la recta que mejor se ajusta a los puntos es la que hace mnima la suma expresada en la ecuacin anterior; esto es lgico, puesto que esta suma representa la discrepancia entre los puntos y la recta. Las condiciones de mnimo (primeras derivadas nulas) conducen a las ecuaciones que se conocen como ecuaciones normales para la determinacin de a y b. n es el nmero de parejas de valores de que se parte para determinar la recta. Las soluciones de las ecuaciones normales son:

Transformada de Hough para lneas. La transformada de Hough est diseada especialmente para encontrar lneas. Definimos una lnea como una coleccin de puntos de borde que son adyacentes y que tienen la misma direccin. La transformada de Hough es un algoritmo que tomar una coleccin de puntos de borde, encontrados mediante un detector de bordes y buscar todas las lneas sobre las cuales estos puntos de borde se encuentran. La idea bsica es convertir los puntos de bordes al espacio de parmetros.

19

Espacio de parmetros. Existen dos alternativas a la hora de trabajar en el espacio de parmetros de la Transformada de Hough. a) La primera alternativa se deriva de la consideracin de la ecuacin punto pendiente de la recta y = a x + b y consiste en considerar como parmetros del espacio, a la pendiente de la recta a y la ordenada en el origen b. De esta forma, cada lnea del espacio imagen ser representada por un punto (a, b) en el espacio de parmetros. Inversamente, cualquier punto p(x, y) del espacio imagen, se corresponder con la lnea a = x(-b) + y en el espacio de parmetros, y representar todas las posibles lneas de la imagen a travs de p. En la siguiente figura se ilustra la simetra existente entre el espacio imagen y el espacio de parmetros a travs de la consideracin de la ecuacin de la recta punto pendiente.

Yi = aX i + b Y0 ai X 0 = bi
Ntese la simetra de los dominios espacial (Xi, Yi) y de parmetros (a,b): cabe tanto la interpretacin de que los puntos (Xi, Yi) forman una recta de pendiente a y punto de paso (0,b) como que los puntos (ai, bi) forman una recta de pendiente -X0 y punto de paso (0, Y0). No obstante, el problema de esta parametrizacin radica en que tanto a como b determinan un espacio ilimitado de parmetros [-,], lo que complica considerablemente las capacidades de clculo. b) De esta limitacin surge la segunda alternativa denominada comnmente parametrizacin en el espacio de parmetros polar [, ], donde representa la distancia ortogonal entre el origen de la imagen y la lnea, y la orientacin de la lnea

20

o ngulo entre el eje de ordenadas de la imagen y la distancia . De esta forma tenemos garantizado un espacio de parmetros finito donde cualquier lnea puede ser representada, definido por la ecuacin =xcos+ ysen y los intervalos [0-2N] y [0-2], siendo N el tamao de la imagen. Es importante resear que con la parametrizacin polar una lnea perteneciente al espacio imagen ser representada por un sinusoide en el espacio de parmetros.

Basados en este hecho e independientemente del espacio de parmetros utilizado, la estrategia para la extraccin de lneas mediante Hough es la siguiente: Deteccin de los pxeles de borde de las rectas mediante un filtro de bordes. Establecimiento de un espacio de parmetros de dimensiones el espacio de bsqueda y una cuantizacin suficientemente precisa. Se barre la imagen de manera que cada pixel de borde da lugar a una recta: las celdas por las que "pasa" esta recta reciben un "voto".

En teora todos los pxeles que pertenecen a una misma recta (en la representacin espacial) son rectas (en el dominio de parmetros) que se cortan en una misma celda (en la representacin de los parmetros): la recta resultar ser la celda ms votada.

La transformada de Hough es un algoritmo de votacin, resultante del conjunto de puntos que forman parte de una lnea. Desde este punto de vista, el array de contadores en el espacio de parmetros puede ser estimado a travs de un histograma. Los votos finales totales, sern un contador de coordenadas, que indicar la probabilidad relativa de la hiptesis nula, de que una recta con un conjunto de parmetros exista en la imagen. La transformada de Hough tiene varias caractersticas importantes. En primer lugar, como todos lo puntos son procesados independientemente, combatir bien la oclusin. En segundo lugar, es relativamente robusto al ruido, ya que los puntos errneos no contribuirn consistentemente y slo generarn ruido de fondo. La limitacin ms grande de la transformada de Hough es quizs, el rpido aumento del tiempo de bsqueda, as como la aparicin de falsos mximos en el espacio de parmetros por parte de elementos no representativos.

Extraccin de crculos
Transformada de Hough para crculos. Al igual que se explotaba la dualidad punto-lnea en la transformada de Hough para lneas se podr hacer algo similar en el caso de los crculos.

21

Espacio de parmetros. Si el radio es conocido, el dominio de parmetros de cada crculo es bidimensional: coordenadas del centro de cada crculo. En este dominio, cada crculo del espacio se representa con un punto y simtricamente, un punto del dominio espacial se representa en el dominio de parmetros mediante un crculo formado por todos los puntos (dominio de parmetros) que representan a todos los crculos (dominio espacial) que pueden pasar por el punto (dominio espacial).

( X i X 0 ) 2 + (Yi Y0 ) 2 = K 2
Ntese la simetra de los dominios espacial (Xi, Yi) y de parmetros (X0, Y0): cabe tanto la interpretacin de que los puntos (Xi, Yi) forman un crculo respecto del centro (X0, Y0) como que los puntos (X0, Y0) forman un crculo respecto del centro (Xi, Yi). Todos los puntos de un mismo crculo (en el dominio espacial) son crculos (en el dominio de parmetros) que se intersectan en un mismo punto (en el dominio de parmetros) que representa el centro del crculo (dominio espacial). Basados en este hecho la estrategia para extraer crculos mediante la transformada de Hough es la siguiente: Deteccin de los pxeles de borde de los crculos mediante un filtro de bordes. Establecimiento de un dominio de parmetros cuyas dimensiones sean el propio espacio de bsqueda y una cuantizacin suficientemente precisa: la de los pxeles de la imagen original. Se barre la imagen de manera que cada pixel etiquetado como borde da lugar a un crculo de radio K centrado sobre el mismo. Las celdas que pertenecen al crculo reciben un "voto". En teora, todos los pxeles que pertenecen a un mismo crculo son, en el espacio de

22

parmetros, crculos que se cortan en la misma celda de manera que el centro de cada crculo es determinado como la celda "ms votada".

23

You might also like