You are on page 1of 57

2 Formacin de las imgenes

Los sistemas de Visin Artificial se


encuentran con escenas visuales de
informacin en el espacio continuo y sin
embargo el desarrollo y diseo de los
equipos se sustenta en tecnologa digital.
Luego se evidencia el paso de informacin
continua en el tiempo a discreta. La
captacin de la informacin presente en el
espacio continuo, as como la forma en que
sta va a ser alterada, como consecuencia
de la transformacin a datos discretos,
requiere ser estudiada con cierta
profundidad para comprender las
limitaciones que impone el sistema de Figura 2.1 Captura digital: desde el espacio
continuo al discreto
formacin de imgenes en su conjunto.

La figura 2.2 muestra un esquema de adquisicin de escenas. El motivo es


iluminado de manera ptima, tal que aumente el contraste entre el fondo y los objetos de
inters; la luz reflejada o transmitida pasa a travs de un sistema ptico, adecuando la
escena al tamao del elemento sensor. El transductor est constituido por elementos
sensores que convierten los haces luminosos recibidos en una seal elctrica. La cmara

Dpto. Electrnica, Automtica e Informtica Industrial 33


Carlos Platero Apuntes de Visin Artificial

de estado slido da un formato a la imagen


Sistema de
recibida en seal elctrica pudiendo ser de tipo iluminacin
Batera de cmaras
ptica
digital o analgico. sta es transmitida hasta el
computador, ya sea para su monitorizacin o Movimientos de la banda Escena

procesamiento. En el caso de utilizar seal de


vdeo analgica se requiere de la conversin a
formato digital. Sea como fuese, se habr Lnea de inspeccin

generado una correspondencia entre la realidad


y lo almacenado en el computador.
Figura 2.2. Elementos constituyentes
de formacin de imgenes
Se pretende abordar las capacidades de
la adquisicin y de formacin de las escenas visuales. Como se ha podido observar, las
posibilidades de estos equipos dependen de una multitud de factores. El diseo de una
aplicacin adecuada requiere del anlisis de todos estos factores que influyen en las
prestaciones, buscando, adems, las fuentes de degradacin en la adquisicin de las
imgenes. Estas ltimas pueden ser eliminadas y/o compensadas mediante la seleccin
apropiada de soporte fsico, compromisos de medidas y tcnicas de calibracin. El
exacto conocimiento de los factores que influyen en la calidad de la imagen permitir
con posterioridad la seleccin correcta de los componentes.

El desarrollo de este captulo va a tratar de cmo afectan los diferentes


elementos del sistema de formacin de imgenes a la mtrica virtual, centrndose
especialmente en el subsistema de iluminacin, en la ptica y en la seleccin de
arquitecturas de cmaras de estado slido. Los motivos son que stos representan los
elementos ms crticos en la calidad de la imagen y por ende en la mtrica. El captulo
finalizar con algunas tcnicas de calibracin de las cmaras.

2.1 Caracterizacin de imgenes digitales

La calidad de una imagen es una impresin subjetiva que va desde pobre hasta
excelente. La habilidad de la percepcin realizada por el cerebro viene afectada no slo
por el sistema de visin humano, sino tambin por otros factores como son: las
emociones, el aprendizaje y la memoria. Las relaciones entre stas son complejas,
intrincadas y no comprendidas. Los juicios personales varan ante una misma imagen y
las valoraciones pueden ser muy dispares.

Muchas expresiones han sido dadas para categorizar una imagen, cada una es
apropiada segn un particular conjunto de condiciones. Estas expresiones suelen ser
obtenidas desde las observaciones empricas, donde un grupo de imgenes son
ordenadas y posteriormente se infiere alguna ecuacin que justifique la clasificacin.

En un principio, la calidad de la imagen estaba relacionada con las lentes. Con el


avance de la tecnologa, la calidad se ha centrado en la minimizacin de la relacin
seal ruido, SNR, y en la arquitectura de las cmaras. Muchos tests han dado medidas
sobre la calidad de la imagen. La mayora de las mtricas estn relacionadas con la
calidad de las pticas, la resolucin de la cmara o la relacin seal ruido del elemento
sensor. En general, las imgenes con altas prestaciones pticas y bajo ruido son
clasificadas como imgenes de gran calidad. Las prestaciones del sistema de visin

34 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

dependen de las cmaras, lentes, iluminacin, Cristal protector

filtros pticos, etc. Slo al final se puede plantear


la calidad de la imagen.

Los ms importantes factores que afectan


a la calidad geomtrica y radiomtrica de una
imagen adquirida por una cmara de estado Lente Filtro IR Difusor Sensor

slidos son los siguientes:

 Iluminacin Figura 2.3. Partes constitutivas de una


cmara
 Superficie a visualizar

 ptica

 Cmaras

 Transmisin y digitalizacin de las imgenes

 Entorno

La seleccin de una apropiada iluminacin es una pieza clave en las tareas de


procesamiento de las imgenes. La uniformidad de luminosidad en la superficie, la
estabilidad temporal y su respuesta espectral, as como las propiedades pticas del
entorno deben ser consideradas. La falta de homogeneidad de intensidad luminosa en la
escena puede acarrear que cientos de pxeles aparezcan con bajo contraste. Por la
extensin y la importancia en el buen funcionamiento de los equipos de visin, se ha
dedicado un apartado para abordar el estudio de las fuentes luminosas.

El segundo aspecto se refiere a la naturaleza del producto a inspeccionar. El tipo,


el color, el tamao y la forma del detalle a analizar, obviamente influyen en las
exactitudes de las medidas. stas dependen, sobre todo, del tamao del objeto de
estudio y de su contraste.

Los aspectos referidos a las pticas, sensores, cmaras y digitalizadoras van a ser
abordados con mayor detalle y representan el ncleo del captulo. Se plantearn los
aspectos de focalizacin de la radiacin luminosa que llegue al elemento sensor y cmo
se modela, para pasar posteriormente al estudio del funcionamiento del sensor y de la
composicin de las cmaras de vdeo.

Por ltimo, respecto al entorno, hay que citar la temperatura, la humedad, las
vibraciones y las iluminaciones ambientales. Por ejemplo, el efecto de la temperatura
puede producir profundos cambios en las cmaras. Hay multitud de cmaras que
requieren ms de dos horas antes de alcanzar su estado estable. Estos cambios provocan
errores de gran magnitud. Sus causas se encuentran en las deformaciones mecnicas, en
la sensibilidad de elemento sensor con la temperatura y en las variaciones en la
frecuencia del reloj.

Dpto. Electrnica, Automtica e Informtica Industrial 35


Carlos Platero Apuntes de Visin Artificial

2.2 Iluminacin

La iluminacin juega un papel primordial dentro del proceso de visin. Los


sistemas de iluminacin ayudan a simplificar considerablemente el anlisis e
interpretacin de las escenas. Muchas veces, los algoritmos de procesamiento pueden
ser reducidos drsticamente con una seleccin adecuada del sistema de formacin de las
imgenes. Por el contrario, la falta de estudio sobre la adquisicin de las imgenes
provocar el aumento de la complejidad de los algoritmos y las dificultades de
generalizacin del equipo de Visin Artificial. Las imgenes recibidas por las cmaras
no pueden estar, generalmente, en un ambiente de iluminacin no estructurada, esto es,
donde las condiciones de iluminacin no hayan sido estudiadas. En estos casos, la
propia sombra de otro objeto que interfiera har peligrar el xito del montaje.

Los sistemas de Visin Artificial trabajan, normalmente, con iluminaciones


estructuradas. El espacio captado por las cmaras est aislado del resto. No hay
contaminacin lumnica, no hay sombras inesperadas, no existen objetos que
interseccionen a los escenarios que se desean capturar. La iluminacin se disea para
que sea capaz de resaltar los objetos de inters. La iluminacin depende bsicamente de
la naturaleza de las superficies donde se va a
reflejar y del tipo de fuente luminosa.

La primera reduccin consiste en tratar los


objetos como si fuesen opacos. La radiacin
transmitida no es considerada. En Computacin
Grfica se estudia la interaccin entre la luz y las
superficies y cunta radiacin reflejada le llega al
sensor. En una primera aproximacin se estudia la
interaccin entre la fuente luminosa y los cuerpos.
Sin embargo, estas iteraciones no son suficientes
para crear imgenes sintticas crebles. As, en el
movimiento de los objetos sobre un escenario no se
produciran cambios de iluminacin o sombras.
Estas consecuencias se derivan de no tener en
cuanta las radiaciones reflejadas de los cuerpos
existentes en la escena. Una de las tcnicas de
renderizacin ms empleadas se llama Ray
Tracing. Consiste en lanzar rayos de luminosidad y
ver cmo interactan con las superficies de los
objetos que hay en el escenario, tomando en cuenta
la interaccin entre todos ellos.
Figura 2. 4 a) Dibujo sin interaccin
con la luz, b) Grfico con interaccin
El problema en Visin Artificial es el entre la luz y la materia
inverso de la Computacin Grfica. No se trata de
generar una imagen sinttica, sino de ubicar correctamente la iluminacin, los sensores
y los cuerpos a examinar para resaltar las caractersticas visuales de los objetos.

36 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

2.2.1 Modelos de superficies

La manera en la que la luz es reflejada en una superficie, depende de entre


muchos factores, de las formas macroscpicas que constituyen las superficies. De esta
manera, en superficies lisas al ser iluminadas con un haz incidente, la luz reflejada sobre
ellas toma una sola direccin; en cambio, sobre superficies rugosas tienden a
difuminarse en mltiples direcciones. Para establecer con exactitud el fenmeno de la
reflexin es necesario tener un conocimiento a priori de la estructura de la superficie, es
decir, un modelo de stas. Se pueden catalogar en dos clases de modelos de superficie:
mapas de perfiles y modelos aleatorios. Un exacto perfil puede ser determinado con las
medidas de alturas en cada punto de la superficie, por algn tipo de dispositivo existente
en el mercado. No obstante, este mtodo es caro e impracticable en muchos casos. Por
lo tanto, suele modelarse mediante funciones de densidad estadsticas que tienden
aproximarse al verdadero comportamiento de la superficie ante un haz de luz incidente.

Una superficie puede ser modelada a


partir de una coleccin de microsuperficies
planas, tal como queda reflejado en la figura
2.5. Cada microsuperficie tiene su propia n
Microsuperficies
orientacin. El ngulo de inclinacin, , es el planas

parmetro que determina el grado de oblicuidad


respecto a la normal del plano medio. En el
caso de superficies isotrpicas, la probabilidad
de distribucin de sera uniforme y las
microsuperficies estaran rotadas respecto a la
Figura 2. 5. Superficie formada por
normal, n, con igual probabilidad en todas las microfacetas
direcciones. Esto lleva a que puede modelarse
la superficie mediante una funcin de distribucin unidimensional. Por ejemplo, la
superficie puede responder a una funcin de densidad gausiana para el nivel de
microfacetas con N( , ). Grandes valores en la varianza, , indicarn la presencia
de superficies rugosas, y al contrario, valores pequeos sealarn superficies lisas. Los
modelos basados en la funcin de distribucin del ngulo de inclinacin en las
microsuperficies son muy populares, pues la difusin de la luz reflejada es explicada por
los niveles de inclinacin y no por la cartografa (altura) de la superficie. Por esta razn,
los modelos de inclinacin, aunque relativamente ambiguos, son ampliamente utilizados
en los problemas de reflexin de la luz en superficies.

La impresin visual de los humanos es bastante vaga con el concepto de


rugosidad. De manera que una superficie vista de cerca parece rugosa y algo ms
alejada, puede llevar a la conclusin de calificarla como lisa. De hecho, los humanos
hacen cambios de vistas para ayudarse en el juicio de la rugosidad de la superficie.

A diferencia de las valoraciones humanas, la teora de reflexin tiene bien


definida el concepto de rugosidad; sta debe relacionar las irregularidades de la
superficie con las direcciones que tome la luz ante un haz de luz incidente. Para
superficies cuyas irregularidades son menores que la longitud de onda de la luz, << ,
la mayor parte del flujo incidente ser reflejada especulrmente en una sola direccin.
En caso contrario, si las irregularidades superan la longitud de onda del haz, la

Dpto. Electrnica, Automtica e Informtica Industrial 37


Carlos Platero Apuntes de Visin Artificial

superficie difuminar la luz en mltiples direcciones, produciendo una radiacin difusa.


En la prctica, la radiacin reflejada es una combinacin de ambos casos.

El modelo ms utilizado en Visin Artificial se basa en las conclusiones de


Nayar. La reflexin de la luz sobre una superficie est formado por tres componentes: la
primera corresponde con la reflexin difusa explicada por el modelo lambertiano. La
segunda justifica el halo especular que se fundamenta en el modelo de Torrence-
Sparrow y la ltima se emplea en superficies lisas y hace referencia al pico especular.

Sensor
Manantial

Luz incidente r

n Pico especular
i
i
Halo especular
Halo difuso

Figura 2. 6 Tipos de radiacin al iluminar una superficie segn el modelo de Nayar

2.2.2 Clculo de la iluminacin y la luminancia

La iluminacin sobre una superficie, tal como se


vio en el captulo anterior, viene determinada por la
intensidad del foco luminoso y por las posiciones
geomtricas entre foco y superficie. Para el caso de
intensidad isotrpica, puntual y de posicin en el eje axial
de la superficie respecto del foco, la iluminacin es igual
a:

d I d r I
E= = 2
dA dA r

Cuando la iluminacin no es paraxial o isotrpica hay


que descomponerla en una componente horizontal y en otra
vertical a la superficie:

38 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

I cos( )
EH =
d2
I cos( )
EV = = E H tg ( )
d2

En general, si un punto est iluminado por ms de un foco, su iluminancia total


es la suma de las iluminancias recibidas:

I i cos( i )
EH = 2
i di
EV = E H i tg ( i )
i

Ejemplo 2.1

Una superficie est iluminada por una fuente luminosa puntual de 0.1
W/sr de intensidad constante en todas direcciones situada a 2 m de altura.
Calcular la iluminancia de superficie y la iluminacin vertical, si la inclinacin
entre la superficie y la fuente, , es de 30.

I cos 3
EH = 2
= 16.2mW / m 2
h
EV = E H tg = 9.4mW / m 2
E = 18.72mW / m 2

Ejemplo 2.2

Una superficie circular de 3 m de radio est iluminada


por una bombilla de 50 cd de intensidad constante en todas
direcciones situada a 2 m de altura sobre el centro de la
plataforma. Calcular la iluminacin mxima y mnima sobre la
superficie.

La iluminacin mxima se dar en la vertical del foco:

I
E max = = 12.5 lx
h2

La mnima se dar en la frontera:

I cos( )
E min = = 2.13 lx
(h / cos( ))2

Dpto. Electrnica, Automtica e Informtica Industrial 39


Carlos Platero Apuntes de Visin Artificial

Hasta ahora se ha hablado sobre la iluminacin radiada, pero


para medir la recibida por un observador se emplea el concepto de
luminancia o radiacin. sta se defini como la relacin entre la
intensidad radiada por una fuente, en una direccin determinada, por
la superficie aparente. Es sta la que llega al ojo o a la cmara y no la
iluminacin.

La reflexin de la luz sobre una


superficie rugosa se aproxima a un
comportamiento de reflexin en todas las
direcciones. Una superficie que refleja la luz
de esta forma se la llama lambertiana. Para
explicar el modelo de interaccin entre la luz
y la materia se definen los vectores unitarios
   
n , l , v y r , segn muestra la figura. La
explicacin del halo difuso se formaliza con:

( )
 
I d = d I din n l

Siendo d el coeficiente de reflexin difuso adimensional e I din es la intensidad


incidente en la superficie. En cambio para superficies lisas, la reflexin es de carcter
especular y su modelo es:

  k
I s = s I sin ( r v )

Donde s el coeficiente de reflexin especular adimensional, I sin es la


intensidad incidente en la superficie y k es un parmetro del modelo para disminuir el

efecto especular cuando se desva del vector r . Normalmente se considera k=100.

Ejemplo 2.3

Se tiene un proyector situado en el techo de 0.04


2
m de superficie que ilumina con una intensidad de 150
mW/sr en cualquier direccin. Una mesa de 0.5 m2 de
superficie recibe dicha iluminacin y tiene un
comportamiento lambertiano de factor de reflexin de
0.8. Calcular la luminancia de la fuente y la luminancia de
la mesa para el observador de la figura.

I I
Lp =   = = 21.59W / m 2 sr
S p (n P v p ) S p sen
I I
Lm =   = = 0.48W / m 2 sr
S m (nm v m ) S m sen

40 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

2.2.2.1 Modelo de Phong de Reflexin de la luz

Este modelo local es utilizado en Computacin Grfica para aplicaciones en


tiempo real. Considera los dos mecanismos de reflexin de la luz en superficies: difusa
y especular. En cuanto a la iluminacin, las clasificas en difusa, especular y ambiental.
Su forma de proceder es descomponer la luz en sus distintas formas de onda,
normalmente utiliza las franjas RGB y calcula la interaccin de cada parte del espectro
con la materia. Con posterioridad, al aplicar superposicin, se suma las interacciones de
cada franja y se obtiene la intensidad en cada punto del escenario.

Para facilitar el clculo computacional, no se considera la interaccin propia


entre cuerpos prximos entre s al radiar unos sobre otros. Este trmino es aproximado
por una iluminacin ambiental, a I ain . La intensidad de emisin de un punto para una
determinada longitud de onda es calculada como:

( )
    k
I = I a + I d + I s + I e = a I ain + d I din n l + s I sin ( r v ) + I e

donde Ie es la componente de intensidad correspondiente a la emisin de luz o


fuente de iluminacin. Este clculo es realizado slo para cuerpos opacos. Es posible
extender el modelo a cuerpos translcidos, modelizando la refraccin difusa y especular
mediante la ley de Snell.

Ejemplo 2.4

Una fuente luminosa de 0.1


W/sr ilumina a una superficie de
0.5 m2. Los factores de reflexin Sensor
difusa y especular sobre esta Manantial

superficie son 1 ,0 .5 ,
3 Luz incidente r

respectivamente. Los ngulos de


n Pico especular
incidencia y de colocacin de la i
i
Halo especular
cmara son i = , r = , Halo difuso
4 6
respecto a la normal de la
superficie. Determinar la
intensidad recibida y la luminancia
en el sensor. Considrese que no hay interferencias de otras superficies y su
emisin es nula. Utilizar el modelo de Pong. Dato:
k=10.
k
1 1 mW
( )     k
I = I d + I s = d I din n l + s I sin ( r v ) =
3
100 cos + 100 cos = 41
4 2 4 6 sr
I I 41 mW
L= =   = = 94.28
S aparente S ( n v ) sr m 2
S cos
6

Dpto. Electrnica, Automtica e Informtica Industrial 41


Carlos Platero Apuntes de Visin Artificial

2.2.3 Tcnicas de iluminacin

Existen muchas tcnicas de iluminacin y resulta difcil de generalizar sobre los


distintos tipos de iluminacin, ya que suele depender de cada caso concreto. Sin
embargo, se pueden clasificar en cuatro grandes grupos: direccionales, difusas, a
contraluz y estructuradas. Se presentan stas y posteriormente se dar un repaso a
combinaciones de las iluminaciones principales.

2.2.3.1 Iluminacin direccional

Consiste en dar una iluminacin orientada al objeto empleando un


haz altamente direccional. Se utiliza en la localizacin y reconocimiento
de piezas, inspeccin de superficies, seguimiento de puntos para
soldadura o pegamento, etc. La forma del haz luminoso depende de la
aplicacin y del objeto a analizar. Cabe destacar los siguientes casos: a)
Punto luminoso b) Lnea de luz c) Plano de luz y d) Corona circular
luminosa.
Figura 2.7
Tcnica
direccional

2.2.3.2 Iluminacin difusa.

En ella se intenta que los haces luminosos


incidan sobre el objeto desde todas las direcciones y no
slo desde la fuente luminosa. Proporciona el mnimo
contraste del objeto y elimina las sombras. Se utiliza
cuando los objetos a analizar presentan superficies Figura 2. 8. Tcnica difusa
suaves.

Para crear una iluminacin difusa se utilizan


difusores de color blanco mate.

2.2.3.3 Iluminacin a contraluz.

Consiste en colocar la fuente luminosa por


detrs del objeto, de manera que la informacin
capturada por el sensor proviene del flujo luminoso
transmitido por el cuerpo. Si el objeto es opaco, ste Figura 2. 9 Tcnica a contraluz

42 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

aparecer como una sombra y las imgenes se constituyen bsicamente en slo dos
niveles de grises. Se emplea preferentemente para la localizacin de piezas y anlisis
dimensional. El principal inconveniente es la prdida de los detalles de los cuerpos. Una
preocupacin a tener en cuenta es el posible deslumbramiento de la cmara, producido
por la cantidad de radiacin que alcanza al sensor, lo que origina un recorte en la
dimensin de los objetos.

En caso de cuerpos translucidos dejar informacin sobre las propiedades


internas de la materia. ste es el fundamento de la tomografa o de la radiografa. La
imagen capturada depender de la absorcin de la materia. En este ejemplo se observa
que la fuente de iluminacin no tiene por que pertenecer al espectro visible.

2.2.3.4 Iluminacin estructurada.

Este tipo de iluminacin se sirve de la


proyeccin de puntos, franjas o rejillas sobre la
superficie de trabajo. En funcin de cmo se deforme
este patrn de luz sobre la superficie se puede detectar
las singularidades de la pieza objeto de anlisis. Este
mtodo posee dos ventajas con respecto a las

anteriores.
Figura 2. 10. Tcnica de luz
estructurada
1. Establece un patrn de luz conocido
sobre la superficie de trabajo y las diferencias con este patrn indican la
presencia de un objeto, simplificndose as el problema de deteccin de
un objeto.

2. Analizando la forma en que el patrn de luz es distorsionado, es posible


obtener informacin de las caractersticas tridimensionales del objeto.

2.2.4 Luz polarizada

Los haces de luz no polarizada consisten en radiaciones electromagnticas con


vibraciones transversales de igual magnitud en un
nmero infinito de planos perpendiculares a la
direccin de desplazamiento. Algunos materiales
actan selectivamente absorbiendo la energa en
ciertos ngulos y transmitindola en otros. El
resultado de un polarizador es un haz de luz que, en
esencia, parece vibrar en una sola direccin
(polarizador total), o vibra en todas direcciones pero
con distinta magnitud (polarizador parcial). El
estado de polarizacin depende de la relacin
existente entre las fases y amplitudes del campo
elctrico y magntico. Figura 2. 11. Luz polarizada

Dpto. Electrnica, Automtica e Informtica Industrial 43


Carlos Platero Apuntes de Visin Artificial

La percepcin de un objeto es el resultado de la reflexin difusa y especular de


la luz incidente sobre ste. La reflexin especular es acromtica y est parcialmente
polarizada, mientras que la reflexin difusa no est polarizada y es la que al actuar
selectivamente sobre las distintas longitudes de onda dan la sensacin de color. Para
obtener imgenes de una superficie coloreada habr de emplear un filtro polarizador que
impida la reflexin especular, polarizada y acromtica, haciendo llegar al sensor slo la
reflexin difusa.

Se suele emplear dos polarizadores, uno en la iluminacin y otro en la cmara.


Generalmente se emplean 0/90 y 45/135.

2.2.5 Ejemplos de iluminaciones.

A continuacin se enumeran algunas iluminaciones utilizadas en Visin


Artificial, mezclas de las anteriores. Se hace una breve descripcin as como sus
ventajas e inconvenientes.
1. Iluminacin Frontal Direccional: Es la tcnica ms empleada. La cmara es
posicionada mirando al objeto en el mismo plano que la iluminacin. La cmara
recibe la luz reflejada del objeto. Ventajas: especialmente til para observar
superficies, fcil de implementar y con posibilidad de utilizar la fibra ptica.
Desventajas: Puede crear reflejos no deseadas.

Figura 2. 12 Ejemplos de iluminacin frontal empleado en la inspeccin de etiquetas

2. Iluminacin Frontal Difusa: Usada para generar iluminacin superior (la


fuente est ms elevada que la escena) . Ventajas: Es suave, regular no
direccional, reduce el brillo en superficies metlicas, relativamente fcil de
implementar. Desventajas: Los bordes pueden quedar difuminados y el
contraste es bajo en zonas monocolor.

44 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

3. Iluminacin de Tienda (da nublado): No direccional, totalmente difusa,


iluminacin superior que produce iluminacin como la de un da nublado.
Bueno para piezas metlicas (bujas, cojinete de bolas) y componentes
electrnicos. Ventajas: Elimina brillos y sombras. Desventajas: Debe rodear la
pieza, puede ser costoso, el tamao puede ser un
problema.

4. Iluminacin Colimada Posterior: Iluminacin


posterior a travs de una lente colimada, de modo que
los rayos de luz son casi paralelos. Ventajas: Produce
bordes muy contrastados para mediciones de precisin.
Desventajas: Difcil de implementar si el material se
mezcla en la direccin del haz y puede ser demasiado brillante para cmaras sin
filtro.

5. Iluminacin de Campo Oscuro: La luz


incidente se refleja lejos de la cmara y la
iluminacin es creada por reflexin especular.
Ventajas: Ilumina defectos y produce una
imagen de alto contraste en algunas
aplicaciones. Desventajas: no ilumina
superficies planas.

6. Contraluz Difusa: La luz est en el lado opuesto de la cmara y va a travs de


un material difusor, tal como papel de estraza o vidrio translucido. Ventajas:
Fcil de implementar, crea silueta del objeto, imagen de muy alto contraste y
bajo coste. Desventajas: los bordes pueden quedar difuminados, puede ser
difcil de implementar dependiendo de la posicin del material.

7. Iluminacin de Bajo ngulo: La luz


incide casi horizontal a la superficie del
objeto. Ventajas: Muestra defectos
topolgicos, Desventajas: Una sola fuente
producir una iluminacin desigual en la
superficie.

8. Iluminacin Frontal Polarizada: Iluminacin frontal con un polarizador en la


luz y un polarizador cruzado en la lente. Ventajas: elimina brillos. Desventajas:
reduce significativamente la cantidad de luz a travs de la lente.

9. Contraluz Polarizado: El polarizador y el polarizador cruzado estn en lados


opuestos del objeto. Ventajas: alta iluminacin en ciertos tipos de

Dpto. Electrnica, Automtica e Informtica Industrial 45


Carlos Platero Apuntes de Visin Artificial

caractersticas o defectos en materiales translcidos y relativamente fciles de


implementar. Desventajas: los bordes pueden quedar difuminados y difcil de
implementar para algunas posiciones del material.

10. Iluminacin Estroboscpica: Una iluminacin peridica que dura


microsegundos se usa para congelar la imagen de objetos en movimiento.
Ventajas: toma imgenes sin movimiento, puede ser de rea, fibra ptica o led.
Desventajas: Ms costoso que las fuentes usuales, requiere una precisa
sincronizacin con la cmara y debe estar fuera del alcance visual de las
personas.

11. Iluminacin Estructurada: Un plano de


luz generado por una luz estructurada
mediante conversin de lente cilndrica de
punto a lnea de lser. Ventajas: muestra
informacin 3D, produce alto contraste en
la mayora de las zonas. Desventajas: el
lser por encima de 5 mW es peligroso, la
luz puede ser absorbida por algunas
superficies.

12. Iluminacin Coaxial: La iluminacin va en la


misma direccin que la luz que entra por la
cmara reflejada por los objetos, esto es, la
iluminacin y el eje de la cmara son colineales.
La fuente de luz est colimada (todos los haces
luminosos van en la misma direccin. Ventajas:
elimina sombras e iluminacin uniforme.
Desventajas: complicado de implementar y spera
iluminacin para superficies lustrosas.

2.2.6 Fuentes luminosas.

Entre los elementos comerciales que se pueden utilizar para una correcta
iluminacin son: luces incandescentes, focos halgenos, fluorescentes, lseres y leds.

Las luces incandescentes presentan un coste bajo, son fciles de usar y adems
pueden estar funcionando durante largos periodos de tiempo. stas suelen ser puntos
luminosos, no direccionales y con moderada eficiencia energtica. Generalmente
presentan la posibilidad de ajustar la intensidad lumnica, aspecto importante, ya que
cmo se ver en el apartado de ptica, interesa que el rea efectiva de la lenta sea
pequea, por lo que para estimular al sensor se requiere mayor potencia lumnica. El
principal inconveniente es el elevado calor que desprenden, producto de su
funcionamiento y que puede limitar su aplicacin.

46 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

Cuando las fuentes luminosas emplean


corriente alterna, la radiacin luminosa vara de
intensidad y puede provocar la variacin de una
imagen a otra. Por eso, a veces, se emplean fuentes
luminosas que puedan ser alimentadas con corriente
continua, como as sucede con las lmparas
halgenas. Estas bombillas tienen una temperatura
menor que las incandescentes (350C).
Figura 2. 13. Fluorescente tipo corona
Los fluorescentes son fuentes de luz que se
caracterizan por no generar calor. Presentan formas y tamaos variables, as como de
diversos colores de luz. Son comnmente empleados en iluminacin difusa. La
alimentacin debe ser en corriente alterna y para evitar fluctuaciones en las imgenes se
emplean reactancias de altas frecuencias (de 100Hz a 25kHz).

El lser es empleado en iluminacin


estructurada. Es un fuente monocromtica que puede
presentar diferentes patrones de luz: punto, lnea,
rejillas, ... Su gran inconveniente es la necesidad de
emplear sistemas de seguridad, para evitar daos en
los operarios que trabajen cerca del estos sistemas de
iluminacin.

El uso de fibra ptica, como gua de luz, est Figura 2. 14. Luz lser
asociado a la transmisin de la iluminacin pero no
del calor, por lo que suele ir asociado a fuentes incandescentes. Su aplicacin est
principalmente en la iluminacin de pequeas reas y
concavidades, como por ejemplo en la endoscopia.

Las luces estroboscpicas son ideales para


analizar objetos en movimiento o piezas en una cinta
transportadora. Dan una iluminacin intensa, por lo
que la iluminacin ambiental influye poco. Existen
elementos con pulsos de 2 microsegundos. El mayor
inconveniente es el proceso de sincronizacin entre la Figura 2. 15. Gua de luz (fibra
ptica)
iluminacin y la cmara.

2.2.7 Aspectos a considerar en las fuentes de iluminacin


Variacin de la iluminacin en pequeos periodos de tiempo: alimentacin
continua, alimentacin alterna en alta frecuencia y sincronizacin.
Variacin de la iluminacin en largos periodos de tiempo: arranque y
autocalibracin.
Temperatura y disposicin fsica.
Fuentes luminosas de alta precisin.
Suciedad.
Carcter colimado del haz.
Mantenimiento, coste y facilidad de recambio.

Dpto. Electrnica, Automtica e Informtica Industrial 47


Carlos Platero Apuntes de Visin Artificial

2.3 La ptica

La ptica es el elemento del sistema de visin que permite concentrar los rayos
luminosos del entorno sobre el plano sensor. Una vez definido el sistema de
iluminacin, la eleccin de la ptica influir en la calidad de la imagen recibida y del
tamao de los objetos. En este apartado se hace un repaso de los parmetros pticos con
un modelo de lente simple. Posteriormente, se explicaran varias cuestiones prcticas
sobre las pticas comerciales empleadas en las cmaras de vdeo.

2.3.1 Cmara oscura

Desde hace mucho tiempo es conocida la experiencia de la cmara oscura.


Cardan, en 1550, emple la cmara oscura con una lente. Se trata de realizar en un
habitculo cerrado, en una de sus paredes, un pequeo orificio. La luz, tras entrar en la
cmara, se proyecta sobre la pared opuesta a la que tiene el orificio. Por cada rayo
procedente del exterior se obtiene un punto luminoso en el plano proyectivo.
Extendiendo el razonamiento a los infinitos rayos que atraviesan el agujero se obtiene
una imagen invertida y proyectiva, del mundo exterior al plano sensor.

Figura 2. 17. Fundamento de la cmara oscura


Tambin se observa que a medida de que la
separacin entre las paredes de la cmara aumente, la
imagen proyectiva se incrementa de tamao. A este
modelo de cmara oscura se la denomina pin-hole.

Sin embargo, en la cmara oscura, la energa


incidente que atraviese no
es lo suficientemente
elevada como para excitar Figura 2. 16 Tamao del objeto
al plano sensor. Por lo que proyectado
se resuelve aumentando el
tamao del agujero. El efecto provocado es una degradacin
de la imagen, ya que son varios los rayos los que inciden,
Figura 2. 18. Tipos de pero no necesariamente del mismo objeto, producindose una
lentes convergentes o
positivas
imagen borrosa. Estos inconvenientes son subsanados con el
uso de las lentes.

48 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

2.3.2 Lente simple

Con el objeto de aumentar la luminosidad en el interior de la cmara, sin que la


imagen se haga borrosa al aumentar el tamao del agujero, se utiliza una lente. Una
lente es una sustancia transparente y refringente, limitada por dos caras, una de las
cuales es curva y la otra puede ser plana o curva, pero con la condicin de que sus
centros de curvatura estn en el mismo eje. El efecto deseado es la convergencia o
divergencia del frente de ondas.

La figura representa una lente convexa


de radio R. El centro de curvatura de la lente
se define por C. Sea un punto P exterior,
situado a una distancia Z. Los infinitos rayos
procedentes del emisor que chocan sobre la
lente producirn una direccin especular,
respecto a la normal de la superficie de la
lente. La refraccin del frente de ondas,
gracias a la curvatura constante, se concentra
en el punto P, separado a una distancia z,
respecto a la superficie. La relacin entre estas
distancias con el radio de curvatura viene
definido por la ecuacin de Gauss:

1 1 2
+ =
Z z R Figura 2. 19 Modelo de lente delgada

En la formacin de imgenes se emplean tanto lentes convergentes o positivas


como divergentes o negativas. Las lentes positivas tienen la propiedad de hacer
converger en un punto, los distintos rayos divergentes que proceden de un mismo lugar
del objeto exterior. Las lentes divergentes hacen el trabajo al contrario, no focalizan la
luz, sino que las hacen divergir.

Al emplear lentes convergentes, todos los puntos del plano imagen tienen, por
tanto, la caracterstica de que todos los rayos incidentes en cada uno de dichos puntos,
provienen de un mismo punto del objeto, obtenindose una imagen ntida con una
mayor energa incidente.

Dpto. Electrnica, Automtica e Informtica Industrial 49


Carlos Platero Apuntes de Visin Artificial

Figura 2. 20. Modelo de lente delgada

La zona sensible de la cmara deber estar situada en el plano de convergencia


de los rayos, en caso contrario, los rayos incidentes sobre el sensor provendr de
distintos objetos, obtenindose una imagen borrosa o desenfocada.

2.3.3 Distancia focal

Se observa que para un mismo


objeto exterior, a medida de que ste se
encuentre ms alejado respecto a la
cmara, el punto de convergencia de los
rayos, al otro lado de la ptica,
disminuye, ya que el grado de
convergencia de la lente permanece
constante y la radiacin incidente tiene
menor divergencia. Al procedimiento de Figura 2. 22. Distancia de enfoque dependiendo de la
ajustar la distancia entre la lente y el situacin de los objetos
plano sensor, con el objeto de tener una
imagen ntida, se le denomina enfoque.

Dependiendo de la curvatura de
las lentes, stas poseen distintos grados
de convergencia de los rayos
provenientes del objeto y por tanto ser
distinta la distancia entre el plano de la
imagen y la lente. Con el fin de medir el
grado de convergencia de una lente se
utiliza la distancia lente-plano de
imagen. Pero debido a que esta
distancia es variable segn la distancia a
la que est enfocado el objeto, su
medicin se realiza cuando el objeto se
Figura 2. 21. Distancia focal
encuentra enfocado a una distancia
infinito delante de la cmara; en cuyo caso, los rayos procedentes del mismo punto del

50 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

objeto sern paralelos. La distancia focal, f, se define como la distancia entre la lente y
el plano sensor o focal cuando se encuentra enfocado hacia el infinito. Esta definicin
equivale a decir que la distancia focal es la distancia entre la lente y el punto de
convergencia de todos los rayos paralelos que inciden perpendicularmente a ella. A este
punto de convergencia se le denomina foco de la lente. Si el objeto se halla a una
distancia finita, la separacin entre la lente y
el plano focal ser mayor que la distancia
focal.

Para explicar la formacin de la


imagen se emplea el modelo de lente fina.
De forma que todos los rayos que pasen por
el centro ptico continan en lnea recta y
los rayos que atraviesen la lente
paralelamente al eje axial de la ptica
convergen en el foco. La proyeccin de un
punto P del exterior, de coordenadas
Figura 2. 23. Modelo de lente fina
(X,Y,Z), sobre el plano sensor, p de posicin
(x,y,z) vendr definido, segn la ecuacin de Gauss, por:

1 1 1
+ =
Z z f (2. 1)

La lente fina puede ser


simplificada si se emplea el
modelo pin-hole. Este modelo,
como se ha comentado, reduce la
ptica a un punto de
convergencia situado a la
distancia focal, f. Con esta
suposicin, se considera
despreciable el movimiento de
convergencia de los rayos a
travs del proceso de enfoque.
Por tanto es como si la ptica
estuviera siempre enfocada hacia Figura 2. 24 Modelo pin-hole
el infinito. La ventaja es la
facilidad de modelado del sistema ptico. Por triangulacin, la relacin entre la
geometra exterior y la proyectada mostrada en la figura es:

f f
x= X y= Y
Z Z (2. 2)

Se denomina factor de magnificacin a la relacin entre el segmento proyectado


sobre el plano imagen y la distancia real exterior:

Dpto. Electrnica, Automtica e Informtica Industrial 51


Carlos Platero Apuntes de Visin Artificial

x y f
M = = =
X Y Z (2. 3)

En el modelo pin-hole, la distancia focal es proporcional al factor de


magnificacin, mientras en el modelo de lente fina es:

M
f = Z
M +1 (2. 4)

En cualquier caso, la distancia focal


da una medida del grado de magnificacin
entre la imagen real y la proyectada. El
tamao de la imagen proyectiva depende de
la distancia focal. A mayor distancia focal,
el rea de la imagen se incrementa y
viceversa. Una eleccin adecuada de la
distancia focal depende de la resolucin
deseada del objeto. El grado de resolucin
espacial del sistema de adquisicin de las
imgenes vendr determinado por el
tamao del objeto ms pequeo que pueda
distinguirse, sin llegar a confundirlo.

Figura 2. 25 Magnificacin de la ptica

Ejemplo 2.5

Para la prctica de calibracin de las


cmaras se ha empleado una cuadrcula tipo de
ajedrez. Los lados son de 27 mm y se ha puesto la
rejilla a 1 metro de distancia respecto a la cmara.
Se ha empleado una cmara de pxel cuadrado de
5.6m. Las aristas de las caras se ven en 15
pxeles. Cul debe ser la distancia focal de la
ptica?. Qu rea se visualiza, si la cmara est
constituida por 357x293 pxeles?. Utilcese el
modelo pin-hole.

15 5.6 10 6
f = 1 = 3.1mm
27 10 3
x y 357 5.6 10 6 x 293 5.6 10 6
S = X Y = = = 0.341m 2
M2 (3.1 10 )
3 2

52 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

Ejemplo 2.6

Qu tipo de espejo se requiere para iluminar una pared situada a 3 m


del foco luminoso, sabiendo que la separacin entre la fuente y el espejo es de
10 cm? Cul es la proyeccin del foco de 5 mm sobre la pared?

El tipo de espejo debe de ser divergente, esto es, su curvatura es cncava y


tendr un radio de curvatura de:

1 1 2
+ = R = 19.4cm
3 0 .1 R

El tamao del foco proyectado ser:

0 .1 x
M X = = 5 10 3 30 = 150mm
3 M

Ejemplo 2.7

Un pequeo objeto se encuentra a 4 cm de un espejo cncavo de radio


12cm. Calcular la posicin y aumento de la imagen ntida.

1 1 1 0.12
+ = z = 0.12m M = =3
0.04 z 0.06 0.04

Ejemplo 2.8

Un objeto es proyectado por una esfera de vidrio hueca de radio R,


10cm, a una distancia respecto de la superficie de 3R, A que distancia
respecto del centro de la esfera se obtendr la imagen ntida y cuanto ha sido
amplificada?

La imagen invertida dentro de la esfera, al pasar por la zona convexa valdr:

1 1 2 3R
+ = z= = 6cm
3R z R 5

Esta imagen al ser pasada por la zona cncava ser amplificada y la imagen
ntida respecto del centro de la esfera ser:

1 1 2 7R
+ = Z'= = 7.78cm d = 17.78cm
Z ' 7R 5 R 9

El factor de magnificacin ser atenuante:

Dpto. Electrnica, Automtica e Informtica Industrial 53


Carlos Platero Apuntes de Visin Artificial

3R / 5 7 R / 5 9
M =
3R 7 R / 9 25

2.3.4 ngulo visual

El mximo tamao de los objetos que entran dentro de la zona sensor de la


imagen viene determinado por el tamao de la zona sensible de la imagen, por la
distancias de los objetos a la cmara y por la distancia focal, f. Con el objeto de poder
comparar los ngulos visuales de las distintas lentes, se efecta la medida con el
enfoque hacia el infinito.

Con este supuesto, se


calcula el ngulo visual cmo el
ngulo que forman dos rayos que
inciden sobre los bordes externos
de la zona sensible de la imagen,
cuando la imagen se encuentra
enfocada a una distancia infinita.
Puesto que la zona sensible es
normalmente rectangular, su
tamao no es lo mismo en todas
las direcciones, pudindose
hablar del ngulo visual
horizontal, vertical, as como del
ngulo visual segn la diagonal.
Normalmente, los sensores de
vdeo son caracterizados por su
diagonal, D, por tanto, el ngulo
visual se expresa en funcin de
este valor. Figura 2. 26. ngulo visual de la ptica

Se observa de la expresin que el ngulo visual disminuye con el aumento de la


distancia focal de la lente.

2.3.5 Diafragma

El rea efectiva de la lente va a influir


en las caractersticas de la imagen proyectada
en la zona sensor. Para poder modificar el
rea efectiva de la lente, sin tener que
cambiarla, se emplea el diafragma. El
diafragma es una superficie opaca, colocada
en la ptica, que permite el paso de los rayos
luminosos en un crculo central de la lente e
impide que los rayos que inciden sobre la
corona pasen. Los diafragmas se construyen
de manera que la abertura central sea Figura 2. 27. Colocacin del diafragma
variable, posibilitando de esta manera una

54 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

graduacin del tamao efectivo de la lente.

Para una lente con una distancia


focal fija, el efecto ms inmediato de la
variacin de la abertura del diafragma se
refleja en la cantidad de luz que incide
sobre el plano sensor. Esta cantidad de luz
es proporcional al rea efectiva de la lente.
Si se denomina con D el dimetro de la
abertura efectiva, la energa incidente de
los rayos ser proporcional a D2. Pero la
luminosidad en el plano imagen no
depende slo de la cantidad de luz que Figura 2. 28. Abertura de la lente dependiendo del
nmero F
atraviesa la lente, sino tambin de la
distancia entre la lente y el plano sensor, la cual es proporcional al cuadrado de su
distancia focal. Segn estos razonamientos, la luminosidad de una lente, que expresa el
flujo de luz en la superficie del rea sensible, es proporcional a D2/f2.1 Para cuantificar
la luminosidad de una imagen se emplea el nmero F de una lente que se define como
F=f/D. Por tanto, una disminucin del nmero F en un valor de 2 equivale a un
aumento del doble de la potencia luminosa.

2.3.6 Profundidad de campo

Para que un objeto situado a una distancia L produzca una imagen ntida es
necesario que la lente se encuentre situada a una determinada distancia del plano sensor.
Esta distancia depende de la distancia L del objeto y de la distancia focal de la lente, f.

Cualquier objeto, situado delante o detrs del enfocado, dar lugar a que los
rayos provenientes de un punto de ste no focalicen en el plano de la zona sensible. En
el sensor quedar proyectado como una mancha, denominado crculo de confusin.

Si el dimetro del crculo de


confusin es menor que la mitad de la
resolucin del sistema de adquisicin de la
imagen, dicho sistema ve tambin como un
solo punto de imagen. Por el contrario, si
el circulo de confusin generado por un
punto fuera del foco es mayor que el valor
mencionado, dicho punto aparecer como
borroso o desenfocado. A este valor crtico

Figura 2. 29. Crculo de confusin

D2
I
1
= I d r I 4 2 2
f F

Dpto. Electrnica, Automtica e Informtica Industrial 55


Carlos Platero Apuntes de Visin Artificial

se le denomina circulo permisible de confusin, .

Cuando un punto del objeto se encuentra ms cerca o ms lejos de la distancia L,


a la que se encuentra enfocado el sistema, pero a una distancia tal que el crculo de
confusin generado sea menor del permisible, dicho punto tambin se encontrar
enfocado.

Se denomina profundidad de campo a la zona dentro de la cual el objeto forma


una imagen ntida o enfocada. Este valor viene determinado por el radio del circulo
permisible de confusin, , la distancia focal, f, y la apertura del diafragma, F:

F L2 F L2
d = d1 + d 2 = +
f 2 F L f 2 + F L (2. 5)

Siendo d1 y d2 las distancias lmites de


los puntos enfocados por detrs y por delante
respectivamente respecto al punto de foco. La
profundidad de campo, d, posee las siguientes
caractersticas:
1. A mayor nmero F da mayor
profundidad de campo.
2. A menor distancia focal da mayor
profundidad de campo
3. A mayor distancia al objeto
supone mayor profundidad de Figura 2. 30. Profundidad de campo
campo.
4. Cuanto mayor sea el radio del crculo de confusin permisible, menor
resolucin del sistema y tanto mayor ser la profundidad de campo.
5. La profundidad de campo es mayor por detrs del objeto que por delante,
d1>d2.
La primera caracterstica supone que cuanto menor sea la apertura de la lente
mayor ser la profundidad de campo. La apertura de la lente hace algo ms que
controlar la cantidad de luz que penetra en la cmara. Tiene una segunda funcin, muy
importante, la de controlar la profundidad de campo.

2.3.7 Aberraciones y distorsin de la imagen

El trmino aberraciones designa las imperfecciones introducidas en las


imgenes por los sistemas pticos. Hasta ahora se ha supuesto que la lente hace
converger los rayos divergentes de un punto del espacio en un nico punto del plano
sensor. Sin embargo, este hecho slo sucede cuando la luz es monocromtica y situada
en las proximidades del eje ptico. Hay dos clases de distorsiones: cromticas y
geomtricas. Las primeras estn relacionadas con el espectro frecuencial de los rayos y
las segundas aparecen si los rayos que inciden en la ptica estn alejndose del eje axial
de la lente.

56 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

2.3.7.1 Aberracin cromtica

Se debe al diferente ndice de refraccin de un rayo luminoso segn su longitud


de onda. Existen dos tipos de aberracin cromtica: longitudinal y lateral.

Aberracin cromtica longitudinal. Este


tipo de aberracin provoca que los rayos de
distintas longitudes de onda procedentes de un
punto sobre el eje ptico de la lente se enfoquen
sobre diferentes planos de imagen.

Aberracin cromtica lateral. Ocurre


debido a que la magnificacin de la lente cambia
segn la longitud de onda del rayo, produciendo un
desplazamiento lateral de los puntos de Figura 2. 31 Aberracin cromtica
convergencia de los rayos de diferente longitud de
onda.

2.3.7.2 Aberracin geomtrica

Las cinco aberraciones geomtricas bsicas o aberraciones de Seidel, en honor al


investigador que las clasific, son: esfrica, coma, astigmatismo, curvatura de campo y
distorsin. Las cuatro primeras afectan a la nitidez de la imagen y la quinta a la forma
de la imagen.

Aberracin esfrica. Del haz de rayos que parten de un punto del objeto situado
sobre el eje de la lente, aquellos que
entran en la lente a una mayor altura
sobre dicho eje son refractados a
diferentes puntos sobre el eje ptico,
producindose un desplazamiento del
foco. La aberracin esfrica puede ser
subsanada mediante el diafragma;
cuanto mayor sea el valor de F, menor
ser el radio de la lente, reducindose

as esta aberracin. Figura 2. 32. Aberracin esfrica

Coma. Hasta ahora se ha


supuesto que los rayos son paraxiales,
pero cuando inciden con un cierto
ngulo sobre el eje, stos no son
enfocados sobre el plano de imagen,
sino que forman una imagen similar a
un cometa con una cola. La cola tiene
el aspecto de crculos que permanecen
siempre tangentes a dos rectas que
forman entre s un ngulo de 60. Esta
cola puede apuntar en la direccin al
Figura 2. 33. Aberracin de coma

Dpto. Electrnica, Automtica e Informtica Industrial 57


Carlos Platero Apuntes de Visin Artificial

centro de la imagen o en la opuesta, originando la coma entrante o la coma saliente. Un


objeto que contenga curvas concntricas al eje ptico sufrir un gran desenfoque a lo
largo de un borde de cada curva concntrica. Si una lente no est corregida contra la
coma, el contraste en los bordes de la imagen ser malo. La coma puede ser corregida
dando una menor apertura al diafragma.

Astigmatismo. En algunos
objetivos ocurre que resulta
imposible enfocar con nitidez
simultneamente los objetos
verticales y horizontales, incluso
estando ambos en el mismo plano.
Este defecto se comprueba
fcilmente fotografiando unas
rejillas metlicas y examinando
atentamente los bordes. Si el plano
de enfoque se desplaza hasta Figura 2. 34. Astigmatismo
encontrar las lneas perpendiculares
de forma ntida, las horizontales aparecern borrosa y viceversa. Disminuyendo la
apertura del diafragma, y por tanto aumentando la profundidad de campo, se consigue
disminuir el astigmatismo hasta un cierto punto, pero no se elimina completamente.

Curvatura de campo.
Representa la incapacidad de
una lente para enfocar un objeto
plano sobre el plano sensor.
Realmente, el plano focal de un
objetivo no es totalmente plano,
sino que forma una superficie
cncava hacia el objetivo. Como
la zona sensible est totalmente
plana, es difcil enfocar a la vez
y exactamente, el centro y los
bordes de la imagen. Los
fabricantes solucionan esta Figura 2. 35. Curvatura de campo
degradacin, parcialmente,
variando el diseo de las lentes. Como el astigmatismo, la curvatura de campo puede ser
corregida disminuyendo la apertura del diafragma para aumentar la profundidad de
campo.

Distorsin. Mientras que


las aberraciones descritas hasta
ahora se relacionan con la nitidez
del enfoque de la imagen, la
distorsin afecta a la forma que
toma el conjunto de la misma. Se
acostumbra a expresar la
distorsin como un porcentaje
entre la altura ideal de la imagen y

Figura 2. 36. Modelo de distorsin

58 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

la distancia que los puntos se desvan de su posicin en la imagen ideal. La distorsin


destruye la perfecta semejanza entre el objeto y su imagen, dando o bien un efecto de
cojn (distorsin positiva) o bien un efecto de barril (distorsin negativa).

Los objetivos ms sencillos y los de amplio ngulo visual, deforman las lneas
rectas tanto vertical como horizontalmente. Al fotografiar una cuadrcula, sta puede
deformarse de forma cncava o convexa, resultando as las llamadas distorsiones de
"cojn" y "barrilete". La de cojn ocurre cuando el diafragma est colocado entre el
ltimo grupo de lentes y la de barrilete cuando est ms cerca de la parte frontal.

En el modelo de la distorsin cabe considerar dos componentes: una radial y otra


tangencial. Cada una de ellas se modela como una serie de infinitos trminos. Sin
embargo, para la mayora de las aplicaciones de visin es suficiente con modelar slo la
distorsin radial y, de sta, vale con los dos primeros trminos de la serie. De esta
forma, la relacin entre los pxeles con y sin distorsin sera:

( )
x d 1 + k1 r 2 + k 2 r 4 xu 2 2 2
r = x d + y d
( 2
)
y d 1 + k1r + k 2 r y u
4
(2. 6)

Donde (xd,yd) son las coordenadas del pxel distorsionado y (xu,yu) del pxel sin
distorsin. El grado de distorsin viene dado por los valores de ki. En la figura de abajo
se muestra los modelos de distorsin tanto radial como tangencial, as como la
combinacin de ambos efectos, procedentes de la cmara empleada en las prcticas de
la asignatura.

Figura 2. 37. Modelo de distorsin de la ptica de la cmara de prcticas

2.3.7.3 Efecto del diafragma sobre las aberraciones

Segn se acaba de comentar, los defectos provocados por las aberraciones


pticas aumentan con el tamao efectivo de la lente, puesto que los rayos incidentes en
los extremos de la lente sufren mayores desviaciones de foco y distorsin que los rayos
centrales. Como consecuencia de esta conclusin, cuanto ms cerrado est el diafragma
y por tanto menor sea la apertura efectiva de la lente, tanto menor ser los defectos
apreciables de la lente. El efecto adverso ser una disminucin de la intensidad
luminosa que atraviesa la cmara, cuya consecuencia se traduce en un aumento de la
potencia de la fuente luminosa para conservar el nivel de excitacin radiomtrica del
pxel.

Dpto. Electrnica, Automtica e Informtica Industrial 59


Carlos Platero Apuntes de Visin Artificial

2.3.8 Funcin de punto extendido (PSF y OTF)

Por muy pequeo que sea el orificio de


una cmara real, por l siempre pasarn varios
rayos pertenecientes al haz de rayos divergentes
que se originan de la reflexin de la luz sobre
cualquier superficie. Este hecho implica que en
vez de tener un punto luminoso en el plano
sensor, se tendr un crculo proyectivo. El
efecto anterior provoca una degradacin en la
imagen. La luz incidente en cada punto del
plano sensor proviene de un conjunto de puntos
prximos del objeto y no de un solo punto. Figura 2. 38. Degradacin del pulso de
dirac
Cuando se emite un pulso de luz, tipo
dirac, ste es procesado por el sistema ptico, formando sobre el plano sensor una
mancha difusa. La distribucin de radiacin sobre el plano sensor del pulso de luz,
cuando el nivel de radiacin es la unidad, se define como la funcin de punto extendido
(Point Spread Function, PSF). A la transformada de Fourier de la funcin de punto
extendido se la denomina funcin de transferencia ptica (OTF).

PSF |OTF|

0.2 1

0.8
0.15

0.6
0.1
0.4

0.05
0.2

0 0
15 40
15 40
10
10 20
5 20
5
0 0 0 0

Figura 2. 39. Distribucin gaussiana de la PSF y su funcin de transferencia ptica

60 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

2.3.9 Lentes comerciales.

Para evitar las degradaciones de la lente fina, las pticas o lentes comerciales, se
componen de varias lentes simples para intentar disminuir las aberraciones. La
diferencia fundamental entre las pticas utilizadas en fotografa y las usadas en las
cmaras de vdeo es el tamao del plano de la imagen. Mientras las fotogrficas
emplean una imagen de 35 mm, las de vdeo utilizan un plano sensor segn el tamao
del CCD empleado; los ms usuales son los de 1/3 y 1/2 de pulgada, aunque existen
CCD desde 1/7 hasta 1 pulgada. El tamao del CCD se refiere a su diagonal y la
relacin entre su anchura y altura suele ser de 3/4.

2.3.10 Caractersticas de las pticas.

Enfoque. Como se ha visto anteriormente, actuando sobre el enfoque se puede


conseguir una imagen ms o menos ntida. Las pticas comerciales se pueden clasificar
por el enfoque en: pticas fijas, pticas variables y pticas motorizadas. Estas ltimas
disponen de un motor de forma que se puede enfocar o bien de forma automtica o bien
de forma teleoperada.

Iris o diafragma. El dispositivo de apertura est formado de lminas muy


delgadas dispuestas de tal manera que en el centro se forma un crculo por el que puede
entrar la luz. Abriendo o cerrando el iris entrar ms o menos luz, haciendo que la
imagen sea ms clara o ms oscura. Como se ha visto anteriormente cerrando el iris
tambin se aumenta la profundidad de campo y se disminuyen las aberraciones de la
lente, sin embargo se tendr que iluminar ms la escena. El iris puede ser manual,
automtico (autoiris) o motorizado. Las pticas con autoiris tienen un motor, al igual
que las motorizadas, pero sta no se controla por un usuario a distancia, sino por la
propia cmara. Las cmaras de vdeo tienen una salida de control para este propsito
que se conecta con un cable a las pticas con autoiris. La cmara regular el autoiris
abrindolo o cerrndolo en funcin de la cantidad de luz que est recibiendo.

Zoom. Las pticas con zoom permiten, mediante dos conjuntos de lentes que se
pueden acercar o separar, variar la distancia focal. De esta manera se puede fijar en
detalles que a simple vista no se aprecian. El efecto de aumentar el zoom es la
disminucin del ngulo de vista. Las pticas pueden ser con o sin zoom y stas pueden
ser manuales o motorizadas.

2.3.11 Parmetros de las pticas.

A la hora de comprar una ptica en el mercado para un sistema de visin hay


que tener claro las necesidades del proyecto. El precio de la ptica puede variar entre
unos pocos euros hasta cientos de euros, en funcin de sus caractersticas y calidades.
Los principales parmetros en la eleccin de una ptica son:

Distancia focal f. La ptica comercial tiene dos puntos principales, primario y


secundario. La distancia en milmetros entre el punto principal-secundario y el sensor de
imagen es la distancia focal. En pticas de enfoque variable, se permitir un
desplazamiento del segundo punto principal para modificar el foco respecto al valor
nominal. En el caso de pticas motorizadas, se dar el rango de enfoque. Es el principal

Dpto. Electrnica, Automtica e Informtica Industrial 61


Carlos Platero Apuntes de Visin Artificial

parmetro a tener en cuenta, ya que ste va a delimitar a que distancia se encuentra la


cmara de la escena.

Nmero F. Es el ndice de cantidad de luz que pasa a travs de la lente. Cuanto


ms pequeo sea el nmero F, mayor ser la cantidad de luz. Se puede calcular su valor
como la relacin entre la distancia focal y dimetro efectivo de apertura.

Angulo de vista. Es el ngulo que se forma con las dos lneas que parten desde
el punto principal secundario a los extremos de la diagonal del sensor de imagen. A un
mayor ngulo de vista se obtendr un mayor campo de la escena en la imagen.

Rosca. La rosca es la forma con la que la ptica se sujeta a la cmara. Las ms


tpicas en pticas de vdeo son la rosca C y la rosca CS, habiendo incluso adaptadores
de uno a otro. En cmaras fotogrficas se suele emplear la rosca de bayoneta. Existen
otros tipos de rosca como la rosca K y otras que emplean algunos fabricantes
particulares como la rosca Watec.

2.4 Sensores de vdeo

Bsicamente, la cmara fotogrfica del siglo XIX se constitua


por una caja estanca en la atravesaba la luz a travs de una lente. Un
dispositivo mecnico dejaba pasar, durante un pequeo lapsus de
tiempo, la radiacin incidente sobre el interior de la caja. La escena se
proyecta sobre la zona sensible, la cual estaba formada por cristales de
halogenuros de plata, muy sensibles a la luz. La tecnologa de la
fotografa se ha modificado espectacularmente hasta hoy da, pero el
principio sigue siendo el mismo.

En 1897 se invento el tubo de rayos catdicos, ofreciendo la oportunidad de


imgenes no fotogrficas, pero no fue hasta 1923 cuando se perfeccion para poder
adquirir imgenes. El sistema usaba un tubo de vaco, una pantalla sensible a la luz y un
haz de electrones para el escaneado de la seal. La llegada en 1930 de la televisin
comercial hizo que las cmaras de vdeo alcanzaran una importancia trascendental.

En 1970 se invent el primer sensor de estado slido. La imagen era formada por
la conversin de los fotones a cargas elctricas. Esta transformacin se realiza por un
elemento semiconductor llamado pxel que se dispona en forma matricial. Las cargas
elctricas eran ledas posteriormente por filas y por columnas,
transformando la seal de vdeo en informacin elctrica. Se
inicio entonces una batalla por la dominacin del mercado entre
las cmaras de estado slido y las de tubo de vaco. sta fue
ganada por las cmaras de estado slido antes sus innumerables
ventajas, como espacio, inmunidad a vibraciones, coste de
fabricacin, etc. Algo similar se libra hoy en da entre las clsicas
cmaras fotogrficas analgicas y las digitales.

62 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

2.4.1 Cmaras de estado slido

La mayora de las cmaras de estado slido estn basadas en dispositivos de


cargas acopladas o CCD (Charge Coupled Deviced), si bien existen otras tecnologas,
como son la de inyeccin de carga o CID (Charge Injection Deviced) o las basadas en
integracin o TDI (Time Delay Integration). Otra tecnologa pujante es la basada en
CMOS. Aun as, el funcionamiento bsico en las distintas tecnologas es similar y est
basado en el efecto fotoelctrico. Los fotones de la luz pasan por una estructura
cristalina de silicio y son absorbidos creando pares electrn-hueco. La cantidad de pares
electrn-hueco ser proporcional a la intensidad de luz que ha incidido sobre el
elemento sensor.

2.4.2 Fundamentos del fotosensor.

El elemento bsico de las clulas fotosensibles son los pxeles. stos estn
constituidos por condensadores MOS (Metal Oxido Semiconductor). Sobre un substrato
de silicio de tipo P, se monta una zona de tipo N y se deposita una pelcula de dixido
de silicio, SiO2, formando una
capa de aislante o dielctrico.
Encima de esta capa se sita un
electrodo conductor de polisilicio
transparente. La radiacin
incidente de la luz visible pasa a
travs del conductor transparente y
crean pares electrn-hueco en el
semiconductor. Los huecos libres
se combinan con los electrones del
substrato, mientras que la
acumulacin de los electrones
libres produce una carga elctrica
proporcional a la intensidad de la
luz y al tiempo de integracin.

Figura 2. 40 Estructura del pixel

2.4.3 Modelo radiomtrico del pxel

Si el sistema de adquisicin de imgenes,


lente ms cmara, se encuentra a una distancia de
R1, desde la superficie de observacin, el nivel
energtico de fotones incidentes dentro del sistema
ptico, de rea A0 y durante el tiempo de
integracin, tI, es de:

Figura 2. 41 Modelo radiomtrico del


pixel

Dpto. Electrnica, Automtica e Informtica Industrial 63


Carlos Platero Apuntes de Visin Artificial

d Lr S aparente d r
A0
nlente = Lr AS At I
R12 (2. 7)

donde Lr es la radiacin refleja en la direccin del sensor y A es el coeficiente


de transmisin atmosfrica. El nmero de fotones que alcanza el sensor ser:

A0
nsensor = Lr AS A O t I
R12 (2. 8)

O es la transmitancia del sistema ptico. El nmero de fotones incidentes en un


pxel, es una relacin de reas que depende del factor de relleno:

Apixel
n pixel = nsen sor
Asen sor (2. 9)

usando la aproximacin de ngulo pequeo para rayos axiales:

As R12
=
Asen sor R22 (2. 10)

e introduciendo los conceptos de magnificacin ptica, M, y la relacin del


modelo de lente delgada:

1 1 1
+ =
R1 R2 f (2. 11)

el nmero de fotones que recibe el pxel ser:

A0 Apixel
n pixel Lr 2
A O t I
f 2 (1 + M ) (2. 12)

asumiendo una apertura circular e introduciendo el concepto de F - nmero,


quedar:

Lr Apixel
n pixel = A O t I
4 F 2 (1 + M )2 (2. 13)

Todas las variables son funcin de la longitud de onda y de la energa de los


fotones. El nmero de fotoelectrones generados en un detector de estado slido es:

64 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

2
n pe = Rr ( ) n pixel ( ) d
1

2 Lr ( ) Apixel
n pe = Rr ( ) A ( ) O ( ) t I d
1 4 F 2M 2 (2. 14)

siendo Rr() la sensibilidad espectral del pxel ante la luz. Como se observa, la
conversin de la radiacin a seal elctrica es slo funcin de la luminancia. No
discrimina el color. Para adquirir el color se necesitar que la integracin se extienda
slo en una franja del espectro determinada. Se suele emplear la teora del triestmulo,
separando la radiacin en tres zonas espectrales, las correspondientes al modelo RGB.
Por otro lado, la conversin de fotones a carga elctrica no es un proceso determinista
sino probabilstico, debido al carcter cuntico del fenmeno fotoelctrico.

Una vez obtenida la cuantificacin de la radiacin incidente hay que transmitirla.


Esta operacin depende de la arquitectura de la cmara y de la tecnologa a emplear.
Pero bsicamente se hace a travs de los vecinos de forma secuencial, de modo similar a
cmo se comporta un registro de
Puerta V1
desplazamiento. El mecanismo se basa en V2
aplicar unas seales de reloj sobre los
Pixel Pixel
electrodos de cada pxel. Al aplicar un
potencial positivo en el vecino de un pxel,
T1
cuyo pozo de electrones libres es
Carga
proporcional a luz recibida, estos se T2
desplazarn a la ubicacin del vecino,
transfirindose la carga y produciendo un T3
registro de desplazamiento analgico. Este
tipo de transferencia se conoce como T4
CCD. En la figura se observa un CCD con
dos seales de desfase, V1 y V2, que son
utilizadas para transferir cargas desde los
fotosensores al registro de lectura Figura 2. 42. Transferencia de cargas CCD
mediante el efecto CCD.

2.4.4 Arquitectura de las cmaras

Segn la disposicin de los pxeles, las imgenes pueden ser:

 Unidimensionales (cmaras lineales, asociadas a un vector de sensores)

 Bidimensionales (cmaras matriciales, asociadas a una matriz de


sensores).

2.4.4.1 Cmaras lineales

Si bien es posible encontrar cmaras matriciales de hasta


5120 x 5120, stas exigen anchos de bandas muy elevados. Por
ejemplo, si se desea 25 cuadros por segundo, el volumen de

Dpto. Electrnica, Automtica e Informtica Industrial 65


Carlos Platero Apuntes de Visin Artificial

informacin es de 640 Mpixel/s, hacindose prohibitivo para la mayora de las


aplicaciones industriales. Con el fin de evitar este exceso de informacin y si se desea
alta resolucin, la solucin hay que encontrarla en las cmaras lineales.

La tecnologa de cmaras lineales hace mucho tiempo que fue desarrollada para
aplicaciones de inspeccin de materiales fabricados en continuo, como papel, tela,
planchas metlicas, etc. Sin embargo, en la actualidad se est imponiendo en muchos
otros procesos productivos que requieren de alta resolucin y /
o alta velocidad a un precio competitivo.

Las cmaras lineales utilizan sensores lineales que


acostumbran a tener entre los 512 y 8192 elementos (pxeles),
con una longitud lo ms corta posible, y con una gran calidad
con el fin de obtener la mejor sensibilidad y prestaciones.

El hecho de construir una imagen de alta calidad a


partir de lneas individuales requiere un alto grado de precisin. La alineacin y los
sincronismos del sistema son crticos si se quiere obtener una imagen correcta del objeto
a analizar.

Constructivamente las cmaras lineales


carecen de distancia interpixel, esto es, no detectores
existen zonas no sensibles. Ello es debido a que
el registro de desplazamiento se encuentra a uno Registro de desplazamiento

de los lados de los fotosensores, y aunque ste a)

tambin es sensible a la luz, se cubre con una Registro de desplazamiento


capa protectora. Pudindose en este caso doblar
la resolucin de la cmara lineal. detectores

Registro de desplazamiento

2.4.4.1.1 Cmaras lineales TDI b)

En una cmara lineal convencional, el


Figura 2. 43. a) un nico registro de
mximo tiempo de exposicin est limitado a la desplazamiento b) doble registro
velocidad de la escena. Como consecuencia de
este tipo de adquisicin, se necesita mucha ms iluminacin que en una cmara
matricial donde la mxima exposicin es la velocidad de captura de cuadro. Por tanto,
limita la velocidad a la que la cmara lineal puede funcionar y hace prcticamente
imposibles las aplicaciones de alta velocidad y baja iluminacin.

La tecnologa TDI (Time Delay Integration) utiliza el movimiento sincronizado


para capturar mltiples tomas de la misma lnea y sumarlas, obteniendo una lnea con
sensibilidad amplificada. TDI es el nombre dado al mtodo de combinar muchas lneas
individuales a la vez, con el fin de incrementar la sensibilidad de la cmara. La ventaja
de este mtodo reside en la mejora de la relacin seal - ruido.

Las cmaras ms modernas incorporan hasta 96 lneas de sensores, de forma que


pueden alcanzar hasta 96 veces ms sensibilidad que una cmara lineal convencional.

66 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

El dispositivo se presenta fsicamente como un array de sensores bidimensional,


con un aspecto idntico al de cualquier cmara matricial. El matiz que lo hace diferente
es la forma de capturar la imagen y la electrnica que lleva integrada para que esto se
pueda realizar. Mientras que en una cmara matricial se hace un muestreo de la
informacin del array completo, en el TDI
slo se aprovecha una nica lnea. Adems
esta lnea no ser siempre la misma y se ir Direccin del objeto

sumando a las anteriores, hasta que termine


el periodo de integracin que se haya
prefijado. T2
T1

Para entender el modo de operar de


una cmara TDI, se sigue la figura 2.44. En
el tiempo T1, la imagen se sita en el primer
T4
detector y crea una carga. Llegado el tiempo T3

T2, la imagen se ha desplazado al segundo


detector. Simultneamente, el reloj del pxel
ha movido la carga del primero al segundo
Cmara TDI
detector. En este punto, se crea una imagen
Elementos TDI
formada por la carga anterior aadindose la
nueva creada en el segundo detector y as
Movimientos de la banda
sucesivamente. La carga (seal) se
incrementa linealmente con el nmero de
detectores, tambin lo hace el ruido pero no
proporcionalmente sino con la raz cuadrada Lneas de inspeccin

del nmero de elementos TDI, NTDI. El


resultado es una mejora de la relacin seal
ruido en NTDI . Figura 2. 44 Efecto TDI

Con las cmaras TDI, por tanto, se puede alcanzar ms velocidad con baja
iluminacin. Sin embargo, hay que tener en cuenta que este tipo de cmaras deben estar
perfectamente alineadas con la direccin del movimiento de la aplicacin y que la
velocidad de la aplicacin debe ser bastante constante.

Entre sus aplicaciones, a parte de las industriales, se encuentran las capturas de


imgenes procedentes de los satlites. Estas imgenes se caracterizan por tener una gran
variabilidad de iluminacin, de ser adquiridas a velocidad constante y de desear una alta
resolucin. Por tanto, las cmaras TDI son ideales para estas tareas.

2.4.5 Cmaras matriciales

Una cmara matricial produce una imagen de un rea,


normalmente con una relacin de aspecto de 4 a 3. Esta relacin
viene de los tiempos de las cmaras Vidicon y de los formatos de
cine y televisin. Actualmente existen muchas cmaras que ya no
mantienen esta relacin y que no siguen los formatos de la
televisin analgica.

Dpto. Electrnica, Automtica e Informtica Industrial 67


Carlos Platero Apuntes de Visin Artificial

Los sensores de cmaras modernos son mayoritariamente de tipo CCD o


CMOS. Miles de diodos sensibles se posicionan de forma muy precisa en una matriz y
los registros de desplazamiento transfieren la carga de cada pxel para formar la seal de
video.

Los tamaos de las cmaras


matriciales estn definidos en pulgadas.
Los formatos ms comunes actualmente
son de 1/3", ", y 2/3". Figura 2. 45. Tamaos de los CCD

2.4.5.1 Caractersticas de las cmaras matriciales

2.4.5.1.1 Factor de relleno

El factor de relleno es el porcentaje del rea de pxel que es sensible a la luz. El


caso ideal es 100%, esto es, cuando los pxeles activos ocupan el 100% del rea del
sensor. Sin embargo, circuitos como los registros de lectura y los circuitos anti-
blooming reducen este factor, en algunas ocasiones hasta en un 20%. El efecto de esta
reduccin se traduce en una menor sensibilidad y en problemas de muestreo. Para evitar
estas desventajas, muchos sensores con bajo factor de relleno (normalmente CCD con
transferencia interlnea) utilizan microlentes que cubren cada uno de los pxeles
incrementando la efectividad del factor de relleno.

2.4.5.1.2 Transferencia de las cmaras CCD

Uno de los mayores inconvenientes de una matriz de fotosensores es la


transmisin de las seales recogidas. Dependiendo de la tecnologa de la cmara,
existen diferentes estructuras para la adquisicin y transmisin de la informacin.
Cualquier cmara, en principio, requerira un rea fotosensora que fuera capaz de captar
toda una imagen enfocada sobre ella mediante un sistema ptico. Esta matriz de
elementos fotosensores es la encargada de recoger la informacin que presenta la escena
que se desee captar. Tras un cierto tiempo (denominado tiempo de integracin), la
informacin luminosa de la escena se encuentra recogida en esta matriz de elementos.
Para extraer esta informacin de los elementos se utiliza la tcnica de registro de
desplazamiento analgico. De esta forma, la carga generada en cada elemento sensor se
desplaza hasta la salida del dispositivo en su conjunto. Existen distintas configuraciones
posibles que darn lugar a diferentes posibilidades tanto en la extraccin como en la
transmisin de la informacin adquirida. Las transferencias ms empleadas son:
transferencia de cuadro, transferencia interlinea y transferencia de cuadro interlnea.

Transferencia de cuadro (Full Frame).- Son los CCD que tienen una
arquitectura ms simple. Emplean un registro paralelo simple para exposicin de los
fotones, integracin de la carga y transporte de la carga. Se utiliza un obturador
mecnico para controlar la exposicin. El rea total del CCD est disponible para recibir
los fotones durante el tiempo de exposicin. El factor de relleno de estos tipos de CCD
es del 100%.

68 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

Segn este tipo de estructura el chip de silicio se divide en dos reas. En la mitad
superior del dispositivo aparece la seccin donde va a incidir la luminosidad de la
imagen que se desea captar en un momento determinado, mientras que en la mitad
inferior, se encuentra el rea de almacenamiento de cargas y el registro de salida. Esta
mitad inferior, evidentemente estar recubierta por una placa opaca de forma que la luz
no pueda alcanzarla y as no
contamine la informacin Fotodiodos
Registro de
desplazamiento vertical
Fotodiodos
recogida por el rea de la
zona superior.

Transferencia
interlnea - Los CCD que
incorporan esta tecnologa
son los ms comunes y
utilizan registros de
Registro serie de lectura
desplazamiento que se
encuentran entre las lneas de Matriz de almacenamiento
los pxeles y se encargan de
almacenar y transferir los
datos de la imagen. La
principal ventaja de este tipo
Registro serie de lectura
de CCD es la alta velocidad
de obturacin, pero no son
tan sensibles y precisas como Figura 2. 46 a) Transferencia interlinea b) Transferencia interlinea
cuadro
otros tipos de tecnologas.
Tienen un bajo nivel de factor de relleno y un rango dinmico ms bajo.

Este tipo de transferencia consiste en un array de fotodiodos separados por


registros de transferencia vertical, que son cubiertos por una opaca capa de metal.
Despus de la integracin, las cargas generadas por los fotodiodos son transferidas al
registro vertical CCD en un tiempo de 1s, minimizando los efectos de manchas. La
principal ventaja de esta transferencia es la rapidez, por lo que no hay necesidad de
utilizar obturadores. La desventaja es que este tipo de salida implica una menor zona
activa del sensor. El rea efectiva puede estar por debajo del 20%. Aunque este factor
puede ser ampliado mediante el uso de microlentes.

Transferencia de cuadro interlnea- Este tipo de estructuras incorpora


caractersticas tanto de la transferencia interlinea como de la de cuadro completo. La
parte superior de la estructura es exactamente igual a una interlineal. Las cargas se
mueven horizontalmente desde los elementos fotosensores hacia el registro de
desplazamiento vertical durante el periodo de borrado vertical. Una vez las cargas estn
en el registro de desplazamiento vertical, en lugar de ser ledas fila a fila a la frecuencia
de lnea, son enviadas a un array de almacenamiento. Este array de almacenamiento
est, al igual que el registro de desplazamiento vertical, cubierto por una mscara de
aluminio opaca a la luz. Es desde este array de almacenamiento donde las cargas pasan
fila a fila al registro de salida. La diferencia es que en esta zona de almacenamiento los
paquetes de informacin no corren ningn peligro de ser contaminados por excesos de
carga que hayan penetrado en el registro de desplazamiento vertical, ya que en ste
permanecen durante un perodo de tiempo muy pequeo. Adems, por tener el chip el

Dpto. Electrnica, Automtica e Informtica Industrial 69


Carlos Platero Apuntes de Visin Artificial

registro de desplazamiento vertical separado de los elementos fotosensores y cubierto


por una mscara opaca a la luz, no ser necesario el empleo de obturadores mecnicos,
como ocurra en los chips de cuadro entero.

Esta estructura ofrece las mejores prestaciones de los CCDs actuales. Sin
embargo, su estructura es compleja y requieren un rea total mayor al tener la zona de
almacenamiento separada. En concreto el rea activa es alrededor del 22% del total de
la zona sensora, lo cual ofrece una idea de la relacin entre la zona activa y la zona
sensora presentada en el proceso de captacin de imgenes.

2.4.5.1.3 Integracin de la seal de salida.

Las seales de vdeo fueron estandarizadas antes de que existiesen las cmaras
de estado slido. Los formatos de vdeo definen la frecuencia de la seal de video, el
nmero de lneas por cuadro y el nmero de cuadros por segundo. Muchas de las
cmaras de estado slido siguen estos estndares, haciendo que la salida de la
informacin sea de tipo entrelazado, como son las mayoras de las seales de televisin.
De esta forma, en los CCD con estructura de transferencia de campo, los mismos
elementos fotosensores son utilizados en los campos pares e impares. En las estructuras
de transferencia interlinea y de transferencia de cuadro, no es as, sino que se utilizan
pxeles separados para cada campo, con el inherente aumento de resolucin vertical.
Existen dos posibles modos de lecturas de las cargas: Integracin de cuadro e
integracin de campo. Impar
Par
En el modo de integracin de a
}
cuadro cada elemento acumula cargas }} b
c
}
}
a+b
b+c

durante un cuadro (dos campos) antes d


c+d
}
de transferirlas al registro de
desplazamiento vertical y desde l ser
enviadas hacia la salida. Otra opcin }} }
posible consiste en combinar las
cargas de filas adyacentes del array de
fotosensores. En este caso, los pxeles
son ledos cada campo,
denominndose este modo integracin
de campo. Como las seales Figura 2. 47 Entrelazado a)Campo b)Cuadro
adyacentes se promedian, la
resolucin vertical obtenida es menor que en el modo de Integracin de Cuadro. Sin
embargo, como la carga slo se integra durante un campo, se obtiene mayor resolucin
dinmica que con el modo de Integracin de Cuadro.

2.4.5.1.4 Cmaras progresivas

La mayor desventaja de las cmaras entrelazadas est en el desfase de los


tiempos de integracin, bien sea entre lneas o entre campos. Con el objeto de evitar
parar el movimiento de los objetos al visualizarlas, accin requerida con las cmaras
entrelazadas, aparecen las cmaras progresivas. stas escanean secuencilmente lnea
a lnea las imgenes. La primera ventaja de las cmaras progresivas es la de tomar

70 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

imgenes en un mismo instante, en contraste con los sistemas entrelazados que


adquieren la imagen en el distintos tiempo de integracin. As cualquier movimiento
vertical producido entre campos, provocar manchas en la imagen, mientras
movimientos horizontales originan cortes en las lneas verticales. An en el caso de
utilizar luces estroboscpicas para congelar el movimiento, se tienen imgenes
continuas slo en el campo que fue activado el pulso de luz. Cuando hay movimiento,
slo un campo puede ser usado para el procesamiento de las imgenes, reduciendo en
un 50% la resolucin. En la figura se aprecia la discontinuidad de las cmaras
entrelazadas y la mejora de las progresivas, aumentando la resolucin vertical respecto a
las entrelazadas.

fotodiodo CCD vertical fotodiodo CCD vertical


V1 V2 V3 V4 V1 V2 V3 V4

1 1

2 2

3 3

4 4

Transferencia entrelazada Transferencia progresiva

Figura 2. 49. Efecto del movimiento


a)carcter en movimiento horizontal b)
Discontinuidad de la imagen debido al Figura 2. 48. Diferencias constructivas entre
sistema entrelazado c) salida de una entrelazada y progresiva
cmara progresiva

La diferencia entre progresivas y entrelazadas est en su aspecto constructivo.


Obsrvese en la figura como las cmaras progresivas, de cuatro fases, difieren en su
diseo, permitiendo almacenar cargas en el mismo instante de tiempo.

2.4.5.1.5 CCD versus CMOS

Mientras que las cmaras CCD presentan una conversin de fotones a cargas
elctricas y stas son desplazadas segn los distintos tipos de transferencias descritos;
las cmaras CMOS, en cada pxel se transforma directamente de fotones a seal
elctrica y estos pulsos elctricos son los desplazados para ser transmitidos.

Las cmaras CCD tiene una mejor calidad de las imgenes y flexibilidad a
expensas de un mayor tamao. Sus aplicaciones son en fotografa digital, aplicaciones
industriales de altas prestaciones, aplicaciones cientficas y mdicas. Mientras las
cmaras CMOS tiene una integracin mayor, menor disipacin y tamao ms reducido,
a expensas de una menor calidad de imagen y menor flexibilidad. Para grandes
volmenes con pocos requerimientos de calidad es la opcin tecnolgica. Sus
aplicaciones principales son las cmaras de seguridad, webcam, cdigo de barras,
scanners, juguetes, telfonos mviles, ....

Dpto. Electrnica, Automtica e Informtica Industrial 71


Carlos Platero Apuntes de Visin Artificial

Figura 2. 50 a) Tecnologa CCD b) Tecnologa CMOS

2.4.5.1.6 Cmaras en color

Aunque el proceso de adquisicin de las imgenes color resulta ser ms


complejo, este tipo de cmaras pueden proporcionar ms informacin que las cmaras
monocromos. Hay dos tipos de arquitectura: 1CCD o 3CCD.

Las cmaras color de 1 CCD incorporan un sensor con un


filtro en forma de mosaico que incorpora los colores primarios
RGB. Este filtro de color es conocido como filtro Bayer. De
hecho, el sensor es monocromtico al que se le ha superpuesto el
filtro de color. La forma en que se disponen los colores R, G y B
es como se muestra en la figura. Como se puede ver hay el doble
de pxeles con filtro verde que con filtro azul o rojo. Efecto ste
necesario para hacer ms semejante la percepcin del sensor a la
visin humana que es ms sensible al verde. Figura 2. 51. 1CCD con
filtro de Bayer

Debido al carcter del propio filtro es evidente que en los


pxeles donde se sita el filtro rojo, no tienen seal ni de verde ni de azul. Para subsanar
la falta de estos colores en estos pxeles, se construye una seal RGB a partir de los
pxeles adyacentes de cada color. Este clculo se realiza en el interior de la cmara
mediante un DSP especfico, que permite realizar la operacin en tiempo real y
dependiendo de la cmara permite obtener una seal analgica o digital en RGB ( o en
PAL o Y/C) en su caso.

Las cmaras de color 3CCD


incorporan un prisma y tres sensores. La luz
procedente del objeto pasa a travs de la
ptica y se divide en tres direcciones al llegar
al prisma. En cada una de los tres extremos
del prisma se encuentra un filtro de color
(rojo, verde y azul) y un sensor que captura la
luz de cada color que viene del exterior. Figura 2. 52 3CCD
Internamente la cmara combina los colores y
genera una seal RGB similar a la que ve el ojo humano. La fidelidad de las imgenes

72 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

de las cmaras de 3CCD es muy superior a las de las cmaras de 1 CCD, pero hay un
par de inconvenientes inherentes al sistema. Por una parte este tipo de cmaras
requieren ms luz debido a que el prisma hace que sea menor la cantidad de iluminacin
que incide sobre los sensores, y por otra se genera un efecto de aberracin cromtica
debida a la propia estructura del prisma. Este efecto puede ser subsanado colocando las
pticas diseadas especficamente para este tipo de cmaras.

2.4.6 Eleccin de una cmara

Muchos son los aspectos que puedan influir en la eleccin de una cmara u otra.
Sin embargo, algunas consideraciones han de tenerse en cuenta para no arrepentirse de
la compra o para no gastarse ms dinero en el proyecto del que realmente hace falta.
Normalmente, la eleccin de la cmara va ntimamente ligada a la de la ptica. Para
hacer una correcta compra de sta se aconseja leer la seccin 2.3.

Las caractersticas tcnicas son las ms importantes y las que siempre se tendr
presente a la hora de adquirir una cmara. A continuacin se enumeran algunas de ellas.

2.4.6.1 Formato de Vdeo

Este tema ser tratado con mayor profundidad ms adelante. El formato de la


seal es importantsimo ya que tanto las cmaras como las digitalizadoras y, a veces, los
monitores deben ser del mismo formato. El formato cambia de un pas a otro. En
Europa se tiene el sistema PAL o CCIR que ser siempre al que se haga referencia. En
los pases francfonos se emplea el sistema SECAM y en el continente Americano y en
Japn el sistema NTSC. Otro tipo de cmaras que no sigue ninguno de estos formatos
son las llamadas cmaras digitales que envan la informacin al ordenador en seales
digitales codificadas segn el formato de cada fabricante, aunque se est extendiendo
los protocolos IEEE 1394, USB 2.0 o GigaEthernet. Si se adquiere una cmara de este
tipo hay que tener en cuenta las ventajes e inconvenientes de video digital respecto al
analgico (anchos de banda, mezcla de video procedente de varias cmaras, ).

2.4.6.2 Resolucin

Una imagen en el sistema CCIR est formada por 576 filas y 768 columnas, sin
embargo, el tamao del CCD puede ser mayor o menor. Este tema ser tratado ms
adelante, pero la norma es que cuantos ms pxeles disponga el CCD mayor ser la
calidad de la imagen. Otro factor a tener en cuenta, en la resolucin, es el nmero de
bits con que se digitaliza el pxel. Lo normal en cmaras digitales es emplear 8 bits,
aunque existen cmaras de hasta 16 bits por pxel.

2.4.6.3 Tipo de Rosca

La rosca es la forma con la que la ptica se sujeta a la cmara. Las ms tpicas en


pticas de vdeo son la rosca C y la rosca CS, habiendo incluso adaptadores de uno a
otro. En pticas y cmaras fotogrficas se suele emplear la rosca de bayoneta. Existen
otros tipos de rosca como la rosca K, y otras que emplean algunos fabricantes
particulares como la rosca Watec. Normalmente las cmaras tienen rosca C, aadiendo

Dpto. Electrnica, Automtica e Informtica Industrial 73


Carlos Platero Apuntes de Visin Artificial

normalmente una arandela que convierte de C a CS. Se debe prestar especial atencin a
este hecho, en caso contrario no se podr acoplar la ptica a la cmara.

2.4.6.4 Seales adicionales

Todas las cmaras poseen un conector, normalmente tipo BNC si es analgica,


donde se consigue la seal de vdeo, adems del de alimentacin. Esto es lo mnimo
necesario que se puede ofertar. Sin embargo, algunas cmaras ofrecen adems las
seales de sincronismo generadas en la propia cmara, que pueden ser empleadas en la
sincronizacin de dispositivos de iluminacin externos. Tambin se suele incluir una
seal de entrada para sincronizar la cmara con la digitalizadora y otra cmara si se esta
haciendo visin estreo. Si se emplean varias cmaras en el sistema de visin, se puede
emplear un generador de sincronismo externo; sta har que el tiempo de integracin de
todas las cmaras se inicie y termine exactamente en el mismo instante de tiempo.
Todas estas seales se suelen agrupar en un conector denominado EXT. Otra seal que
suelen tener algunas cmaras es la del control del autoiris que se conecta a la ptica si
sta dispone de este sistema. De esta manera, el iris se abrir o cerrar automticamente
dependiendo de la cantidad de luz recibida en el CCD.

2.4.6.5 Controles adicionales

El fabricante normalmente ofrece varios ajustes que pueden ser modificados a


voluntad. Algunos de ellos pueden ser imprescindibles para el mximo
aprovechamiento del sistema de visin, por lo que se deber prestar especial atencin a
s la cmara que se desea adquirir ofrece uno u otro ajuste. A continuacin se enumeran
algunos de estos controles:
Control de ganancia automtica (CAG): Hace las veces de un autoiris electrnico.
Si est activado, se aumentar o disminuir la sensibilidad del CCD en funcin de la
intensidad luminosa que se est recibiendo. Muchas aplicaciones debern tener
desactivado este control si no se quiere tener efectos impredecibles.
Tiempo de integracin: Como ya se explico anteriormente es el tiempo en que la
luz incide sobre el CCD. Equivaldra al tiempo de obturacin en trminos
fotogrficos. Es una caracterstica interesente en una cmara que se pueda modificar
el tiempo de integracin. Si se est iluminando la escena con luz fluorescente, como
la red elctrica funciona a 50 Hz, generar unas fluctuaciones en la luminosidad, de
carcter senoidal y tambin de 50 Hz. Si la cmara tiene un tiempo de integracin
pequeo, por ejemplo de 2ms, la imagen se oscurezca y aclare lentamente, pudiendo
afectar negativamente en el sistema de visin. Si se quiere eliminar este efecto se
deber cambiar el tiempo de integracin lo ms prximo a 20 ms.

2.4.6.6 Filtros de infrarrojos, IR

Los CCD tienen una buena respuesta por encima del espectro no visible de
700nm hasta los 850nm aproximadamente. Con esta sensibilidad espectral hara que a
luz ambiente la imagen apareciera muy saturada. Para evitarlo se suele intercalar antes
del CCD un filtro de corte de infrarrojos. Este filtro debe tenerse muy en cuenta si se va
a utilizar luz estructurada con longitudes de onda IR, en este caso se deber abrir la
cmara y eliminar este filtro. Algunas pticas tambin incluyen este filtro y en la
mayora de los casos no es posible su eliminacin. Hay que tener cuidado al comprar

74 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

una ptica para una aplicacin con lser IR si no se quiere llevar uno una desagradable
sorpresa.

2.5 Seal de vdeo

La informacin recogida en el sensor de imagen es convertida a una seal vdeo


analgica o digital segn un formato estndar o no. La transmisin de imgenes de
vdeo ha estado impuesta por la aplicacin principal para las que fueron concebidas las
cmaras, la televisin. La seal analgica de vdeo es una seal elctrica continua que
contiene toda la informacin de la imagen, as como informacin adicional o
sincronismos para que la imagen pueda volver a ser reconstruida mediante un monitor.
Los tiempos y la estructura de la seal fueron determinadas en los primeros das en que
la televisin vio la luz. Posteriormente, se han hecho modificaciones o aadidos a la
seal de vdeo para que se pudiera transmitir color, sonido estreo e informacin
adicional (teletexto), siendo estas nuevas seales compatibles con el formato original.
Actualmente, se habla del apagn analgico que se producir en los prximos aos que
ser sustituido por la transmisin digital de la seal de vdeo.

2.5.1 Estndar de transmisin analgico

El primer estndar para transmisin de televisin en niveles de grises fue


conocido como RS-170 en Estados Unidos en 1941. Posteriormente, el formato NTSC,
compatible con RS170, se defini para la transmisin de seal de vdeo en color. Se usa
actualmente en 32 pases (USA, Canad, Japn, ...). En 1950, en Europa se defini el
estndar CCIR para la transmisin de seales de televisin en blanco y negro y PAL
para el color. Las diferencias esenciales entre los sistemas monocromos RS-170 y
CCIR son el nmero de lneas en la imagen y la transmisin de frecuencias, lo cual les
hace incompatibles en un nivel bsico.
Formato RS-170 CCIR
Fre. Cuadro (Hz) 30 25
Entrelazado 2:1 2:1
Fre. Campo (Hz) 60 50
N. lneas horizontales 525 625
N. lneas horizont. efectivas 480 576
Fre. Lnea (Hz) 15.750 15.625
Tiempo activo lnea 52,5 s 52 s
Pxeles por lnea 752 744
Relacin de aspecto 4:3 4:3
Tamao de imagen (pxeles) 360.960 428.544

En ambos modelos, el formato de vdeo usa el principio de entrelazado para


reducir la frecuencia requerida en la transmisin y corregir el efecto de parpadeo al
reconstruir la imagen. Este principio consiste en transmitir dos campos de lneas
alternas y transmitirlas secuencialmente. Un campo puede transmitirse en la mitad de
tiempo que cuadro completo, dando la impresin de continuidad, a pesar del hecho que
slo la mitad de la informacin est siendo actualizada en cada ciclo.

Dpto. Electrnica, Automtica e Informtica Industrial 75


Carlos Platero Apuntes de Visin Artificial

Aunque los sistemas no entrelazados son comunes para los monitores de


ordenadores, el entrelazar campo par e impar es una caracterstica comn a todos los
sistemas de televisin. El campo par contiene todas las lneas pares, comenzando con
media lnea y terminando con una completa. El campo impar contiene las lneas impares
comenzando con una lnea completa y terminando con la mitad de una lnea. Los dos
campos puestos juntos constituyen un cuadro completo.

La frecuencia de cuadro y de campo son las constantes fundamentales en los dos


estndares de vdeo. Como se puede ver en la tabla el formato RS-170 tiene una
frecuencia de cuadro ms alta, pero las frecuencias de lneas de los dos estndares son
aproximadamente las mismas. En ambos casos, el nmero final de lneas efectivas se ve
reducido por el tiempo de borrado de campo, el cual se usa en los monitores de TV para
que el pincel electrnico vuelva al principio. Adems, en el borrado de campo se envan
seales para sincronizar los osciladores de barrido vertical y horizontal, as como
informacin adicional (teletexto).

Un esquema completo de la
seal de TV de un cuadro completo
puede ser estudiado en la figura. En
ella se incluyen las seales de
sincronismos empleadas para
especificar el comienzo de un
campo (sincronismo vertical o
Vsync) y el comienzo de una lnea
(sincronismo horizontal o Hsync).
Si las seales de sincronismo estn
combinadas con la seal de vdeo, Figura 2. 53. Sincronismo vertical
la resultante es denominada seal
de vdeo compuesto (composite video). Una seal que contenga Vsync y Hsync se
denomina seal de sincronismo compuesto (composite sync). En CCIR habr 625
pulsos de sincronismo horizontal por cuadro y 50 pulsos de sincronismo vertical por
segundo.

En la figura se muestra un
diagrama de la seal de una nica
lnea con el sincronismo horizontal y
los niveles de voltaje. El flanco de
bajada del pulso de sincronismo es el
comienzo de una nueva lnea del
campo y el nivel de borrado (blanking
level) indica con cero voltios lo que Figura 2. 54 Sincronismo de lnea
sera negro en la imagen. El mximo
nivel de blanco es equivalente a 0,7 voltios, mientras que el nivel de sincronismo est
fijado a -0,3 V.

Ningn estndar especifica la cantidad de pxeles en horizontal que debe tener


un CCD, ya que los formatos nacieron para cmaras de tubo de vaco, en los que la
seal analgica se formaba de manera continua. Sin embargo, los CCD hacen un
muestreo de manera discreta. Cada fabricante de cmara ha elegido el nmero de

76 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

pxeles que quiere incluir, aunque muchos de ellos han adoptado un estndar para
RS170 de 752 pxeles. La resolucin vertical del sensor suele ser de 484 lneas, aunque
slo 480 son activas.

2.5.2 Vdeo analgico no estndar

Las seales de video no estndares, pueden ser una combinacin de: frecuencias
no estndar, resolucin no estndar o barrido progresivo. Las seales de video que no se
ajustan a uno de los estndares descritos anteriormente no pueden ser interpretadas por
un frame grabber convencional con circuitos de codificacin para estndares. Las
cmaras que tienen este tipo de seal son las cmaras de alta velocidad o alta resolucin
o las cmaras que se activan mediante trigger o captura asncrona.

2.5.3 Seal de vdeo digital

Las cmaras digitales utilizan la misma tecnologa que las analgicas, sin
embargo, el convertidor analgico-digital est dentro de la cmara y digitaliza el video
directamente y proporciona una seal de salida digital que puede ser de distintos tipos.
El hecho de que la seal se digitalice en la propia cmara hace que la calidad de la seal
sea mejor, pero tiene el inconveniente de que los cables entre la cmara y el frame
grabber no pueden ser muy largos. La salida digital paralela permite conectar la cmara
con un frame grabber mediante un cable multi hilos. Esta salida normalmente tiene el
formato RS-422 o LVDS (EIA-644). No obstante, se est imponiendo la conexin de
vdeo digital serie USB 2.0, FireWire o IEEE 1394 y GigaEthernet. A continuacin se
presentan los sistemas ms habituales para la conexin directa entre las cmaras
digitales y el ordenador:

2.5.3.1 USB (Universal Serial Bus)

USB es un sistema maestro (controladora USB) - esclavo (perifrico) para las


comunicaciones punto a punto, diseado para reemplazar de manera universal los
diversos protocolos de E/S tanto en serie como en paralelo. El dispositivo esclavo slo
puede comunicarse con el maestro (normalmente un ordenador) pero no con otros
esclavos.

Con USB 2.0 (2000) hay un aumento de velocidad hasta 480 Mbps (casi 40
veces la velocidad de USB 1.1) con una diferencia de coste casi mnimo. Bsicamente,
USB 2.0 incluye todo lo que ofrece USB 1.1 y aade el modo de alta velocidad. USB
2.0 tambin usa el mismo tipo de cables y conectores para conectar los dispositivos de
alta velocidad. La alta velocidad del USB le permite competir con la IEEE-1394a
(Firewire) de 400 Megabits/ seg., si bien la IEEE-1394b sigue siendo ms rpida, con
3,2 Gigabits/ seg.

Con respecto a la distancia, USB fue diseada como una extensin del bus del
ordenador personal, con la idea de que los perifricos estuviesen prximos, de forma
que cada cable no midiese ms de 5 metros. Otras interfaces, entre las que se incluyen la
RS-232, la RS-485, la IEEE-1394b, y Ethernet permiten el uso de cables de longitud

Dpto. Electrnica, Automtica e Informtica Industrial 77


Carlos Platero Apuntes de Visin Artificial

mayor. Si bien, la longitud de un vnculo USB se puede aumentar hasta los 30 metros
usando cables que unan 5 hubs y un dispositivo.

2.5.3.2 IEEE-1394 (Firewire)

La tecnologa FireWire (llamada as por su alta velocidad) la desarroll Apple


en 1986 y surgi de la necesidad de tener una conexin entre vdeocmaras digitales y
los ordenadores personales, de bajo coste y orientada al consumidor. Es uno de los
estndares de perifricos ms rpidos desarrollados hasta el momento, y resulta
adecuado para el uso de perifricos multimedia.

En 1995, IEEE la adopt como estndar bajo el nombre de IEEE 1394. Desde
entonces se han desarrollado nuevas versiones que han aadido nuevas posibilidades y
caractersticas. Sony es una de las compaas que ha adoptado este estndar
desarrollando su propia versin conocida como i.Link que se puede encontrar en
muchos de sus ordenadores y videocmaras digitales.

2.5.3.3 Ethernet

Ethernet fue desarrollado a principios de los 70 y estandarizndose en los 80


bajo la tutela del comit IEEE 802. Fue diseado como un sistema de broadcast, de tal
manera que todos los elementos conectados a la red pudieran enviar mensajes cuando
quisieran y a quin quisieran, siendo recibidos los mensajes por todos los equipos de la
red, pero atendindolos slo el destinatario.

De la palabra Ethernet, Ether hace alusin al hecho de que el sistema no est


restringido por el medio fsico que utiliza para establecer la comunicacin, ya sea cables
de cobre, de fibra ptica o por ondas de radio. Existen varias versiones de Ethernet que
se diferencian en el tipo de cable empleado y ha habido una evolucin en las
velocidades:

1. Fast Ethernet: tambin conocida como 100Base-T o IEEE 802.3u, emplea el


mecanismo CSMA/CD como Ethernet pero tiene una tasa de transferencia mayor, de
100Mbps.

2. Ethernet Gigabit: es compatible tanto con Ethernet como Fast Ethernet, pero
su tasa de transferencia es mayor, 1000Mbps.

2.5.3.4 Comparacin de los distintos sistemas

En general, la IEEE-1394 puede ser ms rpida y flexible que USB, pero su


ejecucin/aplicacin es ms cara. Con USB, una nica tarjeta controla las
comunicaciones con varios dispositivos. El ordenador se encarga de las tareas ms
complejas, de forma que los dispositivos pueden ser relativamente simples y baratos.

Por su parte, los dispositivos IEEE-1394 pueden comunicarse directamente entre


ellos, y una sola comunicacin puede dirigirse a mltiples receptores. Esta caracterstica
tiene como resultado una interfaz ms flexible, pero los dispositivos son ms complejos

78 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

y caros. La IEEE-1394 es ms adecuada para aplicaciones que requieran


comunicaciones extremadamente rpidas o para la emisin hacia mltiples receptores.
Mientras que la USB es idnea para perifricos comunes como teclados, impresoras,
escneres, as como aplicaciones de velocidad baja a moderada y sensibles al coste. Si
bien muchos dispositivos, como los dispositivos de almacenamiento, funcionan bien
con ambas interfaces e incluso algunos incluyen las dos.

Ethernet presenta como ventajas la posibilidad de usar cables muy largos, la


capacidad de multidifusin, y la optimizacin de protocolos de Internet sobre Ethernet.
Si bien, al igual que ocurra con la IEEE-1394, el hardware que se necesita para
Ethernet es ms complejo y caro que el hardware perifrico habitual de la USB, por lo
que le resta versatilidad.

2.6 Tarjetas digitalizadoras

El nombre tarjeta digitalizadora no es correcto del todo, ya que sta incluye


operaciones de procesamiento e incluso permiten recibir seal de vdeo digital. Sin
embargo, este trmino es ampliamente aceptado por razones histricas, pues al principio
estas tarjetas no hacan ms que digitalizar la imagen y era el computador el encargado
de procesarlas. Estas tarjetas se podran clasificar en tres tipos: a) Digitializadoras de
bajo coste, b) Digitalizadoras con caractersticas multicanal y c) Digitalizadoras con
capacidad de procesamiento.

Una tarjeta digitalizadora o frame grabber tiene como propsito principal


muestrear, en tiempo real, la salida estndar de una cmara de vdeo, pasando la
informacin al computador. La informacin es almacenada temporalmente y una vez
all la informacin es procesada siguiendo las directrices de un programa. Dependiendo
de la aplicacin, la tarjeta puede ser programada para capturar y almacenar cuadros
individuales, recoger una cierta secuencia de cuadros o quizs leer de manera continua
la imagen de vdeo y realizar una tarea determinada en tiempo real. Algunas tarjetas
tienen caractersticas avanzadas como puede ser captura sncrona de las imgenes.

Dpto. Electrnica, Automtica e Informtica Industrial 79


Carlos Platero Apuntes de Visin Artificial

Las digitalizadoras con capacidades para el procesamiento en tiempo real


derivan sus prestaciones de los procesadores digitales de seal (DSP). stos pueden
realizar procesamientos bsicos sobre la seal de una manera encadenada y en tiempo
real.

2.6.1 Funcionamiento de la adquisicin de la seal de vdeo analgico

El funcionamiento en la adquisicin de vdeo analgico se hace, primeramente,


una adaptacin de impedancias de la seal de vdeo entrante y es separada por un lado
para obtener las seales de sincronismo y por otro el contenido de informacin de la
imagen. Seguidamente, se acondiciona el nivel de continua a un nivel estndar (DC
restoration), ya que la seal enviada por cada cmara puede variar ligeramente y este
proceso ajusta el nivel de negro a una tensin constante. Posteriormente, se hace pasar
la seal por un filtro paso bajo que elimina las altas frecuencias parsitas (low pass
filter) y se corrigen las variaciones que se hayan producido en el nivel de continua y la
ganancia (Offset and Gain). El fabricante normalmente ofrece la posibilidad de
modificar los parmetros de estos circuitos mediante el programa que se ejecuta en el
computador, de esta manera se puede conseguir una seal de mayor calidad. Debido a la
alta frecuencia de la seal de vdeo, es muy importante que las impedancias de cable
coaxial que se utilice y las de la cmara y entrada del digitalizador estn adaptadas. En
caso contrario, se traducir en una degradacin de la seal de vdeo.

2.6.1.1 Sincronizacin.

Ya que las seales de sincronismo vienen junto a la de vdeo, tal y como se ha


explicado, stas deben separarse de la informacin de la imagen. La precisin de las
seales de sincronismo es fundamental para la fidelidad de las imgenes capturadas por
el digitalizador. El primer paso es separar la informacin de vdeo de los impulsos de
sincronismo usando un circuito separador de sincronismo (sync stripper). La resultante
se denomina sincronismo compuesto, ya que contiene tantos los impulsos verticales
como los horizontales. Despus es
introducida como seal de mando a
un bucle de control en cadena
cerrada que en su salida tiene un
oscilador generador de sincronismo
(Hsync Generator), que es
controlado mediante una seal de
error producida por un circuito
comparador de fase (PLL Circuit),
que detecta las diferencias entre la
seal de sincronismo que se est
generando y la que debera ser. La
seal obtenida es la que
sincronizar en el convertidor
analgico digital que es el
encargado de pasar al formato
digital la informacin de las imagenes.

80 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

El circuito generador de sincronismo horizontal fluctuar por algn tiempo hasta


que el circuito PLL alcance un estado estable. Imprecisiones en la deteccin de la fase
producir el efecto denominado temblor de lneas o line jitter, que causa
desplazamientos horizontales de hasta 3 pxeles. En una tarjeta digitalizadora de
calidad, el temblor de lneas ser normalmente menor de 0.1 pxeles.

Para solucionar este problema, algunas cmaras permiten ser sincronizadas por
un oscilador exterior. En este caso el digitalizador ser el que genere las seales de
sincronismo vertical y horizontal o bien el sincronismo compuesto, haciendo que la
digitalizacin sea en el momento preciso y corrigiendo totalmente este problema. Se
tiene que tener especial cuidado cuando la longitud del cable sea elevada, ya que la
seal de sincronismo puede ser retrasada por la inductancia y capacidad del cable,
haciendo que la imagen aparezca
Figura 2. 55. Diagrama de bloques de una digitalizadora
desplazada.

Tambin ha de tenerse especial cuidado con el efecto de calentamiento de los


circuitos electrnicos de la cmara y la digitalizadora, ya que tambin pueden producir
variaciones en el comportamiento de estos y afectar directamente en la calidad de la
imagen. Es un buen hbito esperar una o dos hora con el equipo encendido hasta que la
cmara se estabilice trmicamente.

La digitalizacin se produce en el rango de vdeo de 0 a 0.7 voltios. El periodo


de muestreo para seales de televisin vara entre los 20 y los 30 MHz. Las tarjetas de
propsito general emplean 8 bits que es equivale a un byte de informacin por pxel.

2.7 El modelo proyectivo de la formacin de imgenes

El proceso de adquisicin de una imagen por el sistema de Visin Artificial se


modela en dos pasos: la formacin de la imagen en el elemento sensor CCD a travs de
los elementos pticos y la digitalizacin de la seal proveniente de la cmara. Cada uno
de estos procesos se puede describir de distintas formas, ms o menos complejas.

El modelo pin-hole es el ms simple para representar la formacin de la imagen.


Est basado en la proyeccin de perspectivas y reduce el sistema ptico a un punto
llamado centro ptico, C. Cada punto del espacio eucldeo se proyecta por un nico rayo
luminoso que pasa por el centro ptico, situado a una distancia f (distancia focal), hasta
el plano de la imagen. El eje ptico es la lnea perpendicular al plano de la imagen que
pasa por el centro ptico. En este modelo se carece de proceso de enfoque.

Con este modelo y con una secuencia de imgenes adquiridas consecutivamente


en el tiempo se trata de obtener la percepcin visual de los objetos proyectados en el
plano sensor. Para diferenciar las imgenes unas de otras se indexarn los parmetros.
As la proyeccin de un punto en el espacio Mwi(xwi , ywi , zwi), teniendo el eje de
coordenadas sobre el punto focal de la posicin indexada i, se transforma en un punto
sobre el plano sensor, establecindose la relacin no lineal de:

Dpto. Electrnica, Automtica e Informtica Industrial 81


Carlos Platero Apuntes de Visin Artificial

xi x yi y
= wi = wi
fi z wi fi z wi (2. 15)

Figura 2. 56. Modelo pin-hole de la cmara

siendo xi e yi las coordenadas del punto proyectado. El signo menos refleja el


carcter invertido del modelo. Obsrvese que estas proporciones estn referenciadas en
magnitudes de longitud, generalmente expresado en milmetros. Sin embargo, los
algoritmos de extraccin de las coordenadas del punto proyectado sern dados en
pxeles. Habr que proponer la conveniente conversin.

Para la transformacin se requiere conocer el centro del plano sensor Ci (cxi, cyi);
estos valores sern dados en pxeles desde el origen de coordenadas de la imagen
digitalizada, es decir, la esquina superior izquierda. Tambin es necesario conocer la
distancia interpixel de la cmara tanto en filas como en columnas (dx, dy). Hay que
destacar que Ci es uno de los parmetros intrnsecos de la cmara, pues el
desplazamiento del zoom o el enfoque de las pticas har variar este parmetro de una
imagen a otra. En cambio, las distancias interpixel se mantendrn al ser un parmetro de
fabricacin. No obstante, la diferencia entre el nmero de columnas sensoras de la
cmara y la frecuencia de muestreo de la lnea modificar el valor interpixel de dY.
Adems habr de considerar el efecto de prdida de sincronismo en la lectura de la
lnea, el llamado efecto temblor de lnea que suele evaluarse por el factor de
incertidumbre, ky. Por tanto, se redefine dy como:

n sy
d'y = d y
n py k x (2. 16)

donde nsy es el nmero de elementos sensores columna que hay en una cmara y
npy es el nmero de pxeles de la imagen digitalizada.

Del planteamiento presentado se deduce que la relacin existente entre el punto


proyectado sobre la cmara y su valor en pxeles sobre la imagen digitalizada resulta
ser:

82 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

xi = ( p xi c xi )d x
y i = (Pyi c yi )d y (2. 17)

teniendo pxi e pyi que son las coordenadas en pxeles de la imagen sobre el punto
proyectado en la cmara Esta disposicin de los signos har eliminar el anteriormente
mencionado efecto inversor del modelo pin-hole. Insertando las expresiones de la ec.
2.17 en la ec. 2.15 y presentndolo en coordenadas homogneas y en notacin matricial
se tendr:

fi c xi wi
x
0
z wi
p xi d x
fi y
p yi = 0 d y
c yi wi
z wi
1
0 0 1 1

(2. 18)

En 2.18 est implcito el carcter ortogonal de los ejes de proyeccin. En el caso


de que no fuese as, el mapa de pxeles podra generalizarse a:

fi
fi
c xi x wi
d y z wi
p xi d x
fi y
p yi = 0 d y
c yi wi
z wi
1
0 0 1 1

(2. 19)

donde es un escalar que mide el desplazamiento rotacional entre los dos ejes
principales; si es cero es que stos son perpendiculares.

2.8 Calibracin geomtrica de las cmaras

La calibracin de las cmaras se puede dar en un doble sentido: a) geomtrica y


b) radiomtrica. La primera relaciona las transformaciones proyectivas desde la escena
exterior 3D de la cmara con el plano sensor y la segunda con los aspectos de radiacin
en cada uno de los pxeles. El segundo
aspecto fue tratado, someramente, en el
apartado 2.4.3. Aqu se trata de determinar
cual es el conjunto de transformaciones
proyectivas que relaciona la escena con el
plano sensor. Su utilidad resulta
fundamental en tareas de percepcin y de
navegacin visual. En todas estas
aplicaciones, se trata de analizar las
imgenes para obtener medidas
geomtricas del mundo exterior. Para
Figura 2. 57. Correspondencia entre los puntos 3D
del espacio con los pxeles proyectivos

Dpto. Electrnica, Automtica e Informtica Industrial 83


Carlos Platero Apuntes de Visin Artificial

realizar estos algoritmos se exige de la calibracin geomtrica de las cmaras.

En funcin de lo comentado en el apartado anterior, existen dos tipos de


parmetros en las transformaciones proyectivas: a) parmetros intrnsecos y b)
parmetros extrnsecos. Los primeros son aquellos inherentes a la cmara y son: la
distancia focal, el centro ptico y el modelo de deformacin de la lente; mientras que los
parmetros extrnsecos son los que definen la posicin y orientacin de la cmara
respecto a un sistema de referencias 3D: vector de traslacin y matriz de rotacin.

2.8.1 Procedimiento general de calibracin

Aunque existen distintos mtodos para la calibracin de una cmara, el


procedimiento bsico es el mismo en todos ellos:

1. Determinar con precisin un conjunto de puntos 3D del mundo exterior.

2. Fijar sus correspondencias con las proyecciones de estos puntos 3D sobre


la imagen proyectada 2D.

3. Obtener mediante tcnicas de optimizacin la mejor solucin de la


determinacin de los parmetros intrnsecos y extrnsecos.

Los dos primeros tems requieren conocer una serie de puntos 3D y sus
correspondientes proyecciones en la imagen; son los que se denominan puntos de
calibracin. Dependiendo del algoritmo de calibracin, los puntos pueden ser coplanares
o no. Pero sea como fuere el tipo de
plantilla de calibracin, se sugiere un
patrn de cuadros blancos y negros, a
modo de tablero de ajedrez, tal que
facilite el proceso de extraccin de las
esquinas con precisin subpixel y sea
fcil de corresponder los puntos
exteriores 3D con sus proyecciones
2D. Realizado los pasos de
correspondencia se pasar a determinar
los parmetros intrnsecos y
extrnsecos mediante tcnicas de
optimizacin.

Figura 2. 58. Parmetros extrnsecos

84 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

2.9 Formatos grficos.

Las imgenes digitales se pueden almacenar en distintos soportes fsicos tales


como: discos duros, CDs, DVDs o memoria flash. Para este objetivo se han inventado
cientos de formatos con la funcin principal de comprimir la enorme cantidad de
informacin que contiene una imagen digital. Una primera clasificacin podra ser:
formatos grficos vectoriales y formatos grficos en mapa de bits. Este ltimo puede
dividirse adems en formatos con prdida o no de la informacin.

2.9.1 Formatos grficos vectoriales

Se almacenan las coordenadas de las figuras geomtricas simples como


segmentos, tringulos, rectngulos, circunferencias, etc., as como las rdenes
necesarias para rellenar con los colores adecuados. Para dibujos simples el fichero
resultante ocupar poco tamao comparando con lo que ocupara si estuviera en formato
de mapa de bits. Tal es el caso de ficheros generados por programas de generacin de
imgenes 3D como AutoCAD, libreras de computacin grfica como VTK o
programas de dibujos en general.

2.9.2 Formatos grficos en mapa de bits

Este formato es el ms intuitivo, ya que lo nico que hace es almacenar


secuencialmente los pxeles que componen la imagen en un fichero. El orden de
almacenamiento se puede entender considerando la imagen como una gran matriz de
pxeles. As partiendo de la esquina superior izquierda, avanzando por las columnas de
izquierda a derecha y por filas de arriba abajo.

Si el fichero se almacena as tal cual, se dice que est en formato crudo (*.raw),
ser necesario para su lectura saber cuantas filas y columnas tiene la imagen. El
inconveniente del formato en crudo es la gran cantidad de espacio que se necesita. La
mayora de los formatos actuales llevan consigo una reduccin sustancial del volumen
informativo. La compresin de las imgenes se hace siguiendo algunas de estas tres
estrategias:

1. Compresin en la codificacin: en vez de emplear un nmero fijo de bits


para cada nivel de gris o color, se emplea un cdigo ms corto a los
niveles ms probables y ms largo a los menos probables.

2. Compresin en la representacin: La similitud de intensidad en los


vecinos hace emplear las rachas, las cuales indican el nmero de vecinos
que se repiten. Se almacenan en vez de los valores de intensidad, el
nmero de vecinos con la misma intensidad.

3. Compresin por redundancia visual: Las imgenes vistas por el ojo


humano no es capaz de percibir el contraste de tonos muy prximos entre
s, por dicha razn en vez de almacenar los mapas de bits se aplican
transformaciones matemticas sobre la imagen, con el objetos de guardan

Dpto. Electrnica, Automtica e Informtica Industrial 85


Carlos Platero Apuntes de Visin Artificial

los principales coeficientes de la conversin. Evidentemente, la imagen


resultante es de peor calidad que la entrante. Hay perdidas de detalle. El
ejemplo ms caracterstico es el algoritmo de compresin JPEG basadas
en las transformadas discretas del coseno. Tambin son ejemplos de
compresin basada en redundancia visual los estndares de vdeo MPEG
y MPEG2.

2.10 Cuestiones

1. Diferencias entre la Visin Artificial y la Computacin Grfica sobre


la iluminacin.

2. Factores que influyen en la formacin de una imagen.

3. Calidad de una imagen.

4. Tcnicas de iluminacin.

5. Discrepancias entre el modelo de lente fina y el modelo pin-hole.

6. Consecuencias de variar el diafragma.

7. Tipos de aberraciones y distorsiones pticas.

8. Diferencias entre cmaras lineales y cmaras TDI

9. Modelado geomtrico y radiomtrico de una cmara.

10. Cmaras CCD versus cmaras CMOS.

11. Ventajas e inconvenientes de la distintas arquitecturas de


transferencia: cuadro, interlnea, cuadro-interlnea.

12. Cmaras entrelazadas y cmaras progresivas.

13. Clasificacin de las seales de vdeo.

14. Partes de una digitalizadora de vdeo de bajo costo.

15. Tipos de archivos de imgenes.

86 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

2.11 Problemas

Ejercicio 1

Una fuente luminosa puntual de 100 mW/sr se sita


en un escenario de 10m x 20m, en X e Y respectivamente,
tal cual se observa en la figura. Sabiendo que irradia por
igual en todas las direcciones. Calcular la iluminacin
mxima y mnima sobre el suelo.

La iluminacin mxima sobre el suelo se encontrar debajo del foco:

I 100
Emax = 2
= mW / m 2
d min 9

La mnima se encontrar a la distancia ms alejada entre el escenario y el foco:

2
d max = 152 + 6 2 = 16.43m

El ngulo entre el foco y el extremo del escenario es de 79.4. La iluminacin


total ser:

EH ,min = 0.068mW / m 2 EV ,min = 0.364mW / m 2 Emin = 0.37 mW / m 2

Ejercicio 2

Una luminaria se sita en el centro de


un escenario de 5m x 2m y a una altura de
3m. La intensidad luminosa es entregada por
el fabricante segn el diagrama polar
adjuntado. Calcular la iluminacin en los
puntos a), b) y c).

En el punto A, la intensidad es de 150 mW/sr


y el ngulo entre la normal de la superficie y el foco
es nula:

I cos 3
E Ha = 2
= 16.6mW / m 2
h
EVa = E H tg = 0mW / m 2
E a = 16.6mW / m 2

Dpto. Electrnica, Automtica e Informtica Industrial 87


Carlos Platero Apuntes de Visin Artificial

En el punto B, la intensidad es de 130 mW/sr y el ngulo entre la normal de la


superficie y el foco es de 26.57:

I cos 3
E Hb = 2
= 10.3mW / m 2
h
EVb = E H tg = 5.2mW / m 2
Eb = 11.5mW / m 2

En el punto C, la intensidad es de 140 mW/sr y el ngulo entre la normal de la


superficie y el foco es de 18.43:

I cos 3
E Hb = = 13.3mW / m 2
h2
EVb = E H tg = 4.4mW / m 2
Eb = 14mW / m 2

Ejercicio 3

Se tiene una cmara de vdeo a


calibrar. La ptica tiene una distancia
focal de 3mm y el tamao del pxel es de
5.6 m x 5.6 m. El nmero efectivo de
pxeles son 357(H) x 293(V). Cual es la
distancia mnima que podr ponerse una
rejilla de calibracin respecto de la
cmara, si sta se constituye por cuadros
blancos y negros de 27mm de lado y
segn se observa en la figura, hay 7x9
cuadrados?.

En la mnima distancia deber de entrar la rejilla completa. Se parte de la


hiptesis que los nueve cuadros deben de entrar en las 357 columnas, por tanto:

X 9 27 10 3
Z= f = 3 10 3 = 0.364m
x 357 5.6 10 6

Habr que observar que en las filas entrar los siete cuadrados:

Y 7 27 10 3
Z= f = 3 10 3 = 0.345m
y 293 5.6 10 6

Por tanto, se verifica que cuando la distancia es de 0.364 m entra por completo la
rejilla.

88 Dpto. Electrnica, Automtica e Informtica Industrial


Apuntes de Visin Artificial Captulo 2: Formacin de las imgenes

Ejercicio 4

Se emplea una cmara con una lente


de 3mm y un sensor CMOS que tiene un
pixel cuadrado de 5.6m x 5.6m. El nmero
efectivo de pxeles es 357 (H) x 293 (V). Se
ha colocado una plantilla de calibracin a 500
mm respecto al eje de referencia en la
cmara. Sabiendo que los lados del
cuadrado son de 27mm y que las
coordenadas XYZ del punto indicado en la
rejilla son (50,50,500). Determinar en qu
pxeles de la cmara se proyectan las cuatro
esquinas del cuadrado seleccionado.
Considrese que no hay distorsin en la lente, el eje axial de la lente pasa por
el centro del elemento sensor y que los ejes de proyeccin son ortonormales.

El modelo pin-hole de la cmara quedar definido por:

fi 0 xwi
cxi xwi
dx zwi zwi
pxi 535.71 0 146.5
fi ywi y
p yi = 0 c yi = 0 535.71 178.5 wi
d y
1 z wi z wi
0
0 0 1 1
0 1
1

El primer punto quedar proyectado en el pxel (200,232) y los otros tres en


(229,232),(200,261) y (229,261).

Derecho de Autor 2009 Carlos Platero Dueas.


Permiso para copiar, distribuir y/o modificar este documento bajo los trminos
de la Licencia de Documentacin Libre GNU, Versin 1.1 o cualquier otra
versin posterior publicada por la Free Software Foundation; sin secciones
invariantes, sin texto de la Cubierta Frontal, as como el texto de la Cubierta
Posterior. Una copia de la licencia es incluida en la seccin titulada "Licencia de
Documentacin Libre GNU".

La Licencia de documentacin libre GNU (GNU Free Documentation License)


es una licencia con copyleft para contenidos abiertos. Todos los contenidos de estos
apuntes estn cubiertos por esta licencia. La version 1.1 se encuentra en
http://www.gnu.org/copyleft/fdl.html. La traduccin (no oficial) al castellano de la
versin 1.1 se encuentra en http://www.es.gnu.org/Licencias/fdles.html

Dpto. Electrnica, Automtica e Informtica Industrial 89

You might also like