Professional Documents
Culture Documents
Tesis
presentada en cumplimiento a los requerimientos para el grado de
Abril 2005
Resumen
Se desarroll un sistema de visin artificial
f
Abstract
A machine vision system was used to classify coffee fruits into eleven groups according to ripen. 208 features of the individual fruits were extracted from two dimensional images and used as shape, size, color and texture description. An univariate
and a multivariate method for feature selection was used to select a subset of 9 from
an initial set of 208 features. The selected features were subsequently used as inputs
to three classification schemes: the Bayesian decision, a neural network and a fuzzy
k means clustering. The average classification error obtained for Bayesian classifier
was 5,43 %. The neural network classifier resulted in a average classification error of
7,46 %. While 19,46 % was the error obtained using fuzzy clustering.
Contenido
Resumen
Contenido
Lista de Tablas
Lista de Figuras
11
Introduccin
1.1.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
10
11
12
12
1.3.2. Caracterizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . .
13
6
1.3.3. Seleccin de las caractersticas . . . . . . . . . . . . . . . . . . . .
14
1.3.4. Clasificacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
16
19
19
19
21
22
Captulo 3. Caracterizacin
25
3.1. Caractersticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
25
25
27
30
31
3.2. Normalizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
32
32
33
33
35
36
36
38
50
Captulo 4. Clasificacin
53
4.1. Clasificadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
53
4.1.1. Estadstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
53
54
7
4.1.3. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
54
4.2. Evaluacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
55
56
56
Captulo 5. Resultados
60
60
60
66
Captulo 6. Conclusiones
69
Bibliografa
72
76
76
78
79
79
81
81
82
82
82
A.2.2. Entropa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
83
A.2.3. Uniformidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
84
A.2.4. Contraste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
84
A.2.5. Correlacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
85
86
86
8
A.2.8. Mxima Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . .
86
87
A.2.10. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
87
A.2.11. Directividad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
88
88
89
A.3.1. rea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
A.3.2. Permetro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
89
89
90
A.4.1. Rectangularidad . . . . . . . . . . . . . . . . . . . . . . . . . . .
90
90
A.4.3. Circularidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
90
A.4.4. Firma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
91
91
91
91
93
B.1. Estadstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
93
94
B.3. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
96
96
Lista de Tablas
2.1. Relacin entre: las muestras, los estados de maduracin, las semanas . . . .
21
27
29
31
32
41
44
46
3.8. Las ocho caractersticas seleccionadas con los dos mtodos utilizados . . .
49
50
51
51
58
58
60
61
62
63
64
10
5.6. Indicadores de desempeo. Clasificador usando Redes Neuronales . . . . .
64
65
66
Lista de Figuras
2.1. Fruto de caf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
22
22
23
23
26
34
3.3. ndice de Fisher para las caractersticas de color con normalizacin lineal .
34
3.4. ndice de Fisher para las caractersticas de color con normalizacin no lineal 35
3.5. ndice de Fisher para las caractersticas . . . . . . . . . . . . . . . . . . . .
39
40
40
42
47
57
57
67
11
12
A.1. Funciones de correspondencia de color CIE r(), g(),b(). . . . . . . . .
78
79
80
Introduccin
La calidad del caf colombiano es reconocida mundialmente y ha sido apreciada
por los pases consumidores como una de las mejores dentro de los cafs arbicos. La alta
calidad del caf colombiano es el resultado de las variedades que se cultivan, de la oferta
ambiental y de suelos, y principalmente de la recoleccin. La recoleccin se hace de forma
manual y selectiva desprendiendo los frutos maduros, esta es una ardua labor ya que en una
misma rama es posible encontrar frutos en diferentes estados de madurez e incluso flores.
Los costos de recoleccin son altos y muchas veces no se generan los resultados esperados
porque no slo se renen frutos maduros sino que tambin algunos verdes, y sobremaduros. La presencia de frutos verdes y sobremaduros afectan la calidad del caf variando el
sabor y el aroma. La adicin de una etapa de clasificacin del caf recogido, permitira el
mejoramiento de la calidad del caf que actualmente se produce y adems la generacin de
nuevos productos, al procesar caf de cada una de las otras etapas de madurez.
Los sistemas de visin artificial se han convertido en una solucin sencilla y eficaz para los problemas cotidianos de control presentes en la agricultura. Los excelentes
resultados obtenidos han incrementado el inters por el desarrollo de proyectos aplicados
a diferentes procesos agrcolas, especialmente en las etapas de cosecha de cultivos y en el
control de calidad. Ejemplos de estas aplicaciones son: la recoleccin de tomates [19], manzanas [3] [30], naranjas [33], tomates-cereza [23]; as como la clasificacin de papas [18],
olivas [26] , brcoli [32], nueces de pistacho [15] y manzanas [30]. Sin embargo, todava se
presentan problemas especialmente en la adquisicin de imgenes donde los ambientes no
son controlados, y en los dispositivos actuadores.
Se hizo el seguimiento de todo el proceso de maduracin de los frutos, desde cuando estaban verdes hasta cuando se encontraban sobremaduros y secos. Se caracterizaron
once etapas diferentes, con base en la descripcin del color, la forma, el tamao y la textura. Los mtodos de extraccin de caractersticas aplicados permitieron generar un espacio
de caractersticas de dimensin 208. En problemas de clasificacin es conveniente reducir
la dimensin del espacio de caractersticas, en este trabajo se logr disminuir la dimensin
de 208 a 9 empleando dos mtodos de seleccin. Para la clasificacin se usaron tres algoritmos de reconocimiento de patrones: clasificador Bayesiano, usando redes neuronales y
clustering difuso.
Captulo 1
Marco Terico
1.1.
Caf en Colombia
1.1.1.
Generalidades
El cafeto o planta productora de caf es un arbusto que se da en regin tropical de la
El fruto del cafeto es una baya drupcea, conformado por: una cubierta exterior
llamada pulpa, una sustancia gelatinosa azucarada que recibe el nombre de muclago, una
cubierta dura que se denomina pergamino o cscara, una cubierta ms delgada y fina llamada pelcula y finalmente, una almendra que es la parte del fruto que una vez tostada
y molida se utiliza para la produccin del caf en bebida. La pulpa est formada por el
exocarpio (epidermis), que es la capa externa del fruto y cuyo color vara desde verde o
amarillo hasta rojo o rojo intenso y algunas veces hasta violeta o negro. El color depende
4
5
de la variedad de caf y del grado de madurez del fruto.
Crecimiento y desarrollo del fruto de caf
La fase reproductiva del caf inicia con la aparicin de las primeras flores. Se considera como la primera floracin, el momento en que por lo menos el 50 % de las plantas
han florecido. Esta fase continua con el desarrollo del fruto y culmina con la maduracin
y cosecha [2]. Desde la floracin hasta la maduracin transcurren aproximadamente entre
220 y 240 das. El fruto pasa por varias etapas de crecimiento, y su desarrollo en el tiempo
describe una curva sigmoidal doble. La maduracin de los frutos no es uniforme debido a
las diversas floraciones, y depende de las condiciones climticas particulares. El desarrollo
del fruto se puede describir en tres etapas [34].
Primera etapa: Desde la floracin hasta la semana 8 (60 das). Se caracteriza por un
crecimiento lento, los frutos presentan un color verde y su forma se parece a la cabeza
de un fsforo, presentan consistencia gelatinosa y no hay formacin de la semilla.
Segunda etapa: Desde la semana 9 hasta la 26 (desde los 75 das hasta los 195 das).
Esta etapa se caracteriza por un crecimiento acelerado de los frutos tanto en dimensiones como en peso fresco. El color sigue siendo verde.
Tercera etapa: Desde la semana 27 hasta la 32 (desde los 135 das hasta los 240 das).
Durante esta fase el fruto cambia de color verde a rojo amarillo y adquiere madurez
fisiolgica hasta quedar listo para la cosecha.
1.1.2.
Cultivo
Esta etapa comprende todas las actividades relacionadas con la siembra, fructificacin y recoleccin del caf cereza. Dadas las caractersticas de fructificacin de los cafetos
6
colombianos, donde en una misma rama es posible encontrar granos maduros, pintones,
verdes y hasta flores, se ha adoptado un sistema de recoleccin que consiste en darle varios
pasones al rbol para coger solamente los frutos plenamente maduros. Este sistema de recoleccin selectiva tiene ventajas tales como la uniformidad y buena calidad del producto. Sin
embargo, incrementa la necesidad de mano de obra y por lo tanto se elevan los costos de
produccin. Los costos de recoleccin representan entre el 30 y el 40 % de los costos totales
de produccin [37]. Los costos de cosecha son altos debido a que solamente se recolectan
los frutos maduros, individualmente, en suelos con pendientes moderadas y altas, en poca
de lluvias. La recoleccin del caf en Colombia se hace manualmente ya que la topologa de la zona no facilita la mecanizacin. En reas planas de Australia, Brasil y Hawaii, se
han implementado recolectores mecanizados. Por ejemplo, vibradores de follaje y batidores
mecnicos [28]. El primer sistema aplica vibraciones hacia abajo y adelante sobre las ramas
laterales y los frutos, por medio de dedos mecnicos, de tal forma que se desprendan los
frutos maduros. Y los batidores mecnicos consisten en la aplicacin de temblor en el tallo
para provocar el desprendimiento del fruto maduro. Utilizando estos mtodos la calidad de
la cosecha disminuye debido al alto porcentaje de frutos inmaduros que se desprenden [1].
Beneficio
El beneficio del caf es un conjunto de operaciones realizadas para transformar el
caf en cereza en caf pergamino seco. Existen dos formas de realizar este proceso, por
va hmeda o por va seca. En Colombia se hace beneficio del caf por va hmeda, y
comprende cuatro etapas que son: la descerezada, la fermentacin, el lavado y el secado.
Descerezar o despulpar es quitarle a los granos la cereza o pulpa de color rojo que los cubre.
La fermentacin, consiste en dejar vinagrar los granos descerezados durante varias horas.
El lavado del caf, es el nico proceso en el que se requiere indispensablemente el agua, que
se usa para remover los residuos de muclago que quedan en contacto con el caf pergamino
despus de la fermentacin. Y el secado, que puede hacerse al sol o por sistemas mecnicos.
7
La trilla
La trilla consiste en quitarle al caf pergamino seco el pergamino, es decir la cobertura gruesa, de color amarillo oro que protege la almendra (caf verde). El resultado de la
trilla es caf verde que es la forma como se exporta el caf colombiano.
1.1.3.
8
orden de 5 al 6 %, a pesar de mantener un rea de cultivo constante. Este comportamiento
es el resultado de la tecnificacin de la caficultura; el 57 % de las fincas se encuentran tecnificadas [14]. La actual situacin mundial cafetera soporta una peligrosa sobreproduccin
que se refleja en la inestabilidad de los precios y una ardua competencia entre los pases
productores. Sin embargo, los precios de venta del caf colombiano siempre han estado en
niveles superiores a los de los otros pases exportadores debido a su apreciada calidad.
1.1.4.
como la apariencia, el color y el olor del caf en pergamino, almendra y tostado; as como
por medio de sus caractersticas organolpticas tales como el aroma, la acidez, el amargor,
el cuerpo y el sabor de la bebida. La calidad est determinada genticamente pero es influenciada por diferentes factores tales como las condiciones de cultivo, el clima, el suelo,
los cuidados fitosanitarios, las prcticas agronmicas (principalmente la cosecha y el beneficio), y tambin la preparacin de la bebida [31]. El caf colombiano tiene una calidad
reconocida mundialmente y ha sido apreciada por los pases consumidores como una de
las mejores dentro de los cafs arbicos. La alta calidad del caf colombiano se debe a las
variedades que se cultivan, al manejo de las plantaciones, a la oferta ambiental y principalmente a la recoleccin que a diferencia de muchos pases se hace de forma manual y
selectiva.
Los frutos sobremaduros y verdes causan el defecto de fermento, ya sea con sabores
agrios, a frutas, a cebolla, rancios o nauseabundos. La presencia de ms del 2.5 % de granos
verdes producen deterioro de la calidad. Estos frutos representan un problema ya que no se
despulpan, se fermentan y se convierten en granos negros. Se ha concluido en varias investigaciones que la mejor calidad se consigue procesando slo frutos maduros [31]. Tambin
se demostr que se obtienen diferentes aromas y sabores segn el estado de madurez del
caf que se procese [38]. Por ejemplo, el caf maduro produce sabores dulces, suaves a
9
caramelo y mayor acidez.
1.2.
Cosecha Mecanizada
El propsito de la cosecha mecanizada es la sustitucin de la mano de obra, en ope-
10
1.2.1.
Recoleccin robotizada
La recoleccin robotizada se ha convertido en una opcin innovadora para obtener
productos alimenticios de buena calidad y con precios ms bajos. En la actualidad, diferentes factores tanto de los procesos agrcolas como del progreso tecnolgico han enfocado
las investigaciones hacia la obtencin de soluciones automticas a los problemas de recoleccin de cosechas. Algunos de estos factores son: la escasez de mano de obra, los altos
costos laborales, la labor intensiva asociada con la recoleccin selectiva de frutos, el acelerado progreso en la tecnologa de los sensores y computadores [19], y el decremento de los
costos de los microprocesadores, sistemas de visin y equipamiento de robots [35].
La identificacin visual automtica en imgenes de campo es una operacin compleja por las variaciones de iluminacin. Donde efectos de la luz del sol y la sombra de las
ramas, pueden combinarse en una sola imagen, as como fondos oscuros y claros [33]. Por
esta razn, muchos diseos se trabajan en ambientes protegidos, por ejemplo en invernaderos [23].
11
1.2.2.
Clasificacin de productos
La visin computarizada primero fue aplicada en otras etapas de la produccin agr-
La clasificacin que emplea tcnicas de visin artificial se hace con base en el anlisis de una imagen digital del producto. De cada imagen se pueden extraer propiedades del
producto tales como: la forma, el tamao, el color, etc.. La clasificacin de productos por
medio de visin artificial comprende los siguientes pasos principales: adquisicin de las
imgenes, segmentacin de los objetos presentes en la imagen, extraccin de las caractersticas de los objetos, interpretacin de stas y la asignacin a una clase.
12
Algunas industrias prefieren optar por un proceso de clasificacin sencillo y eficiente que realizar una recoleccin selectiva, ya que los costos de produccin son menores y la
tasa de cosecha es ms alta. Sistemas de clasificacin usando visin artificial han sido implementados con xito en los procesos productivos de papas [18], olivas [26] , brcoli [32],
nueces de pistacho [15] y manzanas [30].
1.3.
1.3.1.
de visin artificial. Esto se hace por medio de un sensor y si es el caso, un sistema digitalizador. El sensor puede ser una cmara fotogrfica o de video. Si la seal producida por
la cmara es anloga entonces se utiliza un convertidor anlogo digital para digitalizarla y
guardarla en el computador. El sistema de adquisicin comprende adems de la cmara un
equipo de iluminacin y un fondo. Para obtener una buena imagen, es necesario poseer una
iluminacin adecuada la cual depende de la tarea que se desea realizar. Una iluminacin
inapropiada conlleva a la alteracin de las caractersticas del objeto en la imagen. El fondo
permite controlar el ambiente procurando realzar el objeto de inters aislndolo de los otros
objetos presentes en el entorno.
13
1.3.2.
Caracterizacin
Las imgenes segmentadas contienen mucha informacin redundante. Estos datos
elevan la carga computacional y no son tiles para el proceso de anlisis. Por esta razn
se extrae la informacin cualitativa, obtenindose una representacin y descripcin de los
objetos que se van a estudiar. Los rasgos extrados se llaman caractersticas y un vector de
tales caractersticas se conoce como modelo o patrn [21]. Las caractersticas son usadas
como entradas a los algoritmos para la clasificacin de los objetos dentro de diferentes categoras. Segn Pavlidis las caractersticas de un objeto en una imagen pueden ser externas
o internas [29]. Las caractersticas externas de la imagen describen la informacin del contorno de los objetos. Las caractersticas extradas de las propiedades de los pxeles dentro
del contorno son llamadas caractersticas internas de la imagen.
14
Por medio de las caractersticas internas se obtiene informacin del color y la textura del objeto. Para caracterizar el color de un objeto se analizan las componentes de los
diferentes modelos de color en cada pxel del objeto. Un modelo de color es la definicin
de un sistema tridimensional de coordenadas donde cada color queda representado por nico punto. Los modelos ms utilizados en en anlisis de imgenes son el RGB (Red Green
Blue) y el HSI (Hue Saturation Intensity). En el modelo RGB, cada color se divide en sus
componentes espectrales primarios rojo, verde y azul. Mientras que en modelo HSI, la componente que cuantifica la intensidad est desacoplada de la informacin cromtica, es decir,
del tono (describe un color puro) y la saturacin (cantidad de luz blanca que modifica el color). Las caractersticas que definen el color son diferentes variables estadsticas, tales como
la media y la varianza, de cada uno de los componentes de los modelos de color. Para caracterizar la textura, que es la distribucin espacial del color en el objeto, se usan variables
estadsticas y estructurales tales como: funciones de autocorrelacin, modelos autoregresivos, transformadas pticas, elementos estructurales, probabilidad de coocurrencia espacial
del los niveles de color, suma y diferencia de los histogramas, entre otros.
1.3.3.
de caractersticas, las cuales deben dar la mejor descripcin de las clases. La seleccin de
las caractersticas discriminantes depende de la naturaleza del problema en particular. Las
caractersticas seleccionadas deben cumplir las siguientes propiedades: capacidad discriminante (separacin entre clases), fiabilidad (poca dispersin), incorrelacin (dependencia
entre caractersticas) y rapidez de clculo. La seleccin de las caractersticas es un proceso
que se hace a posteriori, es decir se escogen, agregando o quitando, caractersticas de un
conjunto predeterminado. Para elegirlas se utiliza la relacin de Fisher y el coeficiente de
correlacin [16]. La relacin de Fisher cuantifica simultneamente la separacin entre clases y la fiabilidad de cada una de las clases. El coeficiente de correlacin se obtiene a partir
de la covarianza de las combinaciones posibles de dos caractersticas, clase a clase.
15
1.3.4.
Clasificacin
En el proceso de clasificacin se requiere de una regla de decisin, conocida como el
criterio de clasificacin, para poder clasificar los productos dentro de dos o ms grupos definidos, llamados clases, con base en las caractersticas cualitativas extradas de los objetos.
El criterio de clasificacin es usualmente derivado de la observacin de las clases conocidas
o grupo de entrenamiento. Hay en la literatura muchos mtodos de clasificacin, para determinar cual de los clasificadores funciona adecuadamente para una aplicacin particular
se deben realizar pruebas experimentales. Algunos de estos clasificadores estn hechos con
base en mtodos estadsticos, usando redes neuronales, lgica difusa, etc.
Las redes neuronales artificiales emulan las redes neuronales biolgicas y se utilizan para aprender estrategias de control observando la forma como una persona lo hace [8].
Son sistemas que aprenden con ejemplos, no requieren que la tarea a ejecutar se programe.
Las redes neuronales reaccionan, aprenden y se auto-organizan. Para entrenar una red neuronal se le presentan de manera repetitiva y sistemtica un conjunto de entradas, se evala
16
la calidad de las respuestas para estas entradas, y se ajusta la frmula que genera estas acciones.
Los sistemas difusos se basan en reglas que utilizan lgica difusa para imitar el
razonamiento humano de un experto [39]. La lgica difusa permite analizar informacin
del mundo real donde las cosas son parcialmente ciertas. Esta informacin involucra incertidumbre, inexactitud y contiene ruido. En la lgica clsica un objeto pertenece o no
pertenece a un conjunto, no hay intermedio, a diferencia de la lgica difusa, donde un objeto pertenece parcialmente a un conjunto. El grado de pertenencia est dado por un valor
que est entre cero y uno. La clasificacin de un objeto se hace con base en el anlisis del
grado de pertenencia que tiene ste a las diferentes caractersticas.
Existe una gran diferencia entre los sistemas difusos y los estadsticos, los dos operan sobre el mismo rango numrico pero los conceptos son distintos. Las probabilidades
miden si algo va a ocurrir o no. Los niveles difusos miden el grado en el cual algo ocurre o
alguna condicin existe.
Los clasificadores con redes neuronales tienen ventajas comparados con los mtodos estadsticos tales como adaptabilidad, procesamiento paralelo masivo y tolerancia a los
errores. Las redes neuronales han sido implementadas con xito en actividades de inspeccin de calidad y clasificacin de diferentes productos agrcolas, debido a que las caractersticas que definen a estos productos no siguen una funcin matemtica determinada.
1.3.5.
Trabajo anterior
Dentro del grupo de investigacin PCI, se realiz un proyecto que consista en el de-
17
electrnica en el 2001 [25]. Los resultados obtenidos mostraron la clasificacin de imgenes de frutos de caf en cuatro categoras dependiendo de la madurez. La discriminacin
entre clases fue realizada a partir de la informacin ofrecida por la media estadstica del histograma, por la media estadstica de la componente de tono del modelo HSI, y por el rea
proyectada. Se implement un clasificador Bayesiano, con el que se obtuvo una efectividad
mayor del 90 % para todas las clases. Se utilizaron 100 imgenes de granos en diferentes
etapas de maduracin, las cuales se tomaron el mismo da, sin condiciones especficas de
adquisicin.
Captulo 2
2.1.1.
Frutos de caf
Los frutos de caf utilizados en la adquisicin de las imgenes se obtuvieron gracias
a la colaboracin de Cenicaf, dentro de un proyecto de investigacin llamado Caracterizacin de los estados de madurez del fruto de caf. Este proyecto desarrollado por investigadores de Cenicaf junto con estudiantes de Agronoma de la universidad de Caldas buscaba
la extraccin de caractersticas fsicas y qumicas de los frutos de caf en diferentes etapas
de desarrollo.
20
Representatividad del cultivo: el cultivo en las tres zonas debe ser homogneo en
cuanto a variedad y condiciones de manejo. Adems debe tener caractersticas propias de los cultivos tecnificados de la regin.
Densidad: altas densidades de siembra, como mnimo 5000 y preferiblemente cercanas a las 10000 plantas por hectrea.
Variedad: caf variedad Colombia - Cereza roja.
Edad: plantaciones que estn entre la segunda y la cuarta cosecha.
Sistema de cultivo: cafetales a libre exposicin.
Manejo: plantaciones en buen estado, sin deficiencias nutricionales, que hayan recibido adecuado manejo fitosanitario y de arvenses.
Tamao del lote: el tamao del lote aproximadamente es de 50m2 .
Despus de seleccionar los lotes se escogieron aleatoriamente 100 plantas. A stas
plantas se les hizo un proceso conocido como Raleo, debido a la caracterstica de fructificacin desuniforme. El Raleo consiste en desprender todos los frutos de la planta dejando
slo las flores. De esta forma, se logra una floracin homognea garantizando que todos
los frutos de la planta pertenecen a el mismo estado de madurez. A partir de la semana 26
despus de la floracin, se recogieron algunos frutos de las 100 plantas sealadas. De los
frutos recogidos, 100 frutos se empacaron a bajas temperaturas y se trasladaron hasta las
instalaciones de la Universidad Nacional de Colombia sede Manizales campus La Nubia.
El mismo da se adquirieron las imgenes para evitar cambios fsicos de los frutos. Este
proceso se repiti cada semana durante 8 semanas. Se cont con 100 frutos por muestra.
Con cada muestra se tomaron 300 imgenes. Debido a la forma como se desarrolla el caf,
las condiciones del terreno y atmosfricas, en algunas semanas se cosecharon dos muestras,
en la tabla (2.1) se explica la relacin entre las muestras, las semanas y los estados de maduracin.
21
Muestra
10
11
Estado de Maduracin
Semana
Tabla 2.1: Relacin entre: las muestras, los estados de maduracin, las semanas
2.1.2.
Sistema de adquisicin
El sistema de adquisicin implementado constaba de una cmara de video a color
3 CCD (JVC KY F 55B), una tarjeta digitalizadora (National instruments), un computador y dos lmparas de luz blanca. Las imgenes almacenadas son la vista superior de los
frutos dispuestos individualmente sobre un fondo e iluminados con luz blanca difusa. Cada
semana se montaron tres sistemas de adquisicin diferentes, con cada uno se tomaron 100
imgenes, una imagen por fruto. Los sistemas de adquisicin contienen los mismos elementos pero se modific la iluminacin y el fondo. Para variar la iluminacin, se cambi la
posicin de las lmparas. Para la iluminacin, la luz de las lmparas no se orient directamente sobre el fruto sino que se difumin usando una sombrilla blanca en cada lmpara. A
pesar de la sombrilla, el haz de luz incida fuertemente sobre el fruto creando dos brillos polarizados. Al alejar las lmparas se disminua el brillo pero la luz no era suficiente haciendo
las imgenes oscuras y creando sombras. Usando un filtro de papel pergamino entre la lmpara y la cmara se obtuvieron imgenes con frutos sin mucho brillo, y con luz moderada
y homognea. Los tres fondos eran cartulinas de color blanco y azul en dos tonalidades.
Los colores se escogieron para producir alto contraste entre el fruto y el fondo, y facilitar la
segmentacin. Como se utilizaron tres sistemas de adquisicin y con cada uno se tomaron
100 imgenes, entonces se cuenta con una base de datos que contiene 300 imgenes por
semana. Las imgenes estn almacenadas en formato BMP, con una resolucin de 160x160
pxeles y 24 bits por pxel. En la figura 2.1 se muestra un ejemplo de una imagen adquirida.
22
2.2.
datos de la imagen que corresponden al interior del fruto. Ya que los frutos estn centrados
en la imagen, se tom una matriz de 50x50 pxeles, a partir del centro de la imagen, de sta
forma se obtiene una porcin del centro del fruto como se muestra en la figura 2.2.
23
con muy buenos resultados debido al alto contraste de la imagen binaria. En la figura 2.4 se
presenta el borde obtenido para la imagen 2.3.
Captulo 3
Caracterizacin
3.1.
Caractersticas
Para caracterizar los frutos de caf se hicieron medidas de color, forma, tamao y
textura. Las caractersticas se obtuvieron al aplicar cada uno de los mtodos de extraccin
de caractersticas en las 3300 imgenes de frutos de caf.
3.1.1.
Caractersticas de color
El color es una medida del espectro electromagntico definido con base en el sis-
tema de visin humano. Las funciones CMFs (color matching functions) son un conjunto
de tres funciones relacionadas con la sensibilidad espectral de los tres conos de los ojos.
Estas funciones fueron determinadas en experimentos psicofsicos. Las funciones CMFs
se usan para establecer un estndar para la especificacin numrica del color en trminos de
tres coordenadas o valores triestmulo. La CIE (Commission Internationale de lclairage
International Commission on Illumination) es la principal organizacin responsable de la
estandarizacin de la mtrica del color y la terminologa. El primer conjunto de CMFs es
conocido como el CIE Red-Green-Blue (RGB). Con base en la informacin del CIE RedGreen-Blue se pueden generar otras formas de representacin del color, transformando del
espacio RGB a otros espacios tridimensionales. Cada color es un punto en un espacio de
25
26
color determinado, y la diferencia entre dos colores se considera como la distancia entre
ellos.
Para la caracterizacin del color se usaron seis espacios de representacin del color:
RGB, HSI, YIQ, YCbCr, Colores oponentes, y Ohta. Cada uno de estos modelos describe
el color usando tres componentes. En el nexo A se explica con detalle cada uno de los
modelos de color utilizados. Para cada imagen de fruto de caf se obtuvo un vector de
tamao 18, donde cada posicin muestra la media estadstica de cada componente para los
diferentes modelos. La media estadstica se hall con base en la ecuacin (3.1), donde xi es
la intensidad de cada componente en cada pxel y n es el total de pxeles.
x
=
n
1X
xi
n i=1
(3.1)
En la figura 3.1 se presenta una imagen con el color promedio en el espacio RGB
para cada una de las once clases.
27
En la tabla 3.1, se presenta la lista de las 18 caractersticas de color obtenidas.
Tabla 3.1: Caractersticas de color
Caracterstica
3.1.2.
10
11
12
13
14
15
16
17
18
Caractersticas de textura
Usando caractersticas de textura se espera obtener descripciones de la suavidad, ru-
28
informacin de la distribucin de las intensidades y las posiciones de los pxeles que tienen
iguales, o casi iguales valores de intensidad. En el proceso de maduracin del caf se tienen
etapas donde un color se presenta homogneamente sobre toda la epidermis, mientras que
en otras etapas hay una variacin suave o brusca de diferentes colores. Las caractersticas
de textura aplicadas a imgenes de caf se centran en el anlisis de la suavidad en la distribucin de la intensidad de los colores para todas las etpas, as como el anlisis de la
rugosidad para las etapas finales cuando los frutos estn sobremaduros o secos, pero no en
la observacin de la repeticin de patrones regulares.
Matriz de Coocurrencia
La construccin de la matriz de coocurrencia se basa en la ubicacin espacial de los
pxeles, las relaciones con su vecindario y el valor de su intensidad, dependiendo de la condicin, la direccin y la distancia. Condicin: Es la regla que debe cumplir un determinado
pxel para poder ser cuantificado, usualmente esta condicin es tomada como la ubicacin
del pxel de determinada intensidad que se encuentra en la direccin del vecino.Direccin:
Es la orientacin espacial en la cual se evala la condicin, como casos tpicos se utilizan
direcciones como 0 grados, 45 grados, 90 grados y 135 grados ( [17]). Distancia: Es el nmero de pxeles que hay entre el par de pxeles evaluados, usualmente se utilizan 1, 3 y 5
pxeles de distancia.
29
Entropa componente R
Uniformidad componente R
Contraste componente R
Correlacin componente R
Varianza componente R
10
Directividad componente R
11
12
Entropa componente G
13
Uniformidad componente G
14
Contraste componente G
15
Correlacin componente G
16
17
18
19
20
Varianza componente G
21
Directividad componente G
22
30
Caracterstica
3.1.3.
23
Entropa componente B
24
Uniformidad componente B
25
Contraste componente B
26
Correlacin componente B
27
28
29
30
31
Varianza componente B
32
Directividad componente B
33
Caractersticas de tamao
El tamao de los frutos de caf depende del estado de madurez. En las primeras eta-
pas de desarrollo del fruto el tamao es pequeo y va aumentando hasta llegar a su mximo
valor en plena madurez. Despus de la madurez el tamao disminuye a medida que el fruto
se va secando. Cuando es dificil de distinguir el cambio de color entre dos etapas de madures consecutivas, se utiliza el tamao como caracterstica diferenciadora. En un ambiente
controlado donde se tenga una cmara nica, as como los parmetros de zoom y foco fijos,
las medidas del tamao discriminaran las diferentes etapas. Se utilizaron las imgenes binarizadas y adems las de contorno para obtener un conjunto de 5 caractersticas de tamao.
En el anexo A se explican con detalle cada uno de los mtodos utilizados. En la tabla 3.3,
se presenta la lista de las 5 caractersticas de tamao.
31
Tabla 3.3: Caractersticas de tamao
Caracterstica
3.1.4.
rea
Permetro
Longitud
Anchura
Eje mnimo
Caractersticas de forma
La forma de los frutos de caf durante todo el proceso de madurez es elipsoidal. La
forma elipsoidad se define con un centro y tres ejes de simetra, adems todas las secciones
planas de un elipsoide son elipses o crculos. En las primeras etapas la forma va variando de
elipsoidal alargada, donde un eje de simetra es mucho mayor que los otros dos, a circular,
donde los tres ejes son similares. En plena madures, cuando el fruto tiene ms pulpa, la
forma es esfrica es decir que los ejes de simetra son iguales. A medida que el fruto va
envejeciendo, la pulpa se va secando y la forma tiende otra vez a ser elipsoidal alargada. En
una imgen de un fruto de caf solo se tiene informacin de una de las tres secciones de la
elipsoide, con base en esta vista se obtienen dos de los tres ejes de simetra. En el anexo A,
se explican detallamente los mtodos de extraccin de caractersticas de forma utilizados.
En la tabla 3.4, se presenta la lista de las 157 caractersticas de forma obtenidas.
32
Tabla 3.4: Caractersticas de forma
Caracterstica
3.2.
1 a 36
37 a 72
73 a 82
83
Rectangularidad
84
Circularidad
85 a 120
121 a 156
157
Normalizacin
Los valores de las caractersticas extradas manejan diferentes rangos dinmicos.
Las caractersticas que tienen valores ms grandes tienen mayor influencia en la clasificacin que las caractersticas con valores pequeos, por lo tanto se realiza una normalizacin
de las caractersticas para que los valores se mantengan dentro de un rango similar.
3.2.1.
N
1 X
xik
N i=1
k2 =
k = 1, 2, ..., l
(3.2)
N
1 X
(xik x
k )2
N 1 i=1
(3.3)
xik x
k
k
(3.4)
x
ik =
Las caractersticas normalizadas con este mtodo tienen media cero y varianza uno.
33
3.2.2.
Normalizacin no lineal
Los mtodos de normalizacin no lineales se emplean en casos en los cuales los
y=
x
ik =
xik x
k
rk
1
1 + exp(y)
(3.5)
(3.6)
El rango de valores de xik que corresponde a la seccin lineal depende de la desviacin estndar y del factor r, el cual es definido por el usuario.
3.2.3.
Comparacin de la normalizacin
Los valores de las caractersticas extradas se normalizaron utilizando los dos mto-
dos, el lineal y no lineal, y con cada uno de estos conjuntos se realiz la seleccin de Fisher
para analizar el efecto de la normalizacin. En la figura 3.2 y figura 3.3 se muestran los
valores del ndice de Fisher para las caractersticas de color sin normalizar y normalizadas
linealmente, respectivamente. Como se puede ver la normalizacin no afecta el valor discriminante de las caractersticas. En cambio al comparar la figura 3.2 y figura3.4 que son los
ndices de Fisher para las caractersticas se observa un cambio en la magnitud del ndice.
Para la normalizacin no lineal el ndice de Fisher aumenta en todas las caractersticas lo
que significa que la nueva representacin mejora la discriminacin. Adems, el aumento del
ndice es casi uniforme para todas las caractersticas. Como los ndices de Fisher muestran
un mayor valor para la normalizacin no lineal se trabaj con los datos normalizados no
linealmente.
34
Figura 3.2: ndice de Fisher para las caractersticas de color sin normalizacin
Figura 3.3: ndice de Fisher para las caractersticas de color con normalizacin lineal
35
Figura 3.4: ndice de Fisher para las caractersticas de color con normalizacin no lineal
3.3.
Seleccin de caractersticas
El nmero de caractersticas extradas usualmente es muy grande. Uno de los pro-
36
3.3.1.
M X
M
X
(i j )2
i
j6=i
i2 + j2
(3.7)
donde los subndices i,j se refieren a la media y varianza correspondiente a la caracterstica bajo investigacin para las clases i y j , respectivamente. Las caractersticas con
ms alto ndice de Fisher son ms discriminantes que las que tienen menor ndice.
3.3.2.
Mtodo multivariado
La seleccin usando el mtodo multivariado se hace con base en la evaluacin en
conjunto de las caractersticas [7]. Este mtodo fue implementado por Genaro Daza Santacoloma y Luis Gonzalo Snchez Giraldo dentro de un trabajo de grado en ingeniera
electrnica en la sede. sta tcnica comprende los siguientes pasos:
MANOVA (Multivariate Analysis of Variables) y Decisin por Flujo de conjunto
flotante.
PCA (Principal Component Analysis)
ANOVA (Analysis of Variables)
Anlisis de correlacin.
37
MANOVA
Es una tcnica de anlisis de varianza multivariado que selecciona las caractersticas
discriminantes en conjunto y no en forma independiente. La idea es evitar la utilizacin de
conjuntos de caractersticas que analizadas de forma univariada discriminen y en conjunto
no lo hagan.
Decisin por flujo de conjunto flotante
El conjunto se empieza a conformar con la caracterstica que separe mejor dos clases. Se va incrementando el tamao del conjunto adicionando la caracterstica que mejore
el desempeo. El conjunto sigue creciendo hasta que la adicin de una caractersticas no
mejore o dae el desempeo del conjunto. Para obtener el desempeo cada uno de los subconjuntos de caractersticas se evala usando el test de Wilks (MANOVA), se obtiene el
F stats y se estima la probabilidad acumulada de la distribucin de Fisher. Se toma el
subconjunto que ofrezca la mayor probabilidad acumulada y que exceda la probabilidad
acumulada medida cuando no se haba adicionado la ltima caracterstica.
PCA
Al grupo seleccionado en el paso anterior se le aplica anlisis de componentes principales enfocado a la minimizacin de la correlacin entre componentes pero no se realiza
reduccin del conjunto.
ANOVA
Se hace anlisis univariado sobre las proyecciones PCA para reducir el espacio,
pero la reduccin se hace sobre un hiperespacio diferente al original.
Anlisis de correlacin
Como la reduccin ANOVA se realiz en un espacio diferente al original, se analiza la correlacin que existe entre las componentes principales seleccionadas con ANO-
38
VA y las caractersticas originales para escoger las caractersticas originales que estn ms
correlacionadas con las proyecciones PCA seleccionadas por ANOVA. Las caractersticas
originales escogidas se pasan por un clasificador lineal incrementando en uno el conjunto.
Finalmente se toman las caractersticas que reduzcan el error de clasificacin tanto como
sea posible.
3.3.3.
Procedimiento utilizado
Se obtuvieron 18 caractersticas de color, 33 de textura, 157 de forma y 5 de tamao.
Dadas las condiciones de adquisicin de las imgenes donde no se fijaron los parmetros de
foco y zoom, las caractersticas de tamao aunque se extrajeron no se van a tener en cuenta.
Al utilizar un zoom y un foco diferente para cada clase no se tiene una referencia fija comn
de comparacin del tamao real de los frutos. El conjunto de caractersticas est formado
por las caractersticas de color, de textura y de forma, es decir que se tienen 208 caractersticas. Se inicia la seleccin con la eliminacin de las que son linealmente dependientes.
Estas caractersticas son una combinacin lineal de otra u otras y por tanto no ofrecen informacin adicional. Eliminando las linealmente dependientes el conjunto queda reducido
a 171 caractersticas.
Se utilizaron dos mtodos de seleccin de caractersticas. Usando el ndice de Fisher y usando el mtodo de anlisis multivariado. El ndice de Fisher mide la capacidad de
discriminacin de cada caracterstica para todas las 11 clases. El anlisis multivariado, entrega las caractersticas ms discriminantes para dos clases. Es decir que el anlisis se hace
clase a clase, una clase con cada una de las clases restantes. En nuestro caso que son 11 clases se obtienen 110 conjuntos de caractersticas uno para cada clase con cada una de las 10
clases restantes. Fisher hace anlisis univariado, mide la discriminacin de la caracterstica
independientemente, y el otro mtodo es un anlisis multivariado, donde se observan las
caractersticas en conjunto. Es ms confiable hacer el anlisis multivariado, pero el mtodo
que se est utilizando escoge las caractersticas para clasificadores clase contra clase, lo que
39
requerira un clasificador clase contra clase. Como son 11 clases se necesitaran 110 clasificadores biclase. Lo que aumentara la complejidad del clasificador y el tiempo de ejecucin.
Entonces se va a utilizar el resultado de los dos mtodos para escoger las caractersticas del
clasificador final.
Comparacin de los mtodos de seleccin
Para evaluar la reduccin de las caractersticas se toma el error de clasificacin variando la dimensin del conjunto de caractersticas resultado de cada uno de los mtodos.
Se utiliza el mismo clasificador Bayesiano en las diferentes pruebas para comparar los resultados.
Fisher
En la Figura 3.5, se muestran los valores de los ndices de Fisher para las 171 caractersticas. Es evidente que unas tienen alta informacin discriminante mientras que la
mayora no. Se organizaron las caractersticas de mayor a menor segn el ndice de
Fisher, como se muestra en la Figura 3.6, menos de la mitad tienen un ndice representativo. En la Figura 3.7 se muestran las respectivas etiquetas de las caractersticas,
las caractersticas estn etiquetadas segn el siguiente orden textura, forma y color.
40
41
Etiqueta
Caracterstica
27
171
163
16
19
83
17
10
158
11
167
12
82
13
14
30
15
25
Contraste componente B
16
155
17
11
18
28
19
166
20
10
Directividad componente R
42
En la figura 3.8 se presenta el error de clasificacin al variar el tamao del conjunto de
caractersticas. Se increment la dimensin del conjunto de caractersticas en orden
segn el ndice de Fisher, desde la ms discriminante hasta evaluar el clasificador con
todas las caractersticas. Con una caracterstica el error est cerca al 55 %, con nueve
caractersticas alcanza el 10 %, entre 10 y 16 caractersticas alcanza el menor error
entre 7 y 10 %. En la figura 3.9 se muestra el tiempo requerido para la clasificacin
aumentando la dimensin del conjunto de caractersticas. El tiempo requerido para la
clasificacin aumenta suavemente en forma exponencial a medida que se aumenta el
tamao del conjunto de caractersticas. Cuando se evala con todas las caractersticas
se necesitan 3 segundos para la clasificacin.
43
44
Error de clasificacin ( %)
tiempo (s)
56.75
0.00191
47.14
0.00175
28.57
0.00223
17.79
0.00261
18.31
0.00298
14.41
0.00349
14.8
0.00394
9.87
0.00449
10.12
0.00516
10
9.87
0.00573
11
9.22
0.00646
12
11.42
0.00735
13
9.87
0.00798
14
9.35
0.00885
15
11.55
0.0098
16
9.09
0.01078
17
9.87
0.01167
18
11.16
0.01283
19
10.9
0.01385
20
10.77
0.01569
45
Anlisis Multivariado
El mtodo de anlisis multivariado selecciona un conjunto de caractersticas adecuado para separar dos clases. Como son 11 clases con el mtodo multivariado se
obtienen 110 grupos de caractersticas de diferentes tamaos uno para cada clase con
respecto a cada una de las otras 10 clases. En muchos casos una caracterstica separa
bien varias clases osea que aparece en varios grupos. Se ordenaron las caractersticas
de tal forma que las primeras son las mejores de cada grupo y luego se van ubicando
las otras sucesivamente hasta ordenar todas las caractersticas de los 110 grupos. El
conjunto total de la seleccin usando el mtodo multivariado comprende 54 caractersticas de las 171. En la tabla 3.7 se listan las 20 mejores caractersticas obtenidas
con el mtodo multivariado.
46
Etiqueta
Caracterstica
83
27
28
155
159
17
13
Uniformidad componente G
10
82
11
167
12
171
13
15
Correlacin componente G
14
162
15
158
16
18
17
20
Varianza componente G
18
Varianza componente R
19
165
20
19
47
En la figura 3.10 se muestra el error de clasificacin obtenido al aumentar la dimensin del conjunto de caractersticas ordenadas. Con una caractersticas se obtiene un
error del 50 %, con seis caractersticas se alcanza un error del 10 %, con 11 caractersticas se logra el menor error de 7 %. El tiempo de clasificacin se presenta en la
figura 3.11. El tiempo presenta un crecimiento exponencial suave a medida que se
incrementa la dimensin del espacio de caractersticas.
48
49
Como se utilizaron dos mtodos para la seleccin de caractersticas, uno univariado
y otro multivariado, se tom de cada mtodo el conjunto de caractersticas con el que se
obtuvo el menor error de clasificacin. Es decir, las primeras 16 caractersticas segn el
ndice de Fisher y las 11 caractersticas del mtodo multivariado. Luego, se compararon
y se escojieron las caractersticas que aparecen en los dos conjuntos. El resultado de esta
seleccin mostr que ocho caractersticas aparecen tanto en la seleccin con Fisher como
usando el mtodo multivariado, estas caractersticas se presentan el la tabla 3.8.
Tabla 3.8: Las ocho caractersticas seleccionadas con los dos mtodos utilizados
Etiqueta
Caractersticas
Tipo
27
Textura
Textura
Textura
83
Forma
17
Textura
167
Color
82
Forma
155
Color
Las caractersticas 28, 171, 158 estn dentro de las 20 mejores caractersticas para
los dos mtodos de seleccin, pero no coinciden dentro de las caractersticas que dan el
menor error. Se probaron estas caractersticas para ver si se mejoraba la clasificacin adicionando alguna de ellas. En la tabla 3.9 se presentan los resultados obtenidos. Como se
puede observar el menor error de clasificacin se obtiene cuando se toman las 8 caractersticas coincidentes ms la caracterstica 171. Se mejor la clasificacin adicionando la
caracterstica 171, este resultado se esperaba ya que esta caracterstica presenta uno de los
ndices de Fisher ms altos.
50
Tabla 3.9: Error de clasificacin adicionando otras caractersticas.
3.4.
caractersticas
error
tiempo ms
8 coincidentes
9.7013
3.7
8 y 28
9.4156
4.0
8 y 171
7.5844
4.3
8 y 158
9.5455
4.4
8 y 28 y 171
8.5714
4.9
8 y 28 y 158
9.1558
4.8
8 y 171 y 158
8.7532
4.9
8 y 28 y 171 y 158
8.4286
5.4
pacios. Con el nimo de mostrar el espacio caracterstico se presentan los valores medios
de cada subespacio en la tabla 3.4, y la varianza de los datos de cada subespacio en la tabla
3.4.
51
Tabla 3.10: La media multiplicada por 100 de las caractersticas seleccionadas
27
83
17
167
82
155
171
Media 1
23.29
22.33
80.73
27.62
78.60
22.69
31.24
22.17
73.58
Media 2
19.13
19.55
88.33
93.14
82.36
13.24
92.52
29.33
86.16
Media 3
76.55
75.65
27.06
66.41
27.76
30.66
67.27
55.95
69.12
Media 4
78.15
75.99
26.91
29.09
28.34
32.68
27.02
55.98
71.79
Media 5
82.25
77.65
30.87
47.20
23.29
70.14
46.54
88.69
45.15
Media 6
75.69
73.77
27.72
50.79
29.25
85.92
49.21
77.35
20.16
Media 7
45.59
42.63
48.11
35.95
59.93
66.52
36.83
48.19
30.29
Media 8
45.73
45.11
46.95
34.26
59.05
54.86
36.30
36.16
35.32
Media 9
45.73
44.39
56.42
52.27
14.27
54.10
48.76
26.11
38.98
Media 10
50.05
53.37
38.95
45.41
39.91
51.28
43.14
25.70
36.82
Media 11
43.88
43.19
54.98
47.06
26.33
50.83
49.41
22.06
36.39
83
17
167
82
155
171
Varianza 1
0.146
0.077
0.431
0.225
0.293
0.154
0.311
0.099
0.187
Varianza 2
0.028
0.013
0.098
0.086
0.211
0.236
0.129
0.768
0.090
Varianza 3
0.064
0.073
0.007
0.820
0.041
0.048
0.654
0.440
0.264
Varianza 4
0.063
0.042
0.003
0.035
0.016
0.839
0.043
0.79
0.597
Varianza 5
0.089
1.012
1.703
0.182
0.187
2.519
0.191
0.205
3.222
Varianza 6
0.137
0.127
0.014
0.150
0.052
0.240
0.090
0.655
0.109
Varianza 7
0.443
0.500
0.176
0.122
0.318
0.240
0.157
0.528
0.095
Varianza 8
0.338
0.351
0.109
0.109
0.217
0.321
0.105
0.337
0.089
Varianza 9
1.239
1.178
2.738
0.198
0.435
0.143
0.272
0.203
0.074
Varianza 10
0.621
0.873
0.380
0.146
1.100
0.036
0.117
0.236
0.016
Varianza 11
1.337
2.337
2.991
0.232
1.662
0.018
0.184
0.133
0.018
Captulo 4
Clasificacin
4.1.
Clasificadores
4.1.1.
Estadstico
Los mtodos estadsticos se fundamentan en la regla de Bayes del mnimo error
[10]. Esta regla concluye que un objeto, con unas caractersticas determinadas, pertenece
a una clase si la probabilidad de pertenecer a sta clase es mayor que la probabilidad de
pertenecer a cualquier otra clase. En el anexo B, se presenta una explicacin detallada de
esta tcnica de clasificacin. El clasificador bayesiano es un clasificador biclase, es decir
que separa el espacio de caractersticas slo en dos subconjuntos. Por lo tanto el clasificador implementado utiliza once clasificadores bayesianos, uno para separar cada clase de
todas las dems. Para cada clasificador se definen la funcin de probabilidad p( wmi ) y La
probabilidad a priori P (wi ). En las aplicaciones prcticas, las funciones de probabilidad no
se conocen y por lo tanto se deben estimar. Para estimarlas, primero se asume la forma de
la funcin de probabilidad, y luego se hallan sus parmetros a partir del conjunto de entrenamiento. En este caso, se supone que las funciones de probabilidad de las clases estn
descritas por distribuciones normales o gausianas como se muestra en la ecuacin (B.4),
p(
wk
1
12
)=
(X i )T (Ci )1 (X i )
d
1 e
m
(2) 2 kCi k 2
53
(4.1)
54
donde d es la dimensin del vector de caractersticas, i es el vector d dimensional
que contiene la media de las caractersticas en una clase wi , Ci es la matriz de covarianza.
Para obtener p( wmi ), slo se necesita reemplazar los parmetros i , Ci . Estos parmetros
pueden ser estimados a partir del conjunto de muestras. La probabilidad a priori P (wi )
tambin se puede hallar del conjunto muestral. Por lo tanto el criterio de clasificacin,
ecuacin (B.3), se determina en forma analtica.
4.1.2.
las redes neuronales se presenta en el anexo B). Cada red es un clasificador biclase que
separa una clase de todas las dems. Las once redes tienen igual estructura. Cada una de
stas es una red neuronal multicapa conformada de la siguiente manera: una capa de entrada
con 9 neuronas, dos capas ocultas con 15 y 7 neuronas respectivamente, una capa de salida
con una neurona. sta estructura se escogi con el mtodo de prueba y error. La entrada es el
vector caracterstico de cada imagen, conformado por las 9 caractersticas seleccionadas en
el captulo anterior. Las funciones de transferencia son funciones sigmoidales. Se entren
durante 300 iteraciones y se tom como umbral del error 1x1010 . Se utiliz el algoritmo
Backpropagation Levenberg y Marquardt para entrenar la red [9]. Este algoritmo utiliza
tcnicas numricas para la optimizacin, minimiza la suma de los cuadrados del error, y
actualiza los pesos de acuerdo a (4.2),
wjk (n + 1) = wjk (n) [J T J I]1 J T k (n)
(4.2)
donde, J es la matriz Jacobiana que contiene las derivadas primeras de los errores
de la red con respecto a los pesos y es un escalar que determina la velocidad de entrenamiento.
4.1.3.
Clustering
El clasificador que se implement es el Clustering k medias que agrupa las muestras
en 11 grupos y ubica el centro de cada grupo, tal que se minimice la distancia entre las
55
muestras y el centro. El algoritmo Clustering k medias se explica con detalle en el anexo B.
Como es una metodologa de reconocimiento de patrones no supervisada, los valores de los
centros se obtienen siguiendo el algoritmo que se muestra en el anexo B. Para empezar hay
que definir cuatro varariables: nmero de muestras de entrenamineto (n), nmero de clases
(k = 11), los centros de las once clases ci se inicializan aleatoriamente, y los valores de las
funciones de pertenencia uij se inicializan aleatoriamene.
4.2.
Evaluacin
Por medio de este experimento se desea evaluar el desempeo de las tcnicas de
(Im, clase) = {
1 si d(Im) 6= clase
0 si d(Im) = clase
(4.3)
Para estimar el error se utiliz el mtodo de validacin cruzada (10-fold) [27], [36].
Para la estimacin del error se usa el conjunto de muestras disponible, el cual se divide en
el conjunto de entrenamiento y el de prueba. El clasificador se disea usando las muestras
de entrenamiento y luego se evala obteniendo el error de clasificacin para las muestras de
prueba. Con base en el error obtenido se puede predecir el desempeo del clasificador ante
nuevas muestras. Para obtener una medida confiable del desempeo el conjunto de muestras
debe ser lo suficientemente grande y, los conjuntos de entrenamiento y de prueba deben ser
independientes.
56
4.2.1.
Mtodos de evaluacin
T
V
i = 1, 2, ..., V ).
Error(dv ) =
1
Tv
(Ima, clase)
(4.4)
(Ima,clase)Tv
Error(d) =
4.2.2.
V
1 X
Error(dv )
V v=1
(4.5)
tras de cada una de las 11 clases, es decir, 3300 muestras. Se van a evaluar las tres tcnicas
de clasificacin usando validacin cruzada. Los grupos de muestras para la validacin se
escogen aleatoriamente. Se hicieron 20 pruebas para analizar el comportamiento de los clasificadores. En la Figura 4.1, se muestra el porcentaje de error promedio obtenido en 9
57
pruebas al evaluar las tres tcnicas de clasificacin. En la Figura 4.2, se presenta el correspondiente tiempo promedio tanto para el entrenamiento como para la prueba.
58
Los errores parciales obtenidos con validacin cruzada de los mejores clasificadores
de cada una de las tcnicas se muestran en la tabla 4.1. El error de clasificacin promedio
total para cada una de las tres tcnicas se presenta en la Tabla 4.2.
Error Difuso( %)
4.5455
7.2727
16.3636
3.6364
2.7273
16.3636
8.1818
8.1818
20.9091
3.6364
13.6364
16.3636
5.4545
9.0909
13.6364
6.3636
3.6364
16.3636
2.7273
9.0909
14.5455
6.3636
8.1818
21.8182
3.6364
3.6364
20.0000
10
2.7273
4.5455
14.5455
5.4364
Redes Neuronales
7.4646
Difuso
19.4636
Captulo 5
Resultados
5.1.
los clasificadores se hace con base en la matriz de confusin de dnde se obtienen algunos
indicadores de desempeo, como se describe a continuacin.
5.1.1.
Matriz de confusin
La matriz de confusin es una herramienta utilizada para la presentacin y el anli-
sis del resultado de una clasificacin. Es una matriz cuadrada cuyo orden es el nmero de
clases. En las columnas se presentan las clases reales mientras que en las filas se presentan
las clases asignadas por el clasificador. Por ejemplo, en la Tabla 5.1 se presenta la matriz de
confusin para un clasificador de dos clases.
Tabla 5.1: Matriz de confusin. Clasificador de dos clases
Clase 1 (real)
Clase 2 (real)
Clase 1 (obtenida)
Verdaderos clase 1
Falsos clase 1
Clase 2 (obtenida)
Falsos clase 2
Verdaderos clase 2
60
61
La suma vertical muestra la distribucin real de las clases, mientras que la suma
horizontal muestra la distribucin de las clases producida por el clasificador.
Falso
Verdadero
Falso
Con base en la matriz de confusin 5.2 fcilmente se obtienen los siguientes indicadores:
Proporcin de verdaderos positivos: P V P =
Proporcin de falsos negativos: P F N =
VP
(V P +F N ) .
FN
(V P +F N ) .
FP
(V N +F P ) .
VP
(V P +F P ) .
(error positivo).
VN
(V N +F P ) .
(efectividad).
(especificidad).
(error negativo).
(precisin).
VN
(V N +F N ) .
Clasificador bayesiano
En la tabla 5.3 se muestra la matriz de confusin para el mejor clasificador bayesiano al evaluar 100 imagenes. Como se puede ver, se obtiene una buena clasificacin en las
primeras etapas pero no tanto para las dems. Principalmente hay alto error, casi del 10 %
en las etapas intermedias.
62
Tabla 5.3: Matriz de confusin. Clasificador Bayesiano
1
10
11
Total
100
100
100
100
100
100
100
100
95
12
107
88
93
92
16
108
83
91
99
103
10
97
102
11
94
96
Total
100
100
100
100
100
100
100
100
100
100
100
1100
Observando la tabla 5.4, donde se muestran los parmetros de desempeo obtenidos con
base en la matriz de confusin, se puede concluir que el clasificador bayesiano tiene efectividad por encima del 90 % en todas las clases excepto en las clases 6 y 8. Pero tiene mejores
resultados en cuanto a la especificidad ya que los valores speran el 98 % en todas las clases.
En cuanto al error, tiene menor error negativo que positivo. Y la precisin en la mayora de
las clases es del 100 % pero en las clases 5, 6, 7 y 8 la precisin es menor cercana al 90 %.
63
10
11
PVP
1.0
1.0
1.0
1.0
0.95
0.88
0.92
0.83
0.99
0.97
0.94
PFN
0.050
0.12
0.080
0.17
0.010
0.030
0.060
PVN
1.0
1.0
1.0
1.0
0.99
1.0
0.98
0.99
1.0
1.0
1.0
VFP
0.012
0.0050
0.016
0.0080
0.0040
0.0050
0.0020
VPP
1.0
1.0
1.0
1.0
0.89
0.95
0.85
0.91
0.96
0.95
0.98
VPN
1.0
1.0
1.0
1.0
0.99
0.99
0.99
0.98
1.0
1.0
0.99
64
10
11
Total
100
100
98
99
99
102
100
101
91
98
95
103
81
14
97
13
85
102
95
99
10
85
94
11
94
105
Total
100
100
100
100
100
100
100
100
100
100
100
1100
10
11
PVP
1.0
0.98
0.99
1.0
0.91
0.95
0.81
0.85
0.95
0.85
0.94
PFN
0.020
0.010
0.090
0.050
0.19
0.15
0.050
0.15
0.060
PVN
1.0
1.0
1.0
1.0
0.99
0.99
0.98
0.98
1.0
0.99
0.99
VFP
0.0010
0.0030
0.0010
0.0070
0.0080
0.016
0.017
0.0040
0.0090
0.011
VPP
1.0
0.99
0.97
0.99
0.93
0.92
0.84
0.83
0.96
0.90
0.90
VPN
1.0
1.0
1.0
1.0
0.99
0.99
0.98
0.98
1.0
0.99
0.99
65
En la tabla 5.7 se muestra la matriz de confusin para el mejor clasificador usando
clustering difuso al evaluar 100 imagenes. Como se puede ver, hay alto error de clasificacin
en general en para todas las clases pero especialmente en las clases finales. Observando la
tabla 5.8, donde se muestran los parmetros de desempeo obtenidos con base en la matriz
de confusin, se puede concluir que el clasificador clustering difuso tiene efectividad por
encima del 90 % solo en cuatro clases las dems estan muy por debajo especialmente en las
clases 5 y 11. Al igual que en los otros clasificadores tiene mejor desempeo en cuanto a
la especificidad, ya que sus valores estn por encima del 96 % en todas las clases. Segn el
indicador de error el clasificador difuso tiene mayor error positivo y negativo que las otras
tcnicas.
Tabla 5.7: Matriz de confusin. Clasificador Difuso
1
10
11
Total
99
99
100
100
99
100
97
104
62
66
34
100
134
89
17
106
81
97
67
13
26
106
10
77
30
112
11
32
41
76
Total
100
100
100
100
100
100
100
100
100
100
100
1100
66
Tabla 5.8: Indicadores de desempeo. Clasificador Difuso
10
11
PVP
0.99
1.0
0.99
0.97
0.62
1.0
0.89
0.81
0.67
0.77
0.41
PFN
0.010
0.010
0.030
0.38
0.11
0.19
0.33
0.23
0.59
PVN
1.0
1.0
1.0
0.99
1.0
0.97
0.98
0.98
0.96
0.97
0.97
VFP
0.0010
0.0070
0.0040
0.034
0.017
0.016
0.039
0.035
0.035
VPP
1.0
1.0
0.99
0.93
0.94
0.75
0.84
0.84
0.63
0.69
0.54
VPN
1.0
1.0
1.0
1.0
0.96
1.0
0.99
0.98
0.97
0.98
0.94
5.1.2.
Curvas ROC
El espacio ROC (Receiver Operating Characteristic) define un sistema de coorde-
nadas usadas para visualizar el desempeo del clasificador. Las curvas ROC, presentan el
compromiso entre efectividad y la especificidad del clasificador, algn aumento en la sensibilidad est acompaado por un decremento en la especificidad. Es decir, las curvas ROC
muestran la relacin entre las muestras clasificadas adecuadamente (PVP, Proporcin de
Verdaderos Positivos) y las muestras que no pertenecen a la clase pero se clasificaron como
si lo fueran (PFP Proporcin de Falsos Positivos). En el espacio ROC la PFP se dibuja como
variable independiente y la PVP como variable dependiente. Cada clasificador es representado por el punto (PFP, PVP). Los puntos (0, 0) y (1, 1) se conocen como los clasificadores
triviales, representan respectivamente, el clasificador que clasifica todo como negativo y el
clasificador que clasifica todo como positivo.
Para dibujar la curva ROC se construye la lnea convexa formada por los puntos
(PFP, PVP) de los clasificadores que se estn evaluando, junto con los puntos de los clasificadores triviales (0,0) y (1,1). La curva ms cercana a los bordes izquierdo y superior en el
espacio ROC, es la prueba ms acertada porque significa que hay mayor acierto. La curva
67
que ms se acerque al la diagonal de 45 grados en el espacio ROC, es la prueba menos acertada. El mejor sistema de entrenamiento es el que produce un conjunto de clasificadores
que maximice el rea bajo la curva (AUC, Area Under Curve) ROC.
En la figura 5.1, se graficaron las curvas ROC para las tres tcnicas de clasificacin. Como se explic anteriormente, la mejor tcnica de clasificacin segn el anlisis con
curvas ROC es la que tenga mayor rea bajo la curva. Por lo tanto, el mejor clasificador
es el bayesiano, con un rea de 0.974, seguido por el clasificador usando redes neuronales,
con un rea similar de 0.9617, y el peor clasificador segn las curvas ROC es el clustering
difuso, cuya rea es 0.906.
Captulo 6
Conclusiones
En un sistema de visin artificial, la adquisicin determina la sencillez o complejidad de las siguientes etapas, y por tanto define el logro de los objetivos. Si el sistema de
visin artificial se basa en la extraccin de las caractersticas externas del objeto, como son
forma y tamao, entonces durante la adquisicin se deben evitar en la imagen dos defectos: las sombras y los brillos. Las sombras aparecen cuando hay una ubicacin errnea de
las fuentes de iluminacin, o tambin resultan de una iluminacin parcial producida por la
escasez de fuentes de luz. Los brillos se presentan cuando la luz incidente sobre el objeto
es muy directiva. Los dos defectos se evitan con la ubicacin de mnimo cuatro fuentes
de luz (una por cada punto cardinal), puestas a una distancia considerable y cuya luz emitida sea difuminada ya sea reflejndola sobre una superficie adecuada o retractndola al
pasarla por un filtro. Si el inters del objeto de estudio est en sus caractersticas internas,
como son color y textura, entonces se debe procurar mantener constantes la intensidad y
el color de la iluminacin, ya que el color que se percibe de un objeto es la parte de la
luz incidente que el objeto no absorbe. En aplicaciones en ambientes naturales e incluso en
ambientes protegidos es muy difcil mantener las mismas condiciones, por esta razn el sistema de adquisicin debe ser lo suficientemente especfico como para resolver la aplicacin
en particular pero adems debe ser lo ms general posible para considerar las variaciones
comunes.
69
70
Para describir la madurez de un fruto de caf se utilizaron las propiedades de color, tamao, forma y textura obtenindose 208 caractersticas. Usando dos algoritmos de
seleccin se redujo el conjunto a 9 caractersticas. Las caractersticas seleccionadas corresponden a 4 caractersticas de textura, tres de color y dos de forma. Caractersticas como
la textura y la forma de un fruto de caf aportan poca informacin en la clasificacin manual pero proporcionan medidas discriminantes en aplicaciones computacionales donde se
pueden obtener valores exactos. Segn la seleccin, las caractersticas de textura aportan
mayor informacin discriminante que las de color, demostrando que para la separacin lo
mejor no es slo el valor del color sino tambin su distribucin en la superficie del fruto.
Las caractersticas de forma seleccionadas contienen la informacin de baja frecuencia con
la cual se reconoce el cambio en la redondez. La mejor caracterstica de color corresponde
a una componente del modelo de colores oponentes mostrando una mejor representacin
del color en otros modelos diferentes a los comnmente utilizados RGB y HSI.
71
separables, robustez ante datos ruidosos, adaptabilidad, procesamiento paralelo, entre otras.
El clasificador clustering difuso por ser una tcnica no supervisada su entrenamiento es sencillo pero requiere la inicializacin de dos conjuntos de parmetros como son: las funciones
de pertenencia y los centros de los grupos. En las pruebas realizadas se concluy que la
inicializacin de estos parmetros afectaba el resultado, por tanto es recomendable cambiar
de la asignacin aleatoria a otra tcnica.
El clasificador bayesiano tiene mejor desempeo segn las dos tcnicas utilizadas
para la comparacin de los clasificadores como son: indices de desempeo usando la matriz
de confusin y las curvas ROC. Con base en los ndices de desempeo obtenidos con la
matriz de confusin el clasificador bayesiano presenta mayor efectividad, especificidad y
precisin, adems de menor error. Y analizando los clasificadores con las curvas ROC, el
clasificador bayesiano exhibe mayor compromiso entre efectividad y especificidad.
Bibliografa
[1] Alvarez J. Mtodo para calcular la relacin cereza - pergamino en el beneficio del caf.
Cenicaf. Chinchin. 1997.
[2] Arcila J, Buhr L, Bleiholder H, Hack H, Wicke H. Aplicacin de la escala BBCH ampliada para la descripcin de las fases fenolgicas del desarrollo de la planta de caf.
Boletn tcnico Cenicaf. Colombia. No 23:1-32. 2001.
[3] Bulanon D, Kataoka T, Ota Y, Hiroma T. A machine Vision System for the Apple
Harvesting Robot. Agricultural Engineering International: the CIGR Journal of Scientific
Research and Development. Manuscript PM 01 006. Vol.III.
[4] Chalarc J. Vida y hechos del caf en Colombia. Bogot(Colombia). 1998.
[5] Cheung-Wai J. Texture Features For Land Cover Change Detection At 250m Resolution. Laboratory for Global Remote Sensing Studies, Department of Geography, University of Maryland, 2000.
[6] Cocquerez J, Philipp S. Analyse DImages Filtrage et Segmentation, Ed. Masson.
[7] Daza G, Sanchez L. PCA, KPCA y MANOVA sobre seales de voz en imgenes de
posturas labiales y audio. Tesis de Pregrado. Universidad Nacional de Colombia Sede
Manizales Facultad de Ingeniera y Arquitectura Departamento de Electricidad, Electrnica y Computacin. Manizales. 2004.
[8] Delgado A. Inteligencia Artificial y Minirobots. Bogot. 1998.
72
73
[9] Daz R, Figueredo J. Optimizacin del problema inverso en Geofsica usando el algoritmo de entrenamiento de Levenberg - Marquardt. Departamento de Geociencias.
Universidad Nacional de Colombia. 2002.
[10] Duda R, Hart P, Stork D. Pattern Classification. John Wiley and Sons. USA. 1998.
[11] Escobar G. Una concepcin gerencial de la caficultura. Servicio nacional de aprendizaje. Bogot (Colombia). 1992.
[12] Federacion Nacional de Cafeteros de Colombia. Beneficio Ecolgico del caf. Cenicaf. Chinchin (Colombia). 1999.
[13] Fondo cultural cafetero. Por los senderos del caf de la gran bonanza a la peor crisis
1975-1993. Bogot. 1994.
[14] Fundacin pro imagen de Colombia en el exterior. Repblica de Colombia. Colombia.
1995.
[15] Ghazanfari A, Irudayaraj J, Kusalik A, Romaniuk M. Machine Vision Grading of
Pistachio Nuts Using Fourier Descriptors. J. Agric. Engng Res. 68, 247-252. 1997.
[16] Gmez D, Allende M. Reconocimiento de Formas y Visin Artificial. Addison-Wesley
Iberoamericana. Wilmington, E.U.A.. 1994.
[17] Gonzales R, Woods R. Tratamniento Digital de imgenes. Addison-Wesley/daz de
Santos. 1996.
[18] Guizard C, Gravoueille J, Crochon M. Automating potato sorting system using color
machine vision. In: Sensoral 98 Colloque international sur les capteurs de qualit des
produits agro alimentaires. Montpellier. 24-27 fvrier 1998. Cemagref Editions, antony.
pag. 185-197. 1998.
[19] Hayashi S, Sakaue O, Kanuma T. Study on tomato harvesting robot. International symposium on fruit, nut and vegetable production engineering, 5. Davis, California (Estados
Unidos). September 3-10. 1997.
74
[20] Hwie P. Analog and Digital Communications. McGraw Hill.
[21] Jayas D, Paliwal J, Visen N. Multilayer neural network for image analysis of agricultural products. J. Agric. Engng Res. 77(2), 119-128. 2000.
[22] Klette R, Gimel G. COMPSCTI. 375 FT. Citr Tamaki.
[23] Kondo N, Nishitsuji Y, Ling P,Ting K. Visual feedback guided Robotic Cherry Tomato
Harvesting. Transactions of the ASAE. Vol.39(6):2331-2338. 1996.
[24] Maxwell J. Theory of the perception of colors. Trans. R. Scottish Soc. Arts. vol.4.
394-400. 1856.
[25] Maya C, Montes N, Osorio G, Prieto F, Angulo F. Deteccin y caracterizacin de frutos de caf empleando procesamineto digital de imgenes. Inteligencia Computacional
(Memorias). Medellin. Agosto de 2001.
[26] Molto E, Blasco J, Escuderos V, Garca J, Daz R, Blasco M. Automatic inspection of
olives using computer vision. In: Sensoral 98 Colloque international sur les capteurs de
qualit des produits agro-alimentaries, Montpellier, 24-27 fvrier 1998.
[27] Moore A. Cross-validation for detecting and preventing overfitting. School of Computer Science Carneigie Mellon University. 2001.
[28] Norris C. Harvesting. Coffee growing in Australia - A machine harvesting perspective.
Rural industries research an development corporation. pag 79-101. 1995.
[29] Pavlisdis T. Algorithms for shape analysis of contours and waveforms. IEEE Transactions on pattern analysis and machine intelligence. 2(4), 301-312. 1980.
[30] Paulus I, Busscher R, Schrevens E. Use of image analysis to human quality classification of aples. J. Agric. Engng Res. 68, 341-353. 1997.
[31] Puerta Q. Cmo garantizar la buena calidad de la bebida del caf y evitar los defectos.
Avances tcnicos Cenicaf. Colombia. No. 284:1-8. 2001.
[32] Qiu W, Shearer S. Maturity assessment of broccoli using the discrete fourier transform.Transactions of the ASAE. Vol. 35(6). 2057-2062. 1993.
[33] Recce M, Taylor J, Plebe A, Tropiano G. Visin and neural control for an orange harvesting robot. Deparment of Anatomy and Developemental Biology.University College
London, London, UK. 1998.
[34] Salazar M, Riao N, Arcila J, Ponce C. Estudio morfolgico anatmico y ultraestructural del fruto de caf (Coffea arabica L). Cenicaf. Colombia. 45(3):93-105. 1994.
[35] Slaughter D, Harrell R. Discriminating fruit for robotic harvest using color in natural
outdoor scenes. Transactions of the ASAE. Vol 32(2). March-April. 1989.
[36] Theodoridis S, Koutroumbas K. Pattern recognition. Academic Press. 1999.
[37] Velez J. Influencia de la precipitacin en el crecimiento del fruto de caf. Avances
tcnicos Cenicaf. Colombia. No 89:1-4. 1979.
[38] Williams A, Feria M, Kari P. The sensory and chemical examination of ground and cup
coffe with particular reference to bean maturity. In Colloque Scientifique international
sur le caf,13. Paipa (Colombia).1989. Pars (Francia). 1989.
[39] Yen J, Langari R. Fuzzy Logic Intelligence, control, and information. Prentice Hall.
New Jersey.
[40] Young T. .On the Theory of Light and Colors". Philosophiucal Transactions of the
Royal Society of London, 92. 20-71. 1802.
6 5, 7 2, 10 4, 7 88 85, 88 36 15 54 15, 53, 93 7 9 9 7, 8 2, 11, 12 14 13, 28, 78, 79, 82,
83, 84, 86, 87 2, 12 2, 10 83 13, 94 87, 88 2, 10 76 17 2, 12 55 6 13 2, 10, 11, 12 8 2,
12 2, 10 5 10 55 6 8 16 76
Anexo A
Mtodos de extraccin de
caractersticas
A.1.
Caractersticas de Color
El color es una medida del espectro electromagntico definido con base en el siste-
ma de visin humano. Al estudiar la forma como el ojo humano percibe el color, Thomas
Young en 1802 [40], encontr que el ojo humano tiene tres receptores, y la diferencia en
sus respuestas contribuyen a la sensacin de color. En estudios posteriores, Maxwell [24]
estableci que el color se puede especificar en trminos de tres variables independientes.
Maxwell demostr que cualquier combinacin aditiva de color podra ser reproducida por
la cantidad apropiada de tres estmulos primarios, en la actualidad se conoce como genralizacin tricromtica o tricromacidad. Los tres receptores se conocen como los conos S,M
y L (sensibles a las longitudes de onda Short, Medium y Long) y su sensibilidad ha sido determinada directamente a travs de medidas microespectrofotomtricas. En el ojo humano,
los tres tipos de conos que dan la sensacin de color estn ubicados en la retina, y contienen
pigmentos fotosensitivos con diferente absorcin espectral. Si la absorcin espectral de la
luz que incide sobre la retina est dada por f () , dnde representa la longitud de onda,
entonces, las respuestas de los tres conos se pueden modelar como los tres vectores con
76
77
componentes dadas por (A.1),
Z
max
si ()f ()d
Ci =
i = 1, 2, 3
(A.1)
min
dnde si () indica la sensibilidad del cono isimo, y [min max ] denotan el intervalo de
longitudes de onda fuera del cual todas las sensibilidades son cero. Tpicamente en el aire
o en el vaco, la regin visible del espectro electromagntico est especificado por la regin
entre min = 360nm y max = 830nm. Para obtener suficiente precisin la digitalizacin
se realiza generalmente mues-treando cada 10nm. Si se toman N muestras uniformemente
espaciadas del rango [min , max ], la ecuacin (A.1), se puede escribir como (A.2),
c = ST f
(A.2)
donde T denota la transpuesta, c = [c1 , c2 , c3 ]T , S es una matriz N 3 cuya isima columna, si , es el vector de muestras de si , y f es el vector N 1 de muestras de f (). Si se
define un conjunto estndar de respuestas de los conos, el color se puede especificar usando
el 3 vector c, en (A.2), conocido como el vector triestmulo.
Las funciones CMFs (color matching functions) son un conjunto de tres funciones
relacionadas con la sensibilidad espectral de los tres conos por transformacin lineal no
singular. Estas funciones fueron determinadas en experimentos psicofsicos. Las funciones
CMFs se usan para establecer un estndar para la especificacin numrica del color en trminos de tres coordenadas o valores triestmulo. Como se dijo anteriormente, el color de un
espectro visible, f , se puede especificar en trminos de sus valores triestmulo, AT f , dnde
A es la matriz de CMFs. La CIE (Commission Internationale de lclairage International
Commission on Illumination) es la principal organizacin responsable de la estandarizacin
de la mtrica del color y la terminologa. En 1931 la CIE defini el primer estndar de colorimetra. El primer conjunto de CMFs es conocido como el CIE Red-Green-Blue (RGB)
CMFs, r(), g(), b(), Figura A.1. Estas funciones estn asociadas con las primarias monocromticas en las longitudes de onda de 700, 546,1 y 435,8 nm, respectivamente.
78
A.1.1.
est representado por tres componentes espectrales: rojo, verde y azul [17], como se ve en
la figura A.2.
En el modelo RGB se obtienen tres imgenes independientes una por cada componente (R,G,B). Estas tres imgenes se combinan para producir una imagen de color compuesta. La mayora de las cmaras de color empleadas para la adquisicin de imgenes
79
A.1.2.
de un color [17], como se ve en la figura A.3. El tono es el atributo con el cual se define
si el color es rojo, verde, prpura, amarillo, etc.. La saturacin es el nivel de luz blanca
mezclada con un tono. Los colores puros estn completamente saturados. Colores como el
rosado (rojo y blanco) estn menos saturados, siendo su grado de saturacin inversamente
proporcional a la cantidad de luz blanca aadida. El tono y la saturacin constituyen la
cromaticidad. La intensidad es una medida del brillo de la luz. La utilidad del modelo de
color HSI es que la componente de intensidad est separada de la informacin cromtica.
Adems, las componentes de saturacin y tono estn relacionadas con la forma en que los
seres humanos percibimos el color.
A.1.3.
Estados Unidos. Una de las principales ventajas de este formato es que la informacin de la
escala de grises est separada de la informacin de color, as la misma seal puede ser usada
tanto para equipos a color o a blanco y negro. En el modelo YIQ, la informacin de color
80
La transformacin del modelo RGB a YIQ est dada por las ecuaciones A.3, A.4 y
A.5.
(A.3)
(A.4)
(A.5)
El modelo YIQ se puede transformar al espacio HSI usando las ecuaciones A.6, A.7
y A.8.
Q
I
(A.6)
I 2 + Q2
(A.7)
HIQ = arctan
SIQ =
IIQ = Y
(A.8)
81
A.1.4.
A.1.5.
Hering not que ciertos tonos nunca se vean juntos. Por ejemplo: la percepcin de un color
nunca estaba descrito como un verde rojizo o como un azul amarillento, mientras que todas
las otras combinaciones eran posibles. Aunque l primero estableci tres tipos de foto receptores: blanco-negro, amarillo-azul y rojo verde, lo cual estaba en contraste con la teora
de la tricromacidad, despus los investigadores encontraron que hay una capa en el sistema
de visin humana que convierte los valores RGB a un vector de colores oponentes. Este
vector tiene una componente acromtica (Blanco-Negro) y dos componentes cromticas
(Rojo verde y Amarillo- azul). Esta transformacin se hace en las clulas postreceptoras de
la retina llamadas clulas ganglion.
(A.9)
YB = 2B R G
(A.10)
W hB l = R + G + B
(A.11)
82
A.1.6.
buena aproximacin de la transformacin de Karhunen-Loeve del modelo RGB. Las ecuaciones A.12, A.13 y A.14 muestran la transformacin.
R+G+B
3
RB
I2 =
2
2G R B
I3 =
4
I1 =
A.2.
(A.12)
(A.13)
(A.14)
Caractersticas de Textura
Usando caractersticas de textura se espera obtener descripciones de la suavidad,
A.2.1.
Matriz de Coocurrencia
La construccin de la matriz de coocurrencia se basa en la ubicacin espacial de los
pxeles, las relaciones con su vecindario y el valor de su intensidad, dependiendo de la condicin, la direccin y la distancia. Condicin: Es la regla que debe cumplir un determinado
pxel para poder ser cuantificado, usualmente esta condicin es tomada como la ubicacin
del pxel de determinada intensidad que se encuentra en la direccin del vecino.Direccin:
Es la orientacin espacial en la cual se evala la condicin, como casos tpicos se utilizan
direcciones como 0 grados, 45 grados, 90 grados y 135 grados ( [17]). Distancia: Es el nmero de pxeles que hay entre el par de pxeles evaluados, usualmente se utilizan 1, 3 y 5
83
pxeles de distancia.
A.2.2.
Entropa
El descriptor de entropa es una medida de la aleatoriedad contenida en la matriz
de coocurrencia. La obtencin de ste sta dada por la frmula (A.15) donde cij es cada
elemento de la matriz, e i y j varan desde 0 hasta n el nmero de niveles de gris.
E=
XX
i
cij log(cij )
(A.15)
Como se sabe de la teora de seales [20], la entropa provee una medida de la informacin contenida en una seal. Cada nmero contenido en la matriz de coocurrencia puede
ser tratado como una probabilidad. A medida que todos los elementos de la matriz de coocurrencia son similares, este descriptor aumenta su valor, siendo mximo en el caso que
todos los elementos de la matriz fueran iguales [17]. A medida que se tengan algunos elementos con mayores probabilidades de ocurrencia, el valor de la entropa va descendiendo
porque la textura es ms uniforme.
84
A.2.3.
Uniformidad
La propiedad de uniformidad da una idea de la suavidad de la textura, y esto se
XX
i
c2ij
(A.16)
De la ecuacin (A.16) se puede inferir que cuando todos los valores de cij son
semejantes, el valor de la uniformidad ser menor, por el contrario si ocurre que en la
diagonal principal se dan mayores picos de intensidad el descriptor se maximizar [17].
A.2.4.
Contraste
El contraste de una textura proporciona informacin acerca de las variaciones brus-
cas de color en la imagen. La extraccin de este descriptor est dada por la siguiente expresin matemtica (A.17).
C=
XX
i
|i j|2 cij
(A.17)
85
A.2.5.
Correlacin
La correlacin de la textura es una medida de relacin lineal entre dos intensidades
1
=
i j
X X
(i i )(j j )cij
i j
(A.18)
donde,
i =
XX
icij
(A.19)
jcij
(A.20)
(i i )cij
(A.21)
(j j )cij
(A.22)
j =
XX
j
i =
XX
i
j =
XX
i
86
A.2.6.
XX
i
|i j|k cij
(A.23)
A.2.7.
refleja la definicin y agrupacin de los elementos de la matriz de coocurrencia [17]. Matemticamente se obtiene mediante la expresin:
Inv =
XX
i
cij
|i j|k
i 6= j
(A.24)
A.2.8.
Mxima Probabilidad
El descriptor de mxima probabilidad suministra informacin sobre la respuesta
87
este descriptor es la siguiente [17].
mp = maxij (cij )
(A.25)
El valor de este descriptor ser mayor cuando en la matriz de coocurrencia se observe un pico de intensidad, el mayor de estos elementos dar el valor mximo de probabilidad.
Este descriptor es til para percibir la mayor ocurrencia o la predominacin de un color en
la textura.
A.2.9.
Homogeneidad Local
El descriptor de homogeneidad local proporciona informacin sobre la regularidad
local de la textura [22]. La descripcin matemtica de este descriptor est dada por la siguiente ecuacin.
HL =
XX
i
cij
1 + (i j)2
(A.26)
A.2.10.
Varianza
XX
i
(i )2 cij
(A.27)
88
matriz en algn punto de la diagonal principal y la varianza se toma como la dispersin
de la muestras con respecto a esta media. De este modo el descriptor de varianza tendr
un mayor valor para aquellas texturas en las cuales la matriz de coocurrencia sea de forma
alargada o dispersa con respecto del mximo pico en la diagonal principal [5].
A.2.11.
Directividad
cii
(A.28)
A.2.12.
Tendencia de Cluster
Clus =
XX
i
(i + j 2)k cij
(A.29)
Se puede inferir que este descriptor aumentar su valor a medida que la media de
los valores est ms cercana al valor mnimo. Esta caracterstica tiene la tendencia a oscilar
entre valores positivos y negativos, puesto que la influencia de la media no siempre se
equipara con el valor de los elementos alejados de esta.
89
A.3.
Caractersticas de Tamao
A.3.1.
rea
El rea es la suma de los pxeles del objeto que aparecen en la imagen. Se obtiene
con la ecuacin (A.30)donde, Iij corresponde al valor de intensidad de una imagen binaria.
En una imagen binaria Iij = 0 cuando el pxel no es parte del objeto y Iij = 1 cuando si lo
es.
A=
XX
i
A.3.2.
Iij = 1
(A.30)
Permetro
El permetro se calcula fcilmente sumando los pxeles del contorno. Si se tienen las
coordenadas de todos los puntos, se puede calcular el permetro eucldeo usando la frmula
(A.31), obteniendo un valor ms aproximado.
P =
N q
X
(xk+1 xk )2 (yk+1 yk )2
(A.31)
k=0
A.3.3.
folgicos. El eje mayor de un contorno es el segmento de recta que une los puntos ms
separados entre s. El eje menor es perpendicular al eje mayor. El rectngulo formado con
las longitudes de los ejes contiene exactamente al contorno y se denomina Rectngulo bsico. El eje mayor corresponde a la altura y el eje menor a la anchura.
90
A.4.
Caractersticas de Forma
A.4.1.
Rectangularidad
La rectangularidad es la relacin entre un objeto y el mnimo rectngulo que lo
Ar
(A.32)
A.4.2.
chura y la altura mximas del objeto, como se muestra en la ecuacin (A.33), este parmetro
se denomina excentricidad del contorno.
Rec2 =
A.4.3.
Anchuramxima
Alturamxima
(A.33)
Circularidad
La circularidad es un parmetro que mide el grado de parecido de un determinado
objeto a un crculo. Generalmente se mide como la relacin entre el cuadrado del permetro
y el rea. La forma ms comn de medirla es usando la ecuacin (A.34).
Cir =
p2
Area
(A.34)
91
A.4.4.
Firma
Una firma es una representacin funcional unidimensional de un contorno y se pue-
A.4.5.
Momentos centrales
La forma de las firmas se puede describir cuantitativamente utilizando momentos.
El momento central de orden k de una firma se define utilizando la ecuacin (A.35), donde
E(x) es el valor esperado de la firma. Usando los primeros momentos se pueden diferenciar
las firmas de formas diferentes.
mn = E(x )k
A.4.6.
(A.35)
Transformada de Fourier
La firma se puede representar en trminos de la frecuencia, usando la transformada
de Fourier. La magnitud del espectro y la fase caracterizan las firmas de las diferentes
formas.
A.4.7.
Descriptores de Fourier
Los descriptores de Fourier representan el contorno de una regin y obtienen in-
92
de un punto fijo y tomar cada punto como un par de coordenadas (x, y). Entonces, se genera una secuencia de pares (x0 , y0 ), (x1 , y1 ),(x2 , y2 ),...,(xN 1 , yN 1 ). Estas coordenadas se
pueden expresar en la forma x(k) = xk y y(k) = yk , para k=0,1,2,...,N-1. El contorno se
puede escribir como un nmero complejo s(k) = x(k) + jy(k)] para obtener una representacin unidimensional de un contorno. En la ecuacin (A.36) se presenta la transformada
discreta de Fourier de s(k).
F (u) =
1
j2uk
1 NX
s(k)e[ N ]
N k=0
(A.36)
real(Fk )2 + imag(Fk )2
k = tan1 (
imag(Fk )
)
real(Fk )
(A.37)
(A.38)
Anexo B
Mtodos de clasificacin
B.1.
Estadstico
Los mtodos estadsticos se fundamentan en la regla de Bayes del mnimo error
[10]. Esta regla concluye que un objeto, con unas caractersticas determinadas, pertenece
a una clase si la probabilidad de pertenecer a sta clase es mayor que la probabilidad de
pertenecer a cualquier otra clase, como se muestra en la ecuacin (B.1),
m k
si P (
wj
wk
) > P ( ) j 6= k
m
m
(B.1)
P(
m k
si P (wk )p(
93
m
m
) > P (wj )p( )
wk
wj
(B.2)
(B.3)
94
donde P (wi ) es la probabilidad a priori por la cual un objeto pertenece a la clase wi ,
p(m) es la funcin densidad de probabilidad para m, y p( wmi ) es la funcin de probabilidad
condicional de la clase para m. En las aplicaciones prcticas, las funciones de probabilidad
no se conocen y por lo tanto se deben estimar. Para estimarlas, primero se asume la forma
de la funcin de probabilidad, y luego se hallan sus parmetros a partir del conjunto de
entrenamiento. Se supone que las funciones de probabilidad de las clases estn descritas
por distribuciones normales o gausianas como se muestra en la ecuacin (B.4),
p(
wk
1
12
(X i )T (Ci )1 (X i )
)=
d
1 e
m
(2) 2 kCi k 2
(B.4)
B.2.
dos nodos o neuronas que estn interconectados entre si. La funcin de transferencia que
describe el comportamiento de una neurona est descrito por y = f [x] [21]. Donde x es
la entrada a una neurona, x = [xi ], para i = 1, 2, ..., N , est compuesta por las salidas de
N neuronas de la capa anterior, y y representa la respuesta de la neurona a estas seales de
entrada. En el modelo ms simple de una neurona, la salida y se aproxima a (B.5),
N
X
y = f [x] = K(
wi xi )
(B.5)
i=1
95
sinptica o pesos, y es un umbral.
(B.6)
donde,
netk (n) =
(B.7)
fk [netk (n)] =
1
(1 +
e([netk (n)+k ]) )
(B.8)
donde k es el umbral para la neurona k. fk es continua, no lineal, fcilmente derivable, evita la saturacin ante entradas grandes as como admite seales dbiles.
La segunda fase implica pasar hacia atrs a travs de la red. Se genera una diferencia
entre la salida actual y la deseada, esta diferencia es una seal de error k (n). Con base en
sta seal de error se actualiza el peso de cada conexin de la red de acuerdo con (B.9),
(B.9)
96
donde es un escalar que determina la velocidad de entrenamiento, es un escalar
que determina el efecto del peso anterior sobre la convergencia de la red en el espacio de
pesos. Esta segunda fase es la que proporciona la recursividad del mtodo. Ya que se entrena hasta que el error alcance el valor deseado.
B.3.
Clustering
El clustering es una metodologa de reconocimiento de patrones no supervisada,
es decir, no utiliza la informacin de la clase a la que pertenecen las muestras. Con ste
mtodo se busca organizar las muestras en grupos (clusters), con base en la medida de la
distancia entre las muestras. Existen diferentes algoritmos de clustering, pero uno de los
ms utilizados es el algoritmo k medias. Clustering k medias agrupa las muestras en k
grupos y ubica el centro de cada grupo tal que se minimice la distancia entre las muestras y
el centro.
B.3.1.
clase, en los esquemas de clustering difusos una muestra xj puede pertenecer simultneamente a ms de una clase con algn grado de pertenencia. El clustering k medias difuso est
definido por un conjunto de funciones de pertenencia uij () i = 1, 2, ..., k, j = 1, 2, ..., n,
donde k es el nmero de clases y n es el tamao del conjunto muestral. es un vector de
parmetros desconocido, pero ste vector se obtiene durante el proceso de entrenamiento
del clasificador. Las funciones de pertenencia cumplen la normalizacin que se muestra en
la ecuacin (B.10),
k
X
i=1
uij = 1,
i = 1, 2, ..., n.
(B.10)
97
Estos esquemas de clustering usan tcnicas de clculo diferencial para optimizar
una funcin de costo J. El clustering k medias difuso busca el mnimo de la funcin de
costo global que se muestra en la ecuacin (B.11),
Jb =
k X
n
X
ubij d(xj , i )
(B.11)
i=1 j=1
Jb
=0
uij
(B.12)
cj =
b
j=1 [uij ] xj
Pj=1
b
n [uij ]
(B.13)
( d1ij ) b1
uij = P
k
(B.14)
dij = kxj ci k
(B.15)
1 b1
r ( drj )
con,
98
2.
3.
4.
5.
6.
retornar ci .
7.
fin