You are on page 1of 111

CARACTERIZACIN Y CLASIFICACIN DE CAF

CEREZA USANDO VISIN ARTIFICIAL

Zulma Liliana Sandoval Nio, Ing.

Tesis
presentada en cumplimiento a los requerimientos para el grado de

Magster en Automatizacin Industrial

UNIVERSIDAD NACIONAL DE COLOMBIA


SEDE MANIZALES
FACULTAD DE INGENIERA Y ARQUITECTURA
DEPARTAMENTO DE ELECTRICIDAD, ELECTRNICA Y COMPUTACIN
MANIZALES, COLOMBIA

Abril 2005

CARACTERIZACIN Y CLASIFICACIN DE CAF


CEREZA USANDO VISIN ARTIFICIAL

Zulma Liliana Sandoval Nio, MSc.


UNIVERSIDAD NACIONAL DE COLOMBIA SEDE MANIZALES, 2005

Director: Flavio Augusto Prieto Ortiz, Ph.D.

Resumen
Se desarroll un sistema de visin artificial
f

para la clasificacin de frutos de ca-

en once categoras dependiendo de su estado de madurez. Para la descripcin

de la forma, el tamao, el color y la textura de un fruto de caf se extrajeron 208


caractersticas. La reduccin del conjunto de caractersticas de 208 a 9 se hizo con
base en los resultados de dos mtodos de seleccin de caractersticas, uno univariado y otro multivariado. El conjunto final de caractersticas se evalu en tres tcnicas
de clasificacin: Bayesiano, redes neuronales y clustering difuso. Con el clasificador
Bayesiano se obtuvo un error de clasificacin del 5,43 %. Usando redes neuronales
el error de clasificacin fue de 7,46 %. Mientras que 19,46 % fue el error obtenido
usando clustering difuso.

Abstract
A machine vision system was used to classify coffee fruits into eleven groups according to ripen. 208 features of the individual fruits were extracted from two dimensional images and used as shape, size, color and texture description. An univariate
and a multivariate method for feature selection was used to select a subset of 9 from
an initial set of 208 features. The selected features were subsequently used as inputs
to three classification schemes: the Bayesian decision, a neural network and a fuzzy
k means clustering. The average classification error obtained for Bayesian classifier
was 5,43 %. The neural network classifier resulted in a average classification error of
7,46 %. While 19,46 % was the error obtained using fuzzy clustering.

Contenido
Resumen

Contenido

Lista de Tablas

Lista de Figuras

11

Introduccin

Captulo 1. Marco Terico

1.1. Caf en Colombia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.1.1. Generalidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.1.2. Proceso de produccin del caf verde . . . . . . . . . . . . . . . .

1.1.3. Economa y comercializacin del caf . . . . . . . . . . . . . . . .

1.1.4. La calidad del caf . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2. Cosecha Mecanizada . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2.1. Recoleccin robotizada . . . . . . . . . . . . . . . . . . . . . . . .

10

1.2.2. Clasificacin de productos . . . . . . . . . . . . . . . . . . . . . .

11

1.3. Etapas principales de un sistema de visin artificial . . . . . . . . . . . . .

12

1.3.1. Adquisicin y adecuacin de las imgenes . . . . . . . . . . . . . .

12

1.3.2. Caracterizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . .

13

6
1.3.3. Seleccin de las caractersticas . . . . . . . . . . . . . . . . . . . .

14

1.3.4. Clasificacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

15

1.3.5. Trabajo anterior . . . . . . . . . . . . . . . . . . . . . . . . . . . .

16

Captulo 2. Adquisicin y adecuacin de las imgenes

19

2.1. Adquisicin de las imgenes . . . . . . . . . . . . . . . . . . . . . . . . .

19

2.1.1. Frutos de caf . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

2.1.2. Sistema de adquisicin . . . . . . . . . . . . . . . . . . . . . . . .

21

2.2. Adecuacin de las imgenes . . . . . . . . . . . . . . . . . . . . . . . . .

22

Captulo 3. Caracterizacin

25

3.1. Caractersticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

25

3.1.1. Caractersticas de color . . . . . . . . . . . . . . . . . . . . . . . .

25

3.1.2. Caractersticas de textura . . . . . . . . . . . . . . . . . . . . . . .

27

3.1.3. Caractersticas de tamao . . . . . . . . . . . . . . . . . . . . . .

30

3.1.4. Caractersticas de forma . . . . . . . . . . . . . . . . . . . . . . .

31

3.2. Normalizacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

3.2.1. Normalizacin estadstica lineal . . . . . . . . . . . . . . . . . . .

32

3.2.2. Normalizacin no lineal . . . . . . . . . . . . . . . . . . . . . . .

33

3.2.3. Comparacin de la normalizacin . . . . . . . . . . . . . . . . . .

33

3.3. Seleccin de caractersticas . . . . . . . . . . . . . . . . . . . . . . . . . .

35

3.3.1. Relacin discriminante de Fisher . . . . . . . . . . . . . . . . . . .

36

3.3.2. Mtodo multivariado . . . . . . . . . . . . . . . . . . . . . . . . .

36

3.3.3. Procedimiento utilizado . . . . . . . . . . . . . . . . . . . . . . .

38

3.4. Anlisis de las caractersticas seleccionadas . . . . . . . . . . . . . . . . .

50

Captulo 4. Clasificacin

53

4.1. Clasificadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

53

4.1.1. Estadstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

53

4.1.2. Usando redes neuronales . . . . . . . . . . . . . . . . . . . . . . .

54

7
4.1.3. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

54

4.2. Evaluacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

55

4.2.1. Mtodos de evaluacin . . . . . . . . . . . . . . . . . . . . . . . .

56

4.2.2. Diseo del experimento y resultados . . . . . . . . . . . . . . . . .

56

Captulo 5. Resultados

60

5.1. Anlisis de los resultados . . . . . . . . . . . . . . . . . . . . . . . . . . .

60

5.1.1. Matriz de confusin . . . . . . . . . . . . . . . . . . . . . . . . .

60

5.1.2. Curvas ROC . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

66

Captulo 6. Conclusiones

69

Bibliografa

72

Anexo A. Mtodos de extraccin de caractersticas

76

A.1. Caractersticas de Color . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

A.1.1. Modelo de color RGB . . . . . . . . . . . . . . . . . . . . . . . .

78

A.1.2. Modelo de color HSI . . . . . . . . . . . . . . . . . . . . . . . . .

79

A.1.3. Modelo de color YIQ . . . . . . . . . . . . . . . . . . . . . . . . .

79

A.1.4. Modelo de color YCbCr . . . . . . . . . . . . . . . . . . . . . . .

81

A.1.5. Modelo de colores oponentes . . . . . . . . . . . . . . . . . . . . .

81

A.1.6. Modelo de colores oponentes OHTA . . . . . . . . . . . . . . . . .

82

A.2. Caractersticas de Textura . . . . . . . . . . . . . . . . . . . . . . . . . . .

82

A.2.1. Matriz de Coocurrencia . . . . . . . . . . . . . . . . . . . . . . . .

82

A.2.2. Entropa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

83

A.2.3. Uniformidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

84

A.2.4. Contraste . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

84

A.2.5. Correlacin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

A.2.6. Momento de Diferencia de Orden k . . . . . . . . . . . . . . . . .

86

A.2.7. Momento Inverso de Diferencia de Orden k . . . . . . . . . . . . .

86

8
A.2.8. Mxima Probabilidad . . . . . . . . . . . . . . . . . . . . . . . . .

86

A.2.9. Homogeneidad Local . . . . . . . . . . . . . . . . . . . . . . . . .

87

A.2.10. Varianza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

87

A.2.11. Directividad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

88

A.2.12. Tendencia de Cluster . . . . . . . . . . . . . . . . . . . . . . . . .

88

A.3. Caractersticas de Tamao . . . . . . . . . . . . . . . . . . . . . . . . . .

89

A.3.1. rea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

89

A.3.2. Permetro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

89

A.3.3. Altura y Anchura mximas . . . . . . . . . . . . . . . . . . . . . .

89

A.4. Caractersticas de Forma . . . . . . . . . . . . . . . . . . . . . . . . . . .

90

A.4.1. Rectangularidad . . . . . . . . . . . . . . . . . . . . . . . . . . .

90

A.4.2. Relacin entre anchura y altura mximas . . . . . . . . . . . . . .

90

A.4.3. Circularidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

90

A.4.4. Firma . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

91

A.4.5. Momentos centrales . . . . . . . . . . . . . . . . . . . . . . . . .

91

A.4.6. Transformada de Fourier . . . . . . . . . . . . . . . . . . . . . . .

91

A.4.7. Descriptores de Fourier . . . . . . . . . . . . . . . . . . . . . . . .

91

Anexo B. Mtodos de clasificacin

93

B.1. Estadstico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

93

B.2. Usando redes neuronales . . . . . . . . . . . . . . . . . . . . . . . . . . .

94

B.3. Clustering . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

96

B.3.1. Clustering k medias difuso . . . . . . . . . . . . . . . . . . . . . .

96

Lista de Tablas
2.1. Relacin entre: las muestras, los estados de maduracin, las semanas . . . .

21

3.1. Caractersticas de color . . . . . . . . . . . . . . . . . . . . . . . . . . .

27

3.2. Caractersticas de textura . . . . . . . . . . . . . . . . . . . . . . . . . . .

29

3.3. Caractersticas de tamao . . . . . . . . . . . . . . . . . . . . . . . . . .

31

3.4. Caractersticas de forma . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

3.5. Las 20 mejores caractersticas segn ndice de Fisher. . . . . . . . . . . . .

41

3.6. Clasificacin usando las caractersticas seleccionadas con Fisher. . . . . .

44

3.7. Las 20 mejores caractersticas segn anlisis multivariado . . . . . . . . .

46

3.8. Las ocho caractersticas seleccionadas con los dos mtodos utilizados . . .

49

3.9. Error de clasificacin adicionando otras caractersticas. . . . . . . . . . .

50

3.10. La media multiplicada por 100 de las caractersticas seleccionadas . . . .

51

3.11. La varianza multiplicada por 100 de las caractersticas seleccionadas . . .

51

4.1. Error de clasificacin promedio . . . . . . . . . . . . . . . . . . . . . . . .

58

4.2. Error de clasificacin promedio . . . . . . . . . . . . . . . . . . . . . . . .

58

5.1. Matriz de confusin. Clasificador de dos clases . . . . . . . . . . . . . . .

60

5.2. Matriz de confusin. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

61

5.3. Matriz de confusin. Clasificador Bayesiano . . . . . . . . . . . . . . . . .

62

5.4. Indicadores de desempeo. Clasificador Bayesiano . . . . . . . . . . . . .

63

5.5. Matriz de confusin. Clasificador usando Redes Neuronales . . . . . . . .

64

10
5.6. Indicadores de desempeo. Clasificador usando Redes Neuronales . . . . .

64

5.7. Matriz de confusin. Clasificador Difuso . . . . . . . . . . . . . . . . . . .

65

5.8. Indicadores de desempeo. Clasificador Difuso . . . . . . . . . . . . . . .

66

Lista de Figuras
2.1. Fruto de caf . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

2.2. Segmentacin. Once clases. . . . . . . . . . . . . . . . . . . . . . . . . . .

22

2.3. Segmentacin del fruto . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

2.4. Contorno del fruto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

3.1. Color promedio RGB de las once clases . . . . . . . . . . . . . . . . . . .

26

3.2. ndice de Fisher para las caractersticas de color sin normalizacin . . . . .

34

3.3. ndice de Fisher para las caractersticas de color con normalizacin lineal .

34

3.4. ndice de Fisher para las caractersticas de color con normalizacin no lineal 35
3.5. ndice de Fisher para las caractersticas . . . . . . . . . . . . . . . . . . . .

39

3.6. ndice de Fisher en orden descendente . . . . . . . . . . . . . . . . . . . .

40

3.7. Caractersticas en orden descendente segn Fisher . . . . . . . . . . . . . .

40

3.8. Error de Clasificacin variando la dimensin del conjunto de caractersticas

42

3.9. Tiempo de Clasificacin variando la dimensin del conjunto de caractersticas 43


3.10. Error de Clasificacin variando la dimensin del conjunto de caractersticas

47

3.11. Tiempo de Clasificacin variando la dimensin del conjunto de caractersticas 48


4.1. Porcentaje de error de los clasificadores. . . . . . . . . . . . . . . . . . . .

57

4.2. Tiempo de procesamiento por muestra. . . . . . . . . . . . . . . . . . . . .

57

5.1. Curva ROC para los clasificadores. . . . . . . . . . . . . . . . . . . . . . .

67

11

12
A.1. Funciones de correspondencia de color CIE r(), g(),b(). . . . . . . . .

78

A.2. Modelo RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

79

A.3. Modelo HSI . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

80

Introduccin
La calidad del caf colombiano es reconocida mundialmente y ha sido apreciada
por los pases consumidores como una de las mejores dentro de los cafs arbicos. La alta
calidad del caf colombiano es el resultado de las variedades que se cultivan, de la oferta
ambiental y de suelos, y principalmente de la recoleccin. La recoleccin se hace de forma
manual y selectiva desprendiendo los frutos maduros, esta es una ardua labor ya que en una
misma rama es posible encontrar frutos en diferentes estados de madurez e incluso flores.
Los costos de recoleccin son altos y muchas veces no se generan los resultados esperados
porque no slo se renen frutos maduros sino que tambin algunos verdes, y sobremaduros. La presencia de frutos verdes y sobremaduros afectan la calidad del caf variando el
sabor y el aroma. La adicin de una etapa de clasificacin del caf recogido, permitira el
mejoramiento de la calidad del caf que actualmente se produce y adems la generacin de
nuevos productos, al procesar caf de cada una de las otras etapas de madurez.

La implementacin de un sencillo sistema de clasificacin usando visin artificial


es una alternativa conveniente ya que permitira la extraccin de caractersticas de forma,
tamao, color y textura del fruto, que son los parmetros principales con los cuales un experto hace la clasificacin manual. Las ventajas con respecto a sistemas de clasificacin
manual, mecnica u ptica se centran en la objetividad, poco contacto fsico entre el sistema de clasificacin y el producto, y la posibilidad de hacer una clasificacin ms especfica.

Los sistemas de visin artificial se han convertido en una solucin sencilla y eficaz para los problemas cotidianos de control presentes en la agricultura. Los excelentes
resultados obtenidos han incrementado el inters por el desarrollo de proyectos aplicados
a diferentes procesos agrcolas, especialmente en las etapas de cosecha de cultivos y en el
control de calidad. Ejemplos de estas aplicaciones son: la recoleccin de tomates [19], manzanas [3] [30], naranjas [33], tomates-cereza [23]; as como la clasificacin de papas [18],
olivas [26] , brcoli [32], nueces de pistacho [15] y manzanas [30]. Sin embargo, todava se
presentan problemas especialmente en la adquisicin de imgenes donde los ambientes no
son controlados, y en los dispositivos actuadores.

Dentro del grupo de Percepcin y control inteligente de la universidad Nacional de


Colombia sede Manizales se han desarrollando algunos estudios que demuestran la viabilidad de la clasificacin de caf con visin artificial. Los buenos resultados obtenidos en los
trabajos anteriores han motivado la realizacin de un estudio formal para la obtencin de
un prototipo final. El aporte del presente trabajo se centra en las etapas de adquisicin de
las imgenes, caracterizacin y clasificacin de los frutos de caf.

Se hizo el seguimiento de todo el proceso de maduracin de los frutos, desde cuando estaban verdes hasta cuando se encontraban sobremaduros y secos. Se caracterizaron
once etapas diferentes, con base en la descripcin del color, la forma, el tamao y la textura. Los mtodos de extraccin de caractersticas aplicados permitieron generar un espacio
de caractersticas de dimensin 208. En problemas de clasificacin es conveniente reducir
la dimensin del espacio de caractersticas, en este trabajo se logr disminuir la dimensin
de 208 a 9 empleando dos mtodos de seleccin. Para la clasificacin se usaron tres algoritmos de reconocimiento de patrones: clasificador Bayesiano, usando redes neuronales y
clustering difuso.

El documento est dividido en seis captulos dispuestos de la siguiente forma: En


el primero se hace una descripcin ms detallada del problema adems de una ampliacin
del estado del arte y de los trabajos previos. En el segundo captulo se muestra como se
desarroll la adquisicin de las imgnes, adems se describe el preprocesamineto y la segmentacin utilizada. Los captulos tercero y cuarto son los capitulos centrales del trabajo y
en ellos se describe la propuesta de caracterizacin y de clasificacin, respectivamente. En
el captulo quinto se hace un reporte de los resulados comparando el desempeo los clasificadores. Y en el ltimo captulo se encuentran las conclusiones y se proponen algunos
trabajos complementarios.

Captulo 1

Marco Terico
1.1.

Caf en Colombia

1.1.1.

Generalidades
El cafeto o planta productora de caf es un arbusto que se da en regin tropical de la

tierra. Pertenece a la familia de las rubiceas, genero Coffea, y la especie es la denominada


Arbica L [4]. El caf arbica L tiene numerosas variedades, de ellas las que se cultivan
en Colombia con mayor intensidad son la variedad tpica, Borbn, caturra, Maragigipe y la
variedad Colombia. La variedad Colombia se obtuvo en el Centro Nacional de investigaciones del caf (Cenicaf), con base en el caf caturra y el hbrido del timor, esta variedad
es resistente a la roya.

El fruto del cafeto es una baya drupcea, conformado por: una cubierta exterior
llamada pulpa, una sustancia gelatinosa azucarada que recibe el nombre de muclago, una
cubierta dura que se denomina pergamino o cscara, una cubierta ms delgada y fina llamada pelcula y finalmente, una almendra que es la parte del fruto que una vez tostada
y molida se utiliza para la produccin del caf en bebida. La pulpa est formada por el
exocarpio (epidermis), que es la capa externa del fruto y cuyo color vara desde verde o
amarillo hasta rojo o rojo intenso y algunas veces hasta violeta o negro. El color depende
4

5
de la variedad de caf y del grado de madurez del fruto.
Crecimiento y desarrollo del fruto de caf
La fase reproductiva del caf inicia con la aparicin de las primeras flores. Se considera como la primera floracin, el momento en que por lo menos el 50 % de las plantas
han florecido. Esta fase continua con el desarrollo del fruto y culmina con la maduracin
y cosecha [2]. Desde la floracin hasta la maduracin transcurren aproximadamente entre
220 y 240 das. El fruto pasa por varias etapas de crecimiento, y su desarrollo en el tiempo
describe una curva sigmoidal doble. La maduracin de los frutos no es uniforme debido a
las diversas floraciones, y depende de las condiciones climticas particulares. El desarrollo
del fruto se puede describir en tres etapas [34].
Primera etapa: Desde la floracin hasta la semana 8 (60 das). Se caracteriza por un
crecimiento lento, los frutos presentan un color verde y su forma se parece a la cabeza
de un fsforo, presentan consistencia gelatinosa y no hay formacin de la semilla.
Segunda etapa: Desde la semana 9 hasta la 26 (desde los 75 das hasta los 195 das).
Esta etapa se caracteriza por un crecimiento acelerado de los frutos tanto en dimensiones como en peso fresco. El color sigue siendo verde.
Tercera etapa: Desde la semana 27 hasta la 32 (desde los 135 das hasta los 240 das).
Durante esta fase el fruto cambia de color verde a rojo amarillo y adquiere madurez
fisiolgica hasta quedar listo para la cosecha.

1.1.2.

Proceso de produccin del caf verde


A continuacin se describir cada una de las etapas de produccin del caf verde.

Cultivo
Esta etapa comprende todas las actividades relacionadas con la siembra, fructificacin y recoleccin del caf cereza. Dadas las caractersticas de fructificacin de los cafetos

6
colombianos, donde en una misma rama es posible encontrar granos maduros, pintones,
verdes y hasta flores, se ha adoptado un sistema de recoleccin que consiste en darle varios
pasones al rbol para coger solamente los frutos plenamente maduros. Este sistema de recoleccin selectiva tiene ventajas tales como la uniformidad y buena calidad del producto. Sin
embargo, incrementa la necesidad de mano de obra y por lo tanto se elevan los costos de
produccin. Los costos de recoleccin representan entre el 30 y el 40 % de los costos totales
de produccin [37]. Los costos de cosecha son altos debido a que solamente se recolectan
los frutos maduros, individualmente, en suelos con pendientes moderadas y altas, en poca
de lluvias. La recoleccin del caf en Colombia se hace manualmente ya que la topologa de la zona no facilita la mecanizacin. En reas planas de Australia, Brasil y Hawaii, se
han implementado recolectores mecanizados. Por ejemplo, vibradores de follaje y batidores
mecnicos [28]. El primer sistema aplica vibraciones hacia abajo y adelante sobre las ramas
laterales y los frutos, por medio de dedos mecnicos, de tal forma que se desprendan los
frutos maduros. Y los batidores mecnicos consisten en la aplicacin de temblor en el tallo
para provocar el desprendimiento del fruto maduro. Utilizando estos mtodos la calidad de
la cosecha disminuye debido al alto porcentaje de frutos inmaduros que se desprenden [1].
Beneficio
El beneficio del caf es un conjunto de operaciones realizadas para transformar el
caf en cereza en caf pergamino seco. Existen dos formas de realizar este proceso, por
va hmeda o por va seca. En Colombia se hace beneficio del caf por va hmeda, y
comprende cuatro etapas que son: la descerezada, la fermentacin, el lavado y el secado.
Descerezar o despulpar es quitarle a los granos la cereza o pulpa de color rojo que los cubre.
La fermentacin, consiste en dejar vinagrar los granos descerezados durante varias horas.
El lavado del caf, es el nico proceso en el que se requiere indispensablemente el agua, que
se usa para remover los residuos de muclago que quedan en contacto con el caf pergamino
despus de la fermentacin. Y el secado, que puede hacerse al sol o por sistemas mecnicos.

7
La trilla
La trilla consiste en quitarle al caf pergamino seco el pergamino, es decir la cobertura gruesa, de color amarillo oro que protege la almendra (caf verde). El resultado de la
trilla es caf verde que es la forma como se exporta el caf colombiano.

1.1.3.

Economa y comercializacin del caf


Brasil, Colombia y Viet Nam cubren el 50 % del mercado mundial cafetero de un

total de 52 pases productores y exportadores de caf [2]. El volumen de produccin anual


de caf en el mundo flucta entre 100 y 110 millones de sacos de 60 kilos (aproximadamente 6 millones de toneladas de caf). Colombia produce entre 12 y 15 millones de sacos [4],
este aporte lo ubica como el segundo productor mundial del grano despus de Brasil y el
primer pas productor de cafs suaves [14]. La variedad producida por Colombia tiene identidad propia y se denomina "suaves colombianos". Cuatro tipos de cafs se comercializan
internacionalmente. Estos son: los suaves colombianos, otros suaves, robustas y Brasileros,
y otros arbicos.

Colombia exporta principalmente a Estados Unidos, Europa y Japn. El consumo


en Estados Unidos y Europa Occidental ha mostrado cierto grado se saturacin, mientras
que el mercado en Japn y los pases de Europa Oriental se comporta de una manera ms
dinmica. Desde que el caf se empez a cultivar en Colombia con fines de exportacin, se
convirti en la fuente ms segura y casi nica de divisas. En los ltimos aos, la comercializacin internacional del caf ha significado para la economa nacional cerca del 30 % del
ingreso total de divisas por concepto de las exportaciones provenientes del sector agrcola
(divisas por valores hasta de 1500 millones de dlares) [4]. Las actividades relacionadas con
la produccin de caf generan empleos directos e indirectos al 35 % de la poblacin econmicamente activa del pas (ms de tres millones de personas) [11]. El rea sembrada, que
asciende a 1137.000 hectreas, representa el 29 % del rea cultivada nacional. La caficultura colombiana, a partir de 1970 registra tasas anuales de incremento de la produccin del

8
orden de 5 al 6 %, a pesar de mantener un rea de cultivo constante. Este comportamiento
es el resultado de la tecnificacin de la caficultura; el 57 % de las fincas se encuentran tecnificadas [14]. La actual situacin mundial cafetera soporta una peligrosa sobreproduccin
que se refleja en la inestabilidad de los precios y una ardua competencia entre los pases
productores. Sin embargo, los precios de venta del caf colombiano siempre han estado en
niveles superiores a los de los otros pases exportadores debido a su apreciada calidad.

1.1.4.

La calidad del caf


La calidad del caf se evala con base en sus caractersticas fsicas y sensoriales

como la apariencia, el color y el olor del caf en pergamino, almendra y tostado; as como
por medio de sus caractersticas organolpticas tales como el aroma, la acidez, el amargor,
el cuerpo y el sabor de la bebida. La calidad est determinada genticamente pero es influenciada por diferentes factores tales como las condiciones de cultivo, el clima, el suelo,
los cuidados fitosanitarios, las prcticas agronmicas (principalmente la cosecha y el beneficio), y tambin la preparacin de la bebida [31]. El caf colombiano tiene una calidad
reconocida mundialmente y ha sido apreciada por los pases consumidores como una de
las mejores dentro de los cafs arbicos. La alta calidad del caf colombiano se debe a las
variedades que se cultivan, al manejo de las plantaciones, a la oferta ambiental y principalmente a la recoleccin que a diferencia de muchos pases se hace de forma manual y
selectiva.

Los frutos sobremaduros y verdes causan el defecto de fermento, ya sea con sabores
agrios, a frutas, a cebolla, rancios o nauseabundos. La presencia de ms del 2.5 % de granos
verdes producen deterioro de la calidad. Estos frutos representan un problema ya que no se
despulpan, se fermentan y se convierten en granos negros. Se ha concluido en varias investigaciones que la mejor calidad se consigue procesando slo frutos maduros [31]. Tambin
se demostr que se obtienen diferentes aromas y sabores segn el estado de madurez del
caf que se procese [38]. Por ejemplo, el caf maduro produce sabores dulces, suaves a

9
caramelo y mayor acidez.

Los consumidores tienen diferentes preferencias respecto a las caractersticas del


caf. Por ejemplo, a los franceses e italianos les gusta las bebidas con alto amargor y cuerpo, mientras que los alemanes disfrutan caf con altas calificaciones de acidez y aroma, y
moderado cuerpo [12]. Durante 1989 se not el crecimiento en el consumo de los cafs
especializados o de alta calidad. Las tiendas de caf cof f ee shops dedicadas a vender
cafs de una refinada seleccin y calidad se han multiplicado en casi todos los pases industrializados de Europa, en los Estados Unidos, en Japn y en Korea. Por estas preparaciones
se cobra casi un 50 % ms del valor de un caf comn. Colombia tiene excelentes posibilidades de conquistar estos mercados produciendo calidades especiales para el gusto de los
consumidores refinados que estn dispuestos a pagar hasta el doble del precio de un caf normal. Adems se aprecia en estos pases una preferencia por los cafs que garanticen
la menor exposicin a contaminantes de origen qumico como fertilizantes o pesticidas [13].

1.2.

Cosecha Mecanizada
El propsito de la cosecha mecanizada es la sustitucin de la mano de obra, en ope-

raciones elementales, por medio de mquinas diseadas especficamente. Muchas mquinas


estn dotadas de ciertos captadores que, al obrar como rganos sensoriales del hombre, recogen informacin que les permiten ejecutar determinadas acciones de control o pasar de
una operacin a otra. Los trabajos de investigacin que se han realizado a nivel mundial,
relacionados con la utilizacin de visin artificial en procesos agrcolas se han enfocado en
las etapas de recoleccin robotizada de cosechas, y en la clasificacin y ordenamiento de
los productos agrcolas.

10

1.2.1.

Recoleccin robotizada
La recoleccin robotizada se ha convertido en una opcin innovadora para obtener

productos alimenticios de buena calidad y con precios ms bajos. En la actualidad, diferentes factores tanto de los procesos agrcolas como del progreso tecnolgico han enfocado
las investigaciones hacia la obtencin de soluciones automticas a los problemas de recoleccin de cosechas. Algunos de estos factores son: la escasez de mano de obra, los altos
costos laborales, la labor intensiva asociada con la recoleccin selectiva de frutos, el acelerado progreso en la tecnologa de los sensores y computadores [19], y el decremento de los
costos de los microprocesadores, sistemas de visin y equipamiento de robots [35].

Los principales componentes de un robot recolector son: el sistema de visin (ej.


dos vdeo cmaras, ubicados en los lado izquierdo y derecho del manipulador), la unidad
de control (ej. microprocesador), el manipulador (ej. brazo robtico), el terminal actuador
(ej. tubo de succin y herramienta de corte) y el dispositivo de desplazamiento a travs del
cultivo.

La identificacin visual automtica en imgenes de campo es una operacin compleja por las variaciones de iluminacin. Donde efectos de la luz del sol y la sombra de las
ramas, pueden combinarse en una sola imagen, as como fondos oscuros y claros [33]. Por
esta razn, muchos diseos se trabajan en ambientes protegidos, por ejemplo en invernaderos [23].

La recoleccin robotizada ha sido estudiada y probada en los aos recientes. Se


han implementado para la recoleccin de tomates [19], manzanas [3] [30], naranjas [33],
tomates-cereza [23], y otros productos agrcolas. Los resultados de estos estudios mostraron que a pesar del xito obtenido se deba mejorar la etapa de deteccin y ubicacin, as
como el desprendimiento del fruto.

11

1.2.2.

Clasificacin de productos
La visin computarizada primero fue aplicada en otras etapas de la produccin agr-

cola diferentes de la recoleccin; tales como: clasificacin, deteccin de defectos, control


de calidad, valoracin de la madurez de las frutas y las verduras. La clasificacin es un
proceso que puede hacerse por mtodos manuales, con dispositivos electromecnicos o
electro-pticos, entre otros. Pero estos mtodos no son ptimos y por tanto decrementan la
eficiencia del proceso de clasificacin.

La clasificacin manual es una tarea altamente subjetiva, sujeta al error humano y


no siempre es consistente. Se ha probado que difcilmente coincide una estimacin de calidad hecha por un humano al repetir una prueba; esto es definido como inconsistencia [30].
Los costos de clasificacin manual pueden ser altos, ya que se requiere un gran nmero
de trabajadores para separar los productos que cumplen determinadas caractersticas. Los
aparatos electromecnicos no son muy precisos y por su contacto directo con los productos
pueden causar dao mecnico [15]. En la clasificacin electro-ptica el nmero de categoras para la clasificacin es reducido. Por ejemplo, un dispositivo electro-ptico utilizado
para clasificar nueces de pistacho slo puede clasificar en dos categoras: aceptado rechazado; en muchos procesos se necesita que el producto se pueda separar en ms de dos
clases [15].

La clasificacin que emplea tcnicas de visin artificial se hace con base en el anlisis de una imagen digital del producto. De cada imagen se pueden extraer propiedades del
producto tales como: la forma, el tamao, el color, etc.. La clasificacin de productos por
medio de visin artificial comprende los siguientes pasos principales: adquisicin de las
imgenes, segmentacin de los objetos presentes en la imagen, extraccin de las caractersticas de los objetos, interpretacin de stas y la asignacin a una clase.

12
Algunas industrias prefieren optar por un proceso de clasificacin sencillo y eficiente que realizar una recoleccin selectiva, ya que los costos de produccin son menores y la
tasa de cosecha es ms alta. Sistemas de clasificacin usando visin artificial han sido implementados con xito en los procesos productivos de papas [18], olivas [26] , brcoli [32],
nueces de pistacho [15] y manzanas [30].

1.3.

Etapas principales de un sistema de visin artificial

1.3.1.

Adquisicin y adecuacin de las imgenes


La adquisicin de una imagen digital es el primer paso cuando se utiliza un sistema

de visin artificial. Esto se hace por medio de un sensor y si es el caso, un sistema digitalizador. El sensor puede ser una cmara fotogrfica o de video. Si la seal producida por
la cmara es anloga entonces se utiliza un convertidor anlogo digital para digitalizarla y
guardarla en el computador. El sistema de adquisicin comprende adems de la cmara un
equipo de iluminacin y un fondo. Para obtener una buena imagen, es necesario poseer una
iluminacin adecuada la cual depende de la tarea que se desea realizar. Una iluminacin
inapropiada conlleva a la alteracin de las caractersticas del objeto en la imagen. El fondo
permite controlar el ambiente procurando realzar el objeto de inters aislndolo de los otros
objetos presentes en el entorno.

Despus de obtener la imagen digital, se inicia el preprocesamiento de la imagen.


El objetivo del preprocesamiento es mejorar la imagen, principalmente filtrando el ruido y
aumentando el contraste. A continuacin sigue la etapa de segmentacin, la cual consiste en
la separacin de los objetos presentes en la imagen. La salida del proceso de segmentacin
son los datos de ubicacin de los pxeles ya sea del contorno de un objeto o de toda una
regin.

13

1.3.2.

Caracterizacin
Las imgenes segmentadas contienen mucha informacin redundante. Estos datos

elevan la carga computacional y no son tiles para el proceso de anlisis. Por esta razn
se extrae la informacin cualitativa, obtenindose una representacin y descripcin de los
objetos que se van a estudiar. Los rasgos extrados se llaman caractersticas y un vector de
tales caractersticas se conoce como modelo o patrn [21]. Las caractersticas son usadas
como entradas a los algoritmos para la clasificacin de los objetos dentro de diferentes categoras. Segn Pavlidis las caractersticas de un objeto en una imagen pueden ser externas
o internas [29]. Las caractersticas externas de la imagen describen la informacin del contorno de los objetos. Las caractersticas extradas de las propiedades de los pxeles dentro
del contorno son llamadas caractersticas internas de la imagen.

Por medio de las caractersticas externas se obtiene informacin de la forma y el


tamao del objeto. Con base en el contorno se pueden hallar caractersticas morfolgicas
que definen las dimensiones fsicas del objeto as como su apariencia [17]. Algunas de las
caractersticas morfolgicas ms utilizadas son: el rea proyectada, el permetro, la longitud de los ejes, el volumen, el dimetro y la redondez. Los descriptores de Fourier dan
informacin espectral del objeto, al tomar su contorno cerrado como una funcin peridica
con periodo 2. Una funcin peridica con un dominio de [0, 2], en condiciones generales
se puede representar por una expansin en series de Fourier. Los descriptores de Fourier
son la frecuencia y amplitud de los armnicos. Otra forma para describir el contorno de
un objeto es por medio del cdigo de cadena. Esta codificacin consiste en asignar a un
contorno especfico una cadena de smbolos que determinan unvocamente el correspondiente contorno. Existen otros mtodos para obtener los rasgos discriminantes del contorno
tales como: los momentos de una funcin bidimensional acotada y cerrada en el espacio, la
transformada onditas, la transformada de Fourier del cdigo de cadena, etc..

14
Por medio de las caractersticas internas se obtiene informacin del color y la textura del objeto. Para caracterizar el color de un objeto se analizan las componentes de los
diferentes modelos de color en cada pxel del objeto. Un modelo de color es la definicin
de un sistema tridimensional de coordenadas donde cada color queda representado por nico punto. Los modelos ms utilizados en en anlisis de imgenes son el RGB (Red Green
Blue) y el HSI (Hue Saturation Intensity). En el modelo RGB, cada color se divide en sus
componentes espectrales primarios rojo, verde y azul. Mientras que en modelo HSI, la componente que cuantifica la intensidad est desacoplada de la informacin cromtica, es decir,
del tono (describe un color puro) y la saturacin (cantidad de luz blanca que modifica el color). Las caractersticas que definen el color son diferentes variables estadsticas, tales como
la media y la varianza, de cada uno de los componentes de los modelos de color. Para caracterizar la textura, que es la distribucin espacial del color en el objeto, se usan variables
estadsticas y estructurales tales como: funciones de autocorrelacin, modelos autoregresivos, transformadas pticas, elementos estructurales, probabilidad de coocurrencia espacial
del los niveles de color, suma y diferencia de los histogramas, entre otros.

1.3.3.

Seleccin de las caractersticas


El xito o fracaso de la clasificacin depende de la seleccin apropiada de un grupo

de caractersticas, las cuales deben dar la mejor descripcin de las clases. La seleccin de
las caractersticas discriminantes depende de la naturaleza del problema en particular. Las
caractersticas seleccionadas deben cumplir las siguientes propiedades: capacidad discriminante (separacin entre clases), fiabilidad (poca dispersin), incorrelacin (dependencia
entre caractersticas) y rapidez de clculo. La seleccin de las caractersticas es un proceso
que se hace a posteriori, es decir se escogen, agregando o quitando, caractersticas de un
conjunto predeterminado. Para elegirlas se utiliza la relacin de Fisher y el coeficiente de
correlacin [16]. La relacin de Fisher cuantifica simultneamente la separacin entre clases y la fiabilidad de cada una de las clases. El coeficiente de correlacin se obtiene a partir
de la covarianza de las combinaciones posibles de dos caractersticas, clase a clase.

15

1.3.4.

Clasificacin
En el proceso de clasificacin se requiere de una regla de decisin, conocida como el

criterio de clasificacin, para poder clasificar los productos dentro de dos o ms grupos definidos, llamados clases, con base en las caractersticas cualitativas extradas de los objetos.
El criterio de clasificacin es usualmente derivado de la observacin de las clases conocidas
o grupo de entrenamiento. Hay en la literatura muchos mtodos de clasificacin, para determinar cual de los clasificadores funciona adecuadamente para una aplicacin particular
se deben realizar pruebas experimentales. Algunos de estos clasificadores estn hechos con
base en mtodos estadsticos, usando redes neuronales, lgica difusa, etc.

Los mtodos estadsticos se fundamentan en la regla de Bayes del mnimo error


[10], resolviendo el problema de clasificacin en trminos probabilsticos, donde se concluye que un objeto, con unas caractersticas determinadas, pertenece a una clase si la probabilidad de pertenecer a sta clase es mayor que la probabilidad de pertenecer a cualquier
otra clase. En las aplicaciones prcticas, las funciones de probabilidad no se conocen y por
lo tanto se deben estimar. Esta estimacin se hace con aproximaciones paramtricas y no
paramtricas. En la primera de stas, se asume la forma de la funcin de probabilidad, y
se estiman sus parmetros a partir del conjunto de entrenamiento. En la aproximacin no
paramtrica se calculan las funciones de probabilidad directamente del conjunto de entrenamiento.

Las redes neuronales artificiales emulan las redes neuronales biolgicas y se utilizan para aprender estrategias de control observando la forma como una persona lo hace [8].
Son sistemas que aprenden con ejemplos, no requieren que la tarea a ejecutar se programe.
Las redes neuronales reaccionan, aprenden y se auto-organizan. Para entrenar una red neuronal se le presentan de manera repetitiva y sistemtica un conjunto de entradas, se evala

16
la calidad de las respuestas para estas entradas, y se ajusta la frmula que genera estas acciones.

Los sistemas difusos se basan en reglas que utilizan lgica difusa para imitar el
razonamiento humano de un experto [39]. La lgica difusa permite analizar informacin
del mundo real donde las cosas son parcialmente ciertas. Esta informacin involucra incertidumbre, inexactitud y contiene ruido. En la lgica clsica un objeto pertenece o no
pertenece a un conjunto, no hay intermedio, a diferencia de la lgica difusa, donde un objeto pertenece parcialmente a un conjunto. El grado de pertenencia est dado por un valor
que est entre cero y uno. La clasificacin de un objeto se hace con base en el anlisis del
grado de pertenencia que tiene ste a las diferentes caractersticas.

Existe una gran diferencia entre los sistemas difusos y los estadsticos, los dos operan sobre el mismo rango numrico pero los conceptos son distintos. Las probabilidades
miden si algo va a ocurrir o no. Los niveles difusos miden el grado en el cual algo ocurre o
alguna condicin existe.

Los clasificadores con redes neuronales tienen ventajas comparados con los mtodos estadsticos tales como adaptabilidad, procesamiento paralelo masivo y tolerancia a los
errores. Las redes neuronales han sido implementadas con xito en actividades de inspeccin de calidad y clasificacin de diferentes productos agrcolas, debido a que las caractersticas que definen a estos productos no siguen una funcin matemtica determinada.

1.3.5.

Trabajo anterior
Dentro del grupo de investigacin PCI, se realiz un proyecto que consista en el de-

sarrollo de un algoritmo para la caracterizacin y clasificacin de granos de caf empleando


tcnicas de visin artificial, ste trabajo se present como tesis de pregrado en ingeniera

17
electrnica en el 2001 [25]. Los resultados obtenidos mostraron la clasificacin de imgenes de frutos de caf en cuatro categoras dependiendo de la madurez. La discriminacin
entre clases fue realizada a partir de la informacin ofrecida por la media estadstica del histograma, por la media estadstica de la componente de tono del modelo HSI, y por el rea
proyectada. Se implement un clasificador Bayesiano, con el que se obtuvo una efectividad
mayor del 90 % para todas las clases. Se utilizaron 100 imgenes de granos en diferentes
etapas de maduracin, las cuales se tomaron el mismo da, sin condiciones especficas de
adquisicin.

Captulo 2

Adquisicin y adecuacin de las


imgenes
2.1.

Adquisicin de las imgenes

2.1.1.

Frutos de caf
Los frutos de caf utilizados en la adquisicin de las imgenes se obtuvieron gracias

a la colaboracin de Cenicaf, dentro de un proyecto de investigacin llamado Caracterizacin de los estados de madurez del fruto de caf. Este proyecto desarrollado por investigadores de Cenicaf junto con estudiantes de Agronoma de la universidad de Caldas buscaba
la extraccin de caractersticas fsicas y qumicas de los frutos de caf en diferentes etapas
de desarrollo.

La definicin de la poblacin objetivo de estudio se tom con base en los siguientes


criterios:
Alturas de los cultivos: el estudio se llev a cabo en las subestaciones de Cenicaf
en Chinchin, localizadas a tres alturas diferentes: zona alta ( mayor de 1800 msnm),
media (entre 1200 1600 msnm) y baja (menor de 1100 msnm).
19

20
Representatividad del cultivo: el cultivo en las tres zonas debe ser homogneo en
cuanto a variedad y condiciones de manejo. Adems debe tener caractersticas propias de los cultivos tecnificados de la regin.
Densidad: altas densidades de siembra, como mnimo 5000 y preferiblemente cercanas a las 10000 plantas por hectrea.
Variedad: caf variedad Colombia - Cereza roja.
Edad: plantaciones que estn entre la segunda y la cuarta cosecha.
Sistema de cultivo: cafetales a libre exposicin.
Manejo: plantaciones en buen estado, sin deficiencias nutricionales, que hayan recibido adecuado manejo fitosanitario y de arvenses.
Tamao del lote: el tamao del lote aproximadamente es de 50m2 .
Despus de seleccionar los lotes se escogieron aleatoriamente 100 plantas. A stas
plantas se les hizo un proceso conocido como Raleo, debido a la caracterstica de fructificacin desuniforme. El Raleo consiste en desprender todos los frutos de la planta dejando
slo las flores. De esta forma, se logra una floracin homognea garantizando que todos
los frutos de la planta pertenecen a el mismo estado de madurez. A partir de la semana 26
despus de la floracin, se recogieron algunos frutos de las 100 plantas sealadas. De los
frutos recogidos, 100 frutos se empacaron a bajas temperaturas y se trasladaron hasta las
instalaciones de la Universidad Nacional de Colombia sede Manizales campus La Nubia.
El mismo da se adquirieron las imgenes para evitar cambios fsicos de los frutos. Este
proceso se repiti cada semana durante 8 semanas. Se cont con 100 frutos por muestra.
Con cada muestra se tomaron 300 imgenes. Debido a la forma como se desarrolla el caf,
las condiciones del terreno y atmosfricas, en algunas semanas se cosecharon dos muestras,
en la tabla (2.1) se explica la relacin entre las muestras, las semanas y los estados de maduracin.

21
Muestra

10

11

Estado de Maduracin

Semana

Tabla 2.1: Relacin entre: las muestras, los estados de maduracin, las semanas

2.1.2.

Sistema de adquisicin
El sistema de adquisicin implementado constaba de una cmara de video a color

3 CCD (JVC KY F 55B), una tarjeta digitalizadora (National instruments), un computador y dos lmparas de luz blanca. Las imgenes almacenadas son la vista superior de los
frutos dispuestos individualmente sobre un fondo e iluminados con luz blanca difusa. Cada
semana se montaron tres sistemas de adquisicin diferentes, con cada uno se tomaron 100
imgenes, una imagen por fruto. Los sistemas de adquisicin contienen los mismos elementos pero se modific la iluminacin y el fondo. Para variar la iluminacin, se cambi la
posicin de las lmparas. Para la iluminacin, la luz de las lmparas no se orient directamente sobre el fruto sino que se difumin usando una sombrilla blanca en cada lmpara. A
pesar de la sombrilla, el haz de luz incida fuertemente sobre el fruto creando dos brillos polarizados. Al alejar las lmparas se disminua el brillo pero la luz no era suficiente haciendo
las imgenes oscuras y creando sombras. Usando un filtro de papel pergamino entre la lmpara y la cmara se obtuvieron imgenes con frutos sin mucho brillo, y con luz moderada
y homognea. Los tres fondos eran cartulinas de color blanco y azul en dos tonalidades.
Los colores se escogieron para producir alto contraste entre el fruto y el fondo, y facilitar la
segmentacin. Como se utilizaron tres sistemas de adquisicin y con cada uno se tomaron
100 imgenes, entonces se cuenta con una base de datos que contiene 300 imgenes por
semana. Las imgenes estn almacenadas en formato BMP, con una resolucin de 160x160
pxeles y 24 bits por pxel. En la figura 2.1 se muestra un ejemplo de una imagen adquirida.

22

Figura 2.1: Fruto de caf

2.2.

Adecuacin de las imgenes


Las caractersticas internas, como son textura y color, se extrajeron con base en los

datos de la imagen que corresponden al interior del fruto. Ya que los frutos estn centrados
en la imagen, se tom una matriz de 50x50 pxeles, a partir del centro de la imagen, de sta
forma se obtiene una porcin del centro del fruto como se muestra en la figura 2.2.

Figura 2.2: Segmentacin. Once clases.


Las caractersticas de tamao y forma que son externas, se obtuvieron del contorno de cada fruto. Para esto se segment toda la regin del fruto y se extrajo el contorno.
En la segmentacin se aplic un filtro suavizante tipo mediana de tamao 7x7, luego se
convirtieron las imgenes RGB a escala de grises.La conversin RGB a escala de grises se
hizo eliminando la informacin de tono y saturacin y tomando slo el valor de luminancia.
En la imagen a escala de grises es ms evidente el alto contraste entre el fondo y el fruto
entonces se utiliz un sencillo algoritmo de umbralizacin para separarlos. El umbral es el
valor promedio de las intensidades de los pxeles del fondo que se encuentran en la matriz
de 10 x 10 de la esquina superior izquierda de la imagen en escala de grises. El algoritmo de
umbralizacin di buen resultado, aunque en algunas imgenes los brillos en el fruto quedaron como pxeles del fondo. En la figura 2.3 se muestra el resultado de la segmentacin
de la imagen 2.1. Usando un filtro pasa altas se obtuvo el contorno. Se utiliz el filtro Sobel

23
con muy buenos resultados debido al alto contraste de la imagen binaria. En la figura 2.4 se
presenta el borde obtenido para la imagen 2.3.

Figura 2.3: Segmentacin del fruto

Figura 2.4: Contorno del fruto

Captulo 3

Caracterizacin
3.1.

Caractersticas
Para caracterizar los frutos de caf se hicieron medidas de color, forma, tamao y

textura. Las caractersticas se obtuvieron al aplicar cada uno de los mtodos de extraccin
de caractersticas en las 3300 imgenes de frutos de caf.

3.1.1.

Caractersticas de color
El color es una medida del espectro electromagntico definido con base en el sis-

tema de visin humano. Las funciones CMFs (color matching functions) son un conjunto
de tres funciones relacionadas con la sensibilidad espectral de los tres conos de los ojos.
Estas funciones fueron determinadas en experimentos psicofsicos. Las funciones CMFs
se usan para establecer un estndar para la especificacin numrica del color en trminos de
tres coordenadas o valores triestmulo. La CIE (Commission Internationale de lclairage
International Commission on Illumination) es la principal organizacin responsable de la
estandarizacin de la mtrica del color y la terminologa. El primer conjunto de CMFs es
conocido como el CIE Red-Green-Blue (RGB). Con base en la informacin del CIE RedGreen-Blue se pueden generar otras formas de representacin del color, transformando del
espacio RGB a otros espacios tridimensionales. Cada color es un punto en un espacio de
25

26
color determinado, y la diferencia entre dos colores se considera como la distancia entre
ellos.

El color es la principal caracterstica para identificar la madurez en la variedad de


caf que se utiliz en este trabajo, ya que es variedad Colombia - cereza roja. La especificacin cereza roja significa que cuando el fruto est maduro presenta un color rojo intenso
homogneo en toda la epidermis. Existen otras variedades donde el color del fruto maduro
no es rojo sino que puede ser amarillo o naranja. Para la variedad Colombia cereza roja
utilizada en este trabajo, el color de la epidermis vara en la gamma de los verdes para las
primeras etapas, le siguen tonos naranjas y rosados hasta tomar el color rojo de la madurez,
y cuando estn sobremaduros el color llega a ser violeta oscuro.

Para la caracterizacin del color se usaron seis espacios de representacin del color:
RGB, HSI, YIQ, YCbCr, Colores oponentes, y Ohta. Cada uno de estos modelos describe
el color usando tres componentes. En el nexo A se explica con detalle cada uno de los
modelos de color utilizados. Para cada imagen de fruto de caf se obtuvo un vector de
tamao 18, donde cada posicin muestra la media estadstica de cada componente para los
diferentes modelos. La media estadstica se hall con base en la ecuacin (3.1), donde xi es
la intensidad de cada componente en cada pxel y n es el total de pxeles.

x
=

n
1X
xi
n i=1

(3.1)

En la figura 3.1 se presenta una imagen con el color promedio en el espacio RGB
para cada una de las once clases.

Figura 3.1: Color promedio RGB de las once clases

27
En la tabla 3.1, se presenta la lista de las 18 caractersticas de color obtenidas.
Tabla 3.1: Caractersticas de color
Caracterstica

3.1.2.

Media componente R de RGB

Media componente G de RGB

Media componente B de RGB

Media componente H de HSI

Media componente S de HSI

Media componente I de HSI

Media componente Y de YIQ

Media componente I de YIQ

Media componente Q de YIQ

10

Media componente Y de YCbCr

11

Media componente Cb de YCbCr

12

Media componente Cr de YCbCr

13

Media componente RG de Colores Oponentes

14

Media componente YB de Colores Oponentes

15

Media componente W hB l de Colores Oponentes

16

Media componente I1 de OHTA

17

Media componente I2 de OHTA

18

Media componente I3 de OHTA

Caractersticas de textura
Usando caractersticas de textura se espera obtener descripciones de la suavidad, ru-

gosidad y regularidad de una regin. Un mtodo de extraccin de caractersticas de textura


es el anlisis estadstico usando la matriz de coocurrencia. La matriz de cooocurrencia tiene

28
informacin de la distribucin de las intensidades y las posiciones de los pxeles que tienen
iguales, o casi iguales valores de intensidad. En el proceso de maduracin del caf se tienen
etapas donde un color se presenta homogneamente sobre toda la epidermis, mientras que
en otras etapas hay una variacin suave o brusca de diferentes colores. Las caractersticas
de textura aplicadas a imgenes de caf se centran en el anlisis de la suavidad en la distribucin de la intensidad de los colores para todas las etpas, as como el anlisis de la
rugosidad para las etapas finales cuando los frutos estn sobremaduros o secos, pero no en
la observacin de la repeticin de patrones regulares.
Matriz de Coocurrencia
La construccin de la matriz de coocurrencia se basa en la ubicacin espacial de los
pxeles, las relaciones con su vecindario y el valor de su intensidad, dependiendo de la condicin, la direccin y la distancia. Condicin: Es la regla que debe cumplir un determinado
pxel para poder ser cuantificado, usualmente esta condicin es tomada como la ubicacin
del pxel de determinada intensidad que se encuentra en la direccin del vecino.Direccin:
Es la orientacin espacial en la cual se evala la condicin, como casos tpicos se utilizan
direcciones como 0 grados, 45 grados, 90 grados y 135 grados ( [17]). Distancia: Es el nmero de pxeles que hay entre el par de pxeles evaluados, usualmente se utilizan 1, 3 y 5
pxeles de distancia.

Con base en la matriz de coocurrencia se obtienen los descriptores de textura. Se


obtuvo una matriz de coocurrencia para cada una de las direcciones 0, 45, 90 y 135 grados,
todos a una distancia fija de 1 pxel. La matriz final es la suma de las cuatro matrices
de diferentes direcciones divida en cuatro. Los descriptores utilizados para la evaluacin de
textura en frutos de caf se explican con detalle en el anexo A. Se extrajeron 11 descriptores
y se evaluaron en cada una de las componentes R, G, yB, obteniendose 33 caractersticas.
En la tabla 3.2, se presenta la lista de las 33 caractersticas de textura.

29

Tabla 3.2: Caractersticas de textura


Caracterstica
1

Entropa componente R

Uniformidad componente R

Contraste componente R

Correlacin componente R

Momento de diferencia de orden k componente R

Momento inverso de diferencia de orden k componente R

Mxima probabilidad componente R

Homogeneidad local componente R

Varianza componente R

10

Directividad componente R

11

Tendencia de Cluster componente R

12

Entropa componente G

13

Uniformidad componente G

14

Contraste componente G

15

Correlacin componente G

16

Momento de diferencia de orden k componente G

17

Momento inverso de diferencia de orden k componente G

18

Mxima probabilidad componente G

19

Homogeneidad local componente G

20

Varianza componente G

21

Directividad componente G

22

Tendencia de Cluster componente G

30
Caracterstica

3.1.3.

23

Entropa componente B

24

Uniformidad componente B

25

Contraste componente B

26

Correlacin componente B

27

Momento de diferencia de orden k componente B

28

Momento inverso de diferencia de orden k componente B

29

Mxima probabilidad componente B

30

Homogeneidad local componente B

31

Varianza componente B

32

Directividad componente B

33

Tendencia de Cluster componente B

Caractersticas de tamao
El tamao de los frutos de caf depende del estado de madurez. En las primeras eta-

pas de desarrollo del fruto el tamao es pequeo y va aumentando hasta llegar a su mximo
valor en plena madurez. Despus de la madurez el tamao disminuye a medida que el fruto
se va secando. Cuando es dificil de distinguir el cambio de color entre dos etapas de madures consecutivas, se utiliza el tamao como caracterstica diferenciadora. En un ambiente
controlado donde se tenga una cmara nica, as como los parmetros de zoom y foco fijos,
las medidas del tamao discriminaran las diferentes etapas. Se utilizaron las imgenes binarizadas y adems las de contorno para obtener un conjunto de 5 caractersticas de tamao.
En el anexo A se explican con detalle cada uno de los mtodos utilizados. En la tabla 3.3,
se presenta la lista de las 5 caractersticas de tamao.

31
Tabla 3.3: Caractersticas de tamao
Caracterstica

3.1.4.

rea

Permetro

Longitud

Anchura

Eje mnimo

Caractersticas de forma
La forma de los frutos de caf durante todo el proceso de madurez es elipsoidal. La

forma elipsoidad se define con un centro y tres ejes de simetra, adems todas las secciones
planas de un elipsoide son elipses o crculos. En las primeras etapas la forma va variando de
elipsoidal alargada, donde un eje de simetra es mucho mayor que los otros dos, a circular,
donde los tres ejes son similares. En plena madures, cuando el fruto tiene ms pulpa, la
forma es esfrica es decir que los ejes de simetra son iguales. A medida que el fruto va
envejeciendo, la pulpa se va secando y la forma tiende otra vez a ser elipsoidal alargada. En
una imgen de un fruto de caf solo se tiene informacin de una de las tres secciones de la
elipsoide, con base en esta vista se obtienen dos de los tres ejes de simetra. En el anexo A,
se explican detallamente los mtodos de extraccin de caractersticas de forma utilizados.
En la tabla 3.4, se presenta la lista de las 157 caractersticas de forma obtenidas.

32
Tabla 3.4: Caractersticas de forma
Caracterstica

3.2.

1 a 36

Amplitud de los coeficientes de Fourier de la firma

37 a 72

Fase de los coeficientes de Fourier de la firma

73 a 82

Momentos centrales de la firma

83

Rectangularidad

84

Circularidad

85 a 120

Amplitud de los 36 descriptores de Fourier

121 a 156

Fase de los 36 descriptores de Fourier

157

Relacin entre anchura y altura

Normalizacin
Los valores de las caractersticas extradas manejan diferentes rangos dinmicos.

Las caractersticas que tienen valores ms grandes tienen mayor influencia en la clasificacin que las caractersticas con valores pequeos, por lo tanto se realiza una normalizacin
de las caractersticas para que los valores se mantengan dentro de un rango similar.

3.2.1.

Normalizacin estadstica lineal


Es una tcnica basada en la estimacin de la media y la varianza. Para N datos

disponibles de la k sima caracterstica se tiene que,


x
k =

N
1 X
xik
N i=1

k2 =

k = 1, 2, ..., l

(3.2)

N
1 X
(xik x
k )2
N 1 i=1

(3.3)

xik x
k
k

(3.4)

x
ik =

Las caractersticas normalizadas con este mtodo tienen media cero y varianza uno.

33

3.2.2.

Normalizacin no lineal
Los mtodos de normalizacin no lineales se emplean en casos en los cuales los

datos no estn uniformemente distribuidos al rededor de la media. En las ecuaciones (3.5 y


3.6), se muestra una forma de normalizar no linealmente.

y=

x
ik =

xik x
k
rk

1
1 + exp(y)

(3.5)

(3.6)

El rango de valores de xik que corresponde a la seccin lineal depende de la desviacin estndar y del factor r, el cual es definido por el usuario.

3.2.3.

Comparacin de la normalizacin
Los valores de las caractersticas extradas se normalizaron utilizando los dos mto-

dos, el lineal y no lineal, y con cada uno de estos conjuntos se realiz la seleccin de Fisher
para analizar el efecto de la normalizacin. En la figura 3.2 y figura 3.3 se muestran los
valores del ndice de Fisher para las caractersticas de color sin normalizar y normalizadas
linealmente, respectivamente. Como se puede ver la normalizacin no afecta el valor discriminante de las caractersticas. En cambio al comparar la figura 3.2 y figura3.4 que son los
ndices de Fisher para las caractersticas se observa un cambio en la magnitud del ndice.
Para la normalizacin no lineal el ndice de Fisher aumenta en todas las caractersticas lo
que significa que la nueva representacin mejora la discriminacin. Adems, el aumento del
ndice es casi uniforme para todas las caractersticas. Como los ndices de Fisher muestran
un mayor valor para la normalizacin no lineal se trabaj con los datos normalizados no
linealmente.

34

Figura 3.2: ndice de Fisher para las caractersticas de color sin normalizacin

Figura 3.3: ndice de Fisher para las caractersticas de color con normalizacin lineal

35

Figura 3.4: ndice de Fisher para las caractersticas de color con normalizacin no lineal

3.3.

Seleccin de caractersticas
El nmero de caractersticas extradas usualmente es muy grande. Uno de los pro-

blemas ms comunes en el reconocimiento de patrones es la reduccin de la dimensin


del espacio caracterstico. Hay varias razones para reducir el nmero de caractersticas al
mnimo. Primero, un gran nmero de caractersticas aumentara la complejidad computacional tanto en la etapa de caracterizacin, ya que se utilizaran los diferentes mtodos de
extraccin, como en la clasificacin donde se requerira un clasificador adecuado para el
manejo de toda la informacin. En segundo lugar, muchas veces dos caractersticas pueden
portar informacin adecuada para la clasificacin cuando se utilizan por separado, pero si
son altamente correlacionadas la ganancia es poca al utilizarlas en un mismo vector caracterstico. Y tercero, la capacidad de generalizacin del clasificador se puede medir con la
relacin que existe entre el nmero de muestras y los parmetros del clasificador. El nmero
de caractersticas es proporcional a el nmero de parmetros del clasificador por ejemplo,
los pesos sinpticos de una red neuronal o los pesos en un clasificador lineal.

36

La seleccin o reduccin de caractersticas es el proceso mediante el cual se escogen


las mejores caractersticas de un conjunto dado, de tal forma que se reduzca el nmero de
caractersticas pero al mismo tiempo se conserve la informacin discriminante. Si se logra
obtener un conjunto de caractersticas adecuado se simplifica el diseo del clasificador. Las
mejores caractersticas deben proporcionar una gran distancia entre clases y una pequea
distancia intra clase en el espacio vectorial caracterstico.

3.3.1.

Relacin discriminante de Fisher


El ndice de Fisher cuantifica la capacidad de separabilidad de las caractersticas

individuales. Para el caso multiclase el ndice de Fisher se muestra en la ecuacin (3.7).


F DR =

M X
M
X
(i j )2
i

j6=i

i2 + j2

(3.7)

donde los subndices i,j se refieren a la media y varianza correspondiente a la caracterstica bajo investigacin para las clases i y j , respectivamente. Las caractersticas con
ms alto ndice de Fisher son ms discriminantes que las que tienen menor ndice.

3.3.2.

Mtodo multivariado
La seleccin usando el mtodo multivariado se hace con base en la evaluacin en

conjunto de las caractersticas [7]. Este mtodo fue implementado por Genaro Daza Santacoloma y Luis Gonzalo Snchez Giraldo dentro de un trabajo de grado en ingeniera
electrnica en la sede. sta tcnica comprende los siguientes pasos:
MANOVA (Multivariate Analysis of Variables) y Decisin por Flujo de conjunto
flotante.
PCA (Principal Component Analysis)
ANOVA (Analysis of Variables)
Anlisis de correlacin.

37
MANOVA
Es una tcnica de anlisis de varianza multivariado que selecciona las caractersticas
discriminantes en conjunto y no en forma independiente. La idea es evitar la utilizacin de
conjuntos de caractersticas que analizadas de forma univariada discriminen y en conjunto
no lo hagan.
Decisin por flujo de conjunto flotante
El conjunto se empieza a conformar con la caracterstica que separe mejor dos clases. Se va incrementando el tamao del conjunto adicionando la caracterstica que mejore
el desempeo. El conjunto sigue creciendo hasta que la adicin de una caractersticas no
mejore o dae el desempeo del conjunto. Para obtener el desempeo cada uno de los subconjuntos de caractersticas se evala usando el test de Wilks (MANOVA), se obtiene el
F stats y se estima la probabilidad acumulada de la distribucin de Fisher. Se toma el
subconjunto que ofrezca la mayor probabilidad acumulada y que exceda la probabilidad
acumulada medida cuando no se haba adicionado la ltima caracterstica.
PCA
Al grupo seleccionado en el paso anterior se le aplica anlisis de componentes principales enfocado a la minimizacin de la correlacin entre componentes pero no se realiza
reduccin del conjunto.
ANOVA
Se hace anlisis univariado sobre las proyecciones PCA para reducir el espacio,
pero la reduccin se hace sobre un hiperespacio diferente al original.
Anlisis de correlacin
Como la reduccin ANOVA se realiz en un espacio diferente al original, se analiza la correlacin que existe entre las componentes principales seleccionadas con ANO-

38
VA y las caractersticas originales para escoger las caractersticas originales que estn ms
correlacionadas con las proyecciones PCA seleccionadas por ANOVA. Las caractersticas
originales escogidas se pasan por un clasificador lineal incrementando en uno el conjunto.
Finalmente se toman las caractersticas que reduzcan el error de clasificacin tanto como
sea posible.

3.3.3.

Procedimiento utilizado
Se obtuvieron 18 caractersticas de color, 33 de textura, 157 de forma y 5 de tamao.

Dadas las condiciones de adquisicin de las imgenes donde no se fijaron los parmetros de
foco y zoom, las caractersticas de tamao aunque se extrajeron no se van a tener en cuenta.
Al utilizar un zoom y un foco diferente para cada clase no se tiene una referencia fija comn
de comparacin del tamao real de los frutos. El conjunto de caractersticas est formado
por las caractersticas de color, de textura y de forma, es decir que se tienen 208 caractersticas. Se inicia la seleccin con la eliminacin de las que son linealmente dependientes.
Estas caractersticas son una combinacin lineal de otra u otras y por tanto no ofrecen informacin adicional. Eliminando las linealmente dependientes el conjunto queda reducido
a 171 caractersticas.

Se utilizaron dos mtodos de seleccin de caractersticas. Usando el ndice de Fisher y usando el mtodo de anlisis multivariado. El ndice de Fisher mide la capacidad de
discriminacin de cada caracterstica para todas las 11 clases. El anlisis multivariado, entrega las caractersticas ms discriminantes para dos clases. Es decir que el anlisis se hace
clase a clase, una clase con cada una de las clases restantes. En nuestro caso que son 11 clases se obtienen 110 conjuntos de caractersticas uno para cada clase con cada una de las 10
clases restantes. Fisher hace anlisis univariado, mide la discriminacin de la caracterstica
independientemente, y el otro mtodo es un anlisis multivariado, donde se observan las
caractersticas en conjunto. Es ms confiable hacer el anlisis multivariado, pero el mtodo
que se est utilizando escoge las caractersticas para clasificadores clase contra clase, lo que

39
requerira un clasificador clase contra clase. Como son 11 clases se necesitaran 110 clasificadores biclase. Lo que aumentara la complejidad del clasificador y el tiempo de ejecucin.
Entonces se va a utilizar el resultado de los dos mtodos para escoger las caractersticas del
clasificador final.
Comparacin de los mtodos de seleccin
Para evaluar la reduccin de las caractersticas se toma el error de clasificacin variando la dimensin del conjunto de caractersticas resultado de cada uno de los mtodos.
Se utiliza el mismo clasificador Bayesiano en las diferentes pruebas para comparar los resultados.
Fisher
En la Figura 3.5, se muestran los valores de los ndices de Fisher para las 171 caractersticas. Es evidente que unas tienen alta informacin discriminante mientras que la
mayora no. Se organizaron las caractersticas de mayor a menor segn el ndice de
Fisher, como se muestra en la Figura 3.6, menos de la mitad tienen un ndice representativo. En la Figura 3.7 se muestran las respectivas etiquetas de las caractersticas,
las caractersticas estn etiquetadas segn el siguiente orden textura, forma y color.

Figura 3.5: ndice de Fisher para las caractersticas

40

Figura 3.6: ndice de Fisher en orden descendente


En la tabla 3.3.3 se enumeran las 20 mejores caractersticas segn el ndice de Fisher.

Figura 3.7: Caractersticas en orden descendente segn Fisher

41

Tabla 3.5: Las 20 mejores caractersticas segn ndice de Fisher.


#

Etiqueta

Caracterstica

27

Momento de diferencia de orden k componente B

Momento de diferencia de orden k componente R

171

Media componente I3 de OHTA

163

Media componente Q de YIQ

Homogeneidad local componente R

16

Momento de diferencia de orden k componente G

19

Homogeneidad local componente G

83

Amplitud de los 36 descriptores de Fourier 2

17

Momento inverso de diferencia de orden k componente G

10

158

Media componente H de HSI

11

167

Media componente RG de Colores Oponentes

12

82

Amplitud de los 36 descriptores de Fourier 1

13

Momento inverso de diferencia de orden k componente R

14

30

Homogeneidad local componente B

15

25

Contraste componente B

16

155

Media componente R de RGB

17

11

Tendencia de Cluster componente R

18

28

Momento inverso de diferencia de orden k componente B

19

166

Media componente Cr de YCbCr

20

10

Directividad componente R

42
En la figura 3.8 se presenta el error de clasificacin al variar el tamao del conjunto de
caractersticas. Se increment la dimensin del conjunto de caractersticas en orden
segn el ndice de Fisher, desde la ms discriminante hasta evaluar el clasificador con
todas las caractersticas. Con una caracterstica el error est cerca al 55 %, con nueve
caractersticas alcanza el 10 %, entre 10 y 16 caractersticas alcanza el menor error
entre 7 y 10 %. En la figura 3.9 se muestra el tiempo requerido para la clasificacin
aumentando la dimensin del conjunto de caractersticas. El tiempo requerido para la
clasificacin aumenta suavemente en forma exponencial a medida que se aumenta el
tamao del conjunto de caractersticas. Cuando se evala con todas las caractersticas
se necesitan 3 segundos para la clasificacin.

Figura 3.8: Error de Clasificacin variando la dimensin del conjunto de caractersticas

43

Figura 3.9: Tiempo de Clasificacin variando la dimensin del conjunto de caractersticas

44

Tabla 3.6: Clasificacin usando las caractersticas seleccionadas con Fisher.


Nmero de caractersticas

Error de clasificacin ( %)

tiempo (s)

56.75

0.00191

47.14

0.00175

28.57

0.00223

17.79

0.00261

18.31

0.00298

14.41

0.00349

14.8

0.00394

9.87

0.00449

10.12

0.00516

10

9.87

0.00573

11

9.22

0.00646

12

11.42

0.00735

13

9.87

0.00798

14

9.35

0.00885

15

11.55

0.0098

16

9.09

0.01078

17

9.87

0.01167

18

11.16

0.01283

19

10.9

0.01385

20

10.77

0.01569

45
Anlisis Multivariado
El mtodo de anlisis multivariado selecciona un conjunto de caractersticas adecuado para separar dos clases. Como son 11 clases con el mtodo multivariado se
obtienen 110 grupos de caractersticas de diferentes tamaos uno para cada clase con
respecto a cada una de las otras 10 clases. En muchos casos una caracterstica separa
bien varias clases osea que aparece en varios grupos. Se ordenaron las caractersticas
de tal forma que las primeras son las mejores de cada grupo y luego se van ubicando
las otras sucesivamente hasta ordenar todas las caractersticas de los 110 grupos. El
conjunto total de la seleccin usando el mtodo multivariado comprende 54 caractersticas de las 171. En la tabla 3.7 se listan las 20 mejores caractersticas obtenidas
con el mtodo multivariado.

46

Tabla 3.7: Las 20 mejores caractersticas segn anlisis multivariado


#

Etiqueta

Caracterstica

83

Amplitud de los 36 descriptores de Fourier 2

27

Momento de diferencia de orden k componente B

28

Momento inverso de diferencia de orden k componente B

155

Media componente R de RGB

Momento de diferencia de orden k componente R

159

Media componente S de HSI

17

Momento inverso de diferencia de orden k componente G

Homogeneidad local componente R

13

Uniformidad componente G

10

82

Amplitud de los 36 descriptores de Fourier 1

11

167

Media componente RG de Colores Oponentes

12

171

Media componente I3 de OHTA

13

15

Correlacin componente G

14

162

Media componente I de YIQ

15

158

Media componente H de HSI

16

18

Mxima probabilidad componente G

17

20

Varianza componente G

18

Varianza componente R

19

165

media componente Cb de YCbCr

20

19

Homogeneidad local componente G

47
En la figura 3.10 se muestra el error de clasificacin obtenido al aumentar la dimensin del conjunto de caractersticas ordenadas. Con una caractersticas se obtiene un
error del 50 %, con seis caractersticas se alcanza un error del 10 %, con 11 caractersticas se logra el menor error de 7 %. El tiempo de clasificacin se presenta en la
figura 3.11. El tiempo presenta un crecimiento exponencial suave a medida que se
incrementa la dimensin del espacio de caractersticas.

Figura 3.10: Error de Clasificacin variando la dimensin del conjunto de caractersticas

48

Figura 3.11: Tiempo de Clasificacin variando la dimensin del conjunto de caractersticas

49
Como se utilizaron dos mtodos para la seleccin de caractersticas, uno univariado
y otro multivariado, se tom de cada mtodo el conjunto de caractersticas con el que se
obtuvo el menor error de clasificacin. Es decir, las primeras 16 caractersticas segn el
ndice de Fisher y las 11 caractersticas del mtodo multivariado. Luego, se compararon
y se escojieron las caractersticas que aparecen en los dos conjuntos. El resultado de esta
seleccin mostr que ocho caractersticas aparecen tanto en la seleccin con Fisher como
usando el mtodo multivariado, estas caractersticas se presentan el la tabla 3.8.
Tabla 3.8: Las ocho caractersticas seleccionadas con los dos mtodos utilizados
Etiqueta

Caractersticas

Tipo

27

Momento de diferencia de orden k componente B

Textura

Momento de diferencia de orden k componente R

Textura

Homogeneidad local componente R

Textura

83

Amplitud de los 36 descriptores de Fourier 2

Forma

17

Momento inverso de diferencia de orden k componente G

Textura

167

Media componente RG de Colores Oponentes

Color

82

Amplitud de los 36 descriptores de Fourier 1

Forma

155

Media componente R de RGB

Color

Las caractersticas 28, 171, 158 estn dentro de las 20 mejores caractersticas para
los dos mtodos de seleccin, pero no coinciden dentro de las caractersticas que dan el
menor error. Se probaron estas caractersticas para ver si se mejoraba la clasificacin adicionando alguna de ellas. En la tabla 3.9 se presentan los resultados obtenidos. Como se
puede observar el menor error de clasificacin se obtiene cuando se toman las 8 caractersticas coincidentes ms la caracterstica 171. Se mejor la clasificacin adicionando la
caracterstica 171, este resultado se esperaba ya que esta caracterstica presenta uno de los
ndices de Fisher ms altos.

50
Tabla 3.9: Error de clasificacin adicionando otras caractersticas.

3.4.

caractersticas

error

tiempo ms

8 coincidentes

9.7013

3.7

8 y 28

9.4156

4.0

8 y 171

7.5844

4.3

8 y 158

9.5455

4.4

8 y 28 y 171

8.5714

4.9

8 y 28 y 158

9.1558

4.8

8 y 171 y 158

8.7532

4.9

8 y 28 y 171 y 158

8.4286

5.4

Anlisis de las caractersticas seleccionadas


El espacio caracterstico final es de dimensin nueve y est dividido en once subes-

pacios. Con el nimo de mostrar el espacio caracterstico se presentan los valores medios
de cada subespacio en la tabla 3.4, y la varianza de los datos de cada subespacio en la tabla
3.4.

51
Tabla 3.10: La media multiplicada por 100 de las caractersticas seleccionadas
27

83

17

167

82

155

171

Media 1

23.29

22.33

80.73

27.62

78.60

22.69

31.24

22.17

73.58

Media 2

19.13

19.55

88.33

93.14

82.36

13.24

92.52

29.33

86.16

Media 3

76.55

75.65

27.06

66.41

27.76

30.66

67.27

55.95

69.12

Media 4

78.15

75.99

26.91

29.09

28.34

32.68

27.02

55.98

71.79

Media 5

82.25

77.65

30.87

47.20

23.29

70.14

46.54

88.69

45.15

Media 6

75.69

73.77

27.72

50.79

29.25

85.92

49.21

77.35

20.16

Media 7

45.59

42.63

48.11

35.95

59.93

66.52

36.83

48.19

30.29

Media 8

45.73

45.11

46.95

34.26

59.05

54.86

36.30

36.16

35.32

Media 9

45.73

44.39

56.42

52.27

14.27

54.10

48.76

26.11

38.98

Media 10

50.05

53.37

38.95

45.41

39.91

51.28

43.14

25.70

36.82

Media 11

43.88

43.19

54.98

47.06

26.33

50.83

49.41

22.06

36.39

Tabla 3.11: La varianza multiplicada por 100 de las caractersticas seleccionadas


27

83

17

167

82

155

171

Varianza 1

0.146

0.077

0.431

0.225

0.293

0.154

0.311

0.099

0.187

Varianza 2

0.028

0.013

0.098

0.086

0.211

0.236

0.129

0.768

0.090

Varianza 3

0.064

0.073

0.007

0.820

0.041

0.048

0.654

0.440

0.264

Varianza 4

0.063

0.042

0.003

0.035

0.016

0.839

0.043

0.79

0.597

Varianza 5

0.089

1.012

1.703

0.182

0.187

2.519

0.191

0.205

3.222

Varianza 6

0.137

0.127

0.014

0.150

0.052

0.240

0.090

0.655

0.109

Varianza 7

0.443

0.500

0.176

0.122

0.318

0.240

0.157

0.528

0.095

Varianza 8

0.338

0.351

0.109

0.109

0.217

0.321

0.105

0.337

0.089

Varianza 9

1.239

1.178

2.738

0.198

0.435

0.143

0.272

0.203

0.074

Varianza 10

0.621

0.873

0.380

0.146

1.100

0.036

0.117

0.236

0.016

Varianza 11

1.337

2.337

2.991

0.232

1.662

0.018

0.184

0.133

0.018

Captulo 4

Clasificacin
4.1.

Clasificadores

4.1.1.

Estadstico
Los mtodos estadsticos se fundamentan en la regla de Bayes del mnimo error

[10]. Esta regla concluye que un objeto, con unas caractersticas determinadas, pertenece
a una clase si la probabilidad de pertenecer a sta clase es mayor que la probabilidad de
pertenecer a cualquier otra clase. En el anexo B, se presenta una explicacin detallada de
esta tcnica de clasificacin. El clasificador bayesiano es un clasificador biclase, es decir
que separa el espacio de caractersticas slo en dos subconjuntos. Por lo tanto el clasificador implementado utiliza once clasificadores bayesianos, uno para separar cada clase de
todas las dems. Para cada clasificador se definen la funcin de probabilidad p( wmi ) y La
probabilidad a priori P (wi ). En las aplicaciones prcticas, las funciones de probabilidad no
se conocen y por lo tanto se deben estimar. Para estimarlas, primero se asume la forma de
la funcin de probabilidad, y luego se hallan sus parmetros a partir del conjunto de entrenamiento. En este caso, se supone que las funciones de probabilidad de las clases estn
descritas por distribuciones normales o gausianas como se muestra en la ecuacin (B.4),
p(

wk
1
12
)=
(X i )T (Ci )1 (X i )
d
1 e
m
(2) 2 kCi k 2
53

(4.1)

54
donde d es la dimensin del vector de caractersticas, i es el vector d dimensional
que contiene la media de las caractersticas en una clase wi , Ci es la matriz de covarianza.
Para obtener p( wmi ), slo se necesita reemplazar los parmetros i , Ci . Estos parmetros
pueden ser estimados a partir del conjunto de muestras. La probabilidad a priori P (wi )
tambin se puede hallar del conjunto muestral. Por lo tanto el criterio de clasificacin,
ecuacin (B.3), se determina en forma analtica.

4.1.2.

Usando redes neuronales


Se implement un clasificador usando once redes neuronales (el funcionamiento de

las redes neuronales se presenta en el anexo B). Cada red es un clasificador biclase que
separa una clase de todas las dems. Las once redes tienen igual estructura. Cada una de
stas es una red neuronal multicapa conformada de la siguiente manera: una capa de entrada
con 9 neuronas, dos capas ocultas con 15 y 7 neuronas respectivamente, una capa de salida
con una neurona. sta estructura se escogi con el mtodo de prueba y error. La entrada es el
vector caracterstico de cada imagen, conformado por las 9 caractersticas seleccionadas en
el captulo anterior. Las funciones de transferencia son funciones sigmoidales. Se entren
durante 300 iteraciones y se tom como umbral del error 1x1010 . Se utiliz el algoritmo
Backpropagation Levenberg y Marquardt para entrenar la red [9]. Este algoritmo utiliza
tcnicas numricas para la optimizacin, minimiza la suma de los cuadrados del error, y
actualiza los pesos de acuerdo a (4.2),
wjk (n + 1) = wjk (n) [J T J I]1 J T k (n)

(4.2)

donde, J es la matriz Jacobiana que contiene las derivadas primeras de los errores
de la red con respecto a los pesos y es un escalar que determina la velocidad de entrenamiento.

4.1.3.

Clustering
El clasificador que se implement es el Clustering k medias que agrupa las muestras

en 11 grupos y ubica el centro de cada grupo, tal que se minimice la distancia entre las

55
muestras y el centro. El algoritmo Clustering k medias se explica con detalle en el anexo B.
Como es una metodologa de reconocimiento de patrones no supervisada, los valores de los
centros se obtienen siguiendo el algoritmo que se muestra en el anexo B. Para empezar hay
que definir cuatro varariables: nmero de muestras de entrenamineto (n), nmero de clases
(k = 11), los centros de las once clases ci se inicializan aleatoriamente, y los valores de las
funciones de pertenencia uij se inicializan aleatoriamene.

4.2.

Evaluacin
Por medio de este experimento se desea evaluar el desempeo de las tcnicas de

clasificacin usadas. La variable de evaluacin es el error de clasificacin. Los estimadores


de error calculan la proporcin de imgenes etiquetados incorrectamente por el clasificador.
Se utilizar la siguiente funcin indicadora () (4.3),

(Im, clase) = {

1 si d(Im) 6= clase
0 si d(Im) = clase

(4.3)

donde d es el clasificador, Im es la imagen de entrada y clase es la clase a la que


pertenece la imagen de entrada.

Para estimar el error se utiliz el mtodo de validacin cruzada (10-fold) [27], [36].
Para la estimacin del error se usa el conjunto de muestras disponible, el cual se divide en
el conjunto de entrenamiento y el de prueba. El clasificador se disea usando las muestras
de entrenamiento y luego se evala obteniendo el error de clasificacin para las muestras de
prueba. Con base en el error obtenido se puede predecir el desempeo del clasificador ante
nuevas muestras. Para obtener una medida confiable del desempeo el conjunto de muestras
debe ser lo suficientemente grande y, los conjuntos de entrenamiento y de prueba deben ser
independientes.

56

4.2.1.

Mtodos de evaluacin

Mtodo de validacin cruzada


En la tcnica de validacin cruzada, los elementos del grupo total de muestras
T , se divide aleatoriamente en V conjuntos disjuntos T1 , T2 , ...TV de un tamao similar
(Ti

T
V

i = 1, 2, ..., V ).

El procedimiento puede plantearse como sigue:


Para todo v, v = 1, 2, ..., V, se construye un clasificador usando T Tv , como conjunto de aprendizaje. Sea dv el clasificador construido as. Como ninguno de los
elementos del grupo de Tv se ha usado para construir dv , el estimador de error para
dv se hace mediante el conjunto de prueba Tv , as:

Error(dv ) =

1
Tv

(Ima, clase)

(4.4)

(Ima,clase)Tv

donde se evala sobre dv . Al finalizar este paso obtenemos V clasificadores, dv ,


con sus correspondientes estimaciones de error, Error(dv ) (4.4).
Formalmente, el estimador por validacin cruzada con V conjuntos, Error(d), se
calcula con (4.5),

Error(d) =

4.2.2.

V
1 X
Error(dv )
V v=1

(4.5)

Diseo del experimento y resultados


El conjunto total de muestras con el que se dispone est conformado por 300 mues-

tras de cada una de las 11 clases, es decir, 3300 muestras. Se van a evaluar las tres tcnicas
de clasificacin usando validacin cruzada. Los grupos de muestras para la validacin se
escogen aleatoriamente. Se hicieron 20 pruebas para analizar el comportamiento de los clasificadores. En la Figura 4.1, se muestra el porcentaje de error promedio obtenido en 9

57
pruebas al evaluar las tres tcnicas de clasificacin. En la Figura 4.2, se presenta el correspondiente tiempo promedio tanto para el entrenamiento como para la prueba.

Figura 4.1: Porcentaje de error de los clasificadores.

Figura 4.2: Tiempo de procesamiento por muestra.

58
Los errores parciales obtenidos con validacin cruzada de los mejores clasificadores
de cada una de las tcnicas se muestran en la tabla 4.1. El error de clasificacin promedio
total para cada una de las tres tcnicas se presenta en la Tabla 4.2.

Tabla 4.1: Error de clasificacin promedio


Error Bayes( %)

Error Redes Neuronales( %)

Error Difuso( %)

4.5455

7.2727

16.3636

3.6364

2.7273

16.3636

8.1818

8.1818

20.9091

3.6364

13.6364

16.3636

5.4545

9.0909

13.6364

6.3636

3.6364

16.3636

2.7273

9.0909

14.5455

6.3636

8.1818

21.8182

3.6364

3.6364

20.0000

10

2.7273

4.5455

14.5455

Tabla 4.2: Error de clasificacin promedio


Error de clasificacin ( %)
Bayesiano

5.4364

Redes Neuronales

7.4646

Difuso

19.4636

Captulo 5

Resultados
5.1.

Anlisis de los resultados


La informacin de la prueba se dispone en una matriz de confusin. El anlisis de

los clasificadores se hace con base en la matriz de confusin de dnde se obtienen algunos
indicadores de desempeo, como se describe a continuacin.

5.1.1.

Matriz de confusin
La matriz de confusin es una herramienta utilizada para la presentacin y el anli-

sis del resultado de una clasificacin. Es una matriz cuadrada cuyo orden es el nmero de
clases. En las columnas se presentan las clases reales mientras que en las filas se presentan
las clases asignadas por el clasificador. Por ejemplo, en la Tabla 5.1 se presenta la matriz de
confusin para un clasificador de dos clases.
Tabla 5.1: Matriz de confusin. Clasificador de dos clases
Clase 1 (real)

Clase 2 (real)

Clase 1 (obtenida)

Verdaderos clase 1

Falsos clase 1

Clase 2 (obtenida)

Falsos clase 2

Verdaderos clase 2

60

61
La suma vertical muestra la distribucin real de las clases, mientras que la suma
horizontal muestra la distribucin de las clases producida por el clasificador.

Se cambia la notacin de la matriz de confusin como se muestra en la Tabla 5.2


para facilitar la definicin de las mtricas de desempeo.

Tabla 5.2: Matriz de confusin.


Verdadero

Falso

Verdadero

Verdadero Positivo (VP)

Falso Positivo (FP)

Falso

Falso Negativo (FN)

Verdadero Negativo (VN)

Con base en la matriz de confusin 5.2 fcilmente se obtienen los siguientes indicadores:
Proporcin de verdaderos positivos: P V P =
Proporcin de falsos negativos: P F N =

VP
(V P +F N ) .

FN
(V P +F N ) .

Valor predictivo positivo: V P P =


Valor predictivo negativo: V P N =

FP
(V N +F P ) .

VP
(V P +F P ) .

(error positivo).

VN
(V N +F P ) .

Proporcin de verdaderos negativos: P V N =


Proporcin de falsos positivos: P F P =

(efectividad).

(especificidad).

(error negativo).

(precisin).

VN
(V N +F N ) .

Clasificador bayesiano
En la tabla 5.3 se muestra la matriz de confusin para el mejor clasificador bayesiano al evaluar 100 imagenes. Como se puede ver, se obtiene una buena clasificacin en las
primeras etapas pero no tanto para las dems. Principalmente hay alto error, casi del 10 %
en las etapas intermedias.

62
Tabla 5.3: Matriz de confusin. Clasificador Bayesiano
1

10

11

Total

100

100

100

100

100

100

100

100

95

12

107

88

93

92

16

108

83

91

99

103

10

97

102

11

94

96

Total

100

100

100

100

100

100

100

100

100

100

100

1100

Observando la tabla 5.4, donde se muestran los parmetros de desempeo obtenidos con
base en la matriz de confusin, se puede concluir que el clasificador bayesiano tiene efectividad por encima del 90 % en todas las clases excepto en las clases 6 y 8. Pero tiene mejores
resultados en cuanto a la especificidad ya que los valores speran el 98 % en todas las clases.
En cuanto al error, tiene menor error negativo que positivo. Y la precisin en la mayora de
las clases es del 100 % pero en las clases 5, 6, 7 y 8 la precisin es menor cercana al 90 %.

63

Tabla 5.4: Indicadores de desempeo. Clasificador Bayesiano

10

11

PVP

1.0

1.0

1.0

1.0

0.95

0.88

0.92

0.83

0.99

0.97

0.94

PFN

0.050

0.12

0.080

0.17

0.010

0.030

0.060

PVN

1.0

1.0

1.0

1.0

0.99

1.0

0.98

0.99

1.0

1.0

1.0

VFP

0.012

0.0050

0.016

0.0080

0.0040

0.0050

0.0020

VPP

1.0

1.0

1.0

1.0

0.89

0.95

0.85

0.91

0.96

0.95

0.98

VPN

1.0

1.0

1.0

1.0

0.99

0.99

0.99

0.98

1.0

1.0

0.99

Clasificador usando redes neuronales


En la tabla 5.5 se muestra la matriz de confusin para el mejor clasificador usando
redes neuronales al evaluar 100 imagenes. Como se puede ver, se obtiene una buena clasificacin en las primeras etapas pero no tanto para las dems. Principalmente hay alto error en
las etapas finales. Observando la tabla 5.6, donde se muestran los parmetros de desempeo
obtenidos con base en la matriz de confusin, se puede concluir que el clasificador usando
redes neuronales tiene efectividad por encima del 90 % en todas las clases excepto en las
clases 7, 8 y 10 donde la efectifidad es mucho menor al rededor del 80 %. En cuanto a la
especificidad tiene muy buen desempeo ya que los valores superan el 98 % en todas las
clases. As como en el error bayesiano, tiene menor error negativo que positivo. En general
el clasificador con redes tiene menor presicin que el clasificador bayesiano, ya que sus
valores estn cercanos al 90 % en la mayora de las etapas excepto en la etapa 7 y 8.

64

Tabla 5.5: Matriz de confusin. Clasificador usando Redes Neuronales


1

10

11

Total

100

100

98

99

99

102

100

101

91

98

95

103

81

14

97

13

85

102

95

99

10

85

94

11

94

105

Total

100

100

100

100

100

100

100

100

100

100

100

1100

Tabla 5.6: Indicadores de desempeo. Clasificador usando Redes Neuronales

10

11

PVP

1.0

0.98

0.99

1.0

0.91

0.95

0.81

0.85

0.95

0.85

0.94

PFN

0.020

0.010

0.090

0.050

0.19

0.15

0.050

0.15

0.060

PVN

1.0

1.0

1.0

1.0

0.99

0.99

0.98

0.98

1.0

0.99

0.99

VFP

0.0010

0.0030

0.0010

0.0070

0.0080

0.016

0.017

0.0040

0.0090

0.011

VPP

1.0

0.99

0.97

0.99

0.93

0.92

0.84

0.83

0.96

0.90

0.90

VPN

1.0

1.0

1.0

1.0

0.99

0.99

0.98

0.98

1.0

0.99

0.99

65
En la tabla 5.7 se muestra la matriz de confusin para el mejor clasificador usando
clustering difuso al evaluar 100 imagenes. Como se puede ver, hay alto error de clasificacin
en general en para todas las clases pero especialmente en las clases finales. Observando la
tabla 5.8, donde se muestran los parmetros de desempeo obtenidos con base en la matriz
de confusin, se puede concluir que el clasificador clustering difuso tiene efectividad por
encima del 90 % solo en cuatro clases las dems estan muy por debajo especialmente en las
clases 5 y 11. Al igual que en los otros clasificadores tiene mejor desempeo en cuanto a
la especificidad, ya que sus valores estn por encima del 96 % en todas las clases. Segn el
indicador de error el clasificador difuso tiene mayor error positivo y negativo que las otras
tcnicas.
Tabla 5.7: Matriz de confusin. Clasificador Difuso
1

10

11

Total

99

99

100

100

99

100

97

104

62

66

34

100

134

89

17

106

81

97

67

13

26

106

10

77

30

112

11

32

41

76

Total

100

100

100

100

100

100

100

100

100

100

100

1100

66
Tabla 5.8: Indicadores de desempeo. Clasificador Difuso

10

11

PVP

0.99

1.0

0.99

0.97

0.62

1.0

0.89

0.81

0.67

0.77

0.41

PFN

0.010

0.010

0.030

0.38

0.11

0.19

0.33

0.23

0.59

PVN

1.0

1.0

1.0

0.99

1.0

0.97

0.98

0.98

0.96

0.97

0.97

VFP

0.0010

0.0070

0.0040

0.034

0.017

0.016

0.039

0.035

0.035

VPP

1.0

1.0

0.99

0.93

0.94

0.75

0.84

0.84

0.63

0.69

0.54

VPN

1.0

1.0

1.0

1.0

0.96

1.0

0.99

0.98

0.97

0.98

0.94

5.1.2.

Curvas ROC
El espacio ROC (Receiver Operating Characteristic) define un sistema de coorde-

nadas usadas para visualizar el desempeo del clasificador. Las curvas ROC, presentan el
compromiso entre efectividad y la especificidad del clasificador, algn aumento en la sensibilidad est acompaado por un decremento en la especificidad. Es decir, las curvas ROC
muestran la relacin entre las muestras clasificadas adecuadamente (PVP, Proporcin de
Verdaderos Positivos) y las muestras que no pertenecen a la clase pero se clasificaron como
si lo fueran (PFP Proporcin de Falsos Positivos). En el espacio ROC la PFP se dibuja como
variable independiente y la PVP como variable dependiente. Cada clasificador es representado por el punto (PFP, PVP). Los puntos (0, 0) y (1, 1) se conocen como los clasificadores
triviales, representan respectivamente, el clasificador que clasifica todo como negativo y el
clasificador que clasifica todo como positivo.

Para dibujar la curva ROC se construye la lnea convexa formada por los puntos
(PFP, PVP) de los clasificadores que se estn evaluando, junto con los puntos de los clasificadores triviales (0,0) y (1,1). La curva ms cercana a los bordes izquierdo y superior en el
espacio ROC, es la prueba ms acertada porque significa que hay mayor acierto. La curva

67
que ms se acerque al la diagonal de 45 grados en el espacio ROC, es la prueba menos acertada. El mejor sistema de entrenamiento es el que produce un conjunto de clasificadores
que maximice el rea bajo la curva (AUC, Area Under Curve) ROC.

En la figura 5.1, se graficaron las curvas ROC para las tres tcnicas de clasificacin. Como se explic anteriormente, la mejor tcnica de clasificacin segn el anlisis con
curvas ROC es la que tenga mayor rea bajo la curva. Por lo tanto, el mejor clasificador
es el bayesiano, con un rea de 0.974, seguido por el clasificador usando redes neuronales,
con un rea similar de 0.9617, y el peor clasificador segn las curvas ROC es el clustering
difuso, cuya rea es 0.906.

Figura 5.1: Curva ROC para los clasificadores.

Captulo 6

Conclusiones
En un sistema de visin artificial, la adquisicin determina la sencillez o complejidad de las siguientes etapas, y por tanto define el logro de los objetivos. Si el sistema de
visin artificial se basa en la extraccin de las caractersticas externas del objeto, como son
forma y tamao, entonces durante la adquisicin se deben evitar en la imagen dos defectos: las sombras y los brillos. Las sombras aparecen cuando hay una ubicacin errnea de
las fuentes de iluminacin, o tambin resultan de una iluminacin parcial producida por la
escasez de fuentes de luz. Los brillos se presentan cuando la luz incidente sobre el objeto
es muy directiva. Los dos defectos se evitan con la ubicacin de mnimo cuatro fuentes
de luz (una por cada punto cardinal), puestas a una distancia considerable y cuya luz emitida sea difuminada ya sea reflejndola sobre una superficie adecuada o retractndola al
pasarla por un filtro. Si el inters del objeto de estudio est en sus caractersticas internas,
como son color y textura, entonces se debe procurar mantener constantes la intensidad y
el color de la iluminacin, ya que el color que se percibe de un objeto es la parte de la
luz incidente que el objeto no absorbe. En aplicaciones en ambientes naturales e incluso en
ambientes protegidos es muy difcil mantener las mismas condiciones, por esta razn el sistema de adquisicin debe ser lo suficientemente especfico como para resolver la aplicacin
en particular pero adems debe ser lo ms general posible para considerar las variaciones
comunes.

69

70

Para describir la madurez de un fruto de caf se utilizaron las propiedades de color, tamao, forma y textura obtenindose 208 caractersticas. Usando dos algoritmos de
seleccin se redujo el conjunto a 9 caractersticas. Las caractersticas seleccionadas corresponden a 4 caractersticas de textura, tres de color y dos de forma. Caractersticas como
la textura y la forma de un fruto de caf aportan poca informacin en la clasificacin manual pero proporcionan medidas discriminantes en aplicaciones computacionales donde se
pueden obtener valores exactos. Segn la seleccin, las caractersticas de textura aportan
mayor informacin discriminante que las de color, demostrando que para la separacin lo
mejor no es slo el valor del color sino tambin su distribucin en la superficie del fruto.
Las caractersticas de forma seleccionadas contienen la informacin de baja frecuencia con
la cual se reconoce el cambio en la redondez. La mejor caracterstica de color corresponde
a una componente del modelo de colores oponentes mostrando una mejor representacin
del color en otros modelos diferentes a los comnmente utilizados RGB y HSI.

El conjunto de las 9 caractersticas seleccionadas se utiliz como entrada a tres


tcnicas de clasificacin diferentes. De las tres tcnicas, se obtuvo el menor error con el
clasificador bayesiano, aproximadamente del 5 %, pero requiri el mayor tiempo de clasificacin, cerca de 5.5 m s. Con el clasificador usando redes neuronales aument el error de
clasificacin, aproximadamente al 7 %, pero disminuy el tiempo de clasificacin a 0.8 ms.
Usando la tcnica de clustering difuso el error es alto, cerca del 19 %, pero es una tcnica
rpida ya en la clasificacin requiere menos de 0.1ms. El clasificador Bayesiano es una tcnica de clasificacin sencilla, tiene pocos parmetros que se pueden obtener con un anlisis
cuidadoso de la informacin estadstica de las muestras. El clasificador con redes neuronales es una tcnica ms compleja ya que requiere la asignacin de muchos parmetros y
como no hay un algoritmo especfico para la seleccin de estos, se produce incertidumbre
en cuanto al ptimo funcionamiento del clasificador. Sin embargo, ofrece ventajas tales como: capacidad para aprender de los patrones, separacin de clases que no son linealmente

71
separables, robustez ante datos ruidosos, adaptabilidad, procesamiento paralelo, entre otras.
El clasificador clustering difuso por ser una tcnica no supervisada su entrenamiento es sencillo pero requiere la inicializacin de dos conjuntos de parmetros como son: las funciones
de pertenencia y los centros de los grupos. En las pruebas realizadas se concluy que la
inicializacin de estos parmetros afectaba el resultado, por tanto es recomendable cambiar
de la asignacin aleatoria a otra tcnica.

El clasificador bayesiano tiene mejor desempeo segn las dos tcnicas utilizadas
para la comparacin de los clasificadores como son: indices de desempeo usando la matriz
de confusin y las curvas ROC. Con base en los ndices de desempeo obtenidos con la
matriz de confusin el clasificador bayesiano presenta mayor efectividad, especificidad y
precisin, adems de menor error. Y analizando los clasificadores con las curvas ROC, el
clasificador bayesiano exhibe mayor compromiso entre efectividad y especificidad.

Bibliografa
[1] Alvarez J. Mtodo para calcular la relacin cereza - pergamino en el beneficio del caf.
Cenicaf. Chinchin. 1997.
[2] Arcila J, Buhr L, Bleiholder H, Hack H, Wicke H. Aplicacin de la escala BBCH ampliada para la descripcin de las fases fenolgicas del desarrollo de la planta de caf.
Boletn tcnico Cenicaf. Colombia. No 23:1-32. 2001.
[3] Bulanon D, Kataoka T, Ota Y, Hiroma T. A machine Vision System for the Apple
Harvesting Robot. Agricultural Engineering International: the CIGR Journal of Scientific
Research and Development. Manuscript PM 01 006. Vol.III.
[4] Chalarc J. Vida y hechos del caf en Colombia. Bogot(Colombia). 1998.
[5] Cheung-Wai J. Texture Features For Land Cover Change Detection At 250m Resolution. Laboratory for Global Remote Sensing Studies, Department of Geography, University of Maryland, 2000.
[6] Cocquerez J, Philipp S. Analyse DImages Filtrage et Segmentation, Ed. Masson.
[7] Daza G, Sanchez L. PCA, KPCA y MANOVA sobre seales de voz en imgenes de
posturas labiales y audio. Tesis de Pregrado. Universidad Nacional de Colombia Sede
Manizales Facultad de Ingeniera y Arquitectura Departamento de Electricidad, Electrnica y Computacin. Manizales. 2004.
[8] Delgado A. Inteligencia Artificial y Minirobots. Bogot. 1998.
72

73
[9] Daz R, Figueredo J. Optimizacin del problema inverso en Geofsica usando el algoritmo de entrenamiento de Levenberg - Marquardt. Departamento de Geociencias.
Universidad Nacional de Colombia. 2002.
[10] Duda R, Hart P, Stork D. Pattern Classification. John Wiley and Sons. USA. 1998.
[11] Escobar G. Una concepcin gerencial de la caficultura. Servicio nacional de aprendizaje. Bogot (Colombia). 1992.
[12] Federacion Nacional de Cafeteros de Colombia. Beneficio Ecolgico del caf. Cenicaf. Chinchin (Colombia). 1999.
[13] Fondo cultural cafetero. Por los senderos del caf de la gran bonanza a la peor crisis
1975-1993. Bogot. 1994.
[14] Fundacin pro imagen de Colombia en el exterior. Repblica de Colombia. Colombia.
1995.
[15] Ghazanfari A, Irudayaraj J, Kusalik A, Romaniuk M. Machine Vision Grading of
Pistachio Nuts Using Fourier Descriptors. J. Agric. Engng Res. 68, 247-252. 1997.
[16] Gmez D, Allende M. Reconocimiento de Formas y Visin Artificial. Addison-Wesley
Iberoamericana. Wilmington, E.U.A.. 1994.
[17] Gonzales R, Woods R. Tratamniento Digital de imgenes. Addison-Wesley/daz de
Santos. 1996.
[18] Guizard C, Gravoueille J, Crochon M. Automating potato sorting system using color
machine vision. In: Sensoral 98 Colloque international sur les capteurs de qualit des
produits agro alimentaires. Montpellier. 24-27 fvrier 1998. Cemagref Editions, antony.
pag. 185-197. 1998.
[19] Hayashi S, Sakaue O, Kanuma T. Study on tomato harvesting robot. International symposium on fruit, nut and vegetable production engineering, 5. Davis, California (Estados
Unidos). September 3-10. 1997.

74
[20] Hwie P. Analog and Digital Communications. McGraw Hill.
[21] Jayas D, Paliwal J, Visen N. Multilayer neural network for image analysis of agricultural products. J. Agric. Engng Res. 77(2), 119-128. 2000.
[22] Klette R, Gimel G. COMPSCTI. 375 FT. Citr Tamaki.
[23] Kondo N, Nishitsuji Y, Ling P,Ting K. Visual feedback guided Robotic Cherry Tomato
Harvesting. Transactions of the ASAE. Vol.39(6):2331-2338. 1996.
[24] Maxwell J. Theory of the perception of colors. Trans. R. Scottish Soc. Arts. vol.4.
394-400. 1856.
[25] Maya C, Montes N, Osorio G, Prieto F, Angulo F. Deteccin y caracterizacin de frutos de caf empleando procesamineto digital de imgenes. Inteligencia Computacional
(Memorias). Medellin. Agosto de 2001.
[26] Molto E, Blasco J, Escuderos V, Garca J, Daz R, Blasco M. Automatic inspection of
olives using computer vision. In: Sensoral 98 Colloque international sur les capteurs de
qualit des produits agro-alimentaries, Montpellier, 24-27 fvrier 1998.
[27] Moore A. Cross-validation for detecting and preventing overfitting. School of Computer Science Carneigie Mellon University. 2001.
[28] Norris C. Harvesting. Coffee growing in Australia - A machine harvesting perspective.
Rural industries research an development corporation. pag 79-101. 1995.
[29] Pavlisdis T. Algorithms for shape analysis of contours and waveforms. IEEE Transactions on pattern analysis and machine intelligence. 2(4), 301-312. 1980.
[30] Paulus I, Busscher R, Schrevens E. Use of image analysis to human quality classification of aples. J. Agric. Engng Res. 68, 341-353. 1997.
[31] Puerta Q. Cmo garantizar la buena calidad de la bebida del caf y evitar los defectos.
Avances tcnicos Cenicaf. Colombia. No. 284:1-8. 2001.

[32] Qiu W, Shearer S. Maturity assessment of broccoli using the discrete fourier transform.Transactions of the ASAE. Vol. 35(6). 2057-2062. 1993.
[33] Recce M, Taylor J, Plebe A, Tropiano G. Visin and neural control for an orange harvesting robot. Deparment of Anatomy and Developemental Biology.University College
London, London, UK. 1998.
[34] Salazar M, Riao N, Arcila J, Ponce C. Estudio morfolgico anatmico y ultraestructural del fruto de caf (Coffea arabica L). Cenicaf. Colombia. 45(3):93-105. 1994.
[35] Slaughter D, Harrell R. Discriminating fruit for robotic harvest using color in natural
outdoor scenes. Transactions of the ASAE. Vol 32(2). March-April. 1989.
[36] Theodoridis S, Koutroumbas K. Pattern recognition. Academic Press. 1999.
[37] Velez J. Influencia de la precipitacin en el crecimiento del fruto de caf. Avances
tcnicos Cenicaf. Colombia. No 89:1-4. 1979.
[38] Williams A, Feria M, Kari P. The sensory and chemical examination of ground and cup
coffe with particular reference to bean maturity. In Colloque Scientifique international
sur le caf,13. Paipa (Colombia).1989. Pars (Francia). 1989.
[39] Yen J, Langari R. Fuzzy Logic Intelligence, control, and information. Prentice Hall.
New Jersey.
[40] Young T. .On the Theory of Light and Colors". Philosophiucal Transactions of the
Royal Society of London, 92. 20-71. 1802.
6 5, 7 2, 10 4, 7 88 85, 88 36 15 54 15, 53, 93 7 9 9 7, 8 2, 11, 12 14 13, 28, 78, 79, 82,
83, 84, 86, 87 2, 12 2, 10 83 13, 94 87, 88 2, 10 76 17 2, 12 55 6 13 2, 10, 11, 12 8 2,
12 2, 10 5 10 55 6 8 16 76

Anexo A

Mtodos de extraccin de
caractersticas
A.1.

Caractersticas de Color
El color es una medida del espectro electromagntico definido con base en el siste-

ma de visin humano. Al estudiar la forma como el ojo humano percibe el color, Thomas
Young en 1802 [40], encontr que el ojo humano tiene tres receptores, y la diferencia en
sus respuestas contribuyen a la sensacin de color. En estudios posteriores, Maxwell [24]
estableci que el color se puede especificar en trminos de tres variables independientes.
Maxwell demostr que cualquier combinacin aditiva de color podra ser reproducida por
la cantidad apropiada de tres estmulos primarios, en la actualidad se conoce como genralizacin tricromtica o tricromacidad. Los tres receptores se conocen como los conos S,M
y L (sensibles a las longitudes de onda Short, Medium y Long) y su sensibilidad ha sido determinada directamente a travs de medidas microespectrofotomtricas. En el ojo humano,
los tres tipos de conos que dan la sensacin de color estn ubicados en la retina, y contienen
pigmentos fotosensitivos con diferente absorcin espectral. Si la absorcin espectral de la
luz que incide sobre la retina est dada por f () , dnde representa la longitud de onda,
entonces, las respuestas de los tres conos se pueden modelar como los tres vectores con
76

77
componentes dadas por (A.1),
Z

max

si ()f ()d

Ci =

i = 1, 2, 3

(A.1)

min

dnde si () indica la sensibilidad del cono isimo, y [min max ] denotan el intervalo de
longitudes de onda fuera del cual todas las sensibilidades son cero. Tpicamente en el aire
o en el vaco, la regin visible del espectro electromagntico est especificado por la regin
entre min = 360nm y max = 830nm. Para obtener suficiente precisin la digitalizacin
se realiza generalmente mues-treando cada 10nm. Si se toman N muestras uniformemente
espaciadas del rango [min , max ], la ecuacin (A.1), se puede escribir como (A.2),
c = ST f

(A.2)

donde T denota la transpuesta, c = [c1 , c2 , c3 ]T , S es una matriz N 3 cuya isima columna, si , es el vector de muestras de si , y f es el vector N 1 de muestras de f (). Si se
define un conjunto estndar de respuestas de los conos, el color se puede especificar usando
el 3 vector c, en (A.2), conocido como el vector triestmulo.

Las funciones CMFs (color matching functions) son un conjunto de tres funciones
relacionadas con la sensibilidad espectral de los tres conos por transformacin lineal no
singular. Estas funciones fueron determinadas en experimentos psicofsicos. Las funciones
CMFs se usan para establecer un estndar para la especificacin numrica del color en trminos de tres coordenadas o valores triestmulo. Como se dijo anteriormente, el color de un
espectro visible, f , se puede especificar en trminos de sus valores triestmulo, AT f , dnde
A es la matriz de CMFs. La CIE (Commission Internationale de lclairage International
Commission on Illumination) es la principal organizacin responsable de la estandarizacin
de la mtrica del color y la terminologa. En 1931 la CIE defini el primer estndar de colorimetra. El primer conjunto de CMFs es conocido como el CIE Red-Green-Blue (RGB)
CMFs, r(), g(), b(), Figura A.1. Estas funciones estn asociadas con las primarias monocromticas en las longitudes de onda de 700, 546,1 y 435,8 nm, respectivamente.

78

Figura A.1: Funciones de correspondencia de color CIE r(), g(),b().


Un espacio de color es una notacin con la cual se puede especificar un color. Con
base en la informacin del CIE Red-Green-Blue se pueden generar otras formas de representacin del color. Transformando del espacio RGB a otros espacios tridimensionales. Es
natural considerar la relacin de la distancia entre colores en un espacio 3-D para percibir la diferencia entre ellos. Para la caracterizacin del color se usaron seis espacios de
representacin del color: RGB, HSI, YIQ, YCbCr, Colores oponentes, y Ohta.

A.1.1.

Modelo de color RGB


El modelo RGB se basa en un sistema de coordenadas cartesianas, donde cada color

est representado por tres componentes espectrales: rojo, verde y azul [17], como se ve en
la figura A.2.

En el modelo RGB se obtienen tres imgenes independientes una por cada componente (R,G,B). Estas tres imgenes se combinan para producir una imagen de color compuesta. La mayora de las cmaras de color empleadas para la adquisicin de imgenes

79

Figura A.2: Modelo RGB


digitales utilizan el formato RGB.

A.1.2.

Modelo de color HSI


En el modelo HSI se tiene la informacin del tono, la saturacin y la intensidad

de un color [17], como se ve en la figura A.3. El tono es el atributo con el cual se define
si el color es rojo, verde, prpura, amarillo, etc.. La saturacin es el nivel de luz blanca
mezclada con un tono. Los colores puros estn completamente saturados. Colores como el
rosado (rojo y blanco) estn menos saturados, siendo su grado de saturacin inversamente
proporcional a la cantidad de luz blanca aadida. El tono y la saturacin constituyen la
cromaticidad. La intensidad es una medida del brillo de la luz. La utilidad del modelo de
color HSI es que la componente de intensidad est separada de la informacin cromtica.
Adems, las componentes de saturacin y tono estn relacionadas con la forma en que los
seres humanos percibimos el color.

A.1.3.

Modelo de color YIQ


El sistema NTSC utiliza el modelo YIQ en la transmisin de televisin a color en

Estados Unidos. Una de las principales ventajas de este formato es que la informacin de la
escala de grises est separada de la informacin de color, as la misma seal puede ser usada
tanto para equipos a color o a blanco y negro. En el modelo YIQ, la informacin de color

80

Figura A.3: Modelo HSI


est dada por tres componentes: la luminancia (Y), el tono (I), y la saturacin (Q). El primer
componente, la luminancia, representa la informacin de la escalas de grises, mientras que
los dos ltimos componentes representan la informacin de color.

La transformacin del modelo RGB a YIQ est dada por las ecuaciones A.3, A.4 y
A.5.

Y = 0,299R + 0,587G + 0,114B

(A.3)

I = 0,596R 0,274G 0,322B = 0,74(R Y ) 0,27(B Y )

(A.4)

Q = 0,211R 0,523G + 0,312B = 0,48(R Y ) + 0,41(B Y )

(A.5)

El modelo YIQ se puede transformar al espacio HSI usando las ecuaciones A.6, A.7
y A.8.
Q
I

(A.6)

I 2 + Q2

(A.7)

HIQ = arctan
SIQ =

IIQ = Y

(A.8)

81

A.1.4.

Modelo de color YCbCr


El modelo YCbCr es ampliamente usado en video digital. En este formato, la in-

formacin de luminancia se almacena como un solo componente (Y), y la informacin de


crominancia se almacena en dos componentes Cb y Cr. Cb representa la diferencia entre la
componente azul (b) y un valor de referencia. Cr representa la diferencia entre la componente roja y un valor de referencia.

A.1.5.

Modelo de colores oponentes


En el siglo 19, el alemn Ewald Hering, propuso la teora de los colores oponentes.

Hering not que ciertos tonos nunca se vean juntos. Por ejemplo: la percepcin de un color
nunca estaba descrito como un verde rojizo o como un azul amarillento, mientras que todas
las otras combinaciones eran posibles. Aunque l primero estableci tres tipos de foto receptores: blanco-negro, amarillo-azul y rojo verde, lo cual estaba en contraste con la teora
de la tricromacidad, despus los investigadores encontraron que hay una capa en el sistema
de visin humana que convierte los valores RGB a un vector de colores oponentes. Este
vector tiene una componente acromtica (Blanco-Negro) y dos componentes cromticas
(Rojo verde y Amarillo- azul). Esta transformacin se hace en las clulas postreceptoras de
la retina llamadas clulas ganglion.

Un modelo simple de esta transformacin es la que se presenta en las ecuaciones


A.9, A.10 y A.11.
RG = R G

(A.9)

YB = 2B R G

(A.10)

W hB l = R + G + B

(A.11)

82

A.1.6.

Modelo de colores oponentes OHTA


Con base en la teora de los colores oponentes Ohta propuso un modelo que es una

buena aproximacin de la transformacin de Karhunen-Loeve del modelo RGB. Las ecuaciones A.12, A.13 y A.14 muestran la transformacin.

R+G+B
3
RB
I2 =
2
2G R B
I3 =
4
I1 =

A.2.

(A.12)
(A.13)
(A.14)

Caractersticas de Textura
Usando caractersticas de textura se espera obtener descripciones de la suavidad,

rugosidad y regularidad de una regin. Un mtodo de extraccin de caractersticas de textura


es el anlisis estadstico usando la matriz de coocurrencia. La matriz de cooocurrencia tiene
informacin de la distribucin de las intensidades y las posiciones de los pxeles que tienen
iguales, o casi iguales valores de intensidad.

A.2.1.

Matriz de Coocurrencia
La construccin de la matriz de coocurrencia se basa en la ubicacin espacial de los

pxeles, las relaciones con su vecindario y el valor de su intensidad, dependiendo de la condicin, la direccin y la distancia. Condicin: Es la regla que debe cumplir un determinado
pxel para poder ser cuantificado, usualmente esta condicin es tomada como la ubicacin
del pxel de determinada intensidad que se encuentra en la direccin del vecino.Direccin:
Es la orientacin espacial en la cual se evala la condicin, como casos tpicos se utilizan
direcciones como 0 grados, 45 grados, 90 grados y 135 grados ( [17]). Distancia: Es el nmero de pxeles que hay entre el par de pxeles evaluados, usualmente se utilizan 1, 3 y 5

83
pxeles de distancia.

La matriz de coocorrencia es un arreglo provisional que contiene la informacin del


nmero de pares de pxeles que cumplen la condicin, ordenados de forma que el nmero
de fila de cada elemento indica el nivel de gris del pxel en la direccin y la orientacin con
relacin al nivel de gris del pxel indicado por el nmero de columna. Sea la matriz provisional C, de kxk, donde k es el nmero de niveles de gris de la imagen, cuyo elemento cij
es el nmero de veces que un pxel con nivel de gris Ii , se encuentra en la direccin de un
pxel con nivel de gris Ij . Con base en la matriz de coocurrencia se obtienen los descriptores de textura. A continuacin se enumeran los descriptores utilizados para la evaluacin
de textura en frutos de caf. Se obtuvo una matriz de coocurrencia para cada una de las
direcciones 0, 45, 90 y 135 grados, todos a una distancia fija de 1 pxel. La matriz final es la
suma de las cuatro matrices de diferentes direcciones divida en cuatro. Como las imgenes
de caf son RGB se evalan los descriptores para cada una de las componentes R, G, yB.

A.2.2.

Entropa
El descriptor de entropa es una medida de la aleatoriedad contenida en la matriz

de coocurrencia. La obtencin de ste sta dada por la frmula (A.15) donde cij es cada
elemento de la matriz, e i y j varan desde 0 hasta n el nmero de niveles de gris.
E=

XX
i

cij log(cij )

(A.15)

Como se sabe de la teora de seales [20], la entropa provee una medida de la informacin contenida en una seal. Cada nmero contenido en la matriz de coocurrencia puede
ser tratado como una probabilidad. A medida que todos los elementos de la matriz de coocurrencia son similares, este descriptor aumenta su valor, siendo mximo en el caso que
todos los elementos de la matriz fueran iguales [17]. A medida que se tengan algunos elementos con mayores probabilidades de ocurrencia, el valor de la entropa va descendiendo
porque la textura es ms uniforme.

84

A.2.3.

Uniformidad
La propiedad de uniformidad da una idea de la suavidad de la textura, y esto se

refleja en la ubicacin de sus probabilidades en la matriz de coocurrencia. De modo que si


una mayor cantidad de pxeles de colores iguales cumplen con la condicin de ocurrencia,
ser posible observar un pico de intensidad en la diagonal principal de la matriz, y por
consiguiente la dispersin y distanciamiento de otros puntos de la diagonal principal ser
menor. El descriptor de uniformidad de una textura extrado de la matriz de coocurrencia
est dado por la ecuacin (A.16):
U=

XX
i

c2ij

(A.16)

De la ecuacin (A.16) se puede inferir que cuando todos los valores de cij son
semejantes, el valor de la uniformidad ser menor, por el contrario si ocurre que en la
diagonal principal se dan mayores picos de intensidad el descriptor se maximizar [17].

A.2.4.

Contraste
El contraste de una textura proporciona informacin acerca de las variaciones brus-

cas de color en la imagen. La extraccin de este descriptor est dada por la siguiente expresin matemtica (A.17).
C=

XX
i

|i j|2 cij

(A.17)

Como se puede observar en (A.17) el valor del contraste aumentar, si existen ms


elementos de la matriz de coocurrencia alejados de la diagonal principal. Adems, el efecto
de las componentes de la diagonal principal es totalmente despreciado. Puesto que ste se
debe a los puntos cuyos pxeles son de colores iguales y como se busca una informacin
acerca del contraste de la textura estos elementos no representan relevancia [17]. De este
modo, en una textura de caractersticas suaves y uniformes su contraste ser bajo, mientras
que si presenta un aspecto rugoso o irregular su contraste presentar un alto valor. La imagen
de mayor contraste posee una mayor dispersin de la diagonal principal y sus picos son de
menor intensidad.

85

A.2.5.

Correlacin
La correlacin de la textura es una medida de relacin lineal entre dos intensidades

de color. Matemticamente la correlacin, para la matriz de coocurrencia est definida de


la siguiente manera [6].
Crr

1
=
i j






X X

(i i )(j j )cij


i j

(A.18)

donde,
i =

XX

icij

(A.19)

jcij

(A.20)

(i i )cij

(A.21)

(j j )cij

(A.22)

j =

XX
j

i =

XX
i

j =

XX
i

Los valores de correlacin varan entre 1 Crr 1. Cuando Crr = 1 Ii y Ij


estn perfectamente correlacionados positivamente. Esto significa que los posibles valores
de Ii e Ij caen sobre una misma lnea con pendiente positiva. Por otro lado, cuando la
correlacin es -1, la situacin es opuesta, Ii e Ij estn negativamente correlacionados. Si
Ii e Ij son independientes entonces Crr = 0. En general la media tiene que ver sobre la
parte de la diagonal donde se acumulan la mayor cantidad de elementos de la matriz, as
como la varianza provee una idea de la dispersin de los elementos alrededor de la media.
El descriptor de correlacin aumentar cuando la distancia de los elementos a la media sea
mayor, esto se puede observar como una elongacin a lo largo de la diagonal principal de la
matriz de coocurrencia. De un modo similar la correlacin aumenta cuando la varianza es
baja, es decir que los elementos de la matriz no se encuentran muy alejados de la diagonal
principal.

86

A.2.6.

Momento de Diferencia de Orden k


El momento de diferencia de orden k es un descriptor que provee informacin de-

pendiendo del parmetro k. La expresin matemtica que describe el comportamiento de


este descriptor es la siguiente [17].
Dif =

XX
i

|i j|k cij

(A.23)

De la ecuacin (A.23), la tendencia general de este descriptor es aumentar de valor


cuando los elementos de la matriz de coocurrencia se encuentran alejados de la diagonal
principal, cuando el parmetro k es igual a 2 este descriptor se convierte en el contraste.
El momento de diferencia de primer orden provee informacin sobre la dispersin de la
textura.

A.2.7.

Momento Inverso de Diferencia de Orden k


Al contrario del descriptor anterior y como su nombre lo indica, este momento

refleja la definicin y agrupacin de los elementos de la matriz de coocurrencia [17]. Matemticamente se obtiene mediante la expresin:
Inv =

XX
i

cij
|i j|k

i 6= j

(A.24)

En la ecuacin (A.24) se ve que tanto en este descriptor como en el momento de


diferencia y en el contraste, la influencia de la diagonal principal es despreciada. El valor
del momento inverso aumenta cuando la distancia de los elementos de la matriz a la diagonal principal es baja. As que proporciona informacin sobre que tan compacta est la
distribucin de la matriz de coocurrencia, lo que en ltimas da una idea de que la textura
posee una variacin suave de colores.

A.2.8.

Mxima Probabilidad
El descriptor de mxima probabilidad suministra informacin sobre la respuesta

ms fuerte de un par de pxeles en la matriz de coocurrencia. La descripcin matemtica de

87
este descriptor es la siguiente [17].
mp = maxij (cij )

(A.25)

El valor de este descriptor ser mayor cuando en la matriz de coocurrencia se observe un pico de intensidad, el mayor de estos elementos dar el valor mximo de probabilidad.
Este descriptor es til para percibir la mayor ocurrencia o la predominacin de un color en
la textura.

A.2.9.

Homogeneidad Local
El descriptor de homogeneidad local proporciona informacin sobre la regularidad

local de la textura [22]. La descripcin matemtica de este descriptor est dada por la siguiente ecuacin.
HL =

XX
i

cij
1 + (i j)2

(A.26)

De la ecuacin (A.26) se puede deducir que este descriptor aumentar cuando la


distancia i j sea mnima. Lo cual indica que mientras los elementos de la matriz de
coocurrencia estn ms prximos a la diagonal principal mayor ser el valor de la homogeneidad local. La principal diferencia con el descriptor de momento inverso, es que para la
homogeneidad local se tiene en cuenta el aporte de los elementos en la diagonal principal,
que como se sabe poseen altos valores.

A.2.10.

Varianza

La propiedad de la varianza es otra propiedad estadstica de la textura. Para la matriz


de coocurrencia se define la varianza de la siguiente manera:
v=

XX
i

(i )2 cij

(A.27)

La varianza indica la dispersin que tiene un conjunto de muestras con respecto a


un valor medio, mientras los valores estn ms alejados de ste, mayor ser la varianza. En
el caso de la matriz de coocurrencia, los valores medios en i y en j sitan la media de la

88
matriz en algn punto de la diagonal principal y la varianza se toma como la dispersin
de la muestras con respecto a esta media. De este modo el descriptor de varianza tendr
un mayor valor para aquellas texturas en las cuales la matriz de coocurrencia sea de forma
alargada o dispersa con respecto del mximo pico en la diagonal principal [5].

A.2.11.

Directividad

El descriptor de Directividad extrae informacin sobre patrones de direccin en la


textura. Definido matemticamente con la expresin [6].
Dir =

cii

(A.28)

Tambin es conocido como descriptor de probabilidad de diferencia de nivel de gris.


Este descriptor posee la particularidad que slo analiza la diagonal principal de la matriz
de coocurrencia. Debido a que slo los elementos de colores iguales descansan sobre la
diagonal principal, este descriptor da una idea de patrones que se dirigen a lo largo de una
direccin, ya sea horizontal, vertical o diagonal. El valor de Directividad aumentar si en
la matriz de coocurrencia se notan picos de intensidad o una forma elongada del patrn de
esta.

A.2.12.

Tendencia de Cluster

Matemticamente la tendencia de Cluster de la matriz de coocurrencia est dada


por [22].

Clus =

XX
i

(i + j 2)k cij

(A.29)

Se puede inferir que este descriptor aumentar su valor a medida que la media de
los valores est ms cercana al valor mnimo. Esta caracterstica tiene la tendencia a oscilar
entre valores positivos y negativos, puesto que la influencia de la media no siempre se
equipara con el valor de los elementos alejados de esta.

89

A.3.

Caractersticas de Tamao

A.3.1.

rea
El rea es la suma de los pxeles del objeto que aparecen en la imagen. Se obtiene

con la ecuacin (A.30)donde, Iij corresponde al valor de intensidad de una imagen binaria.
En una imagen binaria Iij = 0 cuando el pxel no es parte del objeto y Iij = 1 cuando si lo
es.

A=

XX
i

A.3.2.

Iij = 1

(A.30)

Permetro
El permetro se calcula fcilmente sumando los pxeles del contorno. Si se tienen las

coordenadas de todos los puntos, se puede calcular el permetro eucldeo usando la frmula
(A.31), obteniendo un valor ms aproximado.

P =

N q
X

(xk+1 xk )2 (yk+1 yk )2

(A.31)

k=0

A.3.3.

Altura y Anchura mximas


La anchura y la altura mximas de un objeto se obtienen a partir de los ejes mor-

folgicos. El eje mayor de un contorno es el segmento de recta que une los puntos ms
separados entre s. El eje menor es perpendicular al eje mayor. El rectngulo formado con
las longitudes de los ejes contiene exactamente al contorno y se denomina Rectngulo bsico. El eje mayor corresponde a la altura y el eje menor a la anchura.

90

A.4.

Caractersticas de Forma

A.4.1.

Rectangularidad
La rectangularidad es la relacin entre un objeto y el mnimo rectngulo que lo

rodea, es decir el Rectngulo bsico. Y se obtiene utilizando la ecuacin (A.32), donde Ao


es el rea del objeto y Ar es el rea del rectngulo.
Rec1 =

Ar

(A.32)

Si calculamos el rectngulo mnimo que encierra al objeto, la relacin de reas


entre ste y el objeto nos proporciona una medida de la rectangularidad del objeto. En el
caso extremo en que el objeto es un rectngulo, el rectngulo mnimo es el propio objeto y
la relacin tendr valor 1. La relacin se har menor a medida que la forma del objeto no se
parezca a un rectngulo.

A.4.2.

Relacin entre anchura y altura mximas


Un parmetro aproximado para medir la rectangularidad es la relacin entre la an-

chura y la altura mximas del objeto, como se muestra en la ecuacin (A.33), este parmetro
se denomina excentricidad del contorno.
Rec2 =

A.4.3.

Anchuramxima
Alturamxima

(A.33)

Circularidad
La circularidad es un parmetro que mide el grado de parecido de un determinado

objeto a un crculo. Generalmente se mide como la relacin entre el cuadrado del permetro
y el rea. La forma ms comn de medirla es usando la ecuacin (A.34).
Cir =

p2
Area

(A.34)

91

A.4.4.

Firma
Una firma es una representacin funcional unidimensional de un contorno y se pue-

de generar de varias formas. Una de las ms simples es representar la distancia desde el


centro del objeto del contorno al contorno como una funcin del ngulo. Las firmas generadas de esta forma son independientes de la translacin pero se modifican con la rotacin.
Para hacer la firma invariante a la rotacin se debe generar la firma empezando desde el
mismo punto. Por ejemplo, empezar siempre desde el punto ms alejado del centro. Tambin, los cambios de tamao producen un cambio en la amplitud de la firma. Una forma de
normalizar las funciones es escalar todas las funciones de tal manera que sus valores estn
dentro del mismo intervalo [0, 1].

A.4.5.

Momentos centrales
La forma de las firmas se puede describir cuantitativamente utilizando momentos.

El momento central de orden k de una firma se define utilizando la ecuacin (A.35), donde
E(x) es el valor esperado de la firma. Usando los primeros momentos se pueden diferenciar
las firmas de formas diferentes.
mn = E(x )k

A.4.6.

(A.35)

Transformada de Fourier
La firma se puede representar en trminos de la frecuencia, usando la transformada

de Fourier. La magnitud del espectro y la fase caracterizan las firmas de las diferentes
formas.

A.4.7.

Descriptores de Fourier
Los descriptores de Fourier representan el contorno de una regin y obtienen in-

formacin a cerca de la forma expandiendo una funcin peridica en series de Fourier. Se


puede representar un contorno de N puntos como una funcin al recorrer el contorno a partir

92
de un punto fijo y tomar cada punto como un par de coordenadas (x, y). Entonces, se genera una secuencia de pares (x0 , y0 ), (x1 , y1 ),(x2 , y2 ),...,(xN 1 , yN 1 ). Estas coordenadas se
pueden expresar en la forma x(k) = xk y y(k) = yk , para k=0,1,2,...,N-1. El contorno se
puede escribir como un nmero complejo s(k) = x(k) + jy(k)] para obtener una representacin unidimensional de un contorno. En la ecuacin (A.36) se presenta la transformada
discreta de Fourier de s(k).
F (u) =

1
j2uk
1 NX
s(k)e[ N ]
N k=0

(A.36)

para u = 0, 1, 2, ..., N 1. Los coeficientes complejos a(u) se denominan descriptores


de Fourier del contorno. En coordenadas polares los descriptores de Fourier se calculan
en trminos de la magnitud y la fase como se muestra en las ecuaciones (A.37) y (A.38),
respectivamente.
Ak =

real(Fk )2 + imag(Fk )2

k = tan1 (

imag(Fk )
)
real(Fk )

(A.37)
(A.38)

Anexo B

Mtodos de clasificacin
B.1.

Estadstico
Los mtodos estadsticos se fundamentan en la regla de Bayes del mnimo error

[10]. Esta regla concluye que un objeto, con unas caractersticas determinadas, pertenece
a una clase si la probabilidad de pertenecer a sta clase es mayor que la probabilidad de
pertenecer a cualquier otra clase, como se muestra en la ecuacin (B.1),

m  k

si P (

wj
wk
) > P ( ) j 6= k
m
m

(B.1)

donde es el espacio de caractersticas, que est dividido en regiones i , i =


1, 2, ..., N donde N es el nmero de clases. P ( wmi ) es la probabilidad a posteriori, por la
cual un objeto con un vector de caractersticas m pertenece a la clase wi . Aplicando el
teorema de Bayes descrito en la ecuacin (B.2),se obtiene una ecuacin ms prctica de la
regla de clasificacin (B.3),

P(

m  k

P (wi )p( wmi )


wi
)=
m
p(m)

si P (wk )p(

93

m
m
) > P (wj )p( )
wk
wj

(B.2)

(B.3)

94
donde P (wi ) es la probabilidad a priori por la cual un objeto pertenece a la clase wi ,
p(m) es la funcin densidad de probabilidad para m, y p( wmi ) es la funcin de probabilidad
condicional de la clase para m. En las aplicaciones prcticas, las funciones de probabilidad
no se conocen y por lo tanto se deben estimar. Para estimarlas, primero se asume la forma
de la funcin de probabilidad, y luego se hallan sus parmetros a partir del conjunto de
entrenamiento. Se supone que las funciones de probabilidad de las clases estn descritas
por distribuciones normales o gausianas como se muestra en la ecuacin (B.4),

p(

wk
1
12
(X i )T (Ci )1 (X i )
)=
d
1 e
m
(2) 2 kCi k 2

(B.4)

donde d es la dimensin del vector de caractersticas, i es el vector d dimensional


que contiene la media de las caractersticas en una clase wi , Ci es la matriz de covarianza.
Para obtener p( wmi ), slo se necesita reemplazar los parmetros i , Ci . Estos parmetros
pueden ser estimados a partir del conjunto de muestras. La probabilidad a priori P (wi )
tambin se puede hallar del conjunto muestral. Por lo tanto el criterio de clasificacin,
ecuacin (B.3), se determina en forma analtica.

B.2.

Usando redes neuronales


Una red neuronal es un arreglo de numerosos elementos de procesamiento llama-

dos nodos o neuronas que estn interconectados entre si. La funcin de transferencia que
describe el comportamiento de una neurona est descrito por y = f [x] [21]. Donde x es
la entrada a una neurona, x = [xi ], para i = 1, 2, ..., N , est compuesta por las salidas de
N neuronas de la capa anterior, y y representa la respuesta de la neurona a estas seales de
entrada. En el modelo ms simple de una neurona, la salida y se aproxima a (B.5),
N
X

y = f [x] = K(

wi xi )

(B.5)

i=1

donde, K es una constante y es una funcin no lineal la cual toma el valor +1


para argumentos positivos y 1 (o 0) para argumentos negativos. wi , es llamado eficacia

95
sinptica o pesos, y es un umbral.

El algoritmo de entrenamiento de la red ms utilizado es el Backpropagation. La


aplicacin de este algoritmo comprende dos pasos. Durante la primera fase, las entradas xi
se presentan y se propagan hacia adelante a travs de la red y de esta forma se encuentra la
salida yk (n) en la iteracin n para cada unidad k, por ejemplo:

yk (n) = fk [netk (n)]

(B.6)

donde,

netk (n) =

wkj (n)yj (n)

(B.7)

donde, wkj (n) es el peso de la conexin desde la neurona j de la capa anterior a


una neurona k en cualquier capa en la presentacin n, y fk [] es la funcin de transferencia
de la neurona k.

La funcin de transferencia ms utilizada es la funcin sigmoidal descrita por la


ecuacin (B.8),

fk [netk (n)] =

1
(1 +

e([netk (n)+k ]) )

(B.8)

donde k es el umbral para la neurona k. fk es continua, no lineal, fcilmente derivable, evita la saturacin ante entradas grandes as como admite seales dbiles.

La segunda fase implica pasar hacia atrs a travs de la red. Se genera una diferencia
entre la salida actual y la deseada, esta diferencia es una seal de error k (n). Con base en
sta seal de error se actualiza el peso de cada conexin de la red de acuerdo con (B.9),

wjk (n + 1) = wjk (n) + k (n)yj (n) + [wjk (n) wjk (n 1)]

(B.9)

96
donde es un escalar que determina la velocidad de entrenamiento, es un escalar
que determina el efecto del peso anterior sobre la convergencia de la red en el espacio de
pesos. Esta segunda fase es la que proporciona la recursividad del mtodo. Ya que se entrena hasta que el error alcance el valor deseado.

B.3.

Clustering
El clustering es una metodologa de reconocimiento de patrones no supervisada,

es decir, no utiliza la informacin de la clase a la que pertenecen las muestras. Con ste
mtodo se busca organizar las muestras en grupos (clusters), con base en la medida de la
distancia entre las muestras. Existen diferentes algoritmos de clustering, pero uno de los
ms utilizados es el algoritmo k medias. Clustering k medias agrupa las muestras en k
grupos y ubica el centro de cada grupo tal que se minimice la distancia entre las muestras y
el centro.

B.3.1.

Clustering k medias difuso


En el procedimiento de clustering clsico las muestras pueden pertenecer slo a una

clase, en los esquemas de clustering difusos una muestra xj puede pertenecer simultneamente a ms de una clase con algn grado de pertenencia. El clustering k medias difuso est
definido por un conjunto de funciones de pertenencia uij () i = 1, 2, ..., k, j = 1, 2, ..., n,
donde k es el nmero de clases y n es el tamao del conjunto muestral. es un vector de
parmetros desconocido, pero ste vector se obtiene durante el proceso de entrenamiento
del clasificador. Las funciones de pertenencia cumplen la normalizacin que se muestra en
la ecuacin (B.10),

k
X
i=1

uij = 1,

i = 1, 2, ..., n.

(B.10)

97
Estos esquemas de clustering usan tcnicas de clculo diferencial para optimizar
una funcin de costo J. El clustering k medias difuso busca el mnimo de la funcin de
costo global que se muestra en la ecuacin (B.11),

Jb =

k X
n
X

ubij d(xj , i )

(B.11)

i=1 j=1

donde d(xi , j ) es la distancia entre xj y i . El parmetro b > 0 es conocido como


fuzificador. Si b = 0, Jb es simplemente el criterio de la suma de los errores de cada
muestra. Para b > 1, el criterio Jb reconoce el grado de pertenencia de cada muestra a
mltiples grupos. Para la optimizacin se requiere que,
Jb
=0 y
i

Jb
=0
uij

(B.12)

de donde se obtienen: el vector de parmetros que corresponde a los centros de cada


grupo cj (B.13),
Pn

cj =

b
j=1 [uij ] xj
Pj=1
b
n [uij ]

(B.13)

y las funciones de pertenencia (B.14),


1

( d1ij ) b1

uij = P
k

(B.14)

dij = kxj ci k

(B.15)

1 b1
r ( drj )

con,

Los centros de los grupos y las funciones de pertenencia se estiman iterativamente


con el siguiente algoritmo:
1.

comenzar inicializar n, k, ci , uij , i=1,...,k; j=1,...,n.

98
2.

normalizar uij con (B.10).

3.

hacer calcular el nuevo ci con (B.13).


calcular el nuevo uij con (B.14).

4.
5.

hasta un pequeo cambio en ci y uij .

6.

retornar ci .

7.

fin

You might also like