Professional Documents
Culture Documents
Abstract—Este documento propone un método para un sistema y algoritmos utilizados para realizar una recuperación. Se
CBIR ( Content-based-image-retrieval ) para agrupar, identificar describen algunos imetodos de caractericación y agrupación
y recuperar imágenes. Este sistema comprende 3 fases para su segun los diferentes enfoques existentes en la literatura.
recuperación: Caracterización, Agrupación, Identificación. Para
la caracterización de las imágenes se pueden implementar difer-
entes métodos con los cuales se pueden extraer características A. Caracterización de Imagenes
específicas de una imagen. Cuando se realice la caracterización
La extracción de características es un paso muy importante
de las imágenes se procede a realizar los grupos de estas
caracterizticas; para este agrupamiento se utiliza un algoritmo en el agrupamiento de las imágenes como lo se puede observar
particional (Algoritmo K-means), con esto se toma la imagen a en un estudio comparativo de agrupación de imágenes médicas
identificar, se caracteriza y se compara con los grupos creados, [4] en el cual caracterizan 3 tipos de características cruciales
se selecciona el grupo con mayor parecido a la imagen, luego las cuales son color, forma y textura. Para la extracción
de esto se seleccionan las 5 imágenes más semejantes a la
de características se enfocan principalmente en la textura
imagen propuesta y estas son las salidas de nuestro proyecto
propuesto, en donde son calificadas por una persona experta ya que es muy poderosa para imágenes variantes. Utilizan
para determinar el grupo preciso al que pertenece. GLCM (Gray-Level Co-Occurrence Matrix) para realizar la
extracción de características y utilizan las medidas estadísticas
Index Terms—K-means, imagen, agrupacion,caracterizticas,
identificar, recuperación, comparar, distancia, grupo y centro. como homogeneidad, contraste, entropía, etc. para calcularlas.
Calculan 4 características de textura las cuales son Contraste,
correlación, energía y homogeneidad. Al final de esto tienen
un vector de 4 características para cada imagen.
I. I NTRODUCTION Otro tipo de extracción de características muy interesante
Las imágenes digitales se han convertido en una herramienta es el que utilizan en el siguiente articulo [5] en el cual
indispensable para diferentes aplicaciones, como imágenes hacen referencia a las características de textura, aunque en
médicas, prevención de delitos, educación, multimedia, min- este documento trabajan con la media y la varianza de la
ería, datos, etc. [1] Una aplicación en la que está basado intensidad de los pixeles. No utilizan la totalidad de la imagen,
este proyecto es en la recuperación de imágenes médicas. El el trabajo que realizan para esto es seccionar la imagen en
documento propone una herramienta para identificar el tipo de zonas concéntricas circulares como se muestra en la figura 1.
imagen (corazón-próstata-pulmones-corazón), ilustrando las
imágenes más semejantes a la imagen propuesta. Muchas de
las aplicaciones existentes con este objetivo utilizan un sistema
de etiqueta lo cual convierte el sistema en supervisado, esto
puede facilitar el agrupamiento de estas o utilizan sistemas
de agrupamiento muy complejos como lo pueden ser redes
convolucionales, algoritmos basados en densidad, algoritmos
jerárquicos, mixturas finitas, etc. [2]. Se realiza un algoritmo
el cual funcione con una base de datos que no dependa de
etiquetas y se puedan adicionar imágenes nuevas sin esta, lo
que vuelve al algoritmo no supervisado, por otro lado, se
reduce la complejidad ya que se utilizaran métodos básicos
de caracterización de imágenes. Se pueden implementar difer-
entes métodos de caracterización de imágenes como lo pueden
ser Métodos estadísticos, Métodos Estructurales, Métodos Fig. 1. Media y Varianza de Regiones Circulares Concentricas. [5]
Basados en Modelos, etc. [3] Nos basamos en un algoritmo
particional para realizar el cluster, ya que no requiere un alto Calculan la media y la varianza de cada anillo y guardan
consumo de máquina y los grupos que se formaran no son el dato, el número de características dependerá del número
complejos [2]. de zonas que se tenga lo que hace que su algoritmo sea más
sensible a cambios en las imágenes.
Otra característica que se puede tener en cuenta es el tipo
II. A NTECEDENTES de borde o bordes en la imagen. Toman los cambios de
En esta sección se describen aspectos relacionados con intensidad de la imagen y guardan esa posición de cambio con
procesamiento de imagenes a la hora de recuperar una de un algoritmo seleccionado. El método de detección de bordes
estas, su clasificación, sus caracteristicas, su identificación que utilizan para extraer esta característica es la extracción
2
I n p u t : C ( v e c t o r e s de c a r a c t e r i s t i c a s " 2 " )
K: numero de g r u p o s " 4 " Para esta prueba en la cual se agruparon los datos por su
S a l i d a s = Grupos homogeneidad y energía se observa la distancia o separación
1: I n i c i a l i z a r K entre algunas como lo son los grupos Azul, Rojo y Verde-
2 : f u n c i o n Kmeans M a t l a b Negro. Las características de los grupos verde y negro entre
3 : Comparar P r u e b a con c e n t r o i d e s ellas son muy cercanas y muy parecidas las características de
4: Distancia Euclidiana las imágenes que componen estos grupos lo cual pasa también
5 : C a l c u l a r 5 mas p e q u e ñ o s . con el grupo rojo, pero al ver el grupo azul se observa más
separación entre sus componentes, significa que las imágenes
del grupo azul no son tan constantes entre ellas.
3) Características Imagen prueba: A la imagen de prueba
I se le aplica el mismo algoritmo de Homogeneidad y energía
para tener una distribución entre los grupos ya hallados.
4) Identificación: Para realizar la identificación se tomó la
homogeneidad y energía como coordenadas en un plano 2D
tanto para la prueba como la base de datos esto para tener una
guía donde podamos observar que sucede con la agrupación
de datos. Se analiza la posición de la imagen de entrada con
los centroides de los grupos, con esto se toma el grupo del
centroide más cercano. Esto no puede funcionar de una forma
correcta si existen grupos muy cercanos a la imagen de entrada
y puede combinar relación de imágenes.
B. Recuperación de Imagenes
9
Para tener una decisión acertada acerca de la imagen de
prueba se realiza la recuperación de las 5 imágenes más Fig. 5. Agrupación de Base de Datos. Prostata”Rojo”, Cerebro”Negro”,
parecidas a la imagen de prueba. Ya con la identificación del Pulmones”Azul” y Corazon “Verde”. Magente son los centroides de los
grupos.
grupo más cercano se realiza la identificación de imágenes
más cercanas a la imagen de prueba del grupo seleccionado,
esto al final nos arrogara las 5 más parecidas.
En la figura 5 se observa la manera en la que quedaron
IV. R ESULTADOS distribuidos los centroides, en este procedimiento se encontró
Las pruebas que se hicieron fueron respecto a los enfoques, el primer error del algoritmo ya que los grupos verde y negro
valores, identificación y agrupación de las imágenes nos tienen mucha dispersión entre sus componentes y una
cercanía entre sus centroides el algoritmo k-mean los tomo
como un solo grupo y el grupo azul por su dispersión de
A. Agrupación datos tomo dos grupos en el grupo azul. Esto nos traerá
Se seleccionaron imágenes de la base de datos las cuales problemas a la hora de reconocimiento de imágenes, aunque
eran de cerebro, próstata, pulmón y corazón a las cuales se para solucionar este problema se realizó la distancia euclidiana
les sacaron las características ya mencionadas anterior mente al centro y la distancia entre punto y punto de características
y se ilustraron para ver el orden que estas tomaron. para validar la cercanía entre grupos.
4
9
Fig. 6. Agrupación de Base de Datos. Prostata”Rojo”, Cerebro”Negro”, Fig. 8. PROSTATA-Agrupación de Base de Datos. Prostata”Rojo”, Cere-
Pulmones”Azul” y Corazon “Verde”. Cian posición de la imagen de prueba. bro”Negro”, Pulmones”Azul” y Corazon “Verde”. Cian posición de la imagen
de prueba.
B. Pruebas
Fig. 9. CEREBRO-Salida del codigo Imagen de prueba y sus 5 imagenes
1) Prostata: Para el inicio de la prueba de próstata se retira mas similares..
una imagen como ya se había indicado anteriormente y se
procede a ejecutar el código.
El algoritmo muestra las 5 imagenes mas cercanas del grupo Esta imagen da muy cercana al centroide del grupo de
especifico a la imagen de prueba. Se observa que para este cerebro y ya que se realiza la comparación punto a punto
caso la imagen mas cercana dentro de las 5 es la imagen respecto a sus caracteristicas tiende a fallar poco el algoritmo.
numero 4 y la mas lenjana dentro de el grupo seleccionado es 3) Pulmones: La prueba de pulmones es la prueba que
la imagen 8. Tambien reconoce las imagenes con una variedad mejores sultados arroja, gracias a la disperción de sus datos,
de caracteristicas en ellas. pero es la mas compleja de realizar por el agrupamiento.
5
V. C ONCLUSIONES
Se encontró un problema al ejecutar el algoritmo, por la
magnitud de las características ya que confundía dos grupos
y la dispersión de datos de un grupo lo asumía como dos
grupos, para solucionar esto se propuso realizar una compara-
ción punto a punto y con el centroide de cada grupo para
establecer la referencia. Las imágenes de cerebro tenían datos
muy parecidos entre su base de datos, pero a la vez muy
Fig. 12. PULMONES-Agrupación de Base de Datos. Prostata”Rojo”, Cere- parecidos con las imágenes de cerebro, pero se logró realizar
bro”Negro”, Pulmones”Azul” y Corazon “Verde”. Cian posición de la imagen la respectiva identificación y recuperación de estas imágenes.
de prueba.
También para escoger el método para extraer las características
se probaron la media, homogeneidad, energía, mediana, las
diferentes transformadas, etc. Pero finalmente las caracterís-
ticas según nuestro criterio que mejor funcionaron fueron la
homogeneidad y energía. Este trabajo puede complementarse
4) Corazon: Las características de los corazones están muy con redes convolucionales si se desea mejor el reconocimiento
cercanas a los de cerebro, pero aun así logra identificar y de estas, ya sea un perfil de imagen o cierto corte ya que el
recuperar la imagen de una buena manera, ya que se realizó método que utilizamos es muy global para las imágenes.
una doble comparación para volver el algoritmo más asertivo.
VI. R EFERENCIAS
[1] T. S. S. L.K Pavithra, «An efficient framework for image
retireval using color, texture and edge features,» Department
of Information Technology., Chennai, India, 2017.
[2] F. P. S. S. D. Pascual, «Algoritmo de Agrupamiento,»
Departamento de Lenguajes y Sistemas Informáticos, Santiago
de Cuba, Cuba, 2016.
[3] S. S. E. H. Marian Fayez, «Comparative Study of Clus-
tering Medical Images,» SAI Computing Conference, Londo,
UK, 2016.
[4] R. N. C. ,. C. M.Srinivas, «Content-
basedmedicalimageretrievalusingdictionarylearn-
ing,» DepartmentofComputerScienceandEngineer-
Fig. 13. CORAZON-Salida del codigo Imagen de prueba y sus 5 imagenes ing,IndianInstituteofTechnology,Hyderabad, Hyderabad,
mas similares.. India, 2015.
6