Professional Documents
Culture Documents
Introduccin
Como parte del proyecto RAIOM se han realizado diversas pruebas de concepto
integrando programacin hecha en java y libreras de visin artificial como OpenCV
1
y FastCV2. Estas pruebas nos permitieron evaluar diferentes algoritmos ejecutndose
sobre el sistema operativo Android versin 4.4.3. Se utiliz la plataforma de desarrollo NDK 3 para implementar dichos algoritmos en cdigo nativo C++. El propsito
principal es obtener una mejor performance y tiempo de respuesta de los algoritmos al
ejecutarse en dispositivos mviles. Se han realizado pruebas de implementacin y
adaptacin de algoritmos para lograr los siguientes objetivos:
Reconocimiento gestual
Identificacin de landmarks y objetos
Calculo de la posicin y orientacin (pose) del usuario
1
2
OpenCV. http://opencv.org/
FastCV. https://developer.qualcomm.com/mobile-development/add-advancedfeatures/computer-vision-fastcv
NDK: Native Development Kit. https://developer.android.com/tools/sdk/ndk/index.html
Reconocimiento Gestual
Fig. 1. Representacin del modelo Bag Of Words utilizado para clasificacin. (fuente: Evaluating Bag-ofVisual-Words Representations in Scene Classification, p. 2)
En general queremos que estas caractersticas sean reconocibles aun habiendo sufrido la imagen cambios en el punto de vista, rotaciones o cambios de iluminacin (es
decir, que sean invariantes ante tales cambios). Existen muchos algoritmos diferentes
tanto para bsqueda de puntos clave como para extraccin de caractersticas. Del lado
de la bsqueda de puntos clave se encuentran algoritmos como los detectores de esquinas de Harris y Shi-Tomasi, los detectores LoG (Laplacian of Gaussian), DoG
(Difference of Gaussians), DoH (Determinant of Hessian), FAST (Features from Accelerated Segment Test), PCBR (Principal Curvature-Based Region detector) o MSER
(Maximally Stable Extremal Regions) entre otros. Algunos de los algoritmos son ms
estables que otros ante cambios de brillo y orientacin, algunos son ms lentos que
otros, pero en definitiva ninguno es perfecto y el uso de cada uno depende en gran
parte de una eleccin personal y el compromiso que se pueda tomar entre velocidad y
precisin necesaria [11].
Referencias
1. Davison, A., Reid, I., Molton, N., Stasse, O.: Monoslam: Real-time single camera slam.
Pattern Analysis and Machine Intelligence, IEEE Transactions on 29(6), 1052-1067 (June
2007)
2. Kneip, L., Chli, M., Siegwart, R.: Robust real-time visual odometry using a single camera
and an IMU. In: Proceedings of the British Machine Vision Conference (BMVC) (2011)
3. Lowe, D.: Object recognition from local scale-invariant features. In: Computer Vision,
1999. The Proceedings of the Seventh IEEE International Conference on. vol. 2, pp. 11501157 vol.2 (1999)
4. Maimone, M., Cheng, Y., Matthies, L.: Two years of visual odometry on the mars exploration rovers. Journal of Field Robotics, Special Issue on Space Robotics 24, 2007 (2007)
5. Montemerlo, M., Thrun, S.: Simultaneous localization and mapping with unknown data
association using fastslam. pp. 1985-1991 (2003)
6. Munguia, R., Grau, A.: Monocular slam for visual odometry. In: Intelligent Signal Processing, 2007. WISP 2007. IEEE International Symposium on. pp. 1-6 (Oct 2007)
7. Ortiz, R.: Freak: Fast retina keypoint. In: Proceedings of the 2012 IEEE Conference on
Computer Vision and Pattern Recognition (CVPR). pp. 510-517. CVPR '12, IEEE Computer
Society,
Washington,
DC,
USA
(2012),
http://dl.acm.org/citation.cfm?id=2354409.2354903
8. Rosten, E., Porter, R., Drummond, T.: Faster and better: A machine learning approach to
corner detection. Pattern Analysis and Machine Intelligence, IEEE Transactions on 32(1),
105-119 (Jan 2010)
9. Shi, J., Tomasi, C.: Good features to track. In: Computer Vision and Pattern Recognition,
1994. Proceedings CVPR '94, 1994 IEEE Computer Society Conference on. pp. 593-600
(Jun 1994)
10. Sivic, J., Russell, B.C., Efros, A.A., Zisserman, A., Freeman, W.T.: Discovering object
categories in image collections. In: IN: PROCEEDINGS OF THE TENTH
INTERNATIONAL CONFERENCE ON COMPUTER VISION (2005)
11. Tuytelaars, T., Mikolajczyk, K.: Local invariant feature detectors: A survey. Found.
Trends.
Comput.
Graph.
Vis.
3(3),
177-280
(Jul
2008),
http://dx.doi.org/10.1561/0600000017
12. Yang, Jun and Jiang, Yu-Gang and Hauptmann, Alexander G. and Ngo, Chong-Wah.
Evaluating Bag-of-visual-words Representations in Scene Classification. Proceedings of
the International Workshop on Workshop on Multimedia Information Retrieval (2007)