You are on page 1of 5

ESPAM MFL-

Raquel Murillo

Reconocimiento de Voz

AVANCES DE LAS REDES NEURONALES ARTIFICIALES:


RECONOCIMIENTO DE VOZ
Jeniffer Raquel Murillo Montesdeoca
Escuela Superior Politcnica Agropecuaria de Manab Manuel Flix Lpez
jraquelm2_@hotmail.com
Resumen
El presente artculo da a conocer uno de los ms grandes avances de las Redes neuronales
artificiales, el reconocimiento de voz, con el objetivo de comprender el funcionamiento de estos
sistemas y la importancia de los mismos, as como tambin el papel que cumplen las redes
neuronales artificiales en sistemas como estos.

Palabras Clave
Redes neuronales, Reconocimiento de Voz, Tecnologa.

Abstract
This article reveals one of the greatest advances of artificial neural networks, speech recognition,
in order to understand the functioning of these systems and the importance of them, as well as the
role of neural networks artificial systems like these.

Key Words
Neural networks, Voice Recognition Technology.

INTRODUCCIN
En las ltimas dcadas, se ha estudiado el
funcionamiento de las Redes Neuronales
Artificiales, y sus aplicaciones, que daran
un significativo aporte a la humanidad, y
entre stas aplicaciones que normalmente
utilizan
redes
neuronales, estn principalmente, el control,
la imagen y la voz.

Uno de los grandes esfuerzos en los que se


han invertido investigaciones, es el
Reconocimiento de Voz mediante RNA's el
cual se convierte ya no slo en un invento si
no en una necesidad, tanto as que empresas
como google de la mano con el sistema
operativo Android, han adaptado el
reconocimiento de voz.

ESPAM MFL-

Raquel Murillo

OBJETIVO

El objetivo de este artculo es dar a conocer


un avance muy importante de las redes
neuronales artificiales, el cual es el
Reconocimiento de Voz.

REDES NEURONALES
ARTIFICIALES
Las RNA son un sistema de red que facilita
la transmisin de la informacin, y eso se ha
venido diciendo a lo largo de todo este blog,
sin embargo, las redes neuronales artificiales
pese a constituir una mejora de los sistemas
actuales, no fueron populares en un
principio.
Tras muchos estudios e investigaciones, ya
en los aos 90 las redes neuronales
empezaron a tener su denominada "poca de
oro", y es as que en los ltimos aos, se han
dado muchos inventos y mejoras en sistemas
y todos estos incluyen las RNA.

SISTEMAS DE
RECONOCIMIENTO DE VOZ
A medida que las necesidades crecen, los
sistemas tambin lo hacen, y fue as que ante
la creciente necesidad de tener sistemas que
puedan ser controlados no slo fsicamente
dando una ventaja a personas discapacitadas,
se crearon los sistemas de reconocimiento de
voz.

Reconocimiento de Voz
El reconocimiento de voz, sin embargo tiene
varias problemticas que asumir, por
ejemplo, una persona nunca pronuncia una
palabra de igual manera dos veces, el nimo
de la persona, afecciones en la garganta, el
ruido y dems factores, hacen que el
reconocer la voz sea dificultoso.
Con el fin de acabar con las dificultades ya
antes mencionadas, se crean los algoritmos
que crean coincidencias entre las
pronunciaciones y de esta forma se tiene un

ANN
DTW
HMM

reconocimiento de voz eficaz.


Imagen 1. Algoritmos destacados para el
reconocimiento de voz

ALGORITMO DEL SISTEMA


El sistema de reconocimiento de voz
necesita de un algoritmo para que sea
ejecutado de manera eficaz, el cual es:

Imagen 2. Algoritmo de reconocimiento de


voz

ALGORITMO DE LA RED

ESPAM MFL-

Raquel Murillo

Reconocimiento de Voz

La red tambin tiene un algoritmo de


aprendizaje el cual es el expuesto en la
imagen siguiente:

Generacin y Entrenamiento: Una vez que


se realiza la grabacin y transformacin se
construye la red neuronal.

PASO 1.
Inicializar los pesos de la red
(w) con valores aleatorios
pequeos.

Prueba de RNA: Se realiza pruebas dentro


de la red neuronal, de las diferentes entradas
de datos, es decir de voz, que se tiene como
parmetros de entrada, la red debe reconocer
tambin los nuevos archivos de voz..

PASO 2
Mientras la condicin de paro
sea falsa realizar los pasos (36).
PASO 3
Se presenta un patrn de
entrada, (xp1, xp2,,xpi) y se
especfica la salida deseada
que debe generar la red (dp1,
dp2,,dpk).
PASO 4
Se calcula la salida actual de la
red, para ello se presentan las
entradas a la red y se va
calculando la salida que
presenta cada capa hasta llegar
a la capa de salida (y1,y2,
,yk). Los pasos son los
siguientes:
Imagen 3.Pasos para el aprendizaje de la
red

ESTRUCTURA BSICA DEL


SISTEMA
Grabacin y Transformacin: se graban
los archivos y se transforman en un conjunto
de datos, estos pueden ser tambin patrones,
y tienen que ser entendibles para la red.
La grabacin y transformacin es una tarea
de mapeo de datos y la realiza un codificador
de entrada.

Para este proceso se utiliza un decodificador


de salida transforma el resultado de la red,
en algo que pueda ser entendible.

Imagen 4. Estructura del sistema de


reconocimiento de voz

ETAPAS DEL
RECONOCIMIENTO DE VOZ
Captura de la voz: Se hace una grabacin
dentro de Simulink de Matlab, y esta dura
de 3 a 4 segundos tomando una muestra
conveniente para analizar y es de 8 bits.

Imagen 5. Grabacin en Matlab


Etapa de Ajuste: Una vez que se tiene el
vector de sonido se ajustan los tamaos a los
grupos de estudio, mediante un paso llamado
normalizacin.

ESPAM MFL-

Raquel Murillo

Reconocimiento de Voz

Este ajuste elimina el silencio de entrada


para que se aplique un algoritmo que
reconozca el comienzo de cada palabra.

Imagen 7. Reconocimiento de voz en


Android
Imagen 6. Archivo de audio normalizado

CONCLUSIN

RECONOCIMIENTO DE VOZ DE
ANDROID

Al terminar de leer el presente artculo a


quienes no conozcan nada sobre redes
neuronales artificiales pero sin embargo
conozcan sistemas que utilizan las RNA,
como el buscador por voz de google y
Android, quedarn simplemente extasiados
al ver la maravillosa ciencia que hay detrs
de toda esa cmoda tecnologa que sin duda
nos facilita la vida.

El reconocimiento de voz que tambin usa


Google y utilizan sistemas operativos como
Android tambin funciona mediante redes
neuronales, Vincent Vanhoucke, cientfico de
google indic que el mejoramiento del
reconocimiento de voz que hace que ste
tenga una tasa de error del 25%, se dio en
base a el cambio del modelo a las redes
neuronales.
La forma en la que funciona el
reconocimiento de voz, es bastante simple de
entender sin embargo requiri de muchas
investigaciones, al hablar a nuestro
dispositivo el espectograma de las palabras
se parte en pedazos y es enviado a 8
servidores de google en donde existen bases
de datos con grabaciones de palabras
pronunciadas, todo esto se realiza mediante
las redes neuronales creadas por el equipo de
cientficos de google liderado por Vanhoucke
y el secreto del funcionamiento del sistema
es la capacidad de aprendizaje que tienen las
redes neuronales.

Para quienes hemos estudiado al menos un


poco sobre las Redes Neuronales
Artificiales, y sabemos su historia nos
resulta emocionante saber que se ha logrado
tanto, aunque no en poco tiempo, pero que
sin embargo, los descubrimientos, avances e
investigaciones llegarn al punto en el que
algn da revolucionarn el mundo.
El reconocimiento de voz, es un invento que
sin duda alguna se convierte en una
necesidad, ms que un mero lujo, el que los
sistemas puedan reconocer la voz, facilita la
vida a personas que tienen discapacidades en
la visin o discapacidades mentales, adems
de que un sistema que contenga
reconocimiento de voz y lo utilice para la
seguridad, tiene menos riesgos.

ESPAM MFL-

Raquel Murillo

Sin duda las redes neuronales artificiales,


bajo la tutela de la inteligencia artificial,
mejorarn muchos sistemas, entre ellos el
reconocimiento de voz, imgenes, y otras
invenciones que aporten a un bienestar social
o satisfagan una comodidad.

BIBLIOGRAFA

Basogain, X. 2008. Redes neuronales


artificiales y sus aplicaciones. (En lnea). ES.
Consultado, 25 de ene.2015. Formato PDF.
Disponible
en:
cvb.ehu.es/open_course_ware/castellano/.../r
edes.../libro-del-curso.pdf
Cruz, L y Mozqueda, A. 2008.
Reconocimiento de Voz usando Redes

Reconocimiento de Voz
Neuronales Artificiales Backpropagation y
Coeficientes LPC. Mxico. P 11.

Isasi, P y Galvn,I. 2004. Redes neuronales


artificiales: Un enfoque prctico. 1 ed.
Espaa. Pearson Education. p 248

Luna, C; Martnez, J; Mora, M. 2009.


Reconocimiento de Voz con Redes
Neuronales, DTW y Modelos Ocultos de
Markov. Mxico. Revista cientfica y
tecnolgica REDALYC. Vol 32. P 1-6

Milone, D. 2005. Reconocimiento


automtico del habla con redes neuronales
artificiales. Mxico. Revista de Ciencia,
docencia y tecnologa. N 35. P 261-322.

You might also like