Avances de Las RNA's: Reconocimiento de Voz

ESPAM MFL-
Raquel Murillo
Reconocimiento de Voz
AVANCES DE LAS REDES NEURONALES ARTIFICIALES:

RECONOCIMIENTO DE VOZ
Jeniffer Raquel Murillo Montesdeoca
Escuela Superior Politcnica Agropecuaria de Manab Manuel Flix Lpez
jraquelm2_@hotmail.com
Resumen
El presente artculo da a conocer uno de los ms grandes avances de las Redes neuronales
artificiales, el reconocimiento de voz, con el objetivo de comprender el funcionamiento de estos
sistemas y la importancia de los mismos, as como tambin el papel que cumplen las redes
neuronales artificiales en sistemas como estos.
Palabras Clave
Redes neuronales, Reconocimiento de Voz, Tecnologa.
Abstract
This article reveals one of the greatest advances of artificial neural networks, speech recognition,
in order to understand the functioning of these systems and the importance of them, as well as the
role of neural networks artificial systems like these.
Key Words
Neural networks, Voice Recognition Technology.
INTRODUCCIN
En las ltimas dcadas, se ha estudiado el
funcionamiento de las Redes Neuronales
Artificiales, y sus aplicaciones, que daran
un significativo aporte a la humanidad, y
entre stas aplicaciones que normalmente
utilizan
redes
neuronales, estn principalmente, el control,
la imagen y la voz.
Uno de los grandes esfuerzos en los que se

han invertido investigaciones, es el
Reconocimiento de Voz mediante RNA's el
cual se convierte ya no slo en un invento si
no en una necesidad, tanto as que empresas
como google de la mano con el sistema
operativo Android, han adaptado el
reconocimiento de voz.
ESPAM MFL-
Raquel Murillo
OBJETIVO
El objetivo de este artculo es dar a conocer

un avance muy importante de las redes
neuronales artificiales, el cual es el
Reconocimiento de Voz.
REDES NEURONALES
ARTIFICIALES
Las RNA son un sistema de red que facilita
la transmisin de la informacin, y eso se ha
venido diciendo a lo largo de todo este blog,
sin embargo, las redes neuronales artificiales
pese a constituir una mejora de los sistemas
actuales, no fueron populares en un
principio.
Tras muchos estudios e investigaciones, ya
en los aos 90 las redes neuronales
empezaron a tener su denominada "poca de
oro", y es as que en los ltimos aos, se han
dado muchos inventos y mejoras en sistemas
y todos estos incluyen las RNA.
SISTEMAS DE
A medida que las necesidades crecen, los
sistemas tambin lo hacen, y fue as que ante
la creciente necesidad de tener sistemas que
puedan ser controlados no slo fsicamente
dando una ventaja a personas discapacitadas,
se crearon los sistemas de reconocimiento de
voz.
El reconocimiento de voz, sin embargo tiene
varias problemticas que asumir, por
ejemplo, una persona nunca pronuncia una
palabra de igual manera dos veces, el nimo
de la persona, afecciones en la garganta, el
ruido y dems factores, hacen que el
reconocer la voz sea dificultoso.
Con el fin de acabar con las dificultades ya
antes mencionadas, se crean los algoritmos
que crean coincidencias entre las
pronunciaciones y de esta forma se tiene un
ANN
DTW
HMM
reconocimiento de voz eficaz.

Imagen 1. Algoritmos destacados para el
reconocimiento de voz
ALGORITMO DEL SISTEMA

El sistema de reconocimiento de voz
necesita de un algoritmo para que sea
ejecutado de manera eficaz, el cual es:
Imagen 2. Algoritmo de reconocimiento de

voz
ALGORITMO DE LA RED
ESPAM MFL-
Raquel Murillo
La red tambin tiene un algoritmo de

aprendizaje el cual es el expuesto en la
imagen siguiente:
Generacin y Entrenamiento: Una vez que

se realiza la grabacin y transformacin se
construye la red neuronal.
PASO 1.
Inicializar los pesos de la red
(w) con valores aleatorios
pequeos.
Prueba de RNA: Se realiza pruebas dentro

de la red neuronal, de las diferentes entradas
de datos, es decir de voz, que se tiene como
parmetros de entrada, la red debe reconocer
tambin los nuevos archivos de voz..
PASO 2
Mientras la condicin de paro
sea falsa realizar los pasos (36).
PASO 3
Se presenta un patrn de
entrada, (xp1, xp2,,xpi) y se
especfica la salida deseada
que debe generar la red (dp1,
dp2,,dpk).
PASO 4
Se calcula la salida actual de la
red, para ello se presentan las
entradas a la red y se va
calculando la salida que
presenta cada capa hasta llegar
a la capa de salida (y1,y2,
,yk). Los pasos son los
siguientes:
Imagen 3.Pasos para el aprendizaje de la
red
ESTRUCTURA BSICA DEL

SISTEMA
Grabacin y Transformacin: se graban
los archivos y se transforman en un conjunto
de datos, estos pueden ser tambin patrones,
y tienen que ser entendibles para la red.
La grabacin y transformacin es una tarea
de mapeo de datos y la realiza un codificador
de entrada.
Para este proceso se utiliza un decodificador

de salida transforma el resultado de la red,
en algo que pueda ser entendible.
Imagen 4. Estructura del sistema de

reconocimiento de voz
ETAPAS DEL
Captura de la voz: Se hace una grabacin
dentro de Simulink de Matlab, y esta dura
de 3 a 4 segundos tomando una muestra
conveniente para analizar y es de 8 bits.
Imagen 5. Grabacin en Matlab

Etapa de Ajuste: Una vez que se tiene el
vector de sonido se ajustan los tamaos a los
grupos de estudio, mediante un paso llamado
normalizacin.
ESPAM MFL-
Raquel Murillo
Este ajuste elimina el silencio de entrada

para que se aplique un algoritmo que
reconozca el comienzo de cada palabra.
Imagen 7. Reconocimiento de voz en

Android
Imagen 6. Archivo de audio normalizado
CONCLUSIN
RECONOCIMIENTO DE VOZ DE
ANDROID
Al terminar de leer el presente artculo a

quienes no conozcan nada sobre redes
neuronales artificiales pero sin embargo
conozcan sistemas que utilizan las RNA,
como el buscador por voz de google y
Android, quedarn simplemente extasiados
al ver la maravillosa ciencia que hay detrs
de toda esa cmoda tecnologa que sin duda
nos facilita la vida.
El reconocimiento de voz que tambin usa

Google y utilizan sistemas operativos como
Android tambin funciona mediante redes
neuronales, Vincent Vanhoucke, cientfico de
google indic que el mejoramiento del
reconocimiento de voz que hace que ste
tenga una tasa de error del 25%, se dio en
base a el cambio del modelo a las redes
neuronales.
La forma en la que funciona el
reconocimiento de voz, es bastante simple de
entender sin embargo requiri de muchas
investigaciones, al hablar a nuestro
dispositivo el espectograma de las palabras
se parte en pedazos y es enviado a 8
servidores de google en donde existen bases
de datos con grabaciones de palabras
pronunciadas, todo esto se realiza mediante
las redes neuronales creadas por el equipo de
cientficos de google liderado por Vanhoucke
y el secreto del funcionamiento del sistema
es la capacidad de aprendizaje que tienen las
redes neuronales.
Para quienes hemos estudiado al menos un

poco sobre las Redes Neuronales
Artificiales, y sabemos su historia nos
resulta emocionante saber que se ha logrado
tanto, aunque no en poco tiempo, pero que
sin embargo, los descubrimientos, avances e
investigaciones llegarn al punto en el que
algn da revolucionarn el mundo.
El reconocimiento de voz, es un invento que
sin duda alguna se convierte en una
necesidad, ms que un mero lujo, el que los
sistemas puedan reconocer la voz, facilita la
vida a personas que tienen discapacidades en
la visin o discapacidades mentales, adems
de que un sistema que contenga
reconocimiento de voz y lo utilice para la
seguridad, tiene menos riesgos.
ESPAM MFL-
Raquel Murillo
Sin duda las redes neuronales artificiales,

bajo la tutela de la inteligencia artificial,
mejorarn muchos sistemas, entre ellos el
reconocimiento de voz, imgenes, y otras
invenciones que aporten a un bienestar social
o satisfagan una comodidad.
BIBLIOGRAFA
Basogain, X. 2008. Redes neuronales

artificiales y sus aplicaciones. (En lnea). ES.
Consultado, 25 de ene.2015. Formato PDF.
Disponible
en:
cvb.ehu.es/open_course_ware/castellano/.../r
edes.../libro-del-curso.pdf
Cruz, L y Mozqueda, A. 2008.
Reconocimiento de Voz usando Redes
Neuronales Artificiales Backpropagation y
Coeficientes LPC. Mxico. P 11.
Isasi, P y Galvn,I. 2004. Redes neuronales

artificiales: Un enfoque prctico. 1 ed.
Espaa. Pearson Education. p 248
Luna, C; Martnez, J; Mora, M. 2009.

Reconocimiento de Voz con Redes
Neuronales, DTW y Modelos Ocultos de
Markov. Mxico. Revista cientfica y
tecnolgica REDALYC. Vol 32. P 1-6
Milone, D. 2005. Reconocimiento

automtico del habla con redes neuronales
artificiales. Mxico. Revista de Ciencia,
docencia y tecnologa. N 35. P 261-322.

Avances de Las RNA's: Reconocimiento de Voz

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Avances de Las RNA's: Reconocimiento de Voz

Uploaded by

Copyright:

Available Formats

ESPAM MFL-

AVANCES DE LAS REDES NEURONALES ARTIFICIALES:

Uno de los grandes esfuerzos en los que se

El objetivo de este artculo es dar a conocer

reconocimiento de voz eficaz.

ALGORITMO DEL SISTEMA

Imagen 2. Algoritmo de reconocimiento de

La red tambin tiene un algoritmo de

Generacin y Entrenamiento: Una vez que

Prueba de RNA: Se realiza pruebas dentro

ESTRUCTURA BSICA DEL

Para este proceso se utiliza un decodificador

Imagen 4. Estructura del sistema de

Imagen 5. Grabacin en Matlab

Este ajuste elimina el silencio de entrada

Imagen 7. Reconocimiento de voz en

Al terminar de leer el presente artculo a

El reconocimiento de voz que tambin usa

Para quienes hemos estudiado al menos un

Sin duda las redes neuronales artificiales,

Basogain, X. 2008. Redes neuronales

Isasi, P y Galvn,I. 2004. Redes neuronales

Luna, C; Martnez, J; Mora, M. 2009.

Milone, D. 2005. Reconocimiento

You might also like