You are on page 1of 6

LABORATORIO DE TRANSFORMADAS No.

3: Aplicaciones de
transformada de Fourier: Identificación en tiempo real de cantos de aves
Avendaño Gunnar [gavendañop@unbosque.edu.co]

RESUMEN- En este laboratorio utilizaremos los • Estrategias de partición para la


sonidos de las aves para identificar su categoría, clase Validación de datos.
y especie, lo evidenciaremos utilizando solo el espacio
del tiempo, para esto necesitaremos la ayuda de Validación Cruzada:
diferentes herramientas como los diferentes sonidos de
las aves, además conoceremos diferentes métodos de La validación cruzada es una técnica utilizada
validación para tener características básicas de los para evaluar los resultados de un análisis estadístico y
audios de las aves para la clasificación de las mismas. garantizar que son independientes de la partición entre
datos de entrenamiento y prueba. Consiste en repetir y
ABSTRACT- In this laboratory we will use the calcular la media aritmética obtenida de las medidas
sounds of the birds to identify their category, class and de evaluación sobre diferentes particiones. Se utiliza en
species, we will demonstrate it using only the space of entornos donde el objetivo principal es la predicción y
time, for this we will need the help of different tools se quiere estimar la precisión de un modelo que se
such as the different sounds of the birds, in addition we llevará a cabo a la práctica.1 Es una técnica muy
will know different methods of validation for to have utilizada en proyectos de inteligencia artificial para
basic characteristics of the audios of the birds for the validar modelos generados. La validación cruzada
classification of the same. consta de dos fases, entrenamiento y generación de
resultados. En estas fases se incluyen los pasos
Palabras clave: Validacion Cruzada, Transformada siguientes:
de Fourier, frecuencia, tiempo real, precision.
 Seleccionar una estructura de minería de datos
I.OBJETIVOS de destino
 Especificar los modelos que desea probar.
 Adquirir herramientas de análisis y abstracción que  Especificar el número de plegamientos en los
permitan resolver problemas en el espacio de la que desea crear particiones de los datos de la
frecuencia. estructura
 Determinar las ventajas y desventajas del uso del  Analysis Services crea y entrena tantos
espacio de Fourier para el análisis de señales. modelos como plegamientos.
 Aplicar la transformada de Fourier para tareas de  Para generar los resultados, debe especificar
clasificación. los parámetros de pruebas para los modelos
 Evidenciar los múltiples campos de aplicación de la entrenados.
teoría de la transformada de Fourier, junto con la  Especificación del origen de los datos de
capacidad para resolver problemas del ejercicio pruebas. (Esta característica sólo está
cotidiano del Bioingeniero. disponible cuando se usan los procedimientos
almacenados).
II.INTRODUCCIÓN  Especificar el atributo de predicción, el valor
de predicción y el umbral de precisión.
 A continuación, Analysis Services devuelve un
A) Primera aproximación para conjunto de métricas de precisión para cada
determinación de similitud en el dominio del uno de los plegamientos de cada modelo.
tiempo. También puede devolver métricas de precisión
para el conjunto de datos como un todo. [1]
Validación cruzada dejando uno fuera:

La validación cruzada dejando uno fuera o Leave-one-


out cross-validation (LOOCV) implica separar los
datos de forma que para cada iteración tengamos una
sola muestra para los datos de prueba y todo el resto
conformando los datos de entrenamiento.
La evaluación viene dada por el error, y en este tipo de
validación cruzada el error es muy bajo, pero en
cambio, a nivel computacional es muy costoso, puesto
que se tienen que realizar un elevado número de
iteraciones, tantas como N muestras tengamos y para
cada una analizar los datos tanto de entrenamiento
como de prueba. [2]

Figura 1: Validación Cruzada


Tomada de: https://es.wikipedia.org/wiki/Validaci%C3

Validación cruzada de K iteraciones:

En la validación cruzada de K iteraciones o K-fold


cross-validation los datos de muestra se dividen en K
subconjuntos. Uno de los subconjuntos se utiliza como
datos de prueba y el resto (K-1) como datos de
entrenamiento. El proceso de validación cruzada es
repetido durante k iteraciones, con cada uno de los
posibles subconjuntos de datos de prueba. Finalmente
se realiza la media aritmética de los resultados de cada
iteración para obtener un único resultado. Este método Figura 3: Dejando Uno Afuera.
Tomada de: https://www.wikipedia/validacioncruzada.com
es muy preciso puesto que evaluamos a partir de K
combinaciones de datos de entrenamiento y de prueba,
pero aun así tiene una desventaja, y es que, a diferencia
Nodo partición:
del método de retención, es lento desde el punto de vista
computacional. [2]
Los nodos de partición se utilizan para generar un
campo de partición que divide los datos en
subconjuntos o muestras independientes para las fases
de entrenamiento, comprobación y validación en la
generación del modelo. Si usa una muestra para generar
el modelo y otra muestra distinta para probarlo, podrá
obtener una buena indicación de la bondad del modelo
a la hora de generalizarlo a conjuntos de datos de mayor
tamaño similares a los datos actuales.
El nodo Partición genera un campo nominal con el
papel definido a Partición. Si lo prefiere, en el caso de
que un campo adecuado ya exista en los datos, puede
designarse como una partición utilizando un nodo Tipo.
En este caso no se requiere ningún nodo Partición
independiente. Se puede utilizar como partición
cualquier campo nominal instanciado con dos o tres
valores, pero no los campos con marcas. Consulte el
Figura 2: Validación Cruzada. tema Definición del papel de campos si desea obtener
Tomada de: https://www.wikipedia/validacioncruzada.com
más información. tiempo a dominio de frecuencia y viceversa. Estamos
En una ruta se pueden definir múltiples campos de acostumbrados a señales con dominio de tiempo en la
partición, pero, de hacerlo, será necesario seleccionar vida cotidiana. En el dominio de tiempo, la señal se
un campo de partición simple en la pestaña Campos de expresa con respecto al tiempo. En el dominio de
cada nodo de modelado que utilice la partición. (Si frecuencia, una señal es expresada con respecto a la
solamente hay una partición, se usará automáticamente frecuencia. [4]
siempre que se active la partición.) La transformada de Fourier, denominada así por Joseph
Activación de la partición. Para utilizar la partición en Fourier, es una transformación matemática empleada
un análisis, ésta debe estar activada en la pestaña para transformar señales entre el dominio del tiempo (o
Opciones de modelo en el nodo Análisis o la espacial) y el dominio de la frecuencia, en el caso de
generación de modelos adecuada. Si se anula esta una función periódica en el tiempo, la transformada de
opción, se posibilita la desactivación de la partición sin Fourier se puede simplificar para el cálculo de un
eliminar el campo. conjunto discreto de amplitudes complejas, llamado
coeficientes de las series de Fourier. Ellos representan
Particiones. Puede dividir los datos en dos muestras el espectro de frecuencia de la señal del dominio-
(Entrenamiento y comprobación) o en tres tiempo original.
(Entrenamiento, comprobación y validación). La transformada de Fourier es una aplicación que hace
corresponder a una función de valores complejos y
 Entrenamiento y comprobación. Divide los definidos en la recta, con otra función definida de la
datos en dos particiones de muestra, lo que manera siguiente:
permite entrenar el modelo con una muestra y
comprobarlo con otra.
 Entrenamiento, comprobación y
validación. Divide los datos en tres particiones
de muestra, lo que permite entrenar el modelo
Figura 5: transformada de Fourier.
con una muestra, comprobarlo y ajustarlo con Tomada de: https://es.wikipedia.org/wiki/Transformada_de_Fourier.
otra y validar los resultados con otra. Así se
reduce el tamaño de cada partición en En la práctica las variables suelen estar asociadas a
consecuencia y puede ser más adecuado al dimensiones como el tiempo (segundos) y frecuencia
trabajar con un conjunto de datos muy grande. (hercios) respectivamente, si se utiliza la fórmula
[3] alternativa. [5]

Figura 6: transformada de Fourier alternativa.


Tomada de: https://es.wikipedia.org/wiki/Transformada_de_Fourier

• Justificar el por qué lo encontrado en el


numeral anterior es importante para esta
práctica de laboratorio

Básicamente es importante esta validación ya que


tenemos una cantidad de audios muy elevada, de cada
categoría de aves se pueden sacar características
específicas las cuales posteriormente se pueden
Figura 4: Nodo Partición. evidenciar, esto hace la validación, coge esas
Tomada de: https://www.google.com.co/search?q=nodo+particion. características y reduce las búsquedas de cada audio
mirando unos pocos de cada categoría con esto
Trasformada de Fourier: optimizamos el trabajo y lo hacemos más rápido y
eficiente.
Una transformada de Fourier es una operación
matemática que transforma una señal de dominio de
• Escoger una de las estrategias
encontradas en el primer numeral para
que sea usada en el proceso de validación ¿El valor de precisión es suficiente para que la
de la herramienta de clasificación de herramienta sea usada en procesos de
sonidos de aves que usted diseñará clasificación Automática de sonidos de aves,
(justifique por qué seleccionó dicho reemplazando con ello a los especialistas en esta
método). tarea? (justifique su respuesta).

La validación escogida fue la validación cruzada de k Realizando la prueba de validación se puede evidenciar
interacciones o K-fold ya que esta validación me que tuvo una precisión del 27%, esto indica que con
permite coger un audio de las 7 carpetas que contienen solo este valor no es capaz de realizar procesos de
12 audios, de cada una de las carpetas cojo uno como clasificación autónomos ya que esta precisión es muy
prueba y los 11 restantes son de entrenamiento, con el baja para comparar cada audio y dirigirlo a
fin de disminuir el trabajo realizado y de acelerar el clasificación de ave.
proceso de clasificación de los mismos, teniendo los
audios de prueba después de repetidas interacciones le
realizo el proceso de la media a cada audio con el
propósito de tener un valor único especifico, este
método es un poco lento a la hora de computarizarlo,
pero el resultado es adecuado.

• Describir las etapas de pre-procesamiento


que necesita como método previo a la
comparación de los sonidos.
Teniendo en cuenta que la precisión dada por medio de
Las etapas del pre-procesamiento serian primero como la técnica de validación fue la siguiente 27% se podría
la adquisición de cualquier audio correspondiente a la decir que los audios utilizados o los procesos realizados
carpeta, es decir, que se pueda leer cualquier audio en no han sido de mayor selectividad a la hora de escoger
tiempo real, y eso hace básicamente con las funciones el audio, se podría decir que tomando diferentes valores
que proporciona MATLAB, la segunda etapa seria o diferentes audios se podría alcanzar una precisión
coger es audios de entrenamiento y escoger uno de mayor.
prueba de la carpeta correspondiente para después
poder sumarlos y sacarles el promedio, eso se hace para ¿Qué parámetros influyen en el desempeño de su
tener el valor del promedio de las carpetas, la tercera método de clasificación?
etapa del pre-procesamiento se puede decir que es la
diferencia entre el valor del promedio o de las medias Se podría decir que uno de los parámetros más
aritméticas de cada carpeta y hacer la diferencia al valor influyentes en el método de la clasificación es la
de los audios ya leídos de cada carpeta, con el propósito duración del audio, ya que con un audio que
de poder juntar todos esos valores para poder hallar una proporcione más características, es decir, que su tiempo
precisión más o menos confiable. sea más prolongado se podría percibir sonidos propios
de dichas aves, reconociendo las características como
la amplitud o el tiempo clasificando así la Ave.

¿Cómo podría aumentar la precisión de su


herramienta?

La precisión de la programación para clasificar las aves


de manera correcta podría ser de diferentes formas, una
podría deberse a que en la grabación de los audios se
encuentra mucho ruido, esos valores del ruido
interfieren con algunos patrones establecidos los cuales
III. ANÁLISIS DE RESULTADOS haría posible la clasificación directa de las aves, otra
manera de mejorar la precisión es cambiando la técnica incremento o redujo?
o mejorando la técnica de validación ya escogida, la
cual por alguna razón estaría funcionado El tiempo de clasificación esta vez aumento, ya no era
incorrectamente, de esta manera comparando los de manera intermedia para cada audio sino que
audios de las aves directamente se podrían clasificar, aumento su tiempo unos minutos retrasando la
otra manera de mejorar la precisión de la herramienta clasificación de las aves.
es trabajando solo en el espacio de las frecuencias, si
bien sabemos este espacio genera características ¿Cómo podría aumentar la precisión de su
específicas de las aves teniendo una facilidad a la hora método?
de clasificarlas, de esta forma nos evitaríamos buscar
diferentes datos para alcanzar el propósito de La precisión de mi método podría aumentar cambiando
clasificación, combinando las tres formas explicadas la el valor escogido en mi caso la media de cada audio, si
precisión llegaría a ser tan buena que directamente se se cambia ese valor o esa característica por otro podría
podría clasificar las aves sin ningún problema. aumentar la precisión de mi herramienta como
escogiendo la varianza de los datos, quizá este valor
¿Qué tan rápido puede ejecutar la clasificación aumente la precisión.
de un solo sonido mediante el uso de su
herramienta?, ¿Podría aplicar este algoritmo ¿Qué cambios tendría que hacer para que
para que la detección se haga en tiempo real? pudiera clasificar una grabación en tiempo real?

La herramienta clasifica al ave de una manera Los cambios que se le deberían hacer a la
intermedia, es decir no fue tan rápida la clasificación herramienta de clasificación son en el pre-
pero tampoco se demoró tanto en clasificar, esto puede procesamiento de los audios ya que en esa parte es
ser más rápido mejorando muchas partes de la donde los audios se demoran en leer, si aumentara
herramienta hasta el punto de hacerlo en tiempo real ya la velocidad de adquisición de los audios
que si se quiere clasificar el ave directamente con el
clasificaría de manera más rápida los sonidos de
sonido en vivo se tendrá que hacer de dicha forma, esto
ayudaría no solo a detectar cualquier tipo de ave sino a las aves.
muchos animales o diferentes ruidos del ecosistema.

B) Similitud en el dominio de la frecuencia. IV. CONCLUSIONES

¿El hecho de trabajar en el espacio de las  Trabajar en el espacio de la frecuencia siempre


va a tener sus ventajas ya que proporciona
frecuencias mejoró la precisión de su
resultados más eficientes, también es más fácil
herramienta?, ¿Por qué cree que esto sucedió? a la hora de escoger datos relevantes para la
clasificación de las aves.
Básicamente mejoro de un 27% a un 51% mi
 Se puede concluir que esta herramienta de
conclusión seria que trabajar en el espacio de las
clasificación no está limitada a si campo de
frecuencias es decir aplicando la transformada de
acción, es decir que se pueden tener múltiples
Fourier se cogen diferentes parámetros o datos los
aplicaciones para la misma, siempre y cuando
cuales ayudan a que el resultado sea más eficiente, no
se hagan los procesos indicados a la hora de
como los escogidos en el dominio normal, de esta
clasificar.
forma ya precisión incrementa significativamente a la
hora de hacer la clasificación de las aves.  A la hora de aplicar la transformada de Fourier
se evidencia como la precisión de la
herramienta mejora significativamente esto
quiere decir que aplicando diferentes procesos
matemáticos podemos tener una precisión más
cercana a la ideal.

¿El tiempo de clasificación por sonido se V. REFERENCIAS


[1]Microsoft, Validación Cruzada (Analysis
services-Mineria de Datos), SQL 2008.
[2]Wikipedia, Validación Cruzada, 2017.
[3] IBM Knowledge Center, Nodo Partición, SPSS
Modeler 15.0.0, 2012.
[4]National Instruments, Preguntras frecuentes,
2014.
[5] Dym, H., McKean, H. P., Fourier series and
Integrals. Academic Press, New York, 1972.

You might also like