You are on page 1of 9

18 de abril, 2019

Introducción

 Espectrograma:
⊳ Tiene 3 dimensiones
- Eje (y) → frecuencia.
- Eje (x) → tiempo.
- Eje (z) → intensidad.
⊳ Mientras más claro es menos intenso, mientras más oscuro más intenso.
 Oscilograma:
⊳ Gráfico bidimensional de intensidad y tiempo.
⊳ Componente del oscilograma:
- Ataque: inicio → eutónico (contacto cordal suave), ataque vocal duro (inicio
abrupto de alta intensidad que luego se estabiliza y va decreciendo de manera
progresiva), ataque vocal soplado (inicio de intensidad progresiva, que va
aumentando en el tiempo) …
- Contorno: cuerpo → estable.
- Filatura: final → termina de manera normal.
 El sonido que se produce al salir es el resultado de la pulsación del aire sobre las
paredes de la laringe. Es un sonido puro, una sola frecuencia que se transmite en él.
 El sonido es el resultado de la pulsación de aire que se transmite en el tiempo. Si
estas pulsaciones de aire son más rápidas significa que las CCVV vibraron más
rápido, por lo tanto, el cerebro lo interpreta como que es más agudo. Si estas
pulsaciones son más lentas o se transmiten lentamente por el aire, el cerebro
interpreta que es un sonido más grave. En el espacio no hay sonido, porque no hay
partículas de aire por donde se pueda transmitir.
 La CV se cierra en diferentes etapas, en donde hay ciertas partículas de aire que
salen y otras que se devuelven y esto influye en el patrón vibratorio cordal.
 La CV emite pulsaciones de aire, pero que no son únicas, sino que más de una, y por
eso se dice que la CV produce una frecuencia fundamental con armónicos.
 La voz humana no es un tono puro, sino que es un tono complejo (F0 acompañado de
armónicos).
 Frecuencia: es un pulso de aire que depende del modo de vibración de la CV.
 Armónico:
⊳ Tiene que ver con la cuerda vocal.
⊳ Son frecuencias resultantes del modo de vibración de la CV que acompañan a la
frecuencia fundamental y que corresponden a múltiplos exactos de la frecuencia
fundamental
⊳ Ejemplo:
- Si tengo una F0 de 100Hz el siguiente armónico seria 100 x 2 = 200, el
siguiente armónico F0 x 3 = 300…
- Fórmula: F0 x n, donde n son los números naturales del 1 al infinito.
⊳ Los armónicos más agudos van perdiendo intensidad, son casi imperceptibles, ya
que a que a medida que con más agudos la intensidad va bajando.
18 de abril, 2019

⊳ El decrecimiento en intensidad de cada uno de los armónicos es de 12dB por


octava → 100 – 88 – 76 – 64…
⊳ Una octava es el momento donde la frecuencia se duplica a sí misma → 100 (1
octava) – 200 (2 octavas – 400 (3 octavas) – 800 (4 octavas) → es un aumento
exponencial.
 Formantes:
⊳ Tiene que ver con el tracto vocal.
⊳ Es una frecuencia natural de resonancia del tracto vocal que se va a traducir en
modificaciones (amplifica o atenúa) de la intensidad de los armónicos. Tienden a
ser moldes acústicos que van a modificar la intensidad de los armónicos y eso se
va a traducir en un sonido con un timbre diferente (timbre característico de la voz)
→ permiten amplificar o atenuar los armónicos en la medida que se modifica el
tracto vocal.
⊳ Dependiendo de donde resuene el sonido le va a entregar más energía a algunos
armónicos y los otros se van atenuar.
⊳ Las zonas donde el formante tiene su pic de intensidad, los armónicos que estén
cerca de él van a ganar energía y aquellos que van a estar lejos del pic van a
perder energía (ruido).
⊳ Formantes encontrados en un análisis acústico de una voz humana:
▪ Formantes lingüísticos → F1 y F2 → les otorgan un significado a las vocales.
▪ Formantes tímbricos → F3 y F4.
⊳ Hay personas que tienen 5 formantes, pero generalmente el formante 5 tiene que
ver con las personas con una voz especial y entrenada → formante del cantante.
 Praat
⊳ Analiza los armónicos en el tiempo.
⊳ Para cambiar a banda ancha o a banda estrecha se debe ir a: Spectrum →
Spectrogram setting → Window lenght (aquí es donde se cambian los valores
correspondientes a cada banda).
⊳ El Jitter y el Shimmer se puede obtiene en: Pulses → Show pulses → Voice report.

ANÁLISIS ACÚSTICO DE LA VOZ

Estudio
aerodinámico
Evaluación Funcional
Espectografía

Laboratorio de
Electroglotografía PRAAT
Voz

Exploración
Wave Surfer
neurofisiológica

Programa de
Speech Filig
análisis

Android Gram
Programas de
grabación
iOS Anangraf
18 de abril, 2019

Historia

Helmholzt
Espectógrafo
(1863) Análisis Técnicas
del sonido 2ª guerra
de instrumentales Transformación
Laboratorios mundial:
componentes Steinberg 1934 a señal digital
Bell Telephone análisis de
del sonido a Young, Schuk, (computacional)
Koening et al, mensajes
través del oído 1943
1946
Resonadores

La querían para espiar, saber identificar las voces de las personas y


descubrieron una forma de hacerlo a través del análisis acústico, ya
que es como una huella digital de las de la persona, porque va a tener
cierto armónico y según su timbre va amplificar o atenuar algunas.
Esto lo hacen a través de aparatos que tienen reconocimiento de voz,
lo que hacen es analizar el patrón acústico de la voz.
18 de abril, 2019

Obtención de la Muestra

 Lugar: Escaso ruido externo, o aislado acústicamente.


 Emisión: /a/ al menos 3 segundos; frases; glissando, etc. Idealmente en tono e
intensidad confortables.
 Micrófono: Baja impedancia, curva de respuesta de frecuencia plana (20-20.000 Hz),
unidireccional, de condensador, a 20 cm de la boca.

Análisis Acústico

 Medida indirecta del patrón vibratorio de las cuerdas vocales → nos entrega
información de los armónicos.
 Nos entrega información de la forma del tracto vocal y sus variaciones en el tiempo →
formantes.
 Se analizan las vocales.

 Ventajas
 Identificar componentes de la disfonía.
 Valorar la evolución a través de la evaluación transterapéutica.
 Sencilla utilización.

 Desventajas
 Variabilidad de la emisión.
 No sirve valorarlo por sí solo.
 Falta de estandarización de los resultados, unidades imprecisas.

 Frecuencia De Muestreo
 Teorema de Nyquist
⊳ No es necesaria una frecuencia infinita para retener toda la información de la
señal.
18 de abril, 2019

⊳ Frecuencia mínima de muestreo debe ser al menos del doble de la frecuencia


máxima → la frecuencia de muestro debe ser el doble de la frecuencia a
analizar.
 Frecuencia de muestreo: muestras x segundo
⊳ Cuando se hace un análisis acústico, lo que se hace es transformar una señal
acústica (pulsos de aire que se mueven en el aire) en una señal digital.
Entonces lo que hace la frecuencia de muestreo es cuantas fotos se le toman a
esta señal acústica para hacer una imagen general.
⊳ Le da fidelidad y calidad a la señal acústica.

 Selección de la muestra:
 Para el análisis → no considerar ataque ni “filatura” (final de emisión).
 Mínimo: 250 mseg.

Análisis Acústico: Frecuencia

 F0 (frecuencia que se mide en un tiempo determinado / tono o cantidad de ciclos por


segundo que se emitió en un tiempo dado) no es lo mismo que TMH (promedio de
todas las frecuencias que se utilizan al hablar).
 Rango frecuencial: 80-500 Hz (voz hablada).
 Extensión tonal (todo el rango de sonidos que se pueden emitir sin considerar la
comodidad y la estética): Pich min / Pich máx.
Tesitura: todos los tonos que se pueden emitir
 Análisis del contorno en el eje temporal. considerando la comodidad y la estética.

Análisis Acústico: Intensidad

 Forma de la onda sonora: "onda sonora y contorno adecuado para emisión dada" si
la amplitud va cambiando en el eje temporal "la forma y la amplitud se van
modificando a medida que transcurre la amplitud en el eje temporal “.
 Frecuencia v/s intensidad: intensidad se mantiene estable a medida que aumenta la
frecuencia, o son independientes.

Espectrograma

 Banda ancha (0.005): mejor análisis de los fenómenos del habla. Buena resolución
espectral (se ven mejor los formantes, donde se ven las zonas de mayor y menor
intensidad). No tiene buena resolución de los armónicos.
 Banda angosta (0.03): mejor análisis de los armónicos de la voz. Mejor resolución
temporal (se pueden ver los cambios que van ocurriendo en el tiempo).
18 de abril, 2019

Formante: Análisis

 Frecuencia: Fant (1956), el formante tiene un valor (número) que es el “pico o pick de
la envolvente que encierra los picos de los armónicos”
⊳ El pick del armónico con más intensidad es el número que le vamos a dar al
formante.
⊳ El formante no es algo que se pueda medir, no es algo cuantificable.
 Ancho de Banda: diferencia que hay entre los dos picos 3dB más debajo de la
frecuencia del formante. A menor valor, más aprovechamiento de energía
⊳ Distancia en Hz que hay entre un pick y otro, una vez que se baje 3dB sobre la
energía máxima (3dB menos el pick máximo).
Mientras más angosto es el formante el ancho de banda es más delgado y es
mejor, porque le va a entregar más energía a armónicos más específicos → voz
proyectada y con un timbre muy brillante.
⊳ Si el formante es más ancho, esa energía la va a distribuir a mucho más
armónicos, por lo tanto, es menos específico.

⊳ Hasta 2000 Hz el promedio es de 50 Hz.
⊳ F1: 80 Hz.
Cuando una voz es hipernasal hay un aumento de energía
⊳ F2: 100 Hz. cercana a los 3500Hz. El valor del formante 3° se modifica.
⊳ F3: 120 Hz.
 Nivel de intensidad: dB del formante, otorga la naturalidad del sonido.

Análisis de Armónicos

 Puede haber:
▪ Presencia de armónicos estables en toda la emisión → si estos armónicos se
mantienen estables a lo largo del tiempo.
▪ Presencia o ausencia de armónicos en todo el eje frecuencial.
▪ RASATI:
⊳ Ronquera: presencia de subarmónicos o ruido de fondo en las zonas o
frecuencias graves del espectrograma.
⊳ Aspereza: presencia de subarmónicos o ruido de fondo en las zonas agudas
del espectrograma.
⊳ Voz soplada: ausencia de armónicos en las zonas altas o agudas del
espectrograma → no hay armónicos en todo el eje frecuencial. Mientras más
soplada la voz menos armónicos.
⊳ Astenia: desaparición progresiva de las características de la voz, que puede
ser de intensidad o de los armónicos.
⊳ Tensión: armónicos más ennegrecidos, porque la tensión les agrega energía a
los armónicos.
18 de abril, 2019

⊳ Inestabilidad: cambios periódicos de la frecuencia en el tiempo, cambios


periódicos de la intensidad en el tiempo, lo que se va a traducir en armónicos
inestables en el tiempo o desapariciones bruscas de los armónicos.
 Armónicos presentes hasta zonas agudas (“se observan armónicos en toda la franja
frecuencial” “se empiezan a perder a partir de … "presenta armónicos en las
frecuencias bajas hasta 1500 Hz, zona a partir de la cual comienzan a desdibujarse y
comienzan a ser reemplazados por ruido, a partir de los 2500 Hz. A nivel perceptual
podemos considerar un soplo, o escape de aire lo que se refleja en el espectrograma
por la debilidad armónica y la presencia de ruido”).
 Presencia de subarmónicos
⊳ Son armónicos que están entremedio y que no correspondes a múltiplos de la de
la frecuencia fundamental, y por lo tanto es lo que conocemos como ruido.
⊳ Aspereza o ronquera = subarmónicos.

Ausencia de armónicos en
las zonas agudas del
espectrograma
considerando el eje
frecuencial. A partir de los
3000Hz hay ausencia de
armónicos.

 Ausencia de armónicos → soplocidad.

Parámetros de Ruido

Parámetro que nos objetivizan la presencia de ruido en la voz.

Establece la razón entre la energía de los armónicos y la energía que tiene el ruido, las descompone en partes y lo que
hace es cuantificarlas unas versus la otra. La idea es que haya mucha más presencia de energía de armónicos que de
ruido, que es lo más sano, entonces mientras más grande sea ese número es mejor (mayor a 20dB).
18 de abril, 2019

Medidas de Perturbación

 Qué tan estable o variable es la emisión del sonido.


 Son útiles solo en ciertos casos, ej:
 Según National Center for Voice and Speech: VOZ TIPO 1, 2 Y 3
▪ Tipo 1
- Señales casi periódicas.
- Confiable por sí solo (cuando son menores a 5%).
▪ Tipo 2
- Intermitencias, subarmónicos, aperiodicidades.
- Requiere apoyo de análisis espectral.
▪ Tipo 3
- Señales caóticas, aperiódicas.
- No es útil, mejor GRBAS o RASATI.

Medidas de Perturbación: Jitter

 Variaciones de la frecuencia ciclo a ciclo.


 Valor local:
⊳ Normal: 0.63
⊳ Vals límites (valor máximo hasta donde puede llegar): 1.04
 Causas:
▪ Neurológicas: Por falta de control del sistema nervioso sobre los músculos
vocales.
▪ Aerodinámicas: Cuando hay un defecto del cierre glótico que puede provocar un
escape de aire que haga vibrar irregularmente las cuerdas.
▪ Mecánicas: cuando hay asimetrías en la masa de las cuerdas o cambios en las
propiedades biomecánicas de éstas.
 Importante: descartar inicio y final de la emisión.
18 de abril, 2019

Medidas de perturbación: Shimmer

 Disminuye al aumentar la intensidad.


 Valor local:
⊳ Normal: 1.99
⊳ Vals límites: 3.81

Análisis Acústico del Canto

 Formante del cantante: Acumulación de energía en los formantes altos, cercano a


3000 Hz (Evaluar en /u/ /a/, nunca en la /i/ porque de por si refuerza F3).
 Sopranos: coincidencia de armónicos bajos con F1 y F2 → fenómeno de cobertura
 Registro modal o de pecho: predominio del segundo armónico. El coeficiente de
contacto es alto, el contacto cordal es espeso.
 Belting: sigue predominando el 2o armónico, pero es de cabeza.
 El de cabeza pasa el predominio del 2o armónico al primer armónico.
 Vibrato
⊳ Rate

 Formante del hablante: refuerzo del F3.

Vibrato

You might also like