You are on page 1of 26

ANÁLISIS ACÚSTICO DE LA

VOZ
ESPECTROGRAFÍA E ÍNDICES DE PERTURBACIÓN ACÚSTICA
Evaluación funcional Estudio
aerodinámico

Espectrografía

Electroglotografía PRAAT

Exploración
neurofisiológica Wave Surfer

Laboratorio de
Voz
Programas de Speech Filig
Análisis acústico system

Gram

Programas de Anangraf
grabación
Android

iOS
Un poco de historia…

Helmholzt (1863) Espectógrafo del


Técnicas
- Análisis de sonido
instrumentales 2ª guerra Transformación a
componentes del Laboratorios Bell
- Steinberg 1934 mundial: análisis señal digital
sonido a través Telephone
- Young, Schuk, de mensajes (computacional)
del oído Koening et al,
1943
- Resonadores 1946
1. Obtención de la muestra

 Lugar: Escaso ruido externo, o aislado acústicamente


 Emisión: /a/ al menos 3 segundos; frases; glissando, etc. Idealmente
en tono e intensidad confortables
 Micrófono: Baja impedancia, curva de respuesta de frecuencia
plana (20-20.000 Hz), unidireccional, de condensador, a 20 cm de
la boca.
Análisis acústico

Medida indirecta del Forma del tracto vocal y vocales


patrón vibratorio de las sus variaciones en el
cuerdas vocales tiempo
Análisis Acústico

Ventajas Desventajas

•Identificar •Variabilidad de
componentes la emisión
de la disfonía •No sirve valorarlo
•Valorar la por si solo
evolución, •Falta de
evaluación estandarización
transterapéutica de los resultados,
•Sencilla unidades
utilización imprecisas
Análisis acústico

 FRECUENCIA DE MUESTREO
 Teorema de Nyquist: No es necesaria una frecuencia infinita para
retener toda la información de la señal.
 Frecuencia mínima de muestreo debe ser al menos del doble de la
frecuencia máxima
 Frecuencia de muestreo: muestras x segundo
Análisis acústico

 Frecuencia de muestreo
 Teorema de Nyquist
 Selección de la muestra:
 Para el análisis  no considerar ataque ni “filatura” (final de
emisión)
 Mínimo 250 mseg.
Análisis Acústico: Frecuencia

 F0 = TMH?
 Rango frecuencial: 80-500 hz (voz hablada)
 Extensión tonal: Pich min / Pich máx.
 Análisis del contorno en el eje temporal
Análisis Acústico: Intensidad

 Forma de la onda sonora: "onda sonora y contorno adecuado


para emisión dada" si la amplitud va cambiando en el eje
temporal "la forma y la amplitud se van modificando a medida
que transcurre la amplitud en el eje temporal“
 Frecuencia v/s intensidad: Intensidad se mantiene estable a
medida que aumenta la frecuencia, o son independientes
ESPECTROGRAMA

 Banda ancha (0.005): mejor análisis de los


fenómenos del habla. Buena resolución
espectral
 Banda angosta (0.03): mejor análisis de los
armónicos de la voz. Mejor resolución temporal
Formante: análisis

 Frecuencia: Fant (1956) “pico de la envolvente que encierra los


picos de los armónicos”
 Ancho de Banda: Diferencia que hay entre los dos picos 3 dB más
debajo de la frecuencia del formante. A menor valor, mas
aprovechamiento deenergía
 Hasta 2000 hz el promedio es de 50 hz
 F1: 80 Hz
 F2: 100 Hz
 F3: 120 Hz
 Nivel de intensidad: dB del formante, otorga la naturalidad del
sonido
Análisis de Armónicos

 Presencia de armónicos estables en toda la emisión


 Armónicos presentes hasta zonas agudas (“se observan
armónicos en toda la franja frecuencial” “se empiezan a
perder a partir de … "presenta armónicos en las frecuencias
bajas hasta 1500 hz, zona a partir de la cual comienzan a
desdibujarse y comienzan a ser reemplazados por ruido, a
partir de los 2500 hz. A nivel perceptual podemos consierar un
soplo, o escape de aire lo que se refleja en el espectrograma
por la debilidad armónica y la presencia de ruido.”)
 Presencia de subarmónicos
 Ausencia de armónicos  soplocidad
ASPEREZA= SUBARMÓNICOS
Parámetros de ruido
Medidas de Perturbación
 Qué tan estable o variable es la emisión del sonido
 Son útiles solo en ciertos casos, ej:
 Según National Center for Voice and Speech: VOZ TIPO 1, 2 Y 3

Tipo 1 Tipo 2 Tipo 3

• Señales casi • Intermitencias, • Señales caóticas,


periódicas subarmónicos, aperódicas
• Confiable por si aperiodicidades • No es útil, mejor
solo. (cuando • requiere apoyo GRBAS o RASATI
son menores a de análisis
5%) espectral
Medidas de Perturbación: Jitter

 Variaciones de la frecuencia ciclo a ciclo


 Causas:
 Neurológicas: Por falta de control del sistema nervioso sobre los
músculos vocales
 Aerodinámicas: Cuando hay un defecto del cierre glótico que puede
provocar un escape de aire que haga vibrar irregularmente las
cuerdas.
 Mecánicas: cuando hay asimetrías en la masa de las cuerdas o
cambios en las propiedades biomecánicas de éstas.
 Importante: descartar inicio y final de la emisión.
Medidas de perturbación: jitter
Medidas de perturbación: Shimmer
 Disminuye al aumentar la intensidad
ANÁLISIS ACÚSTICO DEL CANTO

 Formante del cantante: Acumulación de energía en los formantes


altos, cercano a 3000 Hz (Evaluar en /u/ /a/, nunca en la /i/ porque
de por si refuerza F3)
 Sopranos: coincidencia de armónicos bajos con F1 y F2  fenómeno
de cobertura
Análisis acústico del canto

 registro modal o de pecho: predominio del segundo


armónico. El coeficiente de contacto es alto, el
contacto cordal es espeso.
 belting: sigue predominando el 2o armónico, pero es de
cabeza.
 el de cabeza pasa el predominio del 2o armónico al
primer armónico.
Análisis acústico del canto

 Vibrato
 Rate

*Formante del hablante: refuerzo del F3.


vibrato

You might also like