Professional Documents
Culture Documents
Todos los sistemas de reconocedores de voz crean errores. Niños que gritan,
perros que ladran, y conversaciones externas pueden producir entradas de
informacion erroneas. Mucho de esto puede ser evitado solo con usar un
sistema en una sala silenciosa. También hay un problema con las palabras
homofonas, por ejemplo, "votar" y "botar". Este problema puede ser
solucionado algun dia mediante el uso de informacion contextual almacenada.
La variabilidad del habla producida por coarticulación y otros factores hacen del
análisis de la voz extremadamente difícil.
Para utilizar la voz como dato en aplicaciones tan diversas como el voice mail,
anotaciones en un texto o un directorio parlante, es necesario almacenar la voz
de manera que una computadora pueda recuperarla.
La presentación digital de la voz nos provee también con las bases para el
reconocimiento y síntesis de voz.
Por lo tanto la meta es capturar fielmente la señal con el menor número de bits.
•
o Memoria y Ancho de banda necesario para flexibilidad de uso
o Costo de transmisión.
o Diversos rangos de calidad
o Depende de la aplicación.
o Codificadores de Voz (algoritmo de…)
Algoritmos de codificación
Codificación y codificación
Para poder reproducir la señal análoga debe pasar por un filtro pasa-bajas a
la frecuencia de muestreo (quitar ruidos creados por el muestreo).
Si la señal varía más rápido se requiere una T más pequeña por lo tanto un
menor ancho de banda de frecuencias.
Teléfono : 3100Hz por lo tanto se muestrea a 8000 Hz, intelegible pero baja
calidad.
20Khz
El ancho de banda es mayor para instrumentos que para voz. Pero la diferencia
es audible!!
Por lo tanto se requiere mayor espacio para almacenar y transmitirla.
Ej.
Utilizando 4 bits se pueden representar 16 valores diferentes.
Con 8 bits ya son 256 valores.
a) Medición de características:
R(t) T(t)
dw(t)
m=w(n)
Restricciones w(I)=1
W(NT)=NR
Pasos
3) Pruebas