Professional Documents
Culture Documents
Tabla de contenidos
1. Introduccin ..................................................................................................................... 1 2. Descripcin de las funciones ................................................................................................ 3 1. vox_activatevcb ........................................................................................................ 4 2. vox_ApplyDictionary ................................................................................................. 6 3. vox_asr_init .............................................................................................................. 8 4. ATVOX_BUILTIN ...................................................................................................11 5. vox_chkwrd .............................................................................................................12 6. vox_clrrsp ...............................................................................................................13 7. vox_clrvad ..............................................................................................................14 8. vox_deactivatevcb ....................................................................................................15 9. vox_devclose ...........................................................................................................17 10. vox_dtmf_close ......................................................................................................18 11. vox_dtmf_open .......................................................................................................19 12. vox_dtmf_word ......................................................................................................20 13. vox_dtmf_write ......................................................................................................21 14. ATVOX_ERRMSGP ...............................................................................................22 15. vox_getasrlic ..........................................................................................................23 16. vox_GetDllVersion .................................................................................................25 17. vox_getparm ..........................................................................................................26 18. vox_getttslic ..........................................................................................................27 19. vox_getusedasrlic ....................................................................................................29 20. vox_getusedttslic ....................................................................................................30 21. ATVOX_IVCB ......................................................................................................31 22. ATVOX_LASTERR ................................................................................................32 23. vox_libclose ...........................................................................................................33 24. vox_libinit .............................................................................................................34 25. vox_loadcd ............................................................................................................36 26. vox_loadvcb ..........................................................................................................37 27. vox_nbest ..............................................................................................................39 28. ATVOX_NIND ......................................................................................................41 29. vox_playstr ............................................................................................................42 30. vox_playstr_close ...................................................................................................44 31. vox_playstr_open ....................................................................................................45 32. vox_playstr_read .....................................................................................................46 33. vox_playstr_release .................................................................................................47 34. vox_playstr_wait .....................................................................................................48 35. vox_prevcb ............................................................................................................49 36. vox_prevcbdev .......................................................................................................51 37. vox_prevcbex .........................................................................................................54 38. vox_prevcbex2 .......................................................................................................56 39. vox_reccfg_release ..................................................................................................59 40. vox_reccfg_wait .....................................................................................................61 41. vox_recind .............................................................................................................63 42. vox_recstr ..............................................................................................................65 43. vox_recstrm ...........................................................................................................67 44. vox_recstr_close .....................................................................................................69 45. vox_recstr_open .....................................................................................................70 46. vox_recstr_release ...................................................................................................71 47. vox_recstr_wait ......................................................................................................72 48. vox_recstr_write .....................................................................................................73 49. vox_RegisterVVICallback ........................................................................................74 50. vox_regsrvclose ......................................................................................................75 51. vox_SapiClose .......................................................................................................76 52. vox_SapiOpen ........................................................................................................77 53. vox_SapiOpenEx ....................................................................................................79 54. vox_SapiSelect .......................................................................................................80 55. vox_SerialNumber ..................................................................................................81 56. vox_SetAbbreviations ..............................................................................................81
57. vox_setcd ..............................................................................................................84 58. vox_SetDictionary ..................................................................................................85 59. vox_setparm ..........................................................................................................87 60. vox_setvcb ............................................................................................................88 61. vox_spk_addfile .....................................................................................................90 62. vox_spk_exist ........................................................................................................92 63. vox_spk_init ..........................................................................................................93 64. vox_spk_train .........................................................................................................94 65. vox_spk_verify .......................................................................................................96 66. vox_srvclose ..........................................................................................................98 67. vox_termplaystr ......................................................................................................99 68. vox_termrecstr ..................................................................................................... 100 69. vox_thclose .......................................................................................................... 101 70. vox_tts_init .......................................................................................................... 102 71. vox_ttsSetAbbreviations ......................................................................................... 104 72. vox_ttsSetDictionary ............................................................................................. 106 73. vox_unloadvcb ..................................................................................................... 108 74. vox_vsd_close ...................................................................................................... 110 75. vox_vsd_open ...................................................................................................... 111 76. vox_vsd_write ...................................................................................................... 113 77. vox_word ............................................................................................................ 114 78. vox_wordex ......................................................................................................... 115 79. vox_wordrule ....................................................................................................... 116 3. Estructuras de datos y parmetros ...................................................................................... 119 1. VX_RSP - Recognize String Parameter ....................................................................... 120 2. VAD_PRM - Voice Activity Detection Parameters ....................................................... 121 3. MODEATTRIBUTES - SAPI Speaker Id .................................................................... 125 4. Definicin de parmetros para vox_getparm() y vox_setparm() ....................................... 126 5. Obtencin de informacin adicional mediante vox_word o vox_wordex ............................ 134 4. Cdigo de ejemplos en C/C++ ........................................................................................... 137 1. Ejemplo Sncrono ................................................................................................... 138 2. Ejemplo de Deteccin de voz y de tonos DTMF ........................................................... 143 3. Ejemplo de uso del reconocimiento natural basado en modelos estadsticos (SLM) .............. 144 4. Ejemplo de SpeakerID ............................................................................................. 146 A. Ficheros utilizados por los ejemplos .................................................................................. 147 ndice .............................................................................................................................. 149
vi
Verbio Technologies
Lista de tablas
3.1. Parmetros globales en el Library SDK ............................................................................ 126 3.2. Parmetros de canal en el Library SDK ............................................................................ 129 3.3. Elementos de un vocabulario o gramtica ABNF ................................................................ 134
Lista de ejemplos
3.1. Informacin devuelta por el servidor de reconocimiento ...................................................... 135 4.1. Ejemplo sncrono de Verbio Library ................................................................................ 138 4.2. Ejemplo de Deteccin de voz y de tonos DTMF ................................................................. 143 4.3. Ejemplo de reconocimiento SLM .................................................................................... 144 4.4. Ejemplo de Verbio Library para verificacin del locutor ...................................................... 146
Captulo 1. Introduccin
El objectivo de este documento es describir el conjunto de funciones que constituyen el Library SDK proporcionado en Verbio. Este SDK est diseado pensando en aquellos integradores que trabajan en entornos de programacin C/C++ sobre dispositivos de audio genricos (tanto tarjetas CTI como tarjetas de sonido). Es compatible con las versiones antiguas de Verbio (IberVox 6.41 y anteriores), aunque en nuevos desarrollos es aconsejable utilizar la Advanced SDK, puesto que sta facilita el uso de las nuevas funcionalidades incorporadas en Verbio (aunque este SDK slo est disponible en entornos de programacin Microsoft Visual Studio). En el Captulo 2. Descripcin de las funciones se describen todas las funciones disponibles en el SDK. En el Captulo 3. Estructuras de datos y parmetros se describen las estructuras y parmetros comunes a las funciones del SDK. En el Captulo 4. Cdigo de ejemplos en C/C++ se incluyen 2 ejemplos de utilizacin de este SDK: un ejemplo de programacin sncrona y otro de deteccin de voz (VAD) y de tonos DTMF.
Captulo 2. funciones
Descripcin
de
las
1. vox_activatevcb
FUNCION int vox_activatevcb(int chdev, int vcbhandle, unsigned int mode) int chdev int vcbhandle unsigned int mode RETORNA descriptor de un canal vlido descriptor de un vocabulario o gramtica ABNF previamente cargado por compatibilidad con versiones anteriores, sese 0
INCLUDES MODO
voxlib.h sncrono
1.1. Descripcin
La funcin vox_activatevcb() activa el vocabulario previamente cargado en el canal especificado. El descriptor del vocabulario cargado se obtiene invocando a la funcin vox_loadvcb(). Cuando no deba utilizarse en el siguente proceso de reconocimiento, debe ser desactivado mediante la funcin vox_deactivatevcb().
1.3. Precauciones
En cualquier momento, pueden estar activos varios vocabularios y gramticas. El descriptor utilizado en la funcin vox_activatevcb() debe ser el valor retornado por la funcin vox_loadvcb(). La funcin ATVOX_IVCB() retorna el descriptor asociado al vocabulario que contiene la locucin reconocida. Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento.
1.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_VCBFILE EVX_INVWORD EVX_SYSTEM OUT OF MEMORY THE VOCABULARY FILE NAME IS NOT VALID. Check the vocabulary file name and path writing permission. THE VOCABULARY TRANSCRIPTION WAS NOT FOUND SYSTEM ERROR. Check errno.
Verbio Technologies
Verbio Technologies
2. vox_ApplyDictionary
FUNCION int vox_ApplyDictionary(const char *inVcbName, const char *outVcbName, const char *Dictionary) const char *inVcbName const char *outVcbName const char *Dictionary RETORNA nombre del fichero que contiene el vocabulario que debe procesarse nombre del fichero bajo el que se almacenar el fichero de vocabulario procesado nombre del fichero que contiene el vocabulario de excepciones
INCLUDES MODO
voxlib.h sncrono
2.1. Descripcin
La funcin vox_ApplyDictionary() genera un fichero de vocabulario a partir de otro original incluyendo las excepciones y acrnimos contenidos en el diccionario especificado.
Dictionary
2.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_NOMEM EVX_VCBFILE EVX_DICFILE OUT OF MEMORY THE VOCABULARY FILE NAME IS NOT VALID. Check the vocabulary file name and path writing permission. THE DICTIONARY FILE NAME IS NOT VALID. Check the dictionary file name.
Verbio Technologies
Verbio Technologies
3. vox_asr_init
FUNCION int vox_asr_init(const char *configuration, const char *defasrlng) const char *configuration const char *defasrlng RETORNA identificador de la configuracin de reconocimiento por defecto identificador del idioma de reconocimiento por defecto
INCLUDES MODO
voxlib.h sncrono
3.1. Descripcin
La funcin vox_asr_init() inicializa la librera de reconocimiento del habla de Verbio. En nuevos desarrollos es recomendable utilizar esta funcin (conjuntamente con la funcin vox_tts_init en caso de que tambin se requiera sntesis del habla) en lugar de la funcin vox_libinit, puesto que permite indicar al servidor los parmetros de inicializacin de una manera mucho ms concreta.
Espaol castellano + cataln + euskera + gallego Portugus Portugus brasileo Espaol argentino Espaol chileno Espaol colombiano
Verbio Technologies
especifica el idioma por defecto con el que trabaja la configuracin por defecto. En el caso de configuraciones monolinges es redundante, aunque s es imprescindible cuando se activa una configuracin multilinge. LNG_SPANISH LNG_CATALAN LNG_BASQUE LNG_GALICIAN LNG_PORTUGUESE LNG_PORTUGUESE_BRAZILIAN LNG_SPANISH_ARGENTINIAN LNG_SPANISH_CHILEAN LNG_SPANISH_COLOMBIAN LNG_SPANISH_MEXICAN LNG_SPANISH_VENEZUELAN LNG_FRENCH LNG_ENGLISH Espaol castellano Cataln Euskera Gallego Portugus Portugus brasileo Espaol argentino Espaol chileno Espaol colombiano Espaol mexicano Espaol venezolano Francs Ingls
3.3. Precauciones
La funcin vox_asr_init() debe invocarse antes que ninguna otra de las funciones del Library SDK relacionadas con el reconocimiento del habla, a excepcin de aquella destinada a establecer el servidor de trabajo por defecto en configuraciones cliente-servidor (vox_setparm).
3.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_INVSETUP EVX_NOMEM EVX_NOLICFILE EVX_INVLIC VERBIO INTERNAL ERROR. Files may be corrupted. Check disk and repeat Setup. OUT OF MEMORY. NO LICENSE FILE WAS FOUND. Run CheckOut to obtain a license file. THE LICENSE FILE IS NOT VALID. Run CheckOut to obtain a valid license file.
Verbio Technologies
EVX_SYSTEM
10
Verbio Technologies
4. ATVOX_BUILTIN
FUNCION int ATVOX_BUILTIN(int chdev) int chdev RETORNA descriptor de un canal vlido
0 para indicar que el resultado del reconocimiento no procede de una gramtica built-in 1 para indicar que el resultado del reconocimiento s procede de una gramtica built-in
INCLUDES MODO
voxlib.h sncrono
4.1. Descripcin
La funcin ATVOX_BUILTIN() indica si la gramtica que ha devuelto el resultado de reconocimiento al finalizar la llamada a la funcin vox_recind() o vox_nbest() es una gramtica interna (built-in) o no.
4.3. Precauciones
El valor devuelto por la funcin ATVOX_BUILTIN() nicamente es vlido despus de la correcta finalizacin de la funcin vox_recind() o vox_nbest().
Verbio Technologies
11
5. vox_chkwrd
FUNCION int vox_chkwrd(const char *word, int language) const char *word unsigned int language RETORNA puntero a la palabra del vocabulario que desea verificarse idioma del vocabulario
INCLUDES MODO
voxlib.h sncrono
5.1. Descripcin
La funcin vox_chkwrd() chequea la palabra del vocabulario especificada para garantizar que la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()) realizar la transcripcin de texto a fonema de forma correcta. Esta funcin es independiente del canal, por lo que nicamente debe ser llamada una vez para cada nueva palabra de los vocabularios, independientemente de si, con posterioridad, el vocabulario se usar en varios canales.
5.3. Precauciones
Esta funcin realiza una verificacin ms exhaustiva que la utilizada por la funcin vox_prevcb(). Por lo tanto, es posible que la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()) realice una correcta transcripcin a pesar de que la funcin vox_chkwrd() devuelva error. No obstante, es aconsejable corregir aquellas palabras incorrectas para conseguir una transcripcin ms precisa. Esta funcin nicamente est disponible para los idiomas castellano y cataln.
12
Verbio Technologies
6. vox_clrrsp
FUNCION void vox_clrrsp(VX_RSP *rspp) VX_RSP *rspp puntero a una estructura de tipo Recognition String Parameter
6.1. Descripcin
La funcin vox_clrrsp() resetea todos los campos de la estructura VX_RSP asignndoles sus valores por defecto. Es aconsejable utilizar esta funcin para inicializar cualquier estructura VX_RSP antes de ser utilizada por otras funciones.
6.3. Precauciones
La estructura RSP debe ser reseteada mediante la funcin vox_clrrsp() antes de modificar cualquiera de sus campos.
Verbio Technologies
13
7. vox_clrvad
FUNCION void vox_clrvad(VAD_PRM *prm) VAD_PRM *prm puntero a una estructura de tipo Voice Detection Parameter Activity
7.1. Descripcin
La funcin vox_clrvad() resetea todos los campos de la estructura VAD_PRM asignndoles sus valores por defecto. Es aconsejable utilizar esta funcin para inicializar cualquier estructura VAD_PRM antes de ser utilizada por otras funciones. Para conocer el contenido de la estructura y los valores por defecto que les asigna esta funcin, consulte el Captulo 3. Estructuras de datos y parmetros.
7.3. Precauciones
La estructura VAD_PRM debe ser reseteada mediante la funcin vox_clrvad antes de modificar cualquiera de sus campos.
14
Verbio Technologies
8. vox_deactivatevcb
FUNCION int vox_deactivatevcb(int chdev, int vcbhandle, unsigned int mode) int chdev int vcbhandle unsigned int mode RETORNA descriptor de un canal vlido descriptor de un vocabulario o gramtica ABNF previamente cargado y activado por compatibilidad con versiones anteriores, sese 0
INCLUDES MODO
voxlib.h sncrono
8.1. Descripcin
La funcin vox_deactivatevcb() desactiva un vocabulario o gramtica ABNF previamente cargado y activado en el canal especificado. El descriptor del vocabulario se obtiene al cargarlo mediante la funcin vox_loadvcb() y tambin debe usarse para activarlo mediante la funcin vox_activatevcb() o para descargarlo mediante la funcin vox_unloadvcb().
8.3. Precauciones
En cualquier momento, pueden estar activos varios vocabularios y gramticas. El descriptor utilizado en la funcin vox_deactivatevcb() debe ser el valor retornado por la funcin vox_loadvcb(). Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento.
8.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_VCBFILE EVX_INVWORD EVX_SYSTEM OUT OF MEMORY THE VOCABULARY FILE NAME IS NOT VALID. THE VOCABULARY TRANSCRIPTION WAS OT FOUND SYSTEM ERROR. Check errno.
Verbio Technologies
15
16
Verbio Technologies
9. vox_devclose
FUNCION int vox_devclose(int chdev) int chdev RETORNA descriptor de un canal vlido
INCLUDES MODO
voxlib.h sncrono
9.1. Descripcin
La funcin vox_devclose() libera los recursos consumidos por el canal especificado. Es aconsejable invocarla cuando la aplicacin no deba hacer uso de recursos de reconocimiento ni de sntesis por el canal indicado.
9.3. Precauciones
En aplicaciones cuyos descriptores de canal se creen y destruyan de forma permanente (es decir, que no son utilizados a lo largo de todo el tiempo de vida de la aplicacin) es muy recomandable invocar a esta funcin al finalizar el uso del cada canal. De este modo, se liberaran recursos (memoria, procesos, etc.) que pueden ser requeridos por los nuevos canales a utilizar.
9.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_NOLINE NO MORE LINES ARE AVAILABLE FOR THE SPECIFIED CHANNEL DEVICE
Verbio Technologies
17
10. vox_dtmf_close
FUNCION int vox_dtmf_close(int chdev, DTMF_REG* dtmfdev) int chdev DTMF_REG* dtmfdev RETORNA descriptor de un canal vlido descriptor de deteccin de tonos DTMF vlido
INCLUDES MODO
voxlib.h sncrono
10.1. Descripcin
La funcin vox_dtmf_close() cierra el desciptor de deteccin de tonos DTMF abierto mediante la funcin vox_dtmf_open y libera los recursos utilizados durante el proceso de deteccin de tonos DTMF.
18
Verbio Technologies
11. vox_dtmf_open
FUNCION DTMF_REG* vox_dtmf_open(int chdev, unsigned int mode) int chdev unsigned int mode RETORNA descriptor de un canal vlido formato de las muestras (Ley A, Ley Mu o lineal)
INCLUDES MODO
voxlib.h sncrono
11.1. Descripcin
La funcin vox_dtmf_open() inicializa el detector de tonos DTMF en el canal especificado, de modo que est preparado para empezar a recibir las muestras de audio mediante la funcin vox_dtmf_write(). El valor devuelto por la funcin es requerido por las funciones vox_dtmf_write() y vox_dtmf_close().
11.3. Precauciones
Una vez finalizado el proceso de deteccin de tonos DTMF, es imprescindible invocar a la funcin vox_dtmf_close para liberar los recursos de memoria utilizados durante el proceso de deteccin.
Verbio Technologies
19
12. vox_dtmf_word
FUNCION char* vox_dtmf_word(int chdev, const char *sequence) int chdev const char* sequence RETORNA descriptor de un canal vlido cadena de tonos DTMF recibida en el canal.
puntero a un vector de caracteres con el contenido de la palabra del vocabulario retornada por la gramtica, cuando se cumple una de sus alternativas. puntero nulo si la secuencia no cumple ninguna de las opciones contempladas por la gramtica DTMF.
INCLUDES MODO
voxlib.h sncrono
12.1. Descripcin
La funcin vox_dtmfword() devuelve un puntero a un vector de caracteres ASCIIZ con el contenido asociado a la secuencia de tonos DTMF recibido por el canal y contenidos en el vocabulario o gramtica activa en el canal.
20
Verbio Technologies
13. vox_dtmf_write
FUNCION const char* vox_dtmf_write(DTMF_REG* dtmfdev, const void *buffer, unsigned int n) DTMF_REG* dtmfdev const void *buffer unsigned int n RETORNA descriptor de deteccin de tonos DTMF vlido vector en el que se encuentran las muestras de audio que debe procesar el detector de tonos DTMF tamao del vector de muestras (en bytes)
puntero a un vector de caracteres con los tonos DTMF reconocidos en el vector de muestras acabado de procesar 0 (NULL) en caso de que no se haya detectado ningn tono DTMF en el vector de muestras acabado de procesar
INCLUDES MODO
voxlib.h sncrono
13.1. Descripcin
La funcin vox_dtmf_write() enva las muestras recibidas hacia el detector de tonos DTMF para ser procesadas. La funcin retorna los identificadores de los tonos DTMF detectados dentro de la ltima trama de muestras procesada. Los posibles identificadores son: 1 2 3 4 5 6 7 8 9 0 * # A B C D.
13.3. Precauciones
El vector de caracteres retornado es voltil, de modo que en las sucesivas invocaciones a esta funcin o a las funciones vox_dtmf_open y vox_dtmf_close su valor se ver modificado, siendo necesario su almacenamiento si se requiere un procesado posterior del resultado retornado.
Verbio Technologies
21
14. ATVOX_ERRMSGP
FUNCION char * ATVOX_ERRMSGP(int dev) int dev RETORNA INCLUDES MODO descriptor de un canal o -1 para funciones independientes del canal
vector de caracteres con una descripcin del error ocurrido en la ltima llamada a una funcin del SDK voxlib.h sncrono
14.1. Descripcin
La funcin ATVOX_ERRMSGP() devuelve un puntero a un vector ASCIIZ que describe el motivo del error producido durante la ltima llamada a una funcin de la librera Verbio. Este puntero es vlido a lo largo de la ejecucin de la aplicacin. Si no se ha producido ningn error durante la ltima llamada a una funcin, el vector contiene el valor "NO ERROR". Si el error se ha producido durante la llamada a una funcin dependiente del canal (vox_setvcb(), vox_recstr(), ...) el parmetro de entrada dev especifica el descriptor de canal vlido. Si el error se ha producido durante la llamada a una funcin independiente del canal (vox_libinit(), vox_prevcb(), vox_ApplyDictionary(), ...) debe utilizarse -1 como valor del parmetro dev.
22
Verbio Technologies
15. vox_getasrlic
FUNCION int vox_getasrlic(const char *configuration) const char *configuration RETORNA INCLUDES MODO identificador de la configuracin de reconocimiento de la que se desean consultar las licencias disponibles
15.1. Descripcin
La funcin vox_getasrlic() consulta el nmero de licencias de la configuracin especificada disponibles en total (adquiridas) en el servidor utilizado (aqul especificado antes de invocar a la funcin vox_libinit o vox_asr_init).
Espaol castellano + cataln + euskera + gallego Portugus Portugus brasileo Espaol argentino Espaol chileno Espaol colombiano Espaol mexicano Espaol venezolano Francs Ingls
Verbio Technologies
23
15.3. Precauciones
La funcin vox_getasrlic() debe invocarse una vez establecida la comunicacin con el servidor de reconocimiento al que se le solicita el nmero de licencias disponibles, entendiendo por disponibles el nmero mximo de peticiones de reconocimiento simultneas que pueden realizarse, en ese servidor, para la configuracin especificada.
24
Verbio Technologies
16. vox_GetDllVersion
FUNCION int vox_GetDllVersion(unsigned long *fileverp, unsigned long *prodverp) unsigned long *fileverp unsigned long *prodverp RETORNA nmero de versin del fichero DLL de VERBIO nmero de versin del producto
INCLUDES MODO
voxlib.h sncrono
16.1. Descripcin
La funcin vox_GetDllVersion() retorna el nmero de versin de la DLL de VERBIO tanto del fichero como del producto.
Verbio Technologies
25
17. vox_getparm
FUNCION int vox_getparm(int dev, unsigned long parm, void *valuep) int dev unsigned long parm void *valuep descriptor de un canal o -1 para parmetros globales de VERBIO (independientes del canal) parmetro del que se desea obtener el valor puntero a la variable en la que se almacenar el valor del parmetro solicitado
RETORNA
INCLUDES MODO
voxlib.h sncrono
17.1. Descripcin
La funcin vox_getparm() obtiene los valores actuales de los parmetros globales o dependientes del canal de VERBIO. Esta funcin puede obtener el valor de un nico parmetro en cada invocacin.
valuep
26
Verbio Technologies
18. vox_getttslic
FUNCION int vox_getttslic(const char *language) const char *language identificador del idioma de sntesis del que se desean consultar las licencias disponibles
18.1. Descripcin
La funcin vox_getttslic() consulta el nmero de licencias del idioma especificado disponibles en total (adquiridas) en el servidor utilizado (aqul especificado antes de invocar a la funcin vox_libinit o vox_tts_init).
18.3. Precauciones
La funcin vox_getttslic() debe invocarse una vez establecida la comunicacin con el servidor de sntesis al que se le solicita el nmero de licencias disponibles, entendiendo por disponibles el nmero mximo de peticiones de sntesis simultneas que pueden realizarse, en ese servidor, para el idioma especificado.
Verbio Technologies
27
28
Verbio Technologies
19. vox_getusedasrlic
FUNCION RETORNA INCLUDES MODO int vox_getusedasrlic() Nmero de licencias disponibles en el momento de la invocacin voxlib.h sncrono
19.1. Descripcin
La funcin vox_getusedasrlic() consulta el nmero de licencias de la configuracin especificada disponibles en un momento determinado (libres) en el servidor utilizado (aqul especificado antes de invocar a la funcin vox_libinit o vox_asr_init).
19.2. Precauciones
La funcin vox_getusedasrlic() devuelve el nmero de licencias disponibles en un momento determinado, para controlar la disponibilidad de las mismas antes de realizar una peticin. Puede combinarse tambin con las funciones vox_recstr_wait y vox_recstr_release.
Verbio Technologies
29
20. vox_getusedttslic
FUNCION RETORNA INCLUDES MODO int vox_getusedttslic() Nmero de licencias disponibles en el momento de la invocacin voxlib.h sncrono
20.1. Descripcin
La funcin vox_getusedttslic() consulta el nmero de licencias de la configuracin especificada disponibles en un momento determinado (libres) en el servidor utilizado (aqul especificado antes de invocar a la funcin vox_libinit o vox_tts_init).
20.2. Precauciones
La funcin vox_getusedttslic() devuelve el nmero de licencias disponibles en un momento determinado, para controlar la disponibilidad de las mismas antes de realizar una peticin. Puede combinarse tambin con las funciones vox_playstr_wait y vox_playstr_release.
30
Verbio Technologies
21. ATVOX_IVCB
FUNCION int ATVOX_IVCB(int chdev) int chdev RETORNA descriptor de un canal vlido
>=0 indicando el descriptor del vocabulario afectado por el ltimo resultado de reconocimiento -1 en caso de error
INCLUDES MODO
voxlib.h sncrono
21.1. Descripcin
La funcin ATVOX_IVCB() retorna el descriptor del vocabulario del que se ha reconocido una secuencia durante el ltimo proceso de reconocimiento. Este valor est disponible despus de la finalizacin de una llamada a las funciones vox_recind() o vox_nbest().
21.3. Precauciones
El valor devuelto por la funcin ATVOX_IVCB() slo es vlido tras la correcta finalizacin de la funcin vox_recind() o vox_nbest().
21.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_NORECIND NO RECIND. Call vox_recind() before calling ATVOX_IVCB().
Verbio Technologies
31
22. ATVOX_LASTERR
FUNCION long ATVOX_LASTERR(int dev) int dev RETORNA INCLUDES MODO nmero del error voxlib.h sncrono descriptor de un canal vlido o -1 para funciones independientes del canal
22.1. Descripcin
La funcin ATVOX_LASTERR() retorna un valor long que identifica el error que se ha producido durante la ltima llamada a una funcin del SDK de Verbio. Los errores estn definidos en voxlib.h. Si no se ha producido ningn error durante la ltima llamada a una funcin, el valor devuelto es 0. Si el error se ha producido durante la llamada a una funcin dependiente del canal (vox_setvcb(), vox_recstr(), ...) el parmetro de entrada dev especifica el descriptor de canal vlido. Si el error se ha producido durante la llamada a una funcin independiente del canal (vox_libinit(), vox_prevcb(), vox_ApplyDictionary(), ...) debe utilizarse -1 como valor del parmetro dev.
32
Verbio Technologies
23. vox_libclose
FUNCION RETORNA int vox_libclose() 0 si el resultado es satisfactorio -1 en caso de error INCLUDES MODO voxlib.h sncrono
23.1. Descripcin
La funcin vox_libclose libera las conexiones con el motor de sntesis y o reconocimiento del habla iniciadas mediante la funcin vox_libinit, vox_asr_init o vox_tts_init y libera todos los recursos utilizados por el cliente de Verbio. Una vez finalizada la funcin vox_libclose, no pueden invocarse otras funciones del SDK de Verbio desde el cliente afectado, exceptuando aquellas destinadas a establecer de nuevo la conexin con el servidor.
Verbio Technologies
33
24. vox_libinit
FUNCION int vox_libinit(int options) int options RETORNA identificador del idioma por defecto
INCLUDES MODO
voxlib.h sncrono
24.1. Descripcin
La funcin vox_libinit() inicializa la librera Verbio. El parmetro options especifica el idioma por defecto que utilizarn el servidor de reconocimiento y el servidor de sntesis. Esta funcin est incluida por compatibilidad con versiones anteriores, aunque en nuevos desarrollos es muy recomendable utilizar las nuevas funciones equivalentes vox_asr_init y/o vox_tts_init, segn las necesidades concretas.
24.3. Precauciones
La funcin vox_libinit() debe invocarse antes que ninguna otra de las funciones del Library SDK, a excepcin de aquella destinada a establecer el servidor de trabajo por defecto en configuraciones cliente-servidor (vox_setparm).
24.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error:
34
Verbio Technologies
VERBIO INTERNAL ERROR. Files may be corrupted. Check disk and repeat Setup. OUT OF MEMORY. NO LICENSE FILE WAS FOUND. Run CheckOut to obtain a license file. THE LICENSE FILE IS NOT VALID. Run CheckOut to obtain a valid license file. SYSTEM ERROR.Check errno.
Verbio Technologies
35
25. vox_loadcd
FUNCION int vox_loadcd(int chdev, unsigned int mode) int chdev unsigned int mode RETORNA descriptor de un canal vlido por compatibilidad con versiones anteriores, sese 0
INCLUDES MODO
voxlib.h sncrono
25.1. Descripcin
La funcin vox_loadcd() carga el vocabulario de dgitos conectados (consulte Seccin 57 para ms informacin) en el canal especificado. En caso satisfactorio, retorna un descriptor asociado con el vocabulario cargado para que ste pueda ser activado, desactivado y descargado mediante las funciones vox_activatevcb(), vox_deactivatevcb() y vox_unloadvcb() respectivamente.
25.3. Precauciones
Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento.
25.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_SYSTEM OUT OF MEMORY SYSTEM ERROR. Check errno.
36
Verbio Technologies
26. vox_loadvcb
FUNCION int vox_loadvcb(int chdev, const char *filename, unsigned int mode) int chdev const char *filename unsigned int mode RETORNA descriptor de un canal vlido nombre del vocabulario o de la gramtica ABNF/DTMF que debe cargarse vocabulario o gramtica ABNF o DTMF
INCLUDES MODO
voxlib.h sncrono
26.1. Descripcin
La funcin vox_loadvcb() carga el vocabulario o la gramtica ABNF o DTMF en el canal especificado. En caso satisfactorio, retorna un descriptor asociado con el vocabulario cargado para que ste pueda ser activado, desactivado y descargado mediante las funciones vox_activatevcb(), vox_deactivatevcb() y vox_unloadvcb() respectivamente.
GVX_ABNF GVX_DTMF
26.3. Precauciones
Sin la opcin GVX_ABNF habilitada, la funcin vox_loadvcb() requiere el fichero de definiciones y el fichero de transcripciones generados mediante la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()). Si estos ficheros existen y el fichero de vocabulario correspondiente no ha sido modificado desde que se llam a la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()), no es necesario volver a invocarlas antes de cargar el vocabulario mediante la funcin vox_loadvcb(). Con la opcin GVX_ABNF habilitada, la funcin vox_loadvcb() requiere el fichero de estados de la gramtica,
Verbio Technologies
37
el fichero de definiciones y el fichero de transcripciones generado mediante la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()). Si estos ficheros existen y la gramtica ABNF correspondiente no ha sido modificado desde que se llam a la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()), no es necesario volver a invocarlas antes de cargar la gramtica mediante la funcin vox_loadvcb(). Con la opcin GVX_DTMF la gramtica no crea ficheros adicionales resultados de la compilacin. Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento. La configuracin de reconocimiento activa en el momento de cargar la gramtica debe ser la misma que la existente en el momento de su preparacin. En caso contrario, aparecer el error THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words.
26.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_VCBFILE EVX_INVWORD EVX_SYSTEM OUT OF MEMORY. THE VOCABULARY FILE NAME IS NOT VALID. THE VOCABULARY TRANSCRIPTION WAS NOT FOUND. SYSTEM ERROR. Check errno.
38
Verbio Technologies
27. vox_nbest
FUNCION int vox_nbest(int chdev, int maxind, int *index, float *score, int ibest, unsigned int mode) int chdev int maxind int *index float *score int ibest unsigned int mode RETORNA descriptor de un canal vlido nmero mximo de palabras del conectadas o de palabras de la gramtica vocabulario
vector de enteros en el que se recibirn los ndices de las palabras reconocidas vector de float en el que se recibirn los ndices de confianza de las palabras reconocidas nmero de la hiptesis de inters por compatibilidad con versiones anteriores, sese 0
INCLUDES MODO
voxlib.h sncrono
27.1. Descripcin
La funcin vox_nbest() debe ser llamada al finalizar las funciones vox_recstr() (o vox_recstr_open() + vox_recstr_write() + vox_recstr_close()) para obtener los ndices y niveles de confianza de las palabras reconocidas correspondientes a la hiptesis ibest-sima. La funcin vox_nbest() es una extensin de la funcin vox_recind() para permitir la obtencin de mltiples hiptesis de reconocimiento de una misma locucin. El nmero mximo de hiptesis devuelto por el servidor de reconocimiento depende del parmetro VXCH_ACTIVE_NBEST (y VXCH_NBEST). Estos parmetros son dependientes del canal y deben ser especificados mediante la funcin vox_setparm() antes de iniciar el reconocimiento mediante las funciones vox_recstr() o vox_recstr_open(). El valor por defecto de ambos parmetros es 1. Si el nmero de palabras reconocidas es cero, index[0] contiene uno de los siguientes ndices especiales: IND_NOVOICE IND_NOWORD IND_EARLY_START No se ha detectado voz. No se ha reconocido ninguna palabra del vocabulario ni de la gramtica. No se ha detectado silencio inicial.
index
Verbio Technologies
39
este vector debe ser mayor o igual a maxind. score puntero a un vector de float que recibir los niveles de confianza de las palabras reconocidas. El nivel de confianza de cada ndice proporciona una medida de fiabilidad del reconocimiento, que puede ser utilizada para rechazar o pedir confirmacin de las palabras reconocidas. El tamao de este vector debe ser mayor o igual a maxind. nmero de la hiptesis de inters. El valor de este parmetro puede estar entre 0 (hiptesis ms fiable) y NBest-1, donde NBest es el mximo nmero de hiptesis activo en un canal especificado mediante la funcin vox_setparm() (parmetro VXCH_ACTIVE_NBEST).
ibest
27.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_NORECSTR NO RECOGNITION. Use vox_recstr() to start recognition.
40
Verbio Technologies
28. ATVOX_NIND
FUNCION int ATVOX_NIND(int chdev) int chdev RETORNA descriptor de un canal vlido
>=0 para indicar el nmero de palabras del vocabulario o de la gramtica reconocidas -1 en caso de error
INCLUDES MODO
voxlib.h sncrono
28.1. Descripcin
La funcin ATVOX_NIND() retorna el nmero de palabras del vocabulario o de la gramtica reconocidas despus de la finalizacin de la llamada a la funcin vox_recind() o vox_nbest().
28.3. Precauciones
El valor devuelto por la funcin ATVOX_NIND() nicamente es vlido despus de la correcta finalizacin de la funcin vox_recind() o vox_nbest().
28.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_NORECIND NO RECIND. Call vox_recind() before calling ATVOX_NIND().
Verbio Technologies
41
29. vox_playstr
FUNCION int vox_playstr(int chdev, const char *filename, const char *string, unsigned int mode) int chdev const char *filename const char *string unsigned int mode RETORNA descriptor de un canal vlido vector ASCIIZ con el nombre del fichero de audio en el que se almacenar la voz sinttica vector ASCIIZ con el texto que debe ser sintetizado formato de las muestras de audio
INCLUDES MODO
voxlib.h sncrono
29.1. Descripcin
La funcin vox_playstr() inicia la conversin de texto a voz del texto especificado. Una vez la funcin es invocada, la conversin continua hasta el final del texto.
29.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_SYSTEM SYSTEM ERROR. Check errno.
42
Verbio Technologies
vox_playstr_open
Verbio Technologies
43
30. vox_playstr_close
FUNCION int vox_playstr_close(int chdev, int playdev) int chdev int playdev RETORNA descriptor de un canal vlido descriptor de reproduccin vlido
INCLUDES MODO
voxlib.h sncrono
30.1. Descripcin
La funcin vox_playstr_close() cierra el descriptor de reproduccin abierto mediante la funcin vox_playstr_open y libera los recursos utilizados durante el proceso de sntesis.
44
Verbio Technologies
31. vox_playstr_open
FUNCION int vox_playstr_open(int chdev, char *string, unsigned int mode) int chdev char *string unsigned int mode RETORNA descriptor de un canal vlido vector ASCIIZ que contiene el texto a sintetizar formato de las muestras (Ley A o Ley Mu)
INCLUDES MODO
voxlib.h sncrono
31.1. Descripcin
La funcin vox_playstr_open() inicia la sntesis del texto especificado y no finaliza hasta que se haya sintetizado completamente. Las muestras de audio resultantes se obtendrn mediante la funcin vox_playstr_read(), utilizando el descriptor de reproduccin devuelto por la funcin vox_playstr_open().
31.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_SYSTEM SYSTEM ERROR. Check errno.
Verbio Technologies
45
32. vox_playstr_read
FUNCION int vox_playstr_read(int playdev, void *buffer, unsigned int count) int playdev void *buffer unsigned int count RETORNA descriptor de reproduccin vlido vector en el que se almacenarn las muestras de audio procedentes del sintetizador nmero de muestras a obtener (en bytes)
INCLUDES MODO
voxlib.h sncrono
32.1. Descripcin
La funcin vox_playstr_read() obtiene las muestras de audio generadas por la funcin vox_playstr_open(). La funcin retorna un nmero igual al nmero de bytes solicitados para indicar que todava no ha finalizado el proceso de sntesis. La funcin retorna un nmero de muestras menor que el solicitado para indicar que el servidor de sntesis ya no dispone de ms muestras de voz sinttica para entregar, por lo que no debe invocarse a la funcin vox_playstr_read() nuevamente.
vector en el que se almacenarn las muestras de audio procedentes del sintetizador. Debe tener un tamao igual o superior al nmero de muestras solicitadas mediante el parmetro n. cantidad de muestras solicitadas al sintetizador.
32.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_SYSTEM SYSTEM ERROR. Check errno.
46
Verbio Technologies
33. vox_playstr_release
FUNCION int vox_playstr_release(int chdev) int chdev RETORNA descriptor de un canal vlido
INCLUDES MODO
voxlib.h sncrono
33.1. Descripcin
La funcin vox_playstr_release() libera un recurso (licencia) de sntesis del habla reservado mediante la funcin vox_playstr_wait() en el canal especificado.
Verbio Technologies
47
34. vox_playstr_wait
FUNCION int vox_playstr_wait(int chdev, int ms) int chdev int ms RETORNA descriptor de un canal vlido tiempo mximo de espera para obtener un recurso (en milisegundos)
INCLUDES MODO
voxlib.h sncrono
34.1. Descripcin
La funcin vox_playstr_wait() reserva un recurso (licencia) de sntesis del habla para el canal especificado hasta que se libere mediante la funcin vox_playstr_release(). La funcin espera un mximo de ms milisegundos la disponibilidad de un recurso, transcurridos los cuales devuelve un error. El uso de esta funcin es aconsejable para gestionar el uso de los recursos (licencias) disponibles. En entornos en los que nunca se producirn ms peticiones simultneas de sntesis que licencias disponibles no es necesario su uso.
48
Verbio Technologies
35. vox_prevcb
FUNCION int vox_prevcb(const char *filename, unsigned int mode) const char *filename unsigned int mode puntero al nombre del fichero que contiene el vocabulario o la gramtica ABNF a preparar vocabulario convencional (lista de palabras) o gramtica ABNF
RETORNA
INCLUDES MODO
voxlib.h sncrono
35.1. Descripcin
Sin especificar el modo GVX_ABNF (vocabulario convencional), la funcin vox_prevcb() realiza la transcripcin fontica del contenido del fichero, almacenndola en un nuevo fichero binario con el mismo nombre que el del vocabulario pero con extensin ".trc". Esta funcin es independiente del canal y debe utilizarse una vez para cada vocabulario aunque ste se utilice en distintos canales (s es necesario invocar de nuevo a la funcin cuando se modifica dinmicamente el contenido del vocabulario). Cuando se especifica el modo GVX_ABNF (gramtica ABNF), la funcin vox_prevcb() compila la gramtica especificada. El resultado de la compilacin se almacena en un nuevo fichero de texto con el mismo nombre que la gramtica pero con extensin ".trx" (conteniendo el vocabulario de la gramtica) y en un nuevo fichero de texto con extensin ".grm" (conteniendo los estados de la gramtica). Tambin se realiza la trancripcin fontica que se almacena en un nuevo fichero binario con el mismo nombre que el de la gramtica pero con extensin ".trc". Esta funcin es independiente del canal y debe utilizarse una vez para cada gramtica aunque sta se utilice en distintos canales (s es necesario invocar de nuevo a la funcin cuando se modifica dinmicamente el contenido de la gramtica). En caso que deba preparar gramticas dinmicas en distintos canales, debe utilizarse la funcin vx_prevcbdev para evitar conflictos entre ellos. El vocabulario se preparar en el idioma y configuracin de reconocimiento especificados mediante la funcin vox_asr_init o bien mediante la funcin vox_setparm (parmetros VXCH_DEFASRCFG y VXCH_DEFASRLNG ). El idioma puede especificarse independientemente usando la funcin vx_prevcbex2.
35.3. Precauciones
La funcin vovx_prevcb() preparar el vocabulario en el idioma por defecto presente en el canal (excepto aquellas palabras que incorporen el identificador del idioma). Si desea especificarse un idioma distinto, deber utilizarse la funcin vox_prevcbex2(). La configuracin de reconocimiento activa en el momento de cargar la gramtica debe ser la misma que la
Verbio Technologies
49
existente en el momento de su preparacin. En caso contrario, aparecer el error THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words.
35.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_NOMEM EVX_VCBFILE EVX_PARSER EVX_INVWORD EVX_SYSTEM OUT OF MEMORY THE VOCABULARY FILE NAME IS NOT VALID. Check the vocabulary file name and path writing permission. ABNF PARSER ERROR. Check the ABNF grammar syntax. THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words SYSTEM ERROR. Check errno.
50
Verbio Technologies
36. vox_prevcbdev
FUNCION int vox_prevcbdev(int chdev, const char *filename, unsigned int mode, int *lpiword, const char *language) int chdev const char *filename unsigned int mode int *lpiword const char *language RETORNA descriptor de un canal vlido puntero al nombre del fichero que contiene el vocabulario o la gramtica ABNF a preparar vocabulario convencional (lista de palabras) o gramtica ABNF puntero que almacenar la lnea errnea del fichero en caso de error idioma en el que se preparar el vocabulario
INCLUDES MODO
voxlib.h sncrono
36.1. Descripcin
Sin especificar el modo GVX_ABNF (vocabulario convencional), la funcin vox_prevcbex2() realiza la transcripcin fontica del contenido del fichero en el canal indicado, almacenndola en un nuevo fichero binario con el mismo nombre que el del vocabulario pero con extensin ".trc". Esta funcin est indicada para preparar gramticas dinmicas que no pueden haberse preparado al lanzar la aplicacin mediante las funciones vox_prevcb, vox_prevcbex o vox_prevcbex2. Cuando se especifica el modo GVX_ABNF (gramtica ABNF), la funcin vox_prevcbex2() compila la gramtica especificada en el canal indicado. El resultado de la compilacin se almacena en un nuevo fichero de texto con el mismo nombre que la gramtica pero con extensin ".trx" (conteniendo el vocabulario de la gramtica) y en un nuevo fichero de texto con extensin ".grm" (conteniendo los estados de la gramtica). Tambin se realiza la trancripcin fontica que se almacena en un nuevo fichero binario con el mismo nombre que el de la gramtica pero con extensin ".trc". Para evitar conflictos entre gramticas preparadas simultneamente entre distintos canales, es absolutamente imprescindible evitar que canales distintos preparen gramticas con el mismo nombre. En caso de que se produjera este hecho, los resultados son imprevisibles. Por lo tanto, una estrategia recomendada es la de utilizar nombres de gramtica que incluyan tambin el identificador del canal. De este modo, se imposibilita la coincidencia de nombres de gramtica en canales distintos.
Verbio Technologies
51
lpiword language
en caso de error, este puntero contendr la lnea del fichero en la que se encuentra la primera palabra incorrecta. idioma en el que se preparar el vocabulario, independientemente del idioma por defecto establecido en el canal. El vocabulario se preparar en la configuracin de reconocimiento especificada mediante la funcin vox_asr_init o bien mediante la funcin vox_setparm (parmetro VXCH_DEFASRCFG). LNG_SPANISH LNG_CATALAN LNG_BASQUE LNG_GALICIAN LNG_PORTUGUESE LNG_PORTUGUESE_BRAZILIAN LNG_FRENCH LNG_ENGLISH LNG_SPANISH_MEXICAN LNG_SPANISH_ARGENTINIAN LNG_SPANISH_COLOMBIAN LNG_SPANISH_CHILEAN LNG_SPANISH_VENEZUELAN Espaol castellano Cataln Euskera Gallego Portugus Portugus brasileo Francs Ingls Espaol mexicano Espaol argentino Espaol colombiano Espaol chileno Espaol venezolano
36.3. Precauciones
La configuracin de reconocimiento activa en el momento de cargar la gramtica debe ser la misma que la existente en el momento de su preparacin. En caso contrario, aparecer el error THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words.
36.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_NOMEM EVX_VCBFILE EVX_PARSER EVX_INVWORD EVX_SYSTEM OUT OF MEMORY. THE VOCABULARY FILE NAME IS NOT VALID. Check the vocabulary file name and path writing permission. ABNF PARSER ERROR. Check the ABNF grammar syntax. THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words. SYSTEM ERROR. Check errno.
52
Verbio Technologies
Verbio Technologies
53
37. vox_prevcbex
FUNCION int vox_prevcbex(const char *filename, unsigned int mode, int *lpiword) const char *filename unsigned int mode int *lpiword puntero al nombre del fichero que contiene el vocabulario o la gramtica ABNF a preparar vocabulario convencional (lista de palabras) o gramtica ABNF puntero que almacenar la lnea errnea del fichero en caso de error
RETORNA
INCLUDES MODO
voxlib.h sncrono
37.1. Descripcin
Sin especificar el modo GVX_ABNF (vocabulario convencional), la funcin vox_prevcbex() realiza la transcripcin fontica del contenido del fichero, almacenndola en un nuevo fichero binario con el mismo nombre que el del vocabulario pero con extensin ".trc". Esta funcin es independiente del canal y debe utilizarse una vez para cada vocabulario aunque ste se utilice en distintos canales (s es necesario invocar de nuevo a la funcin cuando se modifica dinmicamente el contenido del vocabulario). Cuando se especifica el modo GVX_ABNF (gramtica ABNF), la funcin vox_prevcbex() compila la gramtica especificada. El resultado de la compilacin se almacena en un nuevo fichero de texto con el mismo nombre que la gramtica pero con extensin ".trx" (conteniendo el vocabulario de la gramtica) y en un nuevo fichero de texto con extensin ".grm" (conteniendo los estados de la gramtica). Tambin se realiza la trancripcin fontica que se almacena en un nuevo fichero binario con el mismo nombre que el de la gramtica pero con extensin ".trc". Esta funcin es independiente del canal y debe utilizarse una vez para cada gramtica aunque sta se utilice en distintos canales (s es necesario invocar de nuevo a la funcin cuando se modifica dinmicamente el contenido de la gramtica). En caso que deba preparar gramticas dinmicas en distintos canales, debe utilizarse la funcin vox_prevcbdev para evitar conflictos entre ellos. El vocabulario se preparar en el idioma y configuracin de reconocimiento especificados mediante la funcin vox_asr_init o bien mediante la funcin vox_setparm (parmetros VXCH_DEFASRCFG y VXCH_DEFASRLNG ). nicamente el idioma puede especificarse independientemente usando la funcin vox_prevcbex2.
en caso de error, este puntero contendr la lnea del fichero en la que se encuentra la primera palabra incorrecta.
37.3. Precauciones
54
Verbio Technologies
La funcin vovx_prevcbex() preparar el vocabulario en el idioma por defecto presente en el canal (excepto aquellas palabras que incorporen el identificador del idioma). Si desea especificarse un idioma distinto, deber utilizarse la funcin vox_prevcbex2(). La configuracin de reconocimiento activa en el momento de cargar la gramtica debe ser la misma que la existente en el momento de su preparacin. En caso contrario, aparecer el error THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words.
37.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_NOMEM EVX_VCBFILE EVX_PARSER EVX_INVWORD EVX_SYSTEM OUT OF MEMORY. THE VOCABULARY FILE NAME IS NOT VALID. Check the vocabulary file name and path writing permission. ABNF PARSER ERROR. Check the ABNF grammar syntax. THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words. SYSTEM ERROR. Check errno.
Verbio Technologies
55
38. vox_prevcbex2
FUNCION int vox_prevcbex2(const char *filename, unsigned int mode, int *lpiword, const char *language) const char *filename unsigned int mode int *lpiword const char *language RETORNA puntero al nombre del fichero que contiene el vocabulario o la gramtica ABNF a preparar vocabulario convencional (lista de palabras) o gramtica ABNF puntero que almacenar la lnea errnea del fichero en caso de error idioma en el que se preparar el vocabulario
INCLUDES MODO
voxlib.h sncrono
38.1. Descripcin
Sin especificar el modo GVX_ABNF (vocabulario convencional), la funcin vox_prevcbex2() realiza la transcripcin fontica del contenido del fichero, almacenndola en un nuevo fichero binario con el mismo nombre que el del vocabulario pero con extensin ".trc". Esta funcin es independiente del canal y debe utilizarse una vez para cada vocabulario aunque ste se utilice en distintos canales (s es necesario invocar de nuevo a la funcin cuando se modifica dinmicamente el contenido del vocabulario). Cuando se especifica el modo GVX_ABNF (gramtica ABNF), la funcin vox_prevcbex2() compila la gramtica especificada. El resultado de la compilacin se almacena en un nuevo fichero de texto con el mismo nombre que la gramtica pero con extensin ".trx" (conteniendo el vocabulario de la gramtica) y en un nuevo fichero de texto con extensin ".grm" (conteniendo los estados de la gramtica). Tambin se realiza la trancripcin fontica que se almacena en un nuevo fichero binario con el mismo nombre que el de la gramtica pero con extensin ".trc". Esta funcin es independiente del canal y debe utilizarse una vez para cada gramtica aunque sta se utilice en distintos canales (s es necesario invocar de nuevo a la funcin cuando se modifica dinmicamente el contenido de la gramtica). En caso que deba preparar gramticas dinmicas en distintos canales, debe utilizarse la funcin vox_prevcbdev para evitar conflictos entre ellos.
en caso de error, este puntero contendr la lnea del fichero en la que se encuentra la primera palabra incorrecta. idioma en el que se preparar el vocabulario, independientemente del idioma por defecto establecido en el canal. El vocabulario se preparar en la configuracin de reconocimiento especificada mediante la funcin vox_asr_init o bien mediante la funcin vox_setparm (parmetro VXCH_DEFASRCFG).
56
Verbio Technologies
LNG_SPANISH LNG_CATALAN LNG_BASQUE LNG_GALICIAN LNG_PORTUGUESE LNG_PORTUGUESE_BRAZILIAN LNG_FRENCH LNG_ENGLISH LNG_SPANISH_MEXICAN LNG_SPANISH_ARGENTINIAN LNG_SPANISH_COLOMBIAN LNG_SPANISH_CHILEAN LNG_SPANISH_VENEZUELAN
Espaol castellano Cataln Euskera Gallego Portugus Portugus brasileo Francs Ingls Espaol mexicano Espaol argentino Espaol colombiano Espaol chileno Espaol venezolano
38.3. Precauciones
La configuracin de reconocimiento activa en el momento de cargar la gramtica debe ser la misma que la existente en el momento de su preparacin. En caso contrario, aparecer el error THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words. Esta funcin est indicada para permitir preparar vocabularios y gramticas en distintos idiomas de la configuracin de reconocimiento activa en el motor. En caso de que se desee utilizar un idioma no contenido en la configuracin activa, es necesario activarla primero mediante la funcin vox_setparm (parmetro VXCH_DEFASRCFG). Por ejemplo, en caso de que est cargada la configuracin multilinge CFG_SPANISH_CATALAN, pueden prepararse gramticas en ambos idiomas utilizando esta funcin sin necesidad de cambiar la configuracin ni de idioma por defecto mediante la funcin vox_setparm (parmetro VXCH_DEFASRLANG).
38.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_NOMEM EVX_VCBFILE EVX_PARSER EVX_INVWORD EVX_SYSTEM OUT OF MEMORY. THE VOCABULARY FILE NAME IS NOT VALID. Check the vocabulary file name and path writing permission. ABNF PARSER ERROR. Check the ABNF grammar syntax. THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words. SYSTEM ERROR. Check errno.
Verbio Technologies
57
58
Verbio Technologies
39. vox_reccfg_release
FUNCION int vox_reccfg_release(int chdev, const char * cfg) int chdev const char* cfg descriptor de un canal vlido configuracin de la que se desea liberar una licencia o 0 para licencia de motor ASR
RETORNA
INCLUDES MODO
voxlib.h sncrono
39.1. Descripcin
La funcin vox_reccfg_release() libera un recurso (licencia) de reconocimiento del habla reservado mediante la funcin vox_reccfg_wait() en el canal especificado. De este modo, otras peticiones de licencias pendientes podrn ser atendidas por el recurso liberado.
Verbio Technologies
59
CFG_ENGLISH
US English
60
Verbio Technologies
40. vox_reccfg_wait
FUNCION int vox_reccfg_wait(int chdev, int ms, const char * cfg) int chdev int ms const char* cfg descriptor de un canal vlido tiempo mximo de espera para obtener un recurso (en milisegundos) configuracin de la que se desea reservar una licencia o 0 para licencia de motor ASR
RETORNA
INCLUDES MODO
voxlib.h sncrono
40.1. Descripcin
La funcin vox_reccfg_wait() es muy til para controlar que, en el momento de requerir una licencia de reconocimiento (ya sea de motor o de configuracin), se dispondr de una, evitndose de este modo el error en las funciones invocadas. En la Gua del Usuario se detallan los momentos en los que se consume una licencia aunque, a grandes rasgos, podra resumirse del siguiente modo: 1. Las licencias de motor se consumen durante el procesado de las muestras con la finalidad de obtener la palabra o palabras del vocabulario reconocidas. Por norma general, el intervalo de uso de este tipo de licencias es pequeo. 2. Las licencias de configuracin se empiezan a consumir desde que se establece un vocabulario en un canal o se manipula algn parmetro relacionado con el reconocimiento en un canal (NBEST, ACTIVE_NBEST, KLENGTH, GRMWEIGHT, GRMCONSTANT, RECMODE, DEACTWORD y ACTWORD ) hasta que se cambia a otra configuracin o se libera la licencia con la funcin miembro vox_reccfg_release(). Lgicamente, el tiempo de uso de estas licencias es superior al de las licencias de motor (el vocabulario debe haberse establecido con anterioridad y no puede liberarse hasta finalizado el reconocimiento), llegando incluso (segn la programacin) a estar ocupadas durante gran parte de la ejecucin. En aquellos entornos que dispongan de tantas licencias como lneas atendidas, no es necesario tomar ningn tipo de precaucin, de modo que el uso de estas funciones no aporta ninguna ventaja. Sin embargo, para evitar errores de funcionamiento debidos a falta de licencia en momentos puntuales en aquellos entornos que atiendan ms lneas que licencias disponen, s es muy aconsejable tener la precaucin de reservar con antelacin una licencia de motor y/o de configuracin. De este modo, si no se obtiene la licencia en el momento deseado, se podr mantener al usuario a la espera de forma controlada (por ejemplo, haciendo sonar msica ambiental hasta que se disponga del recurso). La funcin vox_reccfg_wait() reserva un recurso (licencia) de reconocimiento del habla para el canal especificado hasta que se libere mediante la funcin vox_reccfg_release(). La funcin espera un mximo de ms milisegundos la disponibilidad de un recurso, transcurridos los cuales devuelve un error.
Verbio Technologies
61
NULL o 0 CFG_SPANISH CFG_SPANISH_CATALAN CFG_SPANISH_BASQUE CFG_SPANISH_GALICIAN CFG_SPANISH_CATALAN_BASQUE_GALICIAN CFG_PORTUGUESE CFG_PORTUGUESE_BRAZILIAN CFG_SPANISH_MEXICAN CFG_SPANISH_ARGENTINIAN CFG_SPANISH_CHILEAN CFG_SPANISH_VENEZUELAN CFG_SPANISH_COLOMBIAN CFG_FRENCH CFG_ENGLISH
Reserva una licencia de motor de reconocimiento Espaol castellano Espaol castellano + cataln Espaol castellano + euskera Espaol castellano + gallego Espaol castellano + cataln + euskera + gallego Portugus Portugus brasileo Espaol mexicano Espaol argentino Espaol chileno Espaol venezolano Espaol colombiano Francs US English
40.3. Precauciones
A pesar de que no es necesario este control de acceso a las licencias, su prctica es altamente recomendable en aquellos entornos en los que se sobreexplotan las licencias de reconocimiento para evitar errores de reconocimiento indeseados debidos a la falta de licencias disponibles en un momento puntual. Una vez finalizada la peticin de reconocimiento, debe liberarse inmediatamente la licencia mediante la funcin vox_reccfg_release para permitir que peticiones que estn esperando en cola puedan ser procesadas rpidamente.
Atencin
Cuando se reserva licencia para una configuracin, automticamente se descarga la configuracin anterior activa hasta ese momento.
62
Verbio Technologies
41. vox_recind
FUNCION int vox_recind(int chdev, int maxind, int *index, float *score, unsigned int mode) int chdev int maxind int *index float *score unsigned int mode RETORNA descriptor de un canal vlido nmero mximo de palabras del conectadas o de palabras de la gramtica vocabulario
vector de enteros en el que se recibirn los ndices de las palabras reconocidas vector de float en el que se recibirn los ndices de confianza de las palabras reconocidas por compatibilidad con versiones anteriores, sese 0
INCLUDES MODO
voxlib.h sncrono
41.1. Descripcin
La funcin vox_recind() debe ser llamada al finalizar las funciones vox_recstr() o vox_recstr_open() para obtener los ndices y niveles de confianza de las palabras reconocidas. Si el nmero de palabras reconocidas es cero, index[0] contiene uno de los siguientes ndices especiales: IND_NOVOICE IND_NOWORD IND_EARLY_START No se ha detectado voz. No se ha reconocido ninguna palabra del vocabulario ni de la gramtica. No se ha detectado silencio inicial.
index score
mode
Verbio Technologies
63
41.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_NORECSTR NO RECOGNITION. Use vox_recstr() to start recognition.
64
Verbio Technologies
42. vox_recstr
FUNCION int vox_recstr(int chdev, const char *filename, VX_RSP *rspp, unsigned int mode) int chdev const char *filename VX_RSP *rspp unsigned int mode RETORNA descriptor de un canal vlido vector ASCIIZ con el nombre del fichero que contiene las muestras de voz a reconocer puntero a una estructura del tipo Recognition String Parameter formato de las muestras de audio
INCLUDES MODO
voxlib.h sncrono
42.1. Descripcin
La funcin vox_recstr() inicia el reconocimiento de la seal de voz almacenada en el fichero. La funcin vox_recstr() acepta condiciones de terminacin adicionales especificadas mediante la estructura VX_RSP pasada como parmetro. Una vez invocada la funcin vox_recstr(), el proceso de reconocimiento continua hasta que se cumpla alguna de las condiciones de terminacin establecidas mediante la estructura VX_RSP. El formato del fichero que contiene las muestras de voz debe ser PCM lineal, Ley A o Ley Mu, 8 KHz y sin control automtico de ganancia.
mode
42.3. Precauciones
Verbio Technologies
65
La funcin vox_setvcb() (o vox_loadvcb() + vox_activatevcb()) debe ser llamada previamente a la funcin vox_recstr() para establecer el vocabulario o gramtica activo. La estructura VX_RSP utilizada como argumento de la funcin vox_recstr() debe ser inicializada a sus valores por defecto mediante la funcin vox_clrrsp() antes de modificar los valores de sus campos.
42.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_SYSTEM EVX_NOSETVCB SYSTEM ERROR. Check errno. NO ACTIVE VOCABULARY. Use vox_setvcb() to set the active vocabulary.
66
Verbio Technologies
43. vox_recstrm
FUNCION int vox_recstrm(int chdev, void *samp, int nsamp, VX_RSP *rspp, unsigned int mode) int chdev void *samp int nsamp VX_RSP *rspp unsigned int mode RETORNA descriptor de un canal vlido vector que contiene las muestras de voz a reconocer tamao del vector de muestras puntero a una estructura del tipo Recognition String Parameter formato de las muestras de audio
INCLUDES MODO
voxlib.h sncrono
43.1. Descripcin
La funcin vox_recstrm() inicia el reconocimiento de la seal de voz almacenada en memoria. La funcin vox_recstrm() acepta condiciones de terminacin adicionales especificadas mediante la estructura VX_RSP pasada como parmetro. Una vez invocada la funcin vox_recstrm(), el proceso de reconocimiento continua hasta que se cumpla alguna de las condiciones de terminacin establecidas mediante la estructura VX_RSP. El formato de las muestras de voz almacenadas en memoria debe ser PCM lineal, Ley A o Ley Mu, 8 KHz y sin control automtico de ganancia.
mode
Verbio Technologies
67
43.3. Precauciones
La funcin vox_setvcb() (o vox_loadvcb() + vox_activatevcb()) debe ser llamada previamente a la funcin vox_recstrm() para establecer el vocabulario o gramtica activo. La estructura VX_RSP utilizada como argumento de la funcin vox_recstrm() debe ser inicializada a sus valores por defecto mediante la funcin vox_clrrsp() antes de modificar los valores de sus campos.
43.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_SYSTEM EVX_NOSETVCB SYSTEM ERROR. Check errno. NO ACTIVE VOCABULARY. Use vox_setvcb() to set the active vocabulary.
68
Verbio Technologies
44. vox_recstr_close
FUNCION int vox_recstr_close(int chdev, int recdev) int chdev int recdev RETORNA descriptor de un canal vlido descriptor de grabacin vlido
INCLUDES MODO
voxlib.h sncrono
44.1. Descripcin
La funcin vox_recstr_close() cierra el descriptor de grabacin abierto mediante la funcin vox_recstr_open y libera los recursos utilizados durante el proceso de reconocimiento.
Verbio Technologies
69
45. vox_recstr_open
FUNCION int vox_recstr_open(int chdev, VX_RSP *rspp, unsigned int mode) int chdev VX_RSP *rspp unsigned int mode RETORNA descriptor de un canal vlido puntero a una estructura del tipo Recognition String Parameter formato de las muestras (Ley A o Ley Mu)
INCLUDES MODO
voxlib.h sncrono
45.1. Descripcin
La funcin vox_recstr_open() inicializa el servidor de reconocimiento en el canal especificado, de modo que est preparado para empezar a recibir las muestras de audio mediante la funcin vox_recstr_write(). El valor devuelto por la funcin es requerido por las funciones vox_recstr_write() y vox_recstr_close().
mode
45.3. Precauciones
Una vez finalizado el reconocimiento, es imprescindible invocar a la funcin vox_recstr_close para liberar los recursos de memoria utilizados durante el proceso de reconocimiento.
70
Verbio Technologies
46. vox_recstr_release
FUNCION int vox_recstr_release(int chdev) int chdev RETORNA descriptor de un canal vlido
INCLUDES MODO
voxlib.h sncrono
46.1. Descripcin
La funcin vox_recstr_release() libera un recurso (licencia) de reconocimiento del habla reservado mediante la funcin vox_recstr_wait() en el canal especificado. Esta funcin se incluye por compatibilidad con versiones anteriores, aunque debera caer en desuso. Para nuevos desarrollos es aconsejable utilizar la funcin vox_reccfg_release.
Verbio Technologies
71
47. vox_recstr_wait
FUNCION int vox_recstr_wait(int chdev, int ms) int chdev int ms RETORNA descriptor de un canal vlido tiempo mximo de espera para obtener un recurso (en milisegundos)
INCLUDES MODO
voxlib.h sncrono
47.1. Descripcin
La funcin vox_recstr_wait() reserva un recurso (licencia) de reconocimiento del habla para el canal especificado hasta que se libere mediante la funcin vox_recstr_release(). La funcin espera un mximo de ms milisegundos la disponibilidad de un recurso, transcurridos los cuales devuelve un error. El uso de esta funcin es aconsejable para gestionar el uso de los recursos (licencias) disponibles. En entornos en los que nunca se producirn ms peticiones simultneas de reconocimiento que licencias disponibles no es necesario su uso. Esta funcin se incluye por compatibilidad con versiones anteriores, aunque debera caer en desuso. Para nuevos desarrollos es aconsejable utilizar la funcin vox_reccfg_wait.
72
Verbio Technologies
48. vox_recstr_write
FUNCION int vox_recstr_write(int recdev, const void *buffer, unsigned int n) int recdev const void *buffer unsigned int n RETORNA descriptor de grabacin vlido vector en el que se encuentran las muestras de audio que debe procesar el reconocedor tamao del vector de muestras (en bytes)
INCLUDES MODO
voxlib.h sncrono
48.1. Descripcin
La funcin vox_recstr_write() enva las muestras recibidas hacia el servidor de reconocimiento. La funcin retorna un nmero igual al nmero de bytes contenidos en el vector de muestras para indicar que todava no ha finalizado el proceso de reconocimiento y que, por lo tanto, es necesario seguir invocando a esta funcin con nuevas muestras de audio. La funcin retorna un nmero de muestras menor que el tamao del vector de muestras para indicar que el servidor de reconocimiento ya no acepta ms muestras debido a que se ha cumplido alguna de las condiciones de terminacin especificadas en la funcin vox_recstr_open.
Verbio Technologies
73
49. vox_RegisterVVICallback
FUNCION int vox_RegisterVVICallback(int chdev, int (*function)(const char *, unsigned long, size_t)) int chdev descriptor de un canal vlido
RETORNA
int funcin de callback que ser invocada cada vez que el (*function)(const motor de lenguaje estadstico disponga de un nuevo resultado. char *, unsigned long, size_t) 0 si el resultado es satisfactorio -1 en caso de error
INCLUDES MODO
voxlib.h sncrono
49.1. Descripcin
La funcin vox_RegisterVVICallback() especifica una funcin de callback que ser la encargada de recibir los resultados que el motor de lenguaje natural de Verbio vaya generando durante el anlisis de las muestras de audio. Esta funcin es invocada automticamente cada vez que el motor de reconocimiento dispone de nuevos resultados.
74
Verbio Technologies
50. vox_regsrvclose
FUNCION int vox_regsrvclose(VX_SRVCLOSE function) VX_SRVCLOSE function RETORNA INCLUDES MODO voxlib.h sncrono funcin de callback que atender el evento de desconexin
50.1. Descripcin
La funcin vox_regsrvclose() permite especificar una funcin (opcional) que ser invocada en cuanto se detecte una desconexin entre el cliente y el servidor de sntesis y/o reconocimiento.
Verbio Technologies
75
51. vox_SapiClose
FUNCION int vox_SapiClose(int chdev, HSAPI pmode) int chdev HSAPI pmode RETORNA descriptor de un canal vlido descriptor de un motor de sntesis compatible SAPI
INCLUDES
speech.h voxlib.h
MODO
sncrono
51.1. Descripcin
La funcin vox_SapiClose() cierra un motor de sntesis compatible con SAPI previamente abierto mediante la funcin vox_SapiOpen().
76
Verbio Technologies
52. vox_SapiOpen
FUNCION int vox_SapiOpen(int chdev, TTSMODEINO *TTSModeInfo, HSAPI *pmode, unsigned int mode) int chdev TTSMODEINO *TTSModeInfo HSAPI *pmode unsigned int mode RETORNA descriptor de un canal vlido puntero a una estructura del tipo Text-to-Speech Information puntero que recibir el descriptor del motor de sntesis SAPI abierto por compatibilidad con versiones anteriores, sese 0
INCLUDES
speech.h voxlib.h
MODO
sncrono
52.1. Descripcin
La funcin vox_SapiOpen() abre el motor de sntesis compatible SAPI que mejor se adapta a los requisitos especificados mediante la estructura TTSMODEINFO en caso de existir. Una vez finalizada satisfactoriamente la funcin vox_SapiOpen(), el motor de sntesis abierto puede ser seleccionado mediante la funcin vox_SapiSelect(), especificando el descriptor obtenido. El motor de sntesis debe ser cerrado mediante la funcin vox_SapiClose().
52.3. Errores
Si no se encuentra ningn motor de sntesis que se adapte mnimamente a las especificaciones contenidas en la estructura TTSMODEINFO, la funcin retorna -1 para indicar que se ha producido un error.
Verbio Technologies
77
78
Verbio Technologies
53. vox_SapiOpenEx
FUNCION int vox_SapiOpenEx(int chdev, PMODEATTRIBUTES ttsattributes, HSAPI *pmode) int chdev PMODEATTRIBUTES ttsattributes HSAPI *pmode descriptor de un canal vlido puntero a una estructura del tipo MODEATTRIBUTES puntero que recibir el descriptor del motor de sntesis SAPI abierto
RETORNA
INCLUDES
speech.h voxlib.h
MODO
sncrono
53.1. Descripcin
La funcin vox_SapiOpenEx() abre el motor de sntesis compatible SAPI que mejor se adapta a los requisitos especificados mediante la estructura MODEATTRIBUTES en caso de existir. Una vez finalizada satisfactoriamente la funcin vox_SapiOpenEx(), el motor de sntesis abierto puede ser seleccionado mediante la funcin vox_SapiSelect(), especificando el descriptor obtenido. El motor de sntesis debe ser cerrado mediante la funcin vox_SapiClose().
53.3. Errores
Si no se encuentra ningn motor de sntesis que se adapte mnimamente a las especificaciones contenidas en la estructura MODEATTRIBUTES, la funcin retorna -1 para indicar que se ha producido un error.
Verbio Technologies
79
54. vox_SapiSelect
FUNCION int vox_SapiSelect(int chdev, HSAPI pmode) int chdev HSAPI pmode RETORNA descriptor de un canal vlido descriptor de un motor de sntesis compatible SAPI
INCLUDES
speech.h voxlib.h
MODO
sncrono
54.1. Descripcin
La funcin vox_SapiSelect() selecciona el motor de sntesis compatible SAPI abierto previamente mediante la funcin vox_SapiOpen(). Una vez invocada satisfactoriamente la funcin vox_SapiSelect(), el motor de sntesis compatible SAPI seleccionado estar activo en el canal hasta la siguiente llamada a esta funcin o a la funcin vox_SapiClose().
54.3. Errores
Si no existe un motor de sntesis asociado con el descriptor especificado, la funcin retorna -1 para indicar que se ha producido un error.
80
Verbio Technologies
55. vox_SerialNumber
FUNCION RETORNA INCLUDES MODO const char* vox_SerialNumber(void) Nmero de serie de Verbio voxlib.h sncrono
55.1. Descripcin
La funcin vox_SerialNumber() retorna un puntero a carcter conteniendo el nmero de serie correspondiente a la versin servidor de Verbio.
55.2. Precauciones
El nmero de serie nicamente est disponible tras el establecimiento de la comunicacin entre cliente y servidor mediante alguna de las siguientes funciones: vox_libinit, vox_asr_init o vox_tts_init.
Verbio Technologies
81
56. vox_SetAbbreviations
FUNCION int vox_SetAbbreviations(int *filename) int chdev const char *mcLang const char *filename chdev, const char *mcLang, const char
descriptor de un canal vlido especifica el idioma asociado al diccionario personal de abreviaturas puntero al nombre del fichero de texto que contiene las abreviaturas personalizadas
RETORNA
INCLUDES MODO
voxlib.h sncrono
56.1. Descripcin
La funcin vox_SetAbbreviations() establece un conjunto de abreviaturas personalizadas para ser utilizadas por el servidor de sntesis en el canal especificado, pudiendo ser modificadas dinmicamente. El diccionario de abreviaturas personalizadas se aade al diccionario global de abreviaturas usado por el servidor de sntesis para el idioma especificado. Para una mayor informacin, consulte el captulo de sntesis del habla en Verbio Software Reference: Gua del Usuario.
82
Verbio Technologies
filename
puntero al nombre del fichero de texto que contiene las abreviaturas personalizadas para el idioma seleccionado.
56.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr el motivo del error.
Verbio Technologies
83
57. vox_setcd
FUNCION int vox_setcd(int chdev, unsigned int mode) int chdev unsigned int mode RETORNA descriptor de un canal vlido por compatibilidad con versiones anteriores, sese 0
INCLUDES MODO
voxlib.h sncrono
57.1. Descripcin
La funcin vox_setcd() establece el vocabulario de dgitos conectados en el canal especificado.
57.3. Precauciones
Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento.
57.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_SYSTEM OUT OF MEMORY SYSTEM ERROR. Check errno.
84
Verbio Technologies
58. vox_SetDictionary
FUNCION int vox_SetDictionary(int chdev, const char *mcLang, const char *filename) int chdev const char *mcLang const char *filename descriptor de un canal vlido especifica el idioma asociado al diccionario personal puntero al nombre del fichero de texto que contiene el diccionario personalizado
RETORNA
INCLUDES MODO
voxlib.h sncrono
58.1. Descripcin
La funcin vox_SetDictionary() establece un diccionario personalizado para ser utilizado por el servidor de sntesis en el canal especificado, pudiendo ser modificado dinmicamente. El diccionario personalizado se aade al diccionario global usado por el servidor de sntesis para el idioma especificado. Para una mayor informacin, consulte el captulo de sntesis del habla en Verbio Software Reference: Gua del Usuario.
puntero al nombre del fichero de texto que contiene el diccionario personalizado para el idioma seleccionado.
Verbio Technologies
85
58.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr el motivo del error.
86
Verbio Technologies
59. vox_setparm
FUNCION int vox_setparm(int dev, unsigned long parm, void *valuep) int dev unsigned long parm void *valuep descriptor de un canal vlido o -1 para parmetros globales de VERBIO (independientes del canal) parmetro del que se desea establecer el valor puntero a la variable en la que se almacena el valor del parmetro a modificar
RETORNA
INCLUDES MODO
voxlib.h sncrono
59.1. Descripcin
La funcin vox_setparm() permite modificar los valores de los parmetros globales o dependientes del canal de VERBIO. Esta funcin puede modificar el valor de un nico parmetro en cada invocacin.
valuep
Verbio Technologies
87
60. vox_setvcb
FUNCION int vox_setvcb(int chdev, const char *filename, unsigned int mode) int chdev const char *filename descriptor de un canal vlido puntero al nombre del fichero que contiene el vocabulario o la gramtica ABNF/DTMF o bien NULL para desactivar todos los vocabularios vocabulario convencional (listado de palabras) o gramtica ABNF o DTMF
RETORNA
INCLUDES MODO
voxlib.h sncrono
60.1. Descripcin
La funcin vox_setvcb() establece el vocabulario o la gramtica ABNF o DTMF especificado en el canal especificado.
GVX_ABNF GVX_DTMF
60.3. Precauciones
Sin la opcin GVX_ABNF habilitada, la funcin vox_setvcb() requiere el fichero de definiciones y el fichero de transcripciones generados mediante la funcin vox_prevcb() o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev(). Si estos ficheros existen y el fichero de vocabulario correspondiente no ha sido modificado
88
Verbio Technologies
desde que se llam a la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()), no es necesario volver a invocarlas antes de cargar el vocabulario mediante la funcin vox_setvcb(). Con la opcin GVX_ABNF habilitada, la funcin vox_setvcb() requiere el fichero de estados de la gramtica, el fichero de definiciones y el fichero de transcripciones generado mediante la funcin vox_prevcb() o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev(). Si estos ficheros existen y la gramtica ABNF correspondiente no ha sido modificado desde que se llam a la funcin vox_prevcb() (o vox_prevcbex()o vox_prevcbex2() o vox_prevcbdev()), no es necesario volver a invocarlas antes de cargar la gramtica mediante la funcin vox_setvcb(). Con la opcin GVX_DTMF la gramtica no crea ficheros adicionales resultados de la compilacin. Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento. La configuracin de reconocimiento activa en el momento de cargar la gramtica debe ser la misma que la existente en el momento de su preparacin. En caso contrario, aparecer el error THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words.
60.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_VCBFILE EVX_INVWORD EVX_SYSTEM OUT OF MEMORY. THE VOCABULARY FILE NAME IS NOT VALID. THE VOCABULARY TRANSCRIPTION WAS NOT FOUND. SYSTEM ERROR. Check errno.
Verbio Technologies
89
61. vox_spk_addfile
FUNCION int vox_spk_addfile(int chdev, const char* id, const char* filename, const char* transcription) int chdev const char *id const char *filename const char *transcription RETORNA descriptor de un canal vlido identificador del usuario que entrena su huella vocal con el fichero de audio indicado nombre del fichero de audio utilizado durante la fase de entreno del usuario indicado transcripcin del contenido del audio utilizado para entrenar la huella vocal del usuario indicado
INCLUDES MODO
voxlib.h sncrono
61.1. Descripcin
La funcin vox_spk_addfile() almacena el fichero de audio en la base de datos, asociado al usuario indicado, para ser utilizado en el momento de crear la huella vocal del mismo, mediante la invocacin de la funcin vox_spk_train. Adicionalmente, utilizando la capacidad de reconocimiento de Verbio ASR, comprueba tambin que el contenido del fichero coincide con la transcripcin, de modo que pueda certificarse que el usuario ha pronunciado exactamente aquello que se le ha solicitado.
transcription
61.3. Precauciones
El contenido de los ficheros de entrenamiento debe ser, exclusivamente, cadenas de dgitos (de longitud variable). Por lo tanto, la transcripcin proporcionada deben ser cadenas numricas, del tipo 12345678, 952611232, etctera. Se aconseja que las cadenas de entrenamiento tengan una longitud mnima de 8 dgitos y
90
Verbio Technologies
que se proporcionen, al menos, 20 de ellas, obtenidas en distintos das (mnimo dos) y momentos del da (maana/tarde). Puede invocarse directamente a la funcin vox_spk_train especificando un listado de ficheros a utilizar para la fase de entrenamiento en lugar de invocar, para cada nuevo fichero, a la funcin vox_spk_addfile. No obstante, se aconseja su uso a medida que se obtienen los ficheros porque en caso de errores (debido a que el usuario no ha pronunciado la cadena de dgitos solicitada) podr notificarse este error al usuario y solicitarle un nuevo fichero.
61.4. Errores
En caso de error, la funcin retorna un valor negativo. Los posibles cdigos de error retornados por esta funcin son: -1 -4 -6 -18 -27 El canal especificado no es vlido. Error interno de Verbio. La estructura de la base de datos est corrupta. Error al lanzar el proceso de reconocimiento del contenido del fichero de audio. Algn parmetro no ha sido especificado o bien es incorrecto. El contenido del fichero no coincide con la transcripcin proporcionada, o bien no se ha podido comprobar.
Verbio Technologies
91
62. vox_spk_exist
FUNCION int vox_spk_exist(int chdev, const char* id) int chdev const char *id descriptor de un canal vlido identificador del usuario del que se desea conocer su existencia (registro previo)
RETORNA
INCLUDES MODO
voxlib.h sncrono
62.1. Descripcin
La funcin vox_spk_exist() consulta la base de datos de usuarios registrados para comprobar si ya ha completado la fase de entrenamiento y, por lo tanto, ya dispone de un modelo (huella vocal) creado.
62.3. Precauciones
La funcin vox_spk_exist() indica si el usuario indicado dispone de una huella vocal entrenada. No comprueba, sin embargo, si el usuario ha iniciado o no el proceso de entrenamiento, utilizando la funcin vox_spk_addfile para proporcionar los audios de entreno requeridos.
62.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, debe comprobarse que el canal especificado como primer parmetro es vlido.
92
Verbio Technologies
63. vox_spk_init
FUNCION RETORNA int vox_spk_init() 0 si el resultado es satisfactorio <0 en caso de error INCLUDES MODO voxlib.h sncrono
63.1. Descripcin
La funcin vox_spk_init() inicializa la librera Verbio, preparndola para poder recibir peticiones de verificacin de locutor.
63.2. Precauciones
La funcin vox_spk_init() debe invocarse previamente a cualquier invocacin del resto de funciones asociadas a la verificacin de locutor, tales como: vox_spk_addfile, vox_spk_train, vox_spk_verify y vox_spk_exist.
63.3. Errores
En caso de error, la funcin retorna un valor negativo. Los posibles cdigos de error retornados por esta funcin son: -13 -14 Error interno de Verbio. Probablemente la instalacin de los componentes de SpeakerID no se ha realizado o se ha hecho de forma incorrecta. No se dispone de licencias de SpeakerID o bien stas han caducado.
Verbio Technologies
93
64. vox_spk_train
FUNCION int vox_spk_train(int chdev, const char* id, const char* filename, int* lpiword) int chdev const char *id const char *filename int *lpiword descriptor de un canal vlido identificador del usuario que entrena su huella vocal con el fichero de audio indicado nombre del fichero que contiene el listado de ficheros a utilizar durante el proceso de entrenamiento puntero a un entero que, en caso de error en alguno de los ficheros, devolver la lnea que contiene el fichero errneo
RETORNA
INCLUDES MODO
voxlib.h sncrono
64.1. Descripcin
La funcin vox_spk_train() lanza el proceso de generacin de la huella vocal del usuario indicado. Los ficheros utilizados para el proceso de entrenamiento sern, o bien los especificados mediante el parmetro filename o bien los indicados mediante llamadas sucesivas a la funcin vox_spk_addfile. Una vez finalizada correctamente la funcin vox_spk_train(), el sistema estar ya listo para empezar a verificar los intentos de acceso del usuario entrenado.
94
Verbio Technologies
puntero a un entero que recibir el valor de la lnea que contiene un fichero que no ha sido validado para el proceso de entrenamiento. Debe consultarse este valor si la funcin retorna el error -27.
64.3. Precauciones
El contenido de los ficheros de entrenamiento debe ser, exclusivamente, cadenas de dgitos (de longitud variable). Por lo tanto, la transcripcin proporcionada deben ser cadenas numricas, del tipo 12345678, 952611232, etctera. Se aconseja que las cadenas de entrenamiento tengan una longitud mnima de 8 dgitos y que se proporcionen, al menos, 20 de ellas, obtenidas en distintos das (mnimo dos) y momentos del da (maana/tarde). En lugar de especificar conjuntamente el listado de ficheros y sus transcripciones mediante la funcin vox_spk_train es preferible utilizar la funcin vox_spk_addfile individualmente para cada fichero. De este modo, podrn tomarse acciones correctivas en caso de que, en el momento de adquisicin del audio, el proceso de validacin interno indique que la transcripcin no coincide con el contenido real del fichero.
64.4. Errores
En caso de error, la funcin retorna un valor negativo. Los posibles cdigos de error retornados por esta funcin son: -1 -4 -5 -6 -10 -18 -21 -27 -28 El canal especificado no es vlido. Error interno de Verbio. La estructura de la base de datos est corrupta. No se dispone de suficiente memoria disponible para ejecutar la funcin. Error al lanzar el proceso de reconocimiento del contenido del fichero de audio. Error al lanzar el proceso de verificacin del locutor. Algn parmetro no ha sido especificado o bien es incorrecto. El fichero especificado como parmetro no est disponible. El contenido de algn fichero no coincide con la transcripcin proporcionada, o bien no se ha podido comprobar. No se dispone de suficiente material para entrenar. Es necesario proporcionar ms locuciones numricas del usuario a entrenar.
Verbio Technologies
95
65. vox_spk_verify
FUNCION int vox_spk_verify(int chdev, const char* id, const char* filename, const char* transcription, float* score, int mode) int chdev const char *id const char *filename const char *transcription float* score int mode descriptor de un canal vlido identificador del usuario que verifica su identidad con el fichero de audio proporcionado nombre del fichero de audio utilizado para verificar la identidad del usuario transcripcin del contenido del audio utilizado para verificar la identidad del usuario ndice de confianza de la veracidad del usuario analizado activacin o desactivacin de protecciones adicionales (consulte disponibilidad)
RETORNA
1 si el usario es quien dice ser 0 si el usario NO es quien dice ser -1 si el audio parece haber sido manipulado <-1 en caso de error
INCLUDES MODO
voxlib.h sncrono
65.1. Descripcin
La funcin vox_spk_verify() lanza el proceso de verificacin para determinar si la locucin proporcionada pertenece (ha sido pronunciada) realmente por el usuario indicado, basndose en la huella vocal que ha sido previamente entrenada para dicho usuario mediante la funcin vox_spk_train.
transcription
96
Verbio Technologies
score mode
puntero a float que almacenar el ndice de confianza del proceso de verificacin tras su finalizacin. habilita (1) o deshabilita (0) medidas adicionales de proteccin frente a impostores, con anlisis complementarios del audio para detectar estrategias de manipulacin de la seal para engaar al sistema. En caso de que se habilite y las estrategias de deteccin determinen que se trata de audio manipulado, la funcin devolver el error -1. Consulte disponibilidad.
65.3. Precauciones
El contenido de los ficheros de verificacin debe ser, exclusivamente, cadenas de dgitos (de longitud variable). Por lo tanto, la transcripcin proporcionada deben ser cadenas numricas, del tipo 12345678, 952611232, etctera. Se aconseja que las cadenas de verificacin tengan una longitud de entre 6 y 8 dgitos (cuanto ms larga, mayor fiablidad del proceso de verificacin). El ndice de confianza devuelto por la funcin (parmetro score) se proporciona a efectos estadsticos y de ajuste de los umbrales. El sistema, internamente, ya toma la decisin de si es el usuario verdico o no, retornando el valor 1 o 0 respectivamente como resultado de la funcin vox_spk_verify. En caso de que la funcin retorne el valor -1 (habindose habilitado la aplicacin de contramedidas mediante el parmetro mode), es indicativo de que las contramedidas han detectado un audio posiblemente manipulado para violar el sistema de seguridad. En el parmetro score se almacenar el ndice de confianza de la decisin (cuanto mayor sea este valor, ms probabilidad de que el audio haya sido manipulado). En caso de que las contramedidas detecten manipulacin en el audio, ste ya no es analizado por el motor de verificacin de locutor. Por lo tanto, si se tiene la certeza de que el audio procede de una fuente fiable, debera repetirse de nuevo el proceso de verificacin, pero deshabilitando las contramedidas para obtener el resultado de la verificacin.
65.4. Errores
En caso de error, la funcin retorna un valor negativo. Los posibles cdigos de error retornados por esta funcin son: -1 -4 -5 -6 -10 -18 -21 -27 El canal especificado no es vlido. Error interno de Verbio. La estructura de la base de datos est corrupta. No se dispone de suficiente memoria disponible para ejecutar la funcin. Error al lanzar el proceso de reconocimiento del contenido del fichero de audio. Error al lanzar el proceso de verificacin del locutor. Algn parmetro no ha sido especificado o bien es incorrecto. El fichero especificado como parmetro no est disponible. El contenido del fichero no coincide con la transcripcin proporcionada, o bien no se ha podido comprobar.
Verbio Technologies
97
66. vox_srvclose
FUNCION void vox_srvclose(const char *server) const char *server direccin IP del servidor con el que el cliente cierra la conexin
INCLUDES MODO
voxlib.h sncrono
66.1. Descripcin
La funcin vox_srvclose() cierra todas las conexiones con el servidor especificado en la direccin IP.
98
Verbio Technologies
67. vox_termplaystr
FUNCION int vox_termplaystr(int chdev) int chdev RETORNA descriptor de un canal vlido
INCLUDES MODO
voxlib.h sncrono
67.1. Descripcin
La funcin vox_termplaystr() asegura que todos los eventos recibidos como consecuencia de una llamada asncrona a la funcin vox_playstr() son eliminados de la cola de eventos.
67.3. Precauciones
Esta funcin debe ser llamada nicamente cuando la funcin vox_playstr() se ha invocado asncronamente.
Verbio Technologies
99
68. vox_termrecstr
FUNCION int vox_termrecstr(int chdev) int chdev RETORNA descriptor de un canal vlido
INCLUDES MODO
voxlib.h sncrono
68.1. Descripcin
La funcin vox_termrecstr() indica el final del reconocimiento iniciado mediante la funcin vox_recstr_open() o mediante la funcin vox_recstr() invocada asncronamente.
68.3. Precauciones
Esta funcin debe ser llamada nicamente cuando la funcin vox_recstr() se ha invocado asncronamente.
100
Verbio Technologies
69. vox_thclose
FUNCION RETORNA int vox_thclose() 0 si el resultado es satisfactorio -1 en caso de error INCLUDES MODO voxlib.h sncrono
69.1. Descripcin
La funcin vox_thclose libera las conexiones con el motor de sntesis y o reconocimiento del habla utilizadas por el thread (hilo) que la invoca. Por lo tanto, esta funcin debe invocarse siempre desde cualquier thread (hilo) que haya hecho uso de sntesis o reconocimiento, justo antes del momento de su destruccin. De este modo, se liberarn los recursos utilizados para establecer la comunicacin con los servidores de sntesis y/o reconocimiento del habla.
Verbio Technologies
101
70. vox_tts_init
FUNCION int vox_tts_init(const char *configuration, const char *defttslng) const char *configuration const char *defttslng RETORNA uso futuro. Debe tener el valor NULL. identificador del idioma de sntesis por defecto
INCLUDES MODO
voxlib.h sncrono
70.1. Descripcin
La funcin vox_tts_init() inicializa la librera de sntesis del habla de Verbio. En nuevos desarrollos es recomendable utilizar esta funcin (conjuntamente con la funcin vox_asr_init en caso de que tambin se requiera reconocimiento del habla) en lugar de la funcin vox_libinit, puesto que permite indicar al servidor los parmetros de inicializacin de una manera mucho ms concreta.
70.3. Precauciones
La funcin vox_tts_init() debe invocarse antes que ninguna otra de las funciones del Library SDK relacionadas con la sntesis del habla, a excepcin de aquella destinada a establecer el servidor de trabajo por defecto en configuraciones cliente-servidor (vox_setparm).
70.4. Errores
102
Verbio Technologies
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_INVSETUP EVX_NOMEM EVX_NOLICFILE EVX_INVLIC EVX_SYSTEM VERBIO INTERNAL ERROR. Files may be corrupted. Check disk and repeat Setup. OUT OF MEMORY. NO LICENSE FILE WAS FOUND. Run CheckOut to obtain a license file. THE LICENSE FILE IS NOT VALID. Run CheckOut to obtain a valid license file. SYSTEM ERROR.Check errno.
Verbio Technologies
103
71. vox_ttsSetAbbreviations
FUNCION int vox_ttsSetAbbreviations(int chdev, int mcLang, const char *filename) int chdev int mcLang const char *filename descriptor de un canal vlido especifica el idioma asociado al diccionario personal de abreviaturas puntero al nombre del fichero de texto que contiene las abreviaturas personalizadas
RETORNA
INCLUDES MODO
voxlib.h sncrono
71.1. Descripcin
La funcin vox_ttsSetAbbreviations() establece un conjunto de abreviaturas personalizadas para ser utilizadas por el servidor de sntesis en el canal especificado, pudiendo ser modificadas dinmicamente. El diccionario de abreviaturas personalizadas se aade al diccionario global de abreviaturas usado por el servidor de sntesis para el idioma especificado. Esta funcin est obsoleta y se mantiene por compatibilidad con desarrollos antiguos. Para nuevos desarrollos, es aconsejable utilizar la funcin vox_SetAbbreviations. Para una mayor informacin, consulte el captulo de sntesis del habla en Verbio Software Reference: Gua del Usuario.
puntero al nombre del fichero de texto que contiene las abreviaturas personalizadas para el idioma seleccionado.
71.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr el motivo del error.
104
Verbio Technologies
Verbio Technologies
105
72. vox_ttsSetDictionary
FUNCION int vox_ttsSetDictionary(int chdev, int mcLang, const char *filename) int chdev int mcLang const char *filename descriptor de un canal vlido especifica el idioma asociado al diccionario personal puntero al nombre del fichero de texto que contiene el diccionario personalizado
RETORNA
INCLUDES MODO
voxlib.h sncrono
72.1. Descripcin
La funcin vox_ttsSetDictionary() establece un diccionario personalizado para ser utilizado por el servidor de sntesis en el canal especificado, pudiendo ser modificado dinmicamente. El diccionario personalizado se aade al diccionario global usado por el servidor de sntesis para el idioma especificado. Esta funcin est obsoleta y se mantiene por compatibilidad con desarrollos antiguos. Para nuevos desarrollos, es aconsejable utilizar la funcin vox_SetDictionary. Para una mayor informacin, consulte el captulo de sntesis del habla en Verbio Software Reference: Gua del Usuario.
puntero al nombre del fichero de texto que contiene el diccionario personalizado para el idioma seleccionado.
72.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr el motivo del error.
106
Verbio Technologies
Verbio Technologies
107
73. vox_unloadvcb
FUNCION int vox_unloadvcb(int chdev, int vcbhandle, unsigned int mode) int chdev int vcbhandle unsigned int mode RETORNA descriptor de un canal vlido descriptor de un vocabulario o gramtica ABNF previamente cargado por compatibilidad con versiones anteriores, sese 0
INCLUDES MODO
voxlib.h sncrono
73.1. Descripcin
La funcin vox_unloadvcb() descarga un vocabulario o gramtica ABNF previamente cargado en el canal especificado. El descriptor del vocabulario se obtiene al cargarlo mediante la funcin vox_loadvcb() y tambin debe usarse para activarlo mediante la funcin vox_activatevcb() o para descactivarlo mediante la funcin vox_deactivatevcb(). Si el descriptor del vocabulario es -1, la funcin vox_unloadvcb() descarga todos los vocabularios y gramticas ABNF cargados previamente.
73.3. Precauciones
Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento (equivale a invocar la funcin vox_unloadvcb() con el parmetro vcbhandle fijado al valor -1).
73.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_VCBFILE EVX_INVWORD EVX_SYSTEM OUT OF MEMORY THE VOCABULARY FILE NAME IS NOT VALID. THE VOCABULARY TRANSCRIPTION WAS OT FOUND SYSTEM ERROR. Check errno.
108
Verbio Technologies
Verbio Technologies
109
74. vox_vsd_close
FUNCION int vox_vsd_close(int chdev, VAD_PARAM* vsddev) int chdev VAD_PARAM* vsddev RETORNA descriptor de un canal vlido descriptor de deteccin de voz vlido
INCLUDES MODO
voxlib.h sncrono
74.1. Descripcin
La funcin vox_vsd_close() cierra el desciptor de deteccin de voz abierto mediante la funcin vox_vsd_open y libera los recursos utilizados durante el proceso de deteccin de voz.
110
Verbio Technologies
75. vox_vsd_open
FUNCION VAD_PARAM* vox_vsd_open(int chdev, int recdev, VAD_PRM *prm, unsigned int mode) int chdev int recdev VAD_PRM *prm unsigned int mode RETORNA descriptor de un canal vlido descriptor del proceso de reconocimiento paralelo en caso de existir puntero a una estructura del tipo Voice Detection Parameter formato de las muestras (Ley A o Ley Mu) Activity
INCLUDES MODO
voxlib.h sncrono
75.1. Descripcin
La funcin vox_vsd_open() inicializa el detector de voz en el canal especificado, de modo que est preparado para empezar a recibir las muestras de audio mediante la funcin vox_vsd_write(). El valor devuelto por la funcin es requerido por las funciones vox_vsd_write() y vox_vsd_close(). Con la finalidad de reducir el coste computacional en el servidor de reconocimiento, es una prctica aconsejable utilizar el detector de voz en la parte cliente de la aplicacin, de modo que nicamente se mandan al reconocedor muestras de voz, liberando a ste de la tarea de separar la seal de voz de la seal suprflua. Para ello, debe obtenerse previamente un descriptor de reconocimiento mediante la funcin vox_recstr_open, que ser necesario especificar como segundo parmetro de la funcin vox_vsd_open.
prm
mode
Verbio Technologies
111
75.3. Precauciones
Una vez finalizado el proceso de deteccin de voz, es imprescindible invocar a la funcin vox_vsd_close para liberar los recursos de memoria utilizados durante el proceso de deteccin.
112
Verbio Technologies
76. vox_vsd_write
FUNCION int vox_vsd_write(VAD_PARAM* vsddev, const void *buffer, unsigned int n) VAD_PARAM* vsddev const void *buffer unsigned int n RETORNA descriptor de deteccin de voz vlido vector en el que se encuentran las muestras de audio que debe procesar el detector de voz tamao del vector de muestras (en bytes)
INCLUDES MODO
voxlib.h sncrono
76.1. Descripcin
La funcin vox_vsd_write() enva las muestras recibidas hacia el detector de voz para ser procesadas. La funcin retorna el estado en el que se ha quedado el algoritmo de deteccin de voz despus de procesar el buffer de muestras actual. Para conocer los posibles estados y las transiciones permitidas entre ellos, consulte el Captulo 3. Estructuras de datos y parmetros. Es posible tambin especificar una funcin de callback que se ejecute al finalizar el procesado de cada bloque de muestras, instante en el cual informar del estado actual y de otros parmetros de inters. Encontrar ms detalles en la definicin del campo callback de la estructura VAD_PRM. Los parmetros tambin pueden consultarse de forma directa e individualmente mediante la funcin vox_getparm mediante los identificadores VXCH_INITSIL, VXCH_FINALSIL y VXCH_VOICE. Para ms detalles, consulte el Captulo 3. Estructuras de datos y parmetros.
Verbio Technologies
113
77. vox_word
FUNCION const char* vox_word(int chdev, int ind) int chdev int ind descriptor de un canal vlido ndice asociado con la palabra del vocabulario o gramtica que se desea obtener
RETORNA
puntero a un vector de caracteres con el contenido de la palabra del vocabulario apuntada por el ndice (fila) especificado puntero a un vector vaco ("") si el ndice especificado no es vlido
INCLUDES MODO
voxlib.h sncrono
77.1. Descripcin
La funcin vox_word() devuelve un puntero a un vector de caracteres ASCIIZ con el contenido asociado al ndice (fila) especificado del vocabulario o gramtica activa en el canal.
114
Verbio Technologies
78. vox_wordex
FUNCION const char* vox_wordex(int chdev, int ind, int pos) int chdev int ind int pos RETORNA descriptor de un canal vlido ndice asociado con la palabra del vocabulario o gramtica que se desea obtener columna del vocabulario de la que se desea obtener el contenido
puntero a un vector de caracteres con el contenido de la palabra del vocabulario apuntada por el ndice (fila) y columna especificados puntero a un vector vaco ("") si el ndice o la columna especificados no son vlidos
INCLUDES MODO
voxlib.h sncrono
78.1. Descripcin
La funcin vox_wordex() devuelve un puntero a un vector de caracteres ASCIIZ con el contenido asociado al ndice (fila) y columna especificados del vocabulario o gramtica activa en el canal .
pos
Verbio Technologies
115
79. vox_wordrule
FUNCION const char* vox_wordrule(int chdev, const char* rule, int pos, float * score) int chdev const char* rule int pos float* score descriptor de un canal vlido nombre de la regla de la gramtica de la que se desea obtener informacin tipo de informacin que se desea obtener de la regla ndice de confianza del resultado asociado a la regla especificada
RETORNA
NULL en caso de error array de caracteres con la informacin solicitada en caso satisfactorio
INCLUDES MODO
voxlib.h sncrono
79.1. Descripcin
La funcin vox_wordrule() permite obtener la informacin del resultado de reconocimiento desglosado para cada una de las reglas que constituyen la gramtica ABNF utilizada en el proceso de reconocimiento. Para ello, es necesario indicar el nombre de la regla del que se desea obtener la informacin y el tipo de informacin que se desea: valor, utterance o peso. El nidice de confianza (score) se devuelve en todos los casos.Consulte Verbio Software Reference: Gua del usuario para ms detalles acerca del contenido que puede devolverse para cada una de las reglas.
pos
79.3. Errores
Si la funcin retorna 0 (nulo) indicando que se ha producido un error puede ser debido a que se ha especificado un nombre de regla incorrecto (o de tipo de resultado), o a que dicha regla no ha generado ningn resultado de reconocimiento.
116
Verbio Technologies
vox_word, vox_wordex
Verbio Technologies
117
donde: maxsil especifica la duracin mxima, en unidades de 10 ms, del silencio final. Una vez detectada seal de voz, la funcin vox_recstr() detiene el proceso de reconocimiento si se detecta un intervalo de silencio superior a este valor. (Valor por defecto: 20). especifica la duracin mxima, en unidades de 10 ms, del silencio inicial. Si antes de detectar seal de voz transcurre un tiempo superior al valor especificado, se detiene el proceso de reconocimiento. (Valor por defecto: 350). contiene un descriptor de fichero obtenido mediante la invocacin de la funcin fopen(). Si el valor es distinto de -1, la funcin vox_recstr() grabar la seal de entrada en este fichero. El formato de la grabacin est fijado a PCM (ley A o ley Mu), con una frecuencia de muestreo de 8 KHz y sin Control Automtico de Ganancia. (Valor por defecto: -1). nmero de muestras iniciales que sern ignoradas por el reconocedor. Es especialmente til en aquellos casos en los que las muestras proceden de un fichero de audio con cabecera, debido a la necesidad de no procesar los primeros bytes, puesto que stos pertenecen a la cabecera. (Valor por defecto: 0). funcin que ser invocada en cuanto finalice el reconocimiento. Debe seguir la sintaxis int (*VX_RSP_CALLBACK) (int);, en el que el parmetro recibido (entero) es el descriptor del canal vlido. Es especialmente til cuando se implementan funcionalidades de barge-in, tal y como se muestra en el ejemplo anexo.
initsil
io_fhandle
skip_samples
callback
Nota
Si no desea grabarse la seal de entrada, el campo io_fhandle debe tener el valor -1. Este es el valor por defecto establecido mediante la funcin vox_clrrsp().
120
Verbio Technologies
donde: frame_len especifica el tamao, en muestras, de cada uno de los bloques de audio en los que se fragmentar la seal entrante antes de ser procesada. A mayor tamao del bloque, menor coste computacional pero tambin menor precisin a la hora de obtenerse el instante en el que se empieza a recibir voz. Por el contrario, a menor tamao, mayor precisin incrementndose por contra el coste computacional. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 512. especifica el tamao, en muestras, de la ventana utilizada para el procesado de cada uno de los bloques en los que se ha dividido la seal de audio a analizar. Al igual que en el caso del parmetro frame_len, a mayor tamao menor precisin y coste computacional. Por el contrario, a menor tamao mayor precisin y coste computacional. El valor de este parmetro no puede ser nunca superior al de frame_len, siendo habitual que coincidan ambos valores. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 512. especifica el tiempo de silencio mnimo, en milisegundos, para determinar que se ha detectado voz en las muestras anteriores. Intervalos menores de silencio se entender que forman parte de la seal de voz previa. En funcin del uso al que vaya destinado el VAD puede usarse este valor para segmentar la seal en fragmentos de voz ms o menos amplios. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 180. especifica la duracin mnima, en milisegundos, de un segmento de voz para que el VAD la detecte como tal. De este modo, se evita que ruidos, etc. puedan ocasionar numerosas falsas alarmas. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 120. especifica un umbral a partir del cual se inicia el procesado de la seal para determinar si las muestras siguientes corresponden a voz o no. Por debajo de este umbral se considera que la seal es de silencio, de modo que en funcin del entorno (ms o menos ruidoso), la modificacin de este valor permitir ajustar la deteccin de voz de la manera ms precisa posible. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 2.5. especifica un segundo umbral (junto con low_factor) para determinar si la seal recibida es voz o no. El detector de voz requiere que se superen ambos umbrales para determinar que se ha recibido voz. Su valor debe ser siempre superior al especificado para low_factor. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 4.5. especifica el umbral que determina si, una vez detectada voz, la seal recibida a continuacin sigue siendo seal de voz o no. Si no lo es, empieza a contar el
frame_step
sil_req_ms
voice_req_ms
low_factor
high_factor
final_factor
Verbio Technologies
121
tiempo mximo de silencio (sil_req_ms) que puede formar parte de un fragmento de voz. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 0.8. final_high_factor especifica un segundo umbral (junto con final_factor) que gestiona el fin de la deteccin de voz una vez detectada. Si, una vez detectada voz, el nivel de la seal es inferior a final_factor i no ha transcurrido el tiempo especificado por sil_req_ms, puede volverse al estado de voz siempre y cuando el nivel de la seal sea superior al valor especificado para este parmetro. Si sto ocurre, vuelve a empezar el contador de sil_req_ms. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 2.5. Uso futuro. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 0. Valor mnimo que puede tener el umbral interno que gestiona la deteccin de voz. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 500. Valor mnimo de la amplitud de la seal a analizar . Si la amplitud de la seal no supera este valor, a efectos de deteccin se trabajar con el valor mnimo para ese fragmento de sonido. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 50. Valor mximo de la amplitud de la seal a analizar . Si la amplitud de la seal supera este valor, a efectos de deteccin se trabajar con el valor mximo para ese fragmento de sonido. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 200.
aam_max
callback
Diagrama de flujo de los estados del detector de voz. Funcin de callback que se ejecutar cada vez que se procese un bloque de muestras (de tamao frame_len). Por defecto no se especifica ninguna funcin de callback, de modo que no se ejecutar ningn cdigo adicional tras procesarse un bloque de muestras. Los parmetros que recibir esta funcin contendrn la siguiente informacin: state estado en el que se encuentra el detector de voz en el instante actual. Los posibles valores son: VVX_INIT Estado inicial. nicamente se est en este estado antes de procesar el primer bloque de muestras. De ste estado nicamente puede pasarse al estado VVX_SILENCE y nunca
122
Verbio Technologies
puede volverse a l. VVX_SILENCE Estado de silencio. A l se llega desde el estado inicial o bien desde el estado VVX_LOW (no se ha recibido seal de suficiente amplitud como para pasar al estado VVX_HIGH) o bien desde el estado VVX_FINAL (la duracin de seal de nivel alto no ha sido suficiente como para determinar que se ha detectado voz) o bien desde el estado VVX_VOICE (se ha recibido suficiente seal de alta amplitud como para decidir que se ha recibido voz). Es posible mantenerse en este estado durante el procesado de varios bloques de muestras consecutivos. VVX_LOW Estado de inicio de deteccin de voz. Mientras la amplitud de la seal de audio est comprendida entre los dos umbrales de decisin, el estado puede permanecer en VVX_LOW. A l se puede llegar desde el estado VVX_SILENCE (se ha recibido un bloque de muestras de amplitud intermedia) o bien desde el estado VVX_VOICE (se ha detectado voz en un bloque anterior y el siguiente ya empieza con un nivel intermedio de seal sin pasar por el estado de silencio). Es posible mantenerse en este estado durante el procesado de varios bloques de muestras consecutivos. VVX_HIGH Estado de nivel alto de energa de la seal. Si se mantiene un tiempo suficiente en este estado, se decidir que se ha recibido voz. A este estado se puede llegar desde el estado VVX_SILENCE o VVX_LOW (se ha recibido un bloque de muestras de amplitud elevada) o bien desde el estado VVX_FINAL (se ha pasado previamente por este estado pero la llegada de bloques con energa elevada provoca que se vuelva a l) o bien desde el estado VVX_VOICE (se ha detectado voz en un bloque anterior y el siguiente ya empieza con un nivel alto de
Verbio Technologies
123
seal sin pasar por el estado de silencio ni de nivel intermedio). Es posible mantenerse en este estado durante el procesado de varios bloques de muestras consecutivos. VVX_FINAL Estado en el que se decide si ha existido voz en los bloques previos o no. A l se llega exclusivamente desde el estado VVX_HIGH. Transcurrido el tiempo de guarda, en funcin del nmero de bloques que hayan superado el umbral de nivel de seal asociado a voz, se decidir que se ha recibido voz (se pasa al estado VVX_VOICE ) o no (se pasa al estado VVX_SILENCE). Es posible mantenerse en este estado durante el procesado de varios bloques de muestras consecutivos. VVX_VOICE Estado al que se llega cuando se decide que en los bloques previos de seal haba muestras de voz. A este estado nicamente puede llegarse desde el estado VVX_FINAL.
cantidad de muestras (de silencio) acumuladas desde el inicio de la locucin sin que se haya detectado voz. cantidad de muestras (se silencio) acumuladas desde que se proces la ltima trama de voz. nmero de fragmentos de la locucin que contienen muestras de voz. Cuanto mayor sea el silencio final exigido para dar por finalizado un fragmento de voz, menor nmero de fragmentos deberan aparecer.
Nota
Es imprescindible invocar a la funcin vox_clrvad para inicializar toda variable del tipo VAD_PRM.
124
Verbio Technologies
donde: age especifica la edad del locutor deseado. Las posibilidades son: Child Teen Adult Senior gender Infantil Adolescente Adulto Tercera edad
especifica el sexo del locutor deseado. Las posibilidades son: Male Female Masculino Femenino
identificador anlogo al del campo language.LanguageID de la estructura TTSMODEINFO, que especifica el idioma (y dialecto en algunos casos) del locutor deseado. nombre bajo el que se registra el locutor deseado. Suele ser la manera ms directa de hacer referencia a un locutor. nombre de la empresa que ha desarrollado el locutor deseado.
Verbio Technologies
125
VXGB_PLAYSTRLIC
int
VXGB_LICMODE
int
VXGB_RECSAMPFREQ
float
VXGB_VSDMAXREF
float
R/W
200
VXGB_VSDMINREF
float
R/W
50
VXGB_NETTIMEOUT
int
R/W
VXGB_DEFSERVER
char*
R/W
"127.0.0.1"
126
Verbio Technologies
Define
Tipo
Lectura(R)/ Escritura(R)
Defecto
Descripcin
cliente. Es necesario especificarlo antes de invocar a la funcin vox_libinit o vox_asr_init o vox_tts_init. VXGB_LOCALADDR char* R Nombre o direccin IP del equipo en el que est ejecutndose el cliente. Listado de todos los locutores disponibles junto con sus caractersticas principales. El formato del vector de caracteres obtenido es el siguiente (contiene informacin de todos los locutores encontrados sin espacios intermedios): Identificador: Nombre: Sexo: Edad: Idioma; Identificador2: Nombre2: Sexo2: Edad2: Idioma2; ... Habilita (1) o deshabilita (0) la grabacin de todas las locuciones enviadas al reconocedor junto con los resultados de reconocimiento asociados. Es especialmente ltil en la fase de pruebas para poder evaluar la calidad de reconocimiento y actuar, si cabe, sobre las gramticas o los dilogos para mejorar el rendimiento. Directorio en el que se almacenarn las locuciones y los resultados de reconocimiento si se ha habilitado el parmetro VXGB_TUNNING_ACT. Especifica el modelo estadstico que ser utilizado por la aplicacin. Para ello, el valor del parmetro debe ser el nombre de la arquitectura que contiene los modelos deseados. Para ms detalles acerca de cmo utilizar el reconocimiento basado en modelos estadsticos, consulte los ejemplos o contacte con support@verbio.com. Permite obtener el listado de locutores disponibles en el motor de sntesis para ser utilizados desde la aplicacin. Esta funcin devuelve los cdigos internos de los locutores, separados por comas. Los cdigos internos de los locutores siguen la siguiente nomenclatura: languageNAME (identificador de idioma en minscula seguido de dos letras maysculas que identifican al locutor). Para obtener un listado completo de los identificadores de idioma (de 2 o 5 caracteres), consulte la funcin vox_tts_init y el fichero
VXGB_TTSSPKINFO
char*
VXGB_TUNNING_ACT
int
R/W
VXGB_TUNNING_DIR
char*
R/W
""
VXGB_VVI_ARQ
char*
VXGB_START_SPK
char*
Verbio Technologies
127
Define
Tipo
Lectura(R)/ Escritura(R)
Defecto
Descripcin
voxlib.h. VXGB_START_CONF char* R Permite obtener el listado de configuraciones de reconocimiento disponibles en el motor de reconocimiento para ser utilizados desde la aplicacin. Esta funcin devuelve los cdigos internos de las configuraciones, separados por comas. Los cdigos internos de las configuraciones siguen la siguiente nomenclatura: LANGUAGE (para configuraciones monolinges) o LANGUAGE-LANGUAGE.... LANGUAGE (para configuraciones multilinges). Para obtener un listado completo de los identificadores de idioma (de 2 o 5 caracteres), consulte la funcin vox_asr_init y el fichero voxlib.h. Permite obtener el listado arquitecturas que contienen modelos estadsticos (SLM) disponibles para ser utilizadas desde el motor de reconocimiento estadstico. El listado contiene cada uno de los identificadores de las arquitecturas, separados por comas. El nombre de las arquitecturas es fijado por el integrador durante la construccin de los modelos estadsticos. Para ms detalles acerca de cmo utilizar el reconocimiento basado en modelos estadsticos, consulte los ejemplos o contacte con support@verbio.com. Permite obtener el listado de modelos estadsticos (SLM) disponibles dentro de la arquitectura cargada para ser utilizadas desde el motor de reconocimiento estadstico. El listado contiene cada uno de los identificadores de los modelos estadsticos, separados por comas. El nombre de los modelos es fijado por el integrador durante la construccin de los mismos. Para ms detalles acerca de cmo utilizar el reconocimiento basado en modelos estadsticos, consulte los ejemplos o contacte con support@verbio.com. Permite definir la longitud mxima de la respuesta ante un proceso de reconocimiento. El valor son la cantidad de unidades de 20ms permitidas a lo largo de todo el proceso, de modo que, con el valor por defecto, la longitud
VXGB_START_VIT
char*
VXGB_START_SLM
char*
VXGB_MAXFRAMES
int
2500
128
Verbio Technologies
Define
Tipo
Lectura(R)/ Escritura(R)
Defecto
Descripcin
mxima de audio (antes de lanzar un nuevo reconocimiento) que puede procesarse es de 50 segundos. El valor de este parmetro es un entero, de modo que no debe ser superior a 32767.
VXCH_ACTIVE_NBEST
int
R/W
VXCH_TTSFREQUENCY
int
VXCH_TTSSPEED
int
R/W
VXCH_TTSSPKNAME
char*
R/W
Verbio Technologies
129
Define
Tipo
Lectura(R)/ Escritura(R)
Defecto
Descripcin
Configuration Manager. Este mismo configurador permite ver el nombre de los locutores asociados a cada uno de los idiomas disponibles. VXCH_TTSLNG int R/W Especifica el idioma de sntesis mediante una constante (vase voxlib.h) que se usar en el prximo proceso de conversin de texto a habla. Se mantiene por compatibilidad con versiones anteriores. Para nuevos desarrollos debera utilizarse el parmetro VXCH_DEFTTSLANG. El valor inicial depender de cmo se haya configurado el servidor de sntesis mediante el Verbio Server Configuration Manager. Especifica el idioma de sntesis en formato texto (vase voxlib.h) que se usar en el prximo proceso de conversin de texto a habla. En nuevos desarrollos es la opcin recomendada frente al obsoleto VXCH_TTSLNG. El valor inicial depender de cmo se haya configurado el servidor de sntesis mediante el Verbio Server Configuration Manager. Tono medio de la voz sintetizada. Las voces femeninas tienen un tono superior que el de las voces masculinas. El valor por defecto depende del locutor. Volumen de la voz sintetizada. La amplitud se amplifica proporcionalmente a la relacin entre el nuevo valor y el valor por defecto. Por lo tanto, la estrategia recomendada consiste en consultar el valor actual del locutor, manipular el valor proporcionalmente para obtener el volumen deseado y fijarlo posteriormente. Se desaconseja pues fijar un valor aleatorio sin conocer el valor actual de funcionamiento. Configuracin de reconocimiento por defecto que se utilizar en cualquier proceso de reconocimiento hasta que se especifique lo contrario. El valor inicial depender de cmo se haya configurado el servidor de reconocimiento mediante el Verbio Server Configuration Manager. Idioma por defecto que usarn las funciones vox_prevcb() y
VXCH_DEFTTSLANG
char*
R/W
VXCH_TTSPITCH
int
R/W
VXCH_TTSVOLUME
int
R/W
VXCH_DEFASRCFG
char*
R/W
VXCH_DEFASRLNG
char*
R/W
130
Verbio Technologies
Define
Tipo
Lectura(R)/ Escritura(R)
Defecto
Descripcin
vox_prevcbex() para procesar los ficheros de vocabulario. El valor inicial depender de cmo se haya configurado el servidor de reconocimiento mediante el Verbio Server Configuration Manager. VXCH_SERVER char* R Servidor de sntesis y/o reconocimiento al que se conecta el canal (nombre o IP del equipo). El valor por defecto depende del parmetro VXGB_DEFSERVER, aunque puede modificarse con posterioridad para que cada lnea pueda especificar su propio servidor. Indica si se ha detectado voz durante el proceso de reconocimiento (el valor devuelto en el parmatro es 1). Tpicamente la consulta de este parmetro se realiza entre llamadas sucesivas a la funcin vox_recstr_write() para conocer el momento en el que el usuario ha empezado a hablar, de modo que puedan aplicarse, por ejemplo, estrategias de Barge-in. Parmetro utilizado para calcular la penalizacin que sufre una palabra a la hora de poder ser reconocida. A mayor penalizacin, ms dificultad para que la palabra forme parte de la cadena reconocida. La penalizacin es una funcin de tres parmetros: el peso de cada palabra especificado en la gramtica (si no se especifica ninguno es 1), el valor de este parmetro y el valor de VXCH_GRMCONSTANT. El valor especificado en este parmetro debe utilizarse cuando se quiera acentuar la diferencia entre los pesos de las palabras, puesto que la penalizacin es proporcional a su valor y al peso de las palabras. VXCH_GRMCONSTANT float R/W 0 Parmetro utilizado para calcular la penalizacin que sufre una palabra a la hora de poder ser reconocida. A mayor penalizacin, ms dificultad para que la palabra forme parte de la cadena reconocida. La penalizacin es una funcin de tres parmetros: el peso de cada palabra especificado en la gramtica (si no se especifica ninguno es 1), el valor de este parmetro y el valor de VXCH_GRMWEIGHT.
VXCH_VOICEDETECTED
int
VXCH_GRMWEIGHT
float
R/W
Verbio Technologies
131
Define
Tipo
Lectura(R)/ Escritura(R)
Defecto
Descripcin
El valor de este parmetro puede utilizarse para reducir la aparicin de inserciones (aunmentar el valor reduce la cantidad de palabras devueltas por el reconocedor) o bien para priorizar las palabras largas respecto a las ms breves. VXCH_INITSIL int R cantidad de muestras (de silencio) acumuladas desde el inicio de la locucin sin que se haya detectado voz, siempre y cuando se estn utilizando las funciones de deteccin de actividad vocal vox_vsd_open, vox_vsd_write y vox_vsd_close cantidad de muestras (de silencio) acumuladas desde que se proces la ltima trama de voz, siempre y cuando se estn utilizando las funciones de deteccin de actividad vocal vox_vsd_open, vox_vsd_write y vox_vsd_close nmero de fragmentos de la locucin que contienen muestras de voz. Cuanto mayor sea el silencio final exigido para dar por finalizado un fragmento de voz, menor nmero de fragmentos deberan aparecer. Para que esta informacin est disponible, deben utilizarse las funciones de deteccin de actividad vocal vox_vsd_open, vox_vsd_write y vox_vsd_close permite deshabilitar una regla de una gramtica o de todas las gramticas activas en un momento determinado. De este modo, en entornos en los que se parta de una gramtica compleja que, en base al dilogo, pueda irse acotando, no es necesario desglosarla en gramticas ms sencillas a medida que el usuario navega las opciones, sino que pueden irse desactivando aquellas reglas que ya no aplican en la siguiente posible respuesta. Con ello se mejora la rapidez y la calidad del reconocimiento sin apenas coste computacional, puesto que no hay que descargar ni cargar nuevas gramticas. El valor del parmetro debe ser el nombre de la regla de la gramtica ABNF que debe desactivarse. En caso de que ese nombre pueda estar presentes en otras gramticas activas en ese instante, puede especificarse el identificador de la gramtica de inters mediante el
VXCH_FINALSIL
int
VXCH_VOICE
int
VXCH_DEACTWORD
char*
132
Verbio Technologies
Define
Tipo
Lectura(R)/ Escritura(R)
Defecto
Descripcin
siguiente formato: nombre_regla#identificador, donde identificador es el valor devuelto por la funcin vox_setvcb o vox_activatevcb. Si se desea desactivar esa regla en todas las gramticas activas que la contengas, el parmetro debe contener nicamente el nombre de la regla. VXCH_ACTWORD char* W permite habilitar de nuevo una regla de una gramtica o de todas las gramticas activas en un momento determinado que hubiera sido desactivada, previamente, mediante VXCH_DEACTWORD. El formato del parmetro debe ser idntico al especificado en la descripcin de VXCH_DEACTWORD. Valor que regula el nivel de poda del motor de reconocimiento. Cuanto mayor es el valor, menos descartes realiza el motor de reconocimiento, por lo que puede afinarse algo ms el resultado de reconocimiento, aunque a costa de un incremento sustancial del coste computacional. No se aconseja modificar el valor de este parmetro, salvo consejo del personal de Verbio. Permite consultar los milisegundos de voz (excludo el silencio) que se han recibido en el anterior proceso de reconocimiento. Permite consultar los milisegundos de audio que se han recibido en el anterior proceso de reconocimiento.
VXCH_MINTHRESHOLD
float
R/W
55
VXCH_MSSPEECH
int
VXCH_RECSAMPLES
int
Verbio Technologies
133
Intervalo
El formato del vector de caracteres ASCIIZ devuelto por las funciones vox_word() o vox_wordex es el siguiente: regla:"locucin"(confianza,instante_inicial,instante_final)["valor1" "valor2" "..."] En caso de no tratarse de una gramtica ABNF, el nombre de la regla ser root. En caso de tratarse de una gramtica ABNF con subreglas (no nicamente una regla principal), el formato del vector de caracteres tendr
134
Verbio Technologies
Captulo 3. Estructuras de datos y parmetros un formato parecido al siguiente, en el que cada regla termina en ";" y cada subregla est contenida entre llaves "{}", y en el que debe sustituirse "regla" por todo el texto asociado a cada regla (segn se ha especificado en el prrafo anterior). regla_principal{regla1{regla1_1;regla1_2;};regla2;regla3{regla3_1{regla3_1_1;};};}; La gramtica ABNF asociada al ejemplo anterior podra ser parecida a:
#ABNF 1.0 ISO8859-1; root regla_principal = ... $regla1 ... $regla2 ... $regla3; $regla1 = ... $regla1_1 ... $regla1_2 ...; $regla1_1 = ... ; $regla1_2 = ... ; $regla2 = ... ; $regla3 = ... $regla3_1 ... ; $regla3_1 = ... $regla3_1_1 ... ; $regla3_1_1 = ... ;
Vocabulario convencional.
Comercial Comercial Tcnico Administracin Administracin Tcnico Eduardo Campillo Asuncin Chinea Marta Cuenca Emilio Doblado Guillermo Estrada Sergio Galndez
Verbio Technologies
135
1. Ejemplo Sncrono
Ejemplo 4.1. Ejemplo sncrono de Verbio Library
/****************************************************************************** * DESCRIPTION: Verbio Synchronous Sample * Copyright (C) 2009 Verbio Technologies * *******************************************************************************/ #include <stdio.h> #include <string.h> #include <sys/types.h> #include <sys/stat.h> #include "voxlib.h" #define #define #define #define #define #define #define #define MAXINDEX MAXFILENAME MAXTEXT CODER SETMODE NEWLINE BUFFER_SIZE AUDIO_BUFFER_SIZE 1024 32 160 1024 MC_MULAW /* MC_ALAW o MC_MULAW o MC_LIN16 */ GVX_ISOLATED /* GVX_CONNECTED o GVX_ISOLATED */ '\n' 2048
const char* Path = ""; const char* RecExt = ".esu"; const char* server = NULL; static int RecStr(int dev, const char *filename, int maxsil); static void vox_error(const char *function, int chdev); static FILE *fplog = NULL; int nextfile(FILE *fp, char *rec, char *vcb) { char text[MAXTEXT], *p; int ncols = 0; strcpy(rec,""); strcpy(vcb,""); if (fgets(text, MAXTEXT, fp) != NULL) { if ((p = strchr(text, NEWLINE)) != NULL) *p = '\0'; /* Remove comments */ if ((p = strchr(text, ';')) != NULL) *p = '\0'; /* First column */ if ((p = strchr(text, '\t')) != NULL) { *p = '\0'; strcpy(rec, text); strcpy(text, p+1); } else { strcpy(rec, text); strcpy(text, ""); } ncols++; /* Second column */ if ((p = strchr(text, '\t')) != NULL) *p = '\0'; if (strlen(text) > 0) { strcpy(vcb, text); ncols++; } } return ncols; } int main(int argc, char *argv[]) { int dev = 0, connected = 0, playdev = -1; int i, n, nind, ncols, mode, error, hHELP; int index[MAXINDEX+1]; float score[MAXINDEX+1]; char RecFileName[MAXFILENAME]; char PathRecFileName[MAXFILENAME]; char Text[MAXTEXT]; char *VcbFileName = "vdemo.txt"; char *ListOfFiles = "vdemo.gui"; char *LogFileName = "vdemo.dat"; const char* deflng = LNG_SPANISH; const char* configuration = CFG_SPANISH_CATALAN; unsigned long dwfilever, dwprodver; short buffer_in[AUDIO_BUFFER_SIZE]; FILE *fp = NULL; int retv = 0; int nASR = 0, nTTS = 0; int volume = 0; int speed = 0; int pitch = 0;
138
Verbio Technologies
#ifdef _DEBUG int timeout = -1; #endif if (argc > 1) VcbFileName = argv[1]; if (argc > 2) ListOfFiles = argv[2]; if (argc > 3) LogFileName = argv[3]; if (argc > 4) deflng = argv[4]; if (argc > 5) configuration = argv[5]; if (argc > 6) server = argv[6]; if ((fplog = fopen(LogFileName, "wt")) == NULL) return 1; do { #ifdef _DEBUG vox_setparm(-1, VXGB_NETTIMEOUT, &timeout); #endif if (server) vox_setparm(-1, VXGB_DEFSERVER, server); connected = vox_asr_init(configuration, deflng); if (connected >= 0) connected = vox_tts_init(0, deflng); } while (connected < 0); // Get Verbio Product Version and Serial Number vox_GetDllVersion(&dwfilever, &dwprodver); printf("SAMPLE. Verbio %d.%02d, S/N: %s\n\n", HIWORD(dwprodver), LOWORD(dwprodver), vox_SerialNumber()); // Get number of licenses for vox_recstr nASR = vox_getasrlic(CFG_SPANISH); printf(" * ASR licenses: %2d\n", nASR); // Get number of licenses for vox_playstr nTTS = vox_getttslic(LNG_SPANISH); printf(" * TTS licenses: %2d\n\n", nTTS); vox_getparm(-1, VXGB_LICMODE, &mode); if (mode & LIC_ASR_CATALAN) printf(" * ASR Catalan : Yes\n"); else printf(" * ASR Catalan : No\n"); if (mode & LIC_TTS_CATALAN) printf(" * TTS Catalan : Yes\n"); else printf(" * TTS Catalan : No\n"); if (mode & LIC_EVALUATION) printf(" * Evaluation\n"); if (mode & LIC_LITE) printf(" * Lite\n"); if (nTTS) { // Get volume vox_getparm(dev, VXCH_TTSVOLUME, &volume); printf("TTSVOLUME = %d\n", volume); // Get speed vox_getparm(dev, VXCH_TTSSPEED, &speed); printf("TTSSPEED = %d\n", speed); // Get pitch vox_getparm(dev, VXCH_TTSPITCH, &pitch); printf("TTSPITCH = %d\n", pitch); } if (nASR) { if (vox_reccfg_wait(dev, 500, CFG_SPANISH_CATALAN)) { vox_error("vox_reccfg_wait", dev); retv = ATVOX_LASTERR(dev); goto error; } if (vox_getusedasrlic() <= 0) { goto error; } if (vox_recstr_wait(dev, 500)) { vox_error("vox_recstr_wait", dev); retv = ATVOX_LASTERR(dev); goto error; } if (vox_prevcbex("comandos.txt", 0, &error) < 0) { vox_error("vox_prevcbex", dev); retv = error;
Verbio Technologies
139
goto error; } if (vox_prevcb(VcbFileName, 0) == -1) { vox_error("vox_prevcb", dev); retv = ATVOX_LASTERR(-1); goto error; } if (vox_unloadvcb(dev, -1, 0) < 0) { vox_error("vox_unloadvcb", dev); retv = ATVOX_LASTERR(-1); goto error; } if (vox_setvcb(dev, VcbFileName, SETMODE) < 0) { vox_error("vox_setvcb", dev); retv = ATVOX_LASTERR(dev); goto error; } if ((hHELP = vox_loadvcb(dev, "comandos.txt", GVX_ISOLATED)) < 0) { vox_error("vox_loadvcb", dev); retv = ATVOX_LASTERR(dev); goto error; } if (vox_activatevcb(dev, hHELP, 0) < 0) { vox_error("vox_activatevcb", dev); retv = ATVOX_LASTERR(dev); goto error; } } if ((fp = fopen(ListOfFiles, "rt")) == NULL) { retv = 2; goto error; } strcpy(Text, ""); while ((ncols = nextfile(fp, RecFileName, Text)) != 0) { printf("%s", Text); fprintf(fplog, "%s", RecFileName); fprintf(fplog, "\t%s", VcbFileName); fprintf(fplog, "\t%s", Text); strcpy(PathRecFileName, Path); strcat(PathRecFileName, RecFileName); strcat(PathRecFileName, RecExt); if (RecStr(dev, PathRecFileName, 100) < 0) continue; if ((nind = vox_recind(dev, MAXINDEX, index, score, 0)) < 0) { vox_error("vox_recind", dev); continue; } fprintf(fplog, "\t%d", nind); strcpy(Text, ""); if (nind == 0) { printf("\t%s", vox_word(dev, index[0])); fprintf(fplog, "\t%s", vox_word(dev, index[0])); } else { for (i=0; i<nind; i++) { printf("\t%s\t(%d)", vox_word(dev, index[i]), (int) score[i]); fprintf(fplog, "\t%s\t(%d)", vox_word(dev, index[i]), (int) score[i]); strcat(Text, vox_wordex(dev, index[i], 0)); strcat(Text, " "); } if (ATVOX_IVCB(dev) != hHELP) { if (vox_getusedttslic() <= 0) continue; if (vox_playstr_wait(dev, 500)) { vox_error("vox_playstr_wait", dev); continue; } strcpy(PathRecFileName, strcat(PathRecFileName, strcat(PathRecFileName, strcat(PathRecFileName, Path); RecFileName); "REC"); RecExt);
140
Verbio Technologies
vox_playstr(dev, PathRecFileName, Text, CODER); if ((playdev = vox_playstr_open(dev, Text, CODER)) < 0) { vox_error("vox_playstr_open", dev); continue; } do { n = vox_playstr_read(playdev, buffer_in, AUDIO_BUFFER_SIZE); if (n > 0) { //TODO: Process audio samples stored in buffer_in: //1. Send to a CTI board channel //2. Send to a PC sound card //3. Store in a file //4. Send to any audio device } } while (n == AUDIO_BUFFER_SIZE); if (vox_playstr_close(dev, playdev) < 0) { vox_error("vox_playstr_close", dev); continue; } if (vox_playstr_release(dev)) { vox_error("vox_playstr_release", dev); continue; } } } printf("\n"); fprintf(fplog, "\n"); } if (fp) fclose(fp); if (fplog) fclose(fplog); error: vox_recstr_release(dev); vox_deactivatevcb(dev, hHELP, 0); vox_setvcb(dev, NULL, 0); vox_reccfg_release(dev, CFG_SPANISH_CATALAN); vox_srvclose(server); vox_libclose(); return retv; } #ifdef _MEM int RecStr(int dev, const char *filename, int maxsil) { int retv, nsamples; VX_RSP rsp; unsigned char *mem; struct _stat buf; FILE *fp; vox_clrrsp(&rsp); rsp.maxsil = maxsil; rsp.skip_samples = 0; if (_stat(filename, &buf)) return -1; mem = malloc(buf.st_size); fp = fopen(filename, "rb"); nsamples = fread(mem, sizeof(char), buf.st_size, fp); fclose(fp); if ((retv = vox_recstrm(dev, mem, nsamples, &rsp, CODER)) < 0) { vox_error("vox_recstr", dev); printf("%s\n", filename); getchar(); } free(mem); return retv; } #else int my_recstr(int chdev, const char *fileName, VX_RSP *rspp, unsigned int mode) { int retv = 0; int recdev, n; FILE *fp; char buffer[BUFFER_SIZE]; if ((fp = fopen(fileName, "rb")) == NULL)
Verbio Technologies
141
return -1; if ((recdev = vox_recstr_open(chdev, rspp, mode)) == -1) { fclose(fp); return -1; } do { n = fread(buffer, 1, BUFFER_SIZE, fp); if (n>0) n = vox_recstr_write(recdev, buffer, n); } while (n == BUFFER_SIZE); fclose(fp); retv = vox_recstr_close(chdev, recdev); return retv; } int RecStr(int dev, const char *filename, int maxsil) { int retv; VX_RSP rsp; vox_clrrsp(&rsp); rsp.maxsil = maxsil; if ((retv = my_recstr(dev, filename, &rsp, CODER)) < 0) { vox_error("my_recstr", dev); printf("%s\n", filename); getchar(); } return retv; } #endif void vox_error(const char *function, int dev) { printf("*** ERROR: %s failed. %s ***\n", function, ATVOX_ERRMSGP(dev)); fprintf(fplog, "*** ERROR: %s failed. %s ***\n", function, ATVOX_ERRMSGP(dev)); }
142
Verbio Technologies
if ((result = vox_dtmf_word(chdev, dtmf))) { //A previously loaded and activated DTMF grammar is printf("DTMF tone valid: %s returned\n", result); } break; } state = vox_vsd_write(vsddev, buffer, n); if (!bVoice && state!=VVX_INIT && state!= VVX_SILENCE) bVoice = true; if (bVoice && n>0) n = vox_recstr_write(recdev, buffer, n); } while (n == BUFFER_SIZE); fclose(fp); vox_dtmf_close(chdev, dtmfdev); vox_vsd_close(chdev, vsddev); vox_recstr_close(chdev, recdev);
Verbio Technologies
143
144
Verbio Technologies
Verbio Technologies
145
4. Ejemplo de SpeakerID
Ejemplo 4.4. Ejemplo de Verbio Library para verificacin del locutor
#include <stdio.h> #include "voxlib.h" int main(int argc, char *argv[]) { char *server = "192.168.2.14"; int ret; float score; vox_setparm(-1, VXGB_DEFSERVER, server); if (vox_asr_init("es", "es") < 0) return -1; if (vox_spk_init() < 0) return -1; if (!vox_spk_exist(0, "1234")) { vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, "1234", "1234", "1234", "1234", "1234", "1234", "1234", "1234", "1234", "1234", "F:/datos/wavs_prueba/77308296.wav", "77308296"); "F:/datos/wavs_prueba/0123456789.wav", "0123456789"); "F:/datos/wavs_prueba/9876543210.wav", "9876543210"); "F:/datos/wavs_prueba/0246813579.wav", "0246813579"); "F:/datos/wavs_prueba/1470258369.wav", "1470258369"); "F:/datos/wavs_prueba/5193280476.wav", "5193280476"); "F:/datos/wavs_prueba/9461725038.wav", "9461725038"); "F:/datos/wavs_prueba/5862319407.wav", "5862319407"); "F:/datos/wavs_prueba/3659102487.wav", "3659102487"); "F:/datos/wavs_prueba/4209167183.wav", "4209167183");
ret = vox_spk_train(0, "1234", 0, 0); } else ret = vox_spk_verify(0, "1234", "F:/David/Soft/Biometco/api/datos/wavs_prueba/023_0009.wav", "02468", &score); vox_libclose(); }
146
Verbio Technologies
vdemo.txt
Eduardo Campillo Asuncin Chinea Marta Cuenca Emilio Doblado Guillermo Estrada Mara Fras Sergio Galndez Eloy de la Fuente Enrique Hurtado Pablo Jimnez Francisco Luna Fernando Mayoral Susana Martnez Germn Morales Alfonso Morillo Juan Oliva Inmaculada Snchez Gloria Machado Pilar Zaragoza Irene Ponsa Jose Riveiro Marcial Rodrguez Jorge Snchez Alberto Salvador Hctor Osorio Carmen Puente Carolina Segovia Alejandro Tarrida Leonardo Toronto Jess Urrubieta Departamento Comercial Departamento Tcnico Proveedores Administracin Direccin
vdemo.gui
Eloy de la Fuente Francisco Luna Proveedores Alberto Salvador Guillermo Estrada Sergio Galndez Jos Mario
148
Verbio Technologies
ndice
C
Cliente-Servidor cerrar conexin, 98 desconexiones, 75
D
Definicin de parmetros, 126 Deteccin de la voz ejecucin, 113 finalizacin, 110 inicializacin, 111 parmetros, 14 Deteccin de tonos DTMF ejecucin, 21 finalizacin, 18 inicializacin, 19
detener, 100 ejecucin, 65, 67, 73 finalizacin, 69 funcin de callback, 74 informacin adicional, 134 inicializacin, 70 liberacin de recursos, 59, 71 nmero de resultados, 41 obtencin de los resultados, 20, 114, 115 obtencin de resultados, 39, 63 parmetros, 13 reserva de un recurso, 61, 72 tipo de gramtica, 11 vocabulario, 31 Reconocimiento del habla obtencin de los resultados, 116 Recursos liberacin, 17, 33, 101
S
SAPI MODEATTRIBUTES, 125 SAPI 4.0 abrir, 77, 79 cerrar, 76 seleccionar, 80 Sntesis ejecucin, 46 finalizacin, 44 inicializacin, 45 Sntesis del habla configuracin, 82, 85, 104, 106 detener, 99 ejecucin, 42 liberacin de recursos, 47 reserva de un recurso, 48
E
Errores obtencin, 22, 32
G
Gramticas activacin, 4 carga, 36, 37 desactivacin, 15 descarga, 108 establecimiento, 88 preparacin, 12, 49, 51, 54, 56
I
Inicializacin recursos ASR, 8 recursos ASR y TTS, 34 recursos SpeakerID, 93 recursos TTS, 102
V
VAD, Voice Activity Detection VAD_PRM, 121 VAD_PRM inicializacin, 14 Verificacin del locutor Creacin de la huella vocal, 94 Entrenamiento, 90 Usuarios registrados, 92 Verificacin, 96 Versin obtencin, 25 Vocabularios activacin, 4 carga, 36, 37 desactivacin, 15 descarga, 108 establecimiento, 84, 88 obtencin, 31 preparacin, 6, 12, 49, 51, 54, 56 VX_RSP inicializacin, 13
L
Liberacin recursos ASR y TTS, 33, 101 Licencias reconocimiento, 23, 29 sntesis, 27, 30
N
Nmero de serie, 81
P
Parmetros asignacin, 87 obtencin, 26
R
Recognize String Parameter VX_RSP, 120 Reconocimiento