You are on page 1of 159

Verbio Software Reference

Referencia de las funciones del Library SDK


Verbio Technologies, S.L.

Verbio Software Reference: Referencia de las funciones del Library SDK


Verbio Technologies, S.L. publicado Septiembre de 2009 Copyright 2009 Verbio Technologies, S.L.

Tabla de contenidos
1. Introduccin ..................................................................................................................... 1 2. Descripcin de las funciones ................................................................................................ 3 1. vox_activatevcb ........................................................................................................ 4 2. vox_ApplyDictionary ................................................................................................. 6 3. vox_asr_init .............................................................................................................. 8 4. ATVOX_BUILTIN ...................................................................................................11 5. vox_chkwrd .............................................................................................................12 6. vox_clrrsp ...............................................................................................................13 7. vox_clrvad ..............................................................................................................14 8. vox_deactivatevcb ....................................................................................................15 9. vox_devclose ...........................................................................................................17 10. vox_dtmf_close ......................................................................................................18 11. vox_dtmf_open .......................................................................................................19 12. vox_dtmf_word ......................................................................................................20 13. vox_dtmf_write ......................................................................................................21 14. ATVOX_ERRMSGP ...............................................................................................22 15. vox_getasrlic ..........................................................................................................23 16. vox_GetDllVersion .................................................................................................25 17. vox_getparm ..........................................................................................................26 18. vox_getttslic ..........................................................................................................27 19. vox_getusedasrlic ....................................................................................................29 20. vox_getusedttslic ....................................................................................................30 21. ATVOX_IVCB ......................................................................................................31 22. ATVOX_LASTERR ................................................................................................32 23. vox_libclose ...........................................................................................................33 24. vox_libinit .............................................................................................................34 25. vox_loadcd ............................................................................................................36 26. vox_loadvcb ..........................................................................................................37 27. vox_nbest ..............................................................................................................39 28. ATVOX_NIND ......................................................................................................41 29. vox_playstr ............................................................................................................42 30. vox_playstr_close ...................................................................................................44 31. vox_playstr_open ....................................................................................................45 32. vox_playstr_read .....................................................................................................46 33. vox_playstr_release .................................................................................................47 34. vox_playstr_wait .....................................................................................................48 35. vox_prevcb ............................................................................................................49 36. vox_prevcbdev .......................................................................................................51 37. vox_prevcbex .........................................................................................................54 38. vox_prevcbex2 .......................................................................................................56 39. vox_reccfg_release ..................................................................................................59 40. vox_reccfg_wait .....................................................................................................61 41. vox_recind .............................................................................................................63 42. vox_recstr ..............................................................................................................65 43. vox_recstrm ...........................................................................................................67 44. vox_recstr_close .....................................................................................................69 45. vox_recstr_open .....................................................................................................70 46. vox_recstr_release ...................................................................................................71 47. vox_recstr_wait ......................................................................................................72 48. vox_recstr_write .....................................................................................................73 49. vox_RegisterVVICallback ........................................................................................74 50. vox_regsrvclose ......................................................................................................75 51. vox_SapiClose .......................................................................................................76 52. vox_SapiOpen ........................................................................................................77 53. vox_SapiOpenEx ....................................................................................................79 54. vox_SapiSelect .......................................................................................................80 55. vox_SerialNumber ..................................................................................................81 56. vox_SetAbbreviations ..............................................................................................81

Verbio Software Reference

57. vox_setcd ..............................................................................................................84 58. vox_SetDictionary ..................................................................................................85 59. vox_setparm ..........................................................................................................87 60. vox_setvcb ............................................................................................................88 61. vox_spk_addfile .....................................................................................................90 62. vox_spk_exist ........................................................................................................92 63. vox_spk_init ..........................................................................................................93 64. vox_spk_train .........................................................................................................94 65. vox_spk_verify .......................................................................................................96 66. vox_srvclose ..........................................................................................................98 67. vox_termplaystr ......................................................................................................99 68. vox_termrecstr ..................................................................................................... 100 69. vox_thclose .......................................................................................................... 101 70. vox_tts_init .......................................................................................................... 102 71. vox_ttsSetAbbreviations ......................................................................................... 104 72. vox_ttsSetDictionary ............................................................................................. 106 73. vox_unloadvcb ..................................................................................................... 108 74. vox_vsd_close ...................................................................................................... 110 75. vox_vsd_open ...................................................................................................... 111 76. vox_vsd_write ...................................................................................................... 113 77. vox_word ............................................................................................................ 114 78. vox_wordex ......................................................................................................... 115 79. vox_wordrule ....................................................................................................... 116 3. Estructuras de datos y parmetros ...................................................................................... 119 1. VX_RSP - Recognize String Parameter ....................................................................... 120 2. VAD_PRM - Voice Activity Detection Parameters ....................................................... 121 3. MODEATTRIBUTES - SAPI Speaker Id .................................................................... 125 4. Definicin de parmetros para vox_getparm() y vox_setparm() ....................................... 126 5. Obtencin de informacin adicional mediante vox_word o vox_wordex ............................ 134 4. Cdigo de ejemplos en C/C++ ........................................................................................... 137 1. Ejemplo Sncrono ................................................................................................... 138 2. Ejemplo de Deteccin de voz y de tonos DTMF ........................................................... 143 3. Ejemplo de uso del reconocimiento natural basado en modelos estadsticos (SLM) .............. 144 4. Ejemplo de SpeakerID ............................................................................................. 146 A. Ficheros utilizados por los ejemplos .................................................................................. 147 ndice .............................................................................................................................. 149

vi

Referencia de las funciones del Library SDK

Verbio Technologies

Lista de tablas
3.1. Parmetros globales en el Library SDK ............................................................................ 126 3.2. Parmetros de canal en el Library SDK ............................................................................ 129 3.3. Elementos de un vocabulario o gramtica ABNF ................................................................ 134

Lista de ejemplos
3.1. Informacin devuelta por el servidor de reconocimiento ...................................................... 135 4.1. Ejemplo sncrono de Verbio Library ................................................................................ 138 4.2. Ejemplo de Deteccin de voz y de tonos DTMF ................................................................. 143 4.3. Ejemplo de reconocimiento SLM .................................................................................... 144 4.4. Ejemplo de Verbio Library para verificacin del locutor ...................................................... 146

Captulo 1. Introduccin
El objectivo de este documento es describir el conjunto de funciones que constituyen el Library SDK proporcionado en Verbio. Este SDK est diseado pensando en aquellos integradores que trabajan en entornos de programacin C/C++ sobre dispositivos de audio genricos (tanto tarjetas CTI como tarjetas de sonido). Es compatible con las versiones antiguas de Verbio (IberVox 6.41 y anteriores), aunque en nuevos desarrollos es aconsejable utilizar la Advanced SDK, puesto que sta facilita el uso de las nuevas funcionalidades incorporadas en Verbio (aunque este SDK slo est disponible en entornos de programacin Microsoft Visual Studio). En el Captulo 2. Descripcin de las funciones se describen todas las funciones disponibles en el SDK. En el Captulo 3. Estructuras de datos y parmetros se describen las estructuras y parmetros comunes a las funciones del SDK. En el Captulo 4. Cdigo de ejemplos en C/C++ se incluyen 2 ejemplos de utilizacin de este SDK: un ejemplo de programacin sncrona y otro de deteccin de voz (VAD) y de tonos DTMF.

Captulo 2. funciones

Descripcin

de

las

Captulo 2. Descripcin de las funciones

1. vox_activatevcb
FUNCION int vox_activatevcb(int chdev, int vcbhandle, unsigned int mode) int chdev int vcbhandle unsigned int mode RETORNA descriptor de un canal vlido descriptor de un vocabulario o gramtica ABNF previamente cargado por compatibilidad con versiones anteriores, sese 0

>=0 indicando el descriptor del vocabulario si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

1.1. Descripcin
La funcin vox_activatevcb() activa el vocabulario previamente cargado en el canal especificado. El descriptor del vocabulario cargado se obtiene invocando a la funcin vox_loadvcb(). Cuando no deba utilizarse en el siguente proceso de reconocimiento, debe ser desactivado mediante la funcin vox_deactivatevcb().

1.2. Descripcin de los parmetros


chdev vcbhandle mode especifica el descriptor de canal vlido. descriptor de un vocabulario o gramtica ABNF previamente cargado mediante la funcin vox_loadvcb(). por compatibilidad con versiones anteriores, sese 0

1.3. Precauciones
En cualquier momento, pueden estar activos varios vocabularios y gramticas. El descriptor utilizado en la funcin vox_activatevcb() debe ser el valor retornado por la funcin vox_loadvcb(). La funcin ATVOX_IVCB() retorna el descriptor asociado al vocabulario que contiene la locucin reconocida. Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento.

1.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_VCBFILE EVX_INVWORD EVX_SYSTEM OUT OF MEMORY THE VOCABULARY FILE NAME IS NOT VALID. Check the vocabulary file name and path writing permission. THE VOCABULARY TRANSCRIPTION WAS NOT FOUND SYSTEM ERROR. Check errno.

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

1.5. Elementos relacionados


vox_setvcb, vox_loadvcb, vox_deactivatevcb, vox_unloadvcb, ATVOX_IVCB

1.6. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

Captulo 2. Descripcin de las funciones

2. vox_ApplyDictionary
FUNCION int vox_ApplyDictionary(const char *inVcbName, const char *outVcbName, const char *Dictionary) const char *inVcbName const char *outVcbName const char *Dictionary RETORNA nombre del fichero que contiene el vocabulario que debe procesarse nombre del fichero bajo el que se almacenar el fichero de vocabulario procesado nombre del fichero que contiene el vocabulario de excepciones

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

2.1. Descripcin
La funcin vox_ApplyDictionary() genera un fichero de vocabulario a partir de otro original incluyendo las excepciones y acrnimos contenidos en el diccionario especificado.

2.2. Descripcin de los parmetros


inVcbName outVcbName nombre del fichero de vocabulario original que debe ser procesado. Cada lnea debe contener una palabra del vocabulario formado por una o ms palabras. nombre del fichero que contendr el nuevo vocabulario. Cada lnea contendr una palabra del vocabulario formada por las palabras originales o bien por aquellas que hayan sido modificadas siguiendo las pautas del diccionario de excepciones. nombre del fichero de texto que contiene las excepciones que deben considerarse. Consulte Verbio Software Reference: Gua del usuario para ms informacin del formato que debe tener este un fichero de excepciones.

Dictionary

2.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_NOMEM EVX_VCBFILE EVX_DICFILE OUT OF MEMORY THE VOCABULARY FILE NAME IS NOT VALID. Check the vocabulary file name and path writing permission. THE DICTIONARY FILE NAME IS NOT VALID. Check the dictionary file name.

2.4. Elementos relacionados


vox_prevcb, vox_prevcbex, vox_prevcbex2, vox_prevcbdev, vox_chkwrd

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

2.5. Cdigos de ejemplo


Consulte el ejemplo asncrono del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

Captulo 2. Descripcin de las funciones

3. vox_asr_init
FUNCION int vox_asr_init(const char *configuration, const char *defasrlng) const char *configuration const char *defasrlng RETORNA identificador de la configuracin de reconocimiento por defecto identificador del idioma de reconocimiento por defecto

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

3.1. Descripcin
La funcin vox_asr_init() inicializa la librera de reconocimiento del habla de Verbio. En nuevos desarrollos es recomendable utilizar esta funcin (conjuntamente con la funcin vox_tts_init en caso de que tambin se requiera sntesis del habla) en lugar de la funcin vox_libinit, puesto que permite indicar al servidor los parmetros de inicializacin de una manera mucho ms concreta.

3.2. Descripcin de los parmetros


configuration especifica la configuracin por defecto con la que arrancar el servidor de reconocimiento. Por configuracin de reconocimiento se entiende el idioma o idiomas soportados (en caso de configuraciones multilinges) por el servidor de reconocimiento. Cualquier proceso de reconocimiento invocado usar los modelos de reconocimiento asociados con la configuracin activa en ese momento, por lo que nicamente podr reconocerse en alguno de los idiomas contenidos en dicha configuracin. Para ms informacin, puede consultarse el documento Verbio Software Reference: Gua del Usuario. CFG_SPANISH CFG_SPANISH_CATALAN CFG_SPANISH_BASQUE CFG_SPANISH_GALICIAN CFG_SPANISH_CATALAN_BASQUE_GALICIAN CFG_PORTUGUESE CFG_PORTUGUESE_BRAZILIAN CFG_SPANISH_ARGENTINIAN CFG_SPANISH_CHILEAN CFG_SPANISH_COLOMBIAN Espaol castellano Espaol cataln Espaol euskera Espaol gallego castellano castellano castellano + + +

Espaol castellano + cataln + euskera + gallego Portugus Portugus brasileo Espaol argentino Espaol chileno Espaol colombiano

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

CFG_SPANISH_MEXICAN CFG_SPANISH_VENEZUELAN CFG_FRENCH CFG_ENGLISH defasrlng

Espaol mexicano Espaol venezolano Francs Ingls

especifica el idioma por defecto con el que trabaja la configuracin por defecto. En el caso de configuraciones monolinges es redundante, aunque s es imprescindible cuando se activa una configuracin multilinge. LNG_SPANISH LNG_CATALAN LNG_BASQUE LNG_GALICIAN LNG_PORTUGUESE LNG_PORTUGUESE_BRAZILIAN LNG_SPANISH_ARGENTINIAN LNG_SPANISH_CHILEAN LNG_SPANISH_COLOMBIAN LNG_SPANISH_MEXICAN LNG_SPANISH_VENEZUELAN LNG_FRENCH LNG_ENGLISH Espaol castellano Cataln Euskera Gallego Portugus Portugus brasileo Espaol argentino Espaol chileno Espaol colombiano Espaol mexicano Espaol venezolano Francs Ingls

3.3. Precauciones
La funcin vox_asr_init() debe invocarse antes que ninguna otra de las funciones del Library SDK relacionadas con el reconocimiento del habla, a excepcin de aquella destinada a establecer el servidor de trabajo por defecto en configuraciones cliente-servidor (vox_setparm).

3.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_INVSETUP EVX_NOMEM EVX_NOLICFILE EVX_INVLIC VERBIO INTERNAL ERROR. Files may be corrupted. Check disk and repeat Setup. OUT OF MEMORY. NO LICENSE FILE WAS FOUND. Run CheckOut to obtain a license file. THE LICENSE FILE IS NOT VALID. Run CheckOut to obtain a valid license file.

Verbio Technologies

Referencia de las funciones del Library SDK

Captulo 2. Descripcin de las funciones

EVX_SYSTEM

SYSTEM ERROR.Check errno.

3.5. Elementos relacionados


vox_libinit, vox_tts_init, vox_libclose

3.6. Cdigos de ejemplo


Consulte el ejemplo anexo.

10

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

4. ATVOX_BUILTIN
FUNCION int ATVOX_BUILTIN(int chdev) int chdev RETORNA descriptor de un canal vlido

0 para indicar que el resultado del reconocimiento no procede de una gramtica built-in 1 para indicar que el resultado del reconocimiento s procede de una gramtica built-in

INCLUDES MODO

voxlib.h sncrono

4.1. Descripcin
La funcin ATVOX_BUILTIN() indica si la gramtica que ha devuelto el resultado de reconocimiento al finalizar la llamada a la funcin vox_recind() o vox_nbest() es una gramtica interna (built-in) o no.

4.2. Descripcin de los parmetros


chdev especifica el descriptor de canal vlido.

4.3. Precauciones
El valor devuelto por la funcin ATVOX_BUILTIN() nicamente es vlido despus de la correcta finalizacin de la funcin vox_recind() o vox_nbest().

4.4. Elementos relacionados


vox_recind, vox_nbest

4.5. Cdigos de ejemplo


Consulte el ejemplo asncrono del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

11

Captulo 2. Descripcin de las funciones

5. vox_chkwrd
FUNCION int vox_chkwrd(const char *word, int language) const char *word unsigned int language RETORNA puntero a la palabra del vocabulario que desea verificarse idioma del vocabulario

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

5.1. Descripcin
La funcin vox_chkwrd() chequea la palabra del vocabulario especificada para garantizar que la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()) realizar la transcripcin de texto a fonema de forma correcta. Esta funcin es independiente del canal, por lo que nicamente debe ser llamada una vez para cada nueva palabra de los vocabularios, independientemente de si, con posterioridad, el vocabulario se usar en varios canales.

5.2. Descripcin de los parmetros


word language puntero a la palabra del vocabulario (formada por una o ms palabras) que desea verificarse. especifica el idioma con el que se preparar el vocabulario que contiene la palabra a analizar. LVX_SPANISH LVX_CATALAN Espaol Cataln

5.3. Precauciones
Esta funcin realiza una verificacin ms exhaustiva que la utilizada por la funcin vox_prevcb(). Por lo tanto, es posible que la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()) realice una correcta transcripcin a pesar de que la funcin vox_chkwrd() devuelva error. No obstante, es aconsejable corregir aquellas palabras incorrectas para conseguir una transcripcin ms precisa. Esta funcin nicamente est disponible para los idiomas castellano y cataln.

5.4. Elementos relacionados


vox_prevcb, vox_prevcbex, vox_prevcbex2, vox_prevcbdev, vox_ApplyDictionary

5.5. Cdigos de ejemplo


Consulte el ejemplo asncrono del Dialogic SDK.

12

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

6. vox_clrrsp
FUNCION void vox_clrrsp(VX_RSP *rspp) VX_RSP *rspp puntero a una estructura de tipo Recognition String Parameter

RETORNA INCLUDES MODO

Nada voxlib.h sncrono

6.1. Descripcin
La funcin vox_clrrsp() resetea todos los campos de la estructura VX_RSP asignndoles sus valores por defecto. Es aconsejable utilizar esta funcin para inicializar cualquier estructura VX_RSP antes de ser utilizada por otras funciones.

6.2. Descripcin de los parmetros


rspp puntero a la estructura de tipo Recognition String Parameter que desea inicializarse. Esta estructura especifica parmetros y condiciones de terminacin adicionales para el proceso de reconocimiento. Consulte Captulo 3. Estructuras de datos y parmetros para obtener ms informacin acerca de las estructuras VX_RSP.

6.3. Precauciones
La estructura RSP debe ser reseteada mediante la funcin vox_clrrsp() antes de modificar cualquiera de sus campos.

6.4. Elementos relacionados


vox_recstr, vox_recstr_open

6.5. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

13

Captulo 2. Descripcin de las funciones

7. vox_clrvad
FUNCION void vox_clrvad(VAD_PRM *prm) VAD_PRM *prm puntero a una estructura de tipo Voice Detection Parameter Activity

RETORNA INCLUDES MODO

Nada voxlib.h sncrono

7.1. Descripcin
La funcin vox_clrvad() resetea todos los campos de la estructura VAD_PRM asignndoles sus valores por defecto. Es aconsejable utilizar esta funcin para inicializar cualquier estructura VAD_PRM antes de ser utilizada por otras funciones. Para conocer el contenido de la estructura y los valores por defecto que les asigna esta funcin, consulte el Captulo 3. Estructuras de datos y parmetros.

7.2. Descripcin de los parmetros


prm puntero a la estructura de tipo Voice Activity Detection Parameter que desea inicializarse. Esta estructura especifica parmetros y condiciones de contorno para el proceso de deteccin de la actividad vocal. Consulte el Captulo 3. Estructuras de datos y parmetros para obtener ms informacin acerca de la estructura VAD_PRM.

7.3. Precauciones
La estructura VAD_PRM debe ser reseteada mediante la funcin vox_clrvad antes de modificar cualquiera de sus campos.

7.4. Elementos relacionados


vox_vsd_open

7.5. Cdigos de ejemplo


Consulte el ejemplo anexo.

14

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

8. vox_deactivatevcb
FUNCION int vox_deactivatevcb(int chdev, int vcbhandle, unsigned int mode) int chdev int vcbhandle unsigned int mode RETORNA descriptor de un canal vlido descriptor de un vocabulario o gramtica ABNF previamente cargado y activado por compatibilidad con versiones anteriores, sese 0

>=0 indicando el descriptor del vocabulario si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

8.1. Descripcin
La funcin vox_deactivatevcb() desactiva un vocabulario o gramtica ABNF previamente cargado y activado en el canal especificado. El descriptor del vocabulario se obtiene al cargarlo mediante la funcin vox_loadvcb() y tambin debe usarse para activarlo mediante la funcin vox_activatevcb() o para descargarlo mediante la funcin vox_unloadvcb().

8.2. Descripcin de los parmetros


chdev vcbhandle mode especifica el descriptor de canal vlido. descriptor de un vocabulario o gramtica ABNF previamente cargado mediante la funcin vox_loadvcb() y activado mediante la funcin vox_activatevcb(). por compatibilidad con versiones anteriores, sese 0

8.3. Precauciones
En cualquier momento, pueden estar activos varios vocabularios y gramticas. El descriptor utilizado en la funcin vox_deactivatevcb() debe ser el valor retornado por la funcin vox_loadvcb(). Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento.

8.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_VCBFILE EVX_INVWORD EVX_SYSTEM OUT OF MEMORY THE VOCABULARY FILE NAME IS NOT VALID. THE VOCABULARY TRANSCRIPTION WAS OT FOUND SYSTEM ERROR. Check errno.

Verbio Technologies

Referencia de las funciones del Library SDK

15

Captulo 2. Descripcin de las funciones

8.5. Elementos relacionados


vox_setvcb, vox_loadvcb, vox_loadcd, vox_activatevcb, vox_unloadvcb, ATVOX_IVCB

8.6. Cdigos de ejemplo


Consulte el ejemplo anexo.

16

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

9. vox_devclose
FUNCION int vox_devclose(int chdev) int chdev RETORNA descriptor de un canal vlido

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

9.1. Descripcin
La funcin vox_devclose() libera los recursos consumidos por el canal especificado. Es aconsejable invocarla cuando la aplicacin no deba hacer uso de recursos de reconocimiento ni de sntesis por el canal indicado.

9.2. Descripcin de los parmetros


chdev especifica el descriptor de canal vlido.

9.3. Precauciones
En aplicaciones cuyos descriptores de canal se creen y destruyan de forma permanente (es decir, que no son utilizados a lo largo de todo el tiempo de vida de la aplicacin) es muy recomandable invocar a esta funcin al finalizar el uso del cada canal. De este modo, se liberaran recursos (memoria, procesos, etc.) que pueden ser requeridos por los nuevos canales a utilizar.

9.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_NOLINE NO MORE LINES ARE AVAILABLE FOR THE SPECIFIED CHANNEL DEVICE

9.5. Elementos relacionados


vox_libclose, vox_srvclose, vox_thclose

9.6. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

17

Captulo 2. Descripcin de las funciones

10. vox_dtmf_close
FUNCION int vox_dtmf_close(int chdev, DTMF_REG* dtmfdev) int chdev DTMF_REG* dtmfdev RETORNA descriptor de un canal vlido descriptor de deteccin de tonos DTMF vlido

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

10.1. Descripcin
La funcin vox_dtmf_close() cierra el desciptor de deteccin de tonos DTMF abierto mediante la funcin vox_dtmf_open y libera los recursos utilizados durante el proceso de deteccin de tonos DTMF.

10.2. Descripcin de los parmetros


chdev dtmfdev especifica el descriptor de canal vlido. especifica el descriptor de deteccin de tonos DTMF vlido obtenido mediante la funcin vox_dtmf_open.

10.3. Elementos relacionados


vox_dtmf_open, vox_dtmf_write

10.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

18

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

11. vox_dtmf_open
FUNCION DTMF_REG* vox_dtmf_open(int chdev, unsigned int mode) int chdev unsigned int mode RETORNA descriptor de un canal vlido formato de las muestras (Ley A, Ley Mu o lineal)

!= -1 para indicar el descriptor de deteccin de tonos DTMF -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

11.1. Descripcin
La funcin vox_dtmf_open() inicializa el detector de tonos DTMF en el canal especificado, de modo que est preparado para empezar a recibir las muestras de audio mediante la funcin vox_dtmf_write(). El valor devuelto por la funcin es requerido por las funciones vox_dtmf_write() y vox_dtmf_close().

11.2. Descripcin de los parmetros


chdev mode especifica el descriptor de canal vlido. especifica el formato de las muestras de audio pasadas al detector de voz. MC_ALAW MC_MULAW MC_LIN16 formato PCM (Ley A) a 8 KHz. formato PCM (Ley Mu) a 8 KHz. formato PCM (lineal 16 bits) a 8 KHz.

11.3. Precauciones
Una vez finalizado el proceso de deteccin de tonos DTMF, es imprescindible invocar a la funcin vox_dtmf_close para liberar los recursos de memoria utilizados durante el proceso de deteccin.

11.4. Elementos relacionados


vox_dtmf_write, vox_dtmf_close

11.5. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

19

Captulo 2. Descripcin de las funciones

12. vox_dtmf_word
FUNCION char* vox_dtmf_word(int chdev, const char *sequence) int chdev const char* sequence RETORNA descriptor de un canal vlido cadena de tonos DTMF recibida en el canal.

puntero a un vector de caracteres con el contenido de la palabra del vocabulario retornada por la gramtica, cuando se cumple una de sus alternativas. puntero nulo si la secuencia no cumple ninguna de las opciones contempladas por la gramtica DTMF.

INCLUDES MODO

voxlib.h sncrono

12.1. Descripcin
La funcin vox_dtmfword() devuelve un puntero a un vector de caracteres ASCIIZ con el contenido asociado a la secuencia de tonos DTMF recibido por el canal y contenidos en el vocabulario o gramtica activa en el canal.

12.2. Descripcin de los parmetros


chdev sequence especifica el descriptor de canal vlido. cadena de tonos DTMF recibida mediante las funciones vox_dtmf_open, vox_dtmf_write y vox_dtmf_close y de la que se desea saber si cumple la gramtica DTMF cargada en el canal especificado.

12.3. Elementos relacionados


vox_wordex, vox_recstr

12.4. Cdigos de ejemplo


Consulte el ejemplo sncrono.

20

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

13. vox_dtmf_write
FUNCION const char* vox_dtmf_write(DTMF_REG* dtmfdev, const void *buffer, unsigned int n) DTMF_REG* dtmfdev const void *buffer unsigned int n RETORNA descriptor de deteccin de tonos DTMF vlido vector en el que se encuentran las muestras de audio que debe procesar el detector de tonos DTMF tamao del vector de muestras (en bytes)

puntero a un vector de caracteres con los tonos DTMF reconocidos en el vector de muestras acabado de procesar 0 (NULL) en caso de que no se haya detectado ningn tono DTMF en el vector de muestras acabado de procesar

INCLUDES MODO

voxlib.h sncrono

13.1. Descripcin
La funcin vox_dtmf_write() enva las muestras recibidas hacia el detector de tonos DTMF para ser procesadas. La funcin retorna los identificadores de los tonos DTMF detectados dentro de la ltima trama de muestras procesada. Los posibles identificadores son: 1 2 3 4 5 6 7 8 9 0 * # A B C D.

13.2. Descripcin de los parmetros


dtmfdev buffer n especifica el descriptor de deteccin de tonos DTMF vlido obtenido mediante la funcin vox_dtmf_open. vector en el que se encuentran las muestras de audio que debe procesar el detector de tonos DTMF. tamao del vector de muestras.

13.3. Precauciones
El vector de caracteres retornado es voltil, de modo que en las sucesivas invocaciones a esta funcin o a las funciones vox_dtmf_open y vox_dtmf_close su valor se ver modificado, siendo necesario su almacenamiento si se requiere un procesado posterior del resultado retornado.

13.4. Elementos relacionados


vox_dtmf_open, vox_dtmf_close

13.5. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

21

Captulo 2. Descripcin de las funciones

14. ATVOX_ERRMSGP
FUNCION char * ATVOX_ERRMSGP(int dev) int dev RETORNA INCLUDES MODO descriptor de un canal o -1 para funciones independientes del canal

vector de caracteres con una descripcin del error ocurrido en la ltima llamada a una funcin del SDK voxlib.h sncrono

14.1. Descripcin
La funcin ATVOX_ERRMSGP() devuelve un puntero a un vector ASCIIZ que describe el motivo del error producido durante la ltima llamada a una funcin de la librera Verbio. Este puntero es vlido a lo largo de la ejecucin de la aplicacin. Si no se ha producido ningn error durante la ltima llamada a una funcin, el vector contiene el valor "NO ERROR". Si el error se ha producido durante la llamada a una funcin dependiente del canal (vox_setvcb(), vox_recstr(), ...) el parmetro de entrada dev especifica el descriptor de canal vlido. Si el error se ha producido durante la llamada a una funcin independiente del canal (vox_libinit(), vox_prevcb(), vox_ApplyDictionary(), ...) debe utilizarse -1 como valor del parmetro dev.

14.2. Descripcin de los parmetros


dev especifica el descriptor de canal vlido o -1 para funciones independientes del canal.

14.3. Elementos relacionados


ATVOX_LASTERR

14.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

22

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

15. vox_getasrlic
FUNCION int vox_getasrlic(const char *configuration) const char *configuration RETORNA INCLUDES MODO identificador de la configuracin de reconocimiento de la que se desean consultar las licencias disponibles

Nmero de licencias mximas disponibles (adquiridas) voxlib.h sncrono

15.1. Descripcin
La funcin vox_getasrlic() consulta el nmero de licencias de la configuracin especificada disponibles en total (adquiridas) en el servidor utilizado (aqul especificado antes de invocar a la funcin vox_libinit o vox_asr_init).

15.2. Descripcin de los parmetros


configuration especifica la configuracin de reconocimiento de la que se desea conocer el nmero de licencias disponibles. Para ms informacin, puede consultarse el documento Verbio Software Reference: Gua del Usuario. CFG_SPANISH CFG_SPANISH_CATALAN CFG_SPANISH_BASQUE CFG_SPANISH_GALICIAN CFG_SPANISH_CATALAN_BASQUE_GALICIAN CFG_PORTUGUESE CFG_PORTUGUESE_BRAZILIAN CFG_SPANISH_ARGENTINIAN CFG_SPANISH_CHILEAN CFG_SPANISH_COLOMBIAN CFG_SPANISH_MEXICAN CFG_SPANISH_VENEZUELAN CFG_FRENCH CFG_ENGLISH Espaol castellano Espaol cataln Espaol euskera Espaol gallego castellano castellano castellano + + +

Espaol castellano + cataln + euskera + gallego Portugus Portugus brasileo Espaol argentino Espaol chileno Espaol colombiano Espaol mexicano Espaol venezolano Francs Ingls

Verbio Technologies

Referencia de las funciones del Library SDK

23

Captulo 2. Descripcin de las funciones

15.3. Precauciones
La funcin vox_getasrlic() debe invocarse una vez establecida la comunicacin con el servidor de reconocimiento al que se le solicita el nmero de licencias disponibles, entendiendo por disponibles el nmero mximo de peticiones de reconocimiento simultneas que pueden realizarse, en ese servidor, para la configuracin especificada.

15.4. Elementos relacionados


vox_getusedasrlic, vox_getttslic, vox_getusedttslic, vox_libinit, vox_asr_init

15.5. Cdigos de ejemplo


Consulte el ejemplo anexo.

24

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

16. vox_GetDllVersion
FUNCION int vox_GetDllVersion(unsigned long *fileverp, unsigned long *prodverp) unsigned long *fileverp unsigned long *prodverp RETORNA nmero de versin del fichero DLL de VERBIO nmero de versin del producto

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

16.1. Descripcin
La funcin vox_GetDllVersion() retorna el nmero de versin de la DLL de VERBIO tanto del fichero como del producto.

16.2. Descripcin de los parmetros


fileverp prodverp puntero en el que se guardar la informacin referente a la versin del fichero. puntero en el que se guardar la informacin referente a la versin del producto.

16.3. Elementos relacionados


vox_SerialNumber

16.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

25

Captulo 2. Descripcin de las funciones

17. vox_getparm
FUNCION int vox_getparm(int dev, unsigned long parm, void *valuep) int dev unsigned long parm void *valuep descriptor de un canal o -1 para parmetros globales de VERBIO (independientes del canal) parmetro del que se desea obtener el valor puntero a la variable en la que se almacenar el valor del parmetro solicitado

RETORNA

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

17.1. Descripcin
La funcin vox_getparm() obtiene los valores actuales de los parmetros globales o dependientes del canal de VERBIO. Esta funcin puede obtener el valor de un nico parmetro en cada invocacin.

17.2. Descripcin de los parmetros


dev parm especifica el descriptor de canal vlido. Use -1 para obtener el valor de parmetros globales de VERBIO. especifica el identificador del parmetro del que se desea recuperar el valor en la variable apuntada por valuep. Los identificadores de los parmetros pueden consultarse en Captulo 3. Estructuras de datos y parmetros. puntero a la variable en la que se almacenar el valor del parmetro solicitado.

valuep

17.3. Elementos relacionados


vox_setparm

17.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

26

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

18. vox_getttslic
FUNCION int vox_getttslic(const char *language) const char *language identificador del idioma de sntesis del que se desean consultar las licencias disponibles

RETORNA INCLUDES MODO

Nmero de licencias mximas disponibles (adquiridas) voxlib.h sncrono

18.1. Descripcin
La funcin vox_getttslic() consulta el nmero de licencias del idioma especificado disponibles en total (adquiridas) en el servidor utilizado (aqul especificado antes de invocar a la funcin vox_libinit o vox_tts_init).

18.2. Descripcin de los parmetros


language especifica el idioma de sntesis del que se desea conocer el nmero de licencias disponibles. Para ms informacin, puede consultarse el documento Verbio Software Reference: Gua del Usuario. LNG_SPANISH LNG_CATALAN LNG_BASQUE LNG_GALICIAN LNG_PORTUGUESE LNG_PORTUGUESE_BRAZILIAN LNG_SPANISH_ARGENTINIAN LNG_SPANISH_MEXICAN LNG_FRENCH LNG_ENGLISH Espaol castellano Cataln Euskera Gallego Portugus Portugus brasileo Espaol argentino Espaol mexicano Francs Ingls

18.3. Precauciones
La funcin vox_getttslic() debe invocarse una vez establecida la comunicacin con el servidor de sntesis al que se le solicita el nmero de licencias disponibles, entendiendo por disponibles el nmero mximo de peticiones de sntesis simultneas que pueden realizarse, en ese servidor, para el idioma especificado.

18.4. Elementos relacionados


vox_getusedttslic, vox_getasrlic, vox_getusedasrlic, vox_libinit, vox_tts_init

18.5. Cdigos de ejemplo

Verbio Technologies

Referencia de las funciones del Library SDK

27

Captulo 2. Descripcin de las funciones

Consulte el ejemplo anexo.

28

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

19. vox_getusedasrlic
FUNCION RETORNA INCLUDES MODO int vox_getusedasrlic() Nmero de licencias disponibles en el momento de la invocacin voxlib.h sncrono

19.1. Descripcin
La funcin vox_getusedasrlic() consulta el nmero de licencias de la configuracin especificada disponibles en un momento determinado (libres) en el servidor utilizado (aqul especificado antes de invocar a la funcin vox_libinit o vox_asr_init).

19.2. Precauciones
La funcin vox_getusedasrlic() devuelve el nmero de licencias disponibles en un momento determinado, para controlar la disponibilidad de las mismas antes de realizar una peticin. Puede combinarse tambin con las funciones vox_recstr_wait y vox_recstr_release.

19.3. Elementos relacionados


vox_getttslic, vox_recstr_wait, vox_recstr_release

19.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

29

Captulo 2. Descripcin de las funciones

20. vox_getusedttslic
FUNCION RETORNA INCLUDES MODO int vox_getusedttslic() Nmero de licencias disponibles en el momento de la invocacin voxlib.h sncrono

20.1. Descripcin
La funcin vox_getusedttslic() consulta el nmero de licencias de la configuracin especificada disponibles en un momento determinado (libres) en el servidor utilizado (aqul especificado antes de invocar a la funcin vox_libinit o vox_tts_init).

20.2. Precauciones
La funcin vox_getusedttslic() devuelve el nmero de licencias disponibles en un momento determinado, para controlar la disponibilidad de las mismas antes de realizar una peticin. Puede combinarse tambin con las funciones vox_playstr_wait y vox_playstr_release.

20.3. Elementos relacionados


vox_getusedasrlic, vox_playstr_wait, vox_playstr_release

20.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

30

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

21. ATVOX_IVCB
FUNCION int ATVOX_IVCB(int chdev) int chdev RETORNA descriptor de un canal vlido

>=0 indicando el descriptor del vocabulario afectado por el ltimo resultado de reconocimiento -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

21.1. Descripcin
La funcin ATVOX_IVCB() retorna el descriptor del vocabulario del que se ha reconocido una secuencia durante el ltimo proceso de reconocimiento. Este valor est disponible despus de la finalizacin de una llamada a las funciones vox_recind() o vox_nbest().

21.2. Descripcin de los parmetros


chdev especifica el descriptor de canal vlido.

21.3. Precauciones
El valor devuelto por la funcin ATVOX_IVCB() slo es vlido tras la correcta finalizacin de la funcin vox_recind() o vox_nbest().

21.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_NORECIND NO RECIND. Call vox_recind() before calling ATVOX_IVCB().

21.5. Elementos relacionados


vox_recind, vox_nbest

21.6. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

31

Captulo 2. Descripcin de las funciones

22. ATVOX_LASTERR
FUNCION long ATVOX_LASTERR(int dev) int dev RETORNA INCLUDES MODO nmero del error voxlib.h sncrono descriptor de un canal vlido o -1 para funciones independientes del canal

22.1. Descripcin
La funcin ATVOX_LASTERR() retorna un valor long que identifica el error que se ha producido durante la ltima llamada a una funcin del SDK de Verbio. Los errores estn definidos en voxlib.h. Si no se ha producido ningn error durante la ltima llamada a una funcin, el valor devuelto es 0. Si el error se ha producido durante la llamada a una funcin dependiente del canal (vox_setvcb(), vox_recstr(), ...) el parmetro de entrada dev especifica el descriptor de canal vlido. Si el error se ha producido durante la llamada a una funcin independiente del canal (vox_libinit(), vox_prevcb(), vox_ApplyDictionary(), ...) debe utilizarse -1 como valor del parmetro dev.

22.2. Descripcin de los parmetros


dev especifica el descriptor de canal vlido o -1 para funciones independientes del canal.

22.3. Elementos relacionados


ATVOX_ERRMSGP

22.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

32

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

23. vox_libclose
FUNCION RETORNA int vox_libclose() 0 si el resultado es satisfactorio -1 en caso de error INCLUDES MODO voxlib.h sncrono

23.1. Descripcin
La funcin vox_libclose libera las conexiones con el motor de sntesis y o reconocimiento del habla iniciadas mediante la funcin vox_libinit, vox_asr_init o vox_tts_init y libera todos los recursos utilizados por el cliente de Verbio. Una vez finalizada la funcin vox_libclose, no pueden invocarse otras funciones del SDK de Verbio desde el cliente afectado, exceptuando aquellas destinadas a establecer de nuevo la conexin con el servidor.

23.2. Elementos relacionados


vox_libinit, vox_asr_init, vox_tts_init

23.3. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

33

Captulo 2. Descripcin de las funciones

24. vox_libinit
FUNCION int vox_libinit(int options) int options RETORNA identificador del idioma por defecto

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

24.1. Descripcin
La funcin vox_libinit() inicializa la librera Verbio. El parmetro options especifica el idioma por defecto que utilizarn el servidor de reconocimiento y el servidor de sntesis. Esta funcin est incluida por compatibilidad con versiones anteriores, aunque en nuevos desarrollos es muy recomendable utilizar las nuevas funciones equivalentes vox_asr_init y/o vox_tts_init, segn las necesidades concretas.

24.2. Descripcin de los parmetros


options especifica el idioma de trabajo por defecto y si deben inicializarse los servidores de reconocimiento y de sntesis (por defecto, ambos se inicializan). LVX_SPANISH LVX_CATALAN LVX_BASQUE LVX_GALICIAN LVX_PORTUGUESE LVX_BRAZILIAN OVX_NORECSTR OVX_NOPLAYSTR OVX_TTSLITE Espaol Cataln Euskera Gallego Portugus Portugus brasileo no se inicializa el servidor de reconocimiento no se inicializa el servidor de sntesis inicializacin rpida (menores prestaciones) del sintetizador (depuracin)

24.3. Precauciones
La funcin vox_libinit() debe invocarse antes que ninguna otra de las funciones del Library SDK, a excepcin de aquella destinada a establecer el servidor de trabajo por defecto en configuraciones cliente-servidor (vox_setparm).

24.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error:

34

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

EVX_INVSETUP EVX_NOMEM EVX_NOLICFILE EVX_INVLIC EVX_SYSTEM

VERBIO INTERNAL ERROR. Files may be corrupted. Check disk and repeat Setup. OUT OF MEMORY. NO LICENSE FILE WAS FOUND. Run CheckOut to obtain a license file. THE LICENSE FILE IS NOT VALID. Run CheckOut to obtain a valid license file. SYSTEM ERROR.Check errno.

24.5. Elementos relacionados


vox_libclose, vox_asr_init, vox_tts_init

24.6. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

35

Captulo 2. Descripcin de las funciones

25. vox_loadcd
FUNCION int vox_loadcd(int chdev, unsigned int mode) int chdev unsigned int mode RETORNA descriptor de un canal vlido por compatibilidad con versiones anteriores, sese 0

>=0 indicando el descriptor del vocabulario si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

25.1. Descripcin
La funcin vox_loadcd() carga el vocabulario de dgitos conectados (consulte Seccin 57 para ms informacin) en el canal especificado. En caso satisfactorio, retorna un descriptor asociado con el vocabulario cargado para que ste pueda ser activado, desactivado y descargado mediante las funciones vox_activatevcb(), vox_deactivatevcb() y vox_unloadvcb() respectivamente.

25.2. Descripcin de los parmetros


chdev mode especifica el descriptor de canal vlido. por compatibilidad con versiones anteriores, sese 0

25.3. Precauciones
Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento.

25.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_SYSTEM OUT OF MEMORY SYSTEM ERROR. Check errno.

25.5. Elementos relacionados


vox_setcd, vox_loadvcb, vox_activatevcb, vox_deactivatevcb, vox_unloadvcb, ATVOX_IVCB

36

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

26. vox_loadvcb
FUNCION int vox_loadvcb(int chdev, const char *filename, unsigned int mode) int chdev const char *filename unsigned int mode RETORNA descriptor de un canal vlido nombre del vocabulario o de la gramtica ABNF/DTMF que debe cargarse vocabulario o gramtica ABNF o DTMF

>=0 indicando el descriptor del vocabulario si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

26.1. Descripcin
La funcin vox_loadvcb() carga el vocabulario o la gramtica ABNF o DTMF en el canal especificado. En caso satisfactorio, retorna un descriptor asociado con el vocabulario cargado para que ste pueda ser activado, desactivado y descargado mediante las funciones vox_activatevcb(), vox_deactivatevcb() y vox_unloadvcb() respectivamente.

26.2. Descripcin de los parmetros


chdev filename mode especifica el descriptor de canal vlido. puntero al nombre del fichero de texto que contiene el vocabulario (cada lnea contiene una palabra del vocabulario formada por una o ms palabras) o la gramtica ABNF. indica el tipo de vocabulario o gramtica GVX_ISOLATED GVX_CONNECTED Palabras aisladas. El reconocedor espera reconocer una nica palabra del vocabulario de este vocabulario. Palabras conectadas (valor por defecto). El reconocedor espera reconocer una o ms palabras del vocabulario de este vocabulario. gramtica ABNF. El reconocedor espera reconocer una o ms palabras de la gramtica. gramtica DTMF. El reconocedor espera recibir uno o ms tonos DTMF.

GVX_ABNF GVX_DTMF

26.3. Precauciones
Sin la opcin GVX_ABNF habilitada, la funcin vox_loadvcb() requiere el fichero de definiciones y el fichero de transcripciones generados mediante la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()). Si estos ficheros existen y el fichero de vocabulario correspondiente no ha sido modificado desde que se llam a la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()), no es necesario volver a invocarlas antes de cargar el vocabulario mediante la funcin vox_loadvcb(). Con la opcin GVX_ABNF habilitada, la funcin vox_loadvcb() requiere el fichero de estados de la gramtica,

Verbio Technologies

Referencia de las funciones del Library SDK

37

Captulo 2. Descripcin de las funciones

el fichero de definiciones y el fichero de transcripciones generado mediante la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()). Si estos ficheros existen y la gramtica ABNF correspondiente no ha sido modificado desde que se llam a la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()), no es necesario volver a invocarlas antes de cargar la gramtica mediante la funcin vox_loadvcb(). Con la opcin GVX_DTMF la gramtica no crea ficheros adicionales resultados de la compilacin. Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento. La configuracin de reconocimiento activa en el momento de cargar la gramtica debe ser la misma que la existente en el momento de su preparacin. En caso contrario, aparecer el error THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words.

26.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_VCBFILE EVX_INVWORD EVX_SYSTEM OUT OF MEMORY. THE VOCABULARY FILE NAME IS NOT VALID. THE VOCABULARY TRANSCRIPTION WAS NOT FOUND. SYSTEM ERROR. Check errno.

26.5. Elementos relacionados


vox_setcd, vox_loadcd, vox_activatevcb, vox_deactivatevcb, vox_unloadvcb, ATVOX_IVCB

26.6. Cdigos de ejemplo


Consulte el ejemplo anexo.

38

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

27. vox_nbest
FUNCION int vox_nbest(int chdev, int maxind, int *index, float *score, int ibest, unsigned int mode) int chdev int maxind int *index float *score int ibest unsigned int mode RETORNA descriptor de un canal vlido nmero mximo de palabras del conectadas o de palabras de la gramtica vocabulario

vector de enteros en el que se recibirn los ndices de las palabras reconocidas vector de float en el que se recibirn los ndices de confianza de las palabras reconocidas nmero de la hiptesis de inters por compatibilidad con versiones anteriores, sese 0

>=0 para indicar la cantidad de palabras reconocidas -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

27.1. Descripcin
La funcin vox_nbest() debe ser llamada al finalizar las funciones vox_recstr() (o vox_recstr_open() + vox_recstr_write() + vox_recstr_close()) para obtener los ndices y niveles de confianza de las palabras reconocidas correspondientes a la hiptesis ibest-sima. La funcin vox_nbest() es una extensin de la funcin vox_recind() para permitir la obtencin de mltiples hiptesis de reconocimiento de una misma locucin. El nmero mximo de hiptesis devuelto por el servidor de reconocimiento depende del parmetro VXCH_ACTIVE_NBEST (y VXCH_NBEST). Estos parmetros son dependientes del canal y deben ser especificados mediante la funcin vox_setparm() antes de iniciar el reconocimiento mediante las funciones vox_recstr() o vox_recstr_open(). El valor por defecto de ambos parmetros es 1. Si el nmero de palabras reconocidas es cero, index[0] contiene uno de los siguientes ndices especiales: IND_NOVOICE IND_NOWORD IND_EARLY_START No se ha detectado voz. No se ha reconocido ninguna palabra del vocabulario ni de la gramtica. No se ha detectado silencio inicial.

27.2. Descripcin de los parmetros


chdev maxind especifica el descriptor de canal vlido. especifica el nmero mximo de palabras del vocabulario conectadas o palabras de la gramtica que pueden reconocerse. En reconocimiento de palabras aisladas, el valor de esta parmetro debe fijarse a 1. puntero a un vector de enteros que recibir los ndices de las palabras reconocidas. El tamao de

index

Verbio Technologies

Referencia de las funciones del Library SDK

39

Captulo 2. Descripcin de las funciones

este vector debe ser mayor o igual a maxind. score puntero a un vector de float que recibir los niveles de confianza de las palabras reconocidas. El nivel de confianza de cada ndice proporciona una medida de fiabilidad del reconocimiento, que puede ser utilizada para rechazar o pedir confirmacin de las palabras reconocidas. El tamao de este vector debe ser mayor o igual a maxind. nmero de la hiptesis de inters. El valor de este parmetro puede estar entre 0 (hiptesis ms fiable) y NBest-1, donde NBest es el mximo nmero de hiptesis activo en un canal especificado mediante la funcin vox_setparm() (parmetro VXCH_ACTIVE_NBEST).

ibest

27.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_NORECSTR NO RECOGNITION. Use vox_recstr() to start recognition.

27.4. Elementos relacionados


vox_recstr, vox_recstr_open, vox_recind, ATVOX_NIND

27.5. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

40

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

28. ATVOX_NIND
FUNCION int ATVOX_NIND(int chdev) int chdev RETORNA descriptor de un canal vlido

>=0 para indicar el nmero de palabras del vocabulario o de la gramtica reconocidas -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

28.1. Descripcin
La funcin ATVOX_NIND() retorna el nmero de palabras del vocabulario o de la gramtica reconocidas despus de la finalizacin de la llamada a la funcin vox_recind() o vox_nbest().

28.2. Descripcin de los parmetros


chdev especifica el descriptor de canal vlido.

28.3. Precauciones
El valor devuelto por la funcin ATVOX_NIND() nicamente es vlido despus de la correcta finalizacin de la funcin vox_recind() o vox_nbest().

28.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_NORECIND NO RECIND. Call vox_recind() before calling ATVOX_NIND().

28.5. Elementos relacionados


vox_recind, vox_nbest

28.6. Cdigos de ejemplo


Consulte el ejemplo asncrono del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

41

Captulo 2. Descripcin de las funciones

29. vox_playstr
FUNCION int vox_playstr(int chdev, const char *filename, const char *string, unsigned int mode) int chdev const char *filename const char *string unsigned int mode RETORNA descriptor de un canal vlido vector ASCIIZ con el nombre del fichero de audio en el que se almacenar la voz sinttica vector ASCIIZ con el texto que debe ser sintetizado formato de las muestras de audio

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

29.1. Descripcin
La funcin vox_playstr() inicia la conversin de texto a voz del texto especificado. Una vez la funcin es invocada, la conversin continua hasta el final del texto.

29.2. Descripcin de los parmetros


chdev filename string mode especifica el descriptor de canal vlido. vector ASCIIZ con el nombre del fichero de audio en el que se almacenarn las muestras de audio de voz sinttica procedentes del servidor de sntesis. vector ASCIIZ con el texto que debe ser sintetizado. Para una ptima sntesis, es imprescindible que el texto est bien puntuado, acentuado, etc. especifica el formato de las muestras de audio generadas por el motor de sntesis MC_ALAW MC_MULAW MC_LIN16 Muestras de audio en formato de Ley A (8 bits, 8 KHz) Muestras de audio en formato de Ley Mu (8 bits, 8 KHz) Muestras de audio en formato lineal (16 bits, 8 KHz). (valor por defecto)

29.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_SYSTEM SYSTEM ERROR. Check errno.

29.4. Elementos relacionados

42

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

vox_playstr_open

29.5. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

43

Captulo 2. Descripcin de las funciones

30. vox_playstr_close
FUNCION int vox_playstr_close(int chdev, int playdev) int chdev int playdev RETORNA descriptor de un canal vlido descriptor de reproduccin vlido

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

30.1. Descripcin
La funcin vox_playstr_close() cierra el descriptor de reproduccin abierto mediante la funcin vox_playstr_open y libera los recursos utilizados durante el proceso de sntesis.

30.2. Descripcin de los parmetros


chdev playdev especifica el descriptor de canal vlido. especifica el descriptor vox_playstr_open. de reproduccin vlido obtenido mediante la funcin

30.3. Elementos relacionados


vox_playstr_open, vox_playstr_read

30.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

44

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

31. vox_playstr_open
FUNCION int vox_playstr_open(int chdev, char *string, unsigned int mode) int chdev char *string unsigned int mode RETORNA descriptor de un canal vlido vector ASCIIZ que contiene el texto a sintetizar formato de las muestras (Ley A o Ley Mu)

!= -1 para indicar el descriptor de reproduccin -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

31.1. Descripcin
La funcin vox_playstr_open() inicia la sntesis del texto especificado y no finaliza hasta que se haya sintetizado completamente. Las muestras de audio resultantes se obtendrn mediante la funcin vox_playstr_read(), utilizando el descriptor de reproduccin devuelto por la funcin vox_playstr_open().

31.2. Descripcin de los parmetros


chdev string mode especifica el descriptor de canal vlido. vector ASCIIZ que contiene el texto que debe sintetizarse. Para una ptima sntesis, es imprescindible que el texto est bien puntuado, acentuado, etc. especifica el formato de las muestras de audio generadas por el sintetizador. MC_ALAW MC_MULAW MC_LIN16 Muestras de audio en formato de Ley A (8 bits, 8 KHz) Muestras de audio en formato de Ley Mu (8 bits, 8 KHz) Muestras de audio en formato lineal (16 bits, 8 KHz). (valor por defecto)

31.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_SYSTEM SYSTEM ERROR. Check errno.

31.4. Elementos relacionados


vox_playstr_read, vox_playstr_close

31.5. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

45

Captulo 2. Descripcin de las funciones

32. vox_playstr_read
FUNCION int vox_playstr_read(int playdev, void *buffer, unsigned int count) int playdev void *buffer unsigned int count RETORNA descriptor de reproduccin vlido vector en el que se almacenarn las muestras de audio procedentes del sintetizador nmero de muestras a obtener (en bytes)

>=0 nmero de muestras obtenidas del sintetizador -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

32.1. Descripcin
La funcin vox_playstr_read() obtiene las muestras de audio generadas por la funcin vox_playstr_open(). La funcin retorna un nmero igual al nmero de bytes solicitados para indicar que todava no ha finalizado el proceso de sntesis. La funcin retorna un nmero de muestras menor que el solicitado para indicar que el servidor de sntesis ya no dispone de ms muestras de voz sinttica para entregar, por lo que no debe invocarse a la funcin vox_playstr_read() nuevamente.

32.2. Descripcin de los parmetros


playdev buffer n especifica el descriptor vox_playstr_open. de reproduccin vlido obtenido mediante la funcin

vector en el que se almacenarn las muestras de audio procedentes del sintetizador. Debe tener un tamao igual o superior al nmero de muestras solicitadas mediante el parmetro n. cantidad de muestras solicitadas al sintetizador.

32.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_SYSTEM SYSTEM ERROR. Check errno.

32.4. Elementos relacionados


vox_playstr_open, vox_playstr_close

32.5. Cdigos de ejemplo


Consulte el ejemplo anexo.

46

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

33. vox_playstr_release
FUNCION int vox_playstr_release(int chdev) int chdev RETORNA descriptor de un canal vlido

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

33.1. Descripcin
La funcin vox_playstr_release() libera un recurso (licencia) de sntesis del habla reservado mediante la funcin vox_playstr_wait() en el canal especificado.

33.2. Descripcin de los parmetros


chdev especifica el descriptor de canal vlido.

33.3. Elementos relacionados


vox_playstr_wait, vox_getusedttslic, vox_recstr_release, vox_recstr_wait

33.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

47

Captulo 2. Descripcin de las funciones

34. vox_playstr_wait
FUNCION int vox_playstr_wait(int chdev, int ms) int chdev int ms RETORNA descriptor de un canal vlido tiempo mximo de espera para obtener un recurso (en milisegundos)

0 si el resultado es satisfactorio -1 en caso de no poder obtener un recurso en el tiempo especificado

INCLUDES MODO

voxlib.h sncrono

34.1. Descripcin
La funcin vox_playstr_wait() reserva un recurso (licencia) de sntesis del habla para el canal especificado hasta que se libere mediante la funcin vox_playstr_release(). La funcin espera un mximo de ms milisegundos la disponibilidad de un recurso, transcurridos los cuales devuelve un error. El uso de esta funcin es aconsejable para gestionar el uso de los recursos (licencias) disponibles. En entornos en los que nunca se producirn ms peticiones simultneas de sntesis que licencias disponibles no es necesario su uso.

34.2. Descripcin de los parmetros


chdev ms especifica el descriptor de canal vlido. tiempo mximo de espera, en milisegundos, para obtener un recurso (licencia) de sntesis del habla para el canal especificado.

34.3. Elementos relacionados


vox_playstr_release, vox_getusedttslic, vox_recstr_wait, vox_recstr_release

34.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

48

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

35. vox_prevcb
FUNCION int vox_prevcb(const char *filename, unsigned int mode) const char *filename unsigned int mode puntero al nombre del fichero que contiene el vocabulario o la gramtica ABNF a preparar vocabulario convencional (lista de palabras) o gramtica ABNF

RETORNA

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

35.1. Descripcin
Sin especificar el modo GVX_ABNF (vocabulario convencional), la funcin vox_prevcb() realiza la transcripcin fontica del contenido del fichero, almacenndola en un nuevo fichero binario con el mismo nombre que el del vocabulario pero con extensin ".trc". Esta funcin es independiente del canal y debe utilizarse una vez para cada vocabulario aunque ste se utilice en distintos canales (s es necesario invocar de nuevo a la funcin cuando se modifica dinmicamente el contenido del vocabulario). Cuando se especifica el modo GVX_ABNF (gramtica ABNF), la funcin vox_prevcb() compila la gramtica especificada. El resultado de la compilacin se almacena en un nuevo fichero de texto con el mismo nombre que la gramtica pero con extensin ".trx" (conteniendo el vocabulario de la gramtica) y en un nuevo fichero de texto con extensin ".grm" (conteniendo los estados de la gramtica). Tambin se realiza la trancripcin fontica que se almacena en un nuevo fichero binario con el mismo nombre que el de la gramtica pero con extensin ".trc". Esta funcin es independiente del canal y debe utilizarse una vez para cada gramtica aunque sta se utilice en distintos canales (s es necesario invocar de nuevo a la funcin cuando se modifica dinmicamente el contenido de la gramtica). En caso que deba preparar gramticas dinmicas en distintos canales, debe utilizarse la funcin vx_prevcbdev para evitar conflictos entre ellos. El vocabulario se preparar en el idioma y configuracin de reconocimiento especificados mediante la funcin vox_asr_init o bien mediante la funcin vox_setparm (parmetros VXCH_DEFASRCFG y VXCH_DEFASRLNG ). El idioma puede especificarse independientemente usando la funcin vx_prevcbex2.

35.2. Descripcin de los parmetros


filename mode puntero al nombre del fichero que contiene el vocabulario (cada lnea constituye una palabra del vocabulario formada por una o ms palabras) o la gramtica ABNF. especifica si se trata de una gramtica ABNF. GVX_ABNF gramtica ABNF

35.3. Precauciones
La funcin vovx_prevcb() preparar el vocabulario en el idioma por defecto presente en el canal (excepto aquellas palabras que incorporen el identificador del idioma). Si desea especificarse un idioma distinto, deber utilizarse la funcin vox_prevcbex2(). La configuracin de reconocimiento activa en el momento de cargar la gramtica debe ser la misma que la

Verbio Technologies

Referencia de las funciones del Library SDK

49

Captulo 2. Descripcin de las funciones

existente en el momento de su preparacin. En caso contrario, aparecer el error THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words.

35.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_NOMEM EVX_VCBFILE EVX_PARSER EVX_INVWORD EVX_SYSTEM OUT OF MEMORY THE VOCABULARY FILE NAME IS NOT VALID. Check the vocabulary file name and path writing permission. ABNF PARSER ERROR. Check the ABNF grammar syntax. THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words SYSTEM ERROR. Check errno.

35.5. Elementos relacionados


vox_prevcbex, vox_prevcbex2, vox_prevcbdev, vox_setvcb, vox_loadvcb

35.6. Cdigos de ejemplo


Consulte el ejemplo anexo.

50

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

36. vox_prevcbdev
FUNCION int vox_prevcbdev(int chdev, const char *filename, unsigned int mode, int *lpiword, const char *language) int chdev const char *filename unsigned int mode int *lpiword const char *language RETORNA descriptor de un canal vlido puntero al nombre del fichero que contiene el vocabulario o la gramtica ABNF a preparar vocabulario convencional (lista de palabras) o gramtica ABNF puntero que almacenar la lnea errnea del fichero en caso de error idioma en el que se preparar el vocabulario

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

36.1. Descripcin
Sin especificar el modo GVX_ABNF (vocabulario convencional), la funcin vox_prevcbex2() realiza la transcripcin fontica del contenido del fichero en el canal indicado, almacenndola en un nuevo fichero binario con el mismo nombre que el del vocabulario pero con extensin ".trc". Esta funcin est indicada para preparar gramticas dinmicas que no pueden haberse preparado al lanzar la aplicacin mediante las funciones vox_prevcb, vox_prevcbex o vox_prevcbex2. Cuando se especifica el modo GVX_ABNF (gramtica ABNF), la funcin vox_prevcbex2() compila la gramtica especificada en el canal indicado. El resultado de la compilacin se almacena en un nuevo fichero de texto con el mismo nombre que la gramtica pero con extensin ".trx" (conteniendo el vocabulario de la gramtica) y en un nuevo fichero de texto con extensin ".grm" (conteniendo los estados de la gramtica). Tambin se realiza la trancripcin fontica que se almacena en un nuevo fichero binario con el mismo nombre que el de la gramtica pero con extensin ".trc". Para evitar conflictos entre gramticas preparadas simultneamente entre distintos canales, es absolutamente imprescindible evitar que canales distintos preparen gramticas con el mismo nombre. En caso de que se produjera este hecho, los resultados son imprevisibles. Por lo tanto, una estrategia recomendada es la de utilizar nombres de gramtica que incluyan tambin el identificador del canal. De este modo, se imposibilita la coincidencia de nombres de gramtica en canales distintos.

36.2. Descripcin de los parmetros


chdev filename mode especifica el descriptor de canal vlido. puntero al nombre del fichero que contiene el vocabulario (cada lnea constituye una palabra del vocabulario formada por una o ms palabras) o la gramtica ABNF. especifica si se trata de una gramtica ABNF. GVX_ABNF gramtica ABNF

Verbio Technologies

Referencia de las funciones del Library SDK

51

Captulo 2. Descripcin de las funciones

lpiword language

en caso de error, este puntero contendr la lnea del fichero en la que se encuentra la primera palabra incorrecta. idioma en el que se preparar el vocabulario, independientemente del idioma por defecto establecido en el canal. El vocabulario se preparar en la configuracin de reconocimiento especificada mediante la funcin vox_asr_init o bien mediante la funcin vox_setparm (parmetro VXCH_DEFASRCFG). LNG_SPANISH LNG_CATALAN LNG_BASQUE LNG_GALICIAN LNG_PORTUGUESE LNG_PORTUGUESE_BRAZILIAN LNG_FRENCH LNG_ENGLISH LNG_SPANISH_MEXICAN LNG_SPANISH_ARGENTINIAN LNG_SPANISH_COLOMBIAN LNG_SPANISH_CHILEAN LNG_SPANISH_VENEZUELAN Espaol castellano Cataln Euskera Gallego Portugus Portugus brasileo Francs Ingls Espaol mexicano Espaol argentino Espaol colombiano Espaol chileno Espaol venezolano

36.3. Precauciones
La configuracin de reconocimiento activa en el momento de cargar la gramtica debe ser la misma que la existente en el momento de su preparacin. En caso contrario, aparecer el error THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words.

36.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_NOMEM EVX_VCBFILE EVX_PARSER EVX_INVWORD EVX_SYSTEM OUT OF MEMORY. THE VOCABULARY FILE NAME IS NOT VALID. Check the vocabulary file name and path writing permission. ABNF PARSER ERROR. Check the ABNF grammar syntax. THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words. SYSTEM ERROR. Check errno.

36.5. Elementos relacionados

52

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

vox_prevcb, vox_prevcbex, vox_prevcbex2, vox_chkwrd, vox_setvcb, vox_loadvcb

36.6. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

53

Captulo 2. Descripcin de las funciones

37. vox_prevcbex
FUNCION int vox_prevcbex(const char *filename, unsigned int mode, int *lpiword) const char *filename unsigned int mode int *lpiword puntero al nombre del fichero que contiene el vocabulario o la gramtica ABNF a preparar vocabulario convencional (lista de palabras) o gramtica ABNF puntero que almacenar la lnea errnea del fichero en caso de error

RETORNA

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

37.1. Descripcin
Sin especificar el modo GVX_ABNF (vocabulario convencional), la funcin vox_prevcbex() realiza la transcripcin fontica del contenido del fichero, almacenndola en un nuevo fichero binario con el mismo nombre que el del vocabulario pero con extensin ".trc". Esta funcin es independiente del canal y debe utilizarse una vez para cada vocabulario aunque ste se utilice en distintos canales (s es necesario invocar de nuevo a la funcin cuando se modifica dinmicamente el contenido del vocabulario). Cuando se especifica el modo GVX_ABNF (gramtica ABNF), la funcin vox_prevcbex() compila la gramtica especificada. El resultado de la compilacin se almacena en un nuevo fichero de texto con el mismo nombre que la gramtica pero con extensin ".trx" (conteniendo el vocabulario de la gramtica) y en un nuevo fichero de texto con extensin ".grm" (conteniendo los estados de la gramtica). Tambin se realiza la trancripcin fontica que se almacena en un nuevo fichero binario con el mismo nombre que el de la gramtica pero con extensin ".trc". Esta funcin es independiente del canal y debe utilizarse una vez para cada gramtica aunque sta se utilice en distintos canales (s es necesario invocar de nuevo a la funcin cuando se modifica dinmicamente el contenido de la gramtica). En caso que deba preparar gramticas dinmicas en distintos canales, debe utilizarse la funcin vox_prevcbdev para evitar conflictos entre ellos. El vocabulario se preparar en el idioma y configuracin de reconocimiento especificados mediante la funcin vox_asr_init o bien mediante la funcin vox_setparm (parmetros VXCH_DEFASRCFG y VXCH_DEFASRLNG ). nicamente el idioma puede especificarse independientemente usando la funcin vox_prevcbex2.

37.2. Descripcin de los parmetros


filename mode puntero al nombre del fichero que contiene el vocabulario (cada lnea constituye una palabra del vocabulario formada por una o ms palabras) o la gramtica ABNF. especifica si se trata de una gramtica ABNF. GVX_ABNF lpiword gramtica ABNF

en caso de error, este puntero contendr la lnea del fichero en la que se encuentra la primera palabra incorrecta.

37.3. Precauciones

54

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

La funcin vovx_prevcbex() preparar el vocabulario en el idioma por defecto presente en el canal (excepto aquellas palabras que incorporen el identificador del idioma). Si desea especificarse un idioma distinto, deber utilizarse la funcin vox_prevcbex2(). La configuracin de reconocimiento activa en el momento de cargar la gramtica debe ser la misma que la existente en el momento de su preparacin. En caso contrario, aparecer el error THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words.

37.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_NOMEM EVX_VCBFILE EVX_PARSER EVX_INVWORD EVX_SYSTEM OUT OF MEMORY. THE VOCABULARY FILE NAME IS NOT VALID. Check the vocabulary file name and path writing permission. ABNF PARSER ERROR. Check the ABNF grammar syntax. THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words. SYSTEM ERROR. Check errno.

37.5. Elementos relacionados


vox_prevcb, vox_prevcbex2, vox_prevcbdev, vox_chkwrd, vox_setvcb, vox_loadvcb

37.6. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

55

Captulo 2. Descripcin de las funciones

38. vox_prevcbex2
FUNCION int vox_prevcbex2(const char *filename, unsigned int mode, int *lpiword, const char *language) const char *filename unsigned int mode int *lpiword const char *language RETORNA puntero al nombre del fichero que contiene el vocabulario o la gramtica ABNF a preparar vocabulario convencional (lista de palabras) o gramtica ABNF puntero que almacenar la lnea errnea del fichero en caso de error idioma en el que se preparar el vocabulario

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

38.1. Descripcin
Sin especificar el modo GVX_ABNF (vocabulario convencional), la funcin vox_prevcbex2() realiza la transcripcin fontica del contenido del fichero, almacenndola en un nuevo fichero binario con el mismo nombre que el del vocabulario pero con extensin ".trc". Esta funcin es independiente del canal y debe utilizarse una vez para cada vocabulario aunque ste se utilice en distintos canales (s es necesario invocar de nuevo a la funcin cuando se modifica dinmicamente el contenido del vocabulario). Cuando se especifica el modo GVX_ABNF (gramtica ABNF), la funcin vox_prevcbex2() compila la gramtica especificada. El resultado de la compilacin se almacena en un nuevo fichero de texto con el mismo nombre que la gramtica pero con extensin ".trx" (conteniendo el vocabulario de la gramtica) y en un nuevo fichero de texto con extensin ".grm" (conteniendo los estados de la gramtica). Tambin se realiza la trancripcin fontica que se almacena en un nuevo fichero binario con el mismo nombre que el de la gramtica pero con extensin ".trc". Esta funcin es independiente del canal y debe utilizarse una vez para cada gramtica aunque sta se utilice en distintos canales (s es necesario invocar de nuevo a la funcin cuando se modifica dinmicamente el contenido de la gramtica). En caso que deba preparar gramticas dinmicas en distintos canales, debe utilizarse la funcin vox_prevcbdev para evitar conflictos entre ellos.

38.2. Descripcin de los parmetros


filename mode puntero al nombre del fichero que contiene el vocabulario (cada lnea constituye una palabra del vocabulario formada por una o ms palabras) o la gramtica ABNF. especifica si se trata de una gramtica ABNF. GVX_ABNF lpiword language gramtica ABNF

en caso de error, este puntero contendr la lnea del fichero en la que se encuentra la primera palabra incorrecta. idioma en el que se preparar el vocabulario, independientemente del idioma por defecto establecido en el canal. El vocabulario se preparar en la configuracin de reconocimiento especificada mediante la funcin vox_asr_init o bien mediante la funcin vox_setparm (parmetro VXCH_DEFASRCFG).

56

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

LNG_SPANISH LNG_CATALAN LNG_BASQUE LNG_GALICIAN LNG_PORTUGUESE LNG_PORTUGUESE_BRAZILIAN LNG_FRENCH LNG_ENGLISH LNG_SPANISH_MEXICAN LNG_SPANISH_ARGENTINIAN LNG_SPANISH_COLOMBIAN LNG_SPANISH_CHILEAN LNG_SPANISH_VENEZUELAN

Espaol castellano Cataln Euskera Gallego Portugus Portugus brasileo Francs Ingls Espaol mexicano Espaol argentino Espaol colombiano Espaol chileno Espaol venezolano

38.3. Precauciones
La configuracin de reconocimiento activa en el momento de cargar la gramtica debe ser la misma que la existente en el momento de su preparacin. En caso contrario, aparecer el error THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words. Esta funcin est indicada para permitir preparar vocabularios y gramticas en distintos idiomas de la configuracin de reconocimiento activa en el motor. En caso de que se desee utilizar un idioma no contenido en la configuracin activa, es necesario activarla primero mediante la funcin vox_setparm (parmetro VXCH_DEFASRCFG). Por ejemplo, en caso de que est cargada la configuracin multilinge CFG_SPANISH_CATALAN, pueden prepararse gramticas en ambos idiomas utilizando esta funcin sin necesidad de cambiar la configuracin ni de idioma por defecto mediante la funcin vox_setparm (parmetro VXCH_DEFASRLANG).

38.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_NOMEM EVX_VCBFILE EVX_PARSER EVX_INVWORD EVX_SYSTEM OUT OF MEMORY. THE VOCABULARY FILE NAME IS NOT VALID. Check the vocabulary file name and path writing permission. ABNF PARSER ERROR. Check the ABNF grammar syntax. THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words. SYSTEM ERROR. Check errno.

38.5. Elementos relacionados

Verbio Technologies

Referencia de las funciones del Library SDK

57

Captulo 2. Descripcin de las funciones

vox_prevcb, vox_prevcbex, vox_prevcbdev, vox_chkwrd, vox_setvcb, vox_loadvcb

38.6. Cdigos de ejemplo


Consulte el ejemplo anexo.

58

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

39. vox_reccfg_release
FUNCION int vox_reccfg_release(int chdev, const char * cfg) int chdev const char* cfg descriptor de un canal vlido configuracin de la que se desea liberar una licencia o 0 para licencia de motor ASR

RETORNA

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

39.1. Descripcin
La funcin vox_reccfg_release() libera un recurso (licencia) de reconocimiento del habla reservado mediante la funcin vox_reccfg_wait() en el canal especificado. De este modo, otras peticiones de licencias pendientes podrn ser atendidas por el recurso liberado.

39.2. Descripcin de los parmetros


chdev cfg especifica el descriptor de canal vlido. Especifica el tipo de licencia de reconocimiento que debe liberarse. Los posibles valores son: NULL o 0 CFG_SPANISH CFG_SPANISH_CATALAN CFG_SPANISH_BASQUE CFG_SPANISH_GALICIAN CFG_SPANISH_CATALAN_BASQUE_GALICIAN CFG_PORTUGUESE CFG_PORTUGUESE_BRAZILIAN CFG_SPANISH_MEXICAN CFG_SPANISH_ARGENTINIAN CFG_SPANISH_CHILEAN CFG_SPANISH_VENEZUELAN CFG_SPANISH_COLOMBIAN CFG_FRENCH Libera una licencia de motor de reconocimiento Espaol castellano Espaol castellano + cataln Espaol castellano + euskera Espaol castellano + gallego Espaol castellano + cataln + euskera + gallego Portugus Portugus brasileo Espaol mexicano Espaol argentino Espaol chileno Espaol venezolano Espaol colombiano Francs

Verbio Technologies

Referencia de las funciones del Library SDK

59

Captulo 2. Descripcin de las funciones

CFG_ENGLISH

US English

39.3. Elementos relacionados


vox_reccfg_wait, vox_playstr_release, vox_playstr_wait

39.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

60

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

40. vox_reccfg_wait
FUNCION int vox_reccfg_wait(int chdev, int ms, const char * cfg) int chdev int ms const char* cfg descriptor de un canal vlido tiempo mximo de espera para obtener un recurso (en milisegundos) configuracin de la que se desea reservar una licencia o 0 para licencia de motor ASR

RETORNA

0 si el resultado es satisfactorio -1 en caso de no poder obtener una licencia en el tiempo especificado

INCLUDES MODO

voxlib.h sncrono

40.1. Descripcin
La funcin vox_reccfg_wait() es muy til para controlar que, en el momento de requerir una licencia de reconocimiento (ya sea de motor o de configuracin), se dispondr de una, evitndose de este modo el error en las funciones invocadas. En la Gua del Usuario se detallan los momentos en los que se consume una licencia aunque, a grandes rasgos, podra resumirse del siguiente modo: 1. Las licencias de motor se consumen durante el procesado de las muestras con la finalidad de obtener la palabra o palabras del vocabulario reconocidas. Por norma general, el intervalo de uso de este tipo de licencias es pequeo. 2. Las licencias de configuracin se empiezan a consumir desde que se establece un vocabulario en un canal o se manipula algn parmetro relacionado con el reconocimiento en un canal (NBEST, ACTIVE_NBEST, KLENGTH, GRMWEIGHT, GRMCONSTANT, RECMODE, DEACTWORD y ACTWORD ) hasta que se cambia a otra configuracin o se libera la licencia con la funcin miembro vox_reccfg_release(). Lgicamente, el tiempo de uso de estas licencias es superior al de las licencias de motor (el vocabulario debe haberse establecido con anterioridad y no puede liberarse hasta finalizado el reconocimiento), llegando incluso (segn la programacin) a estar ocupadas durante gran parte de la ejecucin. En aquellos entornos que dispongan de tantas licencias como lneas atendidas, no es necesario tomar ningn tipo de precaucin, de modo que el uso de estas funciones no aporta ninguna ventaja. Sin embargo, para evitar errores de funcionamiento debidos a falta de licencia en momentos puntuales en aquellos entornos que atiendan ms lneas que licencias disponen, s es muy aconsejable tener la precaucin de reservar con antelacin una licencia de motor y/o de configuracin. De este modo, si no se obtiene la licencia en el momento deseado, se podr mantener al usuario a la espera de forma controlada (por ejemplo, haciendo sonar msica ambiental hasta que se disponga del recurso). La funcin vox_reccfg_wait() reserva un recurso (licencia) de reconocimiento del habla para el canal especificado hasta que se libere mediante la funcin vox_reccfg_release(). La funcin espera un mximo de ms milisegundos la disponibilidad de un recurso, transcurridos los cuales devuelve un error.

40.2. Descripcin de los parmetros


chdev ms cfg especifica el descriptor de canal vlido. tiempo mximo de espera, en milisegundos, para obtener un recurso (licencia) de reconocimiento del habla para el canal especificado. Especifica el tipo de licencia de reconocimiento que debe reservarse. Los posibles valores son:

Verbio Technologies

Referencia de las funciones del Library SDK

61

Captulo 2. Descripcin de las funciones

NULL o 0 CFG_SPANISH CFG_SPANISH_CATALAN CFG_SPANISH_BASQUE CFG_SPANISH_GALICIAN CFG_SPANISH_CATALAN_BASQUE_GALICIAN CFG_PORTUGUESE CFG_PORTUGUESE_BRAZILIAN CFG_SPANISH_MEXICAN CFG_SPANISH_ARGENTINIAN CFG_SPANISH_CHILEAN CFG_SPANISH_VENEZUELAN CFG_SPANISH_COLOMBIAN CFG_FRENCH CFG_ENGLISH

Reserva una licencia de motor de reconocimiento Espaol castellano Espaol castellano + cataln Espaol castellano + euskera Espaol castellano + gallego Espaol castellano + cataln + euskera + gallego Portugus Portugus brasileo Espaol mexicano Espaol argentino Espaol chileno Espaol venezolano Espaol colombiano Francs US English

40.3. Precauciones
A pesar de que no es necesario este control de acceso a las licencias, su prctica es altamente recomendable en aquellos entornos en los que se sobreexplotan las licencias de reconocimiento para evitar errores de reconocimiento indeseados debidos a la falta de licencias disponibles en un momento puntual. Una vez finalizada la peticin de reconocimiento, debe liberarse inmediatamente la licencia mediante la funcin vox_reccfg_release para permitir que peticiones que estn esperando en cola puedan ser procesadas rpidamente.

Atencin
Cuando se reserva licencia para una configuracin, automticamente se descarga la configuracin anterior activa hasta ese momento.

40.4. Elementos relacionados


vox_reccfg_release, vox_playstr_wait, vox_playstr_release

40.5. Cdigos de ejemplo


Consulte el ejemplo anexo.

62

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

41. vox_recind
FUNCION int vox_recind(int chdev, int maxind, int *index, float *score, unsigned int mode) int chdev int maxind int *index float *score unsigned int mode RETORNA descriptor de un canal vlido nmero mximo de palabras del conectadas o de palabras de la gramtica vocabulario

vector de enteros en el que se recibirn los ndices de las palabras reconocidas vector de float en el que se recibirn los ndices de confianza de las palabras reconocidas por compatibilidad con versiones anteriores, sese 0

>=0 para indicar la cantidad de palabras reconocidas -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

41.1. Descripcin
La funcin vox_recind() debe ser llamada al finalizar las funciones vox_recstr() o vox_recstr_open() para obtener los ndices y niveles de confianza de las palabras reconocidas. Si el nmero de palabras reconocidas es cero, index[0] contiene uno de los siguientes ndices especiales: IND_NOVOICE IND_NOWORD IND_EARLY_START No se ha detectado voz. No se ha reconocido ninguna palabra del vocabulario ni de la gramtica. No se ha detectado silencio inicial.

41.2. Descripcin de los parmetros


chdev maxind especifica el descriptor de canal vlido. especifica el nmero mximo de palabras del vocabulario conectadas o palabras de la gramtica que pueden reconocerse. En reconocimiento de palabras aisladas, el valor de esta parmetro debe fijarse a 1. puntero a un vector de enteros que recibir los ndices de las palabras reconocidas. El tamao de este vector debe ser mayor o igual a maxind. puntero a un vector de float que recibir los niveles de confianza de las palabras reconocidas. El nivel de confianza de cada ndice proporciona una medida de fiabilidad del reconocimiento, que puede ser utilizada para rechazar o pedir confirmacin de las palabras reconocidas. El tamao de este vector debe ser mayor o igual a maxind. por compatibilidad con versiones anteriores, sese 0

index score

mode

Verbio Technologies

Referencia de las funciones del Library SDK

63

Captulo 2. Descripcin de las funciones

41.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_NORECSTR NO RECOGNITION. Use vox_recstr() to start recognition.

41.4. Elementos relacionados


vox_recstr, vox_recstr_open, vox_nbest

41.5. Cdigos de ejemplo


Consulte el ejemplo anexo.

64

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

42. vox_recstr
FUNCION int vox_recstr(int chdev, const char *filename, VX_RSP *rspp, unsigned int mode) int chdev const char *filename VX_RSP *rspp unsigned int mode RETORNA descriptor de un canal vlido vector ASCIIZ con el nombre del fichero que contiene las muestras de voz a reconocer puntero a una estructura del tipo Recognition String Parameter formato de las muestras de audio

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

42.1. Descripcin
La funcin vox_recstr() inicia el reconocimiento de la seal de voz almacenada en el fichero. La funcin vox_recstr() acepta condiciones de terminacin adicionales especificadas mediante la estructura VX_RSP pasada como parmetro. Una vez invocada la funcin vox_recstr(), el proceso de reconocimiento continua hasta que se cumpla alguna de las condiciones de terminacin establecidas mediante la estructura VX_RSP. El formato del fichero que contiene las muestras de voz debe ser PCM lineal, Ley A o Ley Mu, 8 KHz y sin control automtico de ganancia.

42.2. Descripcin de los parmetros


chdev filename rspp especifica el descriptor de canal vlido. vector ASCIIZ con el nombre del fichero que contiene las muestras de voz a reconocer puntero a una estructura de tipo String Parameter Structure (VX_RSP) en la que se especifican condiciones adicionales de terminacin del proceso de reconocimiento. Si el valor de este parmetro es NULL se utilizarn los valores por defecto de los campos de la estructura. Para ms informacin acerca de esta estructura, consulte el Captulo 3. Estructuras de datos y parmetros. especifica el formato de las muestras de audio del fichero. MC_ALAW MC_MULAW MC_LIN16 Muestras de audio en formato de Ley A (8 bits, 8 KHz) Muestras de audio en formato de Ley Mu (8 bits, 8 KHz) Muestras de audio en formato lineal (16 bits, 8 KHz). (valor por defecto)

mode

42.3. Precauciones

Verbio Technologies

Referencia de las funciones del Library SDK

65

Captulo 2. Descripcin de las funciones

La funcin vox_setvcb() (o vox_loadvcb() + vox_activatevcb()) debe ser llamada previamente a la funcin vox_recstr() para establecer el vocabulario o gramtica activo. La estructura VX_RSP utilizada como argumento de la funcin vox_recstr() debe ser inicializada a sus valores por defecto mediante la funcin vox_clrrsp() antes de modificar los valores de sus campos.

42.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_SYSTEM EVX_NOSETVCB SYSTEM ERROR. Check errno. NO ACTIVE VOCABULARY. Use vox_setvcb() to set the active vocabulary.

42.5. Elementos relacionados


vox_recstrm

66

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

43. vox_recstrm
FUNCION int vox_recstrm(int chdev, void *samp, int nsamp, VX_RSP *rspp, unsigned int mode) int chdev void *samp int nsamp VX_RSP *rspp unsigned int mode RETORNA descriptor de un canal vlido vector que contiene las muestras de voz a reconocer tamao del vector de muestras puntero a una estructura del tipo Recognition String Parameter formato de las muestras de audio

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

43.1. Descripcin
La funcin vox_recstrm() inicia el reconocimiento de la seal de voz almacenada en memoria. La funcin vox_recstrm() acepta condiciones de terminacin adicionales especificadas mediante la estructura VX_RSP pasada como parmetro. Una vez invocada la funcin vox_recstrm(), el proceso de reconocimiento continua hasta que se cumpla alguna de las condiciones de terminacin establecidas mediante la estructura VX_RSP. El formato de las muestras de voz almacenadas en memoria debe ser PCM lineal, Ley A o Ley Mu, 8 KHz y sin control automtico de ganancia.

43.2. Descripcin de los parmetros


chdev samp nsamp rspp especifica el descriptor de canal vlido. vector que contiene las muestras de voz a reconocer tamao del vector de muestras (en bytes). puntero a una estructura de tipo String Parameter Structure (VX_RSP) en la que se especifican condiciones adicionales de terminacin del proceso de reconocimiento. Si el valor de este parmetro es NULL se utilizarn los valores por defecto de los campos de la estructura. Para ms informacin acerca de esta estructura, consulte el Captulo 3. Estructuras de datos y parmetros. especifica el formato de las muestras de voz almacenadas en memoria. MC_ALAW MC_MULAW MC_LIN16 Muestras de audio en formato de Ley A (8 bits, 8 KHz) Muestras de audio en formato de Ley Mu (8 bits, 8 KHz) Muestras de audio en formato lineal (16 bits, 8 KHz). (valor por defecto)

mode

Verbio Technologies

Referencia de las funciones del Library SDK

67

Captulo 2. Descripcin de las funciones

43.3. Precauciones
La funcin vox_setvcb() (o vox_loadvcb() + vox_activatevcb()) debe ser llamada previamente a la funcin vox_recstrm() para establecer el vocabulario o gramtica activo. La estructura VX_RSP utilizada como argumento de la funcin vox_recstrm() debe ser inicializada a sus valores por defecto mediante la funcin vox_clrrsp() antes de modificar los valores de sus campos.

43.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr alguno de los siguientes motivos de error: EVX_SYSTEM EVX_NOSETVCB SYSTEM ERROR. Check errno. NO ACTIVE VOCABULARY. Use vox_setvcb() to set the active vocabulary.

43.5. Elementos relacionados


vox_recstr

43.6. Cdigos de ejemplo


Consulte el ejemplo anexo.

68

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

44. vox_recstr_close
FUNCION int vox_recstr_close(int chdev, int recdev) int chdev int recdev RETORNA descriptor de un canal vlido descriptor de grabacin vlido

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

44.1. Descripcin
La funcin vox_recstr_close() cierra el descriptor de grabacin abierto mediante la funcin vox_recstr_open y libera los recursos utilizados durante el proceso de reconocimiento.

44.2. Descripcin de los parmetros


chdev recdev especifica el descriptor de canal vlido. especifica el descriptor de grabacin vlido obtenido mediante la funcin vox_recstr_open.

44.3. Elementos relacionados


vox_recstr_open, vox_recstr_write

44.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

69

Captulo 2. Descripcin de las funciones

45. vox_recstr_open
FUNCION int vox_recstr_open(int chdev, VX_RSP *rspp, unsigned int mode) int chdev VX_RSP *rspp unsigned int mode RETORNA descriptor de un canal vlido puntero a una estructura del tipo Recognition String Parameter formato de las muestras (Ley A o Ley Mu)

!= -1 para indicar el descriptor de grabacin -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

45.1. Descripcin
La funcin vox_recstr_open() inicializa el servidor de reconocimiento en el canal especificado, de modo que est preparado para empezar a recibir las muestras de audio mediante la funcin vox_recstr_write(). El valor devuelto por la funcin es requerido por las funciones vox_recstr_write() y vox_recstr_close().

45.2. Descripcin de los parmetros


chdev rspp especifica el descriptor de canal vlido. puntero a una estructura de tipo String Parameter Structure (VX_RSP) en la que se especifican condiciones adicionales de terminacin del proceso de reconocimiento. Si el valor de este parmetro es NULL se utilizarn los valores por defecto de los campos de la estructura. Para ms informacin acerca de esta estructura, consulte Captulo 3. Estructuras de datos y parmetros. especifica el formato de las muestras de audio pasadas al reconocedor. MC_ALAW MC_MULAW formato PCM (Ley A) a 8 KHz. formato PCM (Ley Mu) a 8 KHz.

mode

45.3. Precauciones
Una vez finalizado el reconocimiento, es imprescindible invocar a la funcin vox_recstr_close para liberar los recursos de memoria utilizados durante el proceso de reconocimiento.

45.4. Elementos relacionados


vox_recstr_write, vox_recstr_close

45.5. Cdigos de ejemplo


Consulte el ejemplo anexo.

70

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

46. vox_recstr_release
FUNCION int vox_recstr_release(int chdev) int chdev RETORNA descriptor de un canal vlido

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

46.1. Descripcin
La funcin vox_recstr_release() libera un recurso (licencia) de reconocimiento del habla reservado mediante la funcin vox_recstr_wait() en el canal especificado. Esta funcin se incluye por compatibilidad con versiones anteriores, aunque debera caer en desuso. Para nuevos desarrollos es aconsejable utilizar la funcin vox_reccfg_release.

46.2. Descripcin de los parmetros


chdev especifica el descriptor de canal vlido.

46.3. Elementos relacionados


vox_recstr_wait, vox_playstr_wait vox_reccfg_wait, vox_reccfg_release, vox_getusedasrlic, vox_playstr_release,

46.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

71

Captulo 2. Descripcin de las funciones

47. vox_recstr_wait
FUNCION int vox_recstr_wait(int chdev, int ms) int chdev int ms RETORNA descriptor de un canal vlido tiempo mximo de espera para obtener un recurso (en milisegundos)

0 si el resultado es satisfactorio -1 en caso de no poder obtener un recurso en el tiempo especificado

INCLUDES MODO

voxlib.h sncrono

47.1. Descripcin
La funcin vox_recstr_wait() reserva un recurso (licencia) de reconocimiento del habla para el canal especificado hasta que se libere mediante la funcin vox_recstr_release(). La funcin espera un mximo de ms milisegundos la disponibilidad de un recurso, transcurridos los cuales devuelve un error. El uso de esta funcin es aconsejable para gestionar el uso de los recursos (licencias) disponibles. En entornos en los que nunca se producirn ms peticiones simultneas de reconocimiento que licencias disponibles no es necesario su uso. Esta funcin se incluye por compatibilidad con versiones anteriores, aunque debera caer en desuso. Para nuevos desarrollos es aconsejable utilizar la funcin vox_reccfg_wait.

47.2. Descripcin de los parmetros


chdev ms especifica el descriptor de canal vlido. tiempo mximo de espera, en milisegundos, para obtener un recurso (licencia) de reconocimiento del habla para el canal especificado.

47.3. Elementos relacionados


vox_recstr_release, vox_playstr_release vox_reccfg_wait, vox_reccfg_release, vox_getusedasrlic, vox_playstr_wait,

47.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

72

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

48. vox_recstr_write
FUNCION int vox_recstr_write(int recdev, const void *buffer, unsigned int n) int recdev const void *buffer unsigned int n RETORNA descriptor de grabacin vlido vector en el que se encuentran las muestras de audio que debe procesar el reconocedor tamao del vector de muestras (en bytes)

nmero de muestras procesadas por el motor de reconocimiento -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

48.1. Descripcin
La funcin vox_recstr_write() enva las muestras recibidas hacia el servidor de reconocimiento. La funcin retorna un nmero igual al nmero de bytes contenidos en el vector de muestras para indicar que todava no ha finalizado el proceso de reconocimiento y que, por lo tanto, es necesario seguir invocando a esta funcin con nuevas muestras de audio. La funcin retorna un nmero de muestras menor que el tamao del vector de muestras para indicar que el servidor de reconocimiento ya no acepta ms muestras debido a que se ha cumplido alguna de las condiciones de terminacin especificadas en la funcin vox_recstr_open.

48.2. Descripcin de los parmetros


recdev buffer n especifica el descriptor de grabacin vlido obtenido mediante la funcin vox_recstr_open. vector en el que se encuentran las muestras de audio que debe procesar el reconocedor. tamao del vector de muestras.

48.3. Elementos relacionados


vox_recstr_open, vox_recstr_close

48.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

73

Captulo 2. Descripcin de las funciones

49. vox_RegisterVVICallback
FUNCION int vox_RegisterVVICallback(int chdev, int (*function)(const char *, unsigned long, size_t)) int chdev descriptor de un canal vlido

RETORNA

int funcin de callback que ser invocada cada vez que el (*function)(const motor de lenguaje estadstico disponga de un nuevo resultado. char *, unsigned long, size_t) 0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

49.1. Descripcin
La funcin vox_RegisterVVICallback() especifica una funcin de callback que ser la encargada de recibir los resultados que el motor de lenguaje natural de Verbio vaya generando durante el anlisis de las muestras de audio. Esta funcin es invocada automticamente cada vez que el motor de reconocimiento dispone de nuevos resultados.

49.2. Descripcin de los parmetros


chdev int (*function)(const char *, unsigned long, size_t) especifica el descriptor de canal vlido. Funcin de callback encargada de recibir los resultados de reconocimiento generados por el motor de reconocimiento estadstico.El resultado se entregar en el primer parmetro (const char* en modo texto. El ndice de confianza del resultado se entregar en el segundo parmetro. El identificador del canal desde el que se ha definido la funcin de callback se entregar en el tercer parmetro.

49.3. Cdigos de ejemplo


Consulte el ejemplo anexo.

74

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

50. vox_regsrvclose
FUNCION int vox_regsrvclose(VX_SRVCLOSE function) VX_SRVCLOSE function RETORNA INCLUDES MODO voxlib.h sncrono funcin de callback que atender el evento de desconexin

50.1. Descripcin
La funcin vox_regsrvclose() permite especificar una funcin (opcional) que ser invocada en cuanto se detecte una desconexin entre el cliente y el servidor de sntesis y/o reconocimiento.

50.2. Descripcin de los parmetros


function especifica la funcin de callback que se invocar en cuanto se produzca una desconexin entre el cliente y el servidor. La definicin de la funcin es del tipo: typedef void (*VX_SRVCLOSE) (const char *server) donde recibir como parmetro el nombre o direccin IP del servidor con el que se ha perdido la comunicacin.

50.3. Elementos relacionados


vox_srvclose

50.4. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

75

Captulo 2. Descripcin de las funciones

51. vox_SapiClose
FUNCION int vox_SapiClose(int chdev, HSAPI pmode) int chdev HSAPI pmode RETORNA descriptor de un canal vlido descriptor de un motor de sntesis compatible SAPI

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES

speech.h voxlib.h

MODO

sncrono

51.1. Descripcin
La funcin vox_SapiClose() cierra un motor de sntesis compatible con SAPI previamente abierto mediante la funcin vox_SapiOpen().

51.2. Descripcin de los parmetros


chdev pmode especifica el descriptor de canal vlido. descriptor de un motor de sntesis compatible SAPI previamente abierto mediante la funcin vox_SapiOpen().

51.3. Elementos relacionados


vox_SapiOpen, vox_SapiSelect

51.4. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

76

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

52. vox_SapiOpen
FUNCION int vox_SapiOpen(int chdev, TTSMODEINO *TTSModeInfo, HSAPI *pmode, unsigned int mode) int chdev TTSMODEINO *TTSModeInfo HSAPI *pmode unsigned int mode RETORNA descriptor de un canal vlido puntero a una estructura del tipo Text-to-Speech Information puntero que recibir el descriptor del motor de sntesis SAPI abierto por compatibilidad con versiones anteriores, sese 0

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES

speech.h voxlib.h

MODO

sncrono

52.1. Descripcin
La funcin vox_SapiOpen() abre el motor de sntesis compatible SAPI que mejor se adapta a los requisitos especificados mediante la estructura TTSMODEINFO en caso de existir. Una vez finalizada satisfactoriamente la funcin vox_SapiOpen(), el motor de sntesis abierto puede ser seleccionado mediante la funcin vox_SapiSelect(), especificando el descriptor obtenido. El motor de sntesis debe ser cerrado mediante la funcin vox_SapiClose().

52.2. Descripcin de los parmetros


chdev TTSModeInfo especifica el descriptor de canal vlido. puntero a una estructura de tipo Text-to-Speech Mode Information (TTSMODEINFO), que proporciona informacin detallada acerca del motor de sntesis que desea utilizarse. Si este parmetro es NULL, se seleccionar el motor de sntesis por defecto. En http://www.microsoft.com/speech podr obtener ms informacin acerca de esta estructura y del estndar SAPI (Speech API). pmode mode puntero que contendr el descriptor del motor de sntesis seleccionado al trmino de la funcin. por compatibilidad con versiones anteriores, sese 0

52.3. Errores
Si no se encuentra ningn motor de sntesis que se adapte mnimamente a las especificaciones contenidas en la estructura TTSMODEINFO, la funcin retorna -1 para indicar que se ha producido un error.

52.4. Elementos relacionados

Verbio Technologies

Referencia de las funciones del Library SDK

77

Captulo 2. Descripcin de las funciones

vox_SapiOpenEx, vox_SapiSelect, vox_SapiClose

52.5. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

78

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

53. vox_SapiOpenEx
FUNCION int vox_SapiOpenEx(int chdev, PMODEATTRIBUTES ttsattributes, HSAPI *pmode) int chdev PMODEATTRIBUTES ttsattributes HSAPI *pmode descriptor de un canal vlido puntero a una estructura del tipo MODEATTRIBUTES puntero que recibir el descriptor del motor de sntesis SAPI abierto

RETORNA

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES

speech.h voxlib.h

MODO

sncrono

53.1. Descripcin
La funcin vox_SapiOpenEx() abre el motor de sntesis compatible SAPI que mejor se adapta a los requisitos especificados mediante la estructura MODEATTRIBUTES en caso de existir. Una vez finalizada satisfactoriamente la funcin vox_SapiOpenEx(), el motor de sntesis abierto puede ser seleccionado mediante la funcin vox_SapiSelect(), especificando el descriptor obtenido. El motor de sntesis debe ser cerrado mediante la funcin vox_SapiClose().

53.2. Descripcin de los parmetros


chdev ttsattributes especifica el descriptor de canal vlido. puntero a una estructura de tipo MODEATTRIBUTES que proporciona informacin detallada acerca del motor de sntesis que desea utilizarse. Si este parmetro es NULL, se seleccionar el motor de sntesis por defecto. En el Captulo 3. Estructuras de datos y parmetros podr obtener ms informacin acerca de esta estructura. pmode puntero que contendr el descriptor del motor de sntesis seleccionado al trmino de la funcin.

53.3. Errores
Si no se encuentra ningn motor de sntesis que se adapte mnimamente a las especificaciones contenidas en la estructura MODEATTRIBUTES, la funcin retorna -1 para indicar que se ha producido un error.

53.4. Elementos relacionados


vox_SapiOpen, vox_SapiSelect, vox_SapiClose

53.5. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

79

Captulo 2. Descripcin de las funciones

54. vox_SapiSelect
FUNCION int vox_SapiSelect(int chdev, HSAPI pmode) int chdev HSAPI pmode RETORNA descriptor de un canal vlido descriptor de un motor de sntesis compatible SAPI

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES

speech.h voxlib.h

MODO

sncrono

54.1. Descripcin
La funcin vox_SapiSelect() selecciona el motor de sntesis compatible SAPI abierto previamente mediante la funcin vox_SapiOpen(). Una vez invocada satisfactoriamente la funcin vox_SapiSelect(), el motor de sntesis compatible SAPI seleccionado estar activo en el canal hasta la siguiente llamada a esta funcin o a la funcin vox_SapiClose().

54.2. Descripcin de los parmetros


chdev pmode especifica el descriptor de canal vlido. descriptor de un motor de sntesis compatible SAPI previamente abierto mediante la funcin vox_SapiOpen().

54.3. Errores
Si no existe un motor de sntesis asociado con el descriptor especificado, la funcin retorna -1 para indicar que se ha producido un error.

54.4. Elementos relacionados


vox_SapiOpen, vox_SapiClose

54.5. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

80

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

55. vox_SerialNumber
FUNCION RETORNA INCLUDES MODO const char* vox_SerialNumber(void) Nmero de serie de Verbio voxlib.h sncrono

55.1. Descripcin
La funcin vox_SerialNumber() retorna un puntero a carcter conteniendo el nmero de serie correspondiente a la versin servidor de Verbio.

55.2. Precauciones
El nmero de serie nicamente est disponible tras el establecimiento de la comunicacin entre cliente y servidor mediante alguna de las siguientes funciones: vox_libinit, vox_asr_init o vox_tts_init.

55.3. Elementos relacionados


vox_GetDllVersion

55.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

81

Captulo 2. Descripcin de las funciones

56. vox_SetAbbreviations
FUNCION int vox_SetAbbreviations(int *filename) int chdev const char *mcLang const char *filename chdev, const char *mcLang, const char

descriptor de un canal vlido especifica el idioma asociado al diccionario personal de abreviaturas puntero al nombre del fichero de texto que contiene las abreviaturas personalizadas

RETORNA

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

56.1. Descripcin
La funcin vox_SetAbbreviations() establece un conjunto de abreviaturas personalizadas para ser utilizadas por el servidor de sntesis en el canal especificado, pudiendo ser modificadas dinmicamente. El diccionario de abreviaturas personalizadas se aade al diccionario global de abreviaturas usado por el servidor de sntesis para el idioma especificado. Para una mayor informacin, consulte el captulo de sntesis del habla en Verbio Software Reference: Gua del Usuario.

56.2. Descripcin de los parmetros


chdev mclang descriptor de un canal vlido. especifica el idioma asociado con el vocabulario de abreviaturas personalizadas. LNG_SPANISH LNG_CATALAN LNG_BASQUE LNG_GALICIAN LNG_PORTUGUESE LNG_PORTUGUESE_BRAZILIAN LNG_FRENCH LNG_ENGLISH LNG_SPANISH_MEXICAN LNG_SPANISH_ARGENTINIAN Espaol castellano Cataln Euskera Gallego Portugus Portugus brasileo Francs Ingls Espaol mexicano Espaol argentino

82

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

filename

puntero al nombre del fichero de texto que contiene las abreviaturas personalizadas para el idioma seleccionado.

56.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr el motivo del error.

56.4. Elementos relacionados


vox_SetDictionary

56.5. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

83

Captulo 2. Descripcin de las funciones

57. vox_setcd
FUNCION int vox_setcd(int chdev, unsigned int mode) int chdev unsigned int mode RETORNA descriptor de un canal vlido por compatibilidad con versiones anteriores, sese 0

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

57.1. Descripcin
La funcin vox_setcd() establece el vocabulario de dgitos conectados en el canal especificado.

57.2. Descripcin de los parmetros


chdev mode especifica el descriptor de canal vlido. por compatibilidad con versiones anteriores, sese 0

57.3. Precauciones
Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento.

57.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_SYSTEM OUT OF MEMORY SYSTEM ERROR. Check errno.

57.5. Elementos relacionados


vox_setvcb, vox_loadvcb, vox_activatevcb, vox_deactivatevcb, vox_unloadvcb, ATVOX_IVCB

84

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

58. vox_SetDictionary
FUNCION int vox_SetDictionary(int chdev, const char *mcLang, const char *filename) int chdev const char *mcLang const char *filename descriptor de un canal vlido especifica el idioma asociado al diccionario personal puntero al nombre del fichero de texto que contiene el diccionario personalizado

RETORNA

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

58.1. Descripcin
La funcin vox_SetDictionary() establece un diccionario personalizado para ser utilizado por el servidor de sntesis en el canal especificado, pudiendo ser modificado dinmicamente. El diccionario personalizado se aade al diccionario global usado por el servidor de sntesis para el idioma especificado. Para una mayor informacin, consulte el captulo de sntesis del habla en Verbio Software Reference: Gua del Usuario.

58.2. Descripcin de los parmetros


chdev mclang descriptor de un canal vlido. especifica el idioma al que afectar el diccionario personalizado. LNG_SPANISH LNG_CATALAN LNG_BASQUE LNG_GALICIAN LNG_PORTUGUESE LNG_PORTUGUESE_BRAZILIAN LNG_FRENCH LNG_ENGLISH LNG_SPANISH_MEXICAN LNG_SPANISH_ARGENTINIAN filename Espaol castellano Cataln Euskera Gallego Portugus Portugus brasileo Francs Ingls Espaol mexicano Espaol argentino

puntero al nombre del fichero de texto que contiene el diccionario personalizado para el idioma seleccionado.

Verbio Technologies

Referencia de las funciones del Library SDK

85

Captulo 2. Descripcin de las funciones

58.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr el motivo del error.

58.4. Elementos relacionados


vox_SetAbbreviations

58.5. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

86

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

59. vox_setparm
FUNCION int vox_setparm(int dev, unsigned long parm, void *valuep) int dev unsigned long parm void *valuep descriptor de un canal vlido o -1 para parmetros globales de VERBIO (independientes del canal) parmetro del que se desea establecer el valor puntero a la variable en la que se almacena el valor del parmetro a modificar

RETORNA

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

59.1. Descripcin
La funcin vox_setparm() permite modificar los valores de los parmetros globales o dependientes del canal de VERBIO. Esta funcin puede modificar el valor de un nico parmetro en cada invocacin.

59.2. Descripcin de los parmetros


dev parm especifica el descriptor de canal vlido . Use -1 para establecer el valor de parmetros globales de VERBIO (independientes del canal). especifica el identificador del parmetro del que se desea modificar el valor por el de la variable apuntada por valuep. Los identificadores de los parmetros pueden consultarse en Captulo 3. Estructuras de datos y parmetros. puntero a la variable en la que se almacena el valor del parmetro a modificar.

valuep

59.3. Elementos relacionados


vox_getparm

59.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

87

Captulo 2. Descripcin de las funciones

60. vox_setvcb
FUNCION int vox_setvcb(int chdev, const char *filename, unsigned int mode) int chdev const char *filename descriptor de un canal vlido puntero al nombre del fichero que contiene el vocabulario o la gramtica ABNF/DTMF o bien NULL para desactivar todos los vocabularios vocabulario convencional (listado de palabras) o gramtica ABNF o DTMF

unsigned int mode

RETORNA

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

60.1. Descripcin
La funcin vox_setvcb() establece el vocabulario o la gramtica ABNF o DTMF especificado en el canal especificado.

60.2. Descripcin de los parmetros


chdev filename especifica el descriptor de canal vlido. puntero al nombre del fichero que contiene el vocabulario (cada lnea constituye una palabra del vocabulario formada por una o ms palabras) o la gramtica ABNF/DTMF. NULL para desactivar todos los vocabularios y gramticas cargados hasta ese momento y para liberar la licencia de idioma asociada al canal. mode indica el tipo de vocabulario o gramtica GVX_ISOLATED GVX_CONNECTED Palabras aisladas. El reconocedor espera reconocer una nica palabra del vocabulario de este vocabulario. Palabras conectadas (valor por defecto). El reconocedor espera reconocer una o ms palabras del vocabulario de este vocabulario. gramtica ABNF. El reconocedor espera reconocer una o ms palabras de la gramtica. gramtica DTMF. El reconocedor espera recibir uno o ms tonos DTMF.

GVX_ABNF GVX_DTMF

60.3. Precauciones
Sin la opcin GVX_ABNF habilitada, la funcin vox_setvcb() requiere el fichero de definiciones y el fichero de transcripciones generados mediante la funcin vox_prevcb() o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev(). Si estos ficheros existen y el fichero de vocabulario correspondiente no ha sido modificado

88

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

desde que se llam a la funcin vox_prevcb() (o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev()), no es necesario volver a invocarlas antes de cargar el vocabulario mediante la funcin vox_setvcb(). Con la opcin GVX_ABNF habilitada, la funcin vox_setvcb() requiere el fichero de estados de la gramtica, el fichero de definiciones y el fichero de transcripciones generado mediante la funcin vox_prevcb() o vox_prevcbex() o vox_prevcbex2() o vox_prevcbdev(). Si estos ficheros existen y la gramtica ABNF correspondiente no ha sido modificado desde que se llam a la funcin vox_prevcb() (o vox_prevcbex()o vox_prevcbex2() o vox_prevcbdev()), no es necesario volver a invocarlas antes de cargar la gramtica mediante la funcin vox_setvcb(). Con la opcin GVX_DTMF la gramtica no crea ficheros adicionales resultados de la compilacin. Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento. La configuracin de reconocimiento activa en el momento de cargar la gramtica debe ser la misma que la existente en el momento de su preparacin. En caso contrario, aparecer el error THE VOCABULARY CONTAINS AN INVALID WORD. Check and correct invalid words.

60.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_VCBFILE EVX_INVWORD EVX_SYSTEM OUT OF MEMORY. THE VOCABULARY FILE NAME IS NOT VALID. THE VOCABULARY TRANSCRIPTION WAS NOT FOUND. SYSTEM ERROR. Check errno.

60.5. Elementos relacionados


vox_setcd, vox_loadvcb, vox_activatevcb, vox_deactivatevcb, vox_unloadvcb, ATVOX_IVCB

60.6. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

89

Captulo 2. Descripcin de las funciones

61. vox_spk_addfile
FUNCION int vox_spk_addfile(int chdev, const char* id, const char* filename, const char* transcription) int chdev const char *id const char *filename const char *transcription RETORNA descriptor de un canal vlido identificador del usuario que entrena su huella vocal con el fichero de audio indicado nombre del fichero de audio utilizado durante la fase de entreno del usuario indicado transcripcin del contenido del audio utilizado para entrenar la huella vocal del usuario indicado

1 si el resultado es satisfactorio <0 en caso de error

INCLUDES MODO

voxlib.h sncrono

61.1. Descripcin
La funcin vox_spk_addfile() almacena el fichero de audio en la base de datos, asociado al usuario indicado, para ser utilizado en el momento de crear la huella vocal del mismo, mediante la invocacin de la funcin vox_spk_train. Adicionalmente, utilizando la capacidad de reconocimiento de Verbio ASR, comprueba tambin que el contenido del fichero coincide con la transcripcin, de modo que pueda certificarse que el usuario ha pronunciado exactamente aquello que se le ha solicitado.

61.2. Descripcin de los parmetros


chdev id especifica el descriptor de canal vlido. identificador del usuario del que se ha obtenido un nuevo fichero de audio para el proceso de entrenamiento. el identificador de un usuario es una cadena alfanumrica (dgitos o caracteres a-z,A-Z) elegida por el desarrollador de la aplicacin. Debe ser nica para cada usuario, siendo habitual que el identificador coincida con el identificador numrico (cadena de dgitos) que se le solicitar al usuario para identificarse en el sistema. filename nombre completo del fichero de audio que contiene la locucin del usuario indicado, destinado a ser utilizado en el proceso de creacin de la huella vocal. El formato del fichero debe ser WAV (8000 muestras/segundo, Ley A). transcripcin del contenido del fichero de audio que ser utilizado en el proceso de creacin de la huella vocal, para certificar que el contenido coincide con la secuencia de dgitos solicitada.

transcription

61.3. Precauciones
El contenido de los ficheros de entrenamiento debe ser, exclusivamente, cadenas de dgitos (de longitud variable). Por lo tanto, la transcripcin proporcionada deben ser cadenas numricas, del tipo 12345678, 952611232, etctera. Se aconseja que las cadenas de entrenamiento tengan una longitud mnima de 8 dgitos y

90

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

que se proporcionen, al menos, 20 de ellas, obtenidas en distintos das (mnimo dos) y momentos del da (maana/tarde). Puede invocarse directamente a la funcin vox_spk_train especificando un listado de ficheros a utilizar para la fase de entrenamiento en lugar de invocar, para cada nuevo fichero, a la funcin vox_spk_addfile. No obstante, se aconseja su uso a medida que se obtienen los ficheros porque en caso de errores (debido a que el usuario no ha pronunciado la cadena de dgitos solicitada) podr notificarse este error al usuario y solicitarle un nuevo fichero.

61.4. Errores
En caso de error, la funcin retorna un valor negativo. Los posibles cdigos de error retornados por esta funcin son: -1 -4 -6 -18 -27 El canal especificado no es vlido. Error interno de Verbio. La estructura de la base de datos est corrupta. Error al lanzar el proceso de reconocimiento del contenido del fichero de audio. Algn parmetro no ha sido especificado o bien es incorrecto. El contenido del fichero no coincide con la transcripcin proporcionada, o bien no se ha podido comprobar.

61.5. Elementos relacionados


vox_spk_init, vox_spk_exist, vox_spk_train, vox_spk_verify

61.6. Cdigos de ejemplo


Consulte el ejemplo anexo

Verbio Technologies

Referencia de las funciones del Library SDK

91

Captulo 2. Descripcin de las funciones

62. vox_spk_exist
FUNCION int vox_spk_exist(int chdev, const char* id) int chdev const char *id descriptor de un canal vlido identificador del usuario del que se desea conocer su existencia (registro previo)

RETORNA

1 si el usuario ya est registrado 0 si el usuario no est todava registrado -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

62.1. Descripcin
La funcin vox_spk_exist() consulta la base de datos de usuarios registrados para comprobar si ya ha completado la fase de entrenamiento y, por lo tanto, ya dispone de un modelo (huella vocal) creado.

62.2. Descripcin de los parmetros


chdev id especifica el descriptor de canal vlido. identificador del usuario del que se quiere conocer el estado de su proceso de registro. el identificador de un usuario es una cadena alfanumrica (dgitos o caracteres a-z,A-Z) elegida por el desarrollador de la aplicacin. Debe ser nica para cada usuario, siendo habitual que el identificador coincida con el identificador numrico (cadena de dgitos) que se le solicitar al usuario para identificarse en el sistema.

62.3. Precauciones
La funcin vox_spk_exist() indica si el usuario indicado dispone de una huella vocal entrenada. No comprueba, sin embargo, si el usuario ha iniciado o no el proceso de entrenamiento, utilizando la funcin vox_spk_addfile para proporcionar los audios de entreno requeridos.

62.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, debe comprobarse que el canal especificado como primer parmetro es vlido.

62.5. Elementos relacionados


vox_spk_init, vox_spk_addfile, vox_spk_train, vox_spk_verify

62.6. Cdigos de ejemplo


Consulte el ejemplo anexo

92

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

63. vox_spk_init
FUNCION RETORNA int vox_spk_init() 0 si el resultado es satisfactorio <0 en caso de error INCLUDES MODO voxlib.h sncrono

63.1. Descripcin
La funcin vox_spk_init() inicializa la librera Verbio, preparndola para poder recibir peticiones de verificacin de locutor.

63.2. Precauciones
La funcin vox_spk_init() debe invocarse previamente a cualquier invocacin del resto de funciones asociadas a la verificacin de locutor, tales como: vox_spk_addfile, vox_spk_train, vox_spk_verify y vox_spk_exist.

63.3. Errores
En caso de error, la funcin retorna un valor negativo. Los posibles cdigos de error retornados por esta funcin son: -13 -14 Error interno de Verbio. Probablemente la instalacin de los componentes de SpeakerID no se ha realizado o se ha hecho de forma incorrecta. No se dispone de licencias de SpeakerID o bien stas han caducado.

63.4. Elementos relacionados


vox_spk_addfile, vox_spk_train, vox_spk_verify, vox_spk_exist

63.5. Cdigos de ejemplo


Consulte el ejemplo anexo

Verbio Technologies

Referencia de las funciones del Library SDK

93

Captulo 2. Descripcin de las funciones

64. vox_spk_train
FUNCION int vox_spk_train(int chdev, const char* id, const char* filename, int* lpiword) int chdev const char *id const char *filename int *lpiword descriptor de un canal vlido identificador del usuario que entrena su huella vocal con el fichero de audio indicado nombre del fichero que contiene el listado de ficheros a utilizar durante el proceso de entrenamiento puntero a un entero que, en caso de error en alguno de los ficheros, devolver la lnea que contiene el fichero errneo

RETORNA

0 si el resultado es satisfactorio <0 en caso de error

INCLUDES MODO

voxlib.h sncrono

64.1. Descripcin
La funcin vox_spk_train() lanza el proceso de generacin de la huella vocal del usuario indicado. Los ficheros utilizados para el proceso de entrenamiento sern, o bien los especificados mediante el parmetro filename o bien los indicados mediante llamadas sucesivas a la funcin vox_spk_addfile. Una vez finalizada correctamente la funcin vox_spk_train(), el sistema estar ya listo para empezar a verificar los intentos de acceso del usuario entrenado.

64.2. Descripcin de los parmetros


chdev id especifica el descriptor de canal vlido. identificador del usuario del que se desea obtener la huella vocal a partir de los ficheros de audio y transcripciones indicados. el identificador de un usuario es una cadena alfanumrica (dgitos o caracteres a-z,A-Z) elegida por el desarrollador de la aplicacin. Debe ser nica para cada usuario, siendo habitual que el identificador coincida con el identificador numrico (cadena de dgitos) que se le solicitar al usuario para identificarse en el sistema. filename NULL si los ficheros de audio y transcripciones se han proporcionado invocando sucesivamente a la funcin vox_spk_addfile. nombre completo del fichero de texto que contiene el listado de ficheros de audio a utilizar para el entrenamiento junto con sus respectivas transcripciones. Los ficheros de audio deben ser WAV (8000 muestras/segundo, Ley A). El formato de este fichero debe ser el siguiente (una lnea, acabada en retorno de carro, para cada fichero de audio a utilizar): nombre_fichero_audio TAB transcripcion_cadena_digitos RC RC = Retorno de Carro - TAB = Tabulador lpiword NULL si los ficheros de audio y transcripciones se han proporcionado invocando sucesivamente a la funcin vox_spk_addfile.

94

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

puntero a un entero que recibir el valor de la lnea que contiene un fichero que no ha sido validado para el proceso de entrenamiento. Debe consultarse este valor si la funcin retorna el error -27.

64.3. Precauciones
El contenido de los ficheros de entrenamiento debe ser, exclusivamente, cadenas de dgitos (de longitud variable). Por lo tanto, la transcripcin proporcionada deben ser cadenas numricas, del tipo 12345678, 952611232, etctera. Se aconseja que las cadenas de entrenamiento tengan una longitud mnima de 8 dgitos y que se proporcionen, al menos, 20 de ellas, obtenidas en distintos das (mnimo dos) y momentos del da (maana/tarde). En lugar de especificar conjuntamente el listado de ficheros y sus transcripciones mediante la funcin vox_spk_train es preferible utilizar la funcin vox_spk_addfile individualmente para cada fichero. De este modo, podrn tomarse acciones correctivas en caso de que, en el momento de adquisicin del audio, el proceso de validacin interno indique que la transcripcin no coincide con el contenido real del fichero.

64.4. Errores
En caso de error, la funcin retorna un valor negativo. Los posibles cdigos de error retornados por esta funcin son: -1 -4 -5 -6 -10 -18 -21 -27 -28 El canal especificado no es vlido. Error interno de Verbio. La estructura de la base de datos est corrupta. No se dispone de suficiente memoria disponible para ejecutar la funcin. Error al lanzar el proceso de reconocimiento del contenido del fichero de audio. Error al lanzar el proceso de verificacin del locutor. Algn parmetro no ha sido especificado o bien es incorrecto. El fichero especificado como parmetro no est disponible. El contenido de algn fichero no coincide con la transcripcin proporcionada, o bien no se ha podido comprobar. No se dispone de suficiente material para entrenar. Es necesario proporcionar ms locuciones numricas del usuario a entrenar.

64.5. Elementos relacionados


vox_spk_init, vox_spk_exist, vox_spk_addfile, vox_spk_verify

64.6. Cdigos de ejemplo


Consulte el ejemplo anexo

Verbio Technologies

Referencia de las funciones del Library SDK

95

Captulo 2. Descripcin de las funciones

65. vox_spk_verify
FUNCION int vox_spk_verify(int chdev, const char* id, const char* filename, const char* transcription, float* score, int mode) int chdev const char *id const char *filename const char *transcription float* score int mode descriptor de un canal vlido identificador del usuario que verifica su identidad con el fichero de audio proporcionado nombre del fichero de audio utilizado para verificar la identidad del usuario transcripcin del contenido del audio utilizado para verificar la identidad del usuario ndice de confianza de la veracidad del usuario analizado activacin o desactivacin de protecciones adicionales (consulte disponibilidad)

RETORNA

1 si el usario es quien dice ser 0 si el usario NO es quien dice ser -1 si el audio parece haber sido manipulado <-1 en caso de error

INCLUDES MODO

voxlib.h sncrono

65.1. Descripcin
La funcin vox_spk_verify() lanza el proceso de verificacin para determinar si la locucin proporcionada pertenece (ha sido pronunciada) realmente por el usuario indicado, basndose en la huella vocal que ha sido previamente entrenada para dicho usuario mediante la funcin vox_spk_train.

65.2. Descripcin de los parmetros


chdev id especifica el descriptor de canal vlido. identificador del usuario cuya identidad pretende validarse mediante su huella vocal. el identificador de un usuario es una cadena alfanumrica (dgitos o caracteres a-z,A-Z) elegida por el desarrollador de la aplicacin. Debe ser nica para cada usuario, siendo habitual que el identificador coincida con el identificador numrico (cadena de dgitos) que se le solicitar al usuario para identificarse en el sistema. filename nombre completo del fichero de audio que contiene la locucin del usuario indicado, destinado a ser utilizado en el proceso de verificacin de su huella vocal. El formato del fichero debe ser WAV (8000 muestras/segundo, Ley A). transcripcin del contenido del fichero de audio que ser utilizado en el proceso de verificacin de la huella vocal, para certificar que el contenido coincide con la secuencia de dgitos solicitada.

transcription

96

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

score mode

puntero a float que almacenar el ndice de confianza del proceso de verificacin tras su finalizacin. habilita (1) o deshabilita (0) medidas adicionales de proteccin frente a impostores, con anlisis complementarios del audio para detectar estrategias de manipulacin de la seal para engaar al sistema. En caso de que se habilite y las estrategias de deteccin determinen que se trata de audio manipulado, la funcin devolver el error -1. Consulte disponibilidad.

65.3. Precauciones
El contenido de los ficheros de verificacin debe ser, exclusivamente, cadenas de dgitos (de longitud variable). Por lo tanto, la transcripcin proporcionada deben ser cadenas numricas, del tipo 12345678, 952611232, etctera. Se aconseja que las cadenas de verificacin tengan una longitud de entre 6 y 8 dgitos (cuanto ms larga, mayor fiablidad del proceso de verificacin). El ndice de confianza devuelto por la funcin (parmetro score) se proporciona a efectos estadsticos y de ajuste de los umbrales. El sistema, internamente, ya toma la decisin de si es el usuario verdico o no, retornando el valor 1 o 0 respectivamente como resultado de la funcin vox_spk_verify. En caso de que la funcin retorne el valor -1 (habindose habilitado la aplicacin de contramedidas mediante el parmetro mode), es indicativo de que las contramedidas han detectado un audio posiblemente manipulado para violar el sistema de seguridad. En el parmetro score se almacenar el ndice de confianza de la decisin (cuanto mayor sea este valor, ms probabilidad de que el audio haya sido manipulado). En caso de que las contramedidas detecten manipulacin en el audio, ste ya no es analizado por el motor de verificacin de locutor. Por lo tanto, si se tiene la certeza de que el audio procede de una fuente fiable, debera repetirse de nuevo el proceso de verificacin, pero deshabilitando las contramedidas para obtener el resultado de la verificacin.

65.4. Errores
En caso de error, la funcin retorna un valor negativo. Los posibles cdigos de error retornados por esta funcin son: -1 -4 -5 -6 -10 -18 -21 -27 El canal especificado no es vlido. Error interno de Verbio. La estructura de la base de datos est corrupta. No se dispone de suficiente memoria disponible para ejecutar la funcin. Error al lanzar el proceso de reconocimiento del contenido del fichero de audio. Error al lanzar el proceso de verificacin del locutor. Algn parmetro no ha sido especificado o bien es incorrecto. El fichero especificado como parmetro no est disponible. El contenido del fichero no coincide con la transcripcin proporcionada, o bien no se ha podido comprobar.

65.5. Elementos relacionados


vox_spk_init, vox_spk_exist, vox_spk_train, vox_spk_addfile

65.6. Cdigos de ejemplo


Consulte el ejemplo anexo

Verbio Technologies

Referencia de las funciones del Library SDK

97

Captulo 2. Descripcin de las funciones

66. vox_srvclose
FUNCION void vox_srvclose(const char *server) const char *server direccin IP del servidor con el que el cliente cierra la conexin

INCLUDES MODO

voxlib.h sncrono

66.1. Descripcin
La funcin vox_srvclose() cierra todas las conexiones con el servidor especificado en la direccin IP.

66.2. Descripcin de los parmetros


server especifica la direccin IP del servidor con el que se cerrarn todas las conexiones.

66.3. Elementos relacionados


vox_devclose, vox_thclose, vox_regsrvclose

66.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

98

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

67. vox_termplaystr
FUNCION int vox_termplaystr(int chdev) int chdev RETORNA descriptor de un canal vlido

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

67.1. Descripcin
La funcin vox_termplaystr() asegura que todos los eventos recibidos como consecuencia de una llamada asncrona a la funcin vox_playstr() son eliminados de la cola de eventos.

67.2. Descripcin de los parmetros


chdev especifica el descriptor de canal vlido.

67.3. Precauciones
Esta funcin debe ser llamada nicamente cuando la funcin vox_playstr() se ha invocado asncronamente.

67.4. Elementos relacionados


vox_playstr

67.5. Cdigos de ejemplo


Consulte el ejemplo asncrono del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

99

Captulo 2. Descripcin de las funciones

68. vox_termrecstr
FUNCION int vox_termrecstr(int chdev) int chdev RETORNA descriptor de un canal vlido

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

68.1. Descripcin
La funcin vox_termrecstr() indica el final del reconocimiento iniciado mediante la funcin vox_recstr_open() o mediante la funcin vox_recstr() invocada asncronamente.

68.2. Descripcin de los parmetros


chdev especifica el descriptor de canal vlido.

68.3. Precauciones
Esta funcin debe ser llamada nicamente cuando la funcin vox_recstr() se ha invocado asncronamente.

68.4. Elementos relacionados


vox_recstr, vox_recstr_open

68.5. Cdigos de ejemplo


Consulte el ejemplo asncrono del Dialogic SDK.

100

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

69. vox_thclose
FUNCION RETORNA int vox_thclose() 0 si el resultado es satisfactorio -1 en caso de error INCLUDES MODO voxlib.h sncrono

69.1. Descripcin
La funcin vox_thclose libera las conexiones con el motor de sntesis y o reconocimiento del habla utilizadas por el thread (hilo) que la invoca. Por lo tanto, esta funcin debe invocarse siempre desde cualquier thread (hilo) que haya hecho uso de sntesis o reconocimiento, justo antes del momento de su destruccin. De este modo, se liberarn los recursos utilizados para establecer la comunicacin con los servidores de sntesis y/o reconocimiento del habla.

69.2. Elementos relacionados


vox_libclose, vox_srvclose, vox_devclose

69.3. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

101

Captulo 2. Descripcin de las funciones

70. vox_tts_init
FUNCION int vox_tts_init(const char *configuration, const char *defttslng) const char *configuration const char *defttslng RETORNA uso futuro. Debe tener el valor NULL. identificador del idioma de sntesis por defecto

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

70.1. Descripcin
La funcin vox_tts_init() inicializa la librera de sntesis del habla de Verbio. En nuevos desarrollos es recomendable utilizar esta funcin (conjuntamente con la funcin vox_asr_init en caso de que tambin se requiera reconocimiento del habla) en lugar de la funcin vox_libinit, puesto que permite indicar al servidor los parmetros de inicializacin de una manera mucho ms concreta.

70.2. Descripcin de los parmetros


configuration defttslng parmetro destinado a usos futuros. El valor debe ser fijado a NULL. especifica el idioma por defecto con el que trabajar el servidor de sntesis. LNG_SPANISH LNG_CATALAN LNG_BASQUE LNG_GALICIAN LNG_PORTUGUESE LNG_PORTUGUESE_BRAZILIAN LNG_FRENCH LNG_ENGLISH LNG_SPANISH_MEXICAN LNG_SPANISH_ARGENTINIAN Espaol castellano Cataln Euskera Gallego Portugus Portugus brasileo Francs Ingls Espaol mexicano Espaol argentino

70.3. Precauciones
La funcin vox_tts_init() debe invocarse antes que ninguna otra de las funciones del Library SDK relacionadas con la sntesis del habla, a excepcin de aquella destinada a establecer el servidor de trabajo por defecto en configuraciones cliente-servidor (vox_setparm).

70.4. Errores

102

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR(-1) y ATVOX_ERRMSGP(-1) obtendr alguno de los siguientes motivos de error: EVX_INVSETUP EVX_NOMEM EVX_NOLICFILE EVX_INVLIC EVX_SYSTEM VERBIO INTERNAL ERROR. Files may be corrupted. Check disk and repeat Setup. OUT OF MEMORY. NO LICENSE FILE WAS FOUND. Run CheckOut to obtain a license file. THE LICENSE FILE IS NOT VALID. Run CheckOut to obtain a valid license file. SYSTEM ERROR.Check errno.

70.5. Elementos relacionados


vox_libinit, vox_asr_init, vox_libclose

70.6. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

103

Captulo 2. Descripcin de las funciones

71. vox_ttsSetAbbreviations
FUNCION int vox_ttsSetAbbreviations(int chdev, int mcLang, const char *filename) int chdev int mcLang const char *filename descriptor de un canal vlido especifica el idioma asociado al diccionario personal de abreviaturas puntero al nombre del fichero de texto que contiene las abreviaturas personalizadas

RETORNA

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

71.1. Descripcin
La funcin vox_ttsSetAbbreviations() establece un conjunto de abreviaturas personalizadas para ser utilizadas por el servidor de sntesis en el canal especificado, pudiendo ser modificadas dinmicamente. El diccionario de abreviaturas personalizadas se aade al diccionario global de abreviaturas usado por el servidor de sntesis para el idioma especificado. Esta funcin est obsoleta y se mantiene por compatibilidad con desarrollos antiguos. Para nuevos desarrollos, es aconsejable utilizar la funcin vox_SetAbbreviations. Para una mayor informacin, consulte el captulo de sntesis del habla en Verbio Software Reference: Gua del Usuario.

71.2. Descripcin de los parmetros


chdev mclang especifica el descriptor de canal vlido. especifica el idioma asociado con el vocabulario de abreviaturas personalizadas. LVX_SPANISH LVX_CATALAN filename Espaol Cataln

puntero al nombre del fichero de texto que contiene las abreviaturas personalizadas para el idioma seleccionado.

71.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr el motivo del error.

71.4. Elementos relacionados


vox_ttsSetDictionary

104

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

71.5. Cdigos de ejemplo


Consulte el ejemplo con barge-in del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

105

Captulo 2. Descripcin de las funciones

72. vox_ttsSetDictionary
FUNCION int vox_ttsSetDictionary(int chdev, int mcLang, const char *filename) int chdev int mcLang const char *filename descriptor de un canal vlido especifica el idioma asociado al diccionario personal puntero al nombre del fichero de texto que contiene el diccionario personalizado

RETORNA

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

72.1. Descripcin
La funcin vox_ttsSetDictionary() establece un diccionario personalizado para ser utilizado por el servidor de sntesis en el canal especificado, pudiendo ser modificado dinmicamente. El diccionario personalizado se aade al diccionario global usado por el servidor de sntesis para el idioma especificado. Esta funcin est obsoleta y se mantiene por compatibilidad con desarrollos antiguos. Para nuevos desarrollos, es aconsejable utilizar la funcin vox_SetDictionary. Para una mayor informacin, consulte el captulo de sntesis del habla en Verbio Software Reference: Gua del Usuario.

72.2. Descripcin de los parmetros


chdev mclang especifica el descriptor de canal vlido. especifica el idioma al que afectar el diccionario personalizado. LVX_SPANISH LVX_CATALAN filename Espaol Cataln

puntero al nombre del fichero de texto que contiene el diccionario personalizado para el idioma seleccionado.

72.3. Errores
Si la funcin retorna -1 indicando que se ha producido un error, mediante las funciones ATVOX_LASTERR() y ATVOX_ERRMSGP() obtendr el motivo del error.

72.4. Elementos relacionados


vox_ttsSetAbbreviations

72.5. Cdigos de ejemplo

106

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

Consulte el ejemplo con barge-in del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

107

Captulo 2. Descripcin de las funciones

73. vox_unloadvcb
FUNCION int vox_unloadvcb(int chdev, int vcbhandle, unsigned int mode) int chdev int vcbhandle unsigned int mode RETORNA descriptor de un canal vlido descriptor de un vocabulario o gramtica ABNF previamente cargado por compatibilidad con versiones anteriores, sese 0

>=0 indicando el descriptor del vocabulario si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

73.1. Descripcin
La funcin vox_unloadvcb() descarga un vocabulario o gramtica ABNF previamente cargado en el canal especificado. El descriptor del vocabulario se obtiene al cargarlo mediante la funcin vox_loadvcb() y tambin debe usarse para activarlo mediante la funcin vox_activatevcb() o para descactivarlo mediante la funcin vox_deactivatevcb(). Si el descriptor del vocabulario es -1, la funcin vox_unloadvcb() descarga todos los vocabularios y gramticas ABNF cargados previamente.

73.2. Descripcin de los parmetros


chdev vcbhandle mode descriptor de un canal vlido descriptor de un vocabulario o gramtica ABNF previamente cargado mediante la funcin vox_loadvcb(). por compatibilidad con versiones anteriores, sese 0

73.3. Precauciones
Si se establece el vocabulario o la gramtica activa mediante la funcin vox_setvcb() o vox_setcd(), se descargarn automticamente todos los vocabularios y gramticas cargados hasta ese momento (equivale a invocar la funcin vox_unloadvcb() con el parmetro vcbhandle fijado al valor -1).

73.4. Errores
Si la funcin retorna -1 indicando que se ha producido un error, la funcin ATVOX_LASTERR() devolver alguno de los siguientes motivos: EVX_NOMEM EVX_VCBFILE EVX_INVWORD EVX_SYSTEM OUT OF MEMORY THE VOCABULARY FILE NAME IS NOT VALID. THE VOCABULARY TRANSCRIPTION WAS OT FOUND SYSTEM ERROR. Check errno.

73.5. Elementos relacionados

108

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

vox_setvcb, vox_loadvcb, vox_loadcd, vox_activatevcb, vox_deactivatevcb, ATVOX_IVCB

73.6. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

109

Captulo 2. Descripcin de las funciones

74. vox_vsd_close
FUNCION int vox_vsd_close(int chdev, VAD_PARAM* vsddev) int chdev VAD_PARAM* vsddev RETORNA descriptor de un canal vlido descriptor de deteccin de voz vlido

0 si el resultado es satisfactorio -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

74.1. Descripcin
La funcin vox_vsd_close() cierra el desciptor de deteccin de voz abierto mediante la funcin vox_vsd_open y libera los recursos utilizados durante el proceso de deteccin de voz.

74.2. Descripcin de los parmetros


chdev vsddev especifica el descriptor de canal vlido. especifica el descriptor de deteccin de voz vlido obtenido mediante la funcin vox_vsd_open.

74.3. Elementos relacionados


vox_vsd_open, vox_vsd_write

74.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

110

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

75. vox_vsd_open
FUNCION VAD_PARAM* vox_vsd_open(int chdev, int recdev, VAD_PRM *prm, unsigned int mode) int chdev int recdev VAD_PRM *prm unsigned int mode RETORNA descriptor de un canal vlido descriptor del proceso de reconocimiento paralelo en caso de existir puntero a una estructura del tipo Voice Detection Parameter formato de las muestras (Ley A o Ley Mu) Activity

!= -1 para indicar el descriptor de deteccin de la voz -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

75.1. Descripcin
La funcin vox_vsd_open() inicializa el detector de voz en el canal especificado, de modo que est preparado para empezar a recibir las muestras de audio mediante la funcin vox_vsd_write(). El valor devuelto por la funcin es requerido por las funciones vox_vsd_write() y vox_vsd_close(). Con la finalidad de reducir el coste computacional en el servidor de reconocimiento, es una prctica aconsejable utilizar el detector de voz en la parte cliente de la aplicacin, de modo que nicamente se mandan al reconocedor muestras de voz, liberando a ste de la tarea de separar la seal de voz de la seal suprflua. Para ello, debe obtenerse previamente un descriptor de reconocimiento mediante la funcin vox_recstr_open, que ser necesario especificar como segundo parmetro de la funcin vox_vsd_open.

75.2. Descripcin de los parmetros


chdev recdev especifica el descriptor de canal vlido. en caso de lanzar un proceso de reconocimiento utilizando el VAD en el cliente, es necesario especificar el descriptor de reconocimiento obtenido mediante la funcin vox_recstr_open en este parmetro. De este modo, el servidor de reconocimiento se ver liberado de la tarea de separar la seal de voz del silencio, reducindose as el coste computacional de la parte servidora. En caso de que la estrategia de deteccin de voz no est ligada a un proceso de reconocimiento, el valor de este parmetro debe ser 0. puntero a una estructura de tipo Voice Activity Detection Structure (VAD_PRM) en la que se especifican las variables de entorno que condicionarn el comportamiento del detector de voz. Si el valor de este parmetro es NULL se utilizarn los valores por defecto de los campos de la estructura. Para ms informacin acerca de esta estructura, consulte el Captulo 3. Estructuras de datos y parmetros. especifica el formato de las muestras de audio pasadas al detector de voz. MC_ALAW MC_MULAW formato PCM (Ley A) a 8 KHz. formato PCM (Ley Mu) a 8 KHz.

prm

mode

Verbio Technologies

Referencia de las funciones del Library SDK

111

Captulo 2. Descripcin de las funciones

75.3. Precauciones
Una vez finalizado el proceso de deteccin de voz, es imprescindible invocar a la funcin vox_vsd_close para liberar los recursos de memoria utilizados durante el proceso de deteccin.

75.4. Elementos relacionados


vox_vsd_write, vox_vsd_close

75.5. Cdigos de ejemplo


Consulte el ejemplo anexo.

112

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

76. vox_vsd_write
FUNCION int vox_vsd_write(VAD_PARAM* vsddev, const void *buffer, unsigned int n) VAD_PARAM* vsddev const void *buffer unsigned int n RETORNA descriptor de deteccin de voz vlido vector en el que se encuentran las muestras de audio que debe procesar el detector de voz tamao del vector de muestras (en bytes)

estado en el que se encuentra el proceso de deteccin de voz. -1 en caso de error

INCLUDES MODO

voxlib.h sncrono

76.1. Descripcin
La funcin vox_vsd_write() enva las muestras recibidas hacia el detector de voz para ser procesadas. La funcin retorna el estado en el que se ha quedado el algoritmo de deteccin de voz despus de procesar el buffer de muestras actual. Para conocer los posibles estados y las transiciones permitidas entre ellos, consulte el Captulo 3. Estructuras de datos y parmetros. Es posible tambin especificar una funcin de callback que se ejecute al finalizar el procesado de cada bloque de muestras, instante en el cual informar del estado actual y de otros parmetros de inters. Encontrar ms detalles en la definicin del campo callback de la estructura VAD_PRM. Los parmetros tambin pueden consultarse de forma directa e individualmente mediante la funcin vox_getparm mediante los identificadores VXCH_INITSIL, VXCH_FINALSIL y VXCH_VOICE. Para ms detalles, consulte el Captulo 3. Estructuras de datos y parmetros.

76.2. Descripcin de los parmetros


vsddev buffer n especifica el descriptor de deteccin de voz vlido obtenido mediante la funcin vox_vsd_open. vector en el que se encuentran las muestras de audio que debe procesar el detector de voz. tamao del vector de muestras.

76.3. Elementos relacionados


vox_vsd_open, vox_vsd_close

76.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

113

Captulo 2. Descripcin de las funciones

77. vox_word
FUNCION const char* vox_word(int chdev, int ind) int chdev int ind descriptor de un canal vlido ndice asociado con la palabra del vocabulario o gramtica que se desea obtener

RETORNA

puntero a un vector de caracteres con el contenido de la palabra del vocabulario apuntada por el ndice (fila) especificado puntero a un vector vaco ("") si el ndice especificado no es vlido

INCLUDES MODO

voxlib.h sncrono

77.1. Descripcin
La funcin vox_word() devuelve un puntero a un vector de caracteres ASCIIZ con el contenido asociado al ndice (fila) especificado del vocabulario o gramtica activa en el canal.

77.2. Descripcin de los parmetros


chdev ind especifica el descriptor de canal vlido. ndice asociado con la palabra del vocabulario o gramtica que se desea obtener. Generalmente, los ndices de inters son aquellos devueltos por la funcin vox_recind o vox_nbest. En el caso de querer obtener toda la informacin posible ofrecida por el servidor de reconocimiento (reglas, valores, locuciones, niveles de confianza e intervalos temporales), debe utilizarse el valor IND_STREAM, en cuyo caso el vector de caracteres ASCIIZ contiene toda la informacin estructurada siguiendo el formato especificado en Seccin 5.

77.3. Elementos relacionados


vox_wordex, vox_wordrule, vox_recstr

77.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

114

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

78. vox_wordex
FUNCION const char* vox_wordex(int chdev, int ind, int pos) int chdev int ind int pos RETORNA descriptor de un canal vlido ndice asociado con la palabra del vocabulario o gramtica que se desea obtener columna del vocabulario de la que se desea obtener el contenido

puntero a un vector de caracteres con el contenido de la palabra del vocabulario apuntada por el ndice (fila) y columna especificados puntero a un vector vaco ("") si el ndice o la columna especificados no son vlidos

INCLUDES MODO

voxlib.h sncrono

78.1. Descripcin
La funcin vox_wordex() devuelve un puntero a un vector de caracteres ASCIIZ con el contenido asociado al ndice (fila) y columna especificados del vocabulario o gramtica activa en el canal .

78.2. Descripcin de los parmetros


chdev ind especifica el descriptor de canal vlido. ndice asociado con la palabra del vocabulario o gramtica que se desea obtener. Generalmente, los ndices de inters son aquellos devueltos por la funcin vox_recind o vox_nbest. En el caso de querer obtener toda la informacin posible ofrecida por el servidor de reconocimiento (reglas, valores, locuciones, niveles de confianza e intervalos temporales), debe utilizarse el valor IND_STREAM, en cuyo caso el vector de caracteres ASCIIZ contiene toda la informacin estructurada siguiendo el formato especificado en Seccin 5. columna del vocabulario de la que se desea obtener el contenido. Consulte Verbio Software Reference: Gua del usuario para ms detalles acerca del contenido de cada una de las columnas que constituyen un vocabulario.

pos

78.3. Elementos relacionados


vox_word, vox_wordrule, vox_recstr

78.4. Cdigos de ejemplo


Consulte el ejemplo anexo.

Verbio Technologies

Referencia de las funciones del Library SDK

115

Captulo 2. Descripcin de las funciones

79. vox_wordrule
FUNCION const char* vox_wordrule(int chdev, const char* rule, int pos, float * score) int chdev const char* rule int pos float* score descriptor de un canal vlido nombre de la regla de la gramtica de la que se desea obtener informacin tipo de informacin que se desea obtener de la regla ndice de confianza del resultado asociado a la regla especificada

RETORNA

NULL en caso de error array de caracteres con la informacin solicitada en caso satisfactorio

INCLUDES MODO

voxlib.h sncrono

79.1. Descripcin
La funcin vox_wordrule() permite obtener la informacin del resultado de reconocimiento desglosado para cada una de las reglas que constituyen la gramtica ABNF utilizada en el proceso de reconocimiento. Para ello, es necesario indicar el nombre de la regla del que se desea obtener la informacin y el tipo de informacin que se desea: valor, utterance o peso. El nidice de confianza (score) se devuelve en todos los casos.Consulte Verbio Software Reference: Gua del usuario para ms detalles acerca del contenido que puede devolverse para cada una de las reglas.

79.2. Descripcin de los parmetros


chdev rule especifica el descriptor de canal vlido. nombre completo de la regla del que se desea obtener la informacin. En caso de reglas de segundo nivel o superiores, debe especificarse tambin las reglas inferiores hasta llegar a la regla de inters. Por ejemplo: "regla1.subregla2.subsubregla3". especifica la informacin que devolver la funcin (junto con el ndice de confianza) 0 Valor (value) del resultado de reconocimiento 1 Locucin (utterance) del resultado de reconocimiento 2 Peso aplicado a la regla score ndice de confianza del resultado parcial asociado a la regla especificada

pos

79.3. Errores
Si la funcin retorna 0 (nulo) indicando que se ha producido un error puede ser debido a que se ha especificado un nombre de regla incorrecto (o de tipo de resultado), o a que dicha regla no ha generado ningn resultado de reconocimiento.

79.4. Elementos relacionados

116

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 2. Descripcin de las funciones

vox_word, vox_wordex

79.5. Cdigos de ejemplo


Consulte el ejemplo sncrono del Dialogic SDK.

Verbio Technologies

Referencia de las funciones del Library SDK

117

Captulo 3. Estructuras de datos y parmetros

Captulo 3. Estructuras de datos y parmetros

1. VX_RSP - Recognize String Parameter


La estructura VX_RSP incluye condiciones de terminacin y parmetros adicionales para las funciones vox_recstr() o vox_recstr_open(). El contenido (typedef) de la estructura se muestra a continuacin:
typedef struct vx_rsp { /* Maximum silence after voice detection */ int maxsil; /* Maximum initial silence (before detecting voice) */ int initsil; /* File descriptor */ int io_fhandle; /* Ignored initial samples */ int skip_samples; /* Callback function */ VX_RSP_CALLBACK callback; } VX_RSP;

donde: maxsil especifica la duracin mxima, en unidades de 10 ms, del silencio final. Una vez detectada seal de voz, la funcin vox_recstr() detiene el proceso de reconocimiento si se detecta un intervalo de silencio superior a este valor. (Valor por defecto: 20). especifica la duracin mxima, en unidades de 10 ms, del silencio inicial. Si antes de detectar seal de voz transcurre un tiempo superior al valor especificado, se detiene el proceso de reconocimiento. (Valor por defecto: 350). contiene un descriptor de fichero obtenido mediante la invocacin de la funcin fopen(). Si el valor es distinto de -1, la funcin vox_recstr() grabar la seal de entrada en este fichero. El formato de la grabacin est fijado a PCM (ley A o ley Mu), con una frecuencia de muestreo de 8 KHz y sin Control Automtico de Ganancia. (Valor por defecto: -1). nmero de muestras iniciales que sern ignoradas por el reconocedor. Es especialmente til en aquellos casos en los que las muestras proceden de un fichero de audio con cabecera, debido a la necesidad de no procesar los primeros bytes, puesto que stos pertenecen a la cabecera. (Valor por defecto: 0). funcin que ser invocada en cuanto finalice el reconocimiento. Debe seguir la sintaxis int (*VX_RSP_CALLBACK) (int);, en el que el parmetro recibido (entero) es el descriptor del canal vlido. Es especialmente til cuando se implementan funcionalidades de barge-in, tal y como se muestra en el ejemplo anexo.

initsil

io_fhandle

skip_samples

callback

Nota
Si no desea grabarse la seal de entrada, el campo io_fhandle debe tener el valor -1. Este es el valor por defecto establecido mediante la funcin vox_clrrsp().

120

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 3. Estructuras de datos y parmetros

2. VAD_PRM - Voice Activity Detection Parameters


La estructura VAD_PRM contiene los parmetros de configuracin del detector de voz de Verbio. Estos parmetros condicionarn el comportamiento del VAD durante el procesado de las muestras de audio. El contenido (typedef) de la estructura se muestra a continuacin:
typedef struct { unsigned short frame_len; unsigned short frame_step; float sil_req_ms; float voice_req_ms; float low_factor; float high_factor; float final_factor; float final_high_factor; float max_ref_factor; float min_high_thresh; float aam_min; float aam_max; int (*callback)(int state, unsigned long initsil, unsigned long finalsil, unsigned long voice); } VAD_PRM;

donde: frame_len especifica el tamao, en muestras, de cada uno de los bloques de audio en los que se fragmentar la seal entrante antes de ser procesada. A mayor tamao del bloque, menor coste computacional pero tambin menor precisin a la hora de obtenerse el instante en el que se empieza a recibir voz. Por el contrario, a menor tamao, mayor precisin incrementndose por contra el coste computacional. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 512. especifica el tamao, en muestras, de la ventana utilizada para el procesado de cada uno de los bloques en los que se ha dividido la seal de audio a analizar. Al igual que en el caso del parmetro frame_len, a mayor tamao menor precisin y coste computacional. Por el contrario, a menor tamao mayor precisin y coste computacional. El valor de este parmetro no puede ser nunca superior al de frame_len, siendo habitual que coincidan ambos valores. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 512. especifica el tiempo de silencio mnimo, en milisegundos, para determinar que se ha detectado voz en las muestras anteriores. Intervalos menores de silencio se entender que forman parte de la seal de voz previa. En funcin del uso al que vaya destinado el VAD puede usarse este valor para segmentar la seal en fragmentos de voz ms o menos amplios. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 180. especifica la duracin mnima, en milisegundos, de un segmento de voz para que el VAD la detecte como tal. De este modo, se evita que ruidos, etc. puedan ocasionar numerosas falsas alarmas. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 120. especifica un umbral a partir del cual se inicia el procesado de la seal para determinar si las muestras siguientes corresponden a voz o no. Por debajo de este umbral se considera que la seal es de silencio, de modo que en funcin del entorno (ms o menos ruidoso), la modificacin de este valor permitir ajustar la deteccin de voz de la manera ms precisa posible. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 2.5. especifica un segundo umbral (junto con low_factor) para determinar si la seal recibida es voz o no. El detector de voz requiere que se superen ambos umbrales para determinar que se ha recibido voz. Su valor debe ser siempre superior al especificado para low_factor. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 4.5. especifica el umbral que determina si, una vez detectada voz, la seal recibida a continuacin sigue siendo seal de voz o no. Si no lo es, empieza a contar el

frame_step

sil_req_ms

voice_req_ms

low_factor

high_factor

final_factor

Verbio Technologies

Referencia de las funciones del Library SDK

121

Captulo 3. Estructuras de datos y parmetros

tiempo mximo de silencio (sil_req_ms) que puede formar parte de un fragmento de voz. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 0.8. final_high_factor especifica un segundo umbral (junto con final_factor) que gestiona el fin de la deteccin de voz una vez detectada. Si, una vez detectada voz, el nivel de la seal es inferior a final_factor i no ha transcurrido el tiempo especificado por sil_req_ms, puede volverse al estado de voz siempre y cuando el nivel de la seal sea superior al valor especificado para este parmetro. Si sto ocurre, vuelve a empezar el contador de sil_req_ms. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 2.5. Uso futuro. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 0. Valor mnimo que puede tener el umbral interno que gestiona la deteccin de voz. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 500. Valor mnimo de la amplitud de la seal a analizar . Si la amplitud de la seal no supera este valor, a efectos de deteccin se trabajar con el valor mnimo para ese fragmento de sonido. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 50. Valor mximo de la amplitud de la seal a analizar . Si la amplitud de la seal supera este valor, a efectos de deteccin se trabajar con el valor mximo para ese fragmento de sonido. El valor por defecto tras la invocacin de la funcin vox_clrvad es de 200.

max_ref_factor min_high_thresh aam_min

aam_max

callback

Diagrama de flujo de los estados del detector de voz. Funcin de callback que se ejecutar cada vez que se procese un bloque de muestras (de tamao frame_len). Por defecto no se especifica ninguna funcin de callback, de modo que no se ejecutar ningn cdigo adicional tras procesarse un bloque de muestras. Los parmetros que recibir esta funcin contendrn la siguiente informacin: state estado en el que se encuentra el detector de voz en el instante actual. Los posibles valores son: VVX_INIT Estado inicial. nicamente se est en este estado antes de procesar el primer bloque de muestras. De ste estado nicamente puede pasarse al estado VVX_SILENCE y nunca

122

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 3. Estructuras de datos y parmetros

puede volverse a l. VVX_SILENCE Estado de silencio. A l se llega desde el estado inicial o bien desde el estado VVX_LOW (no se ha recibido seal de suficiente amplitud como para pasar al estado VVX_HIGH) o bien desde el estado VVX_FINAL (la duracin de seal de nivel alto no ha sido suficiente como para determinar que se ha detectado voz) o bien desde el estado VVX_VOICE (se ha recibido suficiente seal de alta amplitud como para decidir que se ha recibido voz). Es posible mantenerse en este estado durante el procesado de varios bloques de muestras consecutivos. VVX_LOW Estado de inicio de deteccin de voz. Mientras la amplitud de la seal de audio est comprendida entre los dos umbrales de decisin, el estado puede permanecer en VVX_LOW. A l se puede llegar desde el estado VVX_SILENCE (se ha recibido un bloque de muestras de amplitud intermedia) o bien desde el estado VVX_VOICE (se ha detectado voz en un bloque anterior y el siguiente ya empieza con un nivel intermedio de seal sin pasar por el estado de silencio). Es posible mantenerse en este estado durante el procesado de varios bloques de muestras consecutivos. VVX_HIGH Estado de nivel alto de energa de la seal. Si se mantiene un tiempo suficiente en este estado, se decidir que se ha recibido voz. A este estado se puede llegar desde el estado VVX_SILENCE o VVX_LOW (se ha recibido un bloque de muestras de amplitud elevada) o bien desde el estado VVX_FINAL (se ha pasado previamente por este estado pero la llegada de bloques con energa elevada provoca que se vuelva a l) o bien desde el estado VVX_VOICE (se ha detectado voz en un bloque anterior y el siguiente ya empieza con un nivel alto de

Verbio Technologies

Referencia de las funciones del Library SDK

123

Captulo 3. Estructuras de datos y parmetros

seal sin pasar por el estado de silencio ni de nivel intermedio). Es posible mantenerse en este estado durante el procesado de varios bloques de muestras consecutivos. VVX_FINAL Estado en el que se decide si ha existido voz en los bloques previos o no. A l se llega exclusivamente desde el estado VVX_HIGH. Transcurrido el tiempo de guarda, en funcin del nmero de bloques que hayan superado el umbral de nivel de seal asociado a voz, se decidir que se ha recibido voz (se pasa al estado VVX_VOICE ) o no (se pasa al estado VVX_SILENCE). Es posible mantenerse en este estado durante el procesado de varios bloques de muestras consecutivos. VVX_VOICE Estado al que se llega cuando se decide que en los bloques previos de seal haba muestras de voz. A este estado nicamente puede llegarse desde el estado VVX_FINAL.

initsil finalsil voice

cantidad de muestras (de silencio) acumuladas desde el inicio de la locucin sin que se haya detectado voz. cantidad de muestras (se silencio) acumuladas desde que se proces la ltima trama de voz. nmero de fragmentos de la locucin que contienen muestras de voz. Cuanto mayor sea el silencio final exigido para dar por finalizado un fragmento de voz, menor nmero de fragmentos deberan aparecer.

Nota
Es imprescindible invocar a la funcin vox_clrvad para inicializar toda variable del tipo VAD_PRM.

124

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 3. Estructuras de datos y parmetros

3. MODEATTRIBUTES - SAPI Speaker Id


La estructura MODEATTRIBUTES es utilizada para especificar las caractersticas deseadas para un locutor SAPI. Pretende ser un medio ms directo que la estructura TTSMODEINFO (Text-to-Speech Information) definida en el estandar SAPI. En http://www.microsoft.com/speech podr obtener ms informacin acerca de esta estructura y del estndar SAPI. Verbio intentar encontrar al locutor que mejor se adapte a las especificaciones, no siendo necesario, por lo tanto, rellenarlas todas, aunque la bsqueda ser ms precisa cuanto ms se detallen las caractersticas del locutor deseado. El contenido (typedef) de la estructura se muestra a continuacin:
typedef struct { char age[SAPI_AGE_SIZE]; char gender[SAPI_GENDER_SIZE]; unsigned short int language; char name[SAPI_NAME_SIZE]; char vendor[SAPI_VENDOR_SIZE]; } MODEATTRIBUTES, *PMODEATTRIBUTES; //Child, Teen, Adult, Senior //Male, Female

donde: age especifica la edad del locutor deseado. Las posibilidades son: Child Teen Adult Senior gender Infantil Adolescente Adulto Tercera edad

especifica el sexo del locutor deseado. Las posibilidades son: Male Female Masculino Femenino

language name vendor

identificador anlogo al del campo language.LanguageID de la estructura TTSMODEINFO, que especifica el idioma (y dialecto en algunos casos) del locutor deseado. nombre bajo el que se registra el locutor deseado. Suele ser la manera ms directa de hacer referencia a un locutor. nombre de la empresa que ha desarrollado el locutor deseado.

Verbio Technologies

Referencia de las funciones del Library SDK

125

Captulo 3. Estructuras de datos y parmetros

4. Definicin de parmetros para vox_getparm() y vox_setparm()


El fichero voxlib.h contiene los parmetros que pueden ser consultados y modificados mediante las funciones vox_getparm() y vox_setparm() respectivamente. Existen parmetros globales (independientes del canal) y parmetros dependientes del canal.

Tabla 3.1. Parmetros globales en el Library SDK


Define Tipo Lectura(R)/ Escritura(R) VXGB_RECSTRLIC int R Licencias de reconocimiento disponibles, i.e., nmero mximo de llamadas simultneas a las funciones vox_recstr() o vox_recstr_open(). Licencias de sntesis disponibles, i.e., nmero mximo de llamadas simultneas a la funcin vox_playstr(). Tipo de licencias, i.e., disponibilidad de idiomas adicionales, Lite (prestaciones limitadas) o versiones de evaluacin. Frecuencia de muestreo a la que trabaja el motor de reconocimiento. Gestin de la amplitud mxima permitida para seal de voz. Condiciona el comportamiento del detector de voz (VAD) del motor de reconocimiento. Gestin de la amplitud mnima permitida para seal de voz. Condiciona el comportamiento del detector de voz (VAD) del motor de reconocimiento. Para entornos ruidosos, es necesario incrementar el valor de este parmetro para que el ruido de fondo no se confunda por seal de voz. El valor de este parmetro no podr nunca superar el especificado mediante el parmetro VXGB_VSDMAXREF. Intervalo de guarda (en segundos) entre las comunicaciones cliente-servidor. Transcurrido este intervalo, se produce un error para indicar que la comunicacin entre el cliente y el servidor se ha perdido. En la fase de depuracin es conveniente poner este valor a -1 para evitar que se produzca un error al ejecutarse la aplicacin paso a paso. Nombre o direccin IP del equipo en el que est operativo el servidor de sntesis y/o reconocimiento al que se conecta el Defecto Descripcin

VXGB_PLAYSTRLIC

int

VXGB_LICMODE

int

VXGB_RECSAMPFREQ

float

VXGB_VSDMAXREF

float

R/W

200

VXGB_VSDMINREF

float

R/W

50

VXGB_NETTIMEOUT

int

R/W

VXGB_DEFSERVER

char*

R/W

"127.0.0.1"

126

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 3. Estructuras de datos y parmetros

Define

Tipo

Lectura(R)/ Escritura(R)

Defecto

Descripcin

cliente. Es necesario especificarlo antes de invocar a la funcin vox_libinit o vox_asr_init o vox_tts_init. VXGB_LOCALADDR char* R Nombre o direccin IP del equipo en el que est ejecutndose el cliente. Listado de todos los locutores disponibles junto con sus caractersticas principales. El formato del vector de caracteres obtenido es el siguiente (contiene informacin de todos los locutores encontrados sin espacios intermedios): Identificador: Nombre: Sexo: Edad: Idioma; Identificador2: Nombre2: Sexo2: Edad2: Idioma2; ... Habilita (1) o deshabilita (0) la grabacin de todas las locuciones enviadas al reconocedor junto con los resultados de reconocimiento asociados. Es especialmente ltil en la fase de pruebas para poder evaluar la calidad de reconocimiento y actuar, si cabe, sobre las gramticas o los dilogos para mejorar el rendimiento. Directorio en el que se almacenarn las locuciones y los resultados de reconocimiento si se ha habilitado el parmetro VXGB_TUNNING_ACT. Especifica el modelo estadstico que ser utilizado por la aplicacin. Para ello, el valor del parmetro debe ser el nombre de la arquitectura que contiene los modelos deseados. Para ms detalles acerca de cmo utilizar el reconocimiento basado en modelos estadsticos, consulte los ejemplos o contacte con support@verbio.com. Permite obtener el listado de locutores disponibles en el motor de sntesis para ser utilizados desde la aplicacin. Esta funcin devuelve los cdigos internos de los locutores, separados por comas. Los cdigos internos de los locutores siguen la siguiente nomenclatura: languageNAME (identificador de idioma en minscula seguido de dos letras maysculas que identifican al locutor). Para obtener un listado completo de los identificadores de idioma (de 2 o 5 caracteres), consulte la funcin vox_tts_init y el fichero

VXGB_TTSSPKINFO

char*

VXGB_TUNNING_ACT

int

R/W

VXGB_TUNNING_DIR

char*

R/W

""

VXGB_VVI_ARQ

char*

VXGB_START_SPK

char*

Verbio Technologies

Referencia de las funciones del Library SDK

127

Captulo 3. Estructuras de datos y parmetros

Define

Tipo

Lectura(R)/ Escritura(R)

Defecto

Descripcin

voxlib.h. VXGB_START_CONF char* R Permite obtener el listado de configuraciones de reconocimiento disponibles en el motor de reconocimiento para ser utilizados desde la aplicacin. Esta funcin devuelve los cdigos internos de las configuraciones, separados por comas. Los cdigos internos de las configuraciones siguen la siguiente nomenclatura: LANGUAGE (para configuraciones monolinges) o LANGUAGE-LANGUAGE.... LANGUAGE (para configuraciones multilinges). Para obtener un listado completo de los identificadores de idioma (de 2 o 5 caracteres), consulte la funcin vox_asr_init y el fichero voxlib.h. Permite obtener el listado arquitecturas que contienen modelos estadsticos (SLM) disponibles para ser utilizadas desde el motor de reconocimiento estadstico. El listado contiene cada uno de los identificadores de las arquitecturas, separados por comas. El nombre de las arquitecturas es fijado por el integrador durante la construccin de los modelos estadsticos. Para ms detalles acerca de cmo utilizar el reconocimiento basado en modelos estadsticos, consulte los ejemplos o contacte con support@verbio.com. Permite obtener el listado de modelos estadsticos (SLM) disponibles dentro de la arquitectura cargada para ser utilizadas desde el motor de reconocimiento estadstico. El listado contiene cada uno de los identificadores de los modelos estadsticos, separados por comas. El nombre de los modelos es fijado por el integrador durante la construccin de los mismos. Para ms detalles acerca de cmo utilizar el reconocimiento basado en modelos estadsticos, consulte los ejemplos o contacte con support@verbio.com. Permite definir la longitud mxima de la respuesta ante un proceso de reconocimiento. El valor son la cantidad de unidades de 20ms permitidas a lo largo de todo el proceso, de modo que, con el valor por defecto, la longitud

VXGB_START_VIT

char*

VXGB_START_SLM

char*

VXGB_MAXFRAMES

int

2500

128

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 3. Estructuras de datos y parmetros

Define

Tipo

Lectura(R)/ Escritura(R)

Defecto

Descripcin

mxima de audio (antes de lanzar un nuevo reconocimiento) que puede procesarse es de 50 segundos. El valor de este parmetro es un entero, de modo que no debe ser superior a 32767.

Tabla 3.2. Parmetros de canal en el Library SDK


Define Tipo Lectura(R)/ Escritura(R) VXCH_NBEST int R/W 1 Nmero mximo de hiptesis generadas por las funciones de reconocimiento vox_recstr() y vox_recstr_open(). Es muy importante tener en cuenta que una modificacin de este parmetro implica tener que volver a cargar y activar todos los vocabularios y gramtica previamente activos. Por lo tanto, es aconsejable fijar este valor desde un principio al valor mximo de hiptesis que vayan a requerirse durante el funcionamiento de toda la aplicacin y, segn las necesidades de cada momento, ir solicitando ms o menos hiptesis mediante la modificacin del parmetro VXCH_ACTIVE_NBEST. Nmero de hiptesis generadas por las funciones de reconocimiento vox_recstr() y vox_recstr_open(). A diferencia del parmetro VXCH_NBEST, la modificacin de este parmetro no afecta a los vocabularios y gramticas activos, sino nicamente a la cantidad de hiptesis devueltas por los mismos. S hay que tener en cuenta, sin embargo, que nunca se podrn solicitar ms hiptesis mediante este parmetro que las especificadas mediante el parmetro VXCH_NBEST. Frecuencia de muestreo a la que trabaja el motor de sntesis. Velocidad de la conversin de texto a voz en palabras por minuto. El valor por defecto depende de cada locutor. Nombre del locutor de sntesis activo. El valor inicial depender de cmo se haya configurado el servidor de sntesis mediante el Verbio Server Defecto Descripcin

VXCH_ACTIVE_NBEST

int

R/W

VXCH_TTSFREQUENCY

int

VXCH_TTSSPEED

int

R/W

VXCH_TTSSPKNAME

char*

R/W

Verbio Technologies

Referencia de las funciones del Library SDK

129

Captulo 3. Estructuras de datos y parmetros

Define

Tipo

Lectura(R)/ Escritura(R)

Defecto

Descripcin

Configuration Manager. Este mismo configurador permite ver el nombre de los locutores asociados a cada uno de los idiomas disponibles. VXCH_TTSLNG int R/W Especifica el idioma de sntesis mediante una constante (vase voxlib.h) que se usar en el prximo proceso de conversin de texto a habla. Se mantiene por compatibilidad con versiones anteriores. Para nuevos desarrollos debera utilizarse el parmetro VXCH_DEFTTSLANG. El valor inicial depender de cmo se haya configurado el servidor de sntesis mediante el Verbio Server Configuration Manager. Especifica el idioma de sntesis en formato texto (vase voxlib.h) que se usar en el prximo proceso de conversin de texto a habla. En nuevos desarrollos es la opcin recomendada frente al obsoleto VXCH_TTSLNG. El valor inicial depender de cmo se haya configurado el servidor de sntesis mediante el Verbio Server Configuration Manager. Tono medio de la voz sintetizada. Las voces femeninas tienen un tono superior que el de las voces masculinas. El valor por defecto depende del locutor. Volumen de la voz sintetizada. La amplitud se amplifica proporcionalmente a la relacin entre el nuevo valor y el valor por defecto. Por lo tanto, la estrategia recomendada consiste en consultar el valor actual del locutor, manipular el valor proporcionalmente para obtener el volumen deseado y fijarlo posteriormente. Se desaconseja pues fijar un valor aleatorio sin conocer el valor actual de funcionamiento. Configuracin de reconocimiento por defecto que se utilizar en cualquier proceso de reconocimiento hasta que se especifique lo contrario. El valor inicial depender de cmo se haya configurado el servidor de reconocimiento mediante el Verbio Server Configuration Manager. Idioma por defecto que usarn las funciones vox_prevcb() y

VXCH_DEFTTSLANG

char*

R/W

VXCH_TTSPITCH

int

R/W

VXCH_TTSVOLUME

int

R/W

VXCH_DEFASRCFG

char*

R/W

VXCH_DEFASRLNG

char*

R/W

130

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 3. Estructuras de datos y parmetros

Define

Tipo

Lectura(R)/ Escritura(R)

Defecto

Descripcin

vox_prevcbex() para procesar los ficheros de vocabulario. El valor inicial depender de cmo se haya configurado el servidor de reconocimiento mediante el Verbio Server Configuration Manager. VXCH_SERVER char* R Servidor de sntesis y/o reconocimiento al que se conecta el canal (nombre o IP del equipo). El valor por defecto depende del parmetro VXGB_DEFSERVER, aunque puede modificarse con posterioridad para que cada lnea pueda especificar su propio servidor. Indica si se ha detectado voz durante el proceso de reconocimiento (el valor devuelto en el parmatro es 1). Tpicamente la consulta de este parmetro se realiza entre llamadas sucesivas a la funcin vox_recstr_write() para conocer el momento en el que el usuario ha empezado a hablar, de modo que puedan aplicarse, por ejemplo, estrategias de Barge-in. Parmetro utilizado para calcular la penalizacin que sufre una palabra a la hora de poder ser reconocida. A mayor penalizacin, ms dificultad para que la palabra forme parte de la cadena reconocida. La penalizacin es una funcin de tres parmetros: el peso de cada palabra especificado en la gramtica (si no se especifica ninguno es 1), el valor de este parmetro y el valor de VXCH_GRMCONSTANT. El valor especificado en este parmetro debe utilizarse cuando se quiera acentuar la diferencia entre los pesos de las palabras, puesto que la penalizacin es proporcional a su valor y al peso de las palabras. VXCH_GRMCONSTANT float R/W 0 Parmetro utilizado para calcular la penalizacin que sufre una palabra a la hora de poder ser reconocida. A mayor penalizacin, ms dificultad para que la palabra forme parte de la cadena reconocida. La penalizacin es una funcin de tres parmetros: el peso de cada palabra especificado en la gramtica (si no se especifica ninguno es 1), el valor de este parmetro y el valor de VXCH_GRMWEIGHT.

VXCH_VOICEDETECTED

int

VXCH_GRMWEIGHT

float

R/W

Verbio Technologies

Referencia de las funciones del Library SDK

131

Captulo 3. Estructuras de datos y parmetros

Define

Tipo

Lectura(R)/ Escritura(R)

Defecto

Descripcin

El valor de este parmetro puede utilizarse para reducir la aparicin de inserciones (aunmentar el valor reduce la cantidad de palabras devueltas por el reconocedor) o bien para priorizar las palabras largas respecto a las ms breves. VXCH_INITSIL int R cantidad de muestras (de silencio) acumuladas desde el inicio de la locucin sin que se haya detectado voz, siempre y cuando se estn utilizando las funciones de deteccin de actividad vocal vox_vsd_open, vox_vsd_write y vox_vsd_close cantidad de muestras (de silencio) acumuladas desde que se proces la ltima trama de voz, siempre y cuando se estn utilizando las funciones de deteccin de actividad vocal vox_vsd_open, vox_vsd_write y vox_vsd_close nmero de fragmentos de la locucin que contienen muestras de voz. Cuanto mayor sea el silencio final exigido para dar por finalizado un fragmento de voz, menor nmero de fragmentos deberan aparecer. Para que esta informacin est disponible, deben utilizarse las funciones de deteccin de actividad vocal vox_vsd_open, vox_vsd_write y vox_vsd_close permite deshabilitar una regla de una gramtica o de todas las gramticas activas en un momento determinado. De este modo, en entornos en los que se parta de una gramtica compleja que, en base al dilogo, pueda irse acotando, no es necesario desglosarla en gramticas ms sencillas a medida que el usuario navega las opciones, sino que pueden irse desactivando aquellas reglas que ya no aplican en la siguiente posible respuesta. Con ello se mejora la rapidez y la calidad del reconocimiento sin apenas coste computacional, puesto que no hay que descargar ni cargar nuevas gramticas. El valor del parmetro debe ser el nombre de la regla de la gramtica ABNF que debe desactivarse. En caso de que ese nombre pueda estar presentes en otras gramticas activas en ese instante, puede especificarse el identificador de la gramtica de inters mediante el

VXCH_FINALSIL

int

VXCH_VOICE

int

VXCH_DEACTWORD

char*

132

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 3. Estructuras de datos y parmetros

Define

Tipo

Lectura(R)/ Escritura(R)

Defecto

Descripcin

siguiente formato: nombre_regla#identificador, donde identificador es el valor devuelto por la funcin vox_setvcb o vox_activatevcb. Si se desea desactivar esa regla en todas las gramticas activas que la contengas, el parmetro debe contener nicamente el nombre de la regla. VXCH_ACTWORD char* W permite habilitar de nuevo una regla de una gramtica o de todas las gramticas activas en un momento determinado que hubiera sido desactivada, previamente, mediante VXCH_DEACTWORD. El formato del parmetro debe ser idntico al especificado en la descripcin de VXCH_DEACTWORD. Valor que regula el nivel de poda del motor de reconocimiento. Cuanto mayor es el valor, menos descartes realiza el motor de reconocimiento, por lo que puede afinarse algo ms el resultado de reconocimiento, aunque a costa de un incremento sustancial del coste computacional. No se aconseja modificar el valor de este parmetro, salvo consejo del personal de Verbio. Permite consultar los milisegundos de voz (excludo el silencio) que se han recibido en el anterior proceso de reconocimiento. Permite consultar los milisegundos de audio que se han recibido en el anterior proceso de reconocimiento.

VXCH_MINTHRESHOLD

float

R/W

55

VXCH_MSSPEECH

int

VXCH_RECSAMPLES

int

Verbio Technologies

Referencia de las funciones del Library SDK

133

Captulo 3. Estructuras de datos y parmetros

5. Obtencin de informacin adicional mediante vox_word o vox_wordex


El servidor de reconocimiento, a parte de la palabra o palabras reconocidas y del nivel de confianza de las mismas, puede proporcionar ms datos que pueden resultar de inters en algunos casos: reglas, valores , locuciones, niveles de confianza y tiempos. Antes de proceder con la explicacin de cada uno de estos elementos, es importante que el lector se familiarice con los aspectos relacionados con los vocabularios convencionales y las gramticas ABNF, que encontrar detallados en Verbio Software Reference: Gua del usuario. A continuacin se dar una explicacin del significado de cada uno de estos campos para poder hacer uso de ellos en caso de considerarse necesario.

Tabla 3.3. Elementos de un vocabulario o gramtica ABNF


Elemento Regla Descripcin En vocabularios convencionales no se especifica explcitamente, de modo que se le asignar siempre el valor root. En gramticas ABNF las reglas ayudan a disear, compartir y clarificar el contenido de las mismas. En el ejemplo siguiente, existen 3 reglas: color (regla principal), rgb y comp. Valor Los valores son los items que devuelve el servidor como resultado del reconocimiento. En vocabularios convencionales suele ser el contenido de la primera columna. En el ejemplo inferior, alguno de los posibles valores devueltos son: Comercial o Tcnico. En gramticas ABNF los valores se especifican entre llaves si difieren de la palabra del vocabulario. En el ejemplo siguiente, alguno de los posibles valores devueltos son: COLOR=R o color pero no rojo porque se le ha asociado explcitamente el valor COLOR=R. Locucin Las locuciones se corresponden con lo que el usuario realmente ha dicho. En vocabularios convencionales suele ser el contenido de la segunda columna (si slo hay una columna, valor y locucin coinciden). En el ejemplo inferior, alguna de las posibles locuciones devueltas son: Eduardo Campillo o Asuncin Chinea. En gramticas ABNF son el texto que no tenga asociado ningn valor vaco {}. En el ejemplo siguiente, alguna de las posibles locuciones devueltas son: rojo o color pero no COLOR=R (se ha especificado como valor) ni por favor (se le ha asociado el valor vaco {}). Confianza El nivel de confianza es un valor numrico que indica el grado de fiabilidad que se le da al resultado. A mayor valor, mayor probabilidad de que la secuencia reconocida sea la correcta. El intervalo de tiempo en el que se ha pronunciado la locucin es otro de los datos ofrecidos por el servidor de reconocimiento. Concretamente, proporciona el instante de inicio y el instante de finalizacin de la locucin.

Intervalo

El formato del vector de caracteres ASCIIZ devuelto por las funciones vox_word() o vox_wordex es el siguiente: regla:"locucin"(confianza,instante_inicial,instante_final)["valor1" "valor2" "..."] En caso de no tratarse de una gramtica ABNF, el nombre de la regla ser root. En caso de tratarse de una gramtica ABNF con subreglas (no nicamente una regla principal), el formato del vector de caracteres tendr

134

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 3. Estructuras de datos y parmetros un formato parecido al siguiente, en el que cada regla termina en ";" y cada subregla est contenida entre llaves "{}", y en el que debe sustituirse "regla" por todo el texto asociado a cada regla (segn se ha especificado en el prrafo anterior). regla_principal{regla1{regla1_1;regla1_2;};regla2;regla3{regla3_1{regla3_1_1;};};}; La gramtica ABNF asociada al ejemplo anterior podra ser parecida a:
#ABNF 1.0 ISO8859-1; root regla_principal = ... $regla1 ... $regla2 ... $regla3; $regla1 = ... $regla1_1 ... $regla1_2 ...; $regla1_1 = ... ; $regla1_2 = ... ; $regla2 = ... ; $regla3 = ... $regla3_1 ... ; $regla3_1 = ... $regla3_1_1 ... ; $regla3_1_1 = ... ;

Vocabulario convencional.
Comercial Comercial Tcnico Administracin Administracin Tcnico Eduardo Campillo Asuncin Chinea Marta Cuenca Emilio Doblado Guillermo Estrada Sergio Galndez

Gramtica ABNF de mltiples reglas.


#ABNF 1.0 ISO8859-1; $rgb = rojo {COLOR=R} | verde {COLOR=G} | azul {COLOR=B}; $comp = marino {COMP=D} | osuro {COMP=D} | claro {COMP=L}; root $color = [color | "el color" | el] $rgb [$comp] ["por favor"{}]; // se utiliza la palabra "rojo" y devuelve la palabra COLOR=R // se utiliza la palabra "verde" y devuelve la palabra COLOR=G // se utiliza la palabra "verde" y devuelve la palabra COLOR=G

Ejemplo 3.1. Informacin devuelta por el servidor de reconocimiento


Locucin dictada: "Eduardo Campillo"

root:"Eduardo Campillo"(158.29,0.50,1.28)["Eduardo Campillo"];

Locucin dictada: "El color rojo por favor"

color:"el color rojo"(127.59,0.26,1.00)["el color" "COLOR=R"]{rgb:"rojo"(168.40,0.76,1.00)["COLOR=R"];comp:;};

Locucin dictada: "El azul marino"

color:"el azul marino"(185.46,0.56,1.37)["el" "COLOR=B" "COMP=D"]{rgb:"azul"(93.27,0.76,1.00)["COLOR=B"]; comp:"marino"(318.19,1.00,1.37)["COMP=D"];};

Verbio Technologies

Referencia de las funciones del Library SDK

135

Captulo 4. Cdigo de ejemplos en C/C++


Nota
El Apndice A contiene los ficheros de vocabularios, gramticas y diccionarios utilizados en los ejemplos de esta seccin.

Captulo 4. Cdigo de ejemplos en C/C++

1. Ejemplo Sncrono
Ejemplo 4.1. Ejemplo sncrono de Verbio Library
/****************************************************************************** * DESCRIPTION: Verbio Synchronous Sample * Copyright (C) 2009 Verbio Technologies * *******************************************************************************/ #include <stdio.h> #include <string.h> #include <sys/types.h> #include <sys/stat.h> #include "voxlib.h" #define #define #define #define #define #define #define #define MAXINDEX MAXFILENAME MAXTEXT CODER SETMODE NEWLINE BUFFER_SIZE AUDIO_BUFFER_SIZE 1024 32 160 1024 MC_MULAW /* MC_ALAW o MC_MULAW o MC_LIN16 */ GVX_ISOLATED /* GVX_CONNECTED o GVX_ISOLATED */ '\n' 2048

const char* Path = ""; const char* RecExt = ".esu"; const char* server = NULL; static int RecStr(int dev, const char *filename, int maxsil); static void vox_error(const char *function, int chdev); static FILE *fplog = NULL; int nextfile(FILE *fp, char *rec, char *vcb) { char text[MAXTEXT], *p; int ncols = 0; strcpy(rec,""); strcpy(vcb,""); if (fgets(text, MAXTEXT, fp) != NULL) { if ((p = strchr(text, NEWLINE)) != NULL) *p = '\0'; /* Remove comments */ if ((p = strchr(text, ';')) != NULL) *p = '\0'; /* First column */ if ((p = strchr(text, '\t')) != NULL) { *p = '\0'; strcpy(rec, text); strcpy(text, p+1); } else { strcpy(rec, text); strcpy(text, ""); } ncols++; /* Second column */ if ((p = strchr(text, '\t')) != NULL) *p = '\0'; if (strlen(text) > 0) { strcpy(vcb, text); ncols++; } } return ncols; } int main(int argc, char *argv[]) { int dev = 0, connected = 0, playdev = -1; int i, n, nind, ncols, mode, error, hHELP; int index[MAXINDEX+1]; float score[MAXINDEX+1]; char RecFileName[MAXFILENAME]; char PathRecFileName[MAXFILENAME]; char Text[MAXTEXT]; char *VcbFileName = "vdemo.txt"; char *ListOfFiles = "vdemo.gui"; char *LogFileName = "vdemo.dat"; const char* deflng = LNG_SPANISH; const char* configuration = CFG_SPANISH_CATALAN; unsigned long dwfilever, dwprodver; short buffer_in[AUDIO_BUFFER_SIZE]; FILE *fp = NULL; int retv = 0; int nASR = 0, nTTS = 0; int volume = 0; int speed = 0; int pitch = 0;

138

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 4. Cdigo de ejemplos en C/C++

#ifdef _DEBUG int timeout = -1; #endif if (argc > 1) VcbFileName = argv[1]; if (argc > 2) ListOfFiles = argv[2]; if (argc > 3) LogFileName = argv[3]; if (argc > 4) deflng = argv[4]; if (argc > 5) configuration = argv[5]; if (argc > 6) server = argv[6]; if ((fplog = fopen(LogFileName, "wt")) == NULL) return 1; do { #ifdef _DEBUG vox_setparm(-1, VXGB_NETTIMEOUT, &timeout); #endif if (server) vox_setparm(-1, VXGB_DEFSERVER, server); connected = vox_asr_init(configuration, deflng); if (connected >= 0) connected = vox_tts_init(0, deflng); } while (connected < 0); // Get Verbio Product Version and Serial Number vox_GetDllVersion(&dwfilever, &dwprodver); printf("SAMPLE. Verbio %d.%02d, S/N: %s\n\n", HIWORD(dwprodver), LOWORD(dwprodver), vox_SerialNumber()); // Get number of licenses for vox_recstr nASR = vox_getasrlic(CFG_SPANISH); printf(" * ASR licenses: %2d\n", nASR); // Get number of licenses for vox_playstr nTTS = vox_getttslic(LNG_SPANISH); printf(" * TTS licenses: %2d\n\n", nTTS); vox_getparm(-1, VXGB_LICMODE, &mode); if (mode & LIC_ASR_CATALAN) printf(" * ASR Catalan : Yes\n"); else printf(" * ASR Catalan : No\n"); if (mode & LIC_TTS_CATALAN) printf(" * TTS Catalan : Yes\n"); else printf(" * TTS Catalan : No\n"); if (mode & LIC_EVALUATION) printf(" * Evaluation\n"); if (mode & LIC_LITE) printf(" * Lite\n"); if (nTTS) { // Get volume vox_getparm(dev, VXCH_TTSVOLUME, &volume); printf("TTSVOLUME = %d\n", volume); // Get speed vox_getparm(dev, VXCH_TTSSPEED, &speed); printf("TTSSPEED = %d\n", speed); // Get pitch vox_getparm(dev, VXCH_TTSPITCH, &pitch); printf("TTSPITCH = %d\n", pitch); } if (nASR) { if (vox_reccfg_wait(dev, 500, CFG_SPANISH_CATALAN)) { vox_error("vox_reccfg_wait", dev); retv = ATVOX_LASTERR(dev); goto error; } if (vox_getusedasrlic() <= 0) { goto error; } if (vox_recstr_wait(dev, 500)) { vox_error("vox_recstr_wait", dev); retv = ATVOX_LASTERR(dev); goto error; } if (vox_prevcbex("comandos.txt", 0, &error) < 0) { vox_error("vox_prevcbex", dev); retv = error;

Verbio Technologies

Referencia de las funciones del Library SDK

139

Captulo 4. Cdigo de ejemplos en C/C++

goto error; } if (vox_prevcb(VcbFileName, 0) == -1) { vox_error("vox_prevcb", dev); retv = ATVOX_LASTERR(-1); goto error; } if (vox_unloadvcb(dev, -1, 0) < 0) { vox_error("vox_unloadvcb", dev); retv = ATVOX_LASTERR(-1); goto error; } if (vox_setvcb(dev, VcbFileName, SETMODE) < 0) { vox_error("vox_setvcb", dev); retv = ATVOX_LASTERR(dev); goto error; } if ((hHELP = vox_loadvcb(dev, "comandos.txt", GVX_ISOLATED)) < 0) { vox_error("vox_loadvcb", dev); retv = ATVOX_LASTERR(dev); goto error; } if (vox_activatevcb(dev, hHELP, 0) < 0) { vox_error("vox_activatevcb", dev); retv = ATVOX_LASTERR(dev); goto error; } } if ((fp = fopen(ListOfFiles, "rt")) == NULL) { retv = 2; goto error; } strcpy(Text, ""); while ((ncols = nextfile(fp, RecFileName, Text)) != 0) { printf("%s", Text); fprintf(fplog, "%s", RecFileName); fprintf(fplog, "\t%s", VcbFileName); fprintf(fplog, "\t%s", Text); strcpy(PathRecFileName, Path); strcat(PathRecFileName, RecFileName); strcat(PathRecFileName, RecExt); if (RecStr(dev, PathRecFileName, 100) < 0) continue; if ((nind = vox_recind(dev, MAXINDEX, index, score, 0)) < 0) { vox_error("vox_recind", dev); continue; } fprintf(fplog, "\t%d", nind); strcpy(Text, ""); if (nind == 0) { printf("\t%s", vox_word(dev, index[0])); fprintf(fplog, "\t%s", vox_word(dev, index[0])); } else { for (i=0; i<nind; i++) { printf("\t%s\t(%d)", vox_word(dev, index[i]), (int) score[i]); fprintf(fplog, "\t%s\t(%d)", vox_word(dev, index[i]), (int) score[i]); strcat(Text, vox_wordex(dev, index[i], 0)); strcat(Text, " "); } if (ATVOX_IVCB(dev) != hHELP) { if (vox_getusedttslic() <= 0) continue; if (vox_playstr_wait(dev, 500)) { vox_error("vox_playstr_wait", dev); continue; } strcpy(PathRecFileName, strcat(PathRecFileName, strcat(PathRecFileName, strcat(PathRecFileName, Path); RecFileName); "REC"); RecExt);

140

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 4. Cdigo de ejemplos en C/C++

vox_playstr(dev, PathRecFileName, Text, CODER); if ((playdev = vox_playstr_open(dev, Text, CODER)) < 0) { vox_error("vox_playstr_open", dev); continue; } do { n = vox_playstr_read(playdev, buffer_in, AUDIO_BUFFER_SIZE); if (n > 0) { //TODO: Process audio samples stored in buffer_in: //1. Send to a CTI board channel //2. Send to a PC sound card //3. Store in a file //4. Send to any audio device } } while (n == AUDIO_BUFFER_SIZE); if (vox_playstr_close(dev, playdev) < 0) { vox_error("vox_playstr_close", dev); continue; } if (vox_playstr_release(dev)) { vox_error("vox_playstr_release", dev); continue; } } } printf("\n"); fprintf(fplog, "\n"); } if (fp) fclose(fp); if (fplog) fclose(fplog); error: vox_recstr_release(dev); vox_deactivatevcb(dev, hHELP, 0); vox_setvcb(dev, NULL, 0); vox_reccfg_release(dev, CFG_SPANISH_CATALAN); vox_srvclose(server); vox_libclose(); return retv; } #ifdef _MEM int RecStr(int dev, const char *filename, int maxsil) { int retv, nsamples; VX_RSP rsp; unsigned char *mem; struct _stat buf; FILE *fp; vox_clrrsp(&rsp); rsp.maxsil = maxsil; rsp.skip_samples = 0; if (_stat(filename, &buf)) return -1; mem = malloc(buf.st_size); fp = fopen(filename, "rb"); nsamples = fread(mem, sizeof(char), buf.st_size, fp); fclose(fp); if ((retv = vox_recstrm(dev, mem, nsamples, &rsp, CODER)) < 0) { vox_error("vox_recstr", dev); printf("%s\n", filename); getchar(); } free(mem); return retv; } #else int my_recstr(int chdev, const char *fileName, VX_RSP *rspp, unsigned int mode) { int retv = 0; int recdev, n; FILE *fp; char buffer[BUFFER_SIZE]; if ((fp = fopen(fileName, "rb")) == NULL)

Verbio Technologies

Referencia de las funciones del Library SDK

141

Captulo 4. Cdigo de ejemplos en C/C++

return -1; if ((recdev = vox_recstr_open(chdev, rspp, mode)) == -1) { fclose(fp); return -1; } do { n = fread(buffer, 1, BUFFER_SIZE, fp); if (n>0) n = vox_recstr_write(recdev, buffer, n); } while (n == BUFFER_SIZE); fclose(fp); retv = vox_recstr_close(chdev, recdev); return retv; } int RecStr(int dev, const char *filename, int maxsil) { int retv; VX_RSP rsp; vox_clrrsp(&rsp); rsp.maxsil = maxsil; if ((retv = my_recstr(dev, filename, &rsp, CODER)) < 0) { vox_error("my_recstr", dev); printf("%s\n", filename); getchar(); } return retv; } #endif void vox_error(const char *function, int dev) { printf("*** ERROR: %s failed. %s ***\n", function, ATVOX_ERRMSGP(dev)); fprintf(fplog, "*** ERROR: %s failed. %s ***\n", function, ATVOX_ERRMSGP(dev)); }

142

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 4. Cdigo de ejemplos en C/C++

2. Ejemplo de Deteccin de voz y de tonos DTMF


Ejemplo 4.2. Ejemplo de Deteccin de voz y de tonos DTMF
Este fragmento de cdigo pretende ilustrar un posible uso del detector de voz y de DTMF. En l, nicamente se mandan muestras al reconocedor cuando se ha detectado algo de seal, evitando que el servidor de reconocimiento malgaste recursos rechazando la parte de silencio inicial. Por simplicidad, se ha omitido la comprobacin de errores.
#define BUFFER_SIZE 512 int chdev = 0, retv = 0, state = 0; int recdev, vsddev, dtmfdev, n; int mode = MC_MULAW; char buffer[BUFFER_SIZE]; const char *dtmf, *result; bool bVoice = false; FILE *fp = 0; VX_RSP rsp; vox_clrrsp(&rsp); rsp.maxsil = 1500; VAD_PRM prm; vox_clrvad(&prm); prm.frame_len = BUFFER_SIZE; prm.frame_step = BUFFER_SIZE; fp = fopen(fileName, "rb"); recdev = vox_recstr_open(chdev, &rsp, mode); vsddev = vox_vsd_open(chdev, recdev, &prm, mode); dtmfdev = vox_dtmf_open(chdev, mode); do { n = fread(buffer, 1, BUFFER_SIZE, fp); dtmf = vox_dtmf_write(dtmfdev, buffer, n); if (dtmf) { printf("DTMF tone %s received\n", dtmf);

if ((result = vox_dtmf_word(chdev, dtmf))) { //A previously loaded and activated DTMF grammar is printf("DTMF tone valid: %s returned\n", result); } break; } state = vox_vsd_write(vsddev, buffer, n); if (!bVoice && state!=VVX_INIT && state!= VVX_SILENCE) bVoice = true; if (bVoice && n>0) n = vox_recstr_write(recdev, buffer, n); } while (n == BUFFER_SIZE); fclose(fp); vox_dtmf_close(chdev, dtmfdev); vox_vsd_close(chdev, vsddev); vox_recstr_close(chdev, recdev);

Verbio Technologies

Referencia de las funciones del Library SDK

143

Captulo 4. Cdigo de ejemplos en C/C++

3. Ejemplo de uso del reconocimiento natural basado en modelos estadsticos (SLM)


Ejemplo 4.3. Ejemplo de reconocimiento SLM
Este ejemplo pretende mostrar cmo debe usarse Verbio cuando se desee realizar reconocimiento de en "habla natural", basado en modelos estadsticos del lenguaje (SLM).
#include <windows.h> #include <stdio.h> #include "voxlib.h" #define USE_CALLBACK #define MAXINDEX 1024 #ifdef USE_CALLBACK static int VVI_callback (const char *result, unsigned long score, size_t ntfyId) { if (result) { printf("%s (%lu) ", result, score); } return 0; } #endif int main(int argc, char *argv[]) { int char int index[MAXINDEX]; float score[MAXINDEX]; vox_setparm(-1, VXGB_DEFSERVER, "127.0.0.1"); vox_setparm(-1, VXGB_NETTIMEOUT, &timeout); if (vox_asr_init(CFG_SPANISH16K, LNG_SPANISH) == -1) return -1; // Get Vox Product Version unsigned long dwfilever = 0, dwprodver = 0; vox_GetDllVersion(&dwfilever, &dwprodver); printf("VVI TEST. VOXLIB %d.%02d\n", dwprodver>>16, dwprodver & 0xFFFF); printf("------------------\n"); if (vox_getparm(-1, VXGB_START_VIT, &information) == 0) printf("Configuraciones SLM disponibles: %s\n", information); if (vox_getparm(-1, VXGB_START_SLM, &information) == 0) printf("\tModelos SLM disponibles: %s\n", information); while (1) { // Load vvi grammar if ((ivcb = vox_loadvcb(dev, "vvi:grammar/generic", 0)) == -1) { vox_libclose(); return -1; } // Activate vvi grammar if (vox_activatevcb(dev, ivcb, 0) == -1) { vox_libclose(); return -1; } #ifdef USE_CALLBACK // Set callback vox_RegisterVVICallback(dev, VVI_callback); #endif VX_RSP rsp; vox_clrrsp(&rsp); rsp.maxsil = 300; if (vox_recstr(dev, "vvi.esu", &rsp, MC_MULAW) < 0) { vox_libclose(); return -1; } #ifndef USE_CALLBACK if ((nind = vox_recind(dev, MAXINDEX, index, score, 0)) < 0) { vox_libclose(); return -1; } if (nind == 0) { printf("Recognition finished due to: %s\n", vox_word(dev, index[0])); } else { for (int i=0; i<nind; i++) { printf("%s (%.2f) ", vox_word(dev, index[i]), score[i]); } } #endif vox_deactivatevcb(dev, ivcb, 0); vox_unloadvcb(dev, ivcb, 0); } vox_setvcb(dev, NULL, 0);

dev = 0, nind, ivcb, timeout = -1; *information = 0;

144

Referencia de las funciones del Library SDK

Verbio Technologies

Captulo 4. Cdigo de ejemplos en C/C++

vox_libclose(); printf("Press return to continue"); getchar(); return 0; }

Verbio Technologies

Referencia de las funciones del Library SDK

145

Captulo 4. Cdigo de ejemplos en C/C++

4. Ejemplo de SpeakerID
Ejemplo 4.4. Ejemplo de Verbio Library para verificacin del locutor
#include <stdio.h> #include "voxlib.h" int main(int argc, char *argv[]) { char *server = "192.168.2.14"; int ret; float score; vox_setparm(-1, VXGB_DEFSERVER, server); if (vox_asr_init("es", "es") < 0) return -1; if (vox_spk_init() < 0) return -1; if (!vox_spk_exist(0, "1234")) { vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, vox_spk_addfile(0, "1234", "1234", "1234", "1234", "1234", "1234", "1234", "1234", "1234", "1234", "F:/datos/wavs_prueba/77308296.wav", "77308296"); "F:/datos/wavs_prueba/0123456789.wav", "0123456789"); "F:/datos/wavs_prueba/9876543210.wav", "9876543210"); "F:/datos/wavs_prueba/0246813579.wav", "0246813579"); "F:/datos/wavs_prueba/1470258369.wav", "1470258369"); "F:/datos/wavs_prueba/5193280476.wav", "5193280476"); "F:/datos/wavs_prueba/9461725038.wav", "9461725038"); "F:/datos/wavs_prueba/5862319407.wav", "5862319407"); "F:/datos/wavs_prueba/3659102487.wav", "3659102487"); "F:/datos/wavs_prueba/4209167183.wav", "4209167183");

ret = vox_spk_train(0, "1234", 0, 0); } else ret = vox_spk_verify(0, "1234", "F:/David/Soft/Biometco/api/datos/wavs_prueba/023_0009.wav", "02468", &score); vox_libclose(); }

146

Referencia de las funciones del Library SDK

Verbio Technologies

Apndice A. Ficheros utilizados por los ejemplos


Importante
Atencin, utilice el tabulador para separar las columnas de los ficheros de texto que contengan ms de una. Ficheros utilizados en el ejemplo. El fichero de gua vdemo.gui es un listado de ficheros de audio pregrabados con algn nombre de la lista, etiquetados de manera que posteriormente se pueda validar la respuesta del reconocimiento. comandos.txt

REPEAT HOME HELP

Repetir Inicio Ayuda

//Repetir la pregunta //Empezar de nuevo el dilogo //Dictar un mensaje ms preciso

vdemo.txt

Eduardo Campillo Asuncin Chinea Marta Cuenca Emilio Doblado Guillermo Estrada Mara Fras Sergio Galndez Eloy de la Fuente Enrique Hurtado Pablo Jimnez Francisco Luna Fernando Mayoral Susana Martnez Germn Morales Alfonso Morillo Juan Oliva Inmaculada Snchez Gloria Machado Pilar Zaragoza Irene Ponsa Jose Riveiro Marcial Rodrguez Jorge Snchez Alberto Salvador Hctor Osorio Carmen Puente Carolina Segovia Alejandro Tarrida Leonardo Toronto Jess Urrubieta Departamento Comercial Departamento Tcnico Proveedores Administracin Direccin

vdemo.gui

DEMO0001 DEMO0002 DEMO0003 DEMO0004 DEMO0005 DEMO0006 DEMO0007

Eloy de la Fuente Francisco Luna Proveedores Alberto Salvador Guillermo Estrada Sergio Galndez Jos Mario

Apndice A. Ficheros utilizados por los ejemplos

148

Referencia de las funciones del Library SDK

Verbio Technologies

ndice
C
Cliente-Servidor cerrar conexin, 98 desconexiones, 75

D
Definicin de parmetros, 126 Deteccin de la voz ejecucin, 113 finalizacin, 110 inicializacin, 111 parmetros, 14 Deteccin de tonos DTMF ejecucin, 21 finalizacin, 18 inicializacin, 19

detener, 100 ejecucin, 65, 67, 73 finalizacin, 69 funcin de callback, 74 informacin adicional, 134 inicializacin, 70 liberacin de recursos, 59, 71 nmero de resultados, 41 obtencin de los resultados, 20, 114, 115 obtencin de resultados, 39, 63 parmetros, 13 reserva de un recurso, 61, 72 tipo de gramtica, 11 vocabulario, 31 Reconocimiento del habla obtencin de los resultados, 116 Recursos liberacin, 17, 33, 101

S
SAPI MODEATTRIBUTES, 125 SAPI 4.0 abrir, 77, 79 cerrar, 76 seleccionar, 80 Sntesis ejecucin, 46 finalizacin, 44 inicializacin, 45 Sntesis del habla configuracin, 82, 85, 104, 106 detener, 99 ejecucin, 42 liberacin de recursos, 47 reserva de un recurso, 48

E
Errores obtencin, 22, 32

G
Gramticas activacin, 4 carga, 36, 37 desactivacin, 15 descarga, 108 establecimiento, 88 preparacin, 12, 49, 51, 54, 56

I
Inicializacin recursos ASR, 8 recursos ASR y TTS, 34 recursos SpeakerID, 93 recursos TTS, 102

V
VAD, Voice Activity Detection VAD_PRM, 121 VAD_PRM inicializacin, 14 Verificacin del locutor Creacin de la huella vocal, 94 Entrenamiento, 90 Usuarios registrados, 92 Verificacin, 96 Versin obtencin, 25 Vocabularios activacin, 4 carga, 36, 37 desactivacin, 15 descarga, 108 establecimiento, 84, 88 obtencin, 31 preparacin, 6, 12, 49, 51, 54, 56 VX_RSP inicializacin, 13

L
Liberacin recursos ASR y TTS, 33, 101 Licencias reconocimiento, 23, 29 sntesis, 27, 30

N
Nmero de serie, 81

P
Parmetros asignacin, 87 obtencin, 26

R
Recognize String Parameter VX_RSP, 120 Reconocimiento

You might also like