You are on page 1of 6

Podrcznik uytkownika programu

voice
wersja dla Windows

Spis treci:
Pierwsze kroki...........................str.2
Sownik dla gosu......................str.3
Tryb dokadny i lektorski............str.4
Zaawansowany paser tekstu.......str.4
Znaczniki sterujce
interfejsu SAPI5........................str.5
Obsuga bdw
syntezatora mowy.....................str.5
Wsparcie techniczne..................str.6
Kont@kt...................................str.6

Copyright 2009 IVO Software Sp. z o.o.

Praca z IVON - pierwsze kroki

odczas instalacji syntezatora mowy IVONA - komputer wzbogaci si o moliwo


generowania ludzkiej mowy wysokiej jakoci. Interpretacja tekstu podawanego
syntezatorowi mowy IVONA jest realizowana przez niedeterministyczne algorytmy
sztucznej inteligencji. Oznacza to, e w niektrych przypadkach wyniki ich dziaania mog by inne
od oczekiwa uytkownikw. W takich przypadkach naley odpowiednio przygotowa
syntezowany tekst by osign zamierzony efekt.
Przecinki i kropki

Tekst do odczytu powinien by napisany zgodnie z zasadami polskiej gramatyki i ortografii.


Przykadowo zdanie Ala ma,jednego kota." zostanie przeczytane: Ala ma przecinek jednego
kota.", poniewa w tekcie brakuje spacji po przecinku przed wyrazem jednego". Taki sposb
interpretacji tekstu do odczytu jest pomocny przy znajdowaniu bdw w pisowni tekstu.
Syntezator mowy IVONA zawsze interpretuje przecinki i kropki. Zdanie Ala ma kota, a kot ma Al."
zostanie zinterpretowane i odczytane jak zdanie zoone (z przerw na znaku przestankowym),
podczas gdy zdanie Ala ma kota a kot ma al." jak pojedyncze zdanie twierdzce. Interpretowanie
przecinkw i kropek powoduje, e zdania zostaj odczytane i zaintonowane w sposb taki, jakiego
oczekuje si od lektora. Pamitajc o tej waciwoci syntezatora mowy IVONA mona osign
ciekawe efekty. Na przykad mona wyrni pewne wyrazy stawiajc przed nimi przecinek, np.
zdanie Ala ma, jednego, kota." zostanie zupenie inaczej przeczytane ni zdanie Ala ma jednego
kota.".
Wyrazy obcojzyczne

Jednym z gosw dostpnych dla syntezatora mowy IVONA jest gos Jacek, ktry jest gosem mowy
polskiej. Oznacza to, e tekst podany syntezatorowi zostanie zawsze przeczytany tak, jakby by
napisany w jzyku polskim. Dlatego te wyrazy obcojzyczne zostan rwnie przeczytane po
polsku. Aby osign poprawn wymow naley wystpujcy w tekcie wyraz obcojzyczny
zastpi jego zapisem fonetycznym w jzyku polskim. Do tego celu mona wykorzysta sownik
syntezatora mowy IVONA, w ktrym mona wpisa sowa pojawiajce si szczeglnie czsto w
syntezowanych tekstach.
Przykady: windows menu -> indos meni; microsoft word ->majkrosoft ord
Wicej informacji na temat uywania sownika znajduje si w rozdziale Zaawansowany paser
tekstu.

Sownik gosu

iekiedy zachodzi potrzeba przeksztacenia tekstu przed syntez, w sposb zapewniajcy


poprawny sposb jego odczytu. Typowym przykadem mog tu by wyrazy obcego
pochodzenia, ktre naley przekaza do syntezatora fonetycznie. Aby sprosta tym
potrzebom gosy syntezatora mowy IVONA obsuguj rozbudowany mechanizm sownika
wyjtkw.
Okno dialogowe sownika wyjtkw zawiera trzy czci:
Sownik - jest to lista wyrazw wyjtkowych. Uytkownik moe do niej dopisywa wasne

wyjtki zapisane w sposb fonetyczny.


Sposb odczytu tekstu - pozwala wybra jeden z trybw odczytywania. W trybie

Dokadnym syntezator odczytuje wszystkie znaki znajdujce si w podanym tekcie, podczas


gdy w trybie Lektorskim cz z nich interpretuje imitujc zachowanie lektora. Szczegy
dziaania obu trybw zostay opisane w dalszej czci tego dokumentu.
Pomijanie znakw - uytkownik moe skonfigurowa, ktre znaki maj zosta bezwzgldnie

pominite podczas odczytywania. Zaznaczone znaki zostan usunite z tekstu wejciowego


zanim trafi on do syntezatora.

Zamieniaj Z oraz Zamieniaj Na


Lista wyrazw zamienianych

Dodaj - po wciniciu przycisku Dodaj mona


wypeni pole Z wyrazem poszukiwanym oraz Na
wyrazem na jaki naley wyraz poszukiwany zamienia.

Edytuj - wcinicie przycisku spowoduje moliwo


zmiany wyrazu poszukiwanego i zamienianego

Usu - wcinicie przycisku usuwa aktualnie


wybrany wyraz poszukiwany ze sownika

Akceptuj (widoczny w czasie edycji sowa)


wcinicie powoduje zaakceptowanie
wprowadzonej zmiany do sownika
Sposoby odczytu tekstu

Anuluj (w polu Sownik, widoczny w


czasie edycji sowa) wcinicie anuluje
wprowadzon zmian do sownika
Tryb odczytu Dokadny

Tryb odczytu Lektorski


Pomijaj znaki - pozwala wybra znaki, ktre maj by
ignorowane podczas odczytu tekstu (cudzysw, mylnik,
nawiasy, klamry, tylda, apostrofy, znaki: < >,/)

Tryb Dokadny i Lektorski

yntezator mowy IVONA moe pracowa w dwch trybach: Lektorskim i Dokadnym. W


zalenoci od uywanego trybu IVONA w rny sposb odczytuje tekst. W trybie
Dokadnym wystpienie jednego ze znakw specjalnych (np. nawias, mylnik, etc.)
powoduje odczytanie jego nazwy przez IVON. W trybie Lektorskim IVONA prbuje
zinterpretowa tekst tak, jak to robi lektor, czyli nie odczytuje nazwy specjalnego znaku, ale
odpowiednio zmienia intonacj zdania. Na przykad zdanie: Ala ma kota Stefanka. zostanie
zupenie inaczej odczytane w obu trybach. W trybie dokadnym usyszymy Ala ma kota cudzysw
Stefanka cudzysw." podczas, gdy w trybie lektorskim usyszymy Ala ma kota, Stefanka.".
Aby uruchomi tryb lektorski naley uruchomi okno konfiguracji sownika i zmieni sposb
interpretacji tekstu na tryb lektorski. Tryb lektorski jest szczeglnie uyteczny do zamiany na
mow duej iloci tekstu wczeniej nieobrobionego, np. tekstu ksiek, w ktrym znajduje si
wiele dialogw.

Zaawansowany paser tekstu

os SAPI5 syntezatora mowy IVONA aduje reguy z pliku sownika ivona.lex, ktry
umieszczony jest w katalogu instalacyjnym syntezatora. W rzeczywistoci sownik jest
bardzo rozbudowanym parserem tekstu pozwalajcym praktycznie dowolnie modyfikowa
tekst poprzez zastosowanie wyrae regularnych zgodnych z definicj POSIX 1003.2 regular
expressions. Sownik zbudowany jest na zasadzie - jedna regua w jednej linii. Regua skada si z
dwch czonw oddzielonych dowoln iloci biaych znakw:
tekst_do_zamian acuch_docelowy
Przykad: ivo software iwo softer
Jeeli ktry z czonw zawiera biae znaki to naley go uj w czudzysw. Jeeli ktry z czonw
zawiera cudzysw to naley poprzedzi go znakiem ucieczki \ (backslash). Czon tekst do zmiany
definiuje wyraenie regularne dopasowujce tekst do zamiany. W procesie przeksztacania tekstu
przed syntez dopasowany fragment zostaje zastpiony poprzez acuch docelowy. Przy czym
acuch docelowy moe zawiera referencje do dopasowywanego tekstu zapisane notacj \1 .. \9
(\0 to cae dopasowanie). Na przykad dodanie reguy: Singapur([[:alpha:]]*) S~'ingapur\1
spowoduje zamian wszystkich wystpie sowa Singapur we wszystkich odmianach.
UWAGA!!! Rcznie dodawane reguy do pliku sownika mog pojawi si w oknie dialogowym
sownika wyjtkw w zmienionej formie. Ze wzgldu na uatwienie obsugi okno dialogowe
sownika wyjtkw wstpnie przetwarza reguy tak, aby byy atwiejsze do zrozumienia. Nie naley
w oknie dialogowym sownika wyjtkw modyfikowa regu dodanych rcznie do pliku!

Przykadowe reguy

Poniej przedstawiamy kilka regu sownika systemu syntezy mowy IVONA uywanych do
najbardziej typowych zada. Naley zauway, e reguy s case-insensitive - czyli dziaaj bez
rozrniania wielkoci liter.
(^|[[:punct:][:space:]])Software([[:punct:][:space:]]|$) \1softer\2
Powysza regua dziaa w sposb nastpujcy: zamie sowo Software, na wersj zapisan
fonetycznie - softer. Otoczenie sowa ^|[[:punct:][:space:]] oraz [[:punct:][:space:]]|$
oznacza dowolny znak interpunkcyjny, biay znak lub pocztek tekstu (znak ^) lub
koniec tekstu (znak $). Gdyby go nie byo algorytm zamieniaby wszystkie wystpienia sowa
Software (co akurat dla sowa Software nie jest niekorzystne, w przeciwiestwie do np. dla
sowa Ala - poniewa zamieniane byyby take takie sowa jak: oddala, przechwala).
Opisywane tu otoczenie sowa zostao ujte w nawiasy, aby umoliwi wykorzystanie referencji
wstecznych - \1, \2, ktre powoduj kopiowanie znakw dopasowanych do fragmentw reguy z
nawiasw, na wyjcie bez zmian. Powysz regu naley rozszerzy jeeli chcemy dopasowa dwa
wyrazy, np.: (^|[[:punct:][:space:]])IVO[[:space:]]+Software([[:punct:] [:space:]]|$)
\1iwo softer\2
Zapis w sowniku usuwajcy niechciane znaki z tekstu: [!?@#$%*&()]+

Znaczniki sterujce interfejsu SAPI5

tekcie podawanym do syntezy mona uywa znacznikw sterujcych, ktre pozwalaj


na modyfikacj generowanej mowy w trakcie syntezy. Wszystkie znaczniki maj posta
znan z XML.

Lista znacznikw przydatnych podczas pracy z syntezatorem mowy IVONA:

Volume - Przy pomocy znacznika Volume mona kontrolowa gono gosu. Jeeli znacznik

pozostanie pusty to zmiana gonoci odnosi si do caego tekstu nastpujcego po znaczniku,


inaczej wycznie do tekstu ujtego w znacznik. Znacznik Volume wymaga atrybutu Level,
ktry okrela nowy poziom gonoci. Warto tego atrybutu musi zawiera si w przedziale [0,
100], gdzie 100 oznacza 100% gonoci i jednoczenie jest wartoci domyln.
Ala ma kota, <volume level=50>a kot ma Al. Ala ma <volume
Przykad:
level=50>kota</volume>, a <volume level=50>kot</ volume> ma Al.

Rate - Znacznik Rate pozwala kontrolowa szybko generowanej mowy. Znacznik moe by

pusty, co oznacza, e jego dziaanie odnosi si do caego nastpujcego po nim tekstu. Znacznik
Rate wymaga jednego z dwch atrybutw: speed lub absspeed. Oba atrybuty przyjmuj wartoci z
zakresu [-10, 10], gdzie -10 oznacza mow najwolniejsz. Warto 0 oznacza prdko domyln
gosu. Atrybut speed zmienia prdko mowy w sposb wzgldny (czyli w odniesieniu do biecej
prdkoci mowy), a absspeed w sposb bezwzgldny.
Przykad: Ala ma kota, <rate absspeed=5>a kot ma Al. <rate absspeed=-1>Ala ma <rate
speed=1>kota</rate>, a <rate speed=1>kot</rate> ma Al.

Silence - Znacznik Silence pozwala wstawi cisz w okrelonym miejscu generowanej

wypowiedzi. Dugo wstawianej ciszy wyraona jest w milisekundach. Znacznik Silence musi by
pusty i zawiera jeden atrybut msec.
Przykad: 3 <silence msec=2000/> 2 <silence msec=2000/> 1 <silence msec=2000/>
bum.

Spell - Znacznik Spell wymusza literowanie ujtego w nim fragmentu tekstu. Znacznik ten

nie moe by pusty. Ala ma papug, ktra mwi i umie cakiem niele wymawia niektre literki,
na przykad <spell>abcd</spell>.

Obsuga bdw syntezatora mowy

osy SAPI5 syntezatora mowy IVONA do zgaszania bdw wykorzystuj mechanizm


rejestru zdarze systemu Windows. Rejestr ten jest dostpny w Panelu Sterowania/
Narzdzia administracyjne/Podgld Zdarze w sekcji Aplikacja.

Bdy gosu SAPI5


Wystpi problem z inicjalizacja interfejsu SAPI5 - nie mona zaladowac pliku biblioteki gosu.

Bd moe powsta podczas prby niepoprawnie zainstalowanego gosu syntezatora mowy IVONA,
ktremu brakuje jednego ze skadnikw. Pojawienie si tego bdu oznacza, e dany gos nie bdzie
mg by uywany dopki problem nie zostanie usunity. Naley zainstalowa dany gos ponownie.
Interfejs SAPI5 nie moe zosta uyty, poniewa przekroczono limit dozwolonych licencji

syntez rwnoleglych.
Bd powstanie podczas prby przeprowadzenia syntezy niezgodnej z dostpn licencj.
Najczstsz przyczyn jego wystpowania jest prba przeprowadzenia wikszej liczby
jednoczesnych syntez ni zezwala na to licencja. Naley zwrci uwag na to, e niektre programy
korzystajce z interfejsu SAPI5 zajmuj syntezator nawet gdy nie syntezuj mowy. Dlatego te, w
przypadku pojawienia si tego bdu, naley sprawdzi czy nie zosta uruchomiony inny program
wykorzystujcy dany gos IVONA.

Wsparcie techniczne
W razie pyta lub kopotw z uruchomieniem produktw firmy IVO Software prosz kontaktowa
si bezporednio z dziaem wsparcia technicznego dla klientw:

email: support@ivo.pl
tel: + 48 58 783 49 51

Kont@kt

TM

IVO Software Sp. z o.o.


al.Zwycistwa 96/98, 81-451 Gdynia
tel.: +48 58 783 49 51
fax: +48 58 732 90 91
e-mail: ivo@ivo.pl
www: www.ivo.pl; www.ivosoftware.com

You might also like