Professional Documents
Culture Documents
voice
wersja dla Windows
Spis treci:
Pierwsze kroki...........................str.2
Sownik dla gosu......................str.3
Tryb dokadny i lektorski............str.4
Zaawansowany paser tekstu.......str.4
Znaczniki sterujce
interfejsu SAPI5........................str.5
Obsuga bdw
syntezatora mowy.....................str.5
Wsparcie techniczne..................str.6
Kont@kt...................................str.6
Jednym z gosw dostpnych dla syntezatora mowy IVONA jest gos Jacek, ktry jest gosem mowy
polskiej. Oznacza to, e tekst podany syntezatorowi zostanie zawsze przeczytany tak, jakby by
napisany w jzyku polskim. Dlatego te wyrazy obcojzyczne zostan rwnie przeczytane po
polsku. Aby osign poprawn wymow naley wystpujcy w tekcie wyraz obcojzyczny
zastpi jego zapisem fonetycznym w jzyku polskim. Do tego celu mona wykorzysta sownik
syntezatora mowy IVONA, w ktrym mona wpisa sowa pojawiajce si szczeglnie czsto w
syntezowanych tekstach.
Przykady: windows menu -> indos meni; microsoft word ->majkrosoft ord
Wicej informacji na temat uywania sownika znajduje si w rozdziale Zaawansowany paser
tekstu.
Sownik gosu
os SAPI5 syntezatora mowy IVONA aduje reguy z pliku sownika ivona.lex, ktry
umieszczony jest w katalogu instalacyjnym syntezatora. W rzeczywistoci sownik jest
bardzo rozbudowanym parserem tekstu pozwalajcym praktycznie dowolnie modyfikowa
tekst poprzez zastosowanie wyrae regularnych zgodnych z definicj POSIX 1003.2 regular
expressions. Sownik zbudowany jest na zasadzie - jedna regua w jednej linii. Regua skada si z
dwch czonw oddzielonych dowoln iloci biaych znakw:
tekst_do_zamian acuch_docelowy
Przykad: ivo software iwo softer
Jeeli ktry z czonw zawiera biae znaki to naley go uj w czudzysw. Jeeli ktry z czonw
zawiera cudzysw to naley poprzedzi go znakiem ucieczki \ (backslash). Czon tekst do zmiany
definiuje wyraenie regularne dopasowujce tekst do zamiany. W procesie przeksztacania tekstu
przed syntez dopasowany fragment zostaje zastpiony poprzez acuch docelowy. Przy czym
acuch docelowy moe zawiera referencje do dopasowywanego tekstu zapisane notacj \1 .. \9
(\0 to cae dopasowanie). Na przykad dodanie reguy: Singapur([[:alpha:]]*) S~'ingapur\1
spowoduje zamian wszystkich wystpie sowa Singapur we wszystkich odmianach.
UWAGA!!! Rcznie dodawane reguy do pliku sownika mog pojawi si w oknie dialogowym
sownika wyjtkw w zmienionej formie. Ze wzgldu na uatwienie obsugi okno dialogowe
sownika wyjtkw wstpnie przetwarza reguy tak, aby byy atwiejsze do zrozumienia. Nie naley
w oknie dialogowym sownika wyjtkw modyfikowa regu dodanych rcznie do pliku!
Przykadowe reguy
Poniej przedstawiamy kilka regu sownika systemu syntezy mowy IVONA uywanych do
najbardziej typowych zada. Naley zauway, e reguy s case-insensitive - czyli dziaaj bez
rozrniania wielkoci liter.
(^|[[:punct:][:space:]])Software([[:punct:][:space:]]|$) \1softer\2
Powysza regua dziaa w sposb nastpujcy: zamie sowo Software, na wersj zapisan
fonetycznie - softer. Otoczenie sowa ^|[[:punct:][:space:]] oraz [[:punct:][:space:]]|$
oznacza dowolny znak interpunkcyjny, biay znak lub pocztek tekstu (znak ^) lub
koniec tekstu (znak $). Gdyby go nie byo algorytm zamieniaby wszystkie wystpienia sowa
Software (co akurat dla sowa Software nie jest niekorzystne, w przeciwiestwie do np. dla
sowa Ala - poniewa zamieniane byyby take takie sowa jak: oddala, przechwala).
Opisywane tu otoczenie sowa zostao ujte w nawiasy, aby umoliwi wykorzystanie referencji
wstecznych - \1, \2, ktre powoduj kopiowanie znakw dopasowanych do fragmentw reguy z
nawiasw, na wyjcie bez zmian. Powysz regu naley rozszerzy jeeli chcemy dopasowa dwa
wyrazy, np.: (^|[[:punct:][:space:]])IVO[[:space:]]+Software([[:punct:] [:space:]]|$)
\1iwo softer\2
Zapis w sowniku usuwajcy niechciane znaki z tekstu: [!?@#$%*&()]+
Volume - Przy pomocy znacznika Volume mona kontrolowa gono gosu. Jeeli znacznik
Rate - Znacznik Rate pozwala kontrolowa szybko generowanej mowy. Znacznik moe by
pusty, co oznacza, e jego dziaanie odnosi si do caego nastpujcego po nim tekstu. Znacznik
Rate wymaga jednego z dwch atrybutw: speed lub absspeed. Oba atrybuty przyjmuj wartoci z
zakresu [-10, 10], gdzie -10 oznacza mow najwolniejsz. Warto 0 oznacza prdko domyln
gosu. Atrybut speed zmienia prdko mowy w sposb wzgldny (czyli w odniesieniu do biecej
prdkoci mowy), a absspeed w sposb bezwzgldny.
Przykad: Ala ma kota, <rate absspeed=5>a kot ma Al. <rate absspeed=-1>Ala ma <rate
speed=1>kota</rate>, a <rate speed=1>kot</rate> ma Al.
wypowiedzi. Dugo wstawianej ciszy wyraona jest w milisekundach. Znacznik Silence musi by
pusty i zawiera jeden atrybut msec.
Przykad: 3 <silence msec=2000/> 2 <silence msec=2000/> 1 <silence msec=2000/>
bum.
Spell - Znacznik Spell wymusza literowanie ujtego w nim fragmentu tekstu. Znacznik ten
nie moe by pusty. Ala ma papug, ktra mwi i umie cakiem niele wymawia niektre literki,
na przykad <spell>abcd</spell>.
Bd moe powsta podczas prby niepoprawnie zainstalowanego gosu syntezatora mowy IVONA,
ktremu brakuje jednego ze skadnikw. Pojawienie si tego bdu oznacza, e dany gos nie bdzie
mg by uywany dopki problem nie zostanie usunity. Naley zainstalowa dany gos ponownie.
Interfejs SAPI5 nie moe zosta uyty, poniewa przekroczono limit dozwolonych licencji
syntez rwnoleglych.
Bd powstanie podczas prby przeprowadzenia syntezy niezgodnej z dostpn licencj.
Najczstsz przyczyn jego wystpowania jest prba przeprowadzenia wikszej liczby
jednoczesnych syntez ni zezwala na to licencja. Naley zwrci uwag na to, e niektre programy
korzystajce z interfejsu SAPI5 zajmuj syntezator nawet gdy nie syntezuj mowy. Dlatego te, w
przypadku pojawienia si tego bdu, naley sprawdzi czy nie zosta uruchomiony inny program
wykorzystujcy dany gos IVONA.
Wsparcie techniczne
W razie pyta lub kopotw z uruchomieniem produktw firmy IVO Software prosz kontaktowa
si bezporednio z dziaem wsparcia technicznego dla klientw:
email: support@ivo.pl
tel: + 48 58 783 49 51
Kont@kt
TM