Re[4]: Wtv a značky - bolo - RE: Re[7]: Text-To-Speech systém EPOS

Jaromír Vít jaromir.vit na volny.cz
Sobota Květen 7 03:05:23 CEST 2005


Hezké ráno.

Apple Mackintosh, prostě jablko. Je zajímavé sledovat, že různé
poradny i různá fóra se těmto počítačům veskrze nezabývají. Proč?
Protože s nimi nejsou problémy. To máte jako s procesory pro PC od
Intelu a AMD. Nejvíce problematických dotazů je právě od uživatelů
AMD. Přikládám článeček.

Výzva pro vývojáře: Český hlasový syntetizátor pro Mac OS X

Nakousnutá jablka

Včera mě Patrick Zandl upozornil na velice zajímavou aplikaci – český
hlasový syntetizátor Epos s (minimálně pro mě) velmi překvapivou
hlasovou kvalitou (ukázka českého textu – závěr recenze na Mac mini,
kterou jsem napsal včera pro PC World ;). Jestliže znáte TTS
(text-to-speech) zabudovaný v Mac OS X a porovnáte si kvalitu výstupu
z Eposu, zjistíte, že rozdíl v kvalitě je propastný – ve prospěch
českého řešení! Pokud si chcete hrát, můžete si vyzkoušet sami převod
přímo na webu, ale co je ještě lepší, celý systém je vyvíjený jako
open-source, který lze podle všeho zkompilovat i pod Unixy. Přiznám
se, nejsem ani trochu programátor :-), a tak nejsem schopen si to
zkompilovat sám, a především – myslím si, že velmi užitečné by bylo
zjistit, zda jde do systému implementovat tento hlasový výstup jako
další “hlas” pro systémové TTS. Jelikož od Tigera bude součástí
systému kompletní screenreader pro zrakově postižené (který normálně
na Windows stojí jako samostatná aplikace 1000 USD), bylo by podobné
řešení skvělým řešením pro postižené.

Skvělý hlasový syntetizátor existuje, najde se dost ochotných
programátorů, kteří by se dali dohromady a pokusí se o implementaci do
Mac OS X?

Mimochodem, netušíte, zda jsou na českém webu pohádky v textové
podobě? Přítelkyni jsem dneska večer po koncertu RoPy zcela vyčerpal
tím, že jsem jí zabavil její PC a posadil k Macu mini a nechal jí do
tří do noci zápolit se Safari, Finderem, Proteusem a podobně – tak
jsem ji chtěl na dobrou noc alespoň nechat předčítat nějakou pohádku
;), ať mohu v klidu psát na blog, ale smůla :(.

Update: pro praktickou ukázku toho, co jde se systémem generování a
rozpoznávání řeči udělat si zavolejte sem: 485 353 100 – Liberecký
hlasový informační systém Infocity.

Update 2: jelikož se strhla relativně nepodstatná diskuse o mém
názoru, že Epos má kvalitnější výstup, přidávám ještě ukázku
systémového TTS s hlasem Victoria, a pro ilustraci také ten samý text
v systému od Acapela a ukázku polštiny navrch. Nutno podotknout, že to
co produkuje Acapela je ještě o třídu až dvě jinde.

Váš názor?

No, pokud se za posledni cca rok nic nezmenilo, nejde to na macu
zkompilovat. Na druhou stranu by na tom nemuselo byt prilis mnoho
prace, autor se snad snazil o nejakou podporu big endian. Mluvilo se o
tom v diskusi na MujMacu/Programovani pro Mac OS X. — nemo    9 03

2005 - 08:35    #  Hm, pohádek se na českém internetu válí dost… Třeba
tahle:
http://www.cssd.cz/vismo/zobraz_dok.asp?u=422010&id_org=422010&id_ktg=3838&p1=7161&p2=&p3=

— JJ    9 03 2005 - 09:31    #  ...tak pokud jde o tu kvalitu hlasu,
zase takový velký rozdíl mezi tím co je v Mac OS X nyní a tímhle tedy
podle mě není (je to jako Victoria)—pravou však je, že je to zatím
nejlepší syntéza českého jazyka jakou jsem kdy slyšel—například nyní
používané programy pro slepce na Woknech mluví česky naprosto
nesrozumitelně a příšerně “počítačov씗něco jako Zarvox ;–) — agent

9 03 2005 - 09:40    #  Zkus tohle:
http://www.geocities.com/Athens/Rhodes/8895/index.htm — Cisa    9 03
2005 - 10:29    #  agent: sorry, ale nemohu s tebou souhlasit. pravda,
nemohl jsem testovat na shodnem vzorku, protoze Epos nema na webu
podporu anglictiny, ale testoval jsem to tady na pritelkyni a rozdil
je nebetycny nejen dle meho nazoru, ale i dle jejiho… ten TTS v Mac OS
X proste ma takove “upadle” zacatky slov, nevyrazne samohlasky a pod…
strasne to syci. tohle je nebe a dudy. — Martin Lér    9 03 2005 -
11:26    #  Martin Lér—přijde mi to vážně skoro stejné… jediný rozdíl
je, že je to česky—schválně jsem si to ještě porovnal, ale maximálně
je to NEPATRNĚ lepší, ale netroufl bych si hovořit o “propastném”
rozdílu… každopádně to nic nemění na tom, že tohle mít pro Mac OS X by
bylo VÍCE NEŽ FANTASTICKÉ! — agent    9 03 2005 - 11:45    #  ad >>ten
TTS v Mac OS X proste ma takove “upadle” zacatky slov, nevyrazne
samohlasky a pod… strasne to sici. tohle je nebe a dudy. — pixy    9
03 2005 - 12:53    #  ad ”... ten TTS v Mac OS X proste ma takove
‘upadle’ zacatky slov, nevyrazne samohlasky a pod… strasne to sici.
tohle je nebe a dudy…”

Malére, a není to náhodou prostě jen tím, že nejsi rodilý anglický
mluvčí? Nezpomínej, že čeština má vždy přízvučnou první slabiku
(narozdíl od angličtiny), proto ti můžou připadat začátky slov
polykané; samohlásky jsou v angličtině podružné (a navíc úplně jiné
než v češtině), proto anglický syntezátor klade větší důraz na
srozumitelnost souhlásek – češtině bez samohlásek bys nerozuměl (to už
spíš bez souhlásek), zatímco u angličtiny je to přesně naopak. Já
myslím, že rodilému mluvčímu zní macovský TTS (přinejmenším) stejně
dobře jako nám tenhle český. Skoro bych se vsadil.

(Co mi to udělalo? U předchozího příspěvku zbyl jen první odstavec a
zbytek to uřízlo… :-O ) — pixy    9 03 2005 - 12:55    #  Nejsem
rodily mluvci, to mas samozrejme pravdu – ale kdyz uz rejes, poslechl
sis alespon oba? Mimo to, mam docela zkusenosti i s jazyky, ktere maji
prizvucnou jinou nez prvni slabiku – vyrustal jsem v polsku. A jak
rikam, netestoval jsem to jen na sobe, i na pritelkyni, ktera hovori
anglicky rozhodne vyrazne lepe nez ja. To co pada z TTS v systemu je
proste “neklidne” – polyka to samohlasky, velmi tam skace hlasitost
jednotlivych pismen a podobne – posloucha se to spatne. Pro ilustraci
jsem do clanku pridal jak ukazku toho, co leze z tts, tak ukazku hlasu
od firmy Acapela (maji i jakousi verzi v cestine, ale jen pro Windoze
a ne na webu, kvalita polstiny me vsak prekvapila hodne) – kazdopadne
ten system od Acapela nakope zadek jak systemovemu TTS, tak Eposu.

Ovsem – vase obhajoba systemoveho TTS je v tomto pripade naprosto
irelevantni, nebot to je nasim uzivatelum ve vetsine pripadu jaksi na
prd – dulezite je, aby se dal Epos zkompilovat pro Maca a pripadne
integrovat do systému, a to je to, o co mi bezi primarne. Skoda ze se
chytate podruznosti. — Martin Lér    9 03 2005 - 14:07    #  Ale
jasně, Epos na Macu by byl rozhodně super, o tom žádná :) Ale
podružnosti stojí taky za zmínku :))) — pixy    9 03 2005 - 17:08    #
Maler: ono to skompilovat nebude take jednoduche, to za a.), za b.)
skompilovat neznamena, ze to bude podporovane Speech Managerom :)

To chce vela roboty taketo nieco… — Jozo Remen    9 03 2005 - 19:05
#  Jozo: ufff, jeste nejake novinky? Uvedomuju si oboje, kdyby to
nebyl takovy problem, udelam si to sam a nepisu tady o tom. — Martin
Lér    9 03 2005 - 19:14    #  No, ta kompilace tak velky problem byt
nemusi, zda se, ze tvurci jsou ochotni pomoci:

“Consider downloading 2.5 instead, although it is still beta – we can
help you compile it on your thrilling big endian hardware or
whatever.”

Integrace—to je jina. Ovsem udelat pro zacatek treba jen primitivni
Service dostupny ve vsech Cocoa aplikacich tezke neni. — nemo    9 03
2005 - 19:26    #  Tak. ALe zda se, ze asi si to nakonec budu muset
muset zkusit zkompilovat sam, vsichni jen povidaj. no nic, jdu tahat
aktualni xcode… — Martin Lér    9 03 2005 - 20:16    #  Ahoj, mam ted
dost jinych veci, ale pokud uz jsou vyresene endian-problemy (ktere
bych v cizim programu fakt resit nechtel), mozna se na to mrknu a
uvidim, zda je to vubec v mych silach. Predpokladam, ze to se
stahovanim Xcode byl vtip(?) – tak jednoduche to zas nebude;)).

(K hlasum: Me je Victoria prijemnejsi nez ten EPOS, sice je
cvrlikavejsi, ale celkove ma tak nejak zivejsi a prirozenejsi
vyslovnost a lepsi melodii vety. Rozhodne ale nepolyka zacatky ani nic
jineho, se skoky v hlasitosti mas pravdu. Ta Acapela v anglictine je
ale s obojim nesrovnatelna.) — Adam Nohejl    9 03 2005 - 21:30    #
Adam: no, možná Malér nemá instalovanou tu “lepší” verzi—nevím jestli
jsou ty tři vylepšené hlasové moduly (mimo jiné Victoria) ve
standardní instalaci—já si je vždy zapínal při instalaci manuálně...
jinak si to neumím vysvětlit, protože já tam také žádný velký rozdíl
ve prospěch EPOS nezaznamenal… (ale znovu říkám—na PC jsem ještě nikdy
neslyšel lepší českou výslovnost) — agent    9 03 2005 - 23:22    #
asi pred polrokem jsme to skouseli skompilovat na PPC (mam asi vsechny
pokracovani “stoparuv pruvodce galaxii” v .doc) dokonce jsem chvili
uvazoval ze si koupim nejaky x86 system, nainstalujem linux :) — gluon
9 03 2005 - 23:58    #  Adam: no vtip to neni, kazdy zacatek je tezky
;))

Agent: to zda mam jiny hlas nez ty poznas snadno, kdyz si poslechnes
tu ukazku z TTS kterou jsem sem hodil. — Martin Lér    10 03 2005 -
00:34    #  k hlasum(ja jsem ta vyse zminovana pritelkyne) : mne
pripadal nejvetsi rozdil prave v tom, ze TTS melo ruznou hlasitost
slabik ve slovech bez zavislosti na prizvuku. K anglictine rodileho
mluvciho mam hodne daleko, nicmene neco malo o ni tusim a (i logicky)
by prizvucna slabika mela byt tou nejhlasitejsi. V TTS to tak nebylo,
proto je tomu hure rozumet, prijde mi, ze se prizvuk timto jakoby
ztraci. — Piskovec    10 03 2005 - 17:25    #

A kde se můžete dozvědět více? na www.maler.cz. Jaromír Vít

> Meka? vo co go?

> Juraj Danko
> Mobilný telefon v Čr: +420 608 166 388
> Mobilný telefon v SR: +421 915 100 191
> e-mail: dafodeil na centrum.cz
> web: http://www.dafodeil.borec.cz, http://www.dafiaq.tk
> ----- Original Message -----
> From: "Jaromír Vít" <jaromir.vit na volny.cz>
> To: "Pro fanousky vypocetni techniky" <fanda na tereza.fjfi.cvut.cz>
> Sent: Saturday, May 07, 2005 1:29 AM
> Subject: Re[2]: Wtv a značky - bolo - RE: Re[7]: Text-To-Speech systém EPOS


>> Zdravím,
>>
>> > čau Laco,
>> > pokiaľ viem, používaš WinMonitor a ten pokiaľ viem nieje značkový ani
> pod
>> > Win98, takže prečo robíš tragédiu z takej nepodstatnej veci? Nebude to
> skôr
>> > tým, že nemáš licenciu WinMonitora pod winxp a nie tým, že by ti Wtv pod
> xp
>> > nevyhovoval? Sorry že som sa už ozval, ale...
>>
>> Lacovi jde asi o to, když už musí žádat firmy znovu o autorizaci, tak
>> ať nemusí volat do dvou firem, ale jen do jedné. Ale, mailová
>> komunikace snad funguje, i když, musíte mít u sebe někoho se zrekem.
>>
>> > Inak aby tento môj mail aspoň oniečom bol, používam Win98see, som
> absolútne
>> > spokojný, môžem čítať, písať, skenovať, chodiť po internete... Pre FBI
>> > nepracujem, takže či sa mi niekto cez deravé Win98 cez sieť dostáva do
>> > počítača alebo nie mi je srdečne jedno a preto sa pýtam - je nejaký
> dôvod,
>> > prečo prejsť na winxp?
>> > s pozdravom Peťo
>>
>> Možná, že autoři trojských koní a kdejakého balastu jsou též
>> spokojení. Nechci Vás obviňovat, nebo dokonce tvrdit, že máte na síti
>> spammerskou mašinu, jenže právě uživatelé s děravými systémy jimi
>> jsou, aniž by o tom věděli. Možná jste ale výjimka a máte opravdu
>> čistý stroj. P.S. Mým snem je pořídit si Meka. Pro práci na internetu
>> ideál. Už žádné starosti s viry, spywarem a jiným brajglem. Mirek Vít
>>
>> > ----- Original Message -----
>> > From: "Ladislav Csepi" <lacoc na nextra.sk>
>> > To: "Pro fanousky vypocetni techniky" <fanda na tereza.fjfi.cvut.cz>
>> > Sent: Friday, May 06, 2005 11:53 PM
>> > Subject: Wtv a značky - bolo - RE: Re[7]: Text-To-Speech systém EPOS
>>
>>
>> > Nazdar,
>> > Nič proti číslovému Wtv - ak ti to vyhovuje. Ja mám radšej značkový, to
> je
>> > vše a nič mimoriadne za tým nehľadaj. A chcem pri značkovom i zostať.
> Toť
>> > vše - L
>> > Jo: A Wtv mám kúpený legálne.
>>
>>
>> > __________ Informacia od NOD32 1.1087 (20050503) __________
>>
>> > Tato sprava bola preverena antivirusovym systemom NOD32.
>> > http://www.eset.sk



Další informace o konferenci Fanda