z html do txt

Boženka Gogoláková gogolakova na nextra.sk
Pondělí Červenec 26 14:38:35 CEST 2004


Dobrý deň,
vďaka, idem vyskúšať.
Som rada, že sa toho niekto ujal nakoľko sa diskusia od mojej pôvodnej
otázky dosť odklonila.
Božka
----- Original Message -----
From: "Michal Jungmann" <jungmann na braillnet.cz>
To: "Pro fanousky vypocetni techniky" <fanda na tereza.fjfi.cvut.cz>
Sent: Monday, July 26, 2004 2:26 PM
Subject: Re: z html do txt


> Dobré odpoledne,
>
> pokud Vám stačí hodně hrubý převod, zkuste použít
>
>     ftp://ftp.braillnet.cz/sova/html2txt.zip
>
> -- je to DOSovský program, který sice hravě zvládne více souborů najednou,
> ale u složitějších stránek nemusí být výsledek uspokojivý (viz popis
funkce
> programu níže).
>
> S pozdravem
>
> Michal Jungmann
>
>
> HTML2TXT 1.0 BETA02
> -------------------
>
> Program provádí následující úpravy:
>
> 1. Vynechá všechny znaky mezi < a >; komentáře <-- až --> nejsou zvlášť
>    ošetřovány.
>
> 2. Entity &#nnn; převádí na znak s ASCII kódem nnn, dále převádí entity
>    &quot;, &amp;, &lt;, &gt;, entitu &nbsp; převádí na normální mezeru;
>    ostatní entity jsou kopírovány beze změny.
>
> 3. Konce řádků (znaky CR a LF) jsou ponechány tak, jak je autor zapsal
>    do textu stránky (není brán ohled na tag <br> apod. - viz bod 1).
>
> Toť vše. U složitějších stránek bude asi výsledek tragický, ale na
základní
> seznámení s obsahem jednodušších stránek by to mohlo stačit.
>
>
> 21.10.1999  Michal Jungmann <jungmann na braillnet.cz>
>
> ----- Original Message -----
> From: "Boženka Gogoláková" <gogolakova na nextra.sk>
> To: "Pro fanousky vypocetni techniky" <fanda na tereza.fjfi.cvut.cz>
> Sent: Monday, July 12, 2004 7:03 PM
> Subject: z html do txt
>
>
> > Ahojte,
> > na túto tému tu už prebehla nejedna diskusia. No i tak, neobjavil niekto
> > programček, ktorý by hromadne previedol trebárs sto html súborov do sto
> txt
> > súborov? Nejaké som objavila i ja, ale vie to pracovať len s jedným
> súborom.
> > Božka
> >
> >
>




Další informace o konferenci Fanda