z html do txt

Michal Jungmann jungmann na braillnet.cz
Pondělí Červenec 26 14:26:02 CEST 2004


Dobré odpoledne,

pokud Vám stačí hodně hrubý převod, zkuste použít

    ftp://ftp.braillnet.cz/sova/html2txt.zip

-- je to DOSovský program, který sice hravě zvládne více souborů najednou,
ale u složitějších stránek nemusí být výsledek uspokojivý (viz popis funkce
programu níže).

S pozdravem

Michal Jungmann


HTML2TXT 1.0 BETA02
-------------------

Program provádí následující úpravy:

1. Vynechá všechny znaky mezi < a >; komentáře <-- až --> nejsou zvlášť
   ošetřovány.

2. Entity &#nnn; převádí na znak s ASCII kódem nnn, dále převádí entity
   &quot;, &amp;, &lt;, &gt;, entitu &nbsp; převádí na normální mezeru;
   ostatní entity jsou kopírovány beze změny.

3. Konce řádků (znaky CR a LF) jsou ponechány tak, jak je autor zapsal
   do textu stránky (není brán ohled na tag <br> apod. - viz bod 1).

Toť vše. U složitějších stránek bude asi výsledek tragický, ale na základní
seznámení s obsahem jednodušších stránek by to mohlo stačit.


21.10.1999  Michal Jungmann <jungmann na braillnet.cz>

----- Original Message ----- 
From: "Boženka Gogoláková" <gogolakova na nextra.sk>
To: "Pro fanousky vypocetni techniky" <fanda na tereza.fjfi.cvut.cz>
Sent: Monday, July 12, 2004 7:03 PM
Subject: z html do txt


> Ahojte,
> na túto tému tu už prebehla nejedna diskusia. No i tak, neobjavil niekto
> programček, ktorý by hromadne previedol trebárs sto html súborov do sto
txt
> súborov? Nejaké som objavila i ja, ale vie to pracovať len s jedným
súborom.
> Božka
>
>




Další informace o konferenci Fanda