z html do txt
Michal Jungmann
jungmann na braillnet.cz
Pondělí Červenec 26 14:26:02 CEST 2004
Dobré odpoledne,
pokud Vám stačí hodně hrubý převod, zkuste použít
ftp://ftp.braillnet.cz/sova/html2txt.zip
-- je to DOSovský program, který sice hravě zvládne více souborů najednou,
ale u složitějších stránek nemusí být výsledek uspokojivý (viz popis funkce
programu níže).
S pozdravem
Michal Jungmann
HTML2TXT 1.0 BETA02
-------------------
Program provádí následující úpravy:
1. Vynechá všechny znaky mezi < a >; komentáře <-- až --> nejsou zvlášť
ošetřovány.
2. Entity &#nnn; převádí na znak s ASCII kódem nnn, dále převádí entity
", &, <, >, entitu převádí na normální mezeru;
ostatní entity jsou kopírovány beze změny.
3. Konce řádků (znaky CR a LF) jsou ponechány tak, jak je autor zapsal
do textu stránky (není brán ohled na tag <br> apod. - viz bod 1).
Toť vše. U složitějších stránek bude asi výsledek tragický, ale na základní
seznámení s obsahem jednodušších stránek by to mohlo stačit.
21.10.1999 Michal Jungmann <jungmann na braillnet.cz>
----- Original Message -----
From: "Boženka Gogoláková" <gogolakova na nextra.sk>
To: "Pro fanousky vypocetni techniky" <fanda na tereza.fjfi.cvut.cz>
Sent: Monday, July 12, 2004 7:03 PM
Subject: z html do txt
> Ahojte,
> na túto tému tu už prebehla nejedna diskusia. No i tak, neobjavil niekto
> programček, ktorý by hromadne previedol trebárs sto html súborov do sto
txt
> súborov? Nejaké som objavila i ja, ale vie to pracovať len s jedným
súborom.
> Božka
>
>
Další informace o konferenci Fanda