[Fanda] triky a typy na skenovanie konkretnej knihy

gp1 gp1 na nextra.sk
Středa Říjen 23 12:42:08 CEST 2013


Ahoj Luboš!
Na knihy potrebuješ v prvom rade robustný stolný scaner, slimy sa prehýbajú 
a zasekávajú už pri malom prítlaku.
Bez pomoci zraku korektne zvládneš len prvú operáciu digitalizácie- 
scanovanie.
Definovanie blokov textu, tabuliek či grafiky, je možné vykonať len za 
pomoci myši.
Automatika v tomto bode občas zlyháva.
Nasleduje OCR.
Surový text treba ešte preformátovať a zalomiť.
Túto operáciu musí robiť vidiaci.
Aj korekturu porovnaním podla originálu zvládne len vidiace oko.
Učebnice, slovníky, či odborné texty s tabulkami, obrázkami, grafmi, tak to 
je zaberák aj pre pár ludí cca 50 - 100 hodin práce.
Tabulky bývajú niekedy zalomené tak, že prebiehajú cez dve strany, prípadne 
pokračujú na dalšej.
To ani nehovorím o nekvalitnej tlači na mizernom papieri.
V tomto ohlade zistujem, že čím je staršia kniha, tým je kvalitnejšia tlač a 
kvalitný papier.
Ked som scanoval staré vydanie Tarzana, tak na 50 strán textu som mal po OCR 
vadné len jedno písmenko...

Ak digitalizujeme len jednoduchý text, tak v tom prípade je šanca dosiahnuť 
akú - takú kvalitu, pomerne dobrá. V každom prípade potrebujeme kontrolovať 
výsledok vidiacim asistentom. Inak vytvoríme len chybový materiál približnej 
informačnej úrovne.

Peter

----- Pôvodná správa ----- 
Od: "Lubos Pintes" <lubos.pintes na gmail.com>
Komu: <fanda na elsa.cvut.cz>
Odoslané: 23. októbra 2013 11:36
Predmet: Re: [Fanda] triky a typy na skenovanie konkretnej knihy


> Ak sa jedná o jazykovú knihu hrubo riskuješ chyby. Najlepší tip podľa mňa 
> je aby to spravil vidiaci. Ináč sa budeš učiť kraviny.
> Napr. ak sa pokúsim skenovať aj tú najjednoduchšiu matematiku, výsledok po 
> rozpoznaní nedáva zmysel. Druhá najhoršia možnosť pre nás je jazyková 
> učebnica.
>
> Dňa 22. 10. 2013 20:59 Adelcia wrote / napísal(a):
>> ,
>>
>> ide mi o serioznu a vaznu vec. Potrebujem naskenovat knizku s ktorej sa 
>> chcem ja sama ucit.
>> mam tu
>> win8
>> nvda
>> ABBYY FineReader 9.0 Professional Edition
>> skener - WIA CanoScan LiDE 90
>> a knizku v jazykoch slovencina a holandcina, s rozmermi 116 krat 165 mm 
>> je to este mensie ako a5.
>>
>> kazdy z vas kto ma akekolvek rady, alebo typy na co najspravnejsie 
>> skenovanie lebo zatial som nic vecsie ako np papier a4 s uradu velmi 
>> neskenovala, tak mi ich prosim dohodte.
>>
>> diky adela.
>>
> 




Další informace o konferenci Fanda