Bogscanning: OCR og indeksering - nogen tips eller erfaring?
Dear lazywebs,
overskriften siger det meste.
Jeg er på udkig efter nogle tips til scanning af bøger og et værktøj til at få det hele til at "ske". Desuden er jeg i tvivl om hvilket format jeg bør scanne til - jeg vil meget gerne have mit kildemateriale liggende i høj kvalitet, i det tilfælde at der skal ændres noget.
Jeg har kigget lidt på googles ocropus, dog ikke forsøgt mig med det endnu http://code.google.com/p/ocropus/
Til at scanne har jeg tænkt mig at bruge enten xsane eller gimp med sane plugin
Herefter er jeg særdeles blank - men jeg kunne forestille mig at der findes gui programmer der kan lette opgaven (vi taler trods alt flere hundrede sider). Måske endda programmet selv kan sørge for at få billede fra scanneren.
erfaringer og forslag er velkomne og modtages med ydmyghed :-)
7eis
overskriften siger det meste.
Jeg er på udkig efter nogle tips til scanning af bøger og et værktøj til at få det hele til at "ske". Desuden er jeg i tvivl om hvilket format jeg bør scanne til - jeg vil meget gerne have mit kildemateriale liggende i høj kvalitet, i det tilfælde at der skal ændres noget.
Jeg har kigget lidt på googles ocropus, dog ikke forsøgt mig med det endnu http://code.google.com/p/ocropus/
Til at scanne har jeg tænkt mig at bruge enten xsane eller gimp med sane plugin
Herefter er jeg særdeles blank - men jeg kunne forestille mig at der findes gui programmer der kan lette opgaven (vi taler trods alt flere hundrede sider). Måske endda programmet selv kan sørge for at få billede fra scanneren.
erfaringer og forslag er velkomne og modtages med ydmyghed :-)
7eis
Kommentarer1
Re: OCR
Prøv også at kigge i Wikipedia. Der er en artikel, der nævner en del OCR-programmer. Der er dog ikke så mange frie og ikke så mange til Linux, og en del af disse ser ud til at være under udvikling.
Mht. filformat, så ville jeg vælge et tabsfrit format under scanningen, tiff eller png f.eks. Så kan du altid konvertere senere, hvis softwaren kræver et andet format.