Søgning i PDF dokumenter
Hej.
Jeg overvejer at købe denne: http://www.edbpriser.dk/Product/Details.aspx?pid=4301963 og bruge den til at scanne mine notesbøger ind, da de er ved at falde fra hinanden.
Jeg foretrækker gammeldags notesbøger men vil gerne gemme dem for eftertiden, så jeg kom til at overveje om jeg vil kunne scanne dem ind som PDF filer og så søge i indholdet?
For eksempel lave en søgning efter "Doppler, Erland Doe" og så få vist resultaterne inde i selve filerne, selvom de er håndskrevne.
Jeg overvejer at købe denne: http://www.edbpriser.dk/Product/Details.aspx?pid=4301963 og bruge den til at scanne mine notesbøger ind, da de er ved at falde fra hinanden.
Jeg foretrækker gammeldags notesbøger men vil gerne gemme dem for eftertiden, så jeg kom til at overveje om jeg vil kunne scanne dem ind som PDF filer og så søge i indholdet?
For eksempel lave en søgning efter "Doppler, Erland Doe" og så få vist resultaterne inde i selve filerne, selvom de er håndskrevne.
Kommentarer20
Tror desværre det vil blive
Hvis du bare scanner dokumenterne normalt så vil det jo bare være A4 billeder i pdf filerne
Du vil dog nok kunne "tagge" dokumenterne og lave en slags arkiv på den måde
Okay.
Det var da trist, men
Det var da trist, men du skal have mange tak for svaret.
Hav en god Lørdag :)
Men forudsat dokumenterne
Lige nu bruger jeg total commander under wine til dette og det fungerer fint, men der er jo nok en Linux løsning også :-)
#3 Jeg har brugt Adobe
Er dog vis på at tracker også kan
PDF med text ja
Der findes tool til at omdanne PDF til tekst.
Skal at det skal virke optimalt er PDF\A at foretrække fra adobe PDF.
Åbn PDF dokumentet i Chromium
#5, #6 Hvis I kan søge på
Eller måske I skulle læse hele indlægget før I bare svarer... ;)
#7
Det er nok fordi jeg
Det er nok fordi jeg drejede tråden en smule ved at spørge om søgning i pdf filer generelt.
Du kan prøve en af de online OCR scannere, fx har jeg rigtigt gode erfaringer med http://www.onlineocr.net/ selv om jeg dog aldrig har prøvet med håndskrift. Når du først har konverteret til tekst er resten let nok. Prøv evt også at google OCR handwritten etc.
#6
Vi taler om at søge i fx 50 pdf dokumenter, så at åbne dem en for en i Chrome er næppe hensigtsmæssigt.
#7 Reagerer på søgning i PDF
Er PDF gemt som håndskrevne billeder, og vil man søge i dem, så bruger man en skrup forkert metode.
Hvis dokumenterne er downloadet, altså man ikke selv har lavet dem, ja så har man et problem.
Findes der en anden måde
De fleste af mine notesbøger er på omkring 30-50 sider, men der er da et par enkelte omkring de 100 sider med håndskrift, tegninger og jeg ved ikke hvad.
Jeg er ikke interesseret i at omdanne til computerskrift.
Det eneste realistiske er
Men du skulle nu alligevel prøve OCR af dem. Selv der vil være en del fejl er det måske korrekt nok til at fungere som et søgbart indeks til dine indscannede (ikke OCR) noter.
Du kan jo sagtens skanne
Men du kunne jo også efterfølgende redigere PDF-dokumenterne i fx Writer (Open-/Libreoffice) og tilføje relevante søgeord med almindelig tekst for kapitler, afsnit og lignende.
#11, #12 Nogenlunde samme
#12
Det lyder lovende at man
Det lyder lovende at man kan det.
Jeg har dog lige forsøgt at åbne et 1 sides pdf dokument (maskinskrevet) med Writer og det gav mig 725 siders computersprog.
Er det en speciel måde man skal åbne pdf filerne på i Writer for at kunne give hver side en overskrift jeg vil kunne søge efter?
Du har ret. Jeg mente
Men du kan i hvertfald sagtens indsætte billeder fra scanninger i et tekstdokument og man burde jo så også kunne tilføje tekst og gemme det hele i write...
Elle måske du kan bruge en
Der er flere muligheder
Inkscape, Gimp og OpenOffice.Draw kan importere pdf, og OpenOffice.Writer kan med denne extension:
http://extensions.services.openoffice.org/node/874
Hvis du alligevel skal til at scanne, vil mit første valg nok være, at indsætte billederne i et tekstdokument, som #15 foreslår, og indsætte stikord og evt et kort resume til hver.
Du kan jo altid eksportere resultatet til pdf, hvis du foretrækker det format.
Tak for alle jeres svar
Nu har jeg en masse ideer at gå ud fra.
#18 - Desværre nok ikke
En ganske udmærket ide at insætte billederne i en tekst editor og tilføje søgeord, men nr. et er og bliver at skrive det hele om på computeren.
Inkscape kan læse PDF og gengive dem rimeligt. Import PDF Plugin til OOWriter 3.2.1 bryder sammen når man forsøger.
Det ultimative program til PDF filer er ikke Adobe's egne, men NitroPDF, der desværre kun findes til Windows og koster penge. Prøv ikke at installere Nitro PDF i Wine.
Søgning på Nitro PDF for Linux hvor du kan også kan se, at spørgsmålet før er taget op her i LinuxIN (2009).
http://www.google.dk/search?aq=f&sourceid=chrome&client=ubuntu&channel=…
Flere fantasifulde foreslag, hvor kun et par enkelte er realistiske, og hvor #1 Hunterkill desværre for dig har ret, men held og lykke.
Mvh
læs
Bruger selv noget lignende som denne:
http://en.wikipedia.org/wiki/File:Book_scanner.svg
Med selv kommercielt og proprietær software, der har specialiseret sig i håndskrivning OCR vil det stadig være meget svært - desværre. #11's svar er lovende til dit projekt.
http://scantailor.sourceforge.net/