• Opret dig
  • Glemt adgangskode

User account menu

  • Artikler
  • Forside
  • Forum
  • Nyheder
  • Log ind
Hjem
LinuxIN.dk

Breadcrumb

  • Hjem
  • forums
  • Søgning i PDF dokumenter

Snak med

Opret dig!

Af AndreasDK | 09.04.2011 10:43

Søgning i PDF dokumenter

Hjælp generelt
Hej.

Jeg overvejer at købe denne: http://www.edbpriser.dk/Product/Details.aspx?pid=4301963 og bruge den til at scanne mine notesbøger ind, da de er ved at falde fra hinanden.

Jeg foretrækker gammeldags notesbøger men vil gerne gemme dem for eftertiden, så jeg kom til at overveje om jeg vil kunne scanne dem ind som PDF filer og så søge i indholdet?

For eksempel lave en søgning efter "Doppler, Erland Doe" og så få vist resultaterne inde i selve filerne, selvom de er håndskrevne.
  • Log ind eller opret dig for at tilføje kommentarer

Kommentarer20

# 1

14 år 2 måneder siden

Permalink

Indsendt af hunterkil den 9. april 2011 kl. 11:16

Permalink

Tror desværre det vil blive

Tror desværre det vil blive en rigtig stor omgang -hvis du skal have søgbare pdf filer så skal du have dine notesbøger igennem OCR som kan genkende teksten -og ja alt efter håndskrift kan det blive virkelig svært.

Hvis du bare scanner dokumenterne normalt så vil det jo bare være A4 billeder i pdf filerne

Du vil dog nok kunne "tagge" dokumenterne og lave en slags arkiv på den måde
  • Log ind eller opret dig for at tilføje kommentarer

# 2

14 år 2 måneder siden

Permalink

Indsendt af AndreasDK den 9. april 2011 kl. 11:21

Permalink

Okay.
Det var da trist, men

Okay.

Det var da trist, men du skal have mange tak for svaret.

Hav en god Lørdag :)
  • Log ind eller opret dig for at tilføje kommentarer

# 3

14 år 2 måneder siden

Permalink

Indsendt af marlar den 9. april 2011 kl. 13:14

Permalink

Men forudsat dokumenterne

Men forudsat dokumenterne ellers er søgbare, findes der så et program der kan søge i alle pdf-filer i en undermappe?

Lige nu bruger jeg total commander under wine til dette og det fungerer fint, men der er jo nok en Linux løsning også :-)
  • Log ind eller opret dig for at tilføje kommentarer

# 4

14 år 2 måneder siden

Permalink

Indsendt af hunterkil den 9. april 2011 kl. 14:11

Permalink

#3 Jeg har brugt Adobe

#3 Jeg har brugt Adobe Acrobat Reader -fungerer glimrende

Er dog vis på at tracker også kan
  • Log ind eller opret dig for at tilføje kommentarer

# 5

14 år 2 måneder siden

Permalink

Indsendt af dudsen den 10. april 2011 kl. 09:52

Permalink

PDF med text ja

Så godt som alle desktop søge pragrammer herunder beagle kan læse og indexere PDF inclusiv metadata.

Der findes tool til at omdanne PDF til tekst.

Skal at det skal virke optimalt er PDF\A at foretrække fra adobe PDF.
  • Log ind eller opret dig for at tilføje kommentarer

# 6

14 år 2 måneder siden

Permalink

Indsendt af frogmaster den 10. april 2011 kl. 10:27

Permalink

Åbn PDF dokumentet i Chromium

Tryk CTRL+f - skriv søgeordet.
  • Log ind eller opret dig for at tilføje kommentarer

# 7

14 år 2 måneder siden

Permalink

Indsendt af anonym2 den 10. april 2011 kl. 10:31

Permalink

#5, #6 Hvis I kan søge på

#5, #6 Hvis I kan søge på håndskrevne dokumenter, vil jeg meget gerne vide hvordan I gør det....

Eller måske I skulle læse hele indlægget før I bare svarer... ;)
  • Log ind eller opret dig for at tilføje kommentarer

# 8

14 år 2 måneder siden

Permalink

Indsendt af marlar den 10. april 2011 kl. 10:39

Permalink

#7
Det er nok fordi jeg

#7
Det er nok fordi jeg drejede tråden en smule ved at spørge om søgning i pdf filer generelt.

Du kan prøve en af de online OCR scannere, fx har jeg rigtigt gode erfaringer med http://www.onlineocr.net/ selv om jeg dog aldrig har prøvet med håndskrift. Når du først har konverteret til tekst er resten let nok. Prøv evt også at google OCR handwritten etc.

#6
Vi taler om at søge i fx 50 pdf dokumenter, så at åbne dem en for en i Chrome er næppe hensigtsmæssigt.

  • Log ind eller opret dig for at tilføje kommentarer

# 9

14 år 2 måneder siden

Permalink

Indsendt af frogmaster den 10. april 2011 kl. 10:46

Permalink

#7 Reagerer på søgning i PDF

Ikke på søgning i billeder. Det er der allerede svaret på. Det kræver OCR, men er ikke hensigtsmæssigt, slet ikke håndskrevet.

Er PDF gemt som håndskrevne billeder, og vil man søge i dem, så bruger man en skrup forkert metode.

Hvis dokumenterne er downloadet, altså man ikke selv har lavet dem, ja så har man et problem.
  • Log ind eller opret dig for at tilføje kommentarer

# 10

14 år 2 måneder siden

Permalink

Indsendt af AndreasDK den 10. april 2011 kl. 13:31

Permalink

Findes der en anden måde

Findes der en anden måde jeg vil kunne gøre det?

De fleste af mine notesbøger er på omkring 30-50 sider, men der er da et par enkelte omkring de 100 sider med håndskrift, tegninger og jeg ved ikke hvad.

Jeg er ikke interesseret i at omdanne til computerskrift.
  • Log ind eller opret dig for at tilføje kommentarer

# 11

14 år 2 måneder siden

Permalink

Indsendt af marlar den 10. april 2011 kl. 14:21

Permalink

Det eneste realistiske er

Det eneste realistiske er nok at indscanne noterne til fx pdf og så indsætte stikord som metadata eller tags. Så kan du i det mindste søge på overordnede emner. På sin vis skal du betragte og behandle dine noter som billeder. Du kan således kun søge i dine billeder hvis du har tagget dem på passende vis fx ferie, familie, natur, solnedgang etc.

Men du skulle nu alligevel prøve OCR af dem. Selv der vil være en del fejl er det måske korrekt nok til at fungere som et søgbart indeks til dine indscannede (ikke OCR) noter.
  • Log ind eller opret dig for at tilføje kommentarer

# 12

14 år 2 måneder siden

Permalink

Indsendt af Anonym4 den 10. april 2011 kl. 14:21

Permalink

Du kan jo sagtens skanne

Du kan jo sagtens skanne dine notesbøger ind og gemme dem som PDF-filer. Derefter skal du jo blot bladre i dem som i en almindelig bog. 50 sider er vel ikke helt uigennemskueligt, selvom du mangler en søgefunktion.

Men du kunne jo også efterfølgende redigere PDF-dokumenterne i fx Writer (Open-/Libreoffice) og tilføje relevante søgeord med almindelig tekst for kapitler, afsnit og lignende.
  • Log ind eller opret dig for at tilføje kommentarer

# 13

14 år 2 måneder siden

Permalink

Indsendt af anonym2 den 10. april 2011 kl. 14:30

Permalink

#11, #12 Nogenlunde samme

#11, #12 Nogenlunde samme svar på præcis samme tidspunkt... :)
  • Log ind eller opret dig for at tilføje kommentarer

# 14

14 år 2 måneder siden

Permalink

Indsendt af AndreasDK den 10. april 2011 kl. 16:05

Permalink

#12
Det lyder lovende at man

#12

Det lyder lovende at man kan det.

Jeg har dog lige forsøgt at åbne et 1 sides pdf dokument (maskinskrevet) med Writer og det gav mig 725 siders computersprog.

Er det en speciel måde man skal åbne pdf filerne på i Writer for at kunne give hver side en overskrift jeg vil kunne søge efter?
  • Log ind eller opret dig for at tilføje kommentarer

# 15

14 år 2 måneder siden

Permalink

Indsendt af Anonym4 den 10. april 2011 kl. 16:26

Permalink

Du har ret. Jeg mente

Du har ret. Jeg er ikke lige sikker på alligevel, om man kan indsætte tekst og derefter søge på det...

Men du kan i hvertfald sagtens indsætte billeder fra scanninger i et tekstdokument og man burde jo så også kunne tilføje tekst og gemme det hele i write...
  • Log ind eller opret dig for at tilføje kommentarer

# 16

14 år 2 måneder siden

Permalink

Indsendt af anonym2 den 10. april 2011 kl. 16:27

Permalink

Elle måske du kan bruge en

Elle måske du kan bruge en PDF-editor som 'flpsed' (ubuntu)..
  • Log ind eller opret dig for at tilføje kommentarer

# 17

14 år 2 måneder siden

Permalink

Indsendt af mich den 10. april 2011 kl. 17:04

Permalink

Der er flere muligheder

Se http://en.wikipedia.org/wiki/List_of_PDF_software under Editors.

Inkscape, Gimp og OpenOffice.Draw kan importere pdf, og OpenOffice.Writer kan med denne extension:
http://extensions.services.openoffice.org/node/874

Hvis du alligevel skal til at scanne, vil mit første valg nok være, at indsætte billederne i et tekstdokument, som #15 foreslår, og indsætte stikord og evt et kort resume til hver.
Du kan jo altid eksportere resultatet til pdf, hvis du foretrækker det format.
  • Log ind eller opret dig for at tilføje kommentarer

# 18

14 år 2 måneder siden

Permalink

Indsendt af AndreasDK den 10. april 2011 kl. 18:24

Permalink

Tak for alle jeres svar

Tak for alle jeres svar :-)

Nu har jeg en masse ideer at gå ud fra.
  • Log ind eller opret dig for at tilføje kommentarer

# 19

14 år 2 måneder siden

Permalink

Indsendt af frogmaster den 11. april 2011 kl. 15:59

Permalink

#18 - Desværre nok ikke

Linux Document Viewer, standard installeret i Mint Julia, er et udmærket program til PDF, men kan ikke søge i billeder. Det er der intet der kan, før PDF billeder er OCR konverteret til tekst, og OCR vil lave mange fejl med håndskrift, hvis OCR overhovedet kan læse skriften.

En ganske udmærket ide at insætte billederne i en tekst editor og tilføje søgeord, men nr. et er og bliver at skrive det hele om på computeren.

Inkscape kan læse PDF og gengive dem rimeligt. Import PDF Plugin til OOWriter 3.2.1 bryder sammen når man forsøger.

Det ultimative program til PDF filer er ikke Adobe's egne, men NitroPDF, der desværre kun findes til Windows og koster penge. Prøv ikke at installere Nitro PDF i Wine.

Søgning på Nitro PDF for Linux hvor du kan også kan se, at spørgsmålet før er taget op her i LinuxIN (2009).

http://www.google.dk/search?aq=f&sourceid=chrome&client=ubuntu&channel=…

Flere fantasifulde foreslag, hvor kun et par enkelte er realistiske, og hvor #1 Hunterkill desværre for dig har ret, men held og lykke.

Mvh
  • Log ind eller opret dig for at tilføje kommentarer

# 20

14 år 2 måneder siden

Permalink

Indsendt af sol0 den 11. april 2011 kl. 20:40

Permalink

læs

#0 Scannere sucks. Brug istedet, hvis du har mulighed for det et digital kamera og en hvid lys kilde. Som regel >8mpix til en A4 side.

Bruger selv noget lignende som denne:
http://en.wikipedia.org/wiki/File:Book_scanner.svg

Med selv kommercielt og proprietær software, der har specialiseret sig i håndskrivning OCR vil det stadig være meget svært - desværre. #11's svar er lovende til dit projekt.

http://scantailor.sourceforge.net/
  • Log ind eller opret dig for at tilføje kommentarer

Svar søges

Chatgpt satire 0
BigLinux 0
llumos Unix-operativsystem, 0
Den er go 0
14. februar = I Love Free Software Day 0

Seneste aktivitet

Læsning af databasefil i Firefox 2
Vanilla OS 15
Backup/synkronisering? 2
Pepsi Challenge 4
"Intet realistisk alternativ" - mig i r*ven 10
Linuxin er nu migreret til Drupal 11 13
Et Dansk alternativ til Facebook 18
Ingen Mint 3
Ekstern Blu-ray-brænder, der fungerer med PCLinuxOS 3
Københavns og Aarhus Kommune dropper MS 9
Open Source-eksperimentet 1
Microsoft og Google ud af de danske skoler 2
Udfordringer med lydin på Debian 12 1
ExplainingComputers? 2
Nextcloud på mobilen 1
Vil du have et sikrere og mere privat internet? Du skal blot installere Vivaldi-browseren med Proton VPN understøttelse! 1
Ny Linuxin på vej :) 43
5G 9
Edit 12
PCLinuxOS 23

© 2025 Linuxin og de respektive skribenter

Oprettet og drevet af nørder siden 2004 !