• Opret dig
  • Glemt adgangskode

User account menu

  • Artikler
  • Forside
  • Forum
  • Nyheder
  • Log ind
Hjem
LinuxIN.dk

Snak med

Opret dig!

Af stizzel | 05.04.2022 21:26

Søg multiple pdf filer for indhold

Software
Findes der et program / script / whatever
som kan søge multiple pdf filer igennem for den tekststreng jeg søger på ?

1. Jeg skriver et søge ord
2. Jeg får vist en liste over relevante pdf filer med det indhold jeg søger på
3. Jeg kan trykke på hver enkelte pdf fil, og få vist et preview af siden i pdfen, så jeg kan se om det er det rigtige indhold som programmet har fundet.

Jeg ved der findes et program til mac der hedder devonthink.

Til linux findes der noget der hedder recoll - recoll er dog et sindsygt ringe program - så den er udelukket.

Har i kloge hoveder en smart løsning ?. Måske en anden løsning som er bedre som jeg ikke har tænkt på ?

Vh
  • Log ind eller opret dig for at tilføje kommentarer

Kommentarer3

# 1

3 år 12 måneder siden

Permalink

Indsendt af osjensen den 5. april 2022 kl. 22:07

Permalink

Hvis din pdf filer er i

Hvis din pdf filer er i /home/stizzel/Documents/ - kan du prøve:

pdfgrep -R 'det du søger' /home/stizzel/Documents/

Ser ud til at fungere.

  • Log ind eller opret dig for at tilføje kommentarer

# 2

3 år 12 måneder siden

Permalink

Indsendt af phoenix den 6. april 2022 kl. 20:41

Permalink

Apache Tika

Du kan evt. benytte Apache Tika

Den kan scanne mange andre formater udover PDF (diverse billed formater, PowerPoint, ...) og kan også OCR scanne og trække metadata med ud.
Den Gemmer i XHTML filer som du så kan søge igennem med fx. grep.

Du downloader en JAR fil, så det kræver Java for at kunne afvikle.

Dette script læser alle filer i mappen dokumenter/ og gemmer dem som XHTML filer i out/ mappen:

#!/usr/bin/env bash

for x in `ls dokumenter`; do
java -jar tika-app-1.20.jar dokumenter/${x} > out/${x}.xml
done

  • Log ind eller opret dig for at tilføje kommentarer

# 3

3 år 11 måneder siden

Permalink

Indsendt af marlar den 10. april 2022 kl. 22:12

Permalink

Jeg bruger Total Command via

Jeg bruger Total Commander via wine til præcis den opgave. Der er mange plugins til TC, heriblandt et PDF-plugin.

Hvis du vil have et ren linuxløsning, kunne det være Midnight Commander-> Eksternt panelisering > pdfgrep.

Ekstern panelisering vil sige at man får udfyldt en filliste med resultatet fra et ekstern program.
  • Log ind eller opret dig for at tilføje kommentarer

Svar søges

Ubuntu MATE grundlægger Martin Wimpress træder tilbage efter 12 år 0
Canonical planlægger Kontroversielle GRUB ændringer til Ubuntu 26.10 Secure Boot 0
tst 0
Linux Fanpakke til LUG'er og foreninger 0
KDE Plasma 6.6 skrivebordsmiljø udgivet 0

Seneste aktivitet

OpenShot 3.5 tager et spring fremad inden for ydeevne, AI og videoredigering 4
(U)hyggen breder sig 6
rsync og filsystem 7
Stor sejr for open source, da Tyskland støtter åbent dokumentformat 2
youtube-tui: Nyd YouTube fra terminalen som en professionel 5
Lukker og slukker 8
BigLinux 6
Det engang så elskede PCLinuxOS er tilbage - og det er stadig en fantastisk Windows erstatning 1
Mousam er en detaljeret desktop vejrapp til Linux 1
Hjælp til Handbrake - ingen dk-undertekster 1
luckyBackup 2
GIMP 30
Pinegrow på Debian 13 ? 4
Openmediavault 1
E-mail blues 9
Driver til min scanner? 5
Printer Epson ET-2865 problem 16
Sudo 7
Thunderbird filvedligeholdelse 2
Debian 13.3.0 8

© 2026 Linuxin og de respektive skribenter

Oprettet og drevet af nørder siden 2004 !