• Opret dig
  • Glemt adgangskode

User account menu

  • Artikler
  • Forside
  • Forum
  • Nyheder
  • Log ind
Hjem
LinuxIN.dk

Snak med

Opret dig!

Af dudsen | 07.03.2014 10:10

[ LØST ] iriterende regex problem med newline

Programmering
Jeg er løbet ind i et problem med regex det jeg vil er at erstate newline med \| for at kunne fodre output til grep, mit problem er at både perl og tr ser ud til at matche "end of line" og ikke bare linjeskift ie jeg vil ikke have strengen afsluttet med "\|"

udsen@ubmain:~$ cat testfile2
1234
5678
8910
udsen@ubmain:~$ perl -pe 's/\R/\\\|/g' testfile2 ; echo ""
1234\|5678\|8910\|
udsen@ubmain:~$ tr '\n' ';' < testfile2 ; echo ""
1234;5678;8910;

jeg har forsøgt med \R i stedet for \n og med samme resultat. Er der et eller andet åbentlyst jeg har glemt.
En note her er at hvis jeg opretter filen under windows(notepad+ med unix line endings) så er der ikke en EOL karakter i slutningen af filen og dermed virker det.
Jeg har et woraround med et regex der fjerner den sidste "\|" men vil egentligt heller at kunne gøre det i en regex streng.

  • Log ind eller opret dig for at tilføje kommentarer

Kommentarer6

# 1

11 år 7 måneder siden

Permalink

Indsendt af mich den 7. marts 2014 kl. 11:15

Permalink

Du giver næsten selv

#0:

Du giver næsten selv svaret. Prøv med
tr '\n' '|' < testfile2 ; echo ""
  • Log ind eller opret dig for at tilføje kommentarer

# 2

11 år 7 måneder siden

Permalink

Indsendt af dudsen den 7. marts 2014 kl. 11:38

Permalink

Du giver næsten selv

#1:
Du giver næsten selv svaret. Prøv med
tr '\n' '|' < testfile2 ; echo ""


Den matcher stadigvæk EOL og ikke kun newline men fejlen kan værre i filen, jeg har forsøgt at oprette en fil både med echo "number" >> filnavn og vim og der er samme adfærd.'

"fejlen" hvis det er en fejl og ikke bare et problem med min forståelse af regex er at resultater er
"1234\|5678\|9012\|" istedet for ""1234\|5678\|9012"

"\|" konstruktionen er med vilje her fordi min grep ellers opfatter | som | og ikke "eller".
  • Log ind eller opret dig for at tilføje kommentarer

# 3

11 år 7 måneder siden

Permalink

Indsendt af mrbrown79 den 7. marts 2014 kl. 13:02

Permalink

Her i arbejdstiden bliver

Her i arbejdstiden bliver det uden nærmere forklaringer, men dem er du formodentlig også i stand til selv at slå op:)

perl -0777 -pe 's/\n/\\|/g' testfile
  • Log ind eller opret dig for at tilføje kommentarer

# 4

11 år 7 måneder siden

Permalink

Indsendt af dudsen den 7. marts 2014 kl. 13:59

Permalink

perl -0777 -pe

#3:
perl -0777 -pe 's/\n/\\|/g' testfile


Slurp giver samme resultat

~$ perl -0777 -pe 's/\n/\\|/g' testfile3 ; echo ""
1234\|5678\|9012\|

Jeg kan dog med \z matche den sidste linie. Jeg har iøvrigt fået læst op på hvordan unix filer er bygget op og er kommet frem til at problemet realt er min forståelse, der er ingen forskel på EOF(filafslutning) og linieskift ie det jeg forsøger er nok ikke realt muligt men tak for hjælpen folkens.
  • Log ind eller opret dig for at tilføje kommentarer

# 5

11 år 7 måneder siden

Permalink

Indsendt af mrbrown79 den 7. marts 2014 kl. 14:10

Permalink

#4Det virker umiddelbart

#4

Det virker umiddelbart hos mig

$ cat testfile
1234
5678
8910
8910

Der er ingen linjeskift til sidst (jeg måtte lave filen i emacs, for 'vi' ville indsætte linjeskift:
$ hexdump -c testfile
0000000 1 2 3 4 \n 5 6 7 8 \n 8 9 1 0 \n 8
0000010 9 1 0
0000013

$ perl -0777 -pe 's/\n/\\|/g' testfile
1234\|5678\|8910\|8910

  • Log ind eller opret dig for at tilføje kommentarer

# 6

11 år 7 måneder siden

Permalink

Indsendt af dudsen den 7. marts 2014 kl. 14:56

Permalink

[ LØST ] filformat

#5: Der er ingen linjeskift til sidst (jeg måtte lave filen i emacs, for 'vi' ville indsætte linjeskift:

Kom frem til det samme standard adfærd er altid at sætte et linie skift ind i slutningen af en fil hvis det ikke er der så virker mit oprindelige regex hvis den er der så gør det ikke. hovedproblemet va at jeg fodrede perl med en fil der ikke så ud som jeg forventede.

$ hexdump -c testfile3
0000000 1 2 3 4 \n 5 6 7 8 \n 9 0 1 2 \n
000000f
$ hexdump -c data/tmp/testfile3
0000000 1 2 3 4 \n 5 6 7 8 \n 9 0 1 2
000000e

den første er med den sidste linie fjernet. Så jeg er nødt til at rense input først
$ perl -pe 'chomp if eof' testfile3 | perl -pe 's/\n/\\\|/g' ; echo ""
1234\|5678\|9012


Takker mange gange for hjælpen.
  • Log ind eller opret dig for at tilføje kommentarer

Svar søges

BigLinux 0
Amerikansk tastatur på dansk tastatur 0
FSF giver flere detaljer om sit nye Librephone projekt 0
Det eneste, der forhindrer dig i at skifte til Linux, er din tankegang 0
OpenZL. Et nyt open source-datakomprimeringsframework 0

Seneste aktivitet

Sådan konfigurerer du flatpaks' flathub til verified only 9
Brug carburetor til at forblive usynlig online 7
Plasma tapet-skifter 3
How to upgrade to LMDE 7 4
Virksomheder og enheder der kører på Linux 11
NordVPN har udgivet kildekoden til sin grafiske brugergrænseflade 2
Flere og flere bruger Brave browseren 1
LibreOffice og Collabora: Hvorfor er de ikke i skolerne i stedet for Word og Google Docs? 11
Firewall igen 5
Værdien ved open source 2
Sailfish på android telefon 1
Ladybird Browser 7
Satiriske ordspil 3
Kan ikke boote på installation 26
Tilføj signatur til Evolution mail 2
LUKS kryptering - Er der andre der bruger det 15
Dansk distro til software udviklere 2
Linux Debian 5
Brother printer installation 2
Den er go 6

© 2025 Linuxin og de respektive skribenter

Oprettet og drevet af nørder siden 2004 !