» »

Regex help

Regex help

Pat_MaGroin ::

Pozdravljeni, regex guruji slo-techa :).

Imam en problem.

V notepad++ lahko odprem eno datoteko, kjer je notri par 10 mio besed besedila.

a/e/o/u/w/z so črke, ki pa v bistvu lahko predstavljajo besede, sledi jim presledek, nato pa običajna beseda ali pa morda še ena črka in potem normalna beseda.

Primer:

A beseda
beseda w beseda
beseda w z beseda.
W beseda
W u beseda

itd.

Skratka, rad bi napisal regex, ki bi mi v vseh teh primerov breaking space zamenjal z non-breaking space.

Prišel sem do sem: Find: ([\s\[\("]|^)(a|A|i|I|o|O|u|U|w|W|z|Z) +
Replace: $1N (N = dejanski non-breaking space).

Težava je, da moj regex ne zajame primerov, ko si sledita a in w ter nato daljša beseda.

Verjamem, da je to komu mala malica, please help! :)

LP

ReRMh ::

tu imaš pa ne najedaj nadvsezgodaj in razišči sam (1, 2) :D

na uč izgleda problematičen presledek ) +

Ahim ::

Pat_MaGroin je izjavil:

Prišel sem do sem: Find: ([\s\[\("]|^)(a|A|i|I|o|O|u|U|w|W|z|Z) +
Replace: $1N (N = dejanski non-breaking space).

Težava je, da moj regex ne zajame primerov, ko si sledita a in w ter nato daljša beseda.

Ja seveda ce si pa dolocil eksplicitno kaj sploh sme biti pred capturing groupom (in tega ni veliko, predvsem pa ne vsebuje tvojega a).

Tudi opis tvojega problema ni cisto jasen - ce naj bi se zamenjal presledek z NBSP (torej 1 za 1), potem zdaj ne deluje, ker pogoltnes tudi po vec presledkov za en NBSP.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Kje in kako dobiti vse črke abecede? (strani: 1 2 )

Oddelek: Programiranje
555618 (3916) Gagatronix
»

branje iz datoteke c#

Oddelek: Programiranje
141638 (1367) darkolord
»

Error znaki

Oddelek: Omrežja in internet
6876 (802) 64202
»

NO@SPAM

Oddelek: Izdelava spletišč
111387 (1081) BSD-jas
»

Dreamweaver 4 -- help

Oddelek: Omrežja in internet
201290 (1144) Elemen_T

Več podobnih tem