regex kombinacija negative, positive look behind ... @ Slo-Tech

Forum » Programiranje »
regex kombinacija negative, positive look behind ...

regex kombinacija negative, positive look behind ...

BRBR :: 7. feb 2012, 17:30

string npr:
'črnikasti sitovec Schoenus nigricans'
... in taki stringi v tem smislu dalje

regex:

[a-zšč] [A-Z]

super, to mi najde natančno 'c S' del stringa. Zdaj pa bi rad zadel natančno tisti presledek vmes, brez 'c' in 'S'.

Če ma kdo kak mušter za to ?

blackbfm :: 7. feb 2012, 19:03

(?![a-zšč])\s(?=[A-Z])

?

edit: ni čist to to, tisti prvi del ni v redu..ampak če ti zadostuje potem ok

Zgodovina sprememb…

spremenilo: blackbfm (7. feb 2012 ob 19:11)

BRBR :: 7. feb 2012, 19:27

Ja, hvala, deluje.

BRBR :: 11. feb 2012, 10:06

edit: ni čist to to, tisti prvi del ni v redu...

Torej če se držim tega muštra .. in hočem poiskat drugi presledek, zadetek veljaven samo v drugi vrstici:

"Oxychilus draparnaudi "
"Oxychilus draparnaudi draparnaudi "

Tole deluje, in res , prvi del iz zgornjega odgovora (spodaj manjka) pa ne deluje.

^"\w+ \w+ (?=[^"])

Kaj pa ni ok v prvem delu regexa iz prvega odgovora, da bi tole delovalo ?

Never underestimate the power of idiots in large groups.

Zgodovina sprememb…

spremenil: BRBR (11. feb 2012 ob 10:08)

MrBrdo :: 11. feb 2012, 11:24

A to rabiš za replace? K drgač se ponavad ne zafrkavam z lookbehind ampak samo več subexpressionov naredim pa potem tistega vzamem ki me zanima. Ne vem pa če je kej počasneje tako

MrBrdo

BRBR :: 11. feb 2012, 13:46

ja za replaca, 'subsp.' moram tamle vmes vrinit.

samo več subexpressionov naredim

ja če bi se mi dalo , in če bi se splačalo programirat, pa je brezveze, mam samo en velik text file , pa en editor, ki fajn podpira regex.

Never underestimate the power of idiots in large groups.

Spura :: 11. feb 2012, 13:51

BRBR je 11. feb 2012 ob 10:06 izjavil:

edit: ni čist to to, tisti prvi del ni v redu...

Torej če se držim tega muštra .. in hočem poiskat drugi presledek, zadetek veljaven samo v drugi vrstici:

"Oxychilus draparnaudi "
"Oxychilus draparnaudi draparnaudi "

Tole deluje, in res , prvi del iz zgornjega odgovora (spodaj manjka) pa ne deluje.
 ^"\w+ \w+ (?=[^"])
 
Kaj pa ni ok v prvem delu regexa iz prvega odgovora, da bi tole delovalo ?

Tole je cist nerazumljivo napisano. Pojma nimam kaj hoces, kaj dela in kaj ne dela.

BRBR :: 11. feb 2012, 13:58

1. če sprobaš tole: '^"\w+ \w+ (?=[^"])' pozem ti najde (skupaj z zadnjim presledkom za bold)

"Oxychilus draparnaudi "
"Oxychilus draparnaudi draparnaudi "

2. če po zgornjem muštru naredmim, s ciljem da mi najde samo zadnji presledek za boldom:
'(?!^"\w+ \w+) (?=[^"])'
ne dela.

Never underestimate the power of idiots in large groups.

Zgodovina sprememb…

spremenil: BRBR (11. feb 2012 ob 14:01)

Spura :: 11. feb 2012, 18:34

Seveda da ne. Zakaj preprosto ne capturas drugega presledka? Aja, ne mores grup uporabljat, ampak mora cel match bit presledek? Tezka bo.
Namrec razlog zakaj ti to ne dela je , da regex znotraj prvega negative lookahead izraza pade na vsakem znaku po prvem, torej naslednji znaki so kot da tega ne bi bilo.
Torej za prvi znak je ^"\w+ \w+ true, torej je (?!....) false, kar pomeni da match takoj pade in gre naprej na naslednji znak. Za naslenje znake je obratno, (?!....) je vedno true, kar pomeni da je isto kot bi imel samo ' (?=[^"])'. To seveda matcha vse presledke razen zadnjega pred ".
Kar bi ti moral naredit je uporabit positive lookbehind.
'(?<=^"\w+ \w+) (?=[^"])'
Torej, ce je pred to tocko, "beseda beseda, potem poskusi matchat space. Ampak tudi to ne bo delalo ker lookbehind me sme vsebovati izrazov, ki lahko matchajo poljubno veliko znakov (to je \w+ v tvojem primeru). Vsaj v vecini regex enginov ne.
Tko da si v riti.

BRBR :: 11. feb 2012, 18:44

he,he, nisem v riti. Tole tvoje čudo dela:

'(?<=^"\w+ \w+) (?=[^"])'

menda je super duper regex jgsoftengine, ki je vgrajen v edit pad pro
--> tule na dnu je link, .... povezava

Hvala lepa.

Never underestimate the power of idiots in large groups.

Zgodovina sprememb…

spremenil: BRBR (11. feb 2012 ob 18:47)

Spura :: 11. feb 2012, 19:39

No, v vecini regexov to ne bi delalo. V Javi naprimer ze ne.

MrBrdo :: 12. feb 2012, 14:34

Te lookbehindi so itak eno čudo

Verjetno edina stvar v regexp ki mi nikoli ni bila čisto kristalno jasna, se jim zelo rad ognem...

MrBrdo

BRBR :: 12. feb 2012, 18:10

pršparajo velik cajta.

Never underestimate the power of idiots in large groups.

Spura :: 12. feb 2012, 20:37

Look aheadi in look behindi so 0-width assertions. Torej regex matcha v neki tocki med dvema znakoma (sirina 0), ce drzi assertion.
Torej (?<=a)b mathca b v ab, ker lookbehind drzi v tocki med a in b, cemur sledi b, ki matcha izraz, ki sledi lookbehindu.

MrBrdo :: 12. feb 2012, 22:14

No hvala, zdej mi je še manj jasno

Sej drugače jih znam uporabljat, hotel sem rečt da mi je neprijetno in se jim raje izogibam, ker mi ponavadi nikoli ne dela s prve

MrBrdo

Zgodovina sprememb…

spremenilo: MrBrdo (12. feb 2012 ob 22:15)

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	Python separiranje besed v stavkih Meizu Oddelek: Programiranje	9	1481 (1295)	Meizu 18. nov 2011 19:03:55
»	branje iz datoteke c# bigbada Oddelek: Programiranje	14	1947 (1676)	darkolord 1. mar 2011 21:22:05
»	PHP - stringi pehape Oddelek: Izdelava spletišč	25	2231 (2054)	pehape 12. nov 2010 19:56:59
»	java in regex alesrosina Oddelek: Programiranje	10	1380 (1325)	alesrosina 4. apr 2004 18:28:14

Več podobnih tem

Zadnje novice

Zadnji članki

Išči:

Forum » Programiranje »
regex kombinacija negative, positive look behind ...

regex kombinacija negative, positive look behind ...