Forum » Programiranje » Veriženje regularnih izrazov
Veriženje regularnih izrazov
Karlos ::
Ali mogoče kdo ve če se da verižiti (gnezditi) regularne izraze npr
dobi body iz html-ja -> najdivse div-e -> najdi vse "a href"
Ali je potrebno napisati vsakega posebaj in jih gnezditi v if stavke?
dobi body iz html-ja -> najdivse div-e -> najdi vse "a href"
Ali je potrebno napisati vsakega posebaj in jih gnezditi v if stavke?
Sai Baba: "Dam vam to, kar hočete, da boste hoteli to, kar vam želim dati."
darkolord ::
Zakaj pa ne bi mogel vse v enemu napisat?
PS. Za HTML je bolj priporočljivo uporabit kak HTML parser
PS. Za HTML je bolj priporočljivo uporabit kak HTML parser
ender ::
Lahko napišeš vse v enem, vendar bo veliko bolj pregledno če jih ločiš.
There are only two hard things in Computer Science:
cache invalidation, naming things and off-by-one errors.
cache invalidation, naming things and off-by-one errors.
netanyahu ::
Ja seveda se da tako združiti več regularnih izrazov. Primer: imam niz "xx1xx2abc2xx1xx" in regularna izraza "1(.*)1" in "2(.*)2". Lahko najprej uporabim prvega in nato drugega, da dobim niz "abc". Lahko pa ju združim v "1.*2(.*)2.*1".
Ti imaš drug problem. Z regularnimi izrazi se po definiciji ne da poiskati vseh DIV elementov ali pa vseh A elementov, ki so znotraj DIV elementa in podobno.
Zadevo najlažje rešiš z XPath izrazom "/html/body//div//a[@href]". Namesto "//" je lahko "/", če mora biti sledeči element otrok. XPath je na voljo tudi v JavaScriptu in tudi za HTML strani (ni potreben XHTML).
Druga stvar je pa, če veš, da boš imel lep vhod, vedno iste strukture, brez zapletenega gnezdenja. Pri tej predpostavki bo šlo pa tudi z regularnimi izrazi.
Ti imaš drug problem. Z regularnimi izrazi se po definiciji ne da poiskati vseh DIV elementov ali pa vseh A elementov, ki so znotraj DIV elementa in podobno.
Zadevo najlažje rešiš z XPath izrazom "/html/body//div//a[@href]". Namesto "//" je lahko "/", če mora biti sledeči element otrok. XPath je na voljo tudi v JavaScriptu in tudi za HTML strani (ni potreben XHTML).
Druga stvar je pa, če veš, da boš imel lep vhod, vedno iste strukture, brez zapletenega gnezdenja. Pri tej predpostavki bo šlo pa tudi z regularnimi izrazi.
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
⊘ | python pomočOddelek: Programiranje | 3407 (2328) | Mavrik |
» | grep - čisto malo pomoči ;)Oddelek: Programiranje | 2346 (1823) | c0dehunter |
» | Regularni izraz - PythonOddelek: Programiranje | 832 (689) | Luka91 |
» | kako pobrat iz html kode podatkeOddelek: Izdelava spletišč | 1747 (1417) | qshop |
» | Programi za izdelovanje spletnih straniOddelek: Izdelava spletišč | 12711 (11904) | Ziga Dolhar |