» »

[python] Parsanje beautifulsoup

[python] Parsanje beautifulsoup

f0r3st727 ::

Pozdravljeni.
Na neki strani tako tabelo (link do tabele: https://docs.google.com/document/d/1H4I...

Kako bi lahko z Beautifulsoupom izpisal boldane podatke, če ustreza boldanemu in ležečemu tisku?
  • spremenilo: f0r3st727 ()

techfreak :) ::

Jaz bi naredil nekaj v smislu:
za vsak td:
    ime = soup.find('a', text = re.compile(r'[A-z]+'))
    kraj_ura = soup.find('a', text = re.compile(r'[A-z]+ [0-9:]+'))
    em = soup.find('em', text = re.compile(r'[A-z]+'))


Koliko je pa to hitro je pa drugo vprašanje.

Zgodovina sprememb…

f0r3st727 ::

techfreak :) je izjavil:

Jaz bi naredil nekaj v smislu:
za vsak td:
ime = soup.find('a', text = re.compile(r'[A-z]+'))
kraj_ura = soup.find('a', text = re.compile(r'[A-z]+ [0-9:]+'))
em = soup.find('em', text = re.compile(r'[A-z]+'))


Koliko je pa to hitro je pa drugo vprašanje.


Me ne zanima koliko je hitro. Bolj me zanima, da se to zgodi, samo če v boldanem in ležečem piše recimo črka B. Torej bi moralo spustiti tegale "osebka". :)

Hvala za odgovor.

techfreak :) ::

Potem pač recimo:
ime = soup.find('a', text = re.compile(r'B'))

če je ime enako B.

f0r3st727 ::

Aha. Kaj pa če imam zelo veliko podatkov za compilat? A mi lahko vrže ven kak error?

Gandalfar ::

ce bos gigabyte htmlja naenkrat parsal se ti zna zgodit, da ti bo rama zmanjkalo ali pa da bo pocasi. Za zadeve do par 10 MB se ti pa ne bo poznalo.

f0r3st727 ::

@techfreak :) : to kodo, ki si mi jo napisal moram dati v kakšno zanko? for ali while?

@Gandalfar: dvomim, da se bom kdaj znašel za svoje potrebe z gigabaytom html-ja... Torej bi ta zadeva morala funkcionirati...

Hvala obema.

f0r3st727 ::

Tale koda, ki mi jo je podal teachfreak ne dela...
Tole mi vrne:
    ime = soup.find('A786', text = re.compile(r'[A-z]+ [0-9:]+'))
^
SyntaxError: invalid syntax

Gandalfar ::

verjetno imas narobe zamaknjeno ali pa napako v prejsnji vrstici

f0r3st727 ::

Zamaknjeno je bilo narobe.

Ampak še vedno ne dela. Vrže mi ven kar nek link, ki ga ne rabim.. Poleg tega bi rabil, da mi najde vse take osebke, ki so na neki strani. Kako bi lahko to dosegel?


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Python končnica datoteke

Oddelek: Programiranje
5982 (897) filips
»

[Python] Domači nalogi

Oddelek: Programiranje
332858 (1748) ragezor

python pomoč

Oddelek: Programiranje
393300 (2221) Mavrik
»

Kako sprogramirat?

Oddelek: Izdelava spletišč
91257 (869) Zeberdee
»

[C#] Prosim pomagajte! Potrebujem program, ki bi pobiral podatke iz ene strani

Oddelek: Programiranje
212581 (2191) David1994

Več podobnih tem