Forum » Pomoč in nasveti » Kako shranit ali dobit vse email naslove na tej strani ?
Kako shranit ali dobit vse email naslove na tej strani ?
#000000 ::
Gre za emaile vseh Slovenskih občin, ampak vsakega posebej kliknit in shranjevat je malo zamudno.
Kaka ideja mogoče ?
Hvala in Lep pozdrav.
Kaka ideja mogoče ?
Hvala in Lep pozdrav.
bluefish ::
Na kateri strani?
Web-scrapping v poljubnem jeziku - za Python recimo knjižnica BeautifulSoup.
Web-scrapping v poljubnem jeziku - za Python recimo knjižnica BeautifulSoup.
#000000 ::
Tukaj http://www.zdruzenjeobcin.si/vse-obcine/ sem probal z clipboard master, sam ga neki sraćka, ne najdem fajla kam on to shrani.
bluefish ::
Dobiš, samo malo.
Edit: me je misek prehitel. Pa naj bo le koda
Edit: me je misek prehitel. Pa naj bo le koda
import requests from bs4 import BeautifulSoup url = 'http://www.zdruzenjeobcin.si/vse-obcine/' soup = BeautifulSoup(requests.get(url).text, 'lxml') emails = [] for email in soup.select("a[href^='mailto:']"): emails.append(email['href'][7:])
Zgodovina sprememb…
- spremenil: bluefish ()
misek ::
Sicer pa je tukaj precej enostavno, saj so vsi naslovi v prosti obliki. Nato pa sed, awk ali kaj drugega.
#000000 ::
nikol nisem še probal tega, mel sem idejo stran uvozit v Dreamviewer ipd, ter nekako tam ostalo pobrisat in ostanejo maijli, sam že dolg nisem niti DW odprl tko da hvala še enkrat.
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Skripta za Bolho.Oddelek: Programiranje | 4435 (1847) | planina91 |
» | Bolha parser/pajek - prejemanje obvestil o novih oglasihOddelek: Programiranje | 4350 (3348) | rokko |
» | [python] Parsanje beautifulsoupOddelek: Programiranje | 937 (624) | f0r3st727 |
» | Sodobna oblast?Oddelek: Problemi človeštva | 2704 (1601) | ABX |
⊘ | python pomočOddelek: Programiranje | 3405 (2326) | Mavrik |