» »

Kako shranit ali dobit vse email naslove na tej strani ?

Kako shranit ali dobit vse email naslove na tej strani ?

#000000 ::

Gre za emaile vseh Slovenskih občin, ampak vsakega posebej kliknit in shranjevat je malo zamudno.

Kaka ideja mogoče ?

Hvala in Lep pozdrav.

bluefish ::

Na kateri strani?

Web-scrapping v poljubnem jeziku - za Python recimo knjižnica BeautifulSoup.

#000000 ::

Tukaj http://www.zdruzenjeobcin.si/vse-obcine/ sem probal z clipboard master, sam ga neki sraćka, ne najdem fajla kam on to shrani.

misek ::

Preveri pravilnost: https://pastebin.com/jaMx1f8W

bluefish ::

Dobiš, samo malo.

Edit: me je misek prehitel. Pa naj bo le koda :)

import requests
from bs4 import BeautifulSoup

url = 'http://www.zdruzenjeobcin.si/vse-obcine/'
soup = BeautifulSoup(requests.get(url).text, 'lxml')

emails = []

for email in soup.select("a[href^='mailto:']"):
    emails.append(email['href'][7:])

Zgodovina sprememb…

  • spremenil: bluefish ()

#000000 ::

Najlepša hvala Lep pozdrav

misek ::

Sicer pa je tukaj precej enostavno, saj so vsi naslovi v prosti obliki. Nato pa sed, awk ali kaj drugega.

#000000 ::

nikol nisem še probal tega, mel sem idejo stran uvozit v Dreamviewer ipd, ter nekako tam ostalo pobrisat in ostanejo maijli, sam že dolg nisem niti DW odprl tko da hvala še enkrat.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Skripta za Bolho.

Oddelek: Programiranje
304435 (1847) planina91
»

Bolha parser/pajek - prejemanje obvestil o novih oglasih

Oddelek: Programiranje
214350 (3348) rokko
»

[python] Parsanje beautifulsoup

Oddelek: Programiranje
9937 (624) f0r3st727
»

Sodobna oblast?

Oddelek: Problemi človeštva
322704 (1601) ABX

python pomoč

Oddelek: Programiranje
393405 (2326) Mavrik

Več podobnih tem