» »

Avtomatsko pridobivanje info elektroske pošte iz spletnih strani

Avtomatsko pridobivanje info elektroske pošte iz spletnih strani

Serial ::

Pozdravljeni na delu so mi dali zelo dolgočasno nalogo..
Dali so mi 350 spletnih strani od spletnih medijev, jaz pa moram sedaj k vsakemu naslovu napisat info elektronsko pošto strani/podjetja.
Ima kdo kakšno zamisel kako bi lahko naredil skripto/programček ali če mogoče že obstaja kaj podobnega, da bi te elektronske naslove pridobil po kakšni lažji poti (da mi ni treba iti na vsako stran in poiskati mail itd..)

Lp

Golden eye ::

Boš vrjeten prej na roke naredu

black ice ::

Splinter (Python). Izvede tudi JS. Je pa zadeva dokaj počasna, če uporabiš browser based driver. Priporočam headless driver, ki je precej hitrejši. Tudi mechanize ni slab, je pa več pisanja kode.
Oglej si izvorno kodo parih strani, ponavadi so maili v tagih, ki vsebujejo 'mailto:' in poiščeš samo ta del za 'mailto:'. Dokumentacija je lepo spisana, zadevo imaš končano v slabe pol ure.
Ne pozabi ločiti spletnih strani, kjer nimaš navedenih e-mailov, katere potem ročno poiščeš (recimo kjer so kontaktni obrazci).

Serial ::

uuu zanimivo.. hvala black ice ;)

Mipe ::

Samo 350 strani je. Če porabiš 1 minuto za vsako, boš porabil največ en delovni dan, in videli bodo, da delaš. Skripta pa ti ne bo pomagala kaj dosti, ker ponekod obfukcirajo e-naslove in boš še vedno moral na roko vpisovati. Koliko časa ti bo vzelo pisanje skripte in popravljanje le-te?

Tudi sam sem pri prejšnjem delodajalcu iskal take izi rešitve. Na koncu se je izkazalo, da se za manjše projekte ne splača zapraviti ohoho ur za gruntanje različnih rešitev in da je na roko še vedno precej hitreje. Vsaj napol - če si že izkušen in imaš pripravljene rešitve, gre še najhitreje.

Zgodovina sprememb…

  • spremenil: Mipe ()

Gandalfar ::

Ce bos scrapal - http://scrapy.org/ in https://github.com/scrapy/scrapely

Drugace pa tale xkcd v razmislek - http://www.xkcd.com/1205/


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Programiranje nasplošno

Oddelek: Programiranje
417413 (5489) kunigunda
»

Kako oz. z čim izdelujete spletišča? (strani: 1 2 )

Oddelek: Izdelava spletišč
5713232 (11648) Goran's Blog
»

Nov napad na domača omrežja: Drive-By Pharming

Oddelek: Novice / Varnost
335798 (4434) Azrael
»

HTML vprašalnik preko e-pošte

Oddelek: Izdelava spletišč
222196 (1873) MihaFirst
»

NO@SPAM

Oddelek: Izdelava spletišč
111335 (1029) BSD-jas

Več podobnih tem