Forum » Pomoč in nasveti » Avtomatsko pridobivanje info elektroske pošte iz spletnih strani
Avtomatsko pridobivanje info elektroske pošte iz spletnih strani
Serial ::
Pozdravljeni na delu so mi dali zelo dolgočasno nalogo..
Dali so mi 350 spletnih strani od spletnih medijev, jaz pa moram sedaj k vsakemu naslovu napisat info elektronsko pošto strani/podjetja.
Ima kdo kakšno zamisel kako bi lahko naredil skripto/programček ali če mogoče že obstaja kaj podobnega, da bi te elektronske naslove pridobil po kakšni lažji poti (da mi ni treba iti na vsako stran in poiskati mail itd..)
Lp
Dali so mi 350 spletnih strani od spletnih medijev, jaz pa moram sedaj k vsakemu naslovu napisat info elektronsko pošto strani/podjetja.
Ima kdo kakšno zamisel kako bi lahko naredil skripto/programček ali če mogoče že obstaja kaj podobnega, da bi te elektronske naslove pridobil po kakšni lažji poti (da mi ni treba iti na vsako stran in poiskati mail itd..)
Lp
black ice ::
Splinter (Python). Izvede tudi JS. Je pa zadeva dokaj počasna, če uporabiš browser based driver. Priporočam headless driver, ki je precej hitrejši. Tudi mechanize ni slab, je pa več pisanja kode.
Oglej si izvorno kodo parih strani, ponavadi so maili v tagih, ki vsebujejo 'mailto:' in poiščeš samo ta del za 'mailto:'. Dokumentacija je lepo spisana, zadevo imaš končano v slabe pol ure.
Ne pozabi ločiti spletnih strani, kjer nimaš navedenih e-mailov, katere potem ročno poiščeš (recimo kjer so kontaktni obrazci).
Oglej si izvorno kodo parih strani, ponavadi so maili v tagih, ki vsebujejo 'mailto:' in poiščeš samo ta del za 'mailto:'. Dokumentacija je lepo spisana, zadevo imaš končano v slabe pol ure.
Ne pozabi ločiti spletnih strani, kjer nimaš navedenih e-mailov, katere potem ročno poiščeš (recimo kjer so kontaktni obrazci).
Mipe ::
Samo 350 strani je. Če porabiš 1 minuto za vsako, boš porabil največ en delovni dan, in videli bodo, da delaš. Skripta pa ti ne bo pomagala kaj dosti, ker ponekod obfukcirajo e-naslove in boš še vedno moral na roko vpisovati. Koliko časa ti bo vzelo pisanje skripte in popravljanje le-te?
Tudi sam sem pri prejšnjem delodajalcu iskal take izi rešitve. Na koncu se je izkazalo, da se za manjše projekte ne splača zapraviti ohoho ur za gruntanje različnih rešitev in da je na roko še vedno precej hitreje. Vsaj napol - če si že izkušen in imaš pripravljene rešitve, gre še najhitreje.
Tudi sam sem pri prejšnjem delodajalcu iskal take izi rešitve. Na koncu se je izkazalo, da se za manjše projekte ne splača zapraviti ohoho ur za gruntanje različnih rešitev in da je na roko še vedno precej hitreje. Vsaj napol - če si že izkušen in imaš pripravljene rešitve, gre še najhitreje.
Zgodovina sprememb…
- spremenil: Mipe ()
Gandalfar ::
Ce bos scrapal - http://scrapy.org/ in https://github.com/scrapy/scrapely
Drugace pa tale xkcd v razmislek - http://www.xkcd.com/1205/
Drugace pa tale xkcd v razmislek - http://www.xkcd.com/1205/
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | Programiranje nasplošnoOddelek: Programiranje | 7808 (5884) | kunigunda |
» | Kako oz. z čim izdelujete spletišča? (strani: 1 2 )Oddelek: Izdelava spletišč | 13905 (12321) | Goran's Blog |
» | Nov napad na domača omrežja: Drive-By PharmingOddelek: Novice / Varnost | 5928 (4564) | Azrael |
» | HTML vprašalnik preko e-pošteOddelek: Izdelava spletišč | 2261 (1938) | MihaFirst |
» | NO@SPAMOddelek: Izdelava spletišč | 1392 (1086) | BSD-jas |