» »

Kako sprogramirat?

Kako sprogramirat?

VAgency ::

Vzemimo za primer spletno stran http://www.msnimenik.com/ in recimo da hočem emaile kopirat v file z imenom email.txt.

Zapis v email.txt pa mora biti v tem stilu

Vzdevek: beni | Starost: 21 | Mesto: Zidani Most
MSN naslov: beni.kolander@hotmail.com


beni, beni.kolander@hotmail.com

Kako?

overlord_tm ::

Pogooglaj malce za izrazom HTML parser. Jezik je poljuben, izberi tistega ki najbolj obvladas.

VAgency ::

Bi bil kdo tok ok, da bi mi napisal tistih par vrstih kode za tisti zgoraj primer, potem pa da naprej poštekam

overlord_tm ::

import urllib2
import re

website = urllib2.urlopen("http://www.msnimenik.com/")
html = website.read().replace("<img src='http://msn.mysmilies.info/images/afna.gif'  alt='@'>", "@")

p = re.compile("<b>(.*?)</b>")
lol = p.findall(html)

p2 = re.compile("(.*)@(.*)")

for line in lol:
	if p2.match(line):
		print line


Tole ti sparsa maile, lahko na tem nadljujes :)

KoMar- ::

Lepo, da mu pomagaš harvestat mejle za spam oz. podobno grdo početje...

HardFu ::

Ja, sploh zato ker ima verjetno namen zasluzit, pa na S-T prosi za free help
http://codeable.io

Karlos ::

Ni slabo na vsake toliko malo potelovaditi s parsanjem podatkov.

Še BASH če ti bolj vstreza :)

ps. A ima kdo idejo kako bi zgornjo kodo prilepil na forum, ker mi je skoz javljalo napako v smislu

Uporabili ste neveljavno / nedovoljeno HTML oznako: ...koda...
Sai Baba: "Dam vam to, kar hočete, da boste hoteli to, kar vam želim dati."

d0rK ::

Taki se potem hvalijo kako imajo neko ogromno bazo mailov za oglaševanje:

Link.

Gost ::

Saj vemo, da je danes praktično 95% vseh mailov, ki jih podjetja dajo v masovni obliki ven, spam. Četudi se prijaviš na nek legalen newsletter in pričakuješ neke informacije, te v večini potem zasipajo z informacijami, ki jih ne potrebuješ.

Kar počne pa VAgnecy pa ne vem, če je pravno sporno, saj na strani nikjer ne piše nič o tem.

Maili so drugače na tisti strani malenkost zaščiteni in imajo namesto afne sličico, vendar to še vedno nič ne pomaga proti taki custom skripti.

Zeberdee ::

Meni se harvestanje mailov ne zdi sporno, bolj se mi zdi sporno, da nekdo to bazo zbira in jo da na vpogled vsakemu. No v tem primeru so se te osebki odločili za javno objavo svojih podatkov in krivde ni.

Več o tem bi vedel Matthai. Če sem prav napisal.


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Bolha parser/pajek - prejemanje obvestil o novih oglasih

Oddelek: Programiranje
214376 (3374) rokko
»

Python končnica datoteke

Oddelek: Programiranje
51111 (1026) filips
»

[Python] Domači nalogi

Oddelek: Programiranje
333079 (1969) ragezor
»

[python] Parsanje beautifulsoup

Oddelek: Programiranje
9944 (631) f0r3st727
»

[C#] Prosim pomagajte! Potrebujem program, ki bi pobiral podatke iz ene strani

Oddelek: Programiranje
212755 (2365) David1994

Več podobnih tem