» »

Spletni NEMARNEži

Spletni NEMARNEži

1
2
»

c3p0 ::

Na Uniforestu skrbno berejo tvoj thread in pravijo, da bodo promptno uredili.

HotBurek ::

Pravilno.

Za tiste, ki želijo na spletu doseč nadpovprečno dobre rezulteate, je to tako ali tako samoumevno.

PRIMER 23

https://www.gastronomicspain.com

gtin13 se zapiše z 13 številkami. So tudi črke vmes? Ne vem. A gre za točno dolžino.

Primer napake:
 <meta itemprop="gtin13" content="Código EAN:8436006916519">

Pravilno:
 <meta itemprop="gtin13" content="8436006916519">

Ali je kdo v Španiji, Valencija, da se oglasi in popravi reč. Ker pač, lep splet = lep svet.


Evo, tole je pa lep primer velike spletne trgovine, in kako solidno postavit sitemap xml strukturo z veliko produkti (rang 80.000 produktov).

https://www.tiendasmetro.co/
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

FireSnake ::

Kayzon je izjavil:

Je s tabo vse v redu?


Po tem:

HotBurek je izjavil:

Ker imajo okrog 22.000 produktov in bi bilo škoda jih spustit.

Še vprašaš?

Burek je odkril nov način, na katerega se zabava.
Pa naj spama, meni je prav zabavno kaj vse "ugotovi".
Poglej in se nasmej: vicmaher.si

HotBurek ::

PRIMER 24

https://hlebosol.eu

Blast from the past. Prevent right click (with JS). Fulll gut.

Rešitev: Shift + Right click (testirano v FF in dela).

Vir: https://www.reddit.com/r/YouShouldKnow/...
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Kayzon ::

No dj se bom uklucil se sam,a uporabljas kaksna orodja za testiranje ali vse rocno?

HotBurek ::

Zaenkrat vse ročno, za vsak site posebej config. Sploh, kar se tiče sitemap xml, da obidem vse tiste, ki niso relevantne (blog, category, ...). Samo malo časa se prihrani, drugega ni.

Če bi imel malo večji sistem, bi verjetno postavil v dveh delih.

Prvi del bi bili crawler-ji, ki bi šli čez "vse", in tudi "vse" shranili (vključno z različnimi verzijami glede na schema org product parser, teh imam trenutno mislim da 6). Pobrano vsebino bi shranil v... hm... tale MongoDB bi verjetno bil za HTML, čeprav mi zadeva ni najbolj pri srcu. Ok, s Python-om se da dobro dostopat do baze, problem je GUI client. Kr neki trial/limited je bil tist Robot+ 3T neki.
Za URL-je shranjevat bi še naprej uporabil SQL (MariaDB), originalne slike bi pa verjetno shranil kar na disk.

In potem bi pa v drugem delu naredil sistem, kjer bi dostopal do teh podatkov, prevejrajal točnost in "lepotot" (npr. eni imajo slike _xs.jpg, ki so velike 10x10 pixlov, isti url brez "_xs" pa vrne normalno velikost), ter iz najdenih rezultatov spisal bol splošni "konverter", kjer bi zbrane podatke bolj masovno zloudal v produkcijsko bazo. Pa tudi crawlerje bi potem tako popravil/spremenil.

Kaj pa vem, zaenkrat se zadeva počasi premika naprej. Trenutno je notri 2.5 miljona produktov, prvi nek mileston, ki ga želim doseč, je 10M produktov. Ter da zadeva nekako dela. Rebuild autocomplete je kr požrešna reč, slike tudi papcajo disk, nekatere SQL operacije sem moral upočasnit.

Če bi imel večji server, bi verjetno prvo stvar, ki bi jo spremenil, to, da bi autocomplete prestavil v typesense (to je in-memory). Trenutno autocomplete dela v SQL z LIKE 'abc%'. Its ok. It works. For now.

Po eni strani je fajn, da je na začetku problem z "premal diska, procesorja, ram-a". Da se proba kakšno stvar optimizirat preden se gre na večji server, kar mislim, da bo prišlo prav kasneje.

Ravno včeraj, predvčerajšnem sem gledal, kaj naj naredim, ko je bil CPU zaseden konstantno skoraj 100%, sem imel kar delay tudi preko ssh/terminal-a in je full moteč, če hitro tipkaš (/ v tab / l tab itn.). Našel sem ethtool, ampak nimam sploh znanja o tako "low level" network tuning-u, pa tudi network opreme nimam čez (shared hosting VPS scena).

ethtool: https://blog.cloudflare.com/how-to-achi...

Če bo šel projekt naprej (dodat čimveč produktov), bojo tudi te network in disk scene še pršle na plano.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

HotBurek ::

Evo, priteral do 400 trgovin in dodal nekaj nove hrane na domačo stran.

Kul HTML stajling odkritje dneva je pa tole:

https://www.organikciyizbiz.com/organik...

In ko se stran odpre, right click, view source code. Gooood stuf. 8-)
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

HotBurek ::

Tale sample nima veze tolk z strukturo (robotst txt, sitemap xml, schema org product), ampak gre bolj za ironijo. Našo domačo.

Če greš na tale site: https://www.src.si/

Gor z velkimi črkami piše: Zanesljive rešitve za vaš poslovni uspeh

Če greš pa na tale pod-site: https://www.src.si/revija/

Pa gor z malimi črkami piše: The site is experiencing technical difficulties.

Bum1!
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

socialec ::

tole, ko scrapaš, se skriješ za kak obskuren ip?

HotBurek ::

Ne, brez skrivalnic.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

HotBurek ::

Evo, tale zadeva NE spada pod "spletne nemarneže".

Je pa tole blast from the past: https://www.atelsek.si

Enjoy.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

HotBurek ::

Tale pravtako NE spada pod "spletni nemarneži".

Je pa to bolj za v kategorijo "ART".

Takšnega lepotnega CSS za izris sitemap xml fajla še nisem srečal:

https://www.uje.hr/media/sitemap.xml

Je pa to "MageWorx XSitemap Extension" za Magento.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window
1
2
»


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Iskalnik produktov po spletnih trgovinah

Oddelek: Programiranje
455985 (200) HotBurek
»

Objavljanje strani v Google in Bing

Oddelek: Omrežja in internet
71159 (989) win64
»

Nizozemski študent zbral 15 milijonov elektronskih naslovov uporabnikov Googla

Oddelek: Novice / Zasebnost
136754 (5312) techfreak :)
»

Zakaj mi google ne najde strani?

Oddelek: Izdelava spletišč
226002 (4607) bluefish
»

Čimbolj neboleča predelava strani

Oddelek: Izdelava spletišč
313467 (2358) R33D3M33R

Več podobnih tem