» »

Spletni NEMARNEži

Spletni NEMARNEži

«
1
2

HotBurek ::

Dobro jutro.

Evo, v okviru projekta mirko1 ( https://www.mirko1.com ) sem si rekel, da bom pisal, katere napake (ali "napake") vse najdem na spletu med dodajanjem spletnih trgovin.

O osnovni preverjam robots.txt, sitemap.xml in schema.org product. Opcijsko tudi favicon.ico (če je ta razlišeč od tistega, ki je nastavljen v browserju), ter html lang (Primer: www.anni.si ima vnešen lang="si". "si" ni lanugage. Pravilno je "sl" ali "sl-SI").

PRIMER 1

https://moon.si

robots.txt je ok, sitemap pointer ima na https://moon.si/sitemap_index.xml. A ta link vrne "http 500" z sporočikom: Na strani je prišlo do kritične napake.

Wat the hek is dis?

PRIMER 2

https://www.equusvitalis.si

V schema.org product so navedene 4 slike (128, 256, 512, 1024), v sitemap.xml pa samo ena brez dimenzij.

Primer:

15352_8a0198e7.128x128.jpg
15352_8a0198e7.256x256.jpg
15352_8a0198e7.512x512.jpg
15352_8a0198e7.1024x1024.jpg

15352_8a0198e7.jpg

Sicer ne vem, zakaj so v schema.org product vnesene štiri iste slike različnih dimenzij. Pri crawl-anju je potem treba upošteva, da se uporabi sliko iz xml. Lažje bi bilo, če bi v schema.org product bila vnešena samo ena slika, pa da je "solidnih" dimenzij (1000 x 1000).

Ter, podatek o tem, za katero podjetje gre? Veliko italianskih spletnih trgovin ima napisano nekje v nogi ITALY, pa tudi ime podjetja. Tako hitreje vidiš "od kod so". Je pa včasih treba it iskan v pogoje poslovanja in razvozlat, katero podjetje je "za" to spletno trgovino. V tem primeru gre za niceshops GmbH iz Avstrije. In jst to vnesem pod "avstrijo".

Več drugih primerov bom pa še dodal.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

HotBurek ::

PRIMER 3

https://www.artsper.com

Tole je eden od sitemap-ov ( https://www.artsper.com/sitemap.artist_... ), velik 10MB in vse je "napisano" v eni sami vrstici. Why? A je tako težko zadevo postavit, da so stvari v vrsticah napisane?

Če to odprem v nano-ut gre CPU na 100%. Če to odprem v brskalniku brskalniku, gre na 100% za nekaj minut, da vse zrendira. Bolnica. Mislim, kol kilo bibi bajtov zdej prišparaš, ker ne uporabiš new line-ov?

Če se kak pravi moški opogumi, naj naredi test:

- velikost originalnega fajla
- velikost z uporabo new line-ov, da je source tak, kot ga zrendira firefox
- velikost z uporabo new line-ov, da je source tak, kot ga zrendira firefox, v gz formatu

In da se to pošera in vidi, kje smo s tem "all in one line" optimizacijo.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

HotBurek ::

PRIMER 4

https://shop.pokica.com

Evo, to so te redirect fore. Če je request iz nemčije, se naredi redirect, pazi to, najprej na /en, potem pa še enega na /en/.

--2025-04-09 16:53:15--  https://shop.pokica.com/izdelek/pokica-funky-potica/
Resolving shop.pokica.com (shop.pokica.com)... 152.89.234.215
Connecting to shop.pokica.com (shop.pokica.com)|152.89.234.215|:443... connected.
HTTP request sent, awaiting response... 301 Moved Permanently
Location: https://shop.pokica.com/en [following]
--2025-04-09 16:53:16--  https://shop.pokica.com/en
Reusing existing connection to shop.pokica.com:443.
HTTP request sent, awaiting response... 301 Moved Permanently
Location: https://shop.pokica.com/en/ [following]
--2025-04-09 16:53:19--  https://shop.pokica.com/en/
Reusing existing connection to shop.pokica.com:443.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: 'index.html'

Če isto request narediš iz slovenije, teh redirektov ni in dobiš "slovenski" page na response-u.

Kwa vi to delate s temi redirekti? A ne moreš pustit, da če ne kdo naredi request gor, pa da ni glih na "tapravem" language linku, bo pa ja kliknu na "čejnđ lengviđ". Al ne?

Pa tak redirect pol ne omogoča, da cravler iz nemčije pokravla page v slovenskem jeziku (ker dobi redirekt na /en).

Pizda ti redirekti...

Pa še sitemap.xml linke redirecta... nekam. Fak dis šit. PASS. Next.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

HotBurek ::

PRIMER 5

https://www.svetdekorja.si

Request na /robots.txt vrne empty content.

Request na /sitema.xml pa 404.

Well done.

Next.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

socialec ::

10% gre na račun pretty print

HotBurek ::

PRIMER 6

https://www.fitnesshop.si

robots.txt nima pointerja na sitemap.xml

Se pravi, manjka zapis:

Sitemap: https://www.fitnesshop.si/sitemap_index.xml

Ostalo je ok.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

Utk ::

Ti si pa res avtoriteta za "dobre prakse"...

HotBurek ::

PRIMER 7

https://tajnagline.hr

V schema org product vrne ceno, zraven pa za valueAddedTaxIncluded vrednost "False".

Primer: https://validator.schema.org/#url=https...

Na spletni strani je cena za ta izdelek ista. Nikjer ni podatka, da gre za ceno brez davka. Tudi, ko se da zadevo v košarico na check-out.

Je zdej ta cena z ali brez DDV?
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

HotBurek ::

PRIMER 8

https://pekis.si

robots.txt nima pointerja na sitemap.xml

Se pravi, manjka zapis:

Sitemap: https://pekis.si/sitemap.xml

Druga stvar.

Iz slovenije so dovoljeni requesti, iz nemčije pa ne.

--2025-04-09 17:53:24--  https://pekis.si/trgovina/modelcek-na-vzvod-za-linske-oci-6-cm-krog
Resolving pekis.si (pekis.si)... 212.44.104.73
Connecting to pekis.si (pekis.si)|212.44.104.73|:443... connected.
HTTP request sent, awaiting response... 403 Forbidden
2025-04-09 17:53:24 ERROR 403: Forbidden.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

HotBurek ::

PRIMER 9

https://www.dtails.nl

Na default lokacijo /favicon.ico ni ikone.

Vse, kar je treba naredit, je, skopirat iconi, ki jo nastavi html ( https://cdn.webshopapp.com/shops/317096... ) in jo skopirat v favicon.ico file v www root. Tako. Je. Lepo.

Ostalo pa štima.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

GupeM ::

Ja, in? Mogoče imajo pa namenoma tako, da imaš ti težave scrapat.

HotBurek ::

PRIMER 10

https://shop.orgo.si.

Nikjer ni favicon ikonce, ne na default /favicon.ico, ne preko html icon shortcut. Why?

Naprej.

/robots.txt ima pointer na sitemap /wp-sitemap.xml, kjer pa vrača 404. Sitemap je sicer na /sitemap_index.xml (wordpress). To je zapofiksat.

Naprej.

Primer izdelka: https://shop.orgo.si/it/product/krhlji-...

Tako schema org product, kot tudi link v sitemal xml, imata za image pointer na "/vreckaarticokinal.jpg", slika pa je na "/vreckaarticokinal-600x735.jpg". Kwa je to? Za popravit.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

HotBurek ::

PRIMER 11

https://rastoca-jablana.si

Request na /robots.txt vrne http 404, skupaj z HTML content-om. Welllll done. To je za popravit, halo?

Druga stvar.

Opazil sem, da so nekateri linki na slike kar s presledki. To sicer gre, gre pa tudi, da presledke zamenjaš z daš-om.

Primer:
# :(
https://rastoca-jablana.si/assets/images/products/964/Fižol ledvičar EKO 400g v pločevinki Bio.o.k.jpg
# :)
https://rastoca-jablana.si/assets/images/products/964/Fižol-ledvičar-EKO-400g-v-pločevinki-Bio.o.k.jpg
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

Utk ::

Raje svojo stran poglej. Te ostale trgovine v nasprotju s tvojim pagom verjetno dejansko delajo.

val46 ::

Kaj pa če bi, namesto da pišeš te tvoje primere tu gor nam, kar nas niti ne zanima, pisal na te spletne trgovine in jim ponudil sebe kot "popravljalca/urejevalca" spletne strani? Boš še kaj zaslužil zraven morda.

Utk ::

https://www.mirko1.com/

Ti bi ustvarjalca te umetnine najel za svetovanje o svoji trgovini?

HotBurek ::

PRIMER 12

https://www.e-fresh.gr

Sitemap xml poniterji so vredu, no, je pa ena napaka.

Tole je sitemap file, ki pointa na druge sitemap-e:

https://www.e-fresh.gr/storage/feeds/si...

Napaka je v tem, da uporablja napačno strukturo. Moralo bi biti: sitemapidnex / sitemap / loc.

Če pa pointa na page, potem pa je urlset / url /loc.

Fantje, to je vse jasno.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

HotBurek ::

PRIMER 13

https://welovecheese.club

/robots.txt ima pointer na sitemap https://welovecheese.club/cms/sitemap_i.... In tam ni sitemap-a.

Treba je popravit robots.txt tako, da bo imel pointer na /sitemap_index.xml. Ker je sitemap tam. Wordpress pa to.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Mato989 ::

HotBurek lahko razlozis kaj tocno delas tukaj v tej temi mi je vsec samo bi zelel malo vec konteksta
Če sem pomagal, se priporočam za uporabo linka!
KUCOIN EXCHANGE link: https://www.kucoin.com/#/?r=E3I9Ij
BINANCE EXCHANGE link: https://www.binance.com/?ref=10161115

HotBurek ::

PRIMER 14

https://www.milnica.si

/robots.txt nima pointerja na sitemap.

Manjka:

Sitemap: https://www.milnica.si/sitemap_index.xml

To je pa to.

Mato989, zbiram podatke (produkte/artikle/izdelke) iz spletnih trgovin. Neke osnove (robots.txt, sitemap.xml, schema.org product) bi morale biti urejejne. Najdem pa takšne, in še druge napake. Take čiste osnove. In to napiše kaj najdem, pa je, vsaj po mojem mnenju, narobe za "današnji" čas.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

HotBurek ::

PRIMER 15

https://oljarna.altera-eco.si

V /robots.txt manjka pointer na sitemap xml.

Tole je potrebno dodat:

Sitemap: https://oljarna.altera-eco/sitemap_index.xml

Druga stvar.

Favicon link v web vmesniku ima pointer na:
https://meilmbwsmh14.cdn.shift8web.com/wp-content/uploads/2018/11/favicon.png

In tam se pojavi: Please wait while your request is being verified...

Potem pa redirect na page https://shift8web.ca/ in title "Toronto Web Design and Development | Shift8 Web". Ni to vredu.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

Lowink ::

15.5, kitajski joint se zdriuži kot da ga ni bilo.

c23po ::

Meni se zdi, da stran https://www.mirko1.com/ deluje in počne to, kar https://ceneje.si. Osebno bi/bom rajši iskal na Burekovi strani.
Glede dileme o tehnični izpopolnjenosti drugih trgovin pa: nismo vsi perfekcionisti. Njim deluje in so s tem zadovoljni. Cela družba pravzaprav funkcionira po načelu "od zgoraj fix, od spodaj nix".
Računalniki nimajo spominov.

Utk ::

Meni se zdi, da stran https://www.mirko1.com/ deluje

Ne, ne deluje. Dobesedno ne deluje. 2 featura ima, od tega en ne dela.

c23po ::

Glede na težo posta bi človek pričakoval tudi malo razsvetlitve. Tako pa "... od spodaj nix".
Računalniki nimajo spominov.

Utk ::

Iskanje je zanič. Če ne napišeš dobesedno (dela) imena produkta, ga ne najde. Izdelki bi morali imet še neke keyworde, ne samo ime, ali pa vsaj da potem izbereš kategorijo pod katero naj išče. Da ne govorimo o kakem keywordu z minusom spredaj, ali pa prevajanju v druge jezike, če že itak ima google translate.

c23po ::

OK, utemeljeno.
Vendar: koliko povprečnih iskalcev artiklov bo bralo sintakso iskalnega stavka? Narod pride, vtipka in pričakuje rezultat. Poizkusil sem z nekaj generičnih tipa "zmrzovalna skrinja Gorenje 250L" in sem dobil rezultate primerljive s ceneje.si.
Kaj je avtorjev namen, kam umestiti svoj iskalnik, pa mi ni čisto jasno.
Računalniki nimajo spominov.

Liker ::

Stran ne deluje dobro.
Iskanje je neuporabno.
Primer:
Iščem zamrzovalna omara, dobim 2 (DVA) zadetka.


Ampak opazim, da mi suggest ponuja še mnogo mnogo drugih opcij. Posksusim z znamko Candy, dobim en zadetek, ki ga prej ni bilo.


Ampak spet, suggest je ponujal različne modele. Poskusim enega naključno (drugačnega kot na prejšnjem zadetku), dobim zadetek, ki ga prej ni bilo.


Ponovimo še enkrat.



V trenutni obliki NEUPORABNO, ne le NEMARNO. Saj vem da je to nek WIP nekoga, ki že 15 let študira SQL tako intenzivno da so vprašanja še vedno na nivoju prve ure takšnega predmeta na srednji rač. šoli, ampak vseeno, nek minimalen standard se pa pričakuje ...

Zgodovina sprememb…

  • spremenil: Liker ()

Liker ::

Pa da se razumemo, nek globalni ceneje.si, ki bi dejansko deloval (ker večina teh primerjalnikov, tako slovenskih kot tujih je precej neuporabnih) bi bil zlata vreden (sploh če bi vodil še neko bazo katera trgovina pošilja kam in vsaj za približno koliko).
Ampak glede na to da OP dela stvari kot jih, bomo verjetno prej dosegli upload (prosto po Thomasu), preden bo to delovalo kot naj bi.

HotBurek ::

Iščem zamrzovalna omara, dobim 2 (DVA) zadetka.

Tako je pravilno. Za iskani input je bil najden izdelek v dveh različnih trgovinah. Tako dela default search. Grupira po trgovinah.

Kontra temu je pa expand.

https://www.mirko1.com/search.html?expa...



Kar se pa "smeri" tega projekta tiče: lahko je iskalnik, lahko primerjalnik, lahko nek "back-end support decision database view on current (world) shop situation", lahko seo for webshops, lahko kaj petega.

Trenutno zadeva še ni določena.

Edino, kar je določeno, da je za naprej no.1 prioriteta dodati čim več novih trgovin/produktov.

Miljon produktov, dva miljona produktov, tri moljone produktov.. in tako naprej. Do kam? Ne vem. Bomo vidl.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

Liker ::

Ok, legit.
Ampak to pomeni dve stvari.
1) UI je zanič, ker res nisem niti pomislil, da bi tisti moder tekst bil link ki bi naredil kaj uporabnega
2) Kdo bi sploh želel grupacijo po trgovinah? Kje je use case tega? In če že obstaja use case, zakaj za vraga je to default?

HotBurek ::

PRIMER 16

https://www.themerchantofvenice.com

Tale site ima neke performance/network issue. Enkrat dela normalno, drugič je po 20 sekundah time-out.

PRIMER 17

https://www.babycenter.si

V /roobts.txt manjka pointer na sitemap xml: Sitemap: https://www.babycenter.si/sitemap.xml

Ter, product sitemap-i imajo celotno vsebino napisano v eni vrstici. Ko to odpreš (browser/nano), je pač happy times za kurjenja CPU/RAM. Na networku pa se s tem ("kompresijo" v en line) prišpara koliko mili bitov?

Kar se pa HTML tiče. No, naj bo vsaj prva vrstica brez napake. To je 10 let stara scena. Je ta danes še veljavna?

root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

misek ::

HotBurek je izjavil:


https://www.babycenter.si
Ter, product sitemap-i imajo celotno vsebino napisano v eni vrstici. Ko to odpreš (browser/nano), je pač happy times za kurjenja CPU/RAM. Na networku pa se s tem ("kompresijo" v en line) prišpara koliko mili bitov?
Ta datoteka je generirana in jo ljudje itak ne bodo odpirali. Za procesiranje pa je lahko to celo boljše in hitrejše.

In odpiranje datoteke pri meni traja ravno 3 sekunde. Toliko, da se vprašam "bo ali ne bo". In je že konec ;)

HotBurek ::

Je pa lažje debugirat, če je lepo napisano. Plus, verjetno odvinso od CPU-ja. Moj mlin ima Intel Core 2 Duo 4400.

PRIMER 18

https://shop.spar.al

Vsi sitemap xml-ji se začnejo z dvema new line-oma.

Primer: https://shop.spar.al/wp-sitemap.xml

Internet validatorji pravijo, da je to napaka/error. Da se more že v first line-u začet prikazovat text.

XML Parsing Error: XML or text declaration not at start of entity

To je za popravit. Ostalo pa ok.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

misek ::

HotBurek je izjavil:

Moj mlin ima Intel Core 2 Duo 4400.
Treba nadgraditi. S tako zadevo se pa danes res ne boš šel resnega projekta :)

Liker ::

Najboljši avtomobili so 25 let stari BMW-ji.
Najboljši CPU-ji so 20 let stari Inteli.
Facts!

misek ::

HotBurek je izjavil:

Primer: https://shop.spar.al/wp-sitemap.xml
Internet validatorji pravijo, da je to napaka/error. Da se more že v first line-u začet prikazovat text.
XML Parsing Error: XML or text declaration not at start of entity
Napaka ni v prvi vrstici ampak na koncu četrte. Poskusi pa ugotoviti kaj je sploh narobe :)

OracleDev ::

Po enem minutnem pregledu tvoje source kode, vidim da znaš uporabljat if/else stavke in pisat v log.

HotBurek ::

Kul.

Evo, en problemček.

Pri izpisu/izrisu ikonce države in favikonce spletne strani sem poazil, da enim to izpiše vertikalno. Kar ni zaželjeno.

Zanima me, če tistim, ki se to zgodi, lahko pogledate v Inspector (F12) in... kaj bi bilo potrebno spremenit? Kolikor se spomnim, je tako, da, ker ta dva elementa:

<div style="display: inline-block; margin-left: 10px; vertical-align: middle;">&#127470;&#127481;</div>
<img style="vertical-align: middle; margin-left: 5px;" src="https://www.mirko1.com/favicon/000000264.png" width="16" height="16" alt="">

Izpisana z "new line-om", tako da je html output lepo tab aligned in vsak element v svoji liniji, potem nastane extra "whitespace". To bi lahko bila opcija, in bi moral posledično razširit td element iz trenutnih 55px na nekaj več.

Že od prej imam v kodi označeno:

# Make sure to use both elements (div and img) in same line due to "whitespace".
# More on that nasty fukup and possible solutions at:
# https://stackoverflow.com/questions/5078239/how-to-remove-the-space-between-inline-inline-block-elements

Kesneje sem, kot zgleda, spremenil in dal nazaj oba elementa v svojo linijo... in whitespce je tu... in mogoče je zaradi tega pri nekaterih brskalnikih izris ikonc "ena nad drugo".

Ne vem pa, v katerem browserju se to naredi. Firefox na Debian linuksih dela kot je bilo zaželjeno.

root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

Liker ::

Vivaldi na linuxu.
Težavo imaš s fiksnimi širinami. Vivaldi mi države pokaže z zastavami, ki imajo večji width kot prikaz drugje. Posledično wrapne v novo vrstico.

HotBurek ::

Ok, hvala za info.

Sedaj sem za div, znotrak katerega se izriše zastava, v CSS nastavil: max-width: 16px;

Mogoče bo pomagalo.

Please let me know.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

FireSnake ::

Mogoče bo pa res pomagalo :))

No, nisem edini, ki je ugotovil, da je ta spamer ... no, spamer.
Poglej in se nasmej: vicmaher.si

Kayzon ::

Kaj je smisel tega, ti ni skoda casa da zastonj isces napake na nekih obskurnih straneh?

HotBurek ::

PRIMER 18

https://www.jumbo.cl

Vse imajo ful dober porihtan, robots txt, sitemap xml, schema org... tu se pa ustavi. Manjka schema org product element. To bi prosil, če ima kdo dol dobre kontakte, da jim sporoči, kaj je za popravit. Pa ko bo popravljeno, če me lahko obvesti.

Namreč, škoda je tako fanjo spletno stran pustit, ane.

PRIMER 19

https://bottegadelgusto.pl

V /robots.txt je sitemap pointer postavljen na /wp-sitemap.xml in response http 404. To je treba popravit in imet pointer na /sitemap_index.xml (ali /sitemap.xml dokler je tam redirect na /sitemap_index.xml).

No, potem pa vsak link za product pointer vrne isti site z napisom:

Przebudowa

Z powodu przebudowy - sklep jest nieczynny.

Za utrudnienia przepraszamy!


Dober, ok ok, opravičilo sprejeto. Vsaj v sitemap xml odstranite potem pointerje na produkte, če jih trenutno nimate.

PRIMER 20

https://www.alqueso.es

Vse štima (robots txt, sitemap xml, scehma org product). No, manjka pa zapis "offer" s ceno in valuto za product. Ker če tega ni, so potem vsi izdelki označeni z ceno 0.00 EUR. Krneki
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

pegasus ::

Definicija spletnega nemarneža: tisti, ki bureku greni življenje ;-)

HotBurek ::

A si predstavljaš, da bi bilo vse idealno: vsi bi imeli robots txt, vsi bi imeli sitemap xml, vsi bi imeli schema org product. No error-s, no warnings, no parsing miss-fucks this-and-that, no network errors...

Napišeš en simple crawler, namečeš notri katere koli url-je, ki obstaja, in full blast v divjino ter pobereš vse podatke dol.

Ampak to bi pol lahko vsak naredil.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

HotBurek ::

Ali pa druga opcija.

Da bi imel v database-u recimo miljardo produktov, okvirno iz 50.000 spletnih trgovin, ter da bi imel dovolj public IP-jev, da bi lahko vsak produkt refreshal na interval ene ure max.

In pol bi sedel za računalnikom, 6 monitorjev, web vmesnik z wss (web socket secure), in bi lahko v živo spremljal, kaj se dogaja na svetu v spletnih trgovinah. Razni filtri po državah (kaj se dogaja v Brasil-iji?), po brendih (gledaš po kontinantih/jezikih ali jezikovnih skupinah (romanic/germanic/cyrillic/arab), kje je brand prisoten pogosteje, kje raste, kje pada, kje se na novo pojavlja, kje izginja), ....

Glede na to, kdaj so novi produkti dodani v database, bi lahko "ugotovil", če je na lokaciji "dan" ali "noč". Ker, verjetno se novi produkti dodajajo podnevi, po 9-ti uri dopoldan, recimo.

Verjetno bi se dalo najdit/ugotovit še kakšne druge stvari. Najdit kaj novega.

Novi trendi, preden so trendi. Ta scena. 8-)

Meni je misel na postavitev takega sistema zanimiva.

Enemu drugemu pa pač dol visi za vse to, in dela nekaj drugega, tretjega. And that's ok.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()

HotBurek ::

PRIMER 21

https://www.carethy.sk

Isto, kot primer 18. Manjka schema org product. Če jih kdo kontaktira, pa da se nekako popravi, bi bilo res lepo za po-crawl-at. Ker imajo okrog 22.000 produktov in bi bilo škoda jih spustit.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Kayzon ::

Je s tabo vse v redu?

HotBurek ::

PRIMER 22

https://uniforest.com

Prva stvar okrog robots txt. Tole je vsebina:

User-agent: *
Sitemap: https://uniforest.com/sitemap.xml

Manjka allow/disallow. Takole je prav:

User-agent: *
Disallow:

Sitemap: https://uniforest.com/sitemap.xml

Naprej. Izdelke ima v shcema org product name vnešen text: Magnum 32

Fantje, dajte to uredit in "popravit" na: Horizontal Log Splitter Magnum 32

Tretja stvar. Ta izdelek ( link ) ima v schema org product offer price vnešeno ceno: 1

Dober, če "ni" cene, pol daš 0. Lepše bi sicer bilo, da bi bila cena okvirna "retail".
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window

Zgodovina sprememb…

  • spremenilo: HotBurek ()
«
1
2


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Iskalnik produktov po spletnih trgovinah

Oddelek: Programiranje
445755 (253) HotBurek
»

Objavljanje strani v Google in Bing

Oddelek: Omrežja in internet
71134 (964) win64
»

Nizozemski študent zbral 15 milijonov elektronskih naslovov uporabnikov Googla

Oddelek: Novice / Zasebnost
136724 (5282) techfreak :)
»

Zakaj mi google ne najde strani?

Oddelek: Izdelava spletišč
225989 (4594) bluefish
»

Čimbolj neboleča predelava strani

Oddelek: Izdelava spletišč
313455 (2346) R33D3M33R

Več podobnih tem