Forum » Programiranje » [Python] Convert IDNA links
[Python] Convert IDNA links
HotBurek ::
Dobro jutro.
Evo, nov dan, nov rešen problem.
Pojavil se je link v sledeči obliki:
https://www.xn--elolivoespaol-skb.es/es...
In sem se lotil convertat tist xn-- -skb v bolj normalne črke.
Sample:
Output:
Kot kaže, dela pravilno.
Meni je lažje videt "pravi" zapis, v tem primeru ñ, kot se gre.
Me pa zanima, če in kako vi shranjujete takšne linke v bazo?
Ter, če gre za hfref link v HTML-ju, v kateri obliki ga je bolje zapisat ter zakaj?
Ker zna bit moteče, če primerjaš "www.xn--elolivoespaol-skb.es" z "www.elolivoespañol.es", in kr naenkrat ni enako. Čeprav v nekem kontekstu je.
Evo, nov dan, nov rešen problem.
Pojavil se je link v sledeči obliki:
https://www.xn--elolivoespaol-skb.es/es...
In sem se lotil convertat tist xn-- -skb v bolj normalne črke.
Sample:
import idna; link = "https://www.xn--elolivoespaol-skb.es/es/queso/174-quesos-la-casota-queso-manchego-artesano-marantona-viejo.html"; print(link); print(type(link)); link = link.encode("utf-8"); print(link); print(type(link)); link = link.decode("idna"); print(link); print(type(link));
Output:
https://www.xn--elolivoespaol-skb.es/es/queso/174-quesos-la-casota-queso-manchego-artesano-marantona-viejo.html <class 'str'> b'https://www.xn--elolivoespaol-skb.es/es/queso/174-quesos-la-casota-queso-manchego-artesano-marantona-viejo.html' <class 'bytes'> https://www.elolivoespañol.es/es/queso/174-quesos-la-casota-queso-manchego-artesano-marantona-viejo.html <class 'str'>
Kot kaže, dela pravilno.
Meni je lažje videt "pravi" zapis, v tem primeru ñ, kot se gre.
Me pa zanima, če in kako vi shranjujete takšne linke v bazo?
Ter, če gre za hfref link v HTML-ju, v kateri obliki ga je bolje zapisat ter zakaj?
Ker zna bit moteče, če primerjaš "www.xn--elolivoespaol-skb.es" z "www.elolivoespañol.es", in kr naenkrat ni enako. Čeprav v nekem kontekstu je.
root@debian:/# iptraf-ng
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window
fatal: This program requires a screen size of at least 80 columns by 24 lines
Please resize your window
Spura ::
Z vsemi podatki delas kot unicode stringi, ker URLji to so, web podpira unicode domene. Karkoli drugega je iskanje problemov. Za URLje imas jasne definicije kaj so dovoljeni znaki in kaj se enkodira, za kanonicno reprezentacijo hoces odstranit vsa nepotrebna enkodiranja, tako da so primerjave lahko tocne.
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | ne gre dostopati do tujih internetnih straniOddelek: Omrežja in internet | 1238 (1010) | Bakunin |
» | Sim karticaOddelek: Mobilne tehnologije | 3215 (2733) | fantasycamp |
» | Nelatinski znaki prihajajo v vrhnje domene (strani: 1 2 )Oddelek: Novice / Omrežja / internet | 12468 (9966) | motorc |
» | Udobne slušalkeOddelek: Kaj kupiti | 1912 (1334) | Romancek1 |
» | DF v linuxu mi nekaj ne štimaOddelek: Operacijski sistemi | 750 (662) | KoReNJe |