c++ šumniki @ Slo-Tech

Forum » Programiranje »
c++ šumniki

c++ šumniki

alexxxx :: 8. apr 2009, 10:03

Evo pojavil se mi je še zadnji problem shranjevanje šumnikov v datoteko. Torej šumniki se shranjujejo kot ANSI jas pa hočem da se shranijo kot UTF-8 saj drugače ne delajo. Lahko jih normalno vpisujem vendar morem nato datoteko odpreti dati kodiranje na UTF-8 rad bi da vse skupaj poteka avtomatsko. Če pa spremenim šumnike v samem programu (glej tukaj klik) pa mi v datoteko shrani take čačke ź ¬ ç ć § ¦ torej kako odpreti in shraniti datoteko v c++ tako da bo ta datoteka v UTF-8 formatu?

Ps google ni našel kaj pametnega
pps zelo fajn bi blo da se "deklarira" taka datoteka, drugače bom moral spreminjati cel program (cca 2000 vrstic kode

)

BlueRunner :: 8. apr 2009, 10:11

C je nizkonivojski jezik. Kot takšen nima pojma o UTF-jih ali kakšnih kodnih tabelah.

Uporabiti boš moral katero izmed namenskih knjižnic za uporabo Unicode. Če si pametno uporabljal C++ abstrakcijo, sprememb ne bi smelo biti preveč. Če pa ne, potem pa pač ne.

Ena izmed knjižnic, ki jo morda lahko izkoristiš, je ICU.

alexxxx :: 8. apr 2009, 18:15

Še kakšna druga možnost

, kakršna koli?! Macro? Bat file? xyz?

BlueRunner :: 8. apr 2009, 20:06

Hmm... ali sploh razumeš na katerem nivoju je gol C/C++ (zakaj se mu reče nizko nivojski) in kaj je Unicode (UTF)?

Oziroma, daj raje povej od kje dobiš te šumnike, ki jih želiš shraniti v datoteko. V kateri kodni tabeli jih imaš pa zapisane v pomnilniku?

Zgodovina sprememb…

spremenilo: BlueRunner (8. apr 2009 ob 20:06)

Matako :: 8. apr 2009, 21:16

Rabiš nekaj v stilu http://www.chilkatsoft.com/charset-libr..., delati to iz 0 je nehvaležno opravilo, ker je UTF8 UNICODE zapis in torej imaš potencialno tisoče kod in še druge fore (kombinacije).

Tudi ko boš enkrat uspel konvertirati nek določen s kodnimi tabelami razširjen ASCII niz ne pozabi dveh osnovnih lastnosti UTF-8

1. UTF8 Kode 0-127 so enake ASCII (7-bit) kodam. To je največji časr UTF8: kompatibilen je z ASCII.

2. Vsi ostali znaki so multi-byte! To zadnje ima za posledico, da ti bo strlen() ipd. funkcije v splošnem vrnil število _bajtov_ in _ne_ znakov. Se pravi še vedno boš pravilno alociral pomnilnik, ne boš pa na ta način dobil logične dolžine niza, za to uporabi utf8 funkcije (spet knjižnica). Je pa UTF8 dovolj zvito zamišljen, da je vedno za vsak byte v nizu jasno ali je nadaljevanje multi-byte sekvence ali je začetni/samostojni znak. To je recimo drugi čar UTF8 ;)

/\/\.K.

Zgodovina sprememb…

spremenil: Matako (8. apr 2009 ob 21:17)

Vredno ogleda ...

	Tema	Sporočila	Ogledi	Zadnje sporočilo
	Tema	Sporočila	Ogledi	Zadnje sporočilo
»	Unicode decode poweroff Oddelek: Programiranje	12	2377 (1835)	Randomness 6. sep 2015 09:35:52
»	Unicode 8.0.0 prinaša več kot sedem tisoč novih znakov McHusch Oddelek: Novice / Ostala programska oprema	38	39445 (33924)	johnnyyy 23. jun 2015 15:29:46
»	Nadgradnja softvera in zato problemi s šumniki zeutrino Oddelek: Operacijski sistemi	17	3520 (3212)	zeutrino 3. jun 2011 01:16:50
»	[C++] Slovenski znaki v Command Promptu Makronaut Oddelek: Programiranje	13	3632 (3336)	Makronaut 24. sep 2007 14:05:07
»	kodna tabela kondratiev Oddelek: Programiranje	8	4498 (4312)	BlueRunner 20. jun 2006 17:18:13

Več podobnih tem

Zadnje novice

Zadnji članki

Išči:

Forum » Programiranje »
c++ šumniki

c++ šumniki

c++ šumniki

alexxxx :: 8. apr 2009, 10:03

BlueRunner :: 8. apr 2009, 10:11

alexxxx :: 8. apr 2009, 18:15

BlueRunner :: 8. apr 2009, 20:06

Matako :: 8. apr 2009, 21:16

Vredno ogleda ...

Unicode decode

Unicode 8.0.0 prinaša več kot sedem tisoč novih znakov

Nadgradnja softvera in zato problemi s šumniki

[C++] Slovenski znaki v Command Promptu

kodna tabela

Forum » Programiranje » c++ šumniki

c++ šumniki

c++ šumniki

alexxxx :: 8. apr 2009, 10:03

BlueRunner :: 8. apr 2009, 10:11

alexxxx :: 8. apr 2009, 18:15

BlueRunner :: 8. apr 2009, 20:06

Matako :: 8. apr 2009, 21:16

Vredno ogleda ...

Forum » Programiranje »
c++ šumniki