» »

HttpWebResponse CharacterSet

HttpWebResponse CharacterSet

Senzacionale ::

http://msdn.microsoft.com/en-us/library...

response.CharacterSet


ampak namesto da bi iz strani http://24ur.com/ dobil charset utf-8 dobi nazaj iso-8859-1. Nikjer ne dobi pravega chasrseta, iz nobene strani...
http://www.dostavahrane.si

Senzacionale ::

mogoče kdo ve vzrok?
http://www.dostavahrane.si

der_Alte ::

UTF-8 imajo zapisano v samih dokumentih z »meta« značko. Tako, da browser preklopi nanj. Kaj imajo v HTTP zaglavju si pa že ugotovil.
Umri mlad! Bodi lepo trupelce!

techfreak :) ::

UTF-8 imajo zapisano v samih dokumentih z »meta« značko. Tako, da browser preklopi nanj. Kaj imajo v HTTP zaglavju si pa že ugotovil.

Browser se bolj malo pobriga na meta značko. Prednost ima kar mu strežnik pošlje.

Senzacionale ::

Hmm torej ni tako enostavno kot sem mislil da bo, se da kako na drugačen način potem izvedeti v katerem charsetu je stran? Iščem ampak ne najdem nobene delujoče rešitve...
http://www.dostavahrane.si

techfreak :) ::

Regex uporabi in najdi meta tag za charset. Večina strani ga ima.

Senzacionale ::

hmm z regexom pa nisem najbojši, če znaš regex mi ga lahko napišeš?
http://www.dostavahrane.si

fiction ::

Jah no sej ni nujno, da z regexpi (dejansko je taka resitev bolj hack kot ne).
Pac na nek nacin sparsas iz HTML-ja, ki si ga dobil s streznika <meta http-equiv="Content-type" content="text/html; charset=UTF-8" />
oz. vrednost charset atributa. Zakaj pa rabis drugace ta podatek o charsetu?

Senzacionale ::

ja na nek način ampak ne vem na kateri, ker ga na noben način ne dobim. Noben ne dela...:( Ker parsam določene vsebine iz neta ampak ima vsaka stran svoj encoding in potem uniči šumnike če ne določim točen encoding StreamReaderju ko bere...
http://www.dostavahrane.si

Senzacionale ::

REŠENO:

HtmlDocument htmlDoc = new HtmlDocument();

            Encoding documentEncoding = htmlDoc.DetectEncoding(propertyBag.ResponseStream);
            propertyBag.ResponseStream.Seek(0, SeekOrigin.Begin);

            if (documentEncoding != null)
            {
                htmlDoc.Load(propertyBag.ResponseStream, documentEncoding, true);
            }
            else
            {
                htmlDoc.Load(propertyBag.ResponseStream, true);
            }

            string originalContent = htmlDoc.DocumentNode.OuterHtml;


če še kdo rabi
http://www.dostavahrane.si


Vredno ogleda ...

TemaSporočilaOglediZadnje sporočilo
TemaSporočilaOglediZadnje sporočilo
»

Davčne blagajne (strani: 1 2 3 424 25 26 27 )

Oddelek: Programiranje
1344331874 (71877) Macketina
»

Prikaz Č na forumu

Oddelek: Programiranje
212080 (1679) nightrage
»

[XAMPP] Server se polomi ob čšžđć

Oddelek: Izdelava spletišč
91658 (1491) alexa-lol
»

ASP.NET + C# vprašanje

Oddelek: Programiranje
342760 (1774) Morenov
»

[C#] Simobilov Glasnik

Oddelek: Programiranje
134331 (1411) Mrch

Več podobnih tem