Forum » Programiranje » aspx preberm HTML strani
aspx preberm HTML strani
Lualah ::
Z Aspx parsam HTML stran, ampak problem je da je ena v utf-8 ena v iso-8859-1 ena pa v windows-1250 kodiranju. Ta ko je v utf-8 šumniki delajo, druge pa ne, namest šumnikov so ? in podobni znaki. Je možno narediti kako da bi šumniki delali tudi iz teh strani ki so v drugem kodiranju?
techfreak :) ::
ASCIIEncoding ascii = new ASCIIEncoding(); UTF8Encoding utf8 = new UTF8Encoding(); byte[] asciiBytes = Encoding.Convert(utf8, ascii, utf8bytes);
techfreak :) ::
To uporabiš takrat ko prebeš HTML stran. Kar pa ti ta funkcija vrne, pa potem uporabiš za parsanje.
Lualah ::
hmm noče mi delovati
in
Vidi kdo napako?
string htmlContent = GetHtmlContent(url); htmlContent = HtmlHelper.ConverEncodings(htmlContent, Encoding.Unicode, Encoding.UTF8); return new HtmlHelper().GetTagsAndValues(htmlContent);
in
public static string ConverEncodings(string content, Encoding currentEncoding, Encoding newEncoding) { // Convert the string into a byte[]. byte[] bytes = currentEncoding.GetBytes(content); // Perform the conversion from one encoding to the other. byte[] newBytes = Encoding.Convert(currentEncoding, newEncoding, bytes); char[] newChars = new char[newEncoding.GetCharCount(newBytes, 0, newBytes.Length)]; newEncoding.GetChars(newBytes, 0, newBytes.Length, newChars, 0); return new string(newChars); }
Vidi kdo napako?
Lualah ::
tudi jaz mislim da je, isto je z ascii kaze ? namesto sumnika...
Uporabljam ncrawler mislim da on ze v osnovi pobere znak dol namesto sumnika, mogoce se motim...
Uporabljam ncrawler mislim da on ze v osnovi pobere znak dol namesto sumnika, mogoce se motim...
Lualah ::
nasel sem izvir osnovne napake. S streamreaderjem preberem html output url naslova, ampak le ta pa unici sumnike.
Lahko bi prebral html kar takole
ampak sem prebral na netu da to ni priporocljivo. Je pa res da tako delajo vsi sumniki razen ž in spet nevem zakaj. Ne vem niti zakaj Streamreader unici vse sumnike? Kaj predlagate?
Stream data = client.OpenRead(url); StreamReader reader = new StreamReader(data); string s = reader.ReadToEnd();
Lahko bi prebral html kar takole
WebClient client = new WebClient(); String htmlCode = client.DownloadString(url)
ampak sem prebral na netu da to ni priporocljivo. Je pa res da tako delajo vsi sumniki razen ž in spet nevem zakaj. Ne vem niti zakaj Streamreader unici vse sumnike? Kaj predlagate?
Zgodovina sprememb…
- spremenilo: Lualah ()
Senzacionale ::
StreamReader reader = new StreamReader(data, Encode.UNICODE);
ali katerokoli kodiranje želiš
ali katerokoli kodiranje želiš
http://www.dostavahrane.si
Vredno ogleda ...
Tema | Ogledi | Zadnje sporočilo | |
---|---|---|---|
Tema | Ogledi | Zadnje sporočilo | |
» | [c#] shrani text, tabele, slikeOddelek: Programiranje | 1522 (1128) | klemen93 |
» | [C# asp.NET web forma] Kam zgine cookie oz. zkj se izbriše?Oddelek: Programiranje | 1143 (957) | Morenov |
» | ASP.NET + C# vprašanjeOddelek: Programiranje | 2789 (1803) | Morenov |
» | [C#] Simobilov GlasnikOddelek: Programiranje | 4345 (1425) | Mrch |
» | Kako z VS.NET priti do izvorne kode neke html strani?Oddelek: Programiranje | 1345 (1140) | Microsoft |