苏飞论坛

标题: 抓取的时候获取到了一些&#+5位数字+;的内容,怎么转换? [打印本页]

作者: inghot    时间: 2012-11-1 17:37
标题: 抓取的时候获取到了一些&#+5位数字+;的内容,怎么转换?
在抓取的时候,有些网站的内容可能进行过某种编码,好让中文显示。
如下:
& # 24050 ;
这个是【已】字,把& # 2中间的空格去掉。
这样的内容该如何转换(C#),不知道是什么编码来着。


作者: 站长苏飞    时间: 2012-11-1 18:02
帮顶,没见过
作者: inghot    时间: 2012-11-1 18:33
是html 编码解码地址
C# WINFORM 解决方法:
在WINFORM中引入System.Web
然后使用System.Web.HttpUtility.HtmlDecode("已签收");就行了。
如果是WEBFORM就不用引入System.Web。
作者: enerst    时间: 2013-1-29 00:35
跟&nbsp一个原理 汉字是10进止的unicode
作者: inghot    时间: 2014-3-13 14:04
http://www.sufeinet.com/thread-826-1-1.html
作者: ching126    时间: 2014-9-9 23:04
我只是路过打酱油的。
作者: ching126    时间: 2014-9-9 23:05
路过,哈哈




欢迎光临 苏飞论坛 (http://www.sufeinet.com/) Powered by Discuz! X3.4