苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 13082|回复: 8

[总群] http返回,页面上的chartset跟content-type不一致。

[复制链接]
发表于 2018-12-27 15:29:03 | 显示全部楼层 |阅读模式
Mr. Zhang() 14:47:25

有个问题不知道各位怎么处理的,http返回,页面上的chartset跟content-type不一致。会导致乱码。各位如何处理的?



1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2018-12-27 17:12:33 | 显示全部楼层
我只是路过打酱油的。
发表于 2018-12-27 18:53:51 | 显示全部楼层
我只是路过打酱油的。
发表于 2018-12-27 19:58:22 | 显示全部楼层
我只是路过打酱油的。
发表于 2018-12-27 19:59:26 | 显示全部楼层
chartset为主就行了,活着直接用页面中提取,不依靠属性
发表于 2018-12-28 08:31:24 | 显示全部楼层
感恩无私的分享与奉献
发表于 2018-12-28 13:00:20 | 显示全部楼层
站长苏飞 发表于 2018-12-27 19:59
chartset为主就行了,活着直接用页面中提取,不依靠属性

苏大,有空看看这个地址   http://www.yangtse.com/app/house/2018-12-10/649725.html  
页面的charset=gbk。
Header中 Content-Type:text/html; charset=UTF-8。
实际网页编码是utf-8。
万能框架中取的是页面的charset,导致解析出乱码
发表于 2018-12-28 15:41:46 | 显示全部楼层
~哖_少~オ輕狂 发表于 2018-12-28 13:00
苏大,有空看看这个地址   http://www.yangtse.com/app/house/2018-12-10/649725.html  
页面的charset= ...

基本上做不到完全自动,框架取的是概率,像这种情况 直接手动指定一下就行了。很少见的。
发表于 2019-1-2 10:01:26 | 显示全部楼层
强烈支持楼主ing……
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-26 21:39

© 2014-2021

快速回复 返回顶部 返回列表