只需一步,快速开始
分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程
HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成
HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子
使用道具 举报
站长苏飞 发表于 2014-11-23 17:56 这是因为网页误导了Httphelper,Httphelper是根据页面返回的Mate值首页进行解码的,但是这两个页面上写的是 ...
yq5858588 发表于 2014-11-24 09:11 晕死呀楼主,我要采集的是各种网页,我不能固定编码呀?
站长苏飞 发表于 2014-11-24 11:33 没有办法指定就自己写一套吧,我做不了,可以不用我的类,不用那么激动。
cload 发表于 2014-11-24 13:42 我已经指了一条路,LZ无视。 站长的类免费,爱用不用。 现在的年青人太浮躁,请教个问题都居高临下!!
yq5858588 发表于 2014-11-24 13:58 你说的那个方法我试过了,有的网页会返回iso88591的编码,但是真正的编码还是utf或者是gbk,所以你那个方 ...
cload 发表于 2014-11-24 15:56 不是还有个根据字节流判断编码的么??? 看过帖子回复一下是个好习惯
本版积分规则 发表回复 回帖后跳转到最后一页
|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)
GMT+8, 2025-4-4 13:41
© 2014-2021