http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 5716|回复: 8

[反馈建议] 似乎发现编码错误

[复制链接]
发表于 2017-7-30 23:11:29 | 显示全部楼层 |阅读模式
代码网址:http://www.xiaolinyinwu.com/temp ... jquery-1.8.3.min.js
源代码搜索:j.test(" ")

浏览器访问是可以搜的到的


然后利用 File.WriteAllBytes(filepath, result.ResultByte);保存文件

将搜索不到关键字,被替换为了j.test("?)

这时候这个jq就失效了




1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2017-7-31 09:04:55 | 显示全部楼层
用Httphelper访问获取的源码?
 楼主| 发表于 2017-7-31 16:07:33 | 显示全部楼层
站长苏飞 发表于 2017-7-31 09:04
用Httphelper访问获取的源码?

用的result.ResultByte 没有用html
发表于 2017-7-31 16:14:23 | 显示全部楼层
会不会是在保存的时候设置的编辑不对,你直接调试看看提取到的是不是对的,你可以直接转成Html然后再保存,如果转成Html也不行的话那就是Httphelper的问题,如果不是的话,那应该是保存时候设置的编码问题
 楼主| 发表于 2017-7-31 16:57:37 | 显示全部楼层
站长苏飞 发表于 2017-7-31 16:14
会不会是在保存的时候设置的编辑不对,你直接调试看看提取到的是不是对的,你可以直接转成Html然后再保存, ...

File.WriteAllBytes(filepath, result.ResultByte);
这种方式保存的时候可以设置编码么?
站长大大有时间的时候可以测试下这个js
觉得比较少见
发表于 2017-8-2 09:00:45 | 显示全部楼层
  File.WriteAllText("路径", result.Html);

这样是没有问题的
发表于 2017-8-2 09:01:20 | 显示全部楼层
换个方式吧,应该是那个方法无法设置编码的问题
 楼主| 发表于 2017-8-7 19:45:29 | 显示全部楼层
站长苏飞 发表于 2017-8-2 09:01
换个方式吧,应该是那个方法无法设置编码的问题

这个网站我先忽略了,类似的问题很多~
有的文件明明是GBK的,但是请求的时候注明了要UTF8的,浏览器会自动按UTF8处理
我们单纯通过请求,又会自动请求成GBK~~

发表于 2017-8-8 08:24:04 | 显示全部楼层
Homeless 发表于 2017-8-7 19:45
这个网站我先忽略了,类似的问题很多~
有的文件明明是GBK的,但是请求的时候注明了要UTF8的,浏览器会自 ...

浏览器带有引擎,自动解析编码,这个不可同日而语。
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-11-22 06:40

© 2014-2021

快速回复 返回顶部 返回列表