http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 3489|回复: 1

[HttpHelper] 为什么用HttpHelper抓包下来的html源码和直接点击右键查看的不一样?

[复制链接]
发表于 2016-4-22 13:05:57 | 显示全部楼层 |阅读模式
我用httphelper抓一个网页。 得到的html 和 我在电脑上用google浏览器打开网页点击右键查看的不一样。分析下来,可能是浏览器代理的问题。 google浏览器的urseragent应该怎么设置?


                URL = url,//URL     必需项     
                Method = "get",//URL     可选项 默认为Get   
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写   
                Cookie = "",//字符串Cookie     可选项   
                Referer = "",//来源URL     可选项   
                Postdata = "",//Post数据     可选项GET时不需要写   
                Timeout = 300000,//连接超时时间     可选项默认为100000   
                ReadWriteTimeout = 50000,//写入Post数据超时时间     可选项默认为30000     
                UserAgent = "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)",//用户的浏览器类型,版本,操作系统     可选项有默认值   
                ContentType = "text/html",//返回类型    可选项有默认值   
                Allowautoredirect = false,//是否根据301跳转     可选项  





1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
 楼主| 发表于 2016-4-22 13:27:18 | 显示全部楼层
通过 http://www.useragentstring.com/ 这个网站找到了 goole浏览器的 useragent,但是用httphelper抓包,发现抓下路的html还是和google浏览器直接打开的不一样。

这个网站也奇怪,用ie浏览器打开是一个显示方式,用google浏览器打开显示是另外一个方式。内容一样的,布局不一样。用goole浏览器时,左侧筛选栏目,用ie打开没有。
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-11-23 15:26

© 2014-2021

快速回复 返回顶部 返回列表