http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 5478|回复: 7

[反馈建议] HttpHelper GET页面少返回个SET cookie

[复制链接]
发表于 2014-5-23 11:05:23 | 显示全部楼层 |阅读模式
抓包的图片






Httphelper GET页面只有前面2个SET cookie 后面的sec cookie没有。。。 求指教





1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2014-5-23 11:18:41 | 显示全部楼层
Cookie不定都是页面返回的还有可能是Js,或者是其他页面生成的。
 楼主| 发表于 2014-5-23 11:23:02 | 显示全部楼层
京东带验证码的都登录不了 不知道和这个有关系没
发表于 2014-5-23 15:57:45 | 显示全部楼层
发条陈 发表于 2014-5-23 15:11
真心建议你 处理下cookie  最好是重新设计.

我建议是用coocontainer

你也认为这个Cookie返回的丢失或者是多少,是和我的类有关系吗?如果是这样我只能说你们都应该补一下基础知识了。Cookie是怎么来的,为什么浏览器获取的和类获取的不一样,这样的问题一问出来就表示是连基础都不懂的,说实话我感觉如果还在问这类问题的人,我真想高傲的说一声,咱们没办法沟通改造,因为你根本不懂基础。  这个问题我不再多解释。 不相信你自己写个方法和用我的类比比看看Cookie是不一样多的。
发表于 2014-5-23 17:11:00 | 显示全部楼层
发条陈 发表于 2014-5-23 16:45
1.我没用过你的类
我只是看到一堆人在说   cookie丢失问题  我说的是事实 可对?
2.我看你给出的解决办 ...

首先我并不否认大家的建议,反而是很感谢,但是我也是人,你们也不能随便不分青红皂白的就乱讲吧!
你看看文章,如果你但凡懂一点Http原理你就不会这样了,或者是你看过Httphelper源码,但是要看懂也不会这样说。
我源码就在那里放着,我没有干涉任何Cookie的接收,只是帮助大家组织一下参数,获取的Cookie肯定是全的,和你自己写不可能有分别。
。cookie丢失,我了个去,还在说这个事。cookie丢失这个问题让我很奇怪。怎么成了我和类的问题了?
是丢失吗?到低能不能懂一点最基础的再交流啊。    你们是不是都认为一个网页打开会得到什么Cookie,
Httphelper请求这个网址也就会得到什么Cookie,如果不是就是丢失,是吗?
  如果是这样那还要登录,验证码,防止抓取,JS,Ajax,还要这些东西干什么,
直接用浏览器不就完了。。是不是从来都没有看过Html是什么? Cookie是由什么组成的。

看看提这些问题的人,我敢说没有一个人应该是绝对没有一个人懂得浏览器Cookie为什么和直接获取不一样的。

然后就说我的Httphelper类有问题。我的是Http请求帮助类,不是浏览器。这点要能清楚。不能执行 JS,解析Html,不能自动登录。不能执行其他脚本生成CooKie

我建议你最少看下源码,然后再回头看看这些问题,看看是为我写的代码把Cookie丢了吗?。
我相信你会有所改变,你自己都说了你没用过,怎么能体会到呢。如果我说你这是空谈,你应该也没有什么理由吧。

为什么 有时候string 有时候集合?

这样的问题 我只想说我没空回复。我厌倦了。请百度


要说别人的东西有问题之前最少应该知道为什么吧。
发表于 2014-5-23 18:13:03 | 显示全部楼层
发条陈 发表于 2014-5-23 18:07
1.首先 我一直都是用自带httpwenbrequest类的.最近自己的http类也在写
所以不要说什么不懂基础
2.其次  ...

cookiecontainer  我不多说什么,你把这个给我存进去我看看


key:
aaa
value:
aaa,fsfsf,fdsfssufeinet.com
你把这个Cookie存储到你所说的cookiecontainer  自己看看会不会报错。
字符串的是因为会带Path 或者是过期时间,而集合的是不带的,更规范一些。有些网站是必须用字符串的、cookie的,这就像是Post或者是Get,Post这么好为什么还要用Get呢, 这上你懂的。

有些是实现不了的,Post不限制参数长度,而Get限制。




发表于 2014-5-23 18:19:42 | 显示全部楼层
或者你找个需要限制时间的Cookie试试看。不是我说基础,我就问一句,你认为Httphelper获取的Cookie和浏览器获取的不一样就是丢失吗?

如果是我真的不敢再说什么了。真的。
发表于 2014-5-23 19:26:23 | 显示全部楼层
发条陈 发表于 2014-5-23 18:36
你说的cookie 我已经测试  会报错.

这的确是因为部分网站的不规范导致的.

不是光这一个问题这只是其中一个,还有好多,我说让他们换格式,是让他们先排除规范的基本问题,并不是类有问题,我本身就是写站长工具的,7c.com每天有几十亿的请求在实践,不是我非要这样,而是只有这样才能解决问题,最少我只能想到这个办法,如果要提醒,我要写的提醒会超过一百以上,这个有时间,我发个帖子,让你看看,集合与字符为什要并存,如果真是一种就能解决。你有没有想过,微软为什么要出那么多格式,难道就是为了告诉别人他能,哈哈,实践战胜理论,
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-23 10:34

© 2014-2021

快速回复 返回顶部 返回列表