http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 15459|回复: 10

[开发助手] 赶集网发帖页面的验证码如何消除?如何实现自动发帖?

[复制链接]
发表于 2015-1-5 16:37:53 | 显示全部楼层 |阅读模式
5金钱

如果我用浏览器登陆,用户登陆成功后,赶集网的发帖页面的checkcode怎么控制?

http://www.ganji.com/pub/pub.php?act=pub&method=load&cid=6&mcid=14&domain=nb&&deal=1 (发帖界面)

如果我用浏览器登陆,验证码不显示;
但如果我用爬虫把这个页面爬下来,得到的页面有验证码,这个怎么修改呢?

我看了一下页面的html+js代码,发现里面有个全局的js控制checkcode是否显示,但我不知道如何和服务器端交互,希望js高手帮下忙?

可以用firebug+wireshark+chrome+firefox来抓包?


求大牛给我一个解决方案?


另外我用坛主的httphelper提供的思路实现了赶集网登陆,但是登陆成功之后的cookie没有设置(我猜想是这个cookie来判断是否显示验证码),所以


及时爬虫登陆成功,再爬发帖页面时,仍然会有验证码,不知道少发了哪个请求,或者少设置了哪个cookie?






1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2015-1-6 08:21:52 | 显示全部楼层
这个抓包分析一下吧,把发贴页面的包分析一下。看看都带有什么参数
回复

使用道具 举报

发表于 2015-1-6 08:57:15 | 显示全部楼层
关注下,我也遇到这个问题了
回复

使用道具 举报

发表于 2015-1-6 11:03:02 | 显示全部楼层
我有做过赶集网的房产发布,有需要请联系我
回复

使用道具 举报

 楼主| 发表于 2015-1-6 12:28:50 | 显示全部楼层
站长苏飞 发表于 2015-1-6 08:21
这个抓包分析一下吧,把发贴页面的包分析一下。看看都带有什么参数

抓包工具抓不到,不知道向哪个地方放链接了,很奇怪。 登陆的抓包也不知道是哪个数据包。
回复

使用道具 举报

 楼主| 发表于 2015-1-6 12:29:15 | 显示全部楼层
Loman源 发表于 2015-1-6 11:03
我有做过赶集网的房产发布,有需要请联系我

楼主,做过自动发帖了,解决了这个问题吗? 用什么实现的
回复

使用道具 举报

发表于 2015-1-6 13:02:57 | 显示全部楼层
抓不到使用Finder2
回复

使用道具 举报

 楼主| 发表于 2015-1-9 16:20:51 | 显示全部楼层
根据楼主的建议我使用了Finder2,确实很详细,能够抓到所有过程。
但现在有一个最重要的问题,不知道如何解决,请楼主帮忙。

浏览器登陆完成后会设置一个cookie内容,ganji_uuid=4909107840471561534474; 但我查看了大多数交互请求,还是没找到这个怎么是从哪个记录中设置的,如果楼主有空,帮忙跟踪一下。
回复

使用道具 举报

发表于 2015-1-13 09:40:30 | 显示全部楼层
200RMB 可以
回复

使用道具 举报

 楼主| 发表于 2015-1-13 15:29:05 | 显示全部楼层
已搞定
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-11-24 13:44

© 2014-2021

快速回复 返回顶部 返回列表