苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 10439|回复: 9

[其他] 采集被封ip的解决办法?

[复制链接]
发表于 2012-12-22 11:22:59 | 显示全部楼层 |阅读模式
采集软件采集58百姓等网站总会被封ip而需要输入验证码什么的;
为此在程序中增加了ip自动拨号功能但还是无法解决;
不知是否有更好的解决方案;
谢谢!!!!!


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2012-12-22 11:27:46 | 显示全部楼层
请问你是使用什么方法采集的,Http请求,还是别的方法
 楼主| 发表于 2012-12-22 14:48:39 | 显示全部楼层
http请求的!
发表于 2012-12-22 15:00:25 | 显示全部楼层
1.如果是Http请求的那你只修改IP应该是不行的,
因为他们很有可能是根据你的UserAgent 信息,做的验证,当然IP也是会验证的,
如果你只是修改了IP,而不修改UserAgent 信息也是不行的,他们会检查到你的IP是换了,但是用户信息完全一样,浏览器,操作系统,电脑名字都一样,这样很容易被认为是机器。建议可以从这方向入手,但是具体有多大效果这个不好说
2.注意一下看看还有那些信息是变化的,或者是可以变化的,你都让他变化一下,其它的也没有什么好的方法。
3.也有可能是采集代码里把一些应该是变化的参数给写死了,建议你再比对一下参数
发表于 2012-12-23 22:46:48 | 显示全部楼层
有个问题还请注意,更换IP好像仅对ADSL有效,因为貌似仅ADSL在每次重新拨号后,才会重新订制网络IP,另貌似局域网是无效的,它与其他同局域网机器共用一个网络IP。曾遇到过,高中整班申请163邮箱,导致整个计算机实验室无法登陆163官网
 楼主| 发表于 2012-12-24 08:53:02 | 显示全部楼层
守望幸福 发表于 2012-12-23 22:46
有个问题还请注意,更换IP好像仅对ADSL有效,因为貌似仅ADSL在每次重新拨号后,才会重新订制网络IP,另貌似 ...

我们采集的电脑是单独网络,不使用局域网;
 楼主| 发表于 2012-12-24 08:55:05 | 显示全部楼层
admin 发表于 2012-12-22 15:00
1.如果是Http请求的那你只修改IP应该是不行的,
因为他们很有可能是根据你的UserAgent 信息,做的验证,当 ...

谢谢;如果是这样,那只能测试下了;
如果我采用虚假的 代理ip会有用处不? ----  这里就有一个问题; 服务端ip获取是否是先获取 代理ip 再获取 真实ip的问题呢?
发表于 2012-12-24 10:08:44 | 显示全部楼层
wj_java 发表于 2012-12-24 08:55
谢谢;如果是这样,那只能测试下了;
如果我采用虚假的 代理ip会有用处不? ----  这里就有一个问题; 服务端 ...

使用代理 是获取的代理 IP,和本地IP无关
 楼主| 发表于 2012-12-24 13:48:09 | 显示全部楼层
admin 发表于 2012-12-24 10:08
使用代理 是获取的代理 IP,和本地IP无关

如果我把请求的头部信息中添加 HTTP_FORWARDED_FOR 的值,不知道这样是否有用!!
发表于 2012-12-24 13:52:30 | 显示全部楼层
wj_java 发表于 2012-12-24 13:48
如果我把请求的头部信息中添加 HTTP_FORWARDED_FOR 的值,不知道这样是否有用!!

这个你可以测试一下,
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-25 15:43

© 2014-2021

快速回复 返回顶部 返回列表