苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 6063|回复: 7

[其他] 高难度,模拟登录,一个诡异的URL地址,我甚至无法用get获得HTML,苏飞、各位高人...

[复制链接]
发表于 2013-12-13 09:53:27 | 显示全部楼层 |阅读模式
地址:http://www.citibet.net/
使用开发助手得到:<script>location.replace('?3151dd2f-e918-4c89-9708-e1c8a6381cbb')</script>
加入COOKIES的结果也是一样的
而页面本身却能够得到结果,网页里有个框架,是否是框架的原因呢?还是加密太强啊?
很重要啊,求助求助!


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-12-13 10:36:03 | 显示全部楼层
你贴下代码,包信息,和返回的结果,我看下。感觉不像是很难啊。如果的框架,就可能要访问框架里面的页面了
 楼主| 发表于 2013-12-13 15:03:23 | 显示全部楼层
谢谢苏飞,现在问题变化了,返回没问题了,新问题是无法取到完整的cookies,有以下三个限制:
1、通过webbrowser取到的cookie少了sessionID;
2、使用response却又被限制读取,报403错误;
3、网站使用了httponley;
4、验证提交使用了一个MARK.js文件加密;

目前思路:保护措施很到位,绕过他的各种算法,只能使用webbrowser人工登录,然后获得cookie,就可以操作了,但是sessionID让我很痛苦啊!你的读取webbrowser的cookies帖子我正在学习,我用的VB.NET语言,有vb.net版的代码么?
求指导,谢谢
发表于 2013-12-13 15:05:26 | 显示全部楼层
01470087 发表于 2013-12-13 15:03
谢谢苏飞,现在问题变化了,返回没问题了,新问题是无法取到完整的cookies,有以下三个限制:
1、通过webb ...

这个没有,我估计方法都差不多,Vb也可以使用doc.cookie吧。
 楼主| 发表于 2013-12-13 15:08:32 | 显示全部楼层
站长苏飞 发表于 2013-12-13 15:05
这个没有,我估计方法都差不多,Vb也可以使用doc.cookie吧。

doc.cookie?是什么
发表于 2013-12-13 15:11:27 | 显示全部楼层
webbrowser.cookie
 楼主| 发表于 2013-12-13 15:25:42 | 显示全部楼层

恩,但是取出来的不完整,正在学习你的代码,你们都是高人啊
发表于 2013-12-13 15:28:55 | 显示全部楼层
01470087 发表于 2013-12-13 15:25
恩,但是取出来的不完整,正在学习你的代码,你们都是高人啊

VB的不会,你看着研究下吧,或者百度下,我估计有人写过
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-29 20:36

© 2014-2021

快速回复 返回顶部 返回列表