苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 4495|回复: 8

[其他] 采集网页js刷新跳转的怎么采集?

[复制链接]
发表于 2013-11-27 16:20:27 | 显示全部楼层 |阅读模式
http://bbs.rednet.cn/forum-10-1.html   采集网页js刷新跳转的怎么采集?


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-11-27 16:24:16 | 显示全部楼层
没办法只能获取跳转到的地址重新请求,
发表于 2013-11-27 16:24:30 | 显示全部楼层
通过分析网页获取地址
 楼主| 发表于 2013-11-27 16:33:47 | 显示全部楼层
<html><head><title>&#x9875;&#x9762;&#x91cd;&#x8f7d;&#x5f00;&#x542f;</title></head><body bgcolor="#FFFFFF"><script language="JavaScript">function reload() {        document.location.reload();}setTimeout("reload()", 1001);</script><table cellpadding="0" cellspacing="0" border="0" width="700" align="center" height="85%">  <tr align="center" valign="middle">    <td>    <table cellpadding="10" cellspacing="0" border="0" width="80%" align="center" style="font-family: Verdana, Tahoma; color: #666666; font-size: 11px">    <tr>      <td valign="middle" align="center" bgcolor="#EBEBEB">             <br /><br /> <b style="font-size: 16px">&#x9875;&#x9762;&#x91cd;&#x8f7d;&#x5f00;&#x542f;</b> <br /><br />&#x6b22;&#x8fce;&#x5149;&#x4e34;&#x672c;&#x7ad9;&#xff0c;&#x9875;&#x9762;&#x6b63;&#x5728;&#x91cd;&#x65b0;&#x8f7d;&#x5165;&#xff0c;&#x8bf7;&#x7a0d;&#x5019;&#x20;&#x2e;&#x2e;&#x2e;        <br /><br />      </td>    </tr>    </table>    </td>  </tr></table></body></html>
这里只有JS的刷新,没有提供跳转后的页面。
发表于 2013-11-27 16:36:29 | 显示全部楼层
这个真心只有苏飞说的解决
发表于 2013-11-27 16:37:32 | 显示全部楼层
document.location.reload()看这一句表示 刷新本页面,网址就是本页面啊,
 楼主| 发表于 2013-11-27 16:46:36 | 显示全部楼层
HttpHelper 再请求一次吗?那不应该还是返回一样的结果吧!参数怎么设置。
发表于 2013-11-27 17:12:18 | 显示全部楼层
ZZG 发表于 2013-11-27 16:46
HttpHelper 再请求一次吗?那不应该还是返回一样的结果吧!参数怎么设置。

同志你访问第二次要带上第一次的Cookie啊
 楼主| 发表于 2013-11-27 17:34:35 | 显示全部楼层
谢谢!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-29 20:41

© 2014-2021

快速回复 返回顶部 返回列表