苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 14520|回复: 3

[其他] 【网页抓取问题】如何获取JS执行过后的网页源代码?

[复制链接]
发表于 2013-9-2 23:52:16 | 显示全部楼层 |阅读模式
抓取网页的时候发现一个问题,就是如果网页的内容是使用JS生成的DOM在源代码里面就不会显示出来。
有没有什么办法可以获取JS执行后的DOM?
举个例子:http://item.taobao.com/item.htm?spm=a230r.1.14.90.F5XBQM&id=21128479264&_u=2k1h97e8627&initiative_new=1
我想获取这个淘宝页面的价格(活动价格),这个价格是(原价*折扣),这个处理是JS处理的。但是又找不到。。
所以直接在源代码里面就获取不了活动价格。
求指点。


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-9-3 00:02:43 | 显示全部楼层
这个也不懂,不过好像要执行js的

参考下http://www.sufeinet.com/forum.ph ... ight=58%CD%AC%B3%C7
发表于 2013-9-3 08:08:22 | 显示全部楼层
这个如果使用Http请求的方法,基本上是没有办法的,只有去执行JS和分析算法。
发表于 2013-9-3 09:42:30 | 显示全部楼层
http://ajax.tbcdn.cn/json/umpSto ... 1&sts=270274560,1170936092103278596,33024,4297080835&chnl=&price=3800&sellerId=1109924773&shopId=&cna=Vvh9ChQ0ETUCATzT%2FlYaEzak&ref=&buyerId=41423774&nick=&tg=274206720&tg2=1170935954655936644&tg3=72057594071482368&tg4=70643624247299&tg6=4096

都在这里,自己拼接参数吧。慢慢分析
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-27 21:08

© 2014-2021

快速回复 返回顶部 返回列表