http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

12
返回列表 发新帖
楼主: 越狱

[学生提问] 有谁能够抓取京东下拉框关键词的?请给个提示思路!传统的抓包之后拼链接不行

[复制链接]
发表于 2015-7-1 20:02:22 | 显示全部楼层
越狱 发表于 2015-7-1 10:15
大神,能不能把你的代码贴出来,我写的怎么老是获取不到?

搞个年费会员直截了当。


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
回复

使用道具 举报

 楼主| 发表于 2015-7-1 21:07:06 | 显示全部楼层
站长苏飞 发表于 2015-7-1 14:01
请求带的参数不够,页面自然会跳转,这个没有什么吧。

你说的参数是Url参数还是request的参数?
回复

使用道具 举报

 楼主| 发表于 2015-7-1 21:19:42 | 显示全部楼层
我是MT 发表于 2015-7-1 20:02
搞个年费会员直截了当。

我想知道不用httphelper为什么抓取不到,这是一个学习的过程
回复

使用道具 举报

发表于 2015-7-1 21:47:16 | 显示全部楼层
不清楚你的代码是怎么写的,所以也不知道应该给你说什么,你贴下代码,我看下
回复

使用道具 举报

 楼主| 发表于 2015-7-1 21:50:53 | 显示全部楼层
站长苏飞 发表于 2015-7-1 21:47
不清楚你的代码是怎么写的,所以也不知道应该给你说什么,你贴下代码,我看下

string Url = "http://dd.search.jd.com/?ver=2&zip=1&key=%E9%AD%85%E8%93%9Dnote2";
            HttpWebRequest request = (HttpWebRequest)WebRequest.Create(Url);
            request.Method = "GET";
            request.UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:38.0) Gecko/20100101 Firefox/38.0";
            request.Accept = "*/*";
            request.ContentType = "text/json;charset=UTF-8";
            request.Timeout = 10000;
            HttpWebResponse response = (HttpWebResponse)request.GetResponse();
            Stream myResponseStream = response.GetResponseStream();
            StreamReader myStreamReader = new StreamReader(myResponseStream, Encoding.UTF8);
            textBox.Text = myStreamReader.ReadToEnd();
            myStreamReader.Close();
            myResponseStream.Close();
回复

使用道具 举报

发表于 2015-7-1 21:52:33 | 显示全部楼层
request.Referer=""http://dd.search.jd.com/?ver=2&zip=1&key=%E9%AD%85%E8%93%9Dnote2" 加上这个属性试试
回复

使用道具 举报

 楼主| 发表于 2015-7-1 21:57:53 | 显示全部楼层
站长苏飞 发表于 2015-7-1 21:52
request.Referer=""http://dd.search.jd.com/?ver=2&zip=1&key=%E9%AD%85%E8%93%9Dnote2" 加上这个属性试 ...

这下确实可以了。

但是站长你好,我想知道,为什么我用火狐浏览器调试的时候,发现refer是:http://www.jd.com/?cu=true&u ... 8f4a527878fd0d42f5b

而不是你给的“http://dd.search.jd.com/?ver=2&a ... AD%85%E8%93%9Dnote2”呢?

还有,我之前抓取淘宝的数据的时候,都是不带refer的,这个refer代表什么意思?主要有什么作用?

求解答,新手小白,谢谢了!
回复

使用道具 举报

 楼主| 发表于 2015-7-1 22:43:51 | 显示全部楼层
站长苏飞 发表于 2015-7-1 22:05
带什么都 行,只要是这个网站的,这是来源页面,表示发起请求的当前页面。有些网站会验证一下来源,表示 ...

OK,明白了谢谢
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-11-24 05:08

© 2014-2021

快速回复 返回顶部 返回列表