http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 15732|回复: 26

[HttpHelper] 淘宝客短链接,转商品链接,最后一步老是取不到 Location

[复制链接]
发表于 2016-11-17 16:29:36 | 显示全部楼层 |阅读模式
https://s.click.taobao.com/K5TpVNx,这是链接
QQ图片20161117162805.png
这是易语言的代码,没有问题,管理看一下


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2016-11-17 16:49:39 | 显示全部楼层
[C#] 纯文本查看 复制代码
            HttpHelper http = new HttpHelper();
            HttpItem item = new HttpItem()
            {
                URL = "https://s.click.taobao.com/k5tpvnx",//URL     必需项
                Method = "GET",//URL     可选项 默认为Get
                Timeout = 100000,//连接超时时间     可选项默认为100000
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
                Cookie = "",//字符串Cookie     可选项
                UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值
                Accept = "text/html, application/xhtml+xml, */*",//    可选项有默认值
                ContentType = "text/html",//返回类型    可选项有默认值

            };
            HttpResult result = http.GetHtml(item);
            string strLocation = result.RedirectUrl;
发表于 2016-11-17 16:50:42 | 显示全部楼层
在框架里有专门的属性获取
result.RedirectUrl 这个就是Location 的值
 楼主| 发表于 2016-11-17 17:24:46 | 显示全部楼层
有时还是取不到!管理
发表于 2016-11-17 17:33:14 | 显示全部楼层
你的易语言啊...是不是走错地方了
 楼主| 发表于 2016-11-17 17:39:28 | 显示全部楼层
79079748 发表于 2016-11-17 17:33
你的易语言啊...是不是走错地方了

没呀,我是说易语言的没问题,用C#的老是取不到商品链接
发表于 2016-11-17 20:28:53 | 显示全部楼层
取不到你打印出来看看是什么,html,header都打印出来看看
 楼主| 发表于 2016-11-17 20:45:27 | 显示全部楼层
站长苏飞 发表于 2016-11-17 20:28
取不到你打印出来看看是什么,html,header都打印出来看看

HTML一直都是空的,这个没问题
Header,这个变来变去的。
 楼主| 发表于 2016-11-18 02:01:01 | 显示全部楼层
站长苏飞 发表于 2016-11-17 20:28
取不到你打印出来看看是什么,html,header都打印出来看看

---------------------------------------------------------------------------------------------------------------
Transfer-Encoding:chunked;Connection:close;Strict-Transport-Security:max-age=0;Timing-Allow-Origin:*;Cache-Control:max-age=0;Content-Type:text/html;Date:Thu, 17 Nov 2016 17:53:22 GMT;Expires:Thu, 17 Nov 2016 17:53:22 GMT;Location:https://detail.tmall.com/item.ht ... 793931142163P:CP="CURa ADMa DEVa PSAo PSDo OUR BUS UNI PUR INT DEM STA PRE COM NAV OTC NOI DSP COR";Set-Cookie:miid=206858970062705264; expires=Wed, 14-Aug-2019 17:53:22 GMT; path=/; domain=.taobao.com;Server:Tengine;
---------------------------------------------------------------------------------------------------------------
Transfer-Encoding:chunked;Connection:close;Vary:Accept-Encoding,Accept-Encoding;Strict-Transport-Security:max-age=0;Timing-Allow-Origin:*;Cache-Control:max-age=0;Content-Type:text/html; charset=GBK;Date:Thu, 17 Nov 2016 17:53:19 GMT;Expires:Thu, 17 Nov 2016 17:53:19 GMT;Server:Tengine;
---------------------------------------------------------------------------------------------------------------
Transfer-Encoding:chunked;Connection:close;Vary:Accept-Encoding,Accept-Encoding;Strict-Transport-Security:max-age=0;Timing-Allow-Origin:*;Cache-Control:max-age=0;Content-Type:text/html; charset=GBK;Date:Thu, 17 Nov 2016 17:52:30 GMT;Expires:Thu, 17 Nov 2016 17:52:30 GMT;Server:Tengine;
---------------------------------------------------------------------------------------------------------------
Transfer-Encoding:chunked;Connection:close;Vary:Accept-Encoding,Accept-Encoding;Strict-Transport-Security:max-age=0;Timing-Allow-Origin:*;Cache-Control:max-age=0;Content-Type:text/html; charset=GBK;Date:Thu, 17 Nov 2016 17:52:22 GMT;Expires:Thu, 17 Nov 2016 17:52:22 GMT;Server:Tengine;
---------------------------------------------------------------------------------------------------------------
Transfer-Encoding:chunked;Connection:close;Vary:Accept-Encoding,Accept-Encoding;Strict-Transport-Security:max-age=0;Timing-Allow-Origin:*;Cache-Control:max-age=0;Content-Type:text/html; charset=GBK;Date:Thu, 17 Nov 2016 17:52:08 GMT;Expires:Thu, 17 Nov 2016 17:52:08 GMT;Server:Tengine;
---------------------------------------------------------------------------------------------------------------

第一个是正常取到的 Header 下面全是不正常的
发表于 2016-11-18 10:24:58 | 显示全部楼层
把不正确的网址发出来看看,我这边测试都行啊
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-11-23 07:27

© 2014-2021

快速回复 返回顶部 返回列表