http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 11931|回复: 5

[求助] HttpHelper无法获取到360的https页面内容

[复制链接]
发表于 2013-6-2 07:49:12 | 显示全部楼层 |阅读模式
请求地址:https://login.360.cn/?o=sso& ... rJsonP1348367367684

使用http://tool.sufeinet.com/测试该地址,返回html是正常的
[code=csharp]返回的Cookie:



返回的HTML:
QHPass.loginUtils.tokenCallback({"errno":0,"errmsg":"","token":"58eb86deb94cc720"})[/code]

使用http://tool.sufeinet.com/生成代码,创建一个winform测试
生成代码如下
[code=csharp]HttpHelper http = new HttpHelper();
            HttpItem item = new HttpItem()
            {
                URL = "https://login.360.cn/?o=sso&m=getToken&func=QHPass.loginUtils.tokenCallback&userName=97138612@qq.com&rand=0.6075735737103969&callback=QiUserJsonP1348367367684",//URL     必需项
                Encoding = Encoding.GetEncoding("UTF-8"),//编码格式(utf-8,gb2312,gbk)     可选项 默认类会自动识别
                Method = "GET",//URL     可选项 默认为Get
                Timeout = 100000,//连接超时时间     可选项默认为100000
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
                Cookie = "",//字符串Cookie     可选项
                UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值
                Accept = "text/html, application/xhtml+xml, */*",//    可选项有默认值
                ContentType = "text/html",//返回类型    可选项有默认值
                Referer = "http://yunpan.360.cn",//来源URL     可选项
                //Allowautoredirect = true,//是否根据301跳转     可选项
                //CerPath = "d:\123.cer",//证书绝对路径     可选项不需要证书时可以不写这个参数
                //Connectionlimit = 1024,//最大连接数     可选项 默认为1024
                //Postdata = "username=sufei&pwd=sufeinet.com",//Post数据     可选项GET时不需要写
                //ProxyIp = "192.168.1.105",//代理服务器ID     可选项 不需要代理 时可以不设置这三个参数
                //ProxyPwd = "123456",//代理服务器密码     可选项
                //ProxyUserName = "administrator",//代理服务器账户名     可选项
                //ResultType = ResultType.String,//返回数据类型,是Byte还是String
            };
            HttpResult result = http.GetHtml(item);
            string html = result.Html;
            string cookie = result.Cookie;
            byte[] b = result.ResultByte;[/code]

输出 html的结果是
[code=csharp]请求被中止: 未能创建 SSL/TLS 安全通道。[/code]

本帖被以下淘专辑推荐:



1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-6-2 08:57:59 | 显示全部楼层
绝对不建议你这样写,因为如果你去访问不需要这个需求的页面时是肯定会出现问题了,而且不建议直接修改Httphelper文件,这样你以后升级就不方便 了

这个就是设置一个安全协议的版本你直接写在这里也是一样的
看下面代码
[code=csharp]   HttpHelper http = new HttpHelper();
            HttpItem item = new HttpItem()
            {
                URL = "https://login.360.cn/?o=sso&m=getToken&func=QHPass.loginUtils.tokenCallback&userName=97138612@qq.com&rand=0.6075735737103969&callback=QiUserJsonP1348367367684",//URL     必需项
                Encoding = Encoding.GetEncoding("UTF-8"),//编码格式(utf-8,gb2312,gbk)     可选项 默认类会自动识别
                Method = "GET",//URL     可选项 默认为Get
                Timeout = 100000,//连接超时时间     可选项默认为100000
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
                Cookie = "",//字符串Cookie     可选项
                UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值
                Accept = "text/html, application/xhtml+xml, */*",//    可选项有默认值
                ContentType = "text/html",//返回类型    可选项有默认值
                Referer = "http://yunpan.360.cn",//来源URL     可选项
            };
            ServicePointManager.SecurityProtocol = SecurityProtocolType.Ssl3;
            HttpResult result = http.GetHtml(item);
            string html = result.Html;
            string cookie = result.Cookie;
            byte[] b = result.ResultByte;[/code]
 楼主| 发表于 2013-6-2 07:58:34 | 显示全部楼层
百度找到个方法,能获取到数据了。不知道会不会产生其它问题。还没进行具体的登录测试。。。。解决方法
[code=csharp]private void SetCer(HttpItem objhttpItem)
        {
            if (!string.IsNullOrEmpty(objhttpItem.CerPath))
            {
                //这一句一定要写在创建连接的前面。使用回调的方法进行证书验证。
                //ServicePointManager.SecurityProtocol = SecurityProtocolType.Ssl3;
                ServicePointManager.ServerCertificateValidationCallback = new System.Net.Security.RemoteCertificateValidationCallback(CheckValidationResult);
                //初始化对像,并设置请求的URL地址
                request = (HttpWebRequest)WebRequest.Create(objhttpItem.URL);
                //将证书添加到请求里
                request.ClientCertificates.Add(new X509Certificate(objhttpItem.CerPath));
            }
            else
                ServicePointManager.SecurityProtocol = SecurityProtocolType.Ssl3;
                //初始化对像,并设置请求的URL地址
                request = (HttpWebRequest)WebRequest.Create(objhttpItem.URL);
        }[/code]

在这个方法的else部分增加了
[code=csharp]                ServicePointManager.SecurityProtocol = SecurityProtocolType.Ssl3;[/code]
这一行。。。
 楼主| 发表于 2013-6-3 19:16:56 | 显示全部楼层
感谢,这个问题解决
发表于 2013-6-20 23:46:01 | 显示全部楼层
站长苏飞 发表于 2013-6-2 08:57
绝对不建议你这样写,因为如果你去访问不需要这个需求的页面时是肯定会出现问题了,而且不建议直接修改Http ...

如果接着在次访问非https的网址,还用改回来吗?
ServicePointManager.SecurityProtocol属性我看是静态的
发表于 2013-6-21 08:03:49 | 显示全部楼层
lqianlong 发表于 2013-6-20 23:46
如果接着在次访问非https的网址,还用改回来吗?
ServicePointManager.SecurityProtocol属性我看是静态 ...

这个看需要吧,需要调整就调整不需要就不用调整,一般都不需要加的,下个版本会增加到属性里方便大家调用
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-11-23 11:37

© 2014-2021

快速回复 返回顶部 返回列表