http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 6530|回复: 8

[HttpHelper] 获取COOKIE为空。

[复制链接]
发表于 2014-9-20 22:37:44 | 显示全部楼层 |阅读模式
10金钱
http://www.muzhiwan.com/

想获取这个网站的cookie信息。进行登录操作。
可是获取首页的使用cookie显示为空。这是什么情况。js吗?

高人指点下~谢谢。

HttpItem item = new HttpItem()
            {
                URL = "http://www.muzhiwan.com/",
                Encoding = null,
                Method = "get",
                Accept = "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
                ResultType = ResultType.Byte
            };
            item.Header.Add("Accept-Encoding", "gzip, deflate");
            HttpResult result = http.GetHtml(item);
            //MessageBox.Show(result.Cookie);
            pictureBox1.Image = byteArrayToImage(result.ResultByte);



1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2014-9-20 23:09:06 | 显示全部楼层
            HttpHelper http = new HttpHelper();
            HttpItem item = new HttpItem()
            {
                URL = "http://www.muzhiwan.com/",//URL     必需项   
                Method = "get",//URL     可选项 默认为Get   
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写   
                Cookie = "",//字符串Cookie     可选项   
                Referer ="",//来源URL     可选项   
                Postdata = "",//Post数据     可选项GET时不需要写   
                Timeout = 100000,//连接超时时间     可选项默认为100000   
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000   
                UserAgent = "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)",//用户的浏览器类型,版本,操作系统     可选项有默认值   
                ContentType = "text/html",//返回类型    可选项有默认值   
                Allowautoredirect = false,//是否根据301跳转     可选项   
                //CerPath = "d:\123.cer",//证书绝对路径     可选项不需要证书时可以不写这个参数   
                //Connectionlimit = 1024,//最大连接数     可选项 默认为1024   
                ProxyIp = "",//代理服务器ID     可选项 不需要代理 时可以不设置这三个参数   
                //ProxyPwd = "123456",//代理服务器密码     可选项   
                //ProxyUserName = "administrator",//代理服务器账户名     可选项   
                ResultType = ResultType.String
            };
            HttpResult result = http.GetHtml(item);
            string html = result.Html;
            string cookie = result.Cookie;
        

        /// <summary>
        /// 字节数组生成图片
        /// </summary>
        /// <param name="Bytes">字节数组</param>
        /// <returns>图片</returns>
        private Image byteArrayToImage(byte[] Bytes)
        {
            MemoryStream ms = new MemoryStream(Bytes);
            return Bitmap.FromStream(ms,true);
        }
回复

使用道具 举报

发表于 2014-9-20 23:14:10 | 显示全部楼层
第一,这个链接并非图片;
第二,抓包中也没有Cookie。
回复

使用道具 举报

 楼主| 发表于 2014-9-20 23:24:32 | 显示全部楼层
cload 发表于 2014-9-20 23:14
第一,这个链接并非图片;
第二,抓包中也没有Cookie。

哦。http://www.muzhiwan.com/common/code.inc.php  可是我通过这个也只能获取到PHPSESSION啊。
回复

使用道具 举报

发表于 2014-9-20 23:33:14 | 显示全部楼层
它只返回这个啊!!
其它的感觉带不带都不影响,是JS生成的。
回复

使用道具 举报

发表于 2014-9-21 08:53:20 | 显示全部楼层
http://www.muzhiwan.com/common/code.inc.php先访问图片获取JS

登录去登录http://www.muzhiwan.com/login.html,你访问主页没有用,
回复

使用道具 举报

 楼主| 发表于 2014-9-21 14:11:38 | 显示全部楼层
本帖最后由 mogu_chulian 于 2014-9-21 14:18 编辑

额。飞哥。访问那个图片获取js? 没懂你的意思。

登录/login.html的时候 ,使用验证码的那个cookie + post的数据登录错误。 调试看到获取的COOKIE和IE抓包的不一样。
怎么弄呀??
回复

使用道具 举报

发表于 2014-9-21 17:30:54 | 显示全部楼层
是cookie发错了
回复

使用道具 举报

发表于 2014-9-22 13:47:10 | 显示全部楼层
我只是路过打酱油的。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-11-24 17:56

© 2014-2021

快速回复 返回顶部 返回列表