苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 9838|回复: 8

[求助] 带验证码登陆网站,提示验证码不正确,及相关Cookie处理方法

[复制链接]
发表于 2018-7-28 17:35:09 | 显示全部楼层 |阅读模式
66金钱
本帖最后由 131415 于 2018-7-28 17:36 编辑

这几天研究验证码登录,好几天了,因为cookie问题毫无进展。主要提示就是“验证码不正确”
主要代码如下:
[C#] 纯文本查看 复制代码
/// <summary>
        /// 获取验证码图片
        /// </summary>
        private void GetVerCode()
        {
            HttpHelper http = new HttpHelper();

            HttpItem item = new HttpItem()
            {
                URL = "http://www.510376.com/login.php",
                Accept = "text/html, application/xhtml+xml, */*",
                Method = "get",//URL     可选项 默认为Get  
                Timeout = 100000,//连接超时时间     可选项默认为100000
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
                Cookie = Cookie,//字符串Cookie     可选项   
                UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值
                Referer = "http://www.510376.com/login.php",//来源URL     可选项
                ResultType = ResultType.String,//返回数据类型,是Byte还是String
            };
            HttpResult result = http.GetHtml(item);
            Cookie_A = result.Cookie;
            txtHtml.Text = " 第一次访问时的Cookie:\n" + Cookie_A;

             item = new HttpItem()
            {
                URL = "http://www.510376.com/tools/regcode.php?verify=08login&t=",
                Accept = "image/png, image/svg+xml, image/*;q=0.8, */*;q=0.5",
                Method = "get",//URL     可选项 默认为Get  
                Timeout = 100000,//连接超时时间     可选项默认为100000
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
                Cookie = Cookie_A,//字符串Cookie     可选项
                UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值
                Referer = "http://www.510376.com/login.php",//来源URL     可选项
                ResultType = ResultType.Byte,//返回数据类型,是Byte还是String
            };
            Image img = http.GetImage(item);
            pictureBox1.Image = img;
            result = http.GetHtml(item);
            Cookie_A = result.Cookie;
            //Cookie_A = "6QC_Q5gqrT_upload=1%2C2%2C3%2C4%2C5%2C6%2C7%2C8%2C9%2C10%2C11%2C12; menubox1=menubox1; 6QC__08_hash=ae2fc5670e3b9b447624d0da87ad84bf;"+HttpHelper.GetSmallCookie(Cookie_A);
            //获取请求的Cookie
            txtHtml.Text = txtHtml.Text+"\n获取验证码时的Cookie:\n" + Cookie_A;

        }


点击登录后:
[C#] 纯文本查看 复制代码
 /// <summary>
        /// 提交登录
        /// </summary>
        private void btnOK_Click(object sender, EventArgs e)  //点击确定按钮事件
        {

            //万能框架对象
            HttpHelper http = new HttpHelper();
            HttpItem item = new HttpItem()
            {
                URL = "http://www.510376.com/index.php?/ajax/check_login/username/%E4%BF%A1%E9%98%B3%E8%AF%9A%E4%BF%A1%E4%BA%8C%E6%89%8B%E8%BD%A6/password/a123456/regcode/" + txtCode.Text.Trim() + "/verify/08login/expires/604800/cmslogin/1/datatype/json/domain/www.510376.com&callback=jQuery1102033559174329472374_1532680542340&_=1532680542341",//URL     必需项
                Method = "GET",//URL     可选项 默认为Get
                Timeout = 100000,//连接超时时间     可选项默认为100000
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
                Cookie = Cookie_A,//字符串Cookie     可选项
                UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值
                Accept = "text/html, application/xhtml+xml, */*",//    可选项有默认值
                ContentType = "text/html",//返回类型    可选项有默认值
                //ContentType = "application/x-www-form-urlencoded",
                //ContentType = "application/json",
                Referer = "http://www.510376.com/login.php",//来源URL     可选项
                Postdata = "",//Post数据     可选项GET时不需要写
                ResultType = ResultType.String,//返回数据类型,是Byte还是Strin
            };
            HttpResult result = http.GetHtml(item);
            string html = result.Html;
            string cookie = result.Cookie;
            cookie = HttpHelper.GetSmallCookie(cookie);
            txtHtml.Text = txtHtml.Text + "\n" + "点击登录时的Cookie:\n" + cookie + "\n" + "得到的提示:\n" + html;
            // MessageBox.Show("登录成功!", "提示信息", MessageBoxButtons.OK, MessageBoxIcon.Information);
            //以下开始显示主窗体 并关闭登录窗体
            //this.DialogResult = DialogResult.OK;
            //this.Close();
        }

1.png

字符串Cookie试了
集合Cookie试了
拼接Cookie试了

主要是卡在了Cookie的检测获取及处理上,论坛的代码翻的差不多了,过期的、不能用的居多,无力感巨大,求帮忙!
@sufeinet
下面附上源码:

TestDock.zip (257.21 KB, 下载次数: 138)

最佳答案

查看完整内容

[mw_shl_code=csharp,true] private void GetVerCode() { HttpHelper http = new HttpHelper(); HttpItem item = new HttpItem() { URL = "http://www.510376.com/login.php", Accept = "text/html, application/xhtml+xml, */*", Method = "get",//URL 可选项 默认为Get Timeout = 100000, ...


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2018-7-28 17:35:10 | 显示全部楼层
[C#] 纯文本查看 复制代码
        private void GetVerCode()
        {
            HttpHelper http = new HttpHelper();

            HttpItem item = new HttpItem()
            {
                URL = "http://www.510376.com/login.php",
                Accept = "text/html, application/xhtml+xml, */*",
                Method = "get",//URL     可选项 默认为Get  
                Timeout = 100000,//连接超时时间     可选项默认为100000
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
                Cookie = Cookie,//字符串Cookie     可选项   
                UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值
                Referer = "http://www.510376.com/login.php",//来源URL     可选项
                ResultType = ResultType.String,//返回数据类型,是Byte还是String
            };
            HttpResult result = http.GetHtml(item);
            Cookie_A = result.Cookie;
            txtHtml.Text = " 第一次访问时的Cookie:\n" + Cookie_A;

             item = new HttpItem()
            {
                URL = "http://www.510376.com/tools/regcode.php?verify=08login&t=",
                Accept = "image/png, image/svg+xml, image/*;q=0.8, */*;q=0.5",
                Method = "get",//URL     可选项 默认为Get  
                Timeout = 100000,//连接超时时间     可选项默认为100000
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
                Cookie = Cookie_A,//字符串Cookie     可选项
                UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值
                Referer = "http://www.510376.com/login.php",//来源URL     可选项
                ResultType = ResultType.Byte,//返回数据类型,是Byte还是String
            };


            //*********************************************修改的地方
            //Image img = http.GetImage(item);
            //pictureBox1.Image = img;
            result = http.GetHtml(item);
            MemoryStream ms = new MemoryStream(result.ResultByte);
            pictureBox1.Image = Bitmap.FromStream(ms, true);
            Cookie_A = result.Cookie.Replace("path=/,", "");
            //*********************************************修改的地方


            //Cookie_A = "6QC_Q5gqrT_upload=1%2C2%2C3%2C4%2C5%2C6%2C7%2C8%2C9%2C10%2C11%2C12; menubox1=menubox1; 6QC__08_hash=ae2fc5670e3b9b447624d0da87ad84bf;"+HttpHelper.GetSmallCookie(Cookie_A);
            //获取请求的Cookie
            txtHtml.Text = txtHtml.Text+"\n获取验证码时的Cookie:\n" + Cookie_A;

        }
回复

使用道具 举报

 楼主| 发表于 2018-7-29 11:30:45 | 显示全部楼层
又研究了一上午,发现只要获取到的Cookie 中,这个值取对了,就可以登录成功:“6QC_08login=FzjNfDBAG1f4Yl8OoQIe1XJVdT%2B1rSk”
测试图如下:
1.png

虽然我在工具中,把这个值获取到了,但还是未能成功。如下图 1.png
继续研究,好了再发。


回复

使用道具 举报

 楼主| 发表于 2018-7-29 16:57:57 | 显示全部楼层
又一天过去了,无进展。
回复

使用道具 举报

 楼主| 发表于 2018-7-30 08:26:00 | 显示全部楼层
zncliving 发表于 2018-7-29 20:45
[mw_shl_code=csharp,true]        private void GetVerCode()
        {
            HttpHelper http = ...

你是我的曙光!
我竟然没怀疑是这个验证码图片获取函数的问题,这个函数肯定是又请求了一次,导致获取了新的Cookie
回复

使用道具 举报

 楼主| 发表于 2018-7-30 09:05:00 | 显示全部楼层
GetImage 函数里返回值调用了一次(GetHtml(item).ResultByte)导致多获取了一次验证码,看来验证码图片获取是不能用
Image img = http.GetImage(item);
            pictureBox1.Image = img;
这样的方式还调用的。
直接用其调用的ByteToImage函数里的代码:
MemoryStream ms = new MemoryStream(b);
return Bitmap.FromStream(ms, true);


回复

使用道具 举报

发表于 2018-7-30 10:42:09 | 显示全部楼层
我只是路过打酱油的。
回复

使用道具 举报

发表于 2018-9-28 14:19:12 | 显示全部楼层
看了楼主的文章,解决了我的问题,谢谢
回复

使用道具 举报

 楼主| 发表于 2018-10-14 14:45:13 | 显示全部楼层
sugaew 发表于 2018-9-28 14:19
看了楼主的文章,解决了我的问题,谢谢

不客气,为人民服务!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-27 03:47

© 2014-2021

快速回复 返回顶部 返回列表