苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 7896|回复: 4

[其他] 新手请求智联招聘 登陆之后的内容 遇到问题 求助

[复制链接]
发表于 2013-8-3 00:06:03 | 显示全部楼层 |阅读模式
使用httphelper类;

                    //智联招聘网处理
                    item = new HttpItem()
                    {
                        URL = "http://hr.zhaopin.com/hrclub/index.html",//URL     必需项   
                        Encoding = Encoding.GetEncoding("gb2312"),//编码格式(utf-8,gb2312,gbk)     可选项 默认类会自动识别   
                        Method = "GET",//URL     可选项 默认为Get   
                        Timeout = 100000,//连接超时时间     可选项默认为100000   
                        ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000   
                        IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写   
                        Cookie = "",//字符串Cookie     可选项   
                        UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值   
                        Accept = "text/html, application/xhtml+xml, */*",//    可选项有默认值   
                        ContentType = "application/x-www-form-urlencoded",//返回类型    可选项有默认值   
                        Referer = "http://hr.zhaopin.com/hrclub/index.html",//来源URL     可选项   
                        //Allowautoredirect = true,//是否根据301跳转     可选项   
                        //CerPath = "d:\123.cer",//证书绝对路径     可选项不需要证书时可以不写这个参数   
                        //Connectionlimit = 1024,//最大连接数     可选项 默认为1024   
                        //Postdata = "username=sufei&pwd=sufeinet.com",//Post数据     可选项GET时不需要写   
                        //ProxyIp = "192.168.1.105",//代理服务器ID     可选项 不需要代理 时可以不设置这三个参数   
                        //ProxyPwd = "123456",//代理服务器密码     可选项   
                        //ProxyUserName = "administrator",//代理服务器账户名     可选项   
                        //ResultType = ResultType.String,//返回数据类型,是Byte还是String   
                        Postdata = "username=" +
                        URLEncode(textBox1.Text.Trim())
                        + "&password=" +
                        URLEncode(textBox2.Text.Trim())
                        + "&Validate=" + URLEncode(textBox3.Text.Trim()) + "&Submit=",
                    };
                    //得到HTML代码
                    result = http.GetHtml(item);
下面这个打印为首页的html内容:
                    logHelper.WriteTraceLog(TraceLogLevel.Info, "first result.Html content is:" + result.Html);  
下面这个打印为空:
                    logHelper.WriteTraceLog(TraceLogLevel.Info, "first result.Html Cookie is:" + result.Cookie);

我使用界面来填入网页验证码的;
请苏飞大神帮忙看看,谢谢



1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-8-3 07:26:27 | 显示全部楼层
休息没环境,周一给你看,我记得以前写过,到上班给你找找
发表于 2013-8-3 07:52:22 | 显示全部楼层
看代码没见你带登录的Cookie呀
 楼主| 发表于 2013-8-4 08:03:21 | 显示全部楼层
这个就是登陆的请求,
这个是用户名
URLEncode(textBox1.Text.Trim())
这个是密码
URLEncode(textBox2.Text.Trim())
验证码 我没搞自动识别,使用人工识别的方式:
URLEncode(textBox3.Text.Trim())

但是请求下来的html 是首页的,不是登陆之后的。

麻烦了,如果需要代码,您提给个邮箱,我给您发一下,谢谢
发表于 2013-8-5 11:19:30 | 显示全部楼层
[code=csharp] #region 私有变量和方法

        //登录URl
        private readonly string loginUrl = "http://my.zhaopin.com/loginmgr/loginproc.asp";

        //登录必须参数
        private readonly string loginPrm = "Validate=cttp%3A%2F%2Fwendao.zhaopin.com%2Fnewbie%3Ferror%3D1&";

        //简历列表Url
        private readonly string resumeListUrl = "http://my.zhaopin.com/myzhaopin/resume_list.asp";

        //简历详细页面前半部分URl
        private readonly string resumeInfoUrl = "http://my.zhaopin.com/myzhaopin/";

        #endregion

        //参数对象
        HttpItem objHttpItem = new HttpItem();

        //Http帮助类
        httphelper objhttp = new httphelper();

        /// <summary>
        /// 根据用户名和密码取得Cookie
        /// </summary>
        /// <param name="Name">智联用户名</param>
        /// <param name="Pwd">智联用户登录密码</param>
        /// <returns>Cookie字符串</returns>
        public string GetCookie(string Name, string Pwd)
        {
            objHttpItem.URL = loginUrl + "?" + loginPrm + "loginname=" + Name + "&password=" + Pwd;
            objHttpItem.Encoding = "utf-8";
            objHttpItem.Method = "GET";

            //登录智联
            string html = objhttp.GetHtml(objHttpItem);
            //取得Cookie
            objHttpItem.Cookie = objhttp.cookie;
            string strCookie = objhttp.cookie;
            return strCookie;
        }
[/code]
这个验证码是不需要的
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2025-1-14 22:10

© 2014-2021

快速回复 返回顶部 返回列表