http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

楼主: 站长苏飞

[例子] C#实现自动登录赶集网(www.ganji.com)附源代码下载--HttpHelper版

[复制链接]
 楼主| 发表于 2013-1-7 16:42:37 | 显示全部楼层
风中劲草 发表于 2013-1-7 16:34
 也是。

我是用来做登录类,外挂铺助类软件。一般登录后,或是提交数据后,cookie常发变化,无需 ...

你的这个情况使用这种方法确实是上佳方案,你行修改一下吧


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-1-9 09:58:33 | 显示全部楼层
看了,顶一个
发表于 2013-1-16 16:45:26 | 显示全部楼层
这个方法wordpress不行。楼主帮看看啊。
 楼主| 发表于 2013-1-16 18:48:28 | 显示全部楼层
yxbbbs 发表于 2013-1-16 16:45
这个方法wordpress不行。楼主帮看看啊。

wordpress 是什么?
发表于 2013-1-25 08:21:30 | 显示全部楼层
顶一下
发表于 2013-2-2 22:55:17 | 显示全部楼层
看了一些抢票软件源代码,不知道能否用这个类来实现相同的功能,有时间试下
发表于 2013-5-15 17:05:16 | 显示全部楼层
下载试了试,显示登录失败,不能进入显示会员中心首页。
发表于 2013-5-26 17:09:14 | 显示全部楼层
我登陆需要验证码。。。。怎么破?
发表于 2013-7-18 14:50:16 | 显示全部楼层
sufei你好,根据你的这种做法,在登陆php的网站,如你说的赶集网等是没有问题的,但是在登陆www.cnblogs.com(博客园),asp.net的网站的时候,为什么会不能成功登陆呢?代码如下:
  [code=csharp] //实例化一个http链接辅助类
            HttpHelper helper = new HttpHelper();
            HttpItem items = new HttpItem()
            {
                URL = "http://passport.cnblogs.com/login.aspx",//URL     必需项
                //Encoding = null,//编码格式(utf-8,gb2312,gbk)     可选项 默认类会自动识别
               Encoding = Encoding.UTF8,
                Method = "post",//URL     可选项 默认为Get
                Postdata = "__EVENTTARGET=&__EVENTARGUMENT=&__VIEWSTATE=%2FwEPDwULLTE1MzYzODg2NzZkGAEFHl9fQ29udHJvbHNSZXF1aXJlUG9zdEJhY2tLZXlfXxYBBQtjaGtSZW1lbWJlcm1QYDyKKI9af4b67Mzq2xFaL9Bt&__EVENTVALIDATION=%2FwEdAAUyDI6H%2Fs9f%2BZALqNAA4PyUhI6Xi65hwcQ8%2FQoQCF8JIahXufbhIqPmwKf992GTkd0wq1PKp6%2B%2F1yNGng6H71Uxop4oRunf14dz2Zt2%2BQKDEIYpifFQj3yQiLk3eeHVQqcjiaAP&tbUserName=hanxue517&tbPassword=dbswsn517&btnLogin=%E7%99%BB++%E5%BD%95&txtReturnUrl=http%3A%2F%2Fhome.cnblogs.com%2F",
                Timeout = 100000,//连接超时时间     可选项默认为100000
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
                //Cookie = "",//字符串Cookie     可选项
                UserAgent = "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)",//用户的浏览器类型,版本,操作系统     可选项有默认值
                Accept = "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",//    可选项有默认值
                ContentType = "text/html",//返回类型    可选项有默认值
                Referer = "http://www.baidu.com",//来源URL     可选项};
                 };
           // WebHeaderCollection webcollection=
            //items.Header.Set("Host","passport.cnblogs.com");
            //items.Header.Add("你好啊","hi");
            //items.Header.Add("date", "2013-07-18");
            HttpResult result = helper.GetHtml(items);
            //取出返回的Cookie
            string cookie = result.Cookie;
            //返回的Html内容
            string html = result.Html;[/code]

还想请教的是,在使用items.Header.Add("Host","passport.cnblogs.com");的时候总是会提示“无法直接修改标题host”,参数名:name
  希望得到你的指教!
 楼主| 发表于 2013-7-18 15:54:14 | 显示全部楼层
host可以直接用,不需要添加到Header里,是个属性
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-11-22 05:19

© 2014-2021

快速回复 返回顶部 返回列表