http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 16475|回复: 10

[综合] http://data.shishicai.cn/cqkl10/haoma/ 网站用helper类抓不下来数据

[复制链接]
发表于 2013-1-13 18:48:53 | 显示全部楼层 |阅读模式
我用httphelper类来抓http://data.shishicai.cn/cqkl10/haoma/的数据,抓下来的是
System.Threading.ThreadAbortException: 正在中止线程。
   在 System.Threading.Thread.AbortInternal()
   在 System.Threading.Thread.Abort(Object stateInfo)
   在 System.Web.HttpResponse.AbortCurrentThread()
   在 data.ProcessRequest(HttpContext context) 位置 \\192.168.1.20\data.shishicai.cn\handler\kuaikai\data.ashx:行号 30


请问是什么原因?

代码如下:
[code=csharp][STAThread]
        static void Main(string[] args)
        {
            HttpHelper http = new HttpHelper();
            HttpItem item = new HttpItem()
            {
                URL = "http://data.shishicai.cn/cqkl10/haoma/",   //必需项
                Encoding = "utf-8",                     //编码格式(utf-8,gb2312,gbk)     可选项 默认类会自动识别
                Method = "get",                         //URL     可选项 默认为Get
                Timeout = 100000,                       //连接超时时间     可选项默认为100000
                ReadWriteTimeout = 30000,               //写入Post数据超时时间     可选项默认为30000
                IsToLower = false,                      //得到的HTML代码是否转成小写     可选项默认转小写
                UserAgent = "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)",//用户的浏览器类型,版本,操作系统     可选项有默认值
                Accept = "text/html, application/xhtml+xml, */*" ,      //可选项有默认值
                ContentType = "text/html",                              //返回类型    可选项有默认值
                ResultType = ResultType.String,                         //返回数据类型,是Byte还是String
            };
            string html = http.GetHtml(item);
            string cookie = item.Cookie;

            HttpItem objHttpItem = new HttpItem()
            {
                URL = "http://data.shishicai.cn/handler/kuaikai/data.ashx",
                Postdata = "lottery=33&date=0001-01-01",
                ContentType = "application/x-www-form-urlencoded",
                Encoding = "utf-8",
                Method = "POST",
                Cookie = item.Cookie,
                IsToLower = false
            };
            html = http.GetHtml(objHttpItem);
            Clipboard.SetDataObject(html + "\r\n" + cookie, true);
        }[/code]


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-1-13 19:04:05 | 显示全部楼层
你把这个代码复制到线程外执行一下,就是在asp.net或者Winfrom中执行一下看出现什么情况
 楼主| 发表于 2013-1-13 19:59:40 | 显示全部楼层
admin 发表于 2013-1-13 19:04
你把这个代码复制到线程外执行一下,就是在asp.net或者Winfrom中执行一下看出现什么情况

FormsHttp.rar (59.14 KB, 下载次数: 458)
发表于 2013-1-14 10:12:57 | 显示全部楼层
测试成功代码下载
FormsHttp.zip (63.95 KB, 下载次数: 525)
 楼主| 发表于 2013-1-14 11:11:43 | 显示全部楼层
本帖最后由 liucq 于 2013-1-14 19:03 编辑
admin 发表于 2013-1-14 10:12
测试成功代码下载

谢谢你,俺终于找到原因了。

我原因为Referer随便搞一个域名相同的就行,没想到这个烂网站这么严格。

懒惰是程序员的大敌呀!!!!

谢谢苏先生的测试,你的helper类非常好用,以后有机会多交流。

谢谢!!!
发表于 2013-1-14 11:14:42 | 显示全部楼层
liucq 发表于 2013-1-14 11:11
谢谢你,俺终于找到原因了。这个网站发post的Referer一定要和post字符串里面的日期相对应。

我原因为R ...

不客气,以后多上来转,呵呵
发表于 2013-1-14 15:21:09 | 显示全部楼层
up
发表于 2013-1-17 02:16:24 | 显示全部楼层
Eagle 发表于 2013-1-14 15:21
up

上面广告,工信部没有备案。这个得删除吧??
发表于 2013-1-17 10:04:47 | 显示全部楼层
守望幸福 发表于 2013-1-17 02:16
上面广告,工信部没有备案。这个得删除吧??

这个广告是论坛投的,是广告联盟上面的。不用管它不影响
发表于 2013-1-21 19:41:04 | 显示全部楼层
苏飞童鞋,你太邪恶了!
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-19 07:13

© 2014-2021

快速回复 返回顶部 返回列表