请求的html为空的问题。

潘家铭 · 发表于 2019-5-6 10:04:18

我刚开始接触抓取网页，昨天晚上无意中找到这里，感觉功能很强大，所以买了会员。
今天我用万能框架试着抓取网页。首先我用demo里的源码试着抓论坛的html结果返回空。

[C#] 纯文本查看 复制代码

////创建Httphelper对象
            HttpHelper http = new HttpHelper();
            //创建Httphelper参数对象
            HttpItem item = new HttpItem()
            {
                URL = "http://www.sufeinet.com",//URL     必需项    
                Method = "get",//URL     可选项 默认为Get   
                ContentType = "text/html",//返回类型    可选项有默认值   
                //ContentType = "application/x-www-form-urlencoded",//返回类型    可选项有默认值   
            };
            //请求的返回值对象
            HttpResult result = http.GetHtml(item);
            //获取请请求的Html
            string html = result.Html;

之后我利用代码生成器试着看了一下，测试下来是没问题的。于是我自动生成了代码。

[C#] 纯文本查看 复制代码

 HttpHelper http = new HttpHelper();

            HttpItem item = new HttpItem()
            {
                URL = "http://www.cnjidan.com/dadou/shanghai.html",//URL     必需项  
                Method = "GET",//URL     可选项 默认为Get  
                Timeout = 100000,//连接超时时间     可选项默认为100000  
                ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000  
                IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写  
                Cookie = "",//字符串Cookie     可选项  
                UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型，版本，操作系统     可选项有默认值  
                Accept = "text/html, application/xhtml+xml, */*",//    可选项有默认值  
                ContentType = "text/html",//返回类型    可选项有默认值  
                Referer = "http://www.cnjidan.com/dadou/shanghai.html",//来源URL     可选项  
                Allowautoredirect = false,//是否根据３０１跳转     可选项  
                AutoRedirectCookie = false,//是否自动处理Cookie     可选项  
                                           //CerPath = "d:\123.cer",//证书绝对路径     可选项不需要证书时可以不写这个参数  
                                           //Connectionlimit = 1024,//最大连接数     可选项 默认为1024  
                Postdata = "",//Post数据     可选项GET时不需要写  
                              //ProxyIp = "192.168.1.105：2020",//代理服务器ID     可选项 不需要代理 时可以不设置这三个参数  
                              //ProxyPwd = "123456",//代理服务器密码     可选项  
                              //ProxyUserName = "administrator",//代理服务器账户名     可选项  
                ResultType = ResultType.String,//返回数据类型，是Byte还是String    
            };
            //请求的返回值对象
            HttpResult result = http.GetHtml(item);
            //获取请请求的Html
            string html = result.Html;
            //获取请求的Cookie
            string cookie = result.Cookie;

可是result.Html是空的。

我不是很懂，怎么才能得到网页的html内容呢？

站长苏飞 · 发表于 2019-5-9 08:40:03

空白问题已经修复

我个人代码书写失误，请更新后使用

HttpHelper万能框架修复V2.3.4版本某些网站返回内容空白的Bug
http://www.sufeinet.com/thread-32362-1-1.html
(出处: 苏飞论坛)

howzew · 发表于 2019-5-6 11:27:43

楼主检查一下你的IE代理，看看是不是IE有问题

站长苏飞 · 发表于 2019-5-6 11:25:49

[C#] 纯文本查看 复制代码

HttpHelper http = new HttpHelper();
           HttpItem item = new HttpItem()
           {
               URL = "http://www.cnjidan.com/dadou/shanghai.html",//URL     必需项    
           };
           //请求的返回值对象
           HttpResult result = http.GetHtml(item);
           //获取请请求的Html
           string html = result.Html;
           //获取请求的Cookie
           string cookie = result.Cookie;

潘家铭 · 发表于 2019-5-6 10:24:20

zncliving 发表于 2019-5-6 10:20
有页面信息啊不是空的

神奇了，我就不行啊。难道是我用的win10的关系？

zncliving · 发表于 2019-5-6 10:20:56

有页面信息啊不是空的

潘家铭 · 发表于 2019-5-6 10:17:07

我知道啊，但是控制台运行起来之后，

[C#] 纯文本查看 复制代码

string html = result.Html;

到这里是空的，

zncliving · 发表于 2019-5-6 10:13:14

没问题啊，用你发的这2个都能获取到网页内容。

		自动登录	找回密码
密码			马上注册

[求助] 请求的html为空的问题。