苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 5107|回复: 5

[HttpHelper] gzip问题

[复制链接]
发表于 2017-4-10 21:37:18 | 显示全部楼层 |阅读模式
QQ图片20170410213609.png

这是为什么呢



1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2017-4-11 07:48:34 | 显示全部楼层
这要看代码是怎么写的,访问的网址是什么
发表于 2017-4-11 07:48:59 | 显示全部楼层
http://www.sufeinet.com/thread-17648-1-1.html也可以先试试这种方式
 楼主| 发表于 2017-4-11 09:05:44 | 显示全部楼层
站长苏飞 发表于 2017-4-11 07:48
http://www.sufeinet.com/thread-17648-1-1.html也可以先试试这种方式

    HttpHelper http = new HttpHelper();
                //创建Httphelper参数对象
                HttpItem item = new HttpItem()
                {
                    URL = url,//URL     必需项   
                    Method = "get",//URL     可选项 默认为Get   
                              
                    ContentType = "text/html",//返回类型    可选项有默认值   
                     
                    Host = "search.xxxx.com",
                  

                    Accept = "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
                    UserAgent = "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; WOW64; Trident/6.0)",
                    Cookie = "",
                   IsGzip = true,
                };
                //请求的返回值对象
                HttpResult result = http.GetHtml(item);
                //获取请请求的Html
                string Des = result.StatusDescription;

                string html = result.Html;
                HttpStatusCode code = result.StatusCode;
                //获取请求的Cookie
                string cookie = result.Cookie;
                return html;
 楼主| 发表于 2017-4-11 09:07:10 | 显示全部楼层
站长苏飞 发表于 2017-4-11 07:48
http://www.sufeinet.com/thread-17648-1-1.html也可以先试试这种方式

网址通过站内信息发给你了
发表于 2017-4-11 17:23:45 | 显示全部楼层
[C#] 纯文本查看 复制代码
HttpHelper http = new HttpHelper();
HttpItem item = new HttpItem()
{
    URL = "http://search.rakuten.co.jp/search/inshop-mall?f=1&v=2&sid=2&uwd=1&s=1&p=1&sitem=&st=A&nitem=&min=10000&max=",//URL     必需项
    Method = "GET",//URL     可选项 默认为Get
    Timeout = 100000,//连接超时时间     可选项默认为100000
    ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000
    IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写
    Cookie = "",//字符串Cookie     可选项
    UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值
    Accept = "text/html, application/xhtml+xml, */*",//    可选项有默认值
    ContentType = "text/html",//返回类型    可选项有默认值
    Referer ="http://www.sufeinet.com",//来源URL     可选项
    Allowautoredirect = False,//是否根据301跳转     可选项
    AutoRedirectCookie = False,//是否自动处理Cookie     可选项
    //CerPath = "d:\123.cer",//证书绝对路径     可选项不需要证书时可以不写这个参数
    //Connectionlimit = 1024,//最大连接数     可选项 默认为1024
    Postdata = "",//Post数据     可选项GET时不需要写
    //ProxyIp = "192.168.1.105:2020",//代理服务器ID     可选项 不需要代理 时可以不设置这三个参数
    //ProxyPwd = "123456",//代理服务器密码     可选项
    //ProxyUserName = "administrator",//代理服务器账户名     可选项
    ResultType = ResultType.String,//返回数据类型,是Byte还是String
};
HttpResult result = http.GetHtml(item);
string html = result.Html;
string cookie = result.Cookie;
        
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-27 21:02

© 2014-2021

快速回复 返回顶部 返回列表