苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 18951|回复: 11

[求助] 购买了万能框架,在线测试采集正常,但是本地采集

[复制链接]
发表于 2022-4-25 18:17:58 | 显示全部楼层 |阅读模式
购买了万能框架,在苏飞在线测试上进行采集,是可以采集到的。采集地址:
https://baijiahao.baidu.com/s?id=1731073946463738468
如下图:
1a.png

生成代码:
2a.png


但是我把生成的代码,添加到本地后,采集的内容,却是空。
3a.png

请苏飞版主帮帮忙,帮帮忙。。。。


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
 楼主| 发表于 2022-4-25 18:47:55 | 显示全部楼层
@站长苏飞  帮帮忙,这是什么问题啊?  在线测试能采集到内容。 但是复制代码到本地后,就采集为""了。
 楼主| 发表于 2022-4-25 19:14:26 | 显示全部楼层
@站长苏飞 站长棒棒我吧。。。

我看了源码,在这里获取页面内容是,没有读取到。。。。
4a.png
发表于 2022-4-26 14:39:21 | 显示全部楼层
兄弟你可以贴一下代码吗,实在做不到对着图片给你打出来测试
 楼主| 发表于 2022-4-27 08:25:58 | 显示全部楼层
  • HttpHelper http = new HttpHelper();  
  • HttpItem item = new HttpItem()  
  • {  
  •     URL = "https://baijiahao.baidu.com/s?id=1581837059629769930",//URL     必需项  
  •     Method = "GET",//URL     可选项 默认为Get  
  •     Timeout = 100000,//连接超时时间     可选项默认为100000  
  •     ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000  
  •     IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写  
  •     Cookie = "",//字符串Cookie     可选项  
  •     UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值  
  •     Accept = "text/html, application/xhtml+xml, */*",//    可选项有默认值  
  •     ContentType = "text/html",//返回类型    可选项有默认值  
  •     Referer ="",//来源URL     可选项  
  •     Allowautoredirect = False,//是否根据301跳转     可选项  
  •     AutoRedirectCookie = False,//是否自动处理Cookie     可选项  
  •     //CerPath = "d:\123.cer",//证书绝对路径     可选项不需要证书时可以不写这个参数  
  •     //Connectionlimit = 1024,//最大连接数     可选项 默认为1024  
  •     Postdata = "",//Post数据     可选项GET时不需要写  
  •     //ProxyIp = "192.168.1.105:2020",//代理服务器ID     可选项 不需要代理 时可以不设置这三个参数  
  •     //ProxyPwd = "123456",//代理服务器密码     可选项  
  •     //ProxyUserName = "administrator",//代理服务器账户名     可选项  
  •     ResultType = ResultType.String,//返回数据类型,是Byte还是String  
  • };  
  • HttpResult result = http.GetHtml(item);  
  • string html = result.Html;  
  • string cookie = result.Cookie;  
  •          
  •   
  •         /// <summary>  
  •         /// 字节数组生成图片  
  •         /// </summary>  
  •         /// <param name="Bytes">字节数组</param>  
  •         /// <returns>图片</returns>  
  •         private Image byteArrayToImage(byte[] Bytes)  
  •         {  
  •             MemoryStream ms = new MemoryStream(Bytes);  
  •             return Bitmap.FromStream(ms,true);  
  •         }

 楼主| 发表于 2022-4-27 08:27:02 | 显示全部楼层
HttpHelper http = new HttpHelper();  
HttpItem item = new HttpItem()  
{  
    URL = "https://baijiahao.baidu.com/s?id=1581837059629769930",//URL     必需项  
    Method = "GET",//URL     可选项 默认为Get  
    Timeout = 100000,//连接超时时间     可选项默认为100000  
    ReadWriteTimeout = 30000,//写入Post数据超时时间     可选项默认为30000  
    IsToLower = false,//得到的HTML代码是否转成小写     可选项默认转小写  
    Cookie = "",//字符串Cookie     可选项  
    UserAgent = "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:18.0) Gecko/20100101 Firefox/18.0",//用户的浏览器类型,版本,操作系统     可选项有默认值  
    Accept = "text/html, application/xhtml+xml, */*",//    可选项有默认值  
    ContentType = "text/html",//返回类型    可选项有默认值  
    Referer ="",//来源URL     可选项  
    Allowautoredirect = False,//是否根据301跳转     可选项  
    AutoRedirectCookie = False,//是否自动处理Cookie     可选项  
    //CerPath = "d:\123.cer",//证书绝对路径     可选项不需要证书时可以不写这个参数  
    //Connectionlimit = 1024,//最大连接数     可选项 默认为1024  
    Postdata = "",//Post数据     可选项GET时不需要写  
    //ProxyIp = "192.168.1.105:2020",//代理服务器ID     可选项 不需要代理 时可以不设置这三个参数  
    //ProxyPwd = "123456",//代理服务器密码     可选项  
    //ProxyUserName = "administrator",//代理服务器账户名     可选项  
    ResultType = ResultType.String,//返回数据类型,是Byte还是String  
};  
HttpResult result = http.GetHtml(item);  
string html = result.Html;  
string cookie = result.Cookie;  
         
  
        /// <summary>  
        /// 字节数组生成图片  
        /// </summary>  
        /// <param name="Bytes">字节数组</param>  
        /// <returns>图片</returns>  
        private Image byteArrayToImage(byte[] Bytes)  
        {  
            MemoryStream ms = new MemoryStream(Bytes);  
            return Bitmap.FromStream(ms,true);  
        }
发表于 2022-4-27 11:47:37 | 显示全部楼层
shaokun 发表于 2022-4-27 08:27
HttpHelper http = new HttpHelper();  
HttpItem item = new HttpItem()  
{  

直接访问 就行,你看看报的什么错,没有。还是说就是返回的空白
发表于 2022-4-27 11:47:54 | 显示全部楼层
我看网址是https,可以把证书加上
 楼主| 发表于 2022-4-27 11:55:12 | 显示全部楼层
返回的html内容是空白。  把证书加上,是该怎么加呀?
发表于 2022-4-27 12:00:17 | 显示全部楼层
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-25 16:15

© 2014-2021

快速回复 返回顶部 返回列表