http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

楼主: 站长苏飞

[发布] 【C#HttpHelper爬虫框架】源码购买帖子

 关闭 [复制链接]
 楼主| 发表于 2015-5-13 08:54:08 | 显示全部楼层
[C#] 纯文本查看 复制代码
            //1.设置所使用的解压缩类型
            //2.设置本地的出口ip和端口
            //3.解决A连接列表获取不准的Bug
            //4.将图片转为字节的方法
            //5.将字节数组为Base64编码
            //6.将字符串转为Base64编码
            //7.将Base64编码解析成字符串
            //8.FastRequest方法增加返回Cookie值


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
 楼主| 发表于 2015-3-6 11:48:05 | 显示全部楼层
更新版本V1.5    2015-03-06更新
[C#] 纯文本查看 复制代码
            //1.增加Put发送方式;
            //2.修复GetHtml()方法当出现50开头或者40开头状态码时报错的Bug
            //3.HttpItem代码层优化
            //4.增加302/301跳转时自动带Cookie的方法



详情请查看教程http://httphelper.sufeinet.com/Course.aspx
 楼主| 发表于 2015-1-19 10:04:44 | 显示全部楼层
  更新版本V1.4      
           //1.解决:服务器提交了协议冲突. Section=ResponseHeader Detail=标头名称无效 具体看Web.config的配置串
            //2.新增FastRequest返回Header信息
            //3.修复RedirectUrl在Location大写L的情况下获取不到跳转Url的问题
            //4.http://www.digitalwuhan.gov.cn/访问这个页面时获取A链接列表卡死是正则问题
            //5.增加获取最后访问的URl result.ResponseUri = response.ResponseUri.ToString();



详情请查看教程http://httphelper.sufeinet.com/Course.aspx

 楼主| 发表于 2014-11-24 08:53:10 | 显示全部楼层
            1.解决【提取Html字符串中两字符之间的数据】永久为空的Bug  
            2.增加提取的A链接的类型(图片,文本)
            3.将类ExceJsHelper更名为ExecJsHelper
            4.优化在Http返回错误状态下也能获取Html内容



详情请查看教程http://httphelper.sufeinet.com/Course.aspx
 楼主| 发表于 2014-10-25 20:57:45 | 显示全部楼层
            1.增加提取Html字符串中两字符之间的数据
            2.修复GetData方法报异常的Bug  http://www.sufeinet.com/thread-10186-1-1.html
            3.增加将字符串转为字节数组
            4.增加将字节数组转为字符串
            5.增加将字节数组转为图片
            6.取消【为Com互操作注册】,因为有些电脑需要管理员身份
            7.增加提取Title
            8.增加提取网站主机部分就是host
            9.增加提取网址对应的IP地址

详情请查看教程http://httphelper.sufeinet.com/Course.aspx
 楼主| 发表于 2014-9-22 08:37:27 | 显示全部楼层
            1.增加执行Js的方法
            2.单个证书增加带密码功能
            3.修复设置多个证书时必须先设置单个证书的路径,而单个证书又没有办法设置密码,所以造成无法给证书带密码的问题
            4.修复Cookie为Null时,Cookie精简化方法报错的问题
详情请查看教程http://httphelper.sufeinet.com/Course.aspx
 楼主| 发表于 2014-9-15 08:32:23 | 显示全部楼层
第一版源码已发布
版本号:V1.0
.NET环境:4.0
更新功能有
  • GET请求
  • POST字符串数据
  • POST字节数组
  • POST文件数据
  • POST请求时设置编码
  • 获取URL重定向(302,301)后的URL网址
  • 获取状态码(StatusCode)和状态描述(StatusDescription)
  • 如何设置请求头信息(Header)
  • 如何获取响应头信息(Header)
  • 如果设置来路URL(Referer)
  • 字符串Cookie使用方法
  • CookieCollection类型Cookie使用方法
  • 获取精简字符串Cookie
  • 字符串Cookie转为CookieCollection类型Cookie
  • CookieCollection类型Cookiel转为字符串Cookie
  • 获取图片验证码
  • 带有证书的网站请求方法
  • 为Http请求设置代理IP
  • 将URL的参数部分转为NameValueCollection集合
  • 解码,还原URL(URLDecode)/转码、编码URL(URLEncode)
  • 使用MD5(32位)加密字符串
  • 将指定的Json字符串转为指定的T类型对象
  • 将指定的T类型对象转为Json字符串
  • 获取所有的A链接并生成List对象(href、text链接文本,html整个标签)
  • 获取所有的Img(图片)对象(src、img、Html整个标签)并生成List对象
  • 过滤所有的html标签
  • 过滤所有的换行符号
  • 极速请求方法FastRequest(极速请求不接收数据)



时间比紧,大家有如果发现有什么Bug还希望在讨论区提一下
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-22 12:57

© 2014-2021

快速回复 返回顶部 返回列表