http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

楼主: 站长苏飞

[发布] [C#HttpHelper]官方产品发布与源码下载---苏飞版

   关闭 [复制链接]
发表于 2012-10-2 21:55:51 | 显示全部楼层


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
 楼主| 发表于 2012-9-29 22:21:47 | 显示全部楼层
ReEnter 发表于 2012-9-29 21:32
当然用过。而且,把你的类升过级。你要不信你的正则有问题的话,你先第一种取编码的方式去掉,让第二种取的 ...

目前我们测试的网站没有一个有问题的,如果你发现有问题请指出来具体网址,我做的一个网站www.7c.com目前是使用的这个类,是做爬虫用的,一天大约有6千多万个域名吧,具我的测试没有取不到编码的,也没有乱码的都是访问正常,希望你能提供一下具体的网址,也可以直接到网站上进行测试。希望你提供网址,非常感谢.要不然咱们的沟通没有办法得到落实,你说行,我说不行,呵呵,我们上面有每在有几万IP,还真不敢随便修改。需要有实际的错误页面才行。如果不方便 的话也可以联系我的QQ在主页上有。单击可以直接联系我。期待你的建议。
发表于 2012-9-29 21:32:15 | 显示全部楼层
当然用过。而且,把你的类升过级。你要不信你的正则有问题的话,你先第一种取编码的方式去掉,让第二种取的试试,看看有多少网站报错,而且还报流已关闭。。。。
发表于 2012-9-29 10:35:27 | 显示全部楼层
看看,感谢
 楼主| 发表于 2012-9-29 08:02:31 | 显示全部楼层
ReEnter 发表于 2012-9-28 23:28
用这个吧...我一直在采淘宝网的...所以还没有注意你提到的..
现在两个都兼容

你确定用过我的吗?我的正则目前还没有见到取不到的,我测试了上千万个网站了,有上千人在使用。希望您能说点具体例子比如那个网站取不到,或者那种情况取不到。
发表于 2012-9-28 23:28:01 | 显示全部楼层
用这个吧...我一直在采淘宝网的...所以还没有注意你提到的..
现在两个都兼容

<!doctype html>
<html >
<head>
<meta charset="gbk" />
<meta([^<]*)charset[\"'=]{1,2}([^<]*)[\"']
 楼主| 发表于 2012-9-27 13:08:11 | 显示全部楼层
wtvb123 发表于 2012-9-27 13:04
刚更新?刚更新?刚更新?刚更新?

是的今天才更新的我时间还没有修改,你下载的真快
发表于 2012-9-27 13:04:35 | 显示全部楼层
刚更新?刚更新?刚更新?刚更新?
发表于 2012-9-27 12:57:10 | 显示全部楼层
我是为这个而来的.``
 楼主| 发表于 2012-9-26 13:48:57 | 显示全部楼层
ReEnter 发表于 2012-9-26 13:17
呵呵.错误不少.还更新这么多次.功能还不算完全.给你提一个错误吧,

提取编码的正则,改成

首先感谢您提出建议
您的正则好像
<meta http-equiv="Content-Type" content="text/html; charset=gbk" />
到这种情况就不行了吧。
至于你说的其它功能,有些是有的,建议你先看下我的类再发表评论。
本人水平有限,只能给大家提供这些。当然我会随着自己的进步不断为大家更新服务,您说的错误不少,希望能细化。再次感谢您的宝贵建议
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-11-22 07:23

© 2014-2021

快速回复 返回顶部 返回列表