苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 5354|回复: 4

[求助] [C#爬虫程序请求过多报异常]

[复制链接]
发表于 2013-9-27 11:22:49 | 显示全部楼层 |阅读模式
以下是主要的异常:
2013/9/27 10:44:35 无法连接到远程服务器
2013/9/27 10:46:07 无法连接到远程服务器
2013/9/27 10:46:18 无法连接到远程服务器
2013/9/27 10:46:45 无法连接到远程服务器
2013/9/27 10:47:52 无法连接到远程服务器
2013/9/27 10:48:13 无法连接到远程服务器
2013/9/27 10:49:10 远程服务器返回错误: (502) 错误的网关。
2013/9/27 10:51:24 远程服务器返回错误: (502) 错误的网关。
2013/9/27 10:54:25 远程服务器返回错误: (502) 错误的网关。
2013/9/27 10:54:37 基础连接已经关闭: 连接被意外关闭。
2013/9/27 10:54:42 操作超时
2013/9/27 11:21:14 基础连接已经关闭: 接收时发生错误。

从一个网站请求10万条数据,但有一些少量数据报异常,不知道为什么呢?



1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-9-27 11:26:06 | 显示全部楼层
请求的网址一样吗?就是URl完全 一样吗?如果不一样有可能是有些页面限制,或者是暂时无法访问

统计一下不能访问的次数10万如果出次了百十次我感觉是正常情况
 楼主| 发表于 2013-9-27 11:30:54 | 显示全部楼层
站长苏飞 发表于 2013-9-27 11:26
请求的网址一样吗?就是URl完全 一样吗?如果不一样有可能是有些页面限制,或者是暂时无法访问

统计一下 ...

网址是一样的,但是参数不一样,因为要先取分页的数据再从每页中取出最终数据.十万有个百十条正常吗,那怎么样能解决这个问题呢,因为要求与它网站上的数据一致.
发表于 2013-9-27 11:37:42 | 显示全部楼层
参数不一样就有可能是网页真的访问不了,你存储一下错误的网页然后检查一下都是什么错误,
这样才能排除。
这说不好的,说不定就是因为你访问的太快,或者是参数组织的某个页面就是不存在,或者是数据不存在报的错,这与用不用线程,没有关系,关键是看这个错误是怎么产生的。你先记录下下分析分析看看原因是什么。
 楼主| 发表于 2013-9-27 13:18:38 | 显示全部楼层
{:soso__12156366109601993327_5:}那只能这样了,谢谢
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-23 18:58

© 2014-2021

快速回复 返回顶部 返回列表