http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 7723|回复: 1

[抓取] HttpWebRequest抓取不到HTML内容?

[复制链接]
发表于 2012-10-25 09:48:57 | 显示全部楼层 |阅读模式
我的代码:
            string strResult = "";
            try
            {
                CookieContainer cookie = new CookieContainer();
                HttpWebRequest http = (HttpWebRequest)WebRequest.Create(url);
                http.AllowAutoRedirect = false ;
               http.KeepAlive = true;
                http.Method = "POST";
                http.Timeout = 5000;
                http.CookieContainer = cookie;
                HttpWebResponse response = (HttpWebResponse)http.GetResponse();
                Stream streamReceive = response.GetResponseStream();
                StreamReader streamReader = new StreamReader(streamReceive, Encoding .UTF8 );
                strResult = streamReader.ReadToEnd();
                streamReader.Close();
                streamReceive.Close();
                response.Close();
                http.Abort();
                return strResult;
}
catch{
...}

为什么我在访问“http://www.ria.ru/”网站的时候,得到的是
“<!DOCTYPE html SYSTEM "about:legacy-compat">
<html lang="ru"><head><meta http-equiv="Content-Type" content="text/html; charset=UTF-8"><script src="/js/libs/jquery.min.js?"></script><script src="/js/libs/swfobject.js?"></script><script>var redirecturl = ''; var senddata = '{ "flash_support": ' + (swfobject.getFlashPlayerVersion().major > 0 ? 1 : 0) + ' }'; $.ajax({ type: 'POST', url: '/services/js_store', data: {action: "save", data: senddata}, success: function(data) { if (data.status == "OK") { if (redirecturl != '') { location.href = redirecturl; } else { location.reload(); } } }, dataType: "json" });</script><meta http-equiv="refresh" content="2;url=/"><noscript><meta http-equiv="refresh" content="0;url=/"></noscript></head><body></body></html>

而不是网页内容


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2012-10-25 10:22:11 | 显示全部楼层
你加上UserAgin试试
建议使用我的类来访问 http://www.sufeinet.com/thread-3-1-1.html
你的问题主要是这个界面不是直接显示内容,而是执行你得到的JS才来显示出来的
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-11-22 14:23

© 2014-2021

快速回复 返回顶部 返回列表