http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 29358|回复: 17

[C#语言基础] C# Xpath 解析HTML入门,使用方法教程

[复制链接]
发表于 2013-1-17 15:35:21 | 显示全部楼层 |阅读模式
首先我们应该去下载一下Dll
目前的版本应该是HtmlAgilityPack.1.4.6的,
这里提供下载:
HtmlAgilityPack.1.4.6.rar (835.11 KB, 下载次数: 1009)


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-1-25 16:43:08 | 显示全部楼层
我是沙发,Xpath,百度了一下很强大,希望飞哥继续更新这方面的东西。
 楼主| 发表于 2013-1-25 16:45:11 | 显示全部楼层
SillyPGM 发表于 2013-1-25 16:43
我是沙发,Xpath,百度了一下很强大,希望飞哥继续更新这方面的东西。

我正在写工具,以后会更新的,呵呵
发表于 2014-1-8 19:36:37 | 显示全部楼层
刚接触这个类 全是英文看不懂,不过按飞哥的代码写 会报错 为啥 ?
[C#] 纯文本查看 复制代码
 HttpHelper http = new HttpHelper(); HttpItem item = new HttpItem() { URL = "http://www.sufeinet.com" };
HtmlAgilityPack.HtmlDocument html = new HtmlAgilityPack.HtmlDocument();
html.LoadHtml(http.GetHtml(item).Html);
HtmlAgilityPack.HtmlNode htmlNode = html.DocumentNode;
HtmlAgilityPack.HtmlNode div = htmlNode.SelectSingleNode(".//*[@id='nv_forum']/div[6]/div[1]/a[1]");

 楼主| 发表于 2014-1-8 20:01:33 | 显示全部楼层
sandy1231 发表于 2014-1-8 19:36
刚接触这个类 全是英文看不懂,不过按飞哥的代码写 会报错 为啥 ?
[mw_shl_code=csharp,true] HttpHelper ...

什么错
发表于 2014-1-8 20:15:20 | 显示全部楼层

调试的时候执行到最后一步就会报错,会跳到这样的界面 1111.png

发表于 2014-1-8 20:28:03 | 显示全部楼层

[C#] 纯文本查看 复制代码
    private void button1_Click(object sender, EventArgs e)
        {
            HttpHelper http = new HttpHelper(); HttpItem item = new HttpItem() { URL = "http://www.sufeinet.com" };
            HtmlAgilityPack.HtmlDocument html = new HtmlAgilityPack.HtmlDocument();
            html.LoadHtml(http.GetHtml(item).Html);
            HtmlAgilityPack.HtmlNode htmlNode = html.DocumentNode;
            HtmlAgilityPack.HtmlNode div = htmlNode.SelectSingleNode(".//*[@id='nv_forum']/div[6]/div[1]/a[1]");
            richTextBox1.Text = div.OuterHtml;
        }


如果随便输出点东西的话 也会报错,未将对象引用设置到对象的实例。
 楼主| 发表于 2014-1-8 20:51:56 | 显示全部楼层
HtmlAgilityPack.HtmlNode div = htmlNode.SelectSingleNode(".//*[@id='nv_forum']/div[6]/div[1]/a[1]"那是因为这里没有数据
发表于 2014-1-24 19:51:48 | 显示全部楼层
非常感谢你帮了我的大忙,真的太感谢你啦!
发表于 2015-4-15 11:47:54 | 显示全部楼层
强烈支持楼主ing……
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-19 05:09

© 2014-2021

快速回复 返回顶部 返回列表