苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 30764|回复: 17
打印 上一主题 下一主题

[C#语言基础] C# Xpath 解析HTML入门,使用方法教程

[复制链接]
跳转到指定楼层
楼主
发表于 2013-1-17 15:35:21 | 只看该作者 |只看大图 回帖奖励 |正序浏览 |阅读模式
首先我们应该去下载一下Dll
目前的版本应该是HtmlAgilityPack.1.4.6的,
这里提供下载:
HtmlAgilityPack.1.4.6.rar (835.11 KB, 下载次数: 1009)
资源如下

大家选择一下自己的版本就行了
然后把Dll引用到你的项目中来
使用代码如下
[C#] 纯文本查看 复制代码
 HttpHelper http = new HttpHelper();
            HttpItem item = new HttpItem() { URL = "http://www.sufeinet.com" };
            HtmlDocument html = new HtmlDocument();

            html.LoadHtml(http.GetHtml(item));

            HtmlAgilityPack.HtmlNode htmlNode = html.DocumentNode;
            //要取出的Xpath标签
            HtmlAgilityPack.HtmlNode div = htmlNode.SelectSingleNode(".//*[@id='nv_forum']/div[6]/div[1]/a[1]");

大家会问了那个这Xpath代码怎么取得呢,其实这个更简单
大家打开火狐浏览器,安装好FirBug,具体的安装方法大家网上看一下吧,

单击一下然后去选择你要获取的内容

然后右键

这样就得到了
好了有什么问题大家提提吧




1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
18
 楼主| 发表于 2020-4-26 11:15:16 | 只看该作者
329337656 发表于 2020-4-25 18:34
麻烦站在看看,为什么会这样的情况!

下载我的例子报错?这个需要引用DLL
17
发表于 2020-4-25 18:34:17 | 只看该作者
麻烦站在看看,为什么会这样的情况!
16
 楼主| 发表于 2020-4-25 15:42:28 | 只看该作者
329337656 发表于 2020-4-25 12:14
HtmlDocument html = new HtmlDocument(); 为什么会提示0个参数的错误

没有指定html代码吧
15
发表于 2020-4-25 12:14:38 | 只看该作者
HtmlDocument html = new HtmlDocument(); 为什么会提示0个参数的错误
14
发表于 2018-6-27 08:31:45 来自移动端 | 只看该作者
XPATH很棒哦,支持飞哥
13
发表于 2016-4-1 21:10:30 | 只看该作者
我按照这个实验了一下,好像还是不行哎;明明右键copy Xpath,但是node都是null
12
发表于 2016-4-1 20:49:13 | 只看该作者
膜拜中....!
回复

使用道具 举报

11
发表于 2015-9-21 11:49:24 | 只看该作者
感谢您的无私奉献,真是帮了我的大忙了
10
发表于 2015-4-15 11:47:54 | 只看该作者
强烈支持楼主ing……
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2025-1-19 19:22

© 2014-2021

快速回复 返回顶部 返回列表