苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

楼主: 剪刀手

[其他] C#提取字符串中的超链接和锚文本

[复制链接]
 楼主| 发表于 2013-1-18 15:28:39 | 显示全部楼层
admin 发表于 2013-1-18 14:32
问题解决了吗?

木有,不知道如何解决……


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
发表于 2013-1-18 15:51:54 | 显示全部楼层
我不是给你代码了吗?
 楼主| 发表于 2013-1-21 09:14:17 | 显示全部楼层
admin 发表于 2013-1-18 15:51
我不是给你代码了吗?

m.Value么?我原来用的就是这个啊,获取的只是链接……
 楼主| 发表于 2013-1-21 09:14:19 | 显示全部楼层
admin 发表于 2013-1-18 15:51
我不是给你代码了吗?

m.Value么?我原来用的就是这个啊,获取的只是链接……
发表于 2013-1-21 10:23:35 | 显示全部楼层
剪刀手 发表于 2013-1-21 09:14
m.Value么?我原来用的就是这个啊,获取的只是链接……

我能不明白你要什么了,你发个A的例子然后告诉我要取那部分我给你代码
 楼主| 发表于 2013-1-21 12:21:10 | 显示全部楼层
如:
<a href="/q?w=3389%C9%A8%C3%E8%C6%F7&amp;bs=3389&amp;sc=web&amp;ch=w.h.r" title="">3389扫描器</a>
获取href=""之间的超链接和锚文本,希望在一个循环里同时获取这两个信息……
 楼主| 发表于 2013-1-21 12:21:49 | 显示全部楼层
admin 发表于 2013-1-21 10:23
我能不明白你要什么了,你发个A的例子然后告诉我要取那部分我给你代码

如:
<a href="/q?w=3389%C9%A8%C3%E8%C6%F7&amp;bs=3389&amp;sc=web&amp;ch=w.h.r" title="">3389扫描器</a>
获取href=""之间的超链接和锚文本,希望在一个循环里同时获取这两个信息……
发表于 2013-1-21 12:28:31 | 显示全部楼层
剪刀手 发表于 2013-1-21 12:21
如:
3389扫描器
获取href=""之间的超链接和锚文本,希望在一个循环里同时获取这两个信息……

[code=csharp]MatchCollection mc3 = Regex.Matches(subjectString, @"<a[\s\S]*?href=\"([\s\S]*?)\"[\s\S]*?>([\s\S]*?)</a>", RegexOptions.IgnoreCase);
            foreach (Match m in mc3)
            {
               href= m.Groups[1].Value ;    //url链接
                text= m.Groups[2].Value ;    //url链接
            }[/code]
 楼主| 发表于 2013-1-21 18:55:24 | 显示全部楼层
admin 发表于 2013-1-21 12:28

不行啊,这个表达式:@"<a[\s\S]*?href=\"([\s\S]*?)\"[\s\S]*?>([\s\S]*?)</a>"无效,编译通不过……
发表于 2013-1-21 19:55:51 | 显示全部楼层
已阅,顶一下
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-26 03:18

© 2014-2021

快速回复 返回顶部 返回列表