http://www.sufeinet.com/plugin.php?id=keke_group

苏飞论坛

 找回密码
 马上注册

QQ登录

只需一步,快速开始

分布式系统框架(V2.0) 轻松承载百亿数据,千万流量!讨论专区 - 源码下载 - 官方教程

HttpHelper爬虫框架(V2.7-含.netcore) HttpHelper官方出品,爬虫框架讨论区 - 源码下载 - 在线测试和代码生成

HttpHelper爬虫类(V2.0) 开源的爬虫类,支持多种模式和属性 源码 - 代码生成器 - 讨论区 - 教程- 例子

查看: 3742|回复: 2
打印 上一主题 下一主题

[C#语言基础] C#关于网址字符截取的问题

[复制链接]
跳转到指定楼层
楼主
发表于 2014-6-15 16:41:50 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
大家好,我是一个C#新手,刚接触不到一周就深深的喜欢上了C#。我遇到了个问题,我有个工作需要,需要用C#写个很小很小 的功能软件来实现。
需求:
有一个.txt的文本文件,里面有10万多行网址,每个网址单独一行。
我需要读入这个.txt文件,然后批量截取每行指定的字符串,我的意思是这样的。
例如:网址为: http://www.baidu.com/wp-content/theme/thsa/inc/index.php
我可以指定字符串,比如我指定字符串:wp-content,然后截取wp-content以前的网址,截取后的结果是:http://www.baidu.com/
但是需要操作每一行的网址,这应该算是批量截取了。然后保存到一个新的.txt文本文件里。

请问各位如何实现,请把代码帮我发上来。也正好学习一下。十分感谢!!!


1. 开通SVIP会员,免费下载本站所有源码,不限次数据,不限时间
2. 加官方QQ群,加官方微信群获取更多资源和帮助
3. 找站长苏飞做网站、商城、CRM、小程序、App、爬虫相关、项目外包等点这里
沙发
发表于 2014-6-16 11:11:12 | 只看该作者
   string host = new Uri(href).Host;
板凳
 楼主| 发表于 2014-6-16 13:00:10 | 只看该作者
本帖最后由 xionglonghui 于 2014-6-16 13:01 编辑

苏飞,我觉得你这个方法也不完全正确的。因为有的wordpress网站安装在子目录里。例如: http://www.baidu.com/wordpress/wp-content/   用你的方法截取的话,只能截取到http://www.baidu.com/ 而我想要的结果是: http://www.baidu.com/wordpress/

再次求解决方法!谢谢
您需要登录后才可以回帖 登录 | 马上注册

本版积分规则

QQ|手机版|小黑屋|手机版|联系我们|关于我们|广告合作|苏飞论坛 ( 豫ICP备18043678号-2)

GMT+8, 2024-12-19 11:42

© 2014-2021

快速回复 返回顶部 返回列表