Python3把爬取过来的网页写入到文件
第一步 请求网页
因为这次主要介绍的是写入文件,所以我们就不使用requests的了,直接使用urllib获取网页
导入urllib
[C#] 纯文本查看 复制代码 from urllib.request import urlopen
然后使用urlopen获取内容
[C#] 纯文本查看 复制代码 myURL = urlopen("http://www.sufeinet.com/")
content = myURL.read(100) # 读取网页内容
为了加快速度,我们只取前100个字符
第二步,写入文件
打开文件
[C#] 纯文本查看 复制代码 f = open("test1.html", "wb")
写入文件
[C#] 纯文本查看 复制代码 f.write(content)
f.close()
完整的源码如下
[C#] 纯文本查看 复制代码 from urllib.request import urlopen
# 输出为文件,目录在项目文件主目录,也可以直接写路径
f = open("test1.html", "wb")
myURL = urlopen("http://www.sufeinet.com/")
content = myURL.read(100) # 读取网页内容
f.write(content)
f.close()
print(content)
print("写入成功!")
|