基本信息
文件名称:《Python编程入门与实践(微视频版)》代码 例11-7 使用爬虫程序获取网页文本.doc
文件大小:74.5 KB
总页数:2 页
更新时间:2025-07-12
总字数:约2.01千字
文档摘要

例11-7使用爬虫程序获取网页文本

例11-7使用爬虫程序获取网页文本

本例使用爬虫程序获取“清华大学出版社”网页上的文本内容。

importrequests

frombs4importBeautifulSoup

#目标网页URL

url=/intro.asp

try:

#发送HTTP请求

response=requests.get(url)

response.raise_for_status()#检查请求是否成功

#设置正确的编码

response.encoding=response.apparent_encod