基本信息
文件名称:《Python编程入门与实践(微视频版)》代码 例11-7 使用爬虫程序获取网页文本.doc
文件大小:74.5 KB
总页数:2 页
更新时间:2025-07-12
总字数:约2.01千字
文档摘要
例11-7使用爬虫程序获取网页文本
例11-7使用爬虫程序获取网页文本
本例使用爬虫程序获取“清华大学出版社”网页上的文本内容。
importrequests
frombs4importBeautifulSoup
#目标网页URL
url=/intro.asp
try:
#发送HTTP请求
response=requests.get(url)
response.raise_for_status()#检查请求是否成功
#设置正确的编码
response.encoding=response.apparent_encod