基本信息
文件名称:实践案例第一个爬虫程序爬取中国高职高专教育网首页标题薛雯52课件讲解.pptx
文件大小:16.48 MB
总页数:7 页
更新时间:2026-02-09
总字数:约小于1千字
文档摘要
实践案例:第一个爬虫程序——爬取“中国高职高专教育网”首页标题主讲人:薛雯
熟悉爬虫项目的完整流程,在遵守网站规则的前提下,通过简单的爬虫程序爬取“中国高职高专教育网”首页标题。课程核心
“环境搭建-代码框架-程序运行”的步骤逻辑,建立爬虫开发的基础认知,为后续学习相关库的原理与应用做好铺垫。重点掌握
任务描述与核心目标本次案例的核心任务是以入门级爬虫开发为导向,在已搭建好的PyCharm开发环境中。新建项目创建代码文件编写基础代码运行程序完成“中国高职高专教育网”首页标题的爬取。
任务描述与核心目标遵守网站公开数据采集规则,仅获取首页标题这一非敏感信息,同时初步接触“异常