基本信息
文件名称:Python人工智能编程基础(微课版):爬虫基础PPT教学课件.pptx
文件大小:760.54 KB
总页数:36 页
更新时间:2025-11-01
总字数:约9.68千字
文档摘要
Python人工智能编程基础项目十二爬虫基础
课前导入阿曹是一名人工智能技术应用专业的学生,经常需要从互联网获取各类数据用于学习和实践。他发现手动复制网页信息效率极低,比如从新闻网站收集资讯、从设计平台下载参考图片时,大量重复操作浪费了很多时间。而网络爬虫能自动模拟浏览器行为,批量获取网页数据并整理存储,恰好能解决这个问题。本项目将围绕Python爬虫核心技术,从基础原理到实战操作,帮助大家掌握数据爬取的关键能力。
重难点重点:难点:理解爬虫工作原理及HTTP请求机制;掌握urllib、requests库的网页内容获取方法;学会用正则表达式、BeautifulSoup解析网页