基本信息
文件名称:大数据采集技术与应用课件:理解网络爬虫.pptx
文件大小:2.62 MB
总页数:27 页
更新时间:2026-01-16
总字数:约小于1千字
文档摘要
;;任务引入1;;教学内容;爬虫的定义;爬虫:一种按照用户条件,并根据一定的规则,自动获取网络上的数据的程序。;爬虫的分类;爬虫的分类;;爬虫的工作原理;(一)通用网络爬虫;(二)聚焦网络爬虫;爬虫的搜索策略;(一)广度优先搜索;(二)最佳优先搜索;(三)深度优先搜索;反爬虫;随着网络不断增长,网络用户也呈现几何增长。随之而来的数据安全事件不断发生。例如诈骗电话、电信诈骗等。;保护数据,维护数据安全,保护个人与集体的利益。;(三)反爬虫的策略;(三)反爬虫的策略;(三)反爬虫的策略;(三)反爬虫的策略;本任务学习了爬虫的基本概念、原理和搜索策略。
包括如下内容:
1.爬虫基本概念。
2.爬