基本信息
文件名称:数据采集技术 课件 任务 1.1 初识网络爬虫.pptx
文件大小:3.24 MB
总页数:16 页
更新时间:2026-03-21
总字数:约1.95千字
文档摘要
初识网络爬虫
——数据采集技术
网络爬虫是什么
01
02
03
04
知识点
网络爬虫的作用
网络爬虫的分类
网络爬虫的应用场景
网络爬虫是什么
01
网络爬虫是什么
网络爬虫(WebCrawler),常被形象地称作“网页蜘蛛”“网络机器人”等,简称“爬虫”,它本质上是一种遵循特定规则,能够自动在万维网中爬取信息的程序或脚本。在广袤无垠的互联网世界里,众多网页如同一张错综复杂且规模庞大的蜘蛛网,而网络爬虫恰似一只敏捷且不知疲倦的“蜘蛛”,沿着网页之间错综复杂的链接,有条不紊地从一个网页迁移至另一个网页。
网络爬虫是什么
种子URL
待抓取的UR