基本信息
文件名称:任务9数据采集和爬虫基础房屋信息抓取PART0543课件.pptx
文件大小:4.76 MB
总页数:12 页
更新时间:2025-10-24
总字数:约小于1千字
文档摘要
PART05
任务9数据采集和爬虫基础
-房屋信息抓取
知识点:爬虫简介和技术基础
1990年,蒙特利尔大学学生编写了Archie,是现代搜索引擎的鼻祖
1993年,受Archie影响,麻省理工学院的学生MatthewGray编写了世界上第一个网络爬虫“互联网漫游者”
现代搜索引擎的爬虫能够遍历链接的网页,甚至被删除的网页也可以通过“网页快照”的功能访问
爬虫简介
爬虫的发展史
在“互联网漫游者”基础上,一些编程者将传统的“蜘蛛”程序工作原理作了些改进,从跟踪一个网站的链接开始,就有可能检索整个互联网
爬虫简介
爬虫能做什么
爬虫技术基础
爬虫程序的基本原理
爬虫程序本质上是一个