基本信息
文件名称:任务9数据采集和爬虫基础房屋信息抓取PART0543课件.pptx
文件大小:4.76 MB
总页数:12 页
更新时间:2025-10-24
总字数:约小于1千字
文档摘要

PART05

任务9数据采集和爬虫基础

-房屋信息抓取

知识点:爬虫简介和技术基础

1990年,蒙特利尔大学学生编写了Archie,是现代搜索引擎的鼻祖

1993年,受Archie影响,麻省理工学院的学生MatthewGray编写了世界上第一个网络爬虫“互联网漫游者”

现代搜索引擎的爬虫能够遍历链接的网页,甚至被删除的网页也可以通过“网页快照”的功能访问

爬虫简介

爬虫的发展史

在“互联网漫游者”基础上,一些编程者将传统的“蜘蛛”程序工作原理作了些改进,从跟踪一个网站的链接开始,就有可能检索整个互联网

爬虫简介

爬虫能做什么

爬虫技术基础

爬虫程序的基本原理

爬虫程序本质上是一个