基本信息
文件名称:金融大数据处理 课件 项目二 金融数据采集和清洗 2.pptx
文件大小:1.6 MB
总页数:7 页
更新时间:2025-10-23
总字数:约小于1千字
文档摘要

金融大数据处理

项目二金融数据采集和清洗任务2.2自动采集数据

任务2.2自动采集数据网络爬虫的概念01网络爬虫的抓取策略0203网络爬虫常用工具

任务2.2自动采集数据一、网络爬虫的概念1.网络爬虫的定义网络爬虫是一个自动提取网页的程序,它为搜索引擎从互联网上下载网页,是搜索引擎的重要组成。爬虫的主要目的是将互联网上的网页下载到本地形成一个互联网内容的镜像备份。

任务2.2自动采集数据二、网络爬虫的抓取策略抓取策略深度优先遍历策略宽度优先遍历策略大站爬行策略

任务2.2自动采集数据三、网络爬虫常用工具网络爬虫是一种自动化浏览网页的程序,即WebSpide