基本信息
文件名称:《Python数据分析与可视化》课件 第9--13章 Python爬取网页数据---案例实战 销售业客户价值数据分析 .pptx
文件大小:14.84 MB
总页数:236 页
更新时间:2026-02-27
总字数:约9.12千字
文档摘要
第9章Python爬取网页数据
;本章内容;9.1相关HTTP协议知识;HTTP基本原理与机制;1.HTTP协议的基本概念;2.HTTP网络请求;Get请求例子;POST请求例子;3.HTTP响应消息;网络爬虫,也叫网络蜘蛛(WebSpider),如果把互联网比喻成一个蜘蛛网,Spider就是一只在网上爬来爬去的蜘蛛。是搜索引擎抓取系统的重要组成部分。爬虫的主要目的是将互联网的网页下载到本地形成一个互联网内容的镜像备份。
URL就是统一资源定位符(UniformResourceLocator),它的一般格式如下:
protocol://hostname[: