基本信息
文件名称:义务教育版(2024)七年级全一册信息科技 第14课 互联网搜索新发展 课件.pptx
文件大小:1.98 MB
总页数:31 页
更新时间:2025-06-13
总字数:约2.23千字
文档摘要

(义务教育版)七年级

全一册

第14课

互联网搜索新发展

单元主题

单元名称

课名称

核心内容

第三单元

便捷的互联网服务

第11课互联网服务应用广

互联网服务的特点和应用现状、万维网的特点

第12课万维网服务大揭秘

万维网的结构特征和工作模式

第13课万维网安全新协议

HTTP和下层协议的关系、HTTPS的优势

第14课互联网搜索新发展

网络搜索的基本过程、技术创新与搜索服务新发展

第15课互联网实验齐发现

网络指令实验、数据包分析实验

学习目标

了解搜索引擎的工作原理。

知道搜索引擎的简单工作过程。

了解网络爬虫等自动化技术给搜索带来的影响。

了解网络搜索的技术创新。

激趣导入

【问题情境】

学校读书节活动正在如火如荼地开展着,有些同学想通过网络了解更多图书的信息,有些同学想查找资料制作读书海报。如何在网络中简单、高效地寻找想要的信息呢?

激趣导入

【建构】

准备读书节线上活动需要收集资料,但是自行在庞大的网络世界中获取信息,无异于大海捞针。网络中有很多专门提供信息搜索服务的网站,它们被称为搜索引擎。

学习活动

一、搜索引擎的工作思路

二、搜索系统的创新改进

三、实践探究

学习活动

学习活动

一、搜索引擎的工作思路

【思考-讨论】

想象一下,互联网上有难以计数的网站,搜索引擎需要从这些网站中寻找与关键词相匹配的网页,然后返回搜索结果,应该需要花费很长时间。但实际上,在搜索引擎中输入问题或关键词后,很快就能看到结果,为什么能搜得这么快?

学习活动

一、搜索引擎的工作思路

实验目的:熟悉搜索引擎的工作过程

实验条件:《简易搜索系统》软件、配套资源中的Web文件夹

实验步骤:

1.运行《简易搜索系统》软件,启动搜索服务,然后尝试用关键词“中国探月”进行搜索,查看搜索结果。

□搜到相关信息□未搜到相关信息

学习活动

一、搜索引擎的工作思路

实验步骤:

2.把老师提供的Web文件夹复制到搜索服务软件所在的文件夹中。

3.重新运行搜索服务软件后,再次以“中国探月”为关键词进行搜索。

学习活动

一、搜索引擎的工作思路

实验步骤:

4.浏览一些网页,并把网页保存到Web文件夹中。

学习活动

一、搜索引擎的工作思路

实验步骤:

5.打开Web文件夹中的pages.csv,记录网页文件的文件名和对应的网址。

学习活动

一、搜索引擎的工作思路

实验步骤:

6.继续进行搜索,看看能否搜到刚刚保存的内容。

学习活动

一、搜索引擎的工作思路

实验结论:

1.搜索引擎搜到的信息是(□搜索前放进去的□实时在网络中获取的)。

2.网页数据都保存在: 。

3.网页文件跟实际网址的关系保存在: 。

4.当前网页排序用的算法是: 。

学习活动

一、搜索引擎的工作思路

梳理搜索系统的结构组成,把下图补充完整。

学习活动

一、搜索引擎的工作思路

梳理搜索系统的结构组成,把下图补充完整。

学习活动

一、搜索引擎的工作思路

【知识链接】

为了快速反馈搜索结果,搜索引擎通常会提前把海量的网络信息保存起来,然后等待查询。

学习活动

学习活动

二、搜索系统的创新改进

【思考-讨论】

通过人工操作来扩充搜索系统中的网页数据比较烦琐,有没有办法更高效地完成相关操作呢?

学习活动

二、搜索系统的创新改进

如果让计算机替代人工操作,会极大提升工作效率。例如,用网络爬虫自动获取相关网页以备查询。

网络爬虫就像个按规则在互联网“蜘蛛网”上自动“抄作业”的小机器人,它能沿着网页链接“爬”遍不同页面,快速收集文字、数据等信息并整理存储,像搜索引擎靠它秒出搜索结果,也能帮人高效整理作业情况、统计数据等,但不能抓取隐私信息,还得遵守网站“禁止爬虫”的规则,是个替人做重复信息收集的“技术搬运工”。

学习活动

二、搜索系统的创新改进

1.运行《网络爬虫测试》软件,输入一个网址后,单击窗口中的按钮,看看能否自动获取相应的网页。

学习活动

二、搜索系统的创新改进

2.把spider.pyc文件复制到搜索系统文件夹中,然后重新运行《简易搜索系统》软件,观察界面的变化。

学习活动

二、搜索系统的创新改进

3.输入一个网址,然后单击“启动网络爬虫”按钮。

学习活动

二、搜索系统的创新改进

4.有同学绘制了下图来展示当前的系统特征,对此,你怎么看?

学习活动

学习活动

三、实践探究

【进一步创新改进搜索系统】

1.运行《分词测试》软件,输入一个短语进行分词,感受分词的效果。

学习活动

三、实践探究

【进一步创新改进搜索系统】

2.把tokenizer.pyc文件复制到搜索系统文件夹中,运行《简易搜索系统》软件,看看搜索结果的变化。

学习活动

【思考-讨论】

搜索结果是根据关键词出现的次数进行排序