课题
互联网搜索新发展
单元
第三单元
学科
信息科技
年级
七年级
单元主题
【学情分析】
建设网络强国,要有自主可控的核心技术,也要有丰富全面的信息服务、繁荣发展的网络文化。互联网为信息社会提供了文件传送、电子邮件、万维网等多种典型服务,深刻影响着社会的方方面面。
本单元将概要介绍互联网典型服务,以当前应用最广泛的万维网为抓手,梳理它的结构特征和应用特点,探寻网路搜索的工作过程,剖析网络协议对网络安全的影响。最后,通过网络实验活动,对之前所学进行归纳梳理。
【内容结构】
学习
目标
1.信息意识:主动学习互联网知识,增强数据安全意识,进行安全防护。
2.计算思维:知道网络中信息编码、传输和呈现的原理。能通过多种手段采集、分析和呈现数据。
3.数字化学习与创新:根据学习需要,有效搜索所需学习资源,探究信息科技支持学习的新方法、新模式,借助信息科技提高学习质量。
4.信息社会责任:在互联网应用中,知道数据安全防护的常用方法和策略,保护个人隐私,尊重他人隐私。
重点
网络搜索的基本过程;搜索引擎的工作原理和工作过程;搜索系统的创新改进。
难点
搜索引擎的工作原理。
教学过程
教学环节
教师活动
学生活动
设计意图
激趣导入
【问题情境】
学校读书节活动正在如火如荼地开展着,有些同学想通过网络了解更多图书的信息,有些同学想查找资料制作读书海报。如何在网络中简单、高效地寻找想要的信息呢?
【引导分析+建构】
准备读书节线上活动需要收集资料,但是自行在庞大的网络世界中获取信息,无异于大海捞针。网络中有很多专门提供信息搜索服务的网站,它们被称为搜索引擎。
注意、思考、讨论
吸引学生的注意力,启发学生思考。
学习活动
【学习活动】一、搜索引擎的工作思路
【思考-讨论】
想象一下,互联网上有难以计数的网站,搜索引擎需要从这些网站中寻找与关键词相匹配的网页,然后返回搜索结果,应该需要花费很长时间。但实际上,在搜索引擎中输入问题或关键词后,很快就能看到结果,为什么能搜得这么快?
【学习探究】
实验目的:熟悉搜索引擎的工作过程
实验条件:《简易搜索系统》软件、配套资源中的Web文件夹
实验步骤:
1.运行《简易搜索系统》软件,启动搜索服务,然后尝试用关键词“中国探月”进行搜索,查看搜索结果。
□搜到相关信息□未搜到相关信息
2.把老师提供的Web文件夹复制到搜索服务软件所在的文件夹中。
3.重新运行搜索服务软件后,再次以“中国探月”为关键词进行搜索。
4.浏览一些网页,并把网页保存到Web文件夹中。
5.打开Web文件夹中的pages.csv,记录网页文件的文件名和对应的网址。
6.继续进行搜索,看看能否搜到刚刚保存的内容。
实验结论:
1.搜索引擎搜到的信息是(□搜索前放进去的□实时在网络中获取的)。
2.网页数据都保存在: 。
3.网页文件跟实际网址的关系保存在: 。
4.当前网页排序用的算法是: 。
【小试牛刀】
梳理搜索系统的结构组成,把下图补充完整。
【知识链接】
为了快速反馈搜索结果,搜索引擎通常会提前把海量的网络信息保存起来,然后等待查询。
这是“以空间换时间”思维的具体体现。搜索引擎提前把海量信息保存下来,耗费了大量的存储空间,换来了对查询需求的快速响应。
【学习活动】二、搜索系统的创新改进
【思考-讨论】
通过人工操作来扩充搜索系统中的网页数据比较烦琐,有没有办法更高效地完成相关操作呢?
【引导分析】
如果让计算机替代人工操作,会极大提升工作效率。例如,用网络爬虫自动获取相关网页以备查询。
【知识拓展】
网络爬虫就像个按规则在互联网“蜘蛛网”上自动“抄作业”的小机器人,它能沿着网页链接“爬”遍不同页面,快速收集文字、数据等信息并整理存储,像搜索引擎靠它秒出搜索结果,也能帮人高效整理作业情况、统计数据等,但不能抓取隐私信息,还得遵守网站“禁止爬虫”的规则,是个替人做重复信息收集的“技术搬运工”。
【学习探究】
1.运行《网络爬虫测试》软件,输入一个网址后,单击窗口中的按钮,看看能否自动获取相应的网页。
2.把spider.pyc文件复制到搜索系统文件夹中,然后重新运行《简易搜索系统》软件,观察界面的变化。
覆盖之前的spider.pyc文件即可。覆盖后重新运行会发现,界面中多了与网络爬虫相关的组件。
3.输入一个网址,然后单击“启动网络爬虫”按钮。
输入要自动获取的网址后单击“启动网络爬虫”按钮,软件除了自动获取网址对应的网页,还会尝试依据该网页含有的超链接,再获取几个网页,并自动维护pages.csv文件。
4.有同学绘制了下图来展示当前的系统特征,对此,你怎么看?
【引导分析】
用自动化工具代替人工完成了烦琐的操作,提高