基本信息
文件名称:第四章计算机信息检索.ppt
文件大小:108.28 MB
总页数:80 页
更新时间:2025-10-24
总字数:约9.97千字
文档摘要

3.搜索引擎使用技巧责任不在搜索引擎,而是没掌握搜索精度的技巧。如何提高信息检索效率呢?输入关键词大量信息(有用的和无用的)搜索引擎第30页,共80页,星期日,2025年,2月5日1、关键词提炼和细化搜索条件选择最具代表性和指示性关键词--搜索技巧之母有时多输入一两个关键词效果不同--基本技巧之一。使用双引号:实现精确查询,不包含演变形式2、用好搜索逻辑命令:使用布尔命令“AND”、“OR”、“NOT”、“near”及与之对应的“*”、“+”、“-”等逻辑符号命令。使用空格:等同于AND;查询两个以上关键词时,用空格表示结果中必须同时出现这几个关键词。用圆括号:当两个关键词用另外一种操作符连在一起,而你又想把它们列为一组时用第31页,共80页,星期日,2025年,2月5日computeradventuregame最基本的搜索方式。computer(OR)adventure(OR)games=computer+adventure+game

相当于布尔逻辑检索中的ANDcomputer(AND)adventure(AND)games=computer*adventure*gamecomputer(AND)game(NOT)adventure=computer+game-adventure

比较一下下面各搜索条件的含义第32页,共80页,星期日,2025年,2月5日4、精确匹配搜索:缩小搜索结果范围,甚至完成某些其他方式无法完成的任务。元词检索:使用通配符(*和?)区分大小写:5、特殊搜索命令:除一般搜索功能外,还提供一些特殊搜索命令,以满足高级用户的特殊需求。比如查询指向某网站的外部链接和某网站内所有相关网页的功能等等。6、附加搜索功能:搜索引擎都提供的一些方便用户搜索的定制功能。常见的有相关关键词搜索、限制地区搜索等。元词放关键词前面,表明搜索的具体特征。例输入“title:清华大学”,可以查到网页标题中带有清华大学的网页。关键词后加上“domain:org”,可查到所有以org为后缀的网站。image:检索图片,link:检索链接到某个选定网站的页面,URL:检索地址中带有某个关键词的网页。*表示匹配的数量不受限制;?表示匹配单个字符,主要用在英文搜索引擎中。例输入“computer*”,就可以找到“computer、computers、computerised、computerized”等单词,而输入“comp?ter”,则只能找到“computer、compater、competer”等单词。第33页,共80页,星期日,2025年,2月5日著名搜索引擎简介1.国外英文目录索引:Yahoo—最著名的目录索引,搜索引擎开山鼻祖之一。

D/ODP—由义务编辑维护的目录索引。

AskJeeves—著名的自然语言搜索引擎,2002年初收购Teoma全文搜索引擎。

LookSmart—点击付费索引目录,2002年收购WiseNut全文搜索引擎。

A—有其自身特色的目录索引。2.国外英文搜索引擎:(全文搜索引擎)Google—以搜索精度高、速度快成为最受欢迎的搜索引擎,是目前搜索界的领军人物。

Fast/AllTheWeb—总部位于挪威的搜索引擎后起之秀,风头直逼google。

AltaVista—曾经的搜索引擎巨人,目前仍被认为是最好的搜索引擎之一。第34页,共80页,星期日,2025年,2月5日Overture—最著名的搜索引擎广告商,竞价排名的始作俑者,也是全文搜索引擎。

Lycos—发源于西班牙的搜索引擎,网络遍布世界各地。

HotBot—隶属于LycosNetworks,搜索结果来自其他搜索引擎及目录索引。3.国内目录索引:搜狐(Sohu)—国内三大门户之一,最早在国内推出搜索引擎收费登录服务。

新浪(Sina)—最大的中文门户网站,同样也推出了搜索引擎收费索引项目。

网易(Netease)—网易搜索是ODP的国内翻版,其目录由志愿管理员维护,是google的网页搜索用户。4.国内全文搜索引擎:百度(Baidu)—国内唯一商业化的全文搜索引擎,提供搜狐、新浪、263、Tom等站点的网页搜索服务。第35页,共80页,星期日,2025年,2月5日计算机信息检索策略构造步骤:(例如:废水处理装置与技术)1.分析信息需求(检索课题),明确检索要求2.选择检索系统