基本信息
文件名称:论简单检索与高级检索的检索方法.docx
文件大小:1.66 MB
总页数:6 页
更新时间:2025-06-07
总字数:约1.19千字
文档摘要

PAGE

PAGE1

现代信息检索教程结课作业

现代信息检索教程

结课作业

XX学院专业年级

姓名学号

现代信息检索教程

简单检索

简单检索,检索的可选项少或者没有,输入查询词,就能快速得到结果。但检索的准确性较差,精度较低,得到的结果也较多,但是胜在操作简单。简单检索的原理主要有一下几种:

布尔检索

利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。例如,输入“文献”AND“检索”,表示查找文献内容中既含有“文献”又含有“检索”词的文献。“文献”OR“检索”,表示查找文献内容中含有“文献”或含有“检索”以及两词都包含的文献。?“文献”NOT“检索”,表示查找文献内容中含有“文献”而不含有“检索”的那部分文献。?

截词检索

截词检索就是用截断的词的一个局部进行的检索,并认为凡满足这个词局部中的所有字符(串)的文献,都为命中的文献。按截断的位置来分,截词可有后截断、前截断、中截断三种类型:

(1)后截断,前方一致。如:comput表示computer,computers,computing等。

(2)前截断,后方一致。如:computer表示minicomputer,microcomputers等。

(3)中截断,中间一致。如comput表示minicomputer,microcomputers等。?

不同的系统所用的截词符也不同。分为有限截词(即一个截词符只代表一个字符)和无限截词(一个截词符可代表多个字符)。

三、原文检索

“原文”是指数据库中的原始记录,原文检索即以原始记录中的检索词与检索词间特定位置关系为对象的运算。原文检索可以说是一种不依赖叙词表而直接使用自由词的检索方法。

原文检索可以弥补布尔逻辑检索、截词方法检索的一些不足,但是,原文检索的能力是有限的。从逻辑形式上看,它仅是更高级的布尔系统,因此存在着布尔逻辑本身的缺陷。

检索结果如下:

结语:

相比简单检索,高级检索给出的结果数目更加的少,同时也更加精确。但是高级检索的操作也相对繁琐。在日常生活的应用中,想要搜索某一类文献时,如果只掌握有很少、很模糊的资料时,应该使用简单检索,这样可以得到的结果更多,不会错过有用的结果。而如果掌握有很详细的资料,那么久应该使用高级检索,这样得到的结果更加精确,也可以节省会多时间。

简单检索与高级检索互有优劣,而到底使用什么检索方式比较好还应该视具体情况而定。灵活的应用简单检索与高级检索才能事半功倍。