基本信息
文件名称:基于本体的DeepWeb关键技术研究:数据源分类与查询接口模式抽取.docx
文件大小:22.57 KB
总页数:16 页
更新时间:2025-12-23
总字数:约1.26万字
文档摘要
基于本体的DeepWeb关键技术研究:数据源分类与查询接口模式抽取
一、引言
1.1研究背景与意义
随着互联网的迅猛发展,网络信息量呈爆炸式增长。互联网按“深度”可分为DeepWeb和SurfaceWeb。与通过超链接访问的SurfaceWeb不同,DeepWeb中的信息只能通过向表单提交查询来获得。据统计,DeepWeb中包含的信息量已经达到互联网总数据量的90%以上,其蕴含的信息绝大多数是结构化信息,涵盖了如交通、商业、医学等众多领域的数据,对互联网资源的利用和发掘具有重要意义。
然而,DeepWeb特殊的数据存储方式和访问方式,使其数据集庞大且分散,搜索技术