基本信息
文件名称:第五届全国搜索引擎和网上信息挖掘学术研讨会教学.ppt
文件大小:418.54 KB
总页数:13 页
更新时间:2025-11-16
总字数:约小于1千字
文档摘要

第五届全国搜索引擎和网上信息挖掘学术研讨会

SEWM2007中文web检索评测报告

江西师范大学

报告人:曹瑛

内容提纲

评测目标

系统设计

实验结果

未来工作

评测目标

主题提取(TD)

查找主题相关的关键资源的入口

导航搜索(HPNP)

HP查找指定名字的网站的首页

NP查找指定名字的页面

主题提取

TD任务分析

不能按照网页相似度大小来判断

站点是从一组相关网页的入口

网页深度一般不会大于4

导航搜索

导航搜索(HPNP)

主页查找

检索返回的相关网页可能只来