欢迎光临
我们一直在努力

搜索技术

查询样例集合构建的重要原则之一:真实性

阅读(1299)评论(0)赞(0)

真实性是指构建查询样例集合时需要采用真实的搜索引擎用户查询,即能反映普遍用户的真实信息需求(非出于某种目的专门设计的特定信息需求)的查询。采用真实的搜索引擎用户查询,对保证搜索引擎性能评价的结果与普通用户的真实使用感受吻合至关重要。若仅采用...

9个基于Java的搜索引擎框架

阅读(2147)评论(0)赞(0)

在这个信息繁杂的互联网时代,我们已经学会了如何通过搜索引擎寻找目标信息,比如你可能会在百度上搜索圣诞节如何让女朋友开心。那么如何使用户在自己开发的网站系统中能搜索一些重要信息,并且以结构化的形式展现给用户,下面分享给大家的9个Java搜索引...

结果池过滤技术的核心假设

阅读(1172)评论(0)赞(0)

只有出现在结果池中的文档,才可能成为查询样例的正确答案。通过此方式,结果池过滤技术将原本针对语料库全部文档进行的正确答案标注转变为针对结果池内文档的标注。待标注文档的规模不超过N*n个(其中,N为每个待评测系统返回的查询结果数,n为待评测系...

信息检索系统性能评价的4个必要因素

阅读(1223)评论(0)赞(0)

使用Cranfield体系对信息检索系统进行性能评价需要4个必要因素: 语料库集合 查询样例集合 正确答案集合 评价指标 其中,语料库集合是指与信息检索系统应用目标相一致的语料数据集合,是整理完善的语料内容。

信息检索系统评价的3个环节

阅读(1184)评论(0)赞(0)

Cranfield方法指出,信息检索系统的评价由3个环节组成。 1.确定查询样例集合:抽取最能表示用户信息需求的一部分查询样例构建一个规模恰当的集合; 2.标注标准答案集合:针对查询样例集合,在检索系统需要检索的语料库中寻找对应的答案; 3...

搜索引擎评价的两个角度

阅读(1133)评论(0)赞(0)

搜索引擎评价可以从两个不同的角度展开。 搜索引擎是一类网络服务的供应商,通过对接受这种服务的用户使用服务体验的调查,可以获取到对不同搜索引擎的评价数据,这种评价方法被大量的互联网咨询公司和研究机构所采用,国内这方面比较著名的评价报告:CNN...

搜索引擎性能评价的意义

阅读(1168)评论(0)赞(0)

在搜索引擎相关研究领域里,“评价”是性能改进乃至保证其顺利运营的至关重要的环节。 对互联网用户而言,性能评价意味着选择最有效的信息获取途径; 对广告商而言,性能评价协助其选择最有利的广告投放平台; 对研究人员而言,性能评价则是算法改进的指导...