搜索技术

入门书籍:《这就是搜索引擎核心技术详解》

入门书籍:《这就是搜索引擎核心技术详解》

11个月前 (06-13) 421

正版图书购买:当当网 免费电子版:百度云 网盘 导读PPT:百度文库 相关书籍:《搜索引擎原理与实践》(豆瓣读书) 当前文章:Search » 入门书籍:《这就是搜索引擎核心技术详解》...

查询样例集合构建的重要原则之一:真实性

查询样例集合构建的重要原则之一:真实性

1年前 (2015-12-04) 358

真实性是指构建查询样例集合时需要采用真实的搜索引擎用户查询,即能反映普遍用户的真实信息需求(非出于某种目的专门设计的特定信息需求)的查询。采用真实的搜索引擎用户查询,对保证搜索引擎性能评价的结果与普通用户的真实使用感受吻合至关重要。若仅采用评测人员根...

百度全站https化,技术宅告诉你为什么搜索更安全了

百度全站https化,技术宅告诉你为什么搜索更安全了

1年前 (2015-11-20) 887

你发现了吗?百度已经实现全站https了! 百度从2014年开始对外开放https的访问,并于2015年3月初正式对全网用户进行https跳转。 你也许会说,切换就切换呗,和我有什么关系?https对于互联网安全的重要性,和空气对于人类的重要性一样。...

9个基于Java的搜索引擎框架

9个基于Java的搜索引擎框架

1年前 (2015-11-20) 554

在这个信息繁杂的互联网时代,我们已经学会了如何通过搜索引擎寻找目标信息,比如你可能会在百度上搜索圣诞节如何让女朋友开心。那么如何使用户在自己开发的网站系统中能搜索一些重要信息,并且以结构化的形式展现给用户,下面分享给大家的9个Java搜索引擎框架也许...

结果池过滤技术的核心假设

结果池过滤技术的核心假设

1年前 (2015-11-20) 376

只有出现在结果池中的文档,才可能成为查询样例的正确答案。通过此方式,结果池过滤技术将原本针对语料库全部文档进行的正确答案标注转变为针对结果池内文档的标注。待标注文档的规模不超过N*n个(其中,N为每个待评测系统返回的查询结果数,n为待评测系统的个数)...

信息检索系统性能评价的4个必要因素

信息检索系统性能评价的4个必要因素

1年前 (2015-11-20) 386

使用Cranfield体系对信息检索系统进行性能评价需要4个必要因素: 语料库集合 查询样例集合 正确答案集合 评价指标 其中,语料库集合是指与信息检索系统应用目标相一致的语料数据集合,是整理完善的语料内容。 当前文章:Search &raqu...

信息检索系统评价的3个环节

信息检索系统评价的3个环节

1年前 (2015-11-20) 311

Cranfield方法指出,信息检索系统的评价由3个环节组成。 1.确定查询样例集合:抽取最能表示用户信息需求的一部分查询样例构建一个规模恰当的集合; 2.标注标准答案集合:针对查询样例集合,在检索系统需要检索的语料库中寻找对应的答案; 3.将...

搜索引擎评价的两个角度

搜索引擎评价的两个角度

1年前 (2015-11-20) 393

搜索引擎评价可以从两个不同的角度展开。 搜索引擎是一类网络服务的供应商,通过对接受这种服务的用户使用服务体验的调查,可以获取到对不同搜索引擎的评价数据,这种评价方法被大量的互联网咨询公司和研究机构所采用,国内这方面比较著名的评价报告:CNNIC发布的...

如何在网站加入 Google 自订搜寻引擎,搜寻网站内的相关文章?

如何在网站加入 Google 自订搜寻引擎,搜寻网站内的相关文章?

1年前 (2015-11-15) 328

有在经营网站的朋友,通常都会在网页内建立一个搜寻引擎,让用户可以输入关键字就能快速找到站内相关文章,想要建立这个搜寻引擎,功力好的当然可以自己撰写出来,若是不想这么麻烦,建议你可以使用 Google 的自订搜寻引擎,只要填入相关要求的资讯,就能轻易建...

搜索引擎性能评价的意义

搜索引擎性能评价的意义

2年前 (2015-10-14) 368

在搜索引擎相关研究领域里,“评价”是性能改进乃至保证其顺利运营的至关重要的环节。 对互联网用户而言,性能评价意味着选择最有效的信息获取途径; 对广告商而言,性能评价协助其选择最有利的广告投放平台; 对研究人员而言,性能评价则是算法改进的指导和正常运营...