基本信息
文件名称:复盘1-搜索核心技术模块【萌萌家】.pdf
文件大小:1.69 MB
总页数:22 页
更新时间:2025-03-15
总字数:约1.15千字
文档摘要

复盘1|搜索核心技术模块

2018-02-25洪亮劼来自北京

《AI技术内参》

到目前为止,我们讲完了人工智能核心技术的第一个模块——搜索。我们从搜索的核心算法入

手,进而讨论了搜索的两个关键组件,分别是查询关键字理解和文档理解,并落实到对搜索系

统的评价,然后从宏观视角介绍了搜索框架的历史和发展,最后又从深度学习技术在搜索领域

的应用角度,对分享做了一个延伸。

整个模块共27期,9大主题,希望通过这些内容,能让你对搜索技术有一个系统的认识和理

解,为自己进一步学习和提升打下基础。今天我们就来对这一模块的内容做一个复盘。

提示:点击知识卡跳转到你最想看的那篇文章,温故而知新。如不能正常跳转,请先将App

更新到最新版本。

1.现代搜索架构剖析

从20世纪50年代有信息检索系统开始,搜索系统大致经历了三个发展阶段。从最开始的

“基于文本匹配的信息检索系统”到“基于机器学习的信息检索系统”,再到近几年受深度学

习影响的“更加智能的搜索系统”。

2.经典搜索核心算法

3.基于机器学习的排序算法

问题设置:把一个排序问题转换成一个机器学习的问题设置,特别是监督学习的设置。

4.基于机器学习的高级排序算法

5.查询关键字理解

6.文档理解

7.经典图算法

8.基于深度学习的搜索算法

9.搜索系统的评价

IfYouCan’tMeasureIt,YouCan’tImproveIt.

积跬步以至千里

最后,恭喜你在这个模块中已经阅读了70047字,听了220分钟的音频,这是一个不小的成

就。在人工智能领域的千里之行,我们已经迈出了扎实的第一步。

感谢你在专栏里的每一个留言,给了我很多思考和启发。期待能够听到你更多的声音,我们一

起交流讨论。

?版权归极客邦科技所有,未经许可不得传播售卖。页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。

精选留言(2)

学无止境

2018-03-08

请问视频垂直领域中文查询关键字解析通常怎么做?

1

白杨

2018-05-17

文档优先的策略,我想到一个场景是,时间优先的新闻文档。

有一个实际的问题是,现在的开源搜索引擎比如sphinx或lucene底层好像没有开放这样的接口

出来,也可能是开放了我没查到,老师能解答一下吗?

