搜索引擎

Web search.jpg
本条目属于网路搜寻引擎系列
网路搜寻引擎
元搜寻引擎
国际性搜寻引擎(多语言)
Google
Yahoo! Search
Bing
仅中文搜寻引擎
百度
360搜索
搜狗
yam蕃薯藤
PChome Online
中国搜索
其他搜寻引擎
DuckDuckGo
Exalead
Naver
Yandex
Alexa Internet
AOL
Ask.com
Qwant
其他连结

搜寻引擎(英语:search engine)是一种资讯检索系统,旨在协助搜寻储存在电脑系统中的资讯。搜寻结果一般被称为「hits」,通常会以表单的形式列出。网路搜寻引擎是最常见、公开的一种搜寻引擎,其功能为搜寻全球资讯网上储存的资讯。

工作方式

搜寻引擎为一组专案提供了一个介面,使使用者能够指定关于感兴趣的专案的标准,并让引擎找到匹配的专案,这些标准称为搜寻查询。在文字搜寻引擎的情况下,搜寻查询通常表示为辨识一个或多个文件可能包含的期望概念的一组单词。[1]有多种样式的搜寻查询语法在严格性上有差异。它也可以在以前的站点中搜寻搜寻引擎中的名称。而一些文字搜寻引擎要求使用者输入由白色空格分隔的两个或三个字,其他搜寻引擎可以使使用者能够指定整个文件,图片,声音和各种形式的自然语言。一些搜寻引擎对搜寻查询进行改进,以增加通过称为查询扩充的过程提供品质集合的可能性。查询理解方法可用于标准化查询语言。

基于索引的搜寻引擎符合查询指定条件的专案列表通常会排序或排名。按相关性排列专案(从最高到最低)减少寻找所需资讯所需的时间。概率搜寻引擎根据相似性度量(每个专案和查询之间,通常以1到0,1的比例最相似)和有时受欢迎程度或权限或使用相关性回馈来评估专案。布林搜寻引擎通常只返回匹配的专案,而不考虑排列顺序,为了提供根据一些标准快速排序的一组匹配专案,搜寻引擎通常将通过称为索引的过程来收集关于所考虑的一组专案的元资料。索引通常需要较少量的电脑储存,这就是为什么一些搜寻引擎仅储存索引的资讯而不是每个专案的完整内容,而是提供导航到搜寻引擎结果页面中的专案的方法。或者,搜寻引擎可以将每个专案的副本储存在高速缓冲记忆体中,使得使用者可以在索引时或为了归档目的看到该专案的状态,或者使得重复的行程更有效和更快地工作。其他类型的搜寻引擎不储存索引。抓取器或蜘蛛型搜寻引擎(也称为即时搜寻引擎)可以在搜寻查询时收集和评估专案,基于起始专案的内容(称为种子或种子URL)动态考虑附加专案网际网路爬虫的情况)。元搜寻引擎既不储存索引也不储存快取,而只是重新使用一个或多个其他搜寻引擎的索引或结果来提供聚合的最终结果集。

类型

按来源

按内容类型

  • 音讯搜寻引擎(Audio search engine)
  • 全文检索(Full text search)
  • 图像搜寻(Image search)
  • 影片搜寻引擎(Video search engine)

按介面

  • 增量搜寻(Incremental search)
  • 即时回答(Instant answer)
  • 语意检索(Semantic search)
  • 基于选择的搜寻(Selection-based search)
  • 语音搜寻(Voice Search)

按主题

  • 书目资料库(Bibliographic database)
  • 企业搜寻(Enterprise search)
  • 医学文献检索(Medical literature retrieval)
  • 垂直搜寻(Vertical search)

另见

参考文献

  1. ^ Voorhees, E.M. Natural Language Processing and Information Retrieval. National Institute of Standards and Technology. March 2000.