2016 - 2024

感恩一路有你

最早的搜索引擎都有哪几个 列举两种常见的搜索引擎方法?

浏览量:2523 时间:2023-07-09 06:55:58 作者:采采

列举两种常见的搜索引擎方法?

搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合搜索引擎、门户搜索引擎和免费链接列表。

这里主要介绍全文索引和目录索引。

第一,全文索引:

首先是数据库中数据的收集。搜索引擎的自动信息收集功能有两种。一种是定时搜索,即每隔一段时间(比如Googl

全文搜索引擎有那些?

全文搜索引擎包括:

1.全文搜索引擎

Lucene 的开发语言是Java,也是Java家族中最著名的开源搜索引擎。它已经是Java世界中的一个标准全文搜索程序,并且它提供了一个完整的。查询引擎和索引引擎,没有中文分词引擎,需要自己实现,所以需要用lucene构建一个搜索引擎。此外,它不支持实时搜索,但linkedin和twitter分别在Lucene上改进了实时搜索。其中Lucene有一个C移植版本叫Lucene,理论上比Lucene快,因为是用C写的.

官方主页:

CLucene官方主页:

2.狮身人面像

Sphinx是用C语言编写的开源搜索引擎,也是目前主流的搜索引擎之一。在索引事件上比lucene快50%,但是索引文件比Lucene大一倍,所以Sphinx在索引上是用空间换事件的策略,在检索速度上和Lucene相差不大,但是在检索准确率上Lucene比Sphinx好。另外,Lucene在中文分词引擎的加入难度上优于Sphinx,其中Sphinx支持实时搜索,使用起来相对简单方便。

官方主页:

3.夏皮安

Xapian是一个用c编写的全文检索程序,它的api和检索原理在很多方面与lucene相似,填补了c中的一个空缺.

官方主页:

4.上下真空滤器

Nutch是一个用java实现的开源web搜索引擎,包括爬虫、索引引擎和查询引擎,其中Nutch基于Lucene,Lucene为Nutch提供了一个用于文本索引和搜索的API。

你是否应该使用Lucene或Nutch应该是,如果你不 不需要抓取数据,你应该使用Lucene。最常见的应用是您有数据源,需要为这些数据提供一个搜索页面。在这种情况下,最好的方法是直接从数据库中获取数据,并用Lucene API构建一个索引。

官方主页:

5.数据公园搜索

DataparkSearch是一个用C语言实现的开源搜索引擎,其中网页排序基于神经网络模型,支持下载HTTP、HTTPS、FTP、NNTP等网页,包括索引引擎、搜索引擎和中文分词引擎(这是唯一一个带有中文分词引擎的开源搜索引擎)。它可以单独定制搜索结果,并有完整的日志记录。

官方主页:

6.泽泰尔

Zettair是一个基于Justin Zobel 的研究成果。它是用C语言实现的。Justin Zobel在全文检索领域非常有名,是业界第一。一个系统地提出倒排索引差分压缩算法的人,倒排表的压缩极大地提高了检索和加载的性能,同时将空间膨胀率降低到了一个非常好的水平。因为Zettair起源于学术界,代码由RMIT大学的搜索引擎组织编写,所以它的代码简洁高效,是学习倒排索引经典算法的一个非常好的例子。支持linux、windows、mac os等系统。

官方主页:

7.因德里

Indri是一个用C语言和C语言编写的全文检索引擎系统。它是由麻省大学和卡内基梅隆大学联合推出的开源项目。它的特点是跨平台和API接口支持Java,PHP和c。

官方主页:

8.一种活泼的小狗

Terrier是由格拉斯哥大学计算科学学院用java开发的全文检索系统。

官方主页:

9.加拉戈

Galago是一个用java语言编写的关于文本搜索的工具集。它包括索引引擎和查询引擎,还包括一个叫做TupleFlow的分布式计算框架(类似于google 的MapReduce)。这个检索系统支持多种Indri查询语言。

官方主页:

10.斑马

Zebra是用C语言实现的检索程序,其特点是支持大数据、EMAIL、XML、MARC等格式。

官方主页:

11.索尔

Solr是一个用java开发的独立的企业级搜索应用服务器,它提供了一个类似于Web-service的API接口。它是基于Lucene的全文检索服务器,也是Lucene的变种。很多一线互联网公司都在用Solr,这也是一个成熟的解决方案。

官方主页:

12.弹性搜索

Elasticsearch是一个开源的分布式搜索引擎,用java语言开发,基于Lucene构建。它是为云计算设计的,可以实现实时搜索、稳定可靠。Elasticsearch的数据模型是JSON。

官方主页:

13.呼

Whoosh是一个用纯python编写的开源搜索引擎。

官方主页:

搜索 引擎 官方主页 Lucene 全文检索

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。