开发人员都应该知道的开源搜索引擎

本文介绍10个开源搜索引擎,它们具有不同的特性,总之都很强大。对于支持开源的开发人员来说,可以了解一下。

1Constellio

Constellio 是一个开源的搜索解决方案,适合企业级的搜索。基于 Apache Solr 项目构建,使用 Lucene 做为搜索引擎,并提供基于 Web 的网页和文档的检索。可选择文档类型、文件夹以及文件名进行检索。

2、SearchBlox

SearchBlox 是一个企业搜索解决方案,基于 Lucene 构建。可进行快速发布、轻松管理以及支持云环境。这是与 Google Mini 最接近的一款搜索产品。

3、Apache Solr

Apache Solr 是一个开源的搜索服务器。Solr 使用 Java 语言开发,主要基于 HTTP 和 Apache Lucene 实现。Apache Solr 中存储的资源是以 Document 为对象进行存储的。每个文档由一系列的 Field 构成,每个 Field 表示资源的一个属性。Solr 中的每个 Document 需要有能唯一标识其自身的属性,默认情况下这个属性的名字是 id,在 Schema 配置文件中使用:
id进行描述。

Solr是一个高性能,采用Java5开发,基于Lucene的全文搜索服务器。文档通过Http利用XML加到一个搜索集合中。查询该集合也 是通过 http收到一个XML/JSON响应来实现。它的主要特性包括:高效、灵活的缓存功能,垂直搜索功能,高亮显示搜索结果,通过索引复制来提高可用性,提 供一套强大Data Schema来定义字段,类型和设置文本分析,提供基于Web的管理界面等。

 4、Sphinx

Sphinx是一个基于SQL的全文检索引擎,可以结合MySQL,PostgreSQL做全文搜索,它可以提供比数据库本身更专业的搜索功能,使得应用程序更容易实现专业化的全文检索。Sphinx特别为一些脚本语言设计搜索API接口,如PHP,Python,Perl,Ruby等,同时为MySQL也设计了一个存储引擎插件。

Sphinx 单一索引最大可包含1亿条记录,在1千万条记录情况下的查询速度为0.x秒(毫秒级)。Sphinx创建索引的速度为:创建100万条记录的索引只需 3~4分钟,创建1000万条记录的索引可以在50分钟内完成,而只包含最新10万条记录的增量索引,重建一次只需几十秒。

5、Google Search for WordPress

地址: http://wordpress.org/extend/plugins/google-search/

如果你想使用 Google search API 运行更快,这个WordPress插件提供了API的实现。

wordPress搜索插件还包括:Search APIRelevanssiSearch EverythingSearch Unleashed

6、其他开源搜索引擎

主页: http://www.dataparksearch.org/ – 是个高性能的开源基于web的搜索引擎,开源许可采用GNU。

URL: http://www.open-search-server.com/ – 文本搜索引擎,基于开源技术创建,OpenSearchServer是个高性能的软件,你可以嵌入到自己的应用中。

URL: http://openfts.sourceforge.net/ – OpenFTS 是个开源文本搜索引
擎,基于PostgreSQL,提供数据在线索引和数据库搜索的相关性排名。 关闭与数据库的集成允许使用元数据来限制搜索结果。

URL: http://www.elasticsearch.org/ – Elastic Search具有非常先进的分布式模型,通过本地JSON,拓展很多的高级搜索功能,所有都是通过JSON层显示。

原文:Paul Anthony

 

2 收藏 评论

相关文章

可能感兴趣的话题



直接登录
跳到底部
返回顶部