Apache Lucene™

Apache Lucene™ 是一个完全用 Java 编写的高性能、功能齐全的搜索引擎库。

这项技术几乎适用于任何需要结构化搜索、全文搜索、分面、跨高维向量的最近邻搜索、拼写纠正或查询建议的应用程序。

Apache Lucene 是一个开源项目,可免费下载。

请使用右侧的链接访问 Lucene。

Lucene™ 功能

Lucene 通过一个简单的 API 提供了强大的功能:

可扩展的高性能索引(Scalable, High-Performance Indexing)

在现代硬件上超过 800GB/小时

小 RAM 要求——只有 1MB 堆

增量索引与批量索引一样快

索引大小大约为索引文本大小的 20-30%

强大、准确、高效的搜索算法

排名搜索——最好的结果首先返回

许多强大的查询类型:短语查询、通配符查询、邻近查询、范围查询等

字段搜索(例如标题、作者、内容)

高维向量的最近邻搜索

按任何字段排序

合并结果的多索引搜索

允许同时更新和搜索

灵活的刻面、突出显示、连接和结果分组

快速、节省内存和容错的建议器

可插拔排名模型,包括向量空间模型和 Okapi BM25

可配置的存储引擎(编解码器)

跨平台解决方案

可作为 Apache 许可证下的开源软件,它允许您在商业和开源程序中使用 Lucene

100% 纯 Java

其他可用的与索引兼容的编程语言的实现

书籍

《lucene in action》

博客

Lucene 专栏

文件格式

参考资料

v9.0.0

v7.2.1