Apache Lucene™
Apache Lucene™ 是一个完全用 Java 编写的高性能、功能齐全的搜索引擎库。
这项技术几乎适用于任何需要结构化搜索、全文搜索、分面、跨高维向量的最近邻搜索、拼写纠正或查询建议的应用程序。
Apache Lucene 是一个开源项目,可免费下载。
请使用右侧的链接访问 Lucene。
Lucene™ 功能
Lucene 通过一个简单的 API 提供了强大的功能:
可扩展的高性能索引(Scalable, High-Performance Indexing)
在现代硬件上超过 800GB/小时
小 RAM 要求——只有 1MB 堆
增量索引与批量索引一样快
索引大小大约为索引文本大小的 20-30%
强大、准确、高效的搜索算法
排名搜索——最好的结果首先返回
许多强大的查询类型:短语查询、通配符查询、邻近查询、范围查询等
字段搜索(例如标题、作者、内容)
高维向量的最近邻搜索
按任何字段排序
合并结果的多索引搜索
允许同时更新和搜索
灵活的刻面、突出显示、连接和结果分组
快速、节省内存和容错的建议器
可插拔排名模型,包括向量空间模型和 Okapi BM25
可配置的存储引擎(编解码器)
跨平台解决方案
可作为 Apache 许可证下的开源软件,它允许您在商业和开源程序中使用 Lucene
100% 纯 Java
其他可用的与索引兼容的编程语言的实现
书籍
《lucene in action》