简介
源码下载地址:源码
Lucene
Lucene 是开源世界中的一颗宝石——一个高度可扩展的快速搜索引擎。
它提供了性能并且非常易于使用。
Lucene in Action 是 Lucene 的权威指南。
它描述了如何索引您的数据,包括您肯定需要知道的类型,例如 MS Word、PDF、HTML 和 XML。
它向您介绍搜索、排序、过滤和突出显示搜索结果。
关于技术
Lucene 在令人惊讶的地方支持搜索——财富 100 强公司的讨论组、商业问题跟踪器、微软的电子邮件搜索、Nutch 网络搜索引擎(可扩展至数十亿页)。
它被多种公司使用,包括 Akamai、Overture、Technorati、HotJobs、Epiphany、FedEx、Mayo Clinic、MIT、New Scientist Magazine 等。
关于这本书
将搜索添加到您的应用程序很容易。
通过许多可重用的示例和关于最佳实践的良好建议,Lucene in Action 向您展示了如何操作。
如果您想在 Web 上通过 Lucene in Action 进行搜索,您可以使用 Lucene 本身作为搜索引擎来实现 - 看看作者很棒的 Search Inside 解决方案。
它的结果页面类似于谷歌的结果页面,并为整个书籍和书籍博客提供了一个新颖而熟悉的界面。
里面有什么
-
如何将 Lucene 集成到您的应用程序中
-
用于丰富文档处理的即用型框架
-
案例研究包括 Nutch、TheServerSide、jGuru 等。
-
Lucene 移植到 Perl、Python、C#/.Net 和 C++
-
排序、过滤、术语向量、多重和远程索引搜索
-
新的 SpanQuery 系列,扩展查询解析器,命中收集
-
性能测试和调优
-
Lucene 附加组件(点击突出显示、同义词查找等)
-
Lucene 的发明者 Doug Cutting 的前言
关于作者
作为 Ant、Lucene 和 Tapestry 开源项目的提交者,Erik Hatcher 是 Manning 屡获殊荣的 Java Development with Ant 的合著者。
Otis Gospodnetic 是 Lucene 提交者、Apache Jakarta 项目管理委员会的成员以及 jGuru 的 Lucene FAQ 的维护者。
两位作者都发表了许多技术文章,其中包括几篇关于 Lucene 的文章。
参考资料
《Lucene in Action II》