个人简介

Echo Blog


江湖无名 安心练剑
  • Lucene Tutorial-03-Lucene 搜索引擎入门教程第一个应用
    Lucene 框架编程 简介 本章节将学习如何使用 Lucene 框架进行实际编程。在您开始编写第一个使用 Lucene 框架的示例之前,请确保您已按照 Lucene - 环境设置教程中所述正确设置了 Lucene 环境。 建议您具备 Eclipse IDE 的工作知识。 编写简单的搜索应用程序 让我们通过编写一个简单的搜索应用程序来开始。该应用程序将打印找到的搜索结果数量,并显示...
    2022-01-29 13:01:55 | Lucene
  • Lucene Tutorial-02-Lucene 搜索引擎入门教程环境搭建 env setup
    Spring框架开发环境准备指南 步骤 1 - Java开发工具包(JDK)设置 下载并安装JDK 您可以从Oracle的Java网站下载最新版本的SDK:Java SE Downloads。按照下载文件中的说明进行安装,然后设置PATH和JAVA_HOME环境变量,以指向包含Java和javac的目录,通常分别为java_install_dir/bin和java_install_dir...
    2022-01-29 13:01:55 | Lucene
  • Lucene Tutorial-01-Lucene 搜索引擎入门教程 overview 概览
    Lucene 搜索引擎入门教程 简介 Lucene 是一个开源的基于 Java 的搜索库。 它非常受欢迎,是一个快速的搜索库。 在 Java 应用程序中,它被用于以一种非常简单和高效的方式为任何类型的应用程序添加文档搜索功能。 本教程将帮助您深入了解 Lucene 的概念,并帮助您理解企业级应用程序中搜索需求的复杂性以及 Lucene 搜索引擎的必要性。 受众 本教程适用于愿意...
    2022-01-29 13:01:55 | Lucene
  • Lucene code-04-Lucene 的索引文件格式其他内容
    4.3.1. 标准化因子文件(nrm) 为什么会有标准化因子呢? 从第一章中的描述,我们知道,在搜索过程中,搜索出的文档要按与查询语句的相关性排序,相关性大的打分(score)高,从而排在前面。 相关性打分(score)使用向量空间模型(Vector Space Model),在计算相关性之前,要计算 Term Weight,也即某 Term 相对于某 Document 的重要性。 ...
    2022-01-29 13:01:55 | Lucene
  • Lucene code-03-Lucene 的索引文件格式反向内容
    反向信息 反向信息是索引文件的核心,也即反向索引。 反向索引包括两部分,左面是词典(Term Dictionary),右面是倒排表(Posting List)。 在 Lucene 中,这两部分是分文件存储的,词典是存储在 tii,tis 中的,倒排表又包括两部分,一部分是文档号及词频,保存在 frq 中,一部分是词的位置信息,保存在 prx 中。 Term Dicti...
    2022-01-29 13:01:55 | Lucene
  • Lucene code-02-Lucene 的索引文件格式具体正向内容
    具体格式 上面曾经交代过,Lucene 保存了从 Index 到 Segment 到 Document 到 Field 一直到 Term 的正向信息,也包括了从 Term 到 Document 映射的反向信息,还有其他一些 Lucene 特有的信息。 下面对这三种信息一一介绍。 4.1. 正向信息 Index –> Segments (segments.gen, segment...
    2022-01-29 13:01:55 | Lucene
  • Lucene code-01-Lucene 的索引文件格式
    Lucene 的索引文件格式 Lucene 的索引里面存了些什么,如何存放的,也即 Lucene 的索引文件格式,是读懂 Lucene源代码的一把钥匙。 当我们真正进入到 Lucene 源代码之中的时候,我们会发现: (1)Lucene 的索引过程,就是按照全文检索的基本过程,将倒排表写成此文件格式的过程。 (2)Lucene 的搜索过程,就是按照此文件格式将索引进去的信息读出来,然...
    2022-01-29 13:01:55 | Lucene
  • Lucene in action-10-index format 文件索引格式
    Lucene 的索引 到目前为止,我们一直把 Lucene 的索引或多或少地当作一个黑盒来对待,并且把注意力放在它的逻辑视图上。虽然如果只是为了使用 Lucene, 可能没有必要去深入理解索引结构的细节,但是你可能对 Lucene 索引的“魔力”非常好奇。 Lucene 的索引结构是对它本身高效数据结构、性能最大化和资源使用最小化之间巧妙安排(arrangement) 的一个个案研究。 ...
    2022-01-10 13:01:55 | Lucene