索引过程是Lucene提供的核心功能之一.下图说明了索引过程和类的使用. IndexWriter 是索引过程中最重要和最核心的组件.
我们将文档包含字段添加到IndexWriter,分析文档使用 Analyzer ,然后根据需要创建/打开/编辑索引,并在目录中存储/更新它们. IndexWriter用于更新或创建索引.它不用于读取索引.
索引类
以下是索引过程中常用类的列表.
S.No. | Class&描述 |
---|---|
1 | IndexWriter 此类充当核心组件,在索引期间创建/更新索引过程. |
2 | 目录 此类表示索引的存储位置. |
3 | 分析器 此课程负责分析文档并获取令牌/要被索引的文本中的单词.如果没有完成分析,IndexWriter就无法创建索引. |
4 | 文档 此类代表带有Fields的虚拟文档,其中Field是一个对象,可以包含物理文档的内容,元数据等.分析器只能理解文档. |
5 | 字段 这是最低的单位或索引过程的起点.它表示键值对关系,其中键用于标识要编制索引的值.让我们假设用于表示文档内容的字段将具有作为"内容"的键,并且该值可以包含文档的部分或全部文本或数字内容. Lucene只能索引文本或数字内容. |