开发手册 欢迎您!
软件开发者资料库

Apache Solr - 添加文档(XML)

Apache Solr添加文档(XML) - 从简单和简单的步骤学习Apache Solr,从基本到高级概念,包括概述,搜索引擎基础知识,Windows环境,Hadoop,架构,术语,基本命令,核心,索引数据,添加文档(XML),更新数据,删除文档,检索数据,查询,分面。

在上一章中,我们解释了如何将数据添加到Solr中,该数据采用JSON和.CSV文件格式.在本章中,我们将演示如何使用XML文档格式在Apache Solr索引中添加数据.

示例数据

假设我们需要添加使用XML文件格式将数据跟踪到Solr索引.

Student IDFirst NameLast NamePhoneCity
001RajivReddy9848022337Hyderabad
002SiddharthBhattacharya9848022338Kolkata
003RajeshKhanna9848022339Delhi
004PreethiAgarwal9848022330Pune
005TrupthiMohanty9848022336Bhubaneshwar
006ArchanaMishra9848022335Chennai

使用XML添加文档

要将上述数据添加到Solr索引中,我们需要准备一个XML文档,如下所示.将此文档保存在名为 sample.xml 的文件中.使用XML添加文档
           001       Rajiv       Reddy       9848022337       Hyderabad                002       Siddarth       Battacharya       9848022338       Kolkata                003       Rajesh       Khanna       9848022339       Delhi                004       Preethi       Agarwal       9848022330       Pune                005       Trupthi       Mohanthy       9848022336       Bhuwaeshwar               006       Archana       Mishra       9848022335       Chennai     

正如您所看到的,为将数据添加到索引而编写的XML文件包含三个重要标记,即< add> ,< doc>,<字段>.

  • add : 这是将文档添加到索引的根标记.它包含一个或多个要添加的文档.

  • doc : 我们添加的文档应包含在< doc>中标签.本文档包含字段形式的数据.

  • 字段 : 字段标记包含文档字段的名称和值.

准备好文档后,可以将此文档添加到文档中.使用上一章中讨论的任何方法索引.

假设XML文件存在于Solr的 bin 目录中,并且它将在核心中编入索引命名为 my_core ,然后您可以使用 post 工具将其添加到Solr索引,如下所示 :

[Hadoop@localhost bin]$ ./post -c my_core sample.xml

执行上述命令后,您将获得以下输出.

/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-core6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files org.apache.Solr.util.SimplePostTool sample.xml SimplePostTool version 5.0.0 Posting files to [base] url http://localhost:8983/Solr/my_core/update... Entering auto mode. File endings considered are xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log POSTing file sample.xml (application/xml) to [base] 1 files indexed. COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update... Time spent: 0:00:00.201

验证

访问Apache Solr Web界面的主页,选择核心 my_core .尝试通过在文本区域 q 中传递查询":"来检索所有文档并执行查询.在执行时,您可以观察到所需的数据被添加到Solr索引.

Solr Index