开发手册 欢迎您!
软件开发者资料库

Apache Solr - 概述

Apache Solr概述 - 从简单和简单的步骤学习Apache Solr,从基本到高级概念,包括概述,搜索引擎基础知识,Windows环境,Hadoop,架构,术语,基本命令,核心,索引数据,添加文档(XML) ,更新数据,删除文档,检索数据,查询,分面。

Solr 是一个开源搜索平台,用于构建搜索应用程序.它建立在 Lucene (全文搜索引擎)之上. Solr是企业级的,快速且高度可扩展的.使用Solr构建的应用程序非常复杂,性能卓越.

Yonik Seely 于2004年创建了Solr,以便为公司网站添加搜索功能. CNET网络. 2006年1月,它成为Apache Software Foundation下的一个开源项目.其最新版本Solr 6.0于2016年发布,支持执行并行SQL查询.

Solr可与Hadoop一起使用.由于Hadoop处理大量数据,Solr帮助我们从如此庞大的源中查找所需信息.不仅搜索,Solr也可用于存储目的.与其他NoSQL数据库一样,它是非关系数据存储处理技术.

简而言之,Solr是可扩展的,准备部署,优化搜索/存储引擎以搜索大量以文本为中心的数据.

Apache Solr的功能

Solr是一个环绕Lucene的Java API.因此,使用Solr,您可以利用Lucene的所有功能.让我们来看看Solr&minus的一些最突出的特征;

  • Restful API &减去;要与Solr通信,不必具备Java编程技能.相反,您可以使用restful服务与之通信.我们以XML,JSON和.CSV等文件格式输入Solr中的文档,并以相同的文件格式获得结果.

  • 全文搜索 :  Solr提供全文搜索所需的所有功能,例如令牌,短语,拼写检查,通配符和自动完成.

  • 企业就绪 : 根据组织的需要,Solr可以部署在任何类型的系统(大型或小型)中,如独立,分布式,云端等.

  • 灵活且可扩展 : 通过扩展Java类并相应地进行配置,我们可以轻松地自定义Solr的组件.

  • NoSQL数据库 :  Solr还可以用作大数据规模的NOSQL数据库,我们可以在集群中分发搜索任务.

  • 管理界面&minus ; Solr提供易于使用,用户友好,功能强大的用户界面,使用该界面我们可以执行所有可能的任务,例如管理日志,添加,删除,更新和搜索文档.

  • 高度可扩展 : 在使用Solr和Hadoop时,我们可以通过添加副本来扩展其容量.

  • 以文本为中心并按相关性排序 :  Solr主要用于搜索文本文档,结果根据与用户查询的相关性按顺序传递.

与Lucene不同,在使用Apache Solr时,您不需要具备Java编程技能.它提供了一个很好的可随时部署的服务来构建一个具有自动完成功能的搜索框,Lucene没有提供.使用Solr,我们可以为大规模(大数据)应用程序扩展,分发和管理索引.

搜索应用程序中的Lucene

Lucene是简单而强大的基于Java的搜索库.它可以在任何应用程序中用于添加搜索功能. Lucene是一个可扩展的高性能库,用于索引和搜索几乎任何类型的文本. Lucene库提供任何搜索应用程序所需的核心操作,例如索引搜索.

如果我们有网络在拥有大量数据的门户网站中,我们很可能需要在我们的门户网站中使用搜索引擎从大量数据池中提取相关信息. Lucene是任何搜索应用程序的核心,并提供与索引和搜索相关的重要操作.