开发手册 欢迎您!
软件开发者资料库

Apache Tajo - OpenStack Swift集成

Apache Tajo OpenStack Swift集成 - 从简单和简单的步骤学习Apache Tajo,从基本到高级概念,包括简介,体系结构,安装,配置设置,Shell命令,数据类型,操作符,SQL函数,数学函数,字符串函数,DateTime函数,JSON函数,数据库创建,表管理,SQL语句,聚合和窗口函数,SQL查询,存储插件,与HBase集成,与Hive集成,OpenStack Swift集成,JDBC接口,自定义函数。

Swift是一个分布式且一致的对象/blob存储. Swift提供云存储软件,以便您可以使用简单的API存储和检索大量数据. Tajo支持Swift集成.

以下是Swift Integration&minus的先决条件;

  • Swift

  • Hadoop

Core-site.xml

添加以下内容更改为hadoop"core-site.xml"文件 :

    fs.swift.impl    org.apache.hadoop.fs.swift.snative.SwiftNativeFileSystem    File system implementation for Swift       fs.swift.blocksize    131072    Split size in KB 

这将用于Hadoop访问Swift对象.完成所有更改后移动到Tajo目录以设置Swift环境变量.

conf/tajo-env.h

打开Tajo配置文件和添加设置环境变量如下 :

$ vi conf/tajo-env.h  export TAJO_CLASSPATH = $HADOOP_HOME/share/hadoop/tools/lib/hadoop-openstack-x.x.x.jar

现在,Tajo将能够使用Swift查询数据.

创建表

让我们创建一个外部表来访问Tajo中的Swift对象,如下所示;

default> create external table swift(num1 int, num2 text, num3 float)    using text with ('text.delimiter' = '|') location 'swift://bucket-name/table1';

创建表后,您可以运行SQL查询.