Amazon Redshift 是云中的完全托管数据仓库服务.它的数据集范围从100千兆字节到1千兆字节.创建数据仓库的初始过程是启动一组称为节点的计算资源,这些资源被组织为名为 cluster 的组.之后,您可以处理您的查询.
如何设置Amazon Redshift?
以下是设置Amazon Redshift的步骤.
第1步 : 使用以下步骤登录并启动Redshift群集.
登录AWS管理控制台并使用以下链接打开Amazon Redshift控制台 : https://console.aws.amazon.com/redshift/
使用屏幕右上角的"区域"菜单选择要创建群集的区域.
单击Launch Cluster按钮.
将打开"群集详细信息"页面.提供所需的详细信息,然后单击继续按钮,直到审阅页面.
将打开确认页面.单击"关闭"按钮完成,以便群集在"群集"列表中可见.
在列表中选择群集并查看群集状态信息.该页面将显示群集状态.
第2步 : 配置安全组以授权客户端与群集的连接.授权访问Redshift取决于客户端是否授权EC2实例.
按照以下步骤操作EC2-VPC平台上的安全组.
打开Amazon Redshift控制台并单击导航窗格中的Clusters.
选择所需的群集.它的配置选项卡打开.
单击安全组.
安全组页面打开后,单击入站选项卡.
单击"编辑"按钮.设置如下所示的字段,然后单击"保存"按钮.
键入 : 自定义TCP规则.
协议 : TCP.
港口范围 : 键入启动群集时使用的相同端口号. Amazon Redshift的默认端口为5439.
来源 : 选择自定义IP,然后键入0.0.0.0/0.
第3步 : 连接到Redshift群集.
有两种方法可以连接到Redshift Cluster : 直接或通过SSL.
以下是直接连接的步骤.
使用SQL客户端工具连接群集.它支持与PostgreSQL JDBC或ODBC驱动程序兼容的SQL客户端工具.
使用以下链接下载和减去; JDBC https://jdbc.postgresql. org/download/postgresql-8.4-703.jdbc4.jar
ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip 或http://ftp.postgresql.org/pub/odbc/versions/msi/psql/psqlodbc_09_00_0101x64.zip for 64 bit machines
使用以下步骤获取连接字符串.
打开Amazon Redshift控制台并在导航窗格中选择群集.
选择所选群集,然后单击"配置"选项卡.
将打开一个页面,如以下屏幕截图所示,其中包含"群集数据库属性"下的"JDBC URL".复制网址.
使用以下步骤将群集与SQL Workbench/J连接.
打开SQL Workbench/J.
选择文件,然后单击连接窗口.
选择创建新的连接配置文件并填写所需的详细信息,如名称等.
单击管理驱动程序和管理驱动程序对话框打开.
单击创建新条目按钮并填写所需详情.
单击文件夹图标并导航到驱动程序位置.最后,单击打开按钮.
将"类名"框和"示例网址"框保留为空.单击确定.
从列表中选择驱动程序.
在URL字段中,粘贴复制的JDBC URL.
输入各自字段的用户名和密码.
选择Autocommit框并单击Save profile list.
Amazon Redshift的功能
以下是Amazon Redshift的功能 :
支持VPC : 用户可以在VPC中启动Redshift并通过虚拟网络环境控制对群集的访问.
加密 : 在Redshift中创建表时,可以加密和配置存储在Redshift中的数据.
SSL : SSL加密用于加密客户端和Redshift之间的连接.
可扩展 : 只需点击几下,就可以根据需要在Redshift数据仓库中轻松扩展节点数量.它还允许在不损失性能的情况下扩展存储容量.
成本效益 : Amazon Redshift是传统数据仓库实践的经济高效的替代方案.没有前期成本,没有长期承诺和按需定价结构.