为了保持Amazon RDS的可靠性,可用性和性能,我们需要收集监控数据,以便我们可以轻松调试多点故障.使用Amazon RDS,您可以监控网络吞吐量,读取,写入和/或元数据操作的I/O,客户端连接以及数据库实例的突发信用余额.我们还应考虑存储历史监测数据.这些存储的数据将为您提供与当前性能数据进行比较的基准.
以下是一些监控数据的示例以及它们如何帮助维护健康的RDS实例.
高CPU或RAM消耗 - CPU或RAM消耗的高值可能是合适的,前提是它们符合您的应用目标(像吞吐量或并发)并且是预期的.
磁盘空间消耗 - 如果使用的空间始终等于或高于总磁盘空间的85%,则调查磁盘空间消耗.查看是否可以从实例中删除数据或将数据存档到其他系统以释放空间.
网络流量 - 对于网络流量,请与系统管理员联系,了解域网络和Internet连接的预期吞吐量.如果吞吐量始终低于预期,请调查网络流量.
数据库连接 - 如果您看到大量用户连接以及实例性能和响应时间的减少,请考虑约束数据库连接.
IOPS指标 - IOPS指标的预期值取决于磁盘规格和服务器配置,因此请使用您的基线了解什么是典型值.调查值是否始终不同于基线.为获得最佳IOPS性能,请确保您的典型工作集适合内存,以最大限度地减少读写操作.
使用Amazon CloudWatch进行监控
Amazon RDS每分钟向Amazon CloudWatch发送指标和维度.我们可以从AWS控制台监控这些metrices,如下图所示.