我们在使用AWS时偶尔会在管理员邮箱中收到AWS关于EC2维护信息的通知邮件,这些邮件很容易淹没在收件箱中,没有得到及时处理。很多客户希望能够更及时收到这类消息,比如从微信或是钉钉等即时通信软件收到这类消息通知。
微信或钉钉等即时通信工具均提供了消息接口,第三方应用获取授权后,通过调用这些接口即可往客户端发送消息。在AWS上可以在EventBridge/Cloudwatch Event中配置事件规则,即可以触发一个Lambda运行微信/钉钉接口调用的处理逻辑。讲解这方面设计的博客和技术文章也比较多了,具体可以参考附录的一些链接。
这个项目会多做一点点,提供一个无须编写代码快速部署钉钉告警通知的功能。在Serverless Application Repository 中可以通过填入钉钉机器人接口相关的参数,即可快速部署整套钉钉告警通知的相关组件,涉及的 AWS 服务包括 EventBridge, SNS, Lambda 和 Secrets Manager 等。如下是整体的部署架构:
为方便演示,这个应用部署时创建了两个EventBridge的Rule,一个是捕获EC2的状态变化事件(如开关机),另一个是捕获 AWS 健康事件(如EC2计划维护事件)。因此部署后可以通过简单的启动或关闭EC2实例来检查是否可以在钉钉收到通知。
配置钉钉自定义机器人,请参考官方说明
注意: 推荐钉钉机器人安全设置选择“自定义关键词”,录入“告警”、“健康事件”作为默认关键词。需定制化情况下,用户可按需要,在 Event 或 Event rule 中添加关键词,并同时添加至钉钉机器人安全设置。
可以在 SAR 中搜索 DingTalk-notifier
查到本应用(注意因为本项目会创建 EventBridge 到 SNS Publish 权限,所以按下图进行勾选。
部署应用时填入自定义机器人的整个 Webhook URL
LLM 参数均为可选,默认值如上图所示。自定义 System Prompt 请参考 defaultSystemPrompt 进行定制。
机器人提示效果如下:
目前ElastiCache在EventBridge中默认集成的事件不包含ElastiCache事件中的所有类型,因此,对于需要监控ElastiCache事件的用户而言,请参考文档将SNS与ElastiCache集成,并更新lambda中的代码实现ElastiCache事件解析并告警。 ElastiCache的事件提示效果如下,以下告警以failover事件为示例:
原消息:
- AWS Health Event
- AWS Health Abuse Event
- EC2 Instance State-change
- CloudWatch Alarm State Change
本项目基于 Niko Feng 企业微信对接项目 与 Randy Lin SAR部署项目 的基础上修改钉钉对接实现及部署模板完成。在此对 Niko 与 Randy 表示感谢!
2022-02-16: 钉钉机器人纯文本警告推送功能实现。
2022-02-20: 修改 Secrets Manager 中存储 security token 为存储整个 Webhook URL。
2022-10-16: 添加 AWS Cost Anomaly Detection 集成。
2022-11-2: 添加 Amazon GuardDuty 集成。
2023-02-28:
- 转换 AWS 服务接入方式为插件模式,插件项目请参见项目: AWS-Lambda-notifier-plugin
- 添加 Cloud Watch alarm state change 作为默认规则
- 移除 AWS Cost Anomaly Detection & Amazon GuardDuty 集成,实现转移至项目: AWS-Lambda-notifier-plugin
2023-06-2: 添加 Event Bridge name 与 SNS ARN 作为输出,方便作为 plugin 集成参数输入。
2023-06-14: 添加捕获 AWS Health Abuse Event 作为默认事件。
2024-05-16: 添加添加连接 Bedrock 托管 LLM 的能力,进行信息梳理。
2024-12-11: 使用 Converse API 调用 Bedrock 模型。默认使用模型调整为 Amazon Nova Lite。