如何用 ThingsCloud 打造全方位多层次的设备告警通知体系

阅读时间:约 23 分钟

articles/2024/20260122120832_e50ee2a9439abac39ad2e9b16538027c.png

在物联网项目的实际应用中,设备告警通知是保障设备稳定运行的核心环节。一个优秀的告警通知体系,不仅要在设备出现异常时及时通知相关人员,更要能够智能判断、精准推送,避免告警风暴对管理者造成骚扰。

ThingsCloud 经过多年在各行业的实践积累,打造了一套全方位、多层次的设备告警通知体系。这套体系从触发机制、状态管理、通知方式、分级控制等多个维度,为不同规模、不同行业的物联网项目提供了灵活而强大的告警通知能力。

本文将带您深入了解 ThingsCloud 的告警通知体系,帮助您构建完善的设备告警通知系统。

第一层:智能触发机制

告警规则的触发是整个告警通知体系的起点。ThingsCloud 提供了丰富的触发类型和触发条件,让告警规则能够精准捕捉设备异常。

灵活的触发类型

ThingsCloud 支持两种触发类型:

  • 设备属性变化:当设备属性值发生变化时触发告警检查,包括属性上报、属性下发、云端属性更新。
  • 设备不活跃:当设备属性未更新超过设置时间后触发告警检查,用于实现设备离线告警。

这两种触发类型覆盖了绝大多数物联网应用场景,无论是温湿度传感器数据异常、设备故障,还是设备意外离线,都能及时检测到。

articles/2024/20260122120952_2c8c95e56e3090a598509b493465951e.png

强大的触发条件

在触发条件方面,ThingsCloud 支持设置多个属性条件,并可以灵活组合:

  • AND 逻辑:多个条件同时成立才触发告警。例如:温度大于 50℃ 且 湿度大于 80% 时触发。
  • OR 逻辑:多个条件只要有一个成立即触发告警。例如:温度大于 50℃ 或 湿度大于 90% 时触发。

动态阈值功能

在实际应用中,不同设备往往需要不同的告警阈值。ThingsCloud 提供了动态阈值功能,可以让每个设备自动使用不同的告警阈值。

例如,1000 个温湿度传感器分布在不同的安装位置,每个位置的告警阈值各不相同。使用动态阈值后,无需为每个设备创建独立的告警规则,只需在设备属性中保存阈值,告警规则会自动读取每个设备的阈值进行判断。

更进一步,您还可以让用户通过 App 面板中的数值控制组件,随时修改自己设备的告警阈值,实现真正的个性化告警管理。

高级防抖动机制

设备数据往往存在波动,如果频繁在临界值附近变化,会导致大量无效的告警触发和恢复。ThingsCloud 提供了三种防抖动机制:

  1. 重复次数:设置条件连续触发的次数,达到次数后才进入告警状态。
  2. 持续时间:设置条件持续满足的时间长度,达到时间后才进入告警状态。
  3. 动态生成条件属性:使用属性上报预处理规则,通过代码精确定义告警触发和恢复的边界值,实现完美的防抖动效果。

例如,您可以设置温度大于 20℃ 时触发告警,但温度小于 15℃ 时才恢复告警,这样 15-20℃ 之间的波动就不会导致告警状态抖动。

第二层:精细化状态管理

告警状态管理是告警通知体系的核心,ThingsCloud 提供了完善的告警状态机制,确保告警通知的准确性和及时性。

四种告警状态

ThingsCloud 定义了四种告警状态:

  • 正常(Ok):最近一次设备属性上报未触发告警规则
  • 告警(Alerting):告警规则已被触发且达到设置的重复次数和持续时间
  • 待定(Pending):告警规则已触发但未达到设置的重复次数和持续时间
  • 未知(Unknown):告警规则暂时无明确的告警状态

这种状态机制避免了瞬时数据异常导致的误报,只有当告警条件持续满足时才会真正进入告警状态。

设备级告警状态

设备下可能有多个告警规则,设备的告警状态取所有告警规则中最严重的那个状态。分为:

  • 无告警
  • 普通告警
  • 重要告警
  • 紧急告警

这样管理人员可以在设备列表中快速识别哪些设备需要优先处理。

有效时段管理

在实际应用中,有些告警规则只需要在特定时段生效。ThingsCloud 提供了有效时段功能,可以设置告警规则在一天中的任意时段生效。

例如:

  • 农业大棚:白天时段(08:00-19:00)光照强度低于阈值时触发告警
  • 园区路灯:夜晚时段(19:00-次日06:00)某路继电器未闭合时触发告警
  • 办公楼宇:非工作时段监测到异常用电指标时触发告警

您甚至可以对同一个设备属性,在不同时段设置不同的告警规则,实现精细化的时间管理。

此外,还可以开启"无效时段允许告警恢复"选项,在有效时段外仍允许告警恢复正常。

第三层:多元化通知方式

当告警触发后,如何及时通知到相关人员?ThingsCloud 提供了丰富的通知方式,覆盖了不同的使用场景和通知对象。

通知组(面向项目成员)

告警通知组用于为项目成员发送告警通知,支持以下通知方式:

  • 邮件通知:发送到项目成员的注册邮箱
  • 短信通知:发送到项目成员认证的手机号码
  • 电话通知:自动拨打电话通知项目成员(需购买电话配额)
  • 微信公众号通知:推送到项目成员绑定的微信公众号
  • 企业微信群机器人:推送到企业微信群
  • 钉钉群机器人:推送到钉钉群
  • 飞书群机器人:推送到飞书群
  • Webhook:推送到第三方系统 URL

一个告警规则可以关联多个通知组,一个通知组也可以关联到多个告警规则,灵活复用。

用户通知(面向设备所属用户)

除了项目成员,您还可以为设备所属的用户发送用户告警通知。支持以下方式:

  • 微信公众号通知:用户在微信中收到公众号推送的告警消息,可直接点击跳转到设备详情页
  • 短信通知:发送到用户账号中的手机号码
  • 电话通知:自动拨打电话通知用户
  • App 通知:推送到 ThingsX App

如果设备归属于多个用户,平台会为所有用户同时发送告警通知。

用户个性化通知设置

ThingsCloud 允许为每个用户设置个性化的通知参数:

  • 开启/关闭通知方式:用户可以选择接收哪些类型的通知
  • 每日通知上限:为防止频繁告警骚扰用户,可设置每日最大通知次数
  • 免打扰时段:设置多个时间段,在这些时段内不向用户发送告警通知

例如,用户可以设置夜间 22:00-08:00 为免打扰时段,避免夜间非紧急告警影响休息。

Webhook 扩展能力

如果内置的通知方式无法满足需求,您可以使用 Webhook 通知功能,将告警信息推送到任意第三方系统 URL。

Webhook 支持:

  • 自定义请求格式(JSON 或表单格式)
  • 自定义 HTTP 请求头
  • 在请求头和请求体中使用动态参数

通过 Webhook,您可以对接几乎任何通知渠道,如自建的消息系统、第三方告警平台等。

第四层:分级管理与配额控制

告警通知不仅要"发得出",还要"发得对"、"发得值"。ThingsCloud 提供了完善的分级管理和配额控制机制。

告警级别

ThingsCloud 支持三种告警级别:

  • 普通告警
  • 重要告警
  • 紧急告警

告警级别会显示在告警历史和告警通知中,例如邮件通知的标题中会包含告警级别。这样接收者可以快速判断告警的重要程度,决定处理优先级。

通知次数上限

为避免设备频繁触发和恢复告警产生大量重复通知,ThingsCloud 提供了两种通知次数上限:

  • 每日通知次数上限:设置该告警规则每日的总通知次数上限
  • 单个设备每日通知次数上限:设置对单个设备每日的通知次数上限

当达到上限后,当日将不再发送通知,避免对用户造成骚扰,也避免浪费通知配额。

配额管理

邮件、短信、电话通知需要消耗相应的通知配额。ThingsCloud 提供了两级配额管理

项目级配额

  • 项目拥有统一的邮件、短信、电话配额池
  • 在项目概要中可以查看剩余配额
  • 需购买配额包才能使用

用户级配额

  • 可以为每个用户分配独立的短信和电话配额
  • 支持增加或减少配额,并记录变更历史
  • 用户可以在自己的账户设置中查看配额余额和消耗历史

这种配额机制既保证了通知功能的可用性,又避免了配额浪费,适合 SaaS 模式的运营。

第五层:全面监控与生态集成

完善的告警通知体系不仅要能发送通知,还要能够监控通知效果,并支持与第三方系统的集成。

告警历史与通知记录

ThingsCloud 记录了所有的告警消息和通知发送记录:

  • 告警消息历史:可在项目概要、设备详情、告警规则三个维度查看告警历史
  • 告警通知记录:每条告警消息都会显示是否发送了通知,以及通知方式
  • 发送失败追踪:如果通知发送失败,可以查看失败原因,便于排查问题

告警统计

在项目概要和设备概要中,提供了告警历史统计图表,帮助您直观分析不同时段的告警频次,发现告警规律,优化告警规则。

控制台实时提示

当设备触发告警或恢复正常时,控制台右上角会有通知提示,点击可快速到达设备页面。还支持告警音效,帮助您第一时间发现异常。

生态集成能力

ThingsCloud 提供了多种集成方式,支持在您的业务系统中实现更丰富的告警逻辑:

  • MQTT 应用端订阅:订阅设备实时消息,包括设备告警状态更新,在应用端实现个性化告警逻辑
  • 消息规则引擎:基于数据流转(MQTT/Webhook),获得设备实时消息,实现应用端的告警处理
  • HTTP API:通过项目 API 获得聚合数据,实现应用端的告警逻辑

集成第三方通知通道

企业版用户可以集成第三方短信和语音通知服务(如阿里云),不消耗平台通知配额,具有更高的灵活性和定制能力。

最佳实践:三个典型场景的告警通知方案

为了帮助您更好地理解如何在实际项目中应用 ThingsCloud 的告警通知体系,下面我们分享三个典型场景的实战案例。

场景一:农业大棚的智能告警管理

项目背景:某农业合作社管理着 50 个智慧大棚,种植反季节蔬菜,需要监控温度、湿度、光照、土壤湿度等关键指标。

告警通知方案

1. 告警规则设计

告警规则触发条件有效时段告警级别通知方式
温度过高告警温度 > 35℃08:00-19:00重要告警微信公众号 + 短信
温度过低告警温度 < 5℃全天紧急告警电话 + 微信 + 短信
湿度异常告警湿度 > 90% 或 < 40%08:00-19:00普通告警微信公众号
光照不足告警光照 < 2000Lux08:00-19:00普通告警微信公众号
设备离线告警设备不活跃 > 30分钟全天重要告警微信 + 短信

2. 高级功能应用

  • 动态阈值:不同作物品种设置不同的温度和湿度阈值,管理员可通过 App 随时调整
  • 重复次数:温度告警设置 3 次重复触发,避免瞬时数据波动导致误报
  • 通知次数上限:每日通知上限 20 次,避免告警风暴骚扰
  • 免打扰时段:夜间 22:00-06:00 仅紧急告警发送通知

3. 通知对象设置

  • 项目成员(农业技术员):接收所有告警通知,通过微信公众号和短信
  • 农户(设备所属用户):仅接收温度和湿度的紧急告警,通过微信公众号和电话
  • 钉钉群:技术支持群接收所有告警,便于团队协作

4. 实施效果

通过分时段、分级别的告警通知策略,农户能够在第一时间获知大棚异常情况,及时采取通风、加热、补光等措施,有效减少了作物损失。技术员也可以通过告警历史分析,优化大棚环境控制策略。


场景二:自来水厂 PLC 设备远程监测

项目背景:某水务公司管理着 10 个水厂,每个水厂有 20-30 台 PLC 设备,需要监控水压、流量、水质、设备状态等关键指标,确保供水安全。

告警通知方案

1. 告警规则设计

告警规则触发条件重复次数/持续时间告警级别通知方式
出水压力异常压力 < 0.3MPa 持续 5分钟持续时间 5分钟紧急告警电话 + 钉钉群 + 短信
进水流量骤降流量下降 > 50%重复次数 2次紧急告警电话 + 钉钉群 + 短信
浊度超标浊度 > 1.0 NTU重复次数 3次重要告警钉钉群 + 邮件
PLC 离线告警设备不活跃 > 5分钟重要告警钉钉群 + 短信
水池液位告警液位 > 90% 或 < 20%重复次数 2次普通告警钉钉群

2. 高级功能应用

  • 多条件组合:使用 AND 逻辑,当"压力低"且"流量下降"同时触发时升级为紧急告警
  • 持续时间:压力异常需持续 5 分钟才触发,避免水泵启停过程中的瞬时波动
  • 告警级别管理:根据影响范围和紧急程度区分普通、重要、紧急三级
  • Webhook 集成:将告警信息推送到企业的 SCADA 系统,实现自动派单

3. 通知对象设置

  • 运维团队(钉钉群):接收所有告警,支持 @成员实现紧急通知
  • 值班工程师(项目成员):接收紧急和重要告警,通过电话和短信
  • 部门领导(邮件):仅接收紧急告警的每日汇总报告

4. 实施效果

通过多层次的告警通知体系,水务公司实现了 24 小时无人值守监控。紧急告警通过电话直接通知值班工程师,确保 5 分钟内响应;一般告警通过钉钉群通知团队,便于合理安排维修计划。告警历史数据还帮助公司优化了设备维护策略,降低了故障率。


场景三:康养机构的老人睡眠监测

项目背景:某高端康养机构为每个房间配备了智能床垫,监测老人的心率、呼吸率、体动、在离床状态等,夜间需要关注老人的睡眠质量和安全状况。

告警通知方案

1. 告警规则设计

告警规则触发条件有效时段告警级别通知方式
夜间长时间离床离床状态 > 30分钟22:00-06:00重要告警值班室 App + 护工站屏幕
心率异常心率 < 50 或 > 120全天紧急告警电话 + App + 微信(家属)
呼吸异常呼吸率 < 10 或 > 25全天紧急告警电话 + App + 微信(家属)
体动异常(夜间)体动为 0 持续 2小时22:00-06:00重要告警App + 护工站屏幕
设备离线智能床垫不活跃 > 1小时全天普通告警App

2. 高级功能应用

  • 有效时段:夜间长时间离床告警仅在 22:00-06:00 生效,避免白天误报
  • 用户配额管理:每个老人的家属账户分配 10 条短信/月配额,超出后仅接收微信公众号通知
  • 免打扰时段:体动异常告警在 23:00-06:00 不向家属发送,仅通知值班人员
  • 每日通知上限:心率异常告警每日上限 5 次,避免老人病情波动时频繁骚扰家属

3. 通知对象设置

  • 值班护士(App 通知):接收所有告警,App 推送确保及时响应
  • 护工站(看板组件):在大屏幕显示所有告警历史,便于全局监控
  • 老人家属(微信公众号 + 短信):仅接收紧急告警(心率、呼吸异常),通过微信公众号查看详情可直接跳转到老人健康数据页面
  • 院长(告警统计报告):每周一通过邮件接收上周告警统计

4. 实施效果

通过精细化、个性化的告警通知方案,康养机构实现了对老人夜间安全的全方位保障。紧急情况能够第一时间通知值班护士和家属,普通异常则通过看板和大屏幕提醒护工关注。用户配额管理和免打扰设置既保证了重要告警的及时送达,又避免了对家属的过度打扰,提升了服务质量。


结语:构建适合您的告警通知体系

ThingsCloud 的告警通知体系是一个多层次、全方位的完整解决方案。从触发机制到状态管理,从通知方式到配额控制,从监控统计到生态集成,每个层次都提供了丰富的功能选项。

通过本文的介绍和三个典型案例的分析,您可以根据项目的具体需求,灵活组合这些功能:

  • 小型项目:使用基本的告警规则 + 邮件/短信通知即可满足需求
  • 中型项目:增加告警级别、有效时段、通知次数上限等管理功能
  • 大型项目:充分利用动态阈值、用户通知、Webhook、配额管理等高级功能
  • SaaS 项目:结合用户通知、用户配额、免打扰时段等,实现多租户管理

无论您的项目规模如何,ThingsCloud 都能为您提供合适的告警通知方案,帮助您构建可靠的物联网设备管理体系。

如果您正在将物联网设备接入 ThingsCloud,请参考 设备接入指南教程

关于 ThingsCloud

ThingsCloud 是新一代物联网设备统一接入平台,帮助企业在极短的时间内搭建个性化的物联网平台和应用,并适应不断变化的发展需求。目前广泛应用于制造、电力、能源、环境、农业、楼宇、家居、教育、交通、物流、自动化等领域。

ThingsCloud 可接入各类网关,传感器、执行器、控制器、通信模组、智能硬件等,实现数据采集、远程控制,数据分析、告警通知、智能联动。还可以零代码生成项目应用 SaaS 和用户应用 App,并开放 API 和实时消息,便于业务系统集成和扩展开发。

通过使用 ThingsCloud,企业可以大大缩短搭建物联网系统的时间,节省软件开发费用,降低定制开发的风险,快速落地数字化和智能化项目。我们的客户遍布各行业,包括中国石化、中国铁塔、中国燃气、吉林大学、北控水务、ACE、中国民航大学、西安交通大学、精量电子、大秦铁路、宁波水利局等。

🚀 开箱即用的物联网平台

立即搭建您的 物联网平台

接入物联网设备搭建可视化看板生成专属 App
仅需不到 30 分钟,开启您的物联网之旅

开箱即用
无需部署
快速上手
10,000+ 企业信赖
6,000,000+ 设备接入
99.9% 服务可用性
信任与选择

5000+ 大型企业正在使用ThingsCloud

从初创公司到世界 500 强,企业选择 ThingsCloud 构建可靠的物联网解决方案

更多博客

应用场景

全球 80% 的数据将来自物联网,不论是传统行业还是新兴行业,都将利用更多有价值的数据来驱动业务,实现降本增效。