指标探索


指标探索用于收集、分析和可视化EnOS设备行为,帮助您了解设备的运行情况,排查设备运行问题。

前提条件

你需要设备管理员角色的权限。如果没有请联系组织管理员添加,参见 策略,角色,与权限

配置指标图表

  1. 在 EnOS 管理控制台中选择 监控运维 > 指标探索
  2. 点击 新建图表
  3. 在侧边栏中输入以下信息,具体配置信息,参见 指标列表理解指标探索
    • 图表名称:输入图标名称。
    • 指标和聚合方式:选择一个或多个指标,并配置聚合方式。
      • 指标:选择设备指标、功能指标或 OTA 指标。
      • 聚合方式:选择求和、平均值、最小值、最大值。
    • 过滤条件:设置过滤维度,限定数据计算的范围。为空时,计算全部设备数据。
      • 同一过滤条件中的多个值之间的关系为“或”。
      • 多个过滤条件之间的关系为“与”。
    • 分组条件:用于查看更细粒度的数据或者通过排序方式查看数据情况。
  4. 点击 保存 生成图表。

查看指标图表

  • 在右上角选择 时间范围时间粒度,图表会以相应的范围和粒度进行展示。

注解

  • 根据所选择的时间范围,系统自动匹配默认时间粒度,例如最近1小时粒度为1分钟,最近1天粒度为5分钟,最近7天粒度为15分钟,最近30天粒度为30分钟。
  • 时间粒度最小值为 1 分钟,确保时间粒度值小于所选时间范围。
  • 若要切换图表类型,点击图表右侧 chart 图表 按钮进行切换。
  • 若要查看一个指标的详细信息,点击图表右侧 > 导出数据 下载数据文件。

管理指标图表

  • 点击图表右侧 > 添加到看板 pin 即可将图添加到运维看板,以便未来需要查看同个指标时能直接进入运维看板查看该图,而不必再一次进行搜索。有关运维看板的更多信息,参见 运维看板
  • 点击图表右侧 manage 配置 按钮,重新配置图表。
  • 若要删除点击图表右侧 > 删除图表

指标列表

指标类型 聚合方式 过滤/分组条件

设备指标:

  • 设备总数
  • 在线设备数量
  • 离线设备数量
  • 未激活设备数量
  • 禁用设备数量
  • 平均值(默认)
  • 最小值
  • 最大值
  • 模型
  • 产品
  • 网关
  • 资产树
  • 设备分组

功能指标:

  • 设备测点上报成功数量
  • 设备测点上报失败请求数量
  • 设备命令下发成功数量
  • 设备命令下发失败数量
  • 设备属性上报成功数量
  • 设备属性上报失败请求数量
  • 设备事件上报成功数量
  • 设备事件上报失败请求次数
  • 求和(默认)
  • 平均值
  • 最小值
  • 最大值
  • 模型
  • 产品:查询网关的产品无法查询到子设备的数据,只有当查询子设备的产品时才会有子设备的数据。
  • 网关:网关下面所有设备。
  • 资产树
  • 设备分组
  • 设备:若为网关设备,则是网关本身的上报情况。

消息指标:

  • 设备发送到云端的消息数量
  • 设备发送到云端的消息大小
  • 云端发送到设备的消息数量:从物联网平台发送到设备和服务端的实时消息数量
  • 云端发送到设备的消息大小
  • 设备发送到云端的无效消息数量
  • 设备与云端建立连接请求的成功数量
  • 设备与云端建立连接请求的失败数量
  • 活跃连接数量:每分钟内所有设备的活跃连接数量,包括直连设备和网关设备
  • 求和(默认)
  • 平均值
  • 最小值
  • 最大值
  • 产品:如果是通过网关上传消息,则选择设备的产品不会有数据
  • 设备:如果是通过网关上传消息,则选择设备本身不会有数据
  • 协议
  • DC:设备连接器
  • 异常类型:消息过大,消息格式无效
OTA 指标:设备OTA数量
  • 求和(默认)
  • 平均值
  • 最小值
  • 最大值
  • 产品
  • 固件
  • 结果:成功或失败

理解指标探索

相关概念

  • 聚合间隔:收集多个指标值之间的时间段。对于时序数据,聚合间隔指的是时间粒度。对于非时序数据,聚合间隔指的是时间范围。
  • 采样粒度:两个原始指标值之间的最小间隔。当用户选择的时间粒度小于采样粒度时,会选择采样粒度较大者作为聚合间隔。

聚合方式

指标探索中提供了五种基本的聚合方式:

  • 求和:在聚合间隔内捕获的所有值的总和。
  • 平均值:在聚合间隔内捕获的指标值的平均值。
  • 最小值:在聚合间隔内捕获的最小值。
  • 最大值:在聚合间隔内捕获的最大值。

假设每分钟采集一次设备 A、B、C 的原始数据并进行相应聚合操作,具体的数据如下图所示:

../../_images/aggregation_method.png

分组排序

假设采集 1 天中产品 A、B、C 的设备的数据。

  • 如下图所示,分组排序的比较基准值与时间粒度无关,与时间范围有关。聚合类型为 Sum,基准值为这一天内所有值之和。如果聚合类型为 Max,则基准值为这一天内所有值中的最大值。

    ../../_images/product_data.png
  • 以下折线图展示了聚合类型为 Sum 时,数值最大的 2 个产品数据。折线图可以展示与时间相关的数据趋势。

    ../../_images/image1.png
  • 以下直方图和饼图展示了聚合类型为 Max,数值最大的前 3 个产品数据。

    • 直方图
      ../../_images/image2.png
    • 饼图
      ../../_images/image3.png

最佳实践

场景描述 适用配置 备注
最近三天通过网关 A 上报成功的测点数量趋势
  • 设备指标:测点上报成功数量
  • 聚合算法:求和
  • 过滤条件:网关 = 网关 A
  • 分组条件:无
  • 时间范围:最近 3 天,时间粒度根据需求自选
  • 图表类型:折线图或者柱状图
最近 1 个月模型 A,模型 B,模型 C 下在线设备数量情况
  • 设备指标:在线设备数量
  • 聚合算法:平均值
  • 过滤条件:模型 = 模型 A,模型 B,模型 C
  • 分组条件:无
  • 时间范围:最近 1 天,时间粒度根据需求自选
  • 图表类型:折线图或者柱状图
分组用于拆分数据,以更细颗粒度查看数据
最近 1 个月设备离线数量排名前 10 省份
  • 设备指标:离线设备数量
  • 聚合算法:平均值
  • 过滤条件:设备分组 = 上海组,北京组,广州组,深圳组……
  • 分组条件:设备分组,10 组,降序
  • 时间范围:最近 1 个月,时间粒度根据需求自选
  • 图表类型:直方图
分组用于排序,其基准值计算方式 = 最近一个月内点值之和/点数(按照设备分组)
2月6日到2月12日期间设备通过网关发到平台消息总量排名最少的前 3 个网关
  • 设备指标:设备发送到云端的消息大小
  • 聚合算法:求和
  • 过滤条件:无
  • 分组条件:网关,3组,升序
  • 时间范围:2月6日到2月12日,时间粒度根据需求自选
  • 图表类型:直方图
分组用于排序,其基准值计算方式 = 2月6日到2月12日内的点的值之和(按照网关)
当前环境下设备在线率,离线率和未激活率
  • 设备指标:在线设备数量,离线设备数量,未激活设备数量
  • 聚合算法:平均值
  • 过滤条件:无
  • 分组条件:无
  • 时间范围:2月6日到2月12日,时间粒度根据需求自选
  • 图表类型:饼图
将三个指标2月6日到2月12日之间的平均值之和作为分母,各自平均值作为分子,计算比率
最近一周设备发送到云端的消息最大值情况
  • 设备指标:设备发送到云端的消息大小
  • 聚合算法:最大值
  • 过滤条件:无
  • 分组条件:无
  • 时间范围:最近 1 周,时间粒度根据需求自选
  • 图表类型:折线图或者柱状图

相关信息