管理线上生产实例


从实验列表页选择 运行实例,即可查看实验的所有 线上生产运行实例,并可对运行实例进行比较、归档等操作。

查看运行实例基本信息和详情


  1. 运行实例列表 首页,查看运行实例的名称、版本号、调度名称、运行状态、运行时间、是否周期调度等基本信息。

    注解

    线上生产运行实例和归档实例由每日定时任务自动清理,列表中仅保留最近500个运行实例;非调度运行的实例,调度名称显示为 NA。

  2. 选中多个运行实例,选择 实例比较,可对比运行实例的基本信息、运行参数和指标。

  3. 选中任意运行实例,选择 实例归档,可归档运行实例。

  4. 选择运行名称打开运行实例的详情页。在 DAG图 标签下,可查看运行实例的运行结果,包括运行进度、算子的输入输出参数、本次运行的日志和 Pod 信息。还可输入算子完整名称或按照<parallelfor算子完整名称>.<item名称>.<算子完整名称>格式搜索某个特定分支的算子,有匹配结果是会定位到目标算子,没有匹配结果时会定位到第一个算子。

    选择算子展开配置,在输入输出标签栏可进行如下操作:

    • 选择复制 copy_icon 可复制整段代码
    • 选择根据输入创建数据集 create_dataset 可创建数据集
    • 选择复制路径 copy_path 可复制 minio 路径
  5. 详情 标签下,可查看运行实例的基本信息、运行参数和高级配置。

  6. 甘特 标签下,可查看各算子的运行状态分布图和运行进度。

  7. 在页面顶部的操作项中,可选择对运行实例进行如下操作:

    • 运行:当前运行实例为失败或成功时,可重新输入参数和配置,运行实例
    • 重试:若当前运行实例报错,可从当前出错处再次运行实例
    • 停止:停止正在运行的实例,停止后运行实例变为失败状态
    • 归档:归档当前运行中的实例
    • 前往任务流设计:跳转至当前任务流的设计页面,显示当前画布中设计的任务流最新版本,对任务流进行修改

管理归档实例


运行实例列表 首页,通过筛选查看已归档的实例。选中归档实例后,可对归档实例进行如下操作:

  • 归档恢复:恢复已归档的实例。
  • 删除:如果实例运行时出错,导致任务流无法正常结束,影响正常使用,可手动删除实例。


../_images/deleting_archived_instance.png