管理数据集


完成数据集创建后,可根据业务需要对数据集进行一系列管理操作。

管理自建数据集

组织内创建的所有数据集都会以标签的形式展示在自建数据集列表中。在列表中,可对自建数据集进行基本管理操作。

  1. 打开数据集管理首页,在页面左侧 筛选条件 菜单中,点击 自建数据集。然后点击 全部我的收藏,切换查看组织内创建的全部数据集或已收藏的数据集。

    ../_images/favorite.png
  2. 选择一个或多个筛选条件,可根据数据集类型、数据集来源、或数据集标签快速筛选查询数据集。

    ../_images/filtering_dataset.png
  3. 筛选出符合条件的数据集列表后,查看数据集的基本信息,包括数据集名称或别名、标签、和更新时间。

  4. 点击数据集名称旁的星标,即可将数据集加入收藏,以便快速查找和使用。

查看数据集详细信息

  1. 在自建数据集列表中,点击数据集标签,进入数据集详情页面。在 详细信息 标签下,查看数据集的属性、Schema信息等。

    ../_images/dataset_details.png
  2. 根据业务需要,编辑数据集的别名、标签、或描述信息。

  3. 调用代码 标签下,查看或复制调用数据集的 Python 代码。

  4. 数据集探索 标签下,根据业务需要,预览数据集中的数据,或对数据集中的数据进行统计分析。

删除数据集

如业务不再需要使用数据集,可删除自建数据集。删除数据集将永久删除与此数据集相关联的元数据信息,包括数据集名称、版本、描述、标签、以及数据集预览和统计分析的运行实例等,但不会删除基础存储及其数据。

  1. 打开详情页面,点击页面右上角的 删除 按钮并确认。
  2. 在数据集列表中,点击 批量删除 按钮,选择需要批量删除的数据集。

使用样例数据集

数据集管理提供了多个通用的数据集样例,可在数据集列表中查看和使用。

  1. 打开数据集管理首页,在页面左侧 筛选条件 菜单中,点击 样例数据集。然后点击 全部我的收藏,切换查看系统提供的全部样例数据集或已收藏的样例数据集。

    ../_images/sample_datasets.png
  2. 选择一个或多个筛选条件,可根据数据集类型快速筛选查询样例数据集。

    ../_images/filtering_sample_dataset.png
  3. 筛选出符合条件的样例数据集列表后,查看数据集的基本信息,包括数据集名称或别名、标签、和更新时间。

  4. 点击数据集名称旁的星标,即可将样例数据集加入收藏,以便快速查找和使用。

  5. 在样例数据集列表中,点击数据集标签,进入数据集详情页面。在 详细信息 标签下,查看数据集的属性、Schema信息等。样例数据集的信息不可被修改。

    ../_images/sample_dataset_details.png
  6. 调用代码 标签下,查看或复制调用样例数据集的 Python 代码。

  7. 数据集探索 标签下,根据业务需要,预览样例数据集中的数据,或对样例数据集中的数据进行统计分析。