创建Hive表

本文描述了如何通过 Zeppelin Notebook 创建Hive表。

关于任务

从外部数据源获取的数据需要存储为Hive表,以供其他EnOS数据处理功能使用。你需要使用数据沙箱产品中的 Zeppelin Notebook 创建所需的Hive表。

步骤

  1. 在EnOS管理门户中选择 数据沙箱,打开 Zeppelin Notebook。

  2. 导入或创建笔记。

    • 如果你已经创建了包含表创建脚本的笔记,点击 Import note

    • 如果要创建新笔记,点击 Create new note

  3. 如果你选择新建笔记,则在弹出窗口中输入笔记的名称,然后选择 hive 作为默认解释器类型。例如,如果你输入 yourname/hive/tablename 作为笔记的名称,则会在 yourname/hive 目录下创建名为 tablename 的Hive表。

  4. 打开笔记,进入笔记编辑模式。在笔记中,提供用于创建Hive表的命令。例如,

    %hive
    
    use db_name;
    
    CREATE TABLE IF NOT EXISTS employee(
       serial_id string,
       birthday string,
       first_name string,
       last_name string,
       gender string,
       onboard_date string)
       comment 'table for employee info'
       PARTITIONED BY (yyyymmdd string)
       STORED AS ORC;
    

    在以上示例中,将 db_name 替换为 Zeppelin Notebook 页面右上角的Hive库名称。更多有关以上命令的信息,参考 Apache Hive documentation on table creation

  5. 点击 run 运行段落。下图显示了Hive表已创建成功:

    ../../../_images/create_hive.png

结果

Hive表创建完成后,你可以通过运行查询来测试结果。

%hive
select * from employee limit 100

如果运行成功,你将得到如下反馈:

../../../_images/test_query.png

后续操作

如果要将刚创建的Hive表作为存储外部数据源的数据库,需要将Hive表指定为目标表,并通过数据同步任务将数据源中的列映射到目标表。详细信息,参考 数据同步