创建Hive表¶
本文描述了如何通过 Zeppelin Notebook 创建Hive表。
关于任务 ¶
从外部数据源获取的数据需要存储为Hive表,以供其他EnOS数据处理功能使用。你需要使用数据沙箱产品中的 Zeppelin Notebook 创建所需的Hive表。
步骤 ¶
在EnOS管理门户中选择 数据沙箱,打开 Zeppelin Notebook。
导入或创建笔记。
如果你已经创建了包含表创建脚本的笔记,点击 Import note。
如果要创建新笔记,点击 Create new note。
如果你选择新建笔记,则在弹出窗口中输入笔记的名称,然后选择 hive 作为默认解释器类型。例如,如果你输入
yourname/hive/tablename
作为笔记的名称,则会在yourname/hive
目录下创建名为tablename
的Hive表。打开笔记,进入笔记编辑模式。在笔记中,提供用于创建Hive表的命令。例如,
%hive use db_name; CREATE TABLE IF NOT EXISTS employee( serial_id string, birthday string, first_name string, last_name string, gender string, onboard_date string) comment 'table for employee info' PARTITIONED BY (yyyymmdd string) STORED AS ORC;
在以上示例中,将
db_name
替换为 Zeppelin Notebook 页面右上角的Hive库名称。更多有关以上命令的信息,参考 Apache Hive documentation on table creation。点击 运行段落。下图显示了Hive表已创建成功:
结果 ¶
Hive表创建完成后,你可以通过运行查询来测试结果。
%hive
select * from employee limit 100
如果运行成功,你将得到如下反馈:
后续操作 ¶
如果要将刚创建的Hive表作为存储外部数据源的数据库,需要将Hive表指定为目标表,并通过数据同步任务将数据源中的列映射到目标表。详细信息,参考 数据同步。