-
打印
-
PDF
使用HUE
-
打印
-
PDF
可在VPC环境下使用。
HUE是可以在Core Hadoop和Spark Hadoop类型中使用的组件。
本指南介绍Cloud Hadoop集群中HUE的功能和HUE中Hive编辑器以及HUE浏览器的使用方法。
HUE配置要素
HUE(Hadoop User Experience)是和Apache Hadoop集群一起使用的基于Web的用户界面。
HUE可以与其他Hadoop生态系统进行分组以运行Hive操作和Spark Job等。
Cloud Hadoop集群的HUE支持以下配置要素。
-
浏览器
- 文档:可以查看HUE中保存的工作流、查询、脚本文件
- 文件:可以查看HDFS中保存的文件
- S3:可以查看Object Storage存储桶中保存的文件
- 表:可以查看Hive Warehouse中保存的表
- Job:可以查看已运行的Oozie Job的状态和日志
-
编辑器
- Hive:可以运行Hive查询
- Scala、PySpark:可以像
spark-shell
一样交互式运行语句 - Spark Submit Jar、Spark:可以分别将.jar和.py文件提交给Spark Job
- Java:可以通过Oozie工作流运行.jar
- Distcp:可以通过Oozie工作流运行Distcp操作
- Shell:可以通过Oozie工作流运行.sh文件
- MapReduce:可以通过Oozie工作流运行MapReduce应用程序
-
调度程序
- Workflow:可以创建Oozie工作流
- 预约:可以调度创建的工作流
访问HUE
HUE默认安装在Core Hadoop和Spark类型中,可以通过以下两种方式进行访问。
通过控制台的Web UI列表连接
可以在Cloud Hadoop控制台通过按应用程序查看访问HUE Web UI。详细内容请参考按应用程序查看。
使用域进行连接
使用域访问HUE Web UI的方法如下。
-
访问NAVER Cloud Platform控制台。
-
点击Platform菜单的VPC,变更为VPC环境。
-
依次点击Services > Big Data & Analytics > Cloud Hadoop菜单。
-
点击拟确认的集群项目,在显示的详细信息界面中确认域中的域名地址。
-
在Web浏览器地址输入栏中输入以下公网IP地址和端口号,打开HUE网页。
https://{域名地址}:8081
-
当浏览器显示登录页面时,输入创建集群时设置的管理员账户和密码并登录。
- 即使在控制台中初始化集群管理员账户,也不会初始化HUE账户的信息。密码必须在HUE网页上进行更改。
运行Hive查询
运行Hive查询的方法如下。
- 在上方菜单条点击 查询 > 编辑器 > Hive(Hive UI) 以运行编辑器。
- 从编辑窗口的列表中选择要运行查询的数据库。
- 在查询编辑器窗口输入查询后,点击 [运行] 按钮。
- 在结果标签页可以查看运行的查询结果。
- 在查询记录标签可以查看运行过的查询列表。
浏览器查询
在上方菜单条点击左侧的菜单图标后,在浏览器区域汇总点击所需浏览器。
-
文件浏览器
-
HDFS文件查询
-
HDFS的默认目录地址:
hdfs://user/账户名
-
点击账户名前面或者root的斜杠可以直接进入
-
[新建]:创建新文件或目录
-
[上传]:在当前目录上传文件
-
-
S3浏览器
-
可以查询能够使用用户的API ACCESS KEY认证的所有存储桶
-
S3的默认目录地址:
s3a://存储桶名称
-
点击root的斜杠可以进入
-
[新建]:创建新文件或目录
-
[上传]:在当前目录上传文件
-
-
表浏览器
-
在Hive中查询创建的数据库和表
-