使用HUE
  • PDF

使用HUE

  • PDF

可在VPC环境下使用。

HUE是可以在Core Hadoop和Spark Hadoop类型中使用的组件。
本指南介绍Cloud Hadoop集群中HUE的功能和HUE中Hive编辑器以及HUE浏览器的使用方法。

HUE配置要素

HUE(Hadoop User Experience)是和Apache Hadoop集群一起使用的基于Web的用户界面。
HUE可以与其他Hadoop生态系统进行分组以运行Hive操作和Spark Job等。

Cloud Hadoop集群的HUE支持以下配置要素。

  • 浏览器

    • 文档:可以查看HUE中保存的工作流、查询、脚本文件
    • 文件:可以查看HDFS中保存的文件
    • S3:可以查看Object Storage存储桶中保存的文件
    • :可以查看Hive Warehouse中保存的表
    • Job:可以查看已运行的Oozie Job的状态和日志
  • 编辑器

    • Hive:可以运行Hive查询
    • Scala、PySpark:可以像spark-shell一样交互式运行语句
    • Spark Submit Jar、Spark:可以分别将.jar和.py文件提交给Spark Job
    • Java:可以通过Oozie工作流运行.jar
    • Distcp:可以通过Oozie工作流运行Distcp操作
    • Shell:可以通过Oozie工作流运行.sh文件
    • MapReduce:可以通过Oozie工作流运行MapReduce应用程序
  • 调度程序

    • Workflow:可以创建Oozie工作流
    • 预约:可以调度创建的工作流

访问HUE

HUE默认安装在Core Hadoop和Spark类型中,可以通过以下两种方式进行访问。

通过控制台的Web UI列表连接

可以在Cloud Hadoop控制台通过按应用程序查看访问HUE Web UI。详细内容请参考按应用程序查看

使用域进行连接

使用域访问HUE Web UI的方法如下。

  1. 访问NAVER Cloud Platform控制台。

  2. 点击Platform菜单的VPC,变更为VPC环境。

  3. 依次点击Services > Big Data & Analytics > Cloud Hadoop菜单。

  4. 点击拟确认的集群项目,在显示的详细信息界面中确认中的域名地址。

    cloudhadoop-clusterlist-domein_zh

  5. 在Web浏览器地址输入栏中输入以下公网IP地址和端口号,打开HUE网页。

    https://{域名地址}:8081
    
  6. 当浏览器显示登录页面时,输入创建集群时设置的管理员账户和密码并登录。

    • 即使在控制台中初始化集群管理员账户,也不会初始化HUE账户的信息。密码必须在HUE网页上进行更改。

运行Hive查询

运行Hive查询的方法如下。

  1. 在上方菜单条点击 查询 > 编辑器 > Hive(Hive UI) 以运行编辑器。
  2. 从编辑窗口的列表中选择要运行查询的数据库。
  3. 在查询编辑器窗口输入查询后,点击 [运行] 按钮。
    • 结果标签页可以查看运行的查询结果。
    • 查询记录标签可以查看运行过的查询列表。

cloudhadoop-hue1_zh

浏览器查询

在上方菜单条点击左侧的菜单图标后,在浏览器区域汇总点击所需浏览器。

  • 文件浏览器

    • HDFS文件查询

    • HDFS的默认目录地址:hdfs://user/账户名

    • 点击账户名前面或者root的斜杠可以直接进入

    • [新建]:创建新文件或目录

    • [上传]:在当前目录上传文件

      cloudhadoop-hue2_zh

  • S3浏览器

    • 可以查询能够使用用户的API ACCESS KEY认证的所有存储桶

    • S3的默认目录地址:s3a://存储桶名称

    • 点击root的斜杠可以进入

    • [新建]:创建新文件或目录

    • [上传]:在当前目录上传文件

      cloudhadoop-hue3_zh

  • 浏览器

    • 在Hive中查询创建的数据库和表

      cloudhadoop-hue4_zh


本文是否有帮助