Practice makes perfect

[BIGDATA Platform] 빅데이터 탐색 활용 소프트웨어 : Hue 본문

빅데이터/BIGDATA Platform

[BIGDATA Platform] 빅데이터 탐색 활용 소프트웨어 : Hue

kerpect 2020. 6. 18. 21:15

Hue 란?

: Hue(Hadoop User Experience)는 Apache Hadoop 클러스터와 함께 사용되는 웹 기반 사용자 인터페이스입니다. Hue는 다른 Hadoop 에코시스템과 함께 그룹화되어 Hive 작업 및 Spark Job 등을 실행할 수 있습니다. Hue는 다양한 하둡의 에코시스템의 기능들을 웹 UI로 통합 제공되었으며, 오픈 소스로 깃허브에 공개, 2016년 공식 사이트에서 릴리즈하였습니다.

Hue 공식 사이트 :  gethue.com/

 

 

Hue 등장 배경

: 빅데이터 탐색/분석은 반복적인 작업이면서 그 과정에서 많은 도구들이 활용되고, 하둡 기반의 하아브, 피그, 우지, 스쿱 등 알아야 할 기술 요소가 지나치게 많아 업무 담당자 또는 데이터 분석가들이 직접 사용하기에 어려움울 많이 느꼈습니다. 또한 빅데이터 기술이 성숙해지면서 이러한 복잡도를 숨기고 접근성을 높이기 위해 소프트웨어를 만들었습니다.

 

 

Hue 아키텍처

 

Job Designer : 우지의 워크플로 및 Coodinator를 웹 UI에서 디자인

Job Browser : 등록한 잡의 리스트 및 진행 상황과 결과 등을 조회

Hive Editor : 하이브 QL을 웹 UI에서 작성, 실행, 관리

Pig Editor : 피그 스크립트를 웹 UI에서 작성, 실행, 관리

HDFS Browser : 하둡의 파일시스템을 웹 UI에서 탐색 및 관리

HBase Browser :  HBase의 HTable 을 웹 UI에서 탐색 및 관리