남는건 기록뿐

Hive랑 RDBMS랑 다른점 본문

Hive & Impala

Hive랑 RDBMS랑 다른점

루크안 2020. 6. 18. 20:28
반응형

RDBMS : 관계형 데이터베이스 관리 시스템을 나타낸다. RDBMS는 관계형 데이터베이스를 위해 특별히 설계된 데이터베이스 관리 시스템이다. 관계형 데이터베이스는 행과 열을 사용하여 구조화 된 형식으로 데이터를 저장하는 데이터베이스를 말하며, 구조화 된 형식을 테이블이라고 한다.

 

HIVE : 데이터 쿼리 및 분석을 제공하는 데이터웨어 하우스 소프트웨어 시스템이다. Hive는 SQL과 같은 인터페이스를 제공하여 Hadoop과 통합되는 다양한 데이터베이스 및 파일 시스템에 저장된 데이터를 질의한다. 대용량 데이터 세트를 질의하고 관리하는 데 도움이 된다. 하둡 생태계를위한 ETL 도구이다.

 

RDBMS과 HIVE의 차이

 

RDBMS                                                                                           HIVE

데이터베이스를 유지 관리하는 데 사용 데이터웨어 하우스를 유지 보수하는 데 사용
SQL (Structured Query Language)을 사용 HQL (Hive Query Language)을 사용
스키마는 RDBMS에서 수정 스키마는 다양함
정규화 된 데이터가 저장 정규화 된 데이터와 비정규 화 된 데이터 유형이 모두 저장
파티셔닝을 지원하지 않음 자동화 파티션을 지원
파티션 방법이 사용되지 않음 샤딩 방법은 파티션에 사용

 

 

 

출처: https://www.geeksforgeeks.org/difference-between-rdbms-and-hive/

반응형

'Hive & Impala' 카테고리의 다른 글

First_value, Last_value  (0) 2020.07.02
Map side join, Reduce side join  (0) 2020.06.23
Hive Meta store의 역할  (0) 2020.06.17
.hiverc setting!  (0) 2020.06.17
Hive Partition, Bucketting에 대하여  (0) 2020.06.17
Comments