남는건 기록뿐

Hive Meta store의 역할 본문

Hive & Impala

Hive Meta store의 역할

루크안 2020. 6. 17. 14:36
반응형

Hive metastore(메타스토어)란

하이브는 테이블과 파티션과 관련된 메타정보를 모두 메타스토어에 저장한다. 다시 말하면, 하이브에서 생성한 테이블 스키마를 저장하는 곳이라고 할 수 있다. 테스트용으로는 더비(derby) 임베디드 데이터베이스가 사용되고, 실제 서비스용으로는 MySQL과 같은 데이터베이스를 사용할 수 있다.

 

 

Hive 메타스토어의 유형

하이브의 메타스토어 유형에는 임베디드 메타스토어(Embedded metastore), 로컬 메타스토어(Local metastore), 원격 메타스토어(Remote metastore) 세가지 유형이 있다.

 

  • 임베디드 메타스토어(Embedded metastore)
    하이브를 설치하면 기본적으로 임베디드 메타스토어를 사용한다. 이 경우 메타스토어가 로컬 장비에 파일로 생성되므로 한번에 하나의 프로세스만 메타스토어에 접근할 수 있다. 따라서 실제 환경에서 사용해서는 안된다.

  • 로컬 메타스토어(Local metastore)
    로컬 메타스토어의 경우 메타데이터가 모두 원격(또는 로컬)의 데이터베이스에 저장된다. 

  • 원격 메타스토어(Remote metastore)
    원격 메타스토어의 경우에도 메타데이터가 모두 원격(또는 로컬)의 데이터베이스에 저장된다. 하지만 로컬 메타스토어와는 달리 메타스토어를 서비스하는 별도의 서버가 기동되며, 클라이언트는 데이터베이스에 집접 쿼리문을 날리는 대신 메타스토어 서버의 중개를 받게 된다. 이때 클라이언트와 메타스토어 서버는 thrift 통신을 사용한다.

 

 

 

 

참고: manic.tistory.com/125

반응형

'Hive & Impala' 카테고리의 다른 글

Map side join, Reduce side join  (0) 2020.06.23
Hive랑 RDBMS랑 다른점  (0) 2020.06.18
.hiverc setting!  (0) 2020.06.17
Hive Partition, Bucketting에 대하여  (0) 2020.06.17
Hive의 3 가지 Table Type, Data Load  (0) 2020.06.17
Comments