맨위로가기

아파치 임팔라

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

아파치 임팔라는 아파치 하둡에서 실행되는 쿼리 엔진이다. 2012년 10월 베타 테스트 배포판으로 시작하여 2013년 5월 정식 버전이 출시되었다. 하둡의 HDFS와 HBase에 저장된 데이터에 대해 낮은 지연 시간의 SQL 쿼리를 가능하게 하며, 맵리듀스, 아파치 하이브, 아파치 피그 등 하둡 소프트웨어와 동일한 파일 형식, 메타데이터, 보안 및 리소스 관리 프레임워크를 사용한다. ANSI SQL 표준을 준수하는 쿼리 언어를 지원하며, ODBC 및 JDBC 드라이버를 통해 다양한 비즈니스 인텔리전스 도구와 연동된다. HDFS, Amazon S3, ABFS, 아파치 HBase 및 아파치 Kudu 스토리지를 지원하며, Kerberos 인증 및 LDAP을 포함한 하둡 보안을 제공한다. 2017년 11월 28일 아파치 최상위 프로젝트로 졸업했다.

더 읽어볼만한 페이지

  • 하둡 - 아파치 하둡
    아파치 하둡은 대용량 데이터를 분산 처리하기 위한 자바 기반의 오픈 소스 프레임워크로, HDFS, 맵리듀스, YARN 등의 모듈로 구성되어 클라우드 환경에서도 사용된다.
  • 하둡 - 맵리듀스
    맵리듀스는 대용량 데이터 처리를 위해 구글에서 개발한 프로그래밍 모델이자 프레임워크로, Map과 Reduce 함수를 사용하여 데이터를 병렬 처리하며 하둡 등의 오픈 소스 구현을 통해 널리 쓰인다.
  • 클라우드 플랫폼 - 마이크로소프트 애저
    마이크로소프트 애저는 전 세계 데이터 센터를 통해 600개 이상의 서비스를 제공하는 마이크로소프트의 클라우드 컴퓨팅 플랫폼으로, 다양한 컴퓨팅, 데이터베이스, 스토리지, AI, IoT 기능과 개발자 지원 서비스를 제공하지만 복잡한 가격 모델과 서비스 장애 및 보안 문제가 우려된다.
  • 클라우드 플랫폼 - 헤로쿠
    헤로쿠는 James Lindenbaum, Adam Wiggins, Orion Henry에 의해 개발되어 세일즈포스닷컴에 인수된 클라우드 플랫폼 서비스이며, 다양한 프로그래밍 언어와 데이터베이스를 지원하고 여러 서비스를 제공하며, 보안 침해와 무료 플랜 중단, 플랫폼 재구축을 겪었다.
  • 아파치 소프트웨어 재단 프로젝트 - 아파치 루씬
    아파치 루씬은 더그 커팅이 개발한 오픈 소스 전문 검색 라이브러리이며, 텍스트 색인 및 검색 기능을 제공하여 웹 검색 엔진, 퍼지 검색, 추천 시스템 구현 등에 사용된다.
  • 아파치 소프트웨어 재단 프로젝트 - 아파치 하둡
    아파치 하둡은 대용량 데이터를 분산 처리하기 위한 자바 기반의 오픈 소스 프레임워크로, HDFS, 맵리듀스, YARN 등의 모듈로 구성되어 클라우드 환경에서도 사용된다.
아파치 임팔라 - [IT 관련 정보]에 관한 문서
기본 정보
개발자아파치 소프트웨어 재단
최초 릴리스2013년 4월 28일
안정화 버전4.4.1
안정화 버전 출시일2024년 8월 20일
프로그래밍 언어C++
자바
운영 체제크로스 플랫폼
장르관계형 하둡 애널리틱스
라이선스아파치 라이선스 2.0
웹사이트아파치 임팔라 공식 웹사이트
저장소임팔라 저장소

2. 특징

아파치 임팔라는 아파치 하둡에서 실행되는 쿼리 엔진이다. 이 프로젝트는 2012년 10월에 공개 베타 테스트 배포판으로 발표되었으며[14][15] 2013년 5월 정식판으로 이용이 가능하게 되었다.[16]

임팔라는 하둡에 스케일링 가능한 병렬 데이터베이스 기술을 도입함으로써 데이터 이동이나 전송 과정 없이 사용자들이 낮은 레이턴시의 SQL 쿼리를 HDFS아파치 HBase에 저장된 데이터에 발행할 수 있게 한다. 임팔라는 동일한 파일과 데이터 포맷, 메타데이터, 보안 및 자원 관리 프레임워크(맵리듀스, 아파치 하이브, 아파치 피그 및 기타 하둡 소프트웨어)를 사용하기 위해 하둡과 연동된다.

임팔라는 분석가와 데이터 과학자가 SQL 또는 비즈니스 인텔리전스 도구를 통해 하둡에 저장된 데이터에 대한 분석을 수행할 수 있도록 홍보된다. 그 결과, 대규모 데이터 처리(MapReduce를 통해)와 대화형 쿼리를 동일한 시스템에서 동일한 데이터 및 메타데이터를 사용하여 수행할 수 있게 되어, 분석을 수행하기 위해 데이터 세트를 특수 시스템 및/또는 독점 형식으로 마이그레이션할 필요가 없다.

'''하둡 통합'''

아파치 임팔라는 아파치 하둡 기반의 쿼리 엔진이다. 2012년 10월에 퍼블릭 베타 테스트 배포판으로 발표되었으며[14][15] 2013년 5월 정식판으로 이용이 가능하게 되었다.[16]

임팔라는 데이터 이동이나 전송 과정 없이 사용자들이 낮은 레이턴시의 SQL 쿼리를 HDFS아파치 HBase에 저장된 데이터에 발행할 수 있게 한다. 임팔라는 맵리듀스, 아파치 하이브, 아파치 피그 및 기타 하둡 소프트웨어에서 사용되는 것과 동일한 파일 및 데이터 형식, 메타데이터, 보안 및 리소스 관리 프레임워크를 사용한다.

임팔라는 HDFS, S3, ABFS, 아파치 HBase 및 아파치 Kudu 스토리지를 지원한다.[9][10] 텍스트, LZO, SequenceFile, Avro, RCFile, Parquet 및 ORC를 포함한 하둡 파일 형식을 읽는다.[6]

임팔라는 하둡 보안(Kerberos 인증, Ldap)을 지원하며, 아파치 Sentry 및 아파치 ranger를 사용한 세분화된 역할 기반 권한 부여 기능을 제공한다. 또한 아파치 Hive의 메타데이터, ODBC 드라이버 및 SQL 구문을 사용한다.

'''SQL 지원'''

아파치 임팔라는 ANSI SQL 표준을 준수하는 쿼리 언어를 제공한다.[14][15][16] ODBC, JDBC 드라이버를 통해 다양한 비즈니스 인텔리전스(BI) 도구와 연동할 수 있다. 임팔라는 아파치 하이브의 메타데이터, ODBC 드라이버 및 SQL 구문을 사용한다.[10] 사용자는 데이터 이동이나 전송 과정 없이 SQL 쿼리를 HDFS아파치 HBase에 저장된 데이터에 발행할 수 있다.

'''성능'''

아파치 임팔라는 아파치 하둡 기반의 쿼리 엔진으로, 분산 쿼리 실행, 컬럼 기반 스토리지 (Parquet 등), LLVM 기반 코드 생성 등을 통해 빠른 쿼리 성능을 제공한다.[14][15] 낮은 지연 시간(Low Latency)으로 대화형 분석이 가능하다. 2013년 초, 열 지향 파일 형식인 Parquet이 발표되었다.[6] 임팔라는 HDFS, S3, ABFS, 아파치 HBase 및 아파치 Kudu 스토리지를 지원하며, 텍스트, LZO, SequenceFile, Avro, RCFile, Parquet 및 ORC를 포함한 하둡 파일 형식을 읽을 수 있다.

'''보안'''

아파치 임팔라는 하둡 보안 (Kerberos 인증, LDAP)을 지원한다.[14][15][3][4] 아파치 Sentry 및 아파치 ranger를 사용한 세분화된 역할 기반 권한 부여를 제공한다.[9][10]

기능은 다음과 같다.


  • HDFS, S3, ABFS, 아파치 HBase 및 아파치 Kudu 스토리지를 지원한다.
  • 텍스트, LZO, SequenceFile, Avro, RCFile, Parquet 및 ORC를 포함한 하둡 파일 형식을 읽는다.
  • 하둡 보안(Kerberos 인증, Ldap)을 지원한다.
  • 아파치 Sentry 및 아파치 ranger를 사용한 세분화된 역할 기반 권한 부여.
  • 아파치 Hive의 메타데이터, ODBC 드라이버 및 SQL 구문을 사용한다.


2013년 초, 임팔라를 포함한 아키텍처를 위해 열 지향 파일 형식인 Parquet이 발표되었다.[6]

2013년 12월, 아마존 웹 서비스는 임팔라에 대한 지원을 발표했다.[7]

2014년 초, MapR은 임팔라에 대한 지원을 추가했다.[8]

2015년, Kudu라는 또 다른 형식이 발표되었으며, Cloudera는 임팔라와 함께 해당 형식을 아파치 소프트웨어 재단에 기증할 것을 제안했다.[9]

임팔라는 2017년 11월 28일에 아파치 최상위 프로젝트(TLP)로 졸업했다.[10]

2. 1. 하둡 통합

아파치 임팔라는 아파치 하둡 기반의 쿼리 엔진이다. 2012년 10월에 퍼블릭 베타 테스트 배포판으로 발표되었으며[14][15] 2013년 5월 정식판으로 이용이 가능하게 되었다.[16]

임팔라는 데이터 이동이나 전송 과정 없이 사용자들이 낮은 레이턴시의 SQL 쿼리를 HDFS아파치 HBase에 저장된 데이터에 발행할 수 있게 한다. 임팔라는 맵리듀스, 아파치 하이브, 아파치 피그 및 기타 하둡 소프트웨어에서 사용되는 것과 동일한 파일 및 데이터 형식, 메타데이터, 보안 및 리소스 관리 프레임워크를 사용한다.

임팔라는 HDFS, S3, ABFS, 아파치 HBase 및 아파치 Kudu 스토리지를 지원한다.[9][10] 텍스트, LZO, SequenceFile, Avro, RCFile, Parquet 및 ORC를 포함한 하둡 파일 형식을 읽는다.[6]

임팔라는 하둡 보안(Kerberos 인증, Ldap)을 지원하며, 아파치 Sentry 및 아파치 ranger를 사용한 세분화된 역할 기반 권한 부여 기능을 제공한다. 또한 아파치 Hive의 메타데이터, ODBC 드라이버 및 SQL 구문을 사용한다.

2. 2. SQL 지원

아파치 임팔라는 ANSI SQL 표준을 준수하는 쿼리 언어를 제공한다.[14][15][16] ODBC, JDBC 드라이버를 통해 다양한 비즈니스 인텔리전스(BI) 도구와 연동할 수 있다. 임팔라는 아파치 하이브의 메타데이터, ODBC 드라이버 및 SQL 구문을 사용한다.[10] 사용자는 데이터 이동이나 전송 과정 없이 SQL 쿼리를 HDFS아파치 HBase에 저장된 데이터에 발행할 수 있다.

2. 3. 성능

아파치 임팔라는 아파치 하둡 기반의 쿼리 엔진으로, 분산 쿼리 실행, 컬럼 기반 스토리지 (Parquet 등), LLVM 기반 코드 생성 등을 통해 빠른 쿼리 성능을 제공한다.[14][15] 낮은 지연 시간(Low Latency)으로 대화형 분석이 가능하다. 2013년 초, 열 지향 파일 형식인 Parquet이 발표되었다.[6] 임팔라는 HDFS, S3, ABFS, 아파치 HBase 및 아파치 Kudu 스토리지를 지원하며, 텍스트, LZO, SequenceFile, Avro, RCFile, Parquet 및 ORC를 포함한 하둡 파일 형식을 읽을 수 있다.

2. 4. 보안

아파치 임팔라는 하둡 보안 (Kerberos 인증, LDAP)을 지원한다.[14][15][3][4] 아파치 Sentry 및 아파치 ranger를 사용한 세분화된 역할 기반 권한 부여를 제공한다.[9][10]

3. 역사

3. 1. 초기 개발 및 공개

3. 2. 주요 기술 발표 및 지원

3. 3. 아파치 최상위 프로젝트 등극

참조

[1] 웹사이트 Apache Impala http://impala.apache[...] 2017-09-15
[2] 뉴스 Man Busts Out of Google, Rebuilds Top-Secret Query Machine https://www.wired.co[...] 2016-10-10
[3] 웹사이트 Cloudera aims to bring real-time queries to Hadoop, big data https://www.zdnet.co[...] ZDNet 2014-01-20
[4] 웹사이트 Cloudera's Impala brings Hadoop to SQL and BI https://www.zdnet.co[...] 2014-01-20
[5] 웹사이트 Cloudera Impala 1.0: It's Here, It's Real, It's Already the Standard for SQL on Hadoop https://web.archive.[...] 2014-04-10
[6] 웹사이트 Parquet: Columnar Storage for Hadoop http://parquet.io/ 2014-01-20
[7] 웹사이트 Announcing Support for Impala with Amazon Elastic MapReduce http://aws.amazon.co[...] Amazon.com 2014-01-20
[8] 웹사이트 Impala for MapR http://doc.mapr.com/[...] MapR.com 2014-04-10
[9] 뉴스 Cloudera to Donate Impala and Kudu Big Data Projects to Apache https://adtmag.com/a[...] 2016-10-10
[10] 웹사이트 The Apache Software Foundation Announces Apache Impala as a Top-Level Project https://blogs.apache[...] 2017-11-30
[11] 트윗 The Apache Impala team is pleased to announce the release of Impala 4.1.0.
[12] 웹인용 Apache Impala http://impala.apache[...] 2017-09-15
[13] 뉴스 Man Busts Out of Google, Rebuilds Top-Secret Query Machine https://www.wired.co[...] 2016-10-10
[14] 웹인용 Cloudera aims to bring real-time queries to Hadoop, big data http://www.zdnet.com[...] ZDNet 2014-01-20
[15] 웹인용 Cloudera’s Impala brings Hadoop to SQL and BI http://www.zdnet.com[...] 2014-01-20
[16] 웹인용 Cloudera Impala 1.0: It’s Here, It’s Real, It’s Already the Standard for SQL on Hadoop https://web.archive.[...] 2014-04-10



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com