맨위로가기

데이터 마트

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

데이터 마트는 특정 사용자의 요구에 맞춰 데이터를 저장하고 분석하기 위해 구축되는 데이터 저장소이다. 데이터 웨어하우스와는 형식상 다른 개념이지만, 사용자 요구 분석에 기반한다는 점에서 공통점을 갖는다. 데이터 마트는 쉬운 데이터 접근, 사용자별 뷰 생성, 응답 시간 개선, 저렴한 구축 비용 등의 장점을 제공하며, 스타 스키마, 스노우플레이크 스키마, 활동 스키마 등의 설계 방식을 사용한다. 데이터 웨어하우스의 하위 집합인 종속 데이터 마트 형태로 구축되기도 하며, 킴볼의 접근 방식에 따라 데이터 마트의 집합이 데이터 웨어하우스가 되기도 한다. 데이터 마트는 병렬 처리 중 오류 발생 시 복구가 어렵고, 데이터 항목 추가 시 ETL 및 BI 도구 변경이 필요하다는 단점도 존재한다.

2. 정의

데이터 마트와 데이터 웨어하우스는 형식상 다른 존재이지만, 실제로는 혼용되어 사용되는 경우가 많다. 데이터 마트는 사용자 요구 분석에서 시작하여 사용 목적에 맞는 접근성과 사용성을 강조하는 데이터 저장소인 반면, 데이터 웨어하우스는 기존 데이터를 어떻게 수집, 분석, 재사용할 것인가에 대한 개념으로 중앙 집중식 데이터 집합체를 의미한다.

2. 1. 용어 정의의 혼란

개개의 데이터 마트와 데이터 웨어하우스는 형식상 다른 존재이다. 그러나 이 용어를 사용하는 대부분의 저자들은 데이터 마트가 사용자 요구 분석에서 시작하는 개념으로, 데이터 웨어하우스는 기존의 데이터를 어떻게 수집, 분석하고 이를 어떻게 재사용할 것인가에 대한 개념으로 해석한다.

데이터 웨어하우스는 중앙 집중식 데이터 집합체(물리적으로는 분산되어 있음)를 뜻하며, 데이터 마트는 데이터 저장소의 역할을 한다. 데이터 마트는 (데이터 웨어하우스에서 상속 여부를 떠나서) 사용 목적에 맞는 접근성과 사용성을 강조한다. 일반적으로 데이터 웨어하우스는 전략적인 성격을 띠지만, 명확하지 않은 개념이다. 데이터 마트는 전술적이고 즉각적인 요구를 충족한다는 목표를 가지고 있다.

Marc Demarest는 데이터 마트와 데이터 웨어하우스의 개념을 통합하고자 통합 데이터 아키텍처(Universal Data Architecture; UDA)라는 용어를 제안했다. 데이터 웨어하우스 서비스를 제공하는 일부 회사에서는 데이터 마트 서비스도 같이 제공한다.

3. 데이터 마트 구축 이유

데이터 마트는 다음의 이유로 구축한다.


  • 자주 필요한 데이터에 쉽게 접근할 수 있다.
  • 사용자 그룹별로 집합적 뷰를 생성한다.
  • 최종 사용자의 응답 시간을 개선한다.
  • 쉽게 생성할 수 있다.
  • 전체 데이터 웨어하우스를 구축하는 것보다 비용이 저렴하다.
  • 잠재적 사용자가 전체 데이터 웨어하우스보다 더 명확하게 정의된다.
  • 비즈니스에 필수적인 데이터만 포함하여 덜 복잡하다.
  • 핵심 데이터 정보를 담고 있다.


이용 부서별로 사용하는 데이터와 분석 내용이 다른 경우가 많기 때문에, 해당 이용 부서가 필요로 하는 데이터만을 데이터 웨어하우스에서 추출하거나, 해당 이용 부서가 필요로 하는 분석 데이터를 미리 집계함으로써 분석 응답 속도를 향상시킬 수 있다. 이는 데이터 용량이 작아지고 요청 시마다 집계값을 계산할 필요가 없어지기 때문에 응답 속도가 향상되는 것과, 일반적으로 이용 부서별로 서버를 설치하기 때문에 서버 단위의 동시 사용자 수가 감소하기 때문이다.

4. 설계 스키마

5. 데이터 마트와 데이터 웨어하우스

개개의 데이터 마트와 데이터 웨어하우스는 형식상 다른 존재이다. 그러나 이 용어를 사용하는 대부분의 저자들은 데이터 마트가 사용자 요구 분석에서 시작하는 개념으로, 데이터 웨어하우스는 기존의 데이터를 어떻게 수집, 분석하고 이를 어떻게 재사용할 것인가에 대한 개념으로 해석한다.

데이터 웨어하우스는 중앙 집중식 데이터 집합체(물리적으로는 분산되어 있음)를 뜻하며, 데이터 마트는 데이터 저장소의 역할을 한다. 데이터 마트는 (데이터 웨어하우스에서 상속 여부를 떠나서) 사용 목적에 맞는 접근성과 사용성을 강조한다. 일반적으로 데이터 웨어하우스는 전략적인 성격을 띠지만, 명확하지 않은 개념이다. 데이터 마트는 전술적이고 즉각적인 요구를 충족한다는 목표를 가지고 있다.

Marc Demarest는 데이터 마트와 데이터 웨어하우스의 개념을 통합하고자 통합 데이터 아키텍처(Universal Data Architecture; UDA)라는 용어를 제안했다. 데이터 웨어하우스 서비스를 제공하는 일부 회사에서는 데이터 마트 서비스도 같이 제공한다.

데이터 웨어하우스는 다음과 같은 특징을 가진다.


  • 여러 개의 주제 영역을 포함한다.
  • 매우 상세한 정보를 담고 있다.
  • 모든 데이터 소스를 통합하는 역할을 한다.
  • 반드시 차원 모델을 사용하지는 않지만, 차원 모델에 데이터를 제공한다.


데이터 마트는 다음과 같은 특징을 가진다.

  • 종종 하나의 주제 영역만 포함한다. (예: 재무 또는 판매)
  • 더 요약된 데이터를 포함할 수 있다(전체 세부 정보를 포함할 수도 있음).
  • 특정 주제 영역 또는 소스 시스템 집합의 정보 통합에 집중한다.
  • 스타 스키마를 사용하여 차원 모델에 중점을 두고 구축된다.


이용 부서별로 사용하는 데이터와 분석 내용이 다른 경우가 많기 때문에, 해당 이용 부서가 필요로 하는 데이터만을 데이터 웨어하우스에서 추출하거나, 해당 이용 부서가 필요로 하는 분석 데이터를 미리 집계함으로써 분석 응답 속도를 향상시킬 수 있다. 이는 데이터 용량이 작아지고 요청 시마다 집계값을 계산할 필요가 없어지기 때문에 응답 속도가 향상되는 것과, 일반적으로 이용 부서별로 서버를 설치하기 때문에 서버 단위의 동시 사용자 수가 감소하기 때문이기도 하다.

데이터 마트와 데이터 웨어하우스를 반드시 모두 도입할 필요는 없으며, 소규모 분석 시스템에서는 데이터 마트만으로 시스템을 구성하는 경우도 있고, 반대로 동시 사용 유저 수가 적거나 강력한 데이터 웨어하우스 서버를 도입하는 경우에는 데이터 마트를 생성하지 않는 경우도 있다. 다만, 일반적인 경향으로 다수의 기간 시스템에서 데이터를 추출·로드하는 경우에는 데이터 마트만으로는 능력 부족이므로 데이터 웨어하우스(센트럴 웨어하우스)를 도입하는 경우가 많다.

분석 유저 측의 요구 사항으로, 다수의 동시 접속 유저 수가 있는 경우에는 서버를 병렬로 처리할 수 있고 데이터베이스를 소형화할 수 있으므로, 데이터 마트를 도입하는 경우가 많다.

6. 종속 데이터 마트

인몬의 데이터 웨어하우징 학설에 따르면, 종속 데이터 마트는 더 큰 데이터 웨어하우스의 논리적 하위 집합(뷰) 또는 물리적 하위 집합(추출)이다. 종속 데이터 마트는 특수한 데이터 모델, 성능, 보안, 편의성, 시험, 정치적 이유 등으로 인해 만들어진다.

인몬은 종속 데이터 마트가 제한된 확장성, 데이터 중복, 다른 정보 사일로와의 데이터 불일치, 엔터프라이즈 데이터 소스를 활용할 수 없는 등의 단점을 가진다고 보았다.[5]

6. 1. 종속 데이터 마트의 한계

인몬의 데이터 웨어하우징 학설에 따르면, '''종속 데이터 마트'''는 다음 이유 중 하나로 인해 격리된 더 큰 데이터 웨어하우스의 논리적 하위 집합(뷰) 또는 물리적 하위 집합(추출)이다.

  • 특수한 데이터 모델 또는 스키마에 대한 새로 고침 필요: 예를 들어, OLAP를 위해 구조를 변경하는 경우.
  • 성능: 효율성을 높이기 위해 데이터 마트를 별도의 컴퓨터로 오프로드하거나 중앙 집중식 데이터 웨어하우스에서 해당 작업 부하를 관리할 필요성을 없애기 위해.
  • 보안: 권한이 있는 데이터 하위 집합을 선택적으로 분리하기 위해.
  • 편의성: 엔터프라이즈 데이터 웨어하우스에 새로운 애플리케이션을 통합하는 데 필요한 데이터 관리 및 권한 부여를 우회하기 위해.
  • 시험장: 엔터프라이즈 데이터 웨어하우스로 마이그레이션하기 전에 애플리케이션의 실행 가능성 및 ROI(투자 수익률) 잠재력을 입증하기 위해.
  • 정치: 사용자 그룹이 자금보다 더 많은 영향력을 가지고 있거나 중앙 집중식 데이터 웨어하우스의 좋은 구성원이 아닌 상황에서 IT(정보기술)에 대한 대처 전략.
  • 정치: 데이터 웨어하우스 팀이 사용 가능한 데이터 웨어하우스를 만들 수 없는 상황에서 데이터 소비자를 위한 대처 전략.


인몬의 데이터 웨어하우징 학설에 따르면 데이터 마트와 관련된 트레이드 오프에는 제한된 확장성, 데이터 중복, 다른 정보 사일로와의 데이터 불일치, 엔터프라이즈 데이터 소스를 활용할 수 없음이 포함된다.[5]

7. 데이터 마트의 약점

데이터 마트는 배치 처리가 처리 도중에 오류로 인해 중단되는 경우 등, 병렬 처리로 구축되는 경우가 많아 복구에 어려움을 겪는다. 또한, 데이터 마트에 추가 데이터 항목이 발생할 경우, ETL을 수정해야 하며, 해당 데이터 마트를 분석하는 BI 도구의 변경도 필요하다.

8. 관련 제품

참조

[1] 웹사이트 What Is a Data Mart? IBM https://www.ibm.com/[...] 2021-10-21
[2] 웹사이트 Data Mart Does Not Equal Data Warehouse http://csis.bits-pil[...] 2000-07-18
[3] 서적 Building and Maintaining a Data Warehouse https://books.google[...] CRC Press 2008
[4] 웹사이트 Excel Hell: A cautionary tale https://medium.com/a[...] 2018-04-01
[5] 서적 Data Warehousing Fundamentals for IT Professionals Wiley 2010



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com