시계열 데이터베이스
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
시계열 데이터베이스는 타임스탬프와 관련 데이터로 구성된 시계열 데이터를 효율적으로 저장하고 처리하기 위해 특화된 데이터베이스 시스템이다. 일반 데이터베이스보다 저장 공간과 성능 면에서 개선을 제공하며, 데이터의 균일성을 활용한 압축, 오래된 데이터 삭제, 특수 인덱싱 등의 기술을 사용한다. 주요 시계열 데이터베이스로는 Machbase, InfluxDB, TimescaleDB 등이 있으며, 오픈 소스 및 상용 제품이 존재한다. 시계열 데이터베이스는 프로파일, 곡선, 트레이스, 트렌드 등 다양한 형태로 활용되며, 시계열 데이터의 특성에 맞춰 데이터 구조, 처리 방식, 쿼리 성능을 최적화한다.
더 읽어볼만한 페이지
- 시계열 소프트웨어 - Stata
Stata는 통계 분석, 데이터 관리, 그래프 작성 기능을 제공하는 통계 소프트웨어 패키지로, 다양한 운영체제 지원, 명령줄 및 그래픽 사용자 인터페이스 제공, 사회과학 및 자연과학 분야에서의 폭넓은 활용, 사용자 커뮤니티를 통한 확장 기능 지원 및 파이썬 연동을 특징으로 한다. - 시계열 소프트웨어 - 메이플 (소프트웨어)
메이플은 Maplesoft에서 개발한 컴퓨터 대수 시스템 소프트웨어로, 기호 및 수치 계산, 시각화, 프로그래밍 기능을 제공하며 수학적 모델링, 시뮬레이션, 데이터 분석 등에 활용되어 교육 및 연구 개발 분야에서 널리 사용된다.
시계열 데이터베이스 | |
---|---|
기본 정보 | |
유형 | 데이터베이스 |
패러다임 | 시계열 분석 |
설계 목표 | 시간 스탬프 데이터 저장 및 검색 높은 쓰기 처리량 데이터 보존 정책 시간 기반 집계 시계열 데이터 시각화 |
일반적인 기능 | |
데이터 모델 | 열 기반 데이터베이스 키-값 데이터베이스 관계형 데이터베이스 |
데이터 수집 | 푸시 기반 시스템 풀 기반 시스템 |
데이터 저장 | 인메모리 데이터베이스 디스크 기반 데이터베이스 클라우드 기반 데이터베이스 |
데이터 압축 | 델타 인코딩 RLE (런 렝스 인코딩) Gorilla 압축 Facebook Zstd |
데이터 쿼리 | SQL (구조적 질의어) |
데이터 시각화 | 그래프 대시보드 |
활용 사례 | |
모니터링 | 애플리케이션 성능 모니터링 (APM) 인프라 모니터링 네트워크 모니터링 서버 모니터링 |
사물 인터넷 (IoT) | 스마트 홈 웨어러블 기기 산업 자동화 |
금융 | 주식 시장 분석 알고리즘 트레이딩 위험 관리 |
에너지 | 스마트 그리드 에너지 효율 수요 반응 |
제조업 | 예지 정비 품질 관리 생산 최적화 |
마케팅 | 고객 행동 분석 캠페인 성과 측정 개인화 |
기타 | |
관련 기술 | 스트림 처리 데이터 레이크 NoSQL |
2. 시계열 데이터베이스의 특징
시계열 데이터 세트는 다른 데이터 세트에 비해 비교적 크고 균일하며, 일반적으로 타임스탬프와 관련 데이터로 구성된다.[6] 시계열 데이터 세트는 서로 다른 테이블 간의 데이터 항목 간의 관계가 적을 수 있으며, 항목을 무기한 저장할 필요가 없다.[6] 이러한 특성으로 인해 시계열 데이터베이스는 범용 데이터베이스보다 저장 공간과 성능 면에서 상당한 개선을 제공할 수 있다.[6] 예를 들어, 시계열 데이터의 균일성 때문에 특수 압축 알고리즘을 사용할 수 있고, 일반 데이터베이스와 달리 오래된 데이터를 정기적으로 삭제(또는 다운샘플링)하도록 구성할 수도 있다.[6]
2. 1. 데이터 구조
시계열 데이터 세트는 일반적으로 시간(타임스탬프)과 값의 쌍으로 구성되며, 다른 데이터 세트에 비해 내용이 획일적이다. 또한 테이블 간의 관계가 적고, 기존 데이터를 나중에 수정하거나 데이터를 무기한으로 보존해야 하는 요구도 거의 없다. 시계열 데이터베이스는 이러한 시계열 데이터 세트의 특성에 특화함으로써 범용 데이터베이스에 비해 저장 공간과 쿼리 성능을 대폭 향상시킨 것이 특징이다. 예를 들어, 시계열 데이터의 균일성에 특화된 압축 알고리즘을 사용하거나, 오래된 데이터를 정기적으로 삭제하거나, 특수한 고효율 인덱스를 이용하는 등의 방법이 사용된다[26][27]。시계열 데이터는 분야에 따라 프로파일, 곡선, 트레이스, 트렌드라고도 불린다[28]。
2. 2. 데이터 처리
시계열 데이터 세트는 일반적으로 시간(타임스탬프)과 값의 쌍으로 구성되며, 다른 데이터 세트에 비해 내용이 획일적이다. 또한 테이블 간의 관계가 적고, 기존 데이터를 나중에 수정하거나 데이터를 무기한으로 보존해야 하는 요구도 거의 없다. 시계열 데이터베이스는 이러한 시계열 데이터 세트의 특성에 특화함으로써 범용 데이터베이스에 비해 저장 공간과 쿼리 성능을 대폭 향상시킨 것이 특징이다. 예를 들어, 시계열 데이터의 균일성에 특화된 압축 알고리즘을 사용하거나, 오래된 데이터를 정기적으로 삭제하거나, 특수한 고효율 인덱스를 이용하는 등의 방법이 사용된다[26][27]。시계열 데이터는 분야에 따라 프로파일, 곡선, 트레이스, 트렌드라고도 불린다[28]。
2. 3. 쿼리 성능
시계열 데이터 세트는 다른 데이터 세트에 비해 비교적 크고 균일하며, 일반적으로 타임스탬프와 관련 데이터로 구성된다.[6] 시계열 데이터 세트는 서로 다른 테이블 간의 데이터 항목 간의 관계가 적을 수 있으며, 항목을 무기한 저장할 필요가 없다.[6] 이러한 특성으로 인해 시계열 데이터베이스는 범용 데이터베이스보다 저장 공간과 성능 면에서 상당한 개선을 제공할 수 있다.[6] 예를 들어, 시계열 데이터의 균일성 때문에 특수 압축 알고리즘은 덜 균일한 데이터에서 작동하도록 설계된 일반 압축 알고리즘보다 개선된 성능을 제공할 수 있다.[6] 일반 데이터베이스와 달리 시계열 데이터베이스는 오래된 데이터를 정기적으로 삭제(또는 다운샘플링)하도록 구성할 수도 있다.[6] 특수 데이터베이스 색인는 쿼리 성능 향상도 제공할 수 있다.[6]3. 주요 시계열 데이터베이스 목록
다음은 시계열 데이터 관리에 기능적으로 최적화된 데이터베이스 시스템 목록이다.
이름 | 라이선스 | 언어 | 각주 |
---|---|---|---|
Machbase | 상용 | C | [45] |
큐브 | 아파치 라이선스 | 자바스크립트 | [46] [48] |
DalmatinerDB | MIT | 얼랭 | [47] [48] |
드루이드 | 아파치 라이선스 | 자바 | [48] |
eXtremeDB | 상용 | SQL, 파이썬, C/C++, 자바, C# | [48] |
InfluxDB | MIT[49], Chronograf AGPLv3, 클러스터링 상용[50] | Go | [48] [51] |
인포믹스 타임시리즈 | 상용 | C/C++ | [48] [52] |
IRONdb | 상용 | C/C++ | [48] [53] |
KairosDB | 아파치 라이선스 | 자바 | [54] [48] |
Kx kdb+ | 상용 | Q | [48] |
OpenTSDB | GPLv3+ | 자바 | [55] [48] |
Prometheus | 아파치 라이선스 | Go | [48] |
Riak-TS | 아파치 라이선스 | 얼랭 | [48] |
RRD툴 | GNU 일반 공중 사용 허가서 | C | [48] |
TimescaleDB | 아파치 라이선스 (일부 기능) | C | [56] [48] [51] [57] [58] |
Whisper (그래파이트) | 아파치 2 | 파이썬 | [59] |
Amazon Timestream for LiveAnalytics | 상용 | Java | [7] |
Apache IoTDB | 아파치 라이선스 2.0 | Java | [8] |
Apache Kudu | 아파치 라이선스 2.0 | C++ | [9] |
Apache Pinot | 아파치 라이선스 2.0 | Java | [10] |
ClickHouse | 아파치 라이선스 2.0 | C++ | [11] |
CrateDB | 아파치 라이선스 2.0 | Java | [12] [13] |
MongoDB | 서버 측 공중 사용 허가서 | C++, 자바스크립트, Python | [20] |
RedisTimeSeries | RSALv2/SSPLv1 | C | [21] [22] |
3. 1. 오픈 소스 시계열 데이터베이스
다음은 오픈 소스 시계열 데이터베이스 목록이다.이름 | 라이선스 | 구현 언어 | 각주 |
---|---|---|---|
큐브 | 아파치 라이선스[46] | 자바스크립트 | [48] |
DalmatinerDB | MIT[47] | 얼랭 | [48] |
드루이드 | 아파치 라이선스 | 자바 | [48] |
InfluxDB | MIT[49] | Go | [48][51] |
KairosDB | 아파치 라이선스[54] | 자바 | [48] |
OpenTSDB | GPLv3+[55] | 자바 | [48] |
Prometheus | 아파치 라이선스 | Go | [48] |
Riak-TS | 아파치 라이선스 | 얼랭 | [48] |
RRD툴 | GNU 일반 공중 사용 허가서 | C | [48] |
TimescaleDB | 아파치 라이선스 (일부 기능)[56] | C | [48][51][57][58] |
Whisper (그래파이트) | 아파치 2 | 파이썬 | [59] |
Apache IoTDB | 아파치 라이선스 2.0 | Java | [8] |
Apache Kudu | 아파치 라이선스 2.0 | C++ | [9] |
Apache Pinot | 아파치 라이선스 2.0 | Java | [10] |
ClickHouse | 아파치 라이선스 2.0 | C++ | [11] |
CrateDB | 아파치 라이선스 2.0 | Java | [12][13] |
Prometheus | 아파치 라이선스 2.0 | Go | [14] |
RedisTimeSeries | RSALv2/SSPLv1[21] | C | [22] |
TimescaleDB | 아파치 라이선스 2.0 | C | [23] |
Whisper (Graphite) | 아파치 라이선스 2.0 | Python | [24] |
3. 2. 상용 시계열 데이터베이스
다음은 시계열 데이터 관리에 기능적으로 최적화된 상용 데이터베이스 시스템이다.이름 | 라이선스 | 언어 | 각주 |
---|---|---|---|
Machbase | 상용 | C | [45] |
eXtremeDB | 상용 | SQL, 파이썬, C/C++, 자바, C# | [48] |
인포믹스 타임시리즈 | 상용 | C/C++ | [48] [52] |
IRONdb | 상용 | C/C++ | [48] [53] |
Kx kdb+ | 상용 | Q | [48] |
Amazon Timestream for LiveAnalytics | 상용 | Java | [7] |
Informix TimeSeries | 상용 | C / C++ | [14] [19] |
Kx kdb+ | 상용 | Q | [14] |
eXtremeDB영어 | 상용 | SQL, Python, C / C++, Java, and C# | [31] |
Informix TimeSeries | 상용 | C / C++ | [31] [35] |
Kx kdb+ | 상용 | Q (프로그래밍 언어)|label=Q영어 | [31] |
3. 3. 국내 기술로 개발된 주요 시계열 데이터베이스
Machbase는 C 언어로 개발된 상용 시계열 데이터베이스이다.[45]4. 시계열 데이터베이스의 활용
시계열 데이터 세트는 다른 데이터 세트에 비해 비교적 크고 균일하며, 일반적으로 타임스탬프와 관련 데이터로 구성된다.[6] 시계열 데이터 세트는 서로 다른 테이블 간의 데이터 항목 간의 관계가 적을 수 있으며, 항목을 무기한 저장할 필요가 없다.[6] 이러한 특성으로 인해 시계열 데이터베이스는 범용 데이터베이스보다 저장 공간과 성능 면에서 상당한 개선을 제공할 수 있다.[6] 예를 들어, 시계열 데이터의 균일성으로 인해 특수 압축 알고리즘은 덜 균일한 데이터에서 작동하도록 설계된 일반 압축 알고리즘보다 개선된 성능을 제공할 수 있다.[6] 시계열 데이터베이스는 데이터를 무기한 저장하도록 설계된 일반 데이터베이스와 달리, 오래된 데이터를 정기적으로 삭제(또는 다운샘플링)하도록 구성할 수도 있다.[6] 특수 데이터베이스 색인는 쿼리 성능 향상도 제공할 수 있다.[6]
시계열 데이터는 분야에 따라 프로파일, 곡선, 트레이스, 트렌드라고도 불린다.[28]
참조
[1]
논문
Exact Discovery of Time Series Motifs
https://www.cs.ucr.e[...]
2019-07-31
[2]
논문
Detection of non-technical losses in smart meter data based on load curve profiling and time series analysis
[3]
논문
Gorilla
[4]
웹사이트
Time-series compression algorithms, explained
https://www.timescal[...]
2020-04-22
[5]
웹사이트
Why time series databases are exploding in popularity
https://www.techrepu[...]
2019-07-31
[6]
뉴스
Database trends: The rise of the time-series database
https://venturebeat.[...]
2021-01-15
[7]
웹사이트
Amazon Timestream - Time series is the new black
https://www.allthing[...]
2021-06-01
[8]
논문
Apache IoTDB: time-series database for internet of things
https://dl.acm.org/d[...]
2020-08-01
[9]
웹사이트
Benchmarking Time Series workloads on Apache Kudu using TSBS
https://blog.clouder[...]
2020-03-18
[10]
논문
Real-time Data Infrastructure at Uber
2021-06-09
[11]
논문
ClickHouse - Lightning Fast Analytics for Everyone
https://www.vldb.org[...]
2024-08-01
[12]
웹사이트
DB-Engines Ranking
https://db-engines.c[...]
2023-01-22
[13]
웹사이트
Anforderungen für Zeitreihendatenbanken im industriellen IoT
https://www.springer[...]
2023-01-22
[14]
웹사이트
State of the Time Series Database Market
https://redmonk.com/[...]
2018-04-03
[15]
웹사이트
influxdb license
https://github.com/i[...]
2016-08-14
[16]
웹사이트
influxdb clustering
https://www.influxda[...]
2016-03-10
[17]
웹사이트
Meet the Founders Who Rewrote in Rust
https://www.influxda[...]
2023-07-06
[18]
웹사이트
Processing time series data: What are the options?
https://www.zdnet.co[...]
2018-09-28
[19]
서적
Solving Business Problems with Informix TimeSeries
http://www.redbooks.[...]
IBM Redbooks
2012-09-21
[20]
뉴스
MongoDB's New Time Series Collections
https://www.mongodb.[...]
[21]
웹사이트
RedisTimeSeries/LICENSE.txt at master · RedisTimeSeries/RedisTimeSeries
https://github.com/R[...]
2023-10-05
[22]
웹사이트
RedisTimeSeries
https://redis.com/mo[...]
2023-06-12
[23]
서적
Design Recommendations for Intelligent Tutoring Systems: Volume 8 - Data Visualization
https://books.google[...]
Army Research Laboratory
2020-12-29
[24]
Thesis
Interoperability in monitoring and reporting systems
2012-05-23
[25]
논문
Exact Discovery of Time Series Motifs
https://www.cs.ucr.e[...]
2019-07-31
[26]
뉴스
Database trends: The rise of the time-series database
https://venturebeat.[...]
2021-01-15
[27]
논문
Gorilla
[28]
논문
Detection of non-technical losses in smart meter data based on load curve profiling and time series analysis
[29]
웹사이트
Benchmarking Time Series workloads on Apache Kudu using TSBS
https://blog.clouder[...]
2020-03-18
[30]
논문
Real-time Data Infrastructure at Uber
https://arxiv.org/ab[...]
2021-06-09
[31]
웹사이트
State of the Time Series Database Market
https://redmonk.com/[...]
2018-04-03
[32]
웹사이트
influxdb license
https://github.com/i[...]
2016-08-14
[33]
웹사이트
influxdb clustering
https://www.influxda[...]
2016-03-10
[34]
웹사이트
Processing time series data: What are the options?
https://www.zdnet.co[...]
2018-09-28
[35]
서적
Solving Business Problems with Informix TimeSeries
http://www.redbooks.[...]
IBM Redbooks
2012-09-21
[36]
웹사이트
MongoDB's New Time Series Collections
https://www.mongodb.[...]
2022-03-27
[37]
웹사이트
RedisTimeSeries A NoSQL Time Series Database
https://redis.com/mo[...]
2023-06-12
[38]
서적
Design Recommendations for Intelligent Tutoring Systems: Volume 8 - Data Visualization
https://www.google.c[...]
Army Research Laboratory
2020-12-29
[39]
Thesis
Interoperability in monitoring and reporting systems
2012-05-23
[40]
웹사이트
Why time series databases are exploding in popularity
https://www.techrepu[...]
2019-07-31
[41]
웹인용
Exact Discovery of Time Series Motifs
https://www.cs.ucr.e[...]
2019-07-31
[42]
저널
Detection of non-technical losses in smart meter data based on load curve profiling and time series analysis
[43]
저널
Gorilla
[44]
웹사이트
Why time series databases are exploding in popularity
https://www.techrepu[...]
2019-07-31
[45]
웹인용
Machbase System Properties
https://db-engines.c[...]
2020-11-03
[46]
웹인용
cube license
https://github.com/s[...]
2018-10-03
[47]
웹인용
dalmatinerdb license
https://github.com/d[...]
2018-10-03
[48]
웹인용
State of the Time Series Database Market
https://redmonk.com/[...]
2018-10-03
[49]
웹인용
influxdb license
https://github.com/i[...]
2016-08-14
[50]
웹인용
influxdb clustering
https://www.influxda[...]
2016-03-10
[51]
웹인용
Processing time series data: What are the options?
https://www.zdnet.co[...]
2016-03-10
[52]
서적
Solving Business Problems with Informix TimeSeries
http://www.redbooks.[...]
IBM Redbooks
2012-09-21
[53]
웹인용
Monitoring in a DevOps World
https://queue.acm.or[...]
2018-10-03
[54]
웹인용
kairosdb license
https://github.com/k[...]
2018-10-03
[55]
웹인용
opentsdb license
https://github.com/O[...]
2018-10-03
[56]
웹인용
timescaledb license
https://github.com/t[...]
2018-10-03
[57]
저널
Scalable Time Series Documents Store
[58]
웹인용
Cyclops 3.0 release with rule engine
https://blog.zhaw.ch[...]
2018-10-11
[59]
Thesis
Interoperability in monitoring and reporting systems
2012-05-23
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com