데이터 보존
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
데이터 보존은 전쟁, 자연 재해, 기술적 변화 등으로부터 데이터를 보호하여 인류의 역사적 기록을 유지하는 것을 의미한다. 초기에는 중요 데이터만 보존되었지만, 기술 발전으로 디지털 데이터 보존이 가능해졌다. 데이터 보존은 정부, 기업, 개인, 사회 전반에 걸쳐 중요하며, 데이터 손실은 다양한 요인으로 발생할 수 있다. 데이터 보존 방법으로는 디지털 보존, 기록 보관소 활용, 카탈로그/디렉토리/포털, 리포지토리 구축 등이 있으며, 사이버 인프라를 통해 데이터 공유를 지원하기도 한다.
더 읽어볼만한 페이지
- 데이터 복구 - 데이터 손실
데이터 손실은 절차적 요인, 인적 행위, 시스템 실패, 자연 재해, 범죄 등 다양한 원인으로 발생하며, 금전적 손실과 평판 손상 등 심각한 결과를 초래하므로 강력한 암호, 이중 인증, 정기적인 백업 등의 예방 조치가 중요하다. - 백업 - 업무 연속성 계획
업무 연속성 계획은 예기치 못한 상황 발생 시 조직의 핵심 업무를 지속하고 빠르게 복구하기 위한 사전 계획으로, 회복탄력성을 높이고 사업을 안정적으로 유지하며 이해관계자에게 미치는 영향을 최소화하는 데 목적을 둔다. - 백업 - 디스크 복제
디스크 복제는 하드웨어 또는 소프트웨어 복제기를 사용하여 소스 드라이브 내용을 대상 드라이브로 복사하는 기술로, 시스템 설정 복제, 디지털 포렌식, 백업, 시스템 배포 및 드라이브 업그레이드 등 다양한 용도로 활용되어 시스템 관리 효율성을 높인다. - 디지털 보존 - 디지털화
디지털화는 아날로그 신호나 자료를 디지털 형태로 변환하는 과정으로, 접근성 향상 및 보존성 강화, 디지털 환경 활용을 가능하게 한다. - 디지털 보존 - 디지털 아카이브
디지털 아카이브는 인터넷과 디지털 기술 발달로 지식 유통 방식에 변화를 가져왔으며, 물리적 공간의 제약 없이 데이터 단위로 축적되어 평가, 식별, 완전성 등의 기본 원리를 따르고, 리프레싱, 마이그레이션 등의 보존 전략을 사용하며 다양한 디지털 자료의 보존을 위한 노력이 이루어지고 있다.
데이터 보존 |
---|
2. 역사
역사적으로 수집된 대부분의 데이터는 시간이 지남에 따라 손실되거나 파괴되었다. 전쟁과 자연재해, 그리고 데이터 보존 및 보호에 필요한 자재와 기술 부족은 이러한 결과를 초래했다. 일반적으로 정부 기록 및 통계, 법적 계약 및 경제 거래와 같이 가장 중요한 데이터 세트만 보존되었다. 과학 연구 및 박사 학위 논문 데이터는 부적절한 저장, 데이터 보존에 대한 인식 및 실행 부족으로 인해 대부분 파괴되었다.[4] 시간이 지남에 따라 데이터 보존은 발전하여 그 중요성과 인식이 높아졌다. 현재 우리는 데이터를 보존하는 다양한 방법과 이를 수행하는 데 관련된 많은 중요한 조직을 보유하고 있다.
데이터 보존의 범위는 광대하다. 정부 기록, 사업 기록, 예술 작품 등 모든 것이 데이터로 표현될 수 있으며, 손실될 수 있다. 이는 인류 역사의 영구적인 손실로 이어진다.
데이터 보유(Data Holding)는 장기적인 보존을 목적으로 하지 않고 비공식적으로 보관되는 데이터 모음을 의미한다. 개인 파일 모음이나 백업 데이터가 이에 해당한다. 이러한 "데이터 보유"는 일반적으로 환경 및 기타 역사적 재해로 인해 데이터가 손실되었을 때 사용되어 온 관리 기법으로 여겨진다.[4]
데이터 보존에는 여러 방법이 사용된다.
최초의 디지털 데이터 보존 저장 솔루션은 1950년대에 등장했으며, 일반적으로 평면 또는 계층적 구조를 가지고 있었다.[5] 이러한 솔루션에도 여전히 문제가 있었지만, 데이터 저장을 훨씬 더 저렴하고 접근하기 쉽게 만들었다. 1970년대에는 관계형 데이터베이스와 스프레드시트가 등장했다. 관계형 데이터베이스는 구조적 질의 언어를 사용하여 데이터를 테이블로 구성하여 이전의 저장 솔루션보다 효율성을 높였으며, 스프레드시트는 대량의 숫자 데이터를 저장하여 이러한 관계형 데이터베이스에 적용, 파생 데이터를 생성할 수 있게 했다. 최근에는 대량의 비정형 또는 반정형 데이터를 저장하는 관계형 데이터베이스를 보완하는 비관계형 (비구조적 질의 언어) 데이터베이스가 등장했다.[4]
3. 중요성
데이터 손실은 개인, 기업, 조직뿐만 아니라 환경 보호, 의학 연구, 국토 안보, 공중 보건 및 안전, 경제 개발[6], 문화 등 사회 전반에 부정적이고 잠재적으로 영구적인 영향을 미칠 수 있다. 데이터 손실은 재해, 전쟁, 데이터 침해, 과실, 망각, 자연적 붕괴 등 다양한 원인으로 발생할 수 있다.
데이터 컬렉션을 적절하게 보존하고 저장하면 미국 지질 조사국([https://www.usgs.gov/ U.S. Geological Survey])처럼 활용할 수 있다. 미국 지질 조사국은 자연 재해, 천연 자원 및 지형에 대한 데이터를 보관하며, 이 데이터는 토지 이용 계획 및 관리를 위해 연방 및 주 토지 관리 기관에서 사용하며, 지속적으로 역사적 참조 데이터로 활용된다.[6]
4. 관련 개념
Data_retention|데이터 리텐션영어이라는 개념은 데이터 보존과 구별된다.[28] 리텐션(retention)은 본래 데이터를 계속 가지거나 사용하는 것을 의미하며,[29] 보존은 장래 이용을 위해 데이터를 보호, 유지 관리, 확보하는 것을 의미한다.[8] 리텐션 방침에서는 데이터를 의도적으로 삭제해야 할 시점이나 공개 접근을 제한해야 할 시점에 대해 언급되는 경우가 많지만, 보존 방침에서는 영속성과 접근 가능성이 중요시된다.
따라서 데이터 보존은 데이터나 그 백업 복사본을 가지거나 소유한다는 개념을 넘어선다. 데이터 보존은 재해 발생이나 기술 변화라는 사건에 앞서, 백업 및 복구 시스템을 포함하여 데이터에 확실하게 접근할 수 있음을 보장하는 노력이다.[30]
5. 방법
5. 1. 디지털 보존
디지털 보존은 데이터 보존과 유사하지만, 주로 기술적 위협과 순수하게 디지털 데이터에 관련되어 있다. 본질적으로 디지털 데이터는 기술적 오작동이나 변화가 발생하더라도 지속적 사용과 접근을 가능하게 하는 공식적인 일련의 활동이다.[10] 디지털 보존은 기술과 프로토콜의 불가피한 변화를 인지하고, 데이터와 메타데이터의 무결성을 보존하면서 새로운 유형의 기술과 플랫폼에서 접근할 수 있도록 데이터를 준비한다.[4]
과거에는 불가능했을 수도 있는 데이터를 보존하는 데 있어 기술은 훌륭한 진전을 제공하지만, 동시에 매우 빠른 속도로 변화하고 있어 디지털 데이터가 새로운 소프트웨어와 호환되지 않아 더 이상 접근할 수 없게 될 수도 있다. 데이터 보존을 사용하지 않으면 기존 디지털 데이터의 상당 부분이 위험에 처하게 된다.[9]
5. 2. 아카이브
기록 보관소는 역사적인 문서와 기록의 모음이다. 기록 보관소는 잘 정리된 데이터를 수집하고, 이를 확인하기 위한 적절한 메타데이터를 제공하여 데이터 보존에 기여한다.[11]
중요한 데이터 기록 보관소의 예시로는 임상 시험 및 임상 연구에 관한 데이터를 수집하는 LONI 이미지 데이터 아카이브가 있다.[12]
5. 3. 카탈로그, 디렉토리 및 포털
카탈로그, 디렉토리 및 포털은 개별 기관에서 관리하는 통합된 자원으로, 기록 보관소 및 소장품과 관련이 있다.[4] 데이터가 사이트에 직접 표시되는 것이 아니라 메타데이터 및 집계 도구 역할을 하며, 철저한 재고 관리를 수행할 수 있게 한다.[13] 목록, 디렉터리, 포털은 개별 기관이 보유하고 있으며, 아카이브 데이터 및 보유 데이터와 관련된 집약된 여러 자원을 의미한다.[22] 이는 메타데이터나 그 집합체인 애그리게이터로서의 역할을 수행하며, 망라적으로 정리된 목록으로 기능할 수 있다.[36]
5. 4. 리포지토리
자료 보관소(리포지토리)는 데이터 보관소와 보유물을 접근하고 저장할 수 있는 장소이다. 자료 보관소의 목표는 모든 보관소 및 보유물의 요구 사항과 프로토콜이 충족되고 데이터 무결성과 사용자 신뢰를 보장하기 위해 데이터가 인증되도록 하는 것이다.[4][22] 자료 보관소는 단일 사이트 자료 보관소, 다중 사이트 자료 보관소, 신뢰할 수 있는 디지털 자료 보관소로 나눌 수 있다.
5. 4. 1. 단일 사이트 리포지토리
단일 사이트 자료 보관소는 모든 데이터 세트를 단일 사이트에서 보관한다.[4]
주요 단일 사이트 자료 보관소로는 네덜란드에서 디지털 연구 자원에 대한 지속적인 접근을 제공하는 데이터 아카이빙 및 네트워킹 서비스가 있다.[14]
5. 4. 2. 다중 사이트 리포지토리
여러 기관의 사이트에서 데이터 세트를 호스팅하는 자료 보관소이다.[4]
대표적인 다중 사이트 자료 보관소로는 OpenAIRE가 있다. OpenAIRE는 EU 회원국 및 기타 국가와 협력하여 연구 데이터와 출판물을 호스팅하며, 열린 학문을 장려하고 데이터의 검색 가능성과 재사용성을 향상시키는 것을 목표로 한다.[15]
5. 4. 3. 신뢰할 수 있는 디지털 리포지토리
신뢰할 수 있는 디지털 리포지토리는 장기간에 걸쳐 안정적이고 신뢰할 수 있는 접근을 보장하는 것을 목표로 한다. 이러한 리포지토리는 단일 사이트 또는 다중 사이트일 수 있지만, 개방형 아카이브 정보 시스템 참조 모델을 준수해야 한다.[16][39] 또한, 지속적인 재정적 책임, 조직적 부력, 행정적 책임, 보안 및 안전과 같이 신뢰성 향상에 기여하는 일련의 규칙을 준수하거나 요건을 유지해야 한다.[4][22]
신뢰할 수 있는 디지털 리포지토리의 예로는 아일랜드의 인문 및 사회 과학 데이터 세트를 호스팅하는 다중 사이트 리포지토리인 아일랜드 디지털 리포지토리(DRI)가 있다.[17][40]
5. 5. 사이버 인프라
사이버 인프라는 하드웨어, 기술, 소프트웨어, 정책, 서비스 및 도구 시스템을 통해 제공되는 아카이브 컬렉션으로 구성된다. 사이버 인프라는 동료 간 협업과 문화 공동체를 지원하는 데이터 공유를 목표로 한다.[3]
주요 사이버 인프라의 예로 캐나다 지리 공간 데이터 인프라가 있으며, 이는 캐나다의 공간 데이터를 제공한다.[18]
참조
[1]
웹사이트
Dictionary Definitions
http://www.interpare[...]
InterPARES2
2013-10-21
[2]
간행물
Conceptualizing Data
Sage
[3]
웹사이트
Cyberinfrastructure vision for 21st century discovery
https://www.nsf.gov/[...]
National Science Foundation
[4]
간행물
Small Data, Data Infrastructures and Data Brokers
Sage
[5]
간행물
From punched cards to "big data": a social history of database populism
http://scholarworks.[...]
2013-02-22
[6]
간행물
The importance of data preservation
https://gsa.confex.c[...]
The Geological Society of America
2017-11-29
[7]
문서
Retain [Definition]
https://www.merriam-[...]
Marriam-Webster
2017
[8]
문서
Preserve [Definition]
https://www.merriam-[...]
Marriam-Webster
2107
[9]
간행물
Digital Preservation for Libraries, Archives, and Museums
Rowman & Littlefield Publishers
[10]
간행물
Data Preservation
http://ifdo.org/word[...]
2017-11-28
[11]
서적
Geo-spatial Data Preservation Primer
Hickling, Aurthurs and Low
[12]
웹사이트
About Us
https://ida.loni.usc[...]
[13]
서적
Caring for the Digital Content, Mapping International Approaches
NUI Maynooth, Trinity College Dublin, Royal Irish Academy and Digital Repository of Ireland
[14]
웹사이트
About DANS
https://dans.knaw.nl[...]
Data Archiving and Networked Services
[15]
웹사이트
Project Factsheets
https://www.openaire[...]
OpenAIRE
[16]
웹사이트
The OAIS reference model
https://www.oclc.org[...]
[17]
웹사이트
About DRI
http://www.dri.ie/ab[...]
Digital Repository of Ireland
2014–2015
[18]
웹사이트
Canada's Spatial Data Infrastructure
http://www.nrcan.gc.[...]
Government of Canada
[19]
웹사이트
Dictionary Definitions
http://www.interpare[...]
InterPARES2
2013-10-21
[20]
간행물
Conceptualizing Data
Sage
[21]
웹사이트
Cyberinfrastructure vision for 21st century discovery
https://www.nsf.gov/[...]
National Science Foundation
2024-04-09
[22]
간행물
Small Data, Data Infrastructures and Data Brokers
Sage
[23]
간행물
From punched cards to "big data": a social history of database populism
http://scholarworks.[...]
2013-02-22
[24]
간행물
Small Data, Data Infrastructures and Data Brokers
Sage
[25]
간행물
The importance of data preservation
https://gsa.confex.c[...]
The Geological Society of America
2017-11-29
[26]
간행물
The importance of data preservation
https://gsa.confex.c[...]
The Geological Society of America
2017-11-29
[27]
간행물
Small Data, Data Infrastructures and Data Brokers
Sage
[28]
문서
Retain [Definition]
https://www.merriam-[...]
Marriam-Webster
2017
[29]
문서
Preserve [Definition]
https://www.merriam-[...]
Marriam-Webster
2107
[30]
간행물
Digital Preservation for Libraries, Archives, and Museums
Rowman & Littlefield Publishers
[31]
간행물
Data Preservation
http://ifdo.org/word[...]
2017-11-28
[32]
간행물
Small Data, Data Infrastructures and Data Brokers
Sage
[33]
간행물
Digital Preservation for Libraries, Archives, and Museums
Rowman & Littlefield Publishers
[34]
서적
Geo-spatial Data Preservation Primer
Hickling, Aurthurs and Low
[35]
웹사이트
About Us
https://ida.loni.usc[...]
2024-04-11
[36]
서적
Caring for the Digital Content, Mapping International Approaches
NUI Maynooth, Trinity College Dublin, Royal Irish Academy and Digital Repository of Ireland
[37]
웹사이트
About DANS
https://dans.knaw.nl[...]
Data Archiving and Networked Services
2024-04-11
[38]
웹사이트
Project Factsheets
https://www.openaire[...]
OpenAIRE
2024-04-11
[39]
웹사이트
The OAIS reference model
https://www.oclc.org[...]
2024-04-11
[40]
웹사이트
About DRI
https://dri.ie/about[...]
Digital Repository of Ireland
2024-04-11
[41]
웹사이트
Canada's Spatial Data Infrastructure
http://www.nrcan.gc.[...]
Government of Canada
2024-04-11
[42]
웹인용
Dictionary Definitions
http://www.interpare[...]
InterPARES2
2013-10-21
[43]
저널
Conceptualizing Data
Sage
[44]
웹인용
Cyberinfrastructure vision for 21st century discovery
https://www.nsf.gov/[...]
National Science Foundation
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com