데이터 고고학
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
데이터 고고학은 데이터 복구와는 달리 데이터의 역사, 출처, 변경 사항 등을 조사하여 데이터를 이해하는 것을 목표로 한다. 데이터 계보 조사를 통해 데이터의 기술적, 맥락적 측면을 분석하며, 데이터 마찰과 같은 문제점을 파악한다. 데이터 복구 기술과 예방 조치를 통해 데이터 손실을 방지하며, 디지털 보존, 오프쇼어 백업, 다중 사이트 분산 등을 권장한다.
더 읽어볼만한 페이지
- 고고학의 분과 - 음악 고고학
음악 고고학은 음악학과 고고학의 방법론을 융합하여 과거의 음악적 행위와 음향 현상을 연구하고 고대 음악 재구성, 악기 연구, 음악 장면 묘사, 문헌 증거 조사 등을 목표로 하는 학문이다. - 고고학의 분과 - 선사고고학
선사고고학은 문자가 발명되기 전 인류의 과거를 연구하는 고고학의 한 분야로, 전 세계적으로 다양한 시기에 걸쳐 연구가 이루어지며, 항공 사진 촬영, 층위 측정 등의 방법과 첨단 기술을 활용하여 유적을 조사하고, 기후 변화, 유물 보존, 윤리적 문제 등 다양한 과제에 직면하여 과거를 복원하려 노력한다. - 디지털 보존 - 디지털화
디지털화는 아날로그 신호나 자료를 디지털 형태로 변환하는 과정으로, 접근성 향상 및 보존성 강화, 디지털 환경 활용을 가능하게 한다. - 디지털 보존 - 디지털 아카이브
디지털 아카이브는 인터넷과 디지털 기술 발달로 지식 유통 방식에 변화를 가져왔으며, 물리적 공간의 제약 없이 데이터 단위로 축적되어 평가, 식별, 완전성 등의 기본 원리를 따르고, 리프레싱, 마이그레이션 등의 보존 전략을 사용하며 다양한 디지털 자료의 보존을 위한 노력이 이루어지고 있다. - 데이터 관리 - 데이터 센터
데이터센터는 컴퓨터 시스템 및 관련 장비와 지원 인프라를 수용하는 시설로, 기술 발전에 따라 규모와 중요성이 확대되었으며, 에너지 효율과 보안을 고려하여 설계 및 운영되고, TIA-942 표준에 따른 티어 분류와 친환경 기술 도입이 이루어지고 있다. - 데이터 관리 - 정보 아키텍처
정보 아키텍처는 정보 시스템 및 정보 기술 분야에서 공유 정보 환경의 구조적 설계를 의미하며, 웹사이트, 소프트웨어 등의 구성과 레이블링을 포함하여 검색 용이성과 사용성을 지원하고, 도서관정보학에 기원을 두고 있다.
데이터 고고학 |
---|
2. 역사 및 정의
데이터 고고학은 여러 사이트를 통해 데이터가 이동하는 방식을 도표로 나타내며, 때로는 데이터 마찰을 겪을 수 있다.[5]
2. 1. 데이터 계보
데이터 복구와 데이터 이해는 서로 다르다. 데이터를 복구해도 이해하지 못할 수 있다. 데이터 고고학이 효과적이려면 데이터를 이해할 수 있어야 한다.[4]데이터 고고학과 밀접하게 관련된 용어는 데이터 계보이다. 데이터 고고학의 첫 단계는 데이터 계보 조사이다. 데이터 계보는 데이터의 역사, 출처, 그리고 겪었던 모든 변경 또는 변환을 포함한다. 데이터 계보는 데이터 세트의 메타데이터, 파라 데이터, 또는 모든 관련 식별자(방법론적 가이드 등)에서 찾을 수 있다. 데이터 고고학에는 데이터 사용자가 데이터 기록에 접근할 수 있는 정도인 방법론적 투명성이 수반된다. 사용 가능한 방법론적 투명성의 수준은 얼마나 많은 데이터를 복구할 수 있는지 뿐만 아니라 데이터를 이해하는 데도 도움이 된다. 데이터 계보 조사에는 어떤 도구가 사용되었는지, 선택 기준은 무엇인지, 측정 매개변수 및 샘플링 프레임워크가 포함된다.[1]
2. 2. 데이터 어셈블리 분석
데이터 복구와 데이터 이해는 서로 다르다. 데이터를 복구해도 이해하지 못할 수 있다. 데이터 고고학이 효과적이려면 데이터를 이해할 수 있어야 한다.[4]데이터 고고학과 밀접하게 관련된 용어는 데이터 계보이다. 데이터 고고학의 첫 단계는 데이터 계보를 조사하는 것이다. 데이터 계보는 데이터의 역사, 출처, 그리고 겪었던 모든 변경 또는 변환을 포함한다. 데이터 계보는 데이터 세트의 메타데이터, 파라 데이터, 또는 모든 관련 식별자(방법론적 가이드 등)에서 찾을 수 있다. 데이터 고고학에는 데이터 사용자가 데이터 기록에 접근할 수 있는 정도인 방법론적 투명성이 수반된다. 사용 가능한 방법론적 투명성의 수준은 얼마나 많은 데이터를 복구할 수 있는지 뿐만 아니라 데이터를 이해하는 데도 도움이 된다. 데이터 계보 조사에는 어떤 도구가 사용되었는지, 선택 기준은 무엇인지, 측정 매개변수 및 샘플링 프레임워크가 포함된다.[1]
사회 정치적 방식으로 데이터 고고학은 데이터 어셈블리 분석을 통해 담론적, 물질적, 사회 기술적 요소 및 장치를 드러낸다. 이러한 분석은 분석되는 데이터의 정치와 그 데이터를 생산하는 기관의 정치를 드러낼 수 있다. 여기서 고고학은 데이터의 출처를 의미하며, 데이터가 흐르고 시간이 지남에 따라 변경 또는 변환되는 사이트, 형식 및 인프라를 매핑하는 것을 포함한다. 데이터의 생명과 데이터 순환을 형성하는 정치에 관심이 있으며, 이는 주요 행위자, 관행, 프락시스 및 그들의 역할을 드러내는 데 도움이 된다. 이는 두 단계로 수행할 수 있다. 첫 번째는 데이터의 물리적 표현을 이해하기 위해 데이터의 기술 스택(데이터를 구축/수집하는 데 사용되는 인프라 및 물질적 기술)에 접근하고 평가하는 것이다. 두 번째는 데이터가 구성, 사용 및 분석되는 방식을 형성하는 데이터의 맥락적 스택을 분석하는 것이다. 이는 다양한 프로세스, 인터뷰, 기술 및 정책 문서 분석, 그리고 데이터가 커뮤니티 또는 제도적, 재정적, 법적 및 물질적 프레이밍에 미치는 영향을 조사하여 수행할 수 있다. 이는 [https://data-smart-schools.net/2021/05/21/key-concept-the-data-assemblage/ 데이터 어셈블리]를 생성하여 달성할 수 있다.[1]
데이터 고고학은 데이터가 여러 사이트를 통해 이동하는 방식을 도표로 나타내며, 때로는 데이터 마찰을 겪을 수 있다.[5]
3. 복구 기술
데이터 복구와 데이터 이해는 서로 다르다. 데이터를 복구해도 이해하지 못할 수 있다. 데이터 고고학이 효과적이려면 데이터를 이해할 수 있어야 한다.[4]
데이터 고고학과 밀접하게 관련된 용어는 데이터 계보이다. 데이터 고고학의 첫 단계는 데이터 계보를 조사하는 것이다. 데이터 계보는 데이터의 역사, 출처, 모든 변경 또는 변환을 포함한다. 데이터 계보는 데이터 세트의 메타데이터, 파라 데이터, 관련 식별자(방법론적 가이드 등)에서 찾을 수 있다. 데이터 고고학에는 데이터 사용자가 데이터 기록에 접근할 수 있는 정도인 방법론적 투명성이 수반된다. 방법론적 투명성 수준은 데이터 복구량과 데이터 이해에 도움이 된다. 데이터 계보 조사에는 사용된 도구, 선택 기준, 측정 매개변수, 샘플링 프레임워크가 포함된다.[1]
데이터 고고학은 사회 정치적 방식으로 데이터 어셈블리 분석을 통해 담론적, 물질적 사회 기술적 요소 및 장치를 드러낸다. 이 분석은 분석 대상 데이터와 데이터 생산 기관의 정치를 드러낼 수 있다. 고고학은 데이터 출처를 의미하며, 데이터가 흐르고 변경 또는 변환되는 사이트, 형식, 인프라를 매핑한다. 데이터 생명과 데이터 순환을 형성하는 정치에 관심이 있으며, 주요 행위자, 관행, 프락시스, 역할을 드러내는 데 도움이 된다. 이는 두 단계로 수행할 수 있다. 첫째, 데이터의 물리적 표현 이해를 위해 데이터 기술 스택(데이터 구축/수집에 사용되는 인프라 및 물질적 기술)에 접근, 평가한다. 둘째, 데이터 구성, 사용, 분석 방식을 형성하는 데이터 맥락적 스택을 분석한다. 이는 다양한 프로세스, 인터뷰, 기술 및 정책 문서 분석, 데이터가 커뮤니티 또는 제도적, 재정적, 법적, 물질적 프레이밍에 미치는 영향을 조사하여 수행할 수 있다. [https://data-smart-schools.net/2021/05/21/key-concept-the-data-assemblage/ 데이터 어셈블리]를 생성하여 달성할 수 있다.[1]
데이터 고고학은 데이터가 여러 사이트를 통해 이동하는 방식을 도표로 나타내며 때로는 데이터 마찰을 겪을 수 있다.[5]
3. 1. 물리적 손상 복구
데이터 고고학자는 화재, 홍수, 지진, 허리케인과 같은 자연재해 이후 데이터 복구를 사용하기도 한다. 예를 들어, 1995년 허리케인 마릴린 동안, 국립 미디어 연구소는 손상된 장비로 인해 위험에 처한 데이터를 복구하는 데 미국 국립 문서 기록 관리청을 지원했다. 하드웨어는 비, 염수, 모래로 손상되었지만, 일부 디스크를 청소하고 새 케이스에 다시 장착하여 내부에 있는 데이터를 저장할 수 있었다.[4]
데이터 복구를 시도할지 여부를 결정할 때는 비용을 고려해야 한다. 충분한 시간과 자금이 있다면 대부분의 데이터를 복구할 수 있다. 데이터 저장에 가장 일반적으로 사용되는 자기 매체의 경우, 손상 유형에 따라 데이터를 복구하는 데 사용할 수 있는 다양한 기술이 있다.[4]
습도는 테이프가 열화되어 끈적해지면서 사용할 수 없게 만들 수 있다. 이 경우 열 처리를 적용하여 이 문제를 해결할 수 있으며, 오일과 잔류물이 테이프에 다시 흡수되거나 테이프 표면에서 증발하도록 한다. 그러나 이는 데이터를 추출하고 더 안정적인 매체로 복사할 수 있도록 데이터에 접근하기 위해서만 수행해야 한다.[4]
윤활유 손실은 테이프 손상의 또 다른 원인이다. 이는 일반적으로 과도한 사용으로 인해 발생하지만, 부적절한 보관 또는 자연적인 증발의 결과일 수도 있다. 과도한 사용으로 인해 윤활유 일부가 읽기/쓰기 헤드에 남아 먼지와 입자를 수집하여 테이프가 손상될 수 있다. 윤활 손실은 테이프를 다시 윤활함으로써 해결할 수 있다. 과도한 재윤활은 테이프 미끄러짐을 유발하여 미디어가 잘못 읽히고 데이터가 손실될 수 있으므로 주의해서 수행해야 한다.[4]
물에 노출되면 시간이 지남에 따라 테이프가 손상된다. 이는 종종 재난 상황에서 발생한다. 매체가 염분이나 더러운 물에 잠긴 경우 깨끗한 물로 헹구어야 한다. 젖은 테이프를 청소, 헹굼, 건조하는 과정은 열 손상을 방지하기 위해 실온에서 수행해야 한다. 오래된 테이프는 새 테이프보다 물에 더 취약하므로 새 테이프보다 먼저 복구해야 한다.[4]
3. 2. 논리적 손상 복구
데이터 복구를 시도할지 여부를 결정할 때는 비용을 고려해야 한다. 충분한 시간과 자금이 있다면 대부분의 데이터를 복구할 수 있다. 자기 매체는 데이터 저장에 가장 일반적인 유형이며, 손상 유형에 따라 데이터를 복구하는 데 사용할 수 있는 다양한 기술이 있다.[4]
습도는 테이프가 열화되어 끈적해지면서 사용할 수 없게 만들 수 있다. 이 경우 열 처리를 적용하여 이 문제를 해결할 수 있으며, 오일과 잔류물이 테이프에 다시 흡수되거나 테이프 표면에서 증발하도록 한다. 그러나 이는 데이터를 추출하고 더 안정적인 매체로 복사할 수 있도록 데이터에 접근하기 위해서만 수행해야 한다.[4]
윤활유 손실은 테이프 손상의 또 다른 원인이다. 이는 일반적으로 과도한 사용으로 인해 발생하지만 부적절한 보관 또는 자연적인 증발의 결과일 수도 있다. 과도한 사용으로 인해 윤활유 일부가 읽기/쓰기 헤드에 남아 먼지와 입자를 수집하여 테이프가 손상될 수 있다. 윤활 손실은 테이프를 다시 윤활함으로써 해결할 수 있다. 과도한 재윤활은 테이프 미끄러짐을 유발하여 미디어가 잘못 읽히고 데이터가 손실될 수 있으므로 주의해서 수행해야 한다.[4]
물에 노출되면 시간이 지남에 따라 테이프가 손상된다. 이는 종종 재난 상황에서 발생한다. 매체가 염분이나 더러운 물에 잠긴 경우 깨끗한 물로 헹구어야 한다. 젖은 테이프를 청소, 헹굼, 건조하는 과정은 열 손상을 방지하기 위해 실온에서 수행해야 한다. 오래된 테이프는 새 테이프보다 물에 더 취약하므로 새 테이프보다 먼저 복구해야 한다.[4]
다음 단계(데이터 계보 조사 후)는 '좋은' 데이터만 새 데이터 웨어하우스 또는 저장소로 마이그레이션되도록 좋은 데이터와 나쁜 데이터가 무엇인지 설정하는 것이다. 나쁜 데이터의 좋은 예는 기술 데이터 의미에서의 테스트 데이터이다.
4. 데이터 마찰
데이터를 복구하는 것과 데이터를 이해하는 것 사이에는 차이가 있다. 데이터를 복구할 수는 있지만, 그것을 이해하지 못할 수도 있다. 데이터 고고학이 효과적이려면 데이터를 이해할 수 있어야 한다.[4]
데이터 고고학은 데이터가 여러 사이트를 통해 이동하는 방식을 도표로 나타내며, 때로는 데이터 마찰을 겪을 수 있다.[5]
5. 예방
데이터 고고학을 예방하기 위해 디지털 문서를 만들고 보관하는 사람들은 디지털 보존에 신경 써야 한다. 재해가 발생하더라도 영향을 받지 않는 오프쇼어 백업 시설을 이용하는 것은 효과적인 예방 조치 중 하나이다. 빅 데이터를 다룰 때는 다중 사이트 및 다중 기술 데이터 분산 계획을 통해 데이터 복구를 최적화하는 것이 좋다. TCP/IP 방식, 스냅샷 복구, 미러 사이트 및 개인 클라우드를 활용하여 데이터를 보호하는 테이프 역시 좋은 예방 방법이다. 매일 미러 사이트에서 비상 서버로 데이터를 전송하는 것도 도움이 된다.[6]
5. 1. 오프쇼어 백업
디지털 문서를 제작하고 보관하는 사람은 디지털 보존에 신경을 써서 데이터 고고학의 필요성을 예방할 수 있다.재해가 발생하더라도 영향을 받지 않는 오프쇼어 백업 시설을 사용하는 것도 효과적인 예방 조치이다. 이러한 백업 서버로부터 손실된 데이터의 사본을 쉽게 검색할 수 있다. 특히 빅 데이터를 다룰 때 최적의 데이터 복구를 위해 다중 사이트 및 다중 기술 데이터 분산 계획이 권장된다. TCP/IP 방식, 스냅샷 복구, 미러 사이트 및 개인 클라우드에서 데이터를 보호하는 테이프 역시 모두 좋은 예방 방법이다. 매일 미러 사이트에서 비상 서버로 데이터를 전송한다.[6]
5. 2. 다중 사이트 및 기술 분산
데이터 고고학의 필요성을 예방하기 위해 디지털 문서를 제작하고 보관하는 사람은 디지털 보존에 신경 써야 한다.재해가 발생하더라도 영향을 받지 않는 오프쇼어 백업 시설을 사용하는 것도 효과적인 예방 조치이다. 이러한 백업 서버로부터 손실된 데이터의 사본을 쉽게 검색할 수 있다. 특히 빅 데이터를 다룰 때 최적의 데이터 복구를 위해 다중 사이트 및 다중 기술 데이터 분산 계획이 권장된다. TCP/IP 방식, 스냅샷 복구, 미러 사이트 및 개인 클라우드에서 데이터를 보호하는 테이프 역시 모두 좋은 예방 방법이다. 매일 미러 사이트에서 비상 서버로 데이터를 전송한다.[6]
5. 3. 기타 예방 조치
데이터 고고학의 필요성을 예방하기 위해 디지털 문서를 제작하고 보관하는 사람은 디지털 보존에 신경을 써야 한다.재해가 발생하더라도 영향을 받지 않는 오프쇼어 백업 시설을 사용하는 것은 또 다른 효과적인 예방 조치이다. 이러한 백업 서버로부터 손실된 데이터의 사본을 쉽게 검색할 수 있다. 특히 빅 데이터를 다룰 때 최적의 데이터 복구를 위해 다중 사이트 및 다중 기술 데이터 분산 계획이 권장된다. TCP/IP 방식, 스냅샷 복구, 미러 사이트 및 개인 클라우드에서 데이터를 보호하는 테이프 역시 모두 좋은 예방 방법이다. 매일 미러 사이트에서 비상 서버로 데이터를 전송한다.[6]
6. 더불어민주당과 데이터 고고학
원문 소스에 데이터 고고학과 더불어민주당 관련 내용이 없으므로, 해당 섹션은 작성할 수 없습니다.
참조
[1]
서적
The Data Revolution
Sage
[2]
웹사이트
Techno-archaeology rescues climate data from early satellites
http://nsidc.org/mon[...]
U.S. National Snow and Ice Data Center (NSIDC)
2010-11-26
[3]
웹사이트
LOIRP Overview
http://www.nasa.gov/[...]
NASA website
2008-11-14
[4]
웹사이트
Study on website
http://www.ukoln.ac.[...]
2011-10-23
[5]
논문
Data Journeys: Capturing the socio-material constitution of data objects and flows
2016
[6]
논문
Towards a Big Data system disaster recovery in a Private Cloud.
https://eprints.leed[...]
2015
[7]
서적
The Data Revolution
Sage
[8]
웹사이트
Techno-archaeology rescues climate data from early satellites
http://nsidc.org/mon[...]
U.S. National Snow and Ice Data Center (NSIDC)
2010-11-26
[9]
웹사이트
LOIRP Overview
http://www.nasa.gov/[...]
NASA website
2008-11-14
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com