공공 데이터

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

공공 데이터는 정부, 지방자치단체 및 공공기관이 보유·관리하는 데이터를 국민이 자유롭게 활용할 수 있도록 개방하는 것을 의미한다. 개인정보, 저작권, 국가 안보 관련 정보 등은 제외되며, 파일 데이터, 오픈 API, 시각화 등 다양한 방식으로 제공된다. 개방 데이터는 오픈 정의에 따라 자유로운 사용, 재사용, 재배포가 가능하며, 지도, 게놈, 의료 데이터 등 다양한 형태를 포함한다. 과학 데이터에 대한 오픈 액세스는 국제 지구 관측년(1957-1958)을 통해 확립되었고, OECD는 공공 자금 지원 연구 데이터 공개를 권고했다. 대한민국은 공공데이터포털을 통해 데이터를 제공하며, 관련 법률 및 제도를 통해 활용을 지원한다. 공공 데이터 개방은 투명성, 경제 성장, 사회 경제적 발전에 기여하는 반면, 민간 경쟁, 데이터 제공 비용, 개인 정보 보호 등의 우려도 존재한다. 공공 데이터는 오픈 액세스, 오픈 콘텐츠 등 다른 "오픈" 활동과 관련되며, 공유 자원으로서의 가치도 지닌다.

공공 데이터
📚 더 읽어볼만한 페이지
  • 오픈 데이터 - 오픈스트리트맵
    오픈스트리트맵(OSM)은 전 세계 사용자들이 참여하여 자유롭게 이용할 수 있도록 만들어진 크라우드소싱 기반의 세계 지도로, 오픈 데이터베이스 라이선스(ODbL)에 따라 배포되며 다양한 분야에서 활용되고 지속적으로 발전하고 있다.
  • 오픈 데이터 - 열린 정부
    열린 정부는 투명성, 참여, 책무성을 통해 정부 활동에 대한 시민 이해를 돕고 정책 결정 참여를 장려하여 책임성을 강화하는 개념으로, OECD는 정부 조정, 시민 참여, 정보 접근 등의 범주로 접근하며, 전자 참여를 통해 시민의 거버넌스 직접 참여를 가능하게 한다.
  • 공공 서비스 - 공중화장실
    공중화장실은 대중이 이용하는 화장실 시설로, 시대에 따라 형태와 기능이 변화해 왔으며 위생, 안전, 사생활 보호 등 사회문화적 문제와 관련되어 스마트 화장실 기술 도입, 성 중립 화장실 확대 등 사회적 변화에 대한 논의가 이루어지고 있다.
  • 공공 서비스 - 양수기
    양수기는 주택, 상업 시설, 산업 현장 등에서 수도 사용량을 측정하여 상수도 공급업체가 요금을 부과하는 데 사용되는 기기로, 유량 측정 방식에 따라 다양한 종류가 있으며 최근에는 스마트 수도 계량 시스템으로 발전하고 있다.

2. 공공 데이터 개방의 개념 및 정의

공공 데이터 개방은 단순한 정보 공개를 넘어, 데이터를 누구나 자유롭게 사용, 재사용 및 재배포할 수 있도록 하는 것을 의미한다.

개방 데이터의 개념은 새로운 것은 아니지만, 공식적인 정의는 비교적 최근에 생겨났다. 개방 데이터는 정부 데이터를 저작권 제한 없이 모든 사람이 어떤 형태로든 재분배할 수 있도록 해야 함을 의미한다. 오픈 정의(Open Definition)는 개방 데이터를 "누구든지 자유롭게 사용, 재사용 및 재배포할 수 있는 데이터"로 요약한다. 이 경우 귀속 및/또는 동일 조건 공유 요구 사항만 적용될 수 있다. 오픈 데이터 연구소(Open Data Institute)는 "개방 데이터는 누구나 접근, 사용 또는 공유할 수 있는 데이터"라는 짧은 버전의 정의를 제공하지만, 공식적인 정의를 참조한다.

개방 데이터 운동의 주요 장벽은 데이터의 상업적 가치이다. 데이터 접근 또는 재사용은 종종 공공 또는 민간 조직에 의해 통제된다. 이러한 통제는 접근 제한, 라이선스, 저작권, 특허 및 접근 또는 재사용에 대한 요금을 통해 이루어질 수 있다. 개방 데이터 옹호자들은 이러한 제한이 공공의 이익을 저해하며, 데이터는 제한이나 수수료 없이 사용할 수 있어야 한다고 주장한다.

데이터 제작자는 소유권, 라이선스 및 재사용 조건 명시의 필요성을 고려하지 않고, 저작권을 주장하지 않으면 해당 데이터가 공공 영역에 들어간다고 추정하기도 한다. 예를 들어, 많은 과학자들은 자신들의 연구와 함께 출판된 데이터를 통제 대상으로 간주하지 않으며, 학술지에 출판하는 행위를 암묵적으로 데이터를 공유지로 공개하는 것으로 여긴다. 그러나 라이선스의 부재는 데이터 세트의 상태를 결정하기 어렵게 만들고, "개방" 정신으로 제공된 데이터의 사용을 제한할 수 있다. 이러한 불확실성 때문에 공공 또는 민간 조직이 해당 데이터를 집계하고, 저작권으로 보호한다고 주장한 다음 이를 재판매할 수도 있다.

2.1. 공공 데이터 개방의 정의

공공데이터 개방이란 정부, 지방자치단체 및 공공기관이 보유·관리하는 공공데이터를 이용자가 자유롭게 활용할 수 있도록 다양한 형태로 개방·제공하는 것이다. 대한민국 정부, 지방자치단체 및 공공기관은 공공데이터를 이용자가 자유롭게 활용할 수 있도록 다양한 형태로 개방·제공하고 있다. 단, 개인정보보호, 제3자의 권리(저작권 등)가 포함된 정보, 국가 안보와 질서에 관련한 정보 등은 제외된다.

공공 데이터는 누구나 자유롭게 이용할 수 있으며 공공데이터포털을 통해 국민이 쉽고 편리하게 공공데이터를 이용할 수 있도록 파일데이터, 오픈API, 시각화 등 다양한 방식으로 제공하고 있으며, 누구라도 쉽고 편리한 검색을 통해 원하는 공공데이터를 빠르고 정확하게 찾을 수 있다.

개방 데이터의 개념은 새로운 것은 아니지만, 공식적인 정의는 비교적 최근에 생겨났다. 오픈 정의(Open Definition)에 따르면, 개방 데이터는 "누구든지 자유롭게 사용, 재사용 및 재배포할 수 있는 데이터"로 요약될 수 있다. 이 경우 귀속 및/또는 동일 조건 공유 요구 사항만 적용될 수 있다. 오픈 데이터 연구소(Open Data Institute)는 "개방 데이터는 누구나 접근, 사용 또는 공유할 수 있는 데이터"라는 짧은 버전의 정의를 가지고 있지만, 공식적인 정의를 참조한다. 개방 데이터는 지도, 게놈, 커넥톰, 화학 화합물, 수학 및 과학 공식, 의료 데이터 및 관행, 생명 과학 및 생물 다양성과 같은 텍스트가 아닌 자료를 포함할 수 있다.

http://opendefinition.org/ Open Definition에 따르면 오픈 데이터는 "자유롭게 사용하고 재사용할 수 있으며, 누구든지 재배포할 수 있는 데이터이다. 따라야 할 규칙은 기껏해야 '작성자 크레딧을 남기기' 또는 '같은 조건으로 배포하기' 정도이다"라는 명제로 요약할 수 있다.

오픈 데이터는 종종 지도, 게놈, 커넥톰, 화합물, 수학 및 자연 과학의 수식, 의료 데이터 및 실습, 생명 과학 및 생물 다양성과 같은 텍스트가 아닌 자료에 초점을 맞춘다.

2.2. 공공 데이터의 범위

오픈 정의(Open Definition)에 따르면, 공공 데이터는 누구나 자유롭게 사용, 재사용 및 재배포할 수 있는 데이터이다. 오픈 데이터 연구소(Open Data Institute)는 "공공 데이터는 누구나 접근, 사용 또는 공유할 수 있는 데이터"라고 정의한다.

공공 데이터는 지도, 게놈, 커넥톰, 화학 화합물, 수학 및 과학 공식, 의료 데이터 및 관행, 생명 과학 및 생물 다양성과 같은 텍스트가 아닌 자료를 포함할 수 있다.

2.3. 공공 데이터 개방의 중요성

공공 데이터 개방은 정부, 지방자치단체 및 공공기관이 보유·관리하는 공공데이터를 이용자가 자유롭게 활용할 수 있도록 다양한 형태로 개방·제공하는 것이다. 대한민국 정부는 공공데이터를 통해 정부의 투명성과 책임성을 높이고, 시민들의 참여를 촉진하며, 새로운 비즈니스 모델 발굴과 경제 성장에 기여하고자 한다.

데이터 재사용에 대한 제한은 반공유지를 생성하고, 사회 경제적 발전을 저해할 수 있다는 주장이 제기된다. 공공데이터는 인류영어에 속하며, 정부 지출 (공공 기금)이 해당 작업 자금으로 사용되었으므로, 보편적으로 이용 가능해야 한다는 것이다.

일부에서는 공식 정보 공개가 제3자가 새로운 종류의 디지털 애플리케이션과 서비스를 개발할 수 있도록 하여 기술 혁신과 경제 성장을 지원할 수 있다고 주장한다. 또한, 데이터를 공개하여 시민들이 정부 부문과 소통하고 "해당 데이터에 가치를 더할" 수 있도록 돕는 정부도 있다.

열린 과학 데이터의 개념은 1957–1958년의 국제 지구 관측년을 준비하면서 세계 데이터 센터 시스템이 형성되면서 확립되었다.

3. 공공 데이터 개방의 역사

기업 및 연구 기관은 개방 데이터 지원을 위해 데이터 커먼즈 전략을 활용한다. 데이터 커먼즈는 사용자들이 데이터를 관리하고 공유할 수 있는 플랫폼이다. 로버트 그로스먼(Robert L. Grossman)은 데이터 커먼즈 전략의 주요 고려 사항으로 영구적인 디지털 ID, 메타데이터, 응용 프로그래밍 인터페이스(API) 기반 접근, 데이터 이식성, 데이터 피어링, 컴퓨팅 접근 방식을 제시했다.

독일과 같은 국가들은 전국적인 개방 데이터 전략을 발표하여 공공의 이익을 위한 데이터 관리 시스템 개발 및 유지 방안을 상세히 설명했다.

3.1. 국제 지구 관측년 (1957-1958)

과학 데이터에 대한 오픈 액세스 개념은 1957-58년 국제 지구 관측년을 준비하면서 세계 데이터 센터 시스템이 형성되면서 확립되었다. 국제 과학 연합 협의회(현재 국제 과학 협의회)는 데이터 손실 위험을 최소화하고 데이터 접근성을 극대화하기 위해 여러 세계 데이터 센터를 감독한다.

3.2. OECD의 노력

2004년, 경제 협력 개발 기구(OECD)의 모든 국가 과학 장관들은 공공 자금으로 지원되는 모든 보관 데이터를 공개적으로 이용할 수 있도록 한다는 선언문에 서명했다. 2007년, OECD는 공공 자금 지원 연구 데이터에 대한 접근을 위한 OECD 원칙 및 지침을 Soft law영어 권고로 발표했다. 이는 법적 구속력은 없지만 회원국 정부에 대한 압력으로 작용한다.

4. 대한민국의 공공 데이터 개방 현황 및 정책

대한민국은 정부, 지방자치단체 및 공공기관이 보유·관리하는 공공데이터를 국민들이 자유롭게 활용할 수 있도록 다양한 형태로 개방·제공하고 있다. 이는 개인정보보호, 제3자의 권리(저작권 등), 국가 안보 및 질서와 관련된 정보를 제외한 모든 공공데이터에 적용된다. 이러한 공공데이터 개방 정책은 디지털 뉴딜 정책의 핵심 과제 중 하나로 적극적으로 추진되고 있다.

공공 데이터는 누구나 자유롭게 이용할 수 있으며, 정부는 공공데이터포털을 통해 다양한 방식으로 제공하고 있다. 일부 지지자들은 정부 정보를 기계가 읽을 수 있는 공공 데이터로 공개하면 정부의 투명성, 책임성 및 공공 참여를 촉진할 수 있다고 주장한다. 또한, 공공 데이터 공개는 제3자가 새로운 종류의 디지털 애플리케이션과 서비스를 개발할 수 있도록 하여 기술 혁신과 경제 성장을 지원할 수 있다는 주장도 있다.

일본에서는 동일본 대지진을 계기로 오픈 데이터에 대한 관심이 높아졌다. 2012년 7월, IT 종합 전략 본부는 전자 행정 오픈 데이터 전략을 수립했고, 2016년에는 "오픈 데이터 2.0"을 결정하여 오픈 데이터 강화 분야 지정, 민간 협력 요청, 지역 간 공통 분야 및 지역 특성 맞춤 노력 촉진 등을 포함시켰다.

2016년 12월 14일, 관민 데이터 활용 추진 기본법이 공포·시행되었고, 2017년 5월 30일에는 「세계 최첨단 IT 국가 창조 선언·관민 데이터 활용 추진 기본 계획」이 각의 결정되었다. 같은 날, 국가, 지방 공공 단체, 사업자가 공공 데이터 공개 및 활용에 있어 기본적인 지침을 제시하는 오픈 데이터 기본 지침이 공개되었다.

2021년 10월 기준으로 일본의 약 67%의 지방 자치 단체가 오픈 데이터에 참여하고 있으며, 특히 인구 20만 명 이상의 도시와 도쿄도 특별구에서는 참여율이 100%에 달한다. 후쿠이현 사바에시는 "데이터 시티 사바에"로 알려져 있으며, 공공 시설 정보, 지도, 버스 위치 정보 등을 크리에이티브 커먼즈 라이선스로 제공하고 앱 개발 콘테스트를 개최하는 등 선도적인 역할을 하고 있다. 가나가와현 요코하마시는 시민 주도의 위원회와 함께 워크숍, 개발 이벤트, 크라우드 펀딩 사이트 운영 등 다양한 활동을 추진하고 있다.

Project PLATEAU(프로젝트 플래토)는 국토교통성이 2020년부터 일본 각지 도시의 3D 모델을 정비하여 오픈 데이터로 공개하는 사업이다.

4.1. 공공데이터포털

공공데이터포털을 통해 국민이 쉽고 편리하게 공공데이터를 이용할 수 있도록 파일데이터, 오픈API, 시각화 등 다양한 방식으로 데이터를 제공하며, 누구나 쉽고 편리한 검색을 통해 원하는 공공데이터를 빠르고 정확하게 찾을 수 있다.

4.2. 공공 데이터 활용 지원

정부는 공공데이터 이용에 대한 국민의 인식을 높이고 이용 활성화를 위해, 공공데이터 활용 기업의 창업부터 성장까지 전 과정을 지원한다. 대표적인 예로 오픈스퀘어-D와 '공공데이터 활용 창업경진대회'가 있다.

오픈스퀘어-D는 공공데이터에 대한 창의적인 아이디어를 가진 사람들이 경험과 기술을 교류하고, 사업화 및 창업으로 성장할 수 있도록 종합적으로 지원하는 열린 공간이다. 오픈스퀘어-D는 창업자들을 위한 입주공간, 아이디어 교류 및 발전을 위한 협업공간, 서비스 개발에 필요한 테스트 및 데이터 분석을 위한 테스트 공간으로 구성되어 있으며, 창업 단계별 교육, 맞춤형 컨설팅, 투자 유치 및 네트워킹 등 다양한 프로그램이 제공된다.

'공공데이터 활용 창업경진대회'는 공공데이터를 활용한 아이디어 또는 웹(앱) 제품 및 서비스 개발 아이템을 발굴하는 대회이다. 민간의 창의적인 아이디어를 공공데이터와 융합하여 새로운 비즈니스 모델을 발굴하고, 공공데이터 기반의 창업 촉진 및 창업 기업 육성을 목적으로 매년 1회 개최된다. 국민 누구나 참여 가능하며, 수상자에게는 시상금뿐만 아니라 제품 및 서비스 홍보, 사무공간 지원, 투자 유치, 창업 컨설팅 등 다양한 혜택이 제공된다.

4.3. 관련 법률 및 제도

2016년 12월 14일, 국민의 안전과 편익 증진을 목표로 공공 데이터 활용을 촉진하는 관민 데이터 활용 추진 기본법이 공포·시행되었다.

2017년 5월 30일, 정부는 「관민 데이터 활용 추진 기본법」 제8조에 따라 「세계 최첨단 IT 국가 창조 선언·관민 데이터 활용 추진 기본 계획」을 각의 결정했다. 이 법에 따라 광역 자치 단체는 「광역 자치 단체 관민 데이터 활용 추진 계획」 수립이 의무화되었고, 시·정·촌(특별구 포함)은 「시정촌 관민 데이터 활용 추진 계획」 수립을 위해 노력해야 한다.

같은 해 5월 30일, 국가, 지방 공공 단체, 사업자가 공공 데이터 공개 및 활용에 있어 기본적인 지침을 제시하는 오픈 데이터 기본 지침이 공개되었다.

4.4. 일본의 공공 데이터 개방 노력

동일본 대지진은 일본에서 오픈 데이터에 대한 관심을 높이는 계기가 되었다.

2012년 7월, IT 종합 전략 본부는 "[https://cio.go.jp/node/1622 전자 행정 오픈 데이터 전략]"을 수립하여 다음과 같은 내용을 정했다.

* 오픈 데이터의 기본 원칙 (적극적인 공공 데이터 공개, 기계 판독 가능 데이터 형식, 영리 목적을 포함한 2차 이용 촉진 등)
* 정부 주도의 노력 추진 및 독립 행정 법인, 지방 공공 단체, 공익 기업 등으로의 파급
* 추진 체제로서 관민 실무자 회의 설치

2013년 6월, IT 종합 전략 본부는 "[https://www.kantei.go.jp/jp/singi/it2/kettei/pdf/20130614/siryou3.pdf 전자 행정 오픈 데이터 추진을 위한 로드맵]"을 추가로 결정했다.

2013년 6월 25일, 각 부성 정보화 총괄 책임자(CIO) 연락 회의에서는 "[https://www.kantei.go.jp/jp/singi/it2/cio/dai52/kihon.pdf 2차 이용 촉진을 위한 부성 데이터 공개에 관한 기본적 생각(가이드라인)]"을 결정하여, 정부 웹페이지 저작권 처리에 대한 방침을 정했다.

2016년 5월 20일, 고도 정보 통신 네트워크 사회 추진 전략 본부는 "오픈 데이터 2.0"을 결정하고 다음 내용을 포함시켰다.

* 오픈 데이터 강화 분야(집중 노력 기간, 대상 분야) 지정 및 오픈 데이터 사이클 추진
* 민간 기업 등에 대한 협조 영역 오픈 데이터 공개 협력 요청
* 지역 간 공통 분야 및 지역 특성 맞춤 노력 촉진
* 실무자 회의 설치: 2013년 3월 28일, 고도 정보 통신 네트워크 사회 추진 전략 본부 결정에 따라 전자 행정 오픈 데이터 전략 관련 시책 조사 및 검토 회의체 설치.
* G8 오픈 데이터 헌장 합의: 2013년 영국 록 아언 G8 정상회담에서 일본 등 참가국들이 오픈 데이터 헌장에 합의. 2013년 10월, 일본 정부는 오픈 데이터 헌장 액션 플랜 책정 및 일원적 포털 사이트 작성.
* 정부 표준 이용 약관 책정
* 데이터 카탈로그 사이트 구축: 2013년 12월, 시험판 data.go.jp 공개, 2014년 10월 본격판 공개.
* 해커톤 개최: 2014년 3월까지 월평균 약 5건의 오픈 데이터 활용 해커톤 개최.
* 민관 데이터 활용 추진 기본법: 2016년 국회에서 의원입법으로 제출, 12월 7일 참의원 본회의 가결, 성립 및 즉시 시행.
* Project PLATEAU(프로젝트 플래토): 국토교통성이 2020년부터 일본 각지 도시의 3D 모델을 정비하여 오픈 데이터로 공개.
* 공공 데이터 이용 약관: 정부 표준 이용 약관 개정. 공공 데이터 이용 약관 참조.

5. 국제적인 공공 데이터 개방 현황

여러 국가 정부는 자체적으로 수집한 데이터의 일부를 배포하기 위해 웹사이트를 만들었다. 이는 지방 정부에서 공공 데이터 또는 열린 정부 데이터를 위해 문화를 만들고 구성하는 협업 프로젝트를 위한 개념이다.

캐나다를 비롯한 여러 국가에서 공공 데이터 개방을 추진하고 있다. Data.gov는 열린 데이터를 제공하는 웹사이트가 있는 총 40개의 미국 주와 46개의 미국 도시 및 카운티의 사이트를 나열한다. 예를 들어 메릴랜드, 캘리포니아, 뉴욕시 등이 있다.

국제적으로 유엔은 회원국 및 유엔 기구의 통계 데이터를 게시하는 공공 데이터 웹사이트를 운영하고 있으며, 세계은행은 개발도상국과 관련된 다양한 통계 데이터를 게시했다. 유럽 위원회는 유럽 연합을 위해 EU 공공 데이터 포털과 유럽 데이터 포털 두 개의 포털을 만들었으며, 2021년 4월 21일에 data.europa.eu로 통합되었다.

이탈리아는 공공 행정에서 광범위하게 사용하기 위해 크리에이티브 커먼즈 라이선스에 따라 표준 프로세스 및 지침을 공개한 최초의 국가이다. 이 개방형 모델은 공공 데이터 관리 주기라고 불리며 베네토 및 움브리아와 같은 여러 지역에서 채택되었다. 레지오 디 칼라브리아 및 제노바와 같은 주요 도시에서도 이 모델을 채택했다.

2024년 7월, OECD는 게시된 데이터 및 보고서에 크리에이티브 커먼즈 CC-BY-4.0 라이선스를 채택했다.

5.1. 주요 국가의 공공 데이터 포털

* Data.gov - 2009년 5월에 설립된 미국 정부의 오픈 데이터 웹사이트이다.
* Data.gov.uk - 2009년 9월에 설립된 영국 정부의 오픈 데이터 웹사이트이다.
* Data.europa.eu - 유럽 연합의 EU 기관, 기구 및 기타 기관의 공공 데이터와 유럽 전역의 지역, 지방 및 국가 공공 기관의 데이터 세트를 제공한다.
* 공공데이터포털 (Data.go.kr) - 대한민국 정부의 공공데이터 포털이다.

5.2. 국제 공공 데이터 헌장 (2015)

열린 정부 파트너십(OGP)은 2015년 10월 정부 공공 데이터 공개를 위한 일련의 원칙과 모범 사례인 국제 공공 데이터 헌장을 발표했다. 이 헌장은 멕시코에서 열린 OGP 글로벌 서밋에서 17개 국가, 주 및 도시 정부에서 공식적으로 채택되었다.

6. 공공 데이터 개방의 찬반 논쟁

공공 데이터 개방은 정부, 지방자치단체 및 공공기관이 보유·관리하는 공공데이터를 이용자가 자유롭게 활용할 수 있도록 다양한 형태로 개방·제공하는 것을 말한다. 그러나 개인정보보호, 제3자의 권리(저작권 등), 국가 안보 및 질서 관련 정보 등은 개방 대상에서 제외된다.

공공 데이터 개방에 대한 논쟁은 데이터의 상업적 가치, 저작권 문제, 개인 정보 보호 등 다양한 요인들로 인해 발생한다. 개방 데이터 운동은 이러한 제한이 공공의 이익을 저해하며, 데이터는 제한이나 수수료 없이 사용 가능해야 한다고 주장한다.

일반적으로 사실적 데이터는 저작권이 있을 수 없다고 간주되지만, 출판사는 종종 간행물에 동반되는 과학 데이터에 저작권 고지(종종 재사용 금지)를 추가한다. 텍스트에 포함된 사실적 데이터가 저작권의 일부인지 여부는 불분명하며, 논문에서 사실을 인간이 추출하는 것은 합법적이지만, 로봇에 의한 기계 추출은 암묵적으로 제한되는 경우가 많다.

오픈 액세스와 달리, 열린 데이터는 일반적으로 개별 기관에 의해 이의가 제기된다.

데이터 게시 수익은 데이터 생성 및 배포 비용을 충당하여 무기한 배포를 가능하게 하고, 비영리 단체의 다른 활동(예: 학회 출판을 통한 학회 지원)에 자금을 지원할 수 있다. 정부는 NIST(미국), Ordnance Survey(영국)처럼 특정 조직에 비용 회수 권한을 부여하기도 한다.

데이터 수집, 정리, 관리, 배포는 노동 집약적/비용 집약적이므로, 서비스 제공자는 공정한 보수를 받아야 한다. 후원자는 데이터의 부적절한 사용을 막기 위해 품질 관리, 배포, 브랜딩 노력이 필요하며, 이는 사용료 부과로 달성될 수 있다. 최종 사용자는 추가 처리(분석, 앱 등) 없이는 데이터를 사용하기 어려울 수 있으며, 접근 권한이 없으면 유용한 처리 유인이 없을 수 있다(생물학적, 의학적, 환경 데이터 등). 열린 데이터의 2차 사용(집계) 통제 부재도 문제점으로 지적된다.

"지속 가능한 정책 및 열린 데이터를 통한 연성 이동성 현지화 최적화" 논문은 열린 데이터가 도시의 연성 이동성(Soft Mobility)의 지속 가능성과 형평성을 개선하는 데 귀중한 도구라고 주장하며, 도시의 다양한 지역 요구 파악, 공정하고 형평한 알고리즘 개발, 연성 이동성 자원 설치 정당화에 활용될 수 있다고 한다.

6.1. 찬성 측 주장

* "데이터는 인류에 속한다"라는 주장은 게놈, 유기체, 의학, 환경 데이터 등과 같은 전형적인 예를 통해 뒷받침되며, 이는 오르후스 협약을 따른다.
* 정부 지출 (공공 기금)이 해당 작업 자금으로 사용되었으므로, 데이터는 보편적으로 이용 가능해야 한다.
* 데이터는 정부 기관에서 또는 정부 기관에 의해 생성되었다 (이는 미국 국립 연구소 및 정부 기관에서 흔히 볼 수 있다).
* 사실은 법적으로 저작권이 있을 수 없다.
* 연구 후원자는 결과 데이터를 자유롭게 이용할 수 없는 한, 완전한 가치를 얻지 못한다.
* 데이터 재사용에 대한 제한은 반공유지를 생성한다.
* 데이터는 공동의 인간 활동을 원활하게 진행하는 데 필요하며, 사회 경제적 발전 (의료, 교육, 경제 생산성 등)의 중요한 동인이다.
* 과학 연구에서 데이터 접근성이 좋아지면 발견 속도가 빨라진다.
* 데이터를 공개하면 "데이터 부패"와 싸우고 과학 연구 데이터가 시간이 지나도 보존되도록 하는 데 도움이 된다.
* 통계적 문해력은 열린 데이터로부터 이점을 얻는다. 강사는 지역 관련 데이터 세트를 사용하여 학생들에게 통계적 개념을 가르칠 수 있다.
* 과학 커뮤니티에서 열린 데이터를 허용하는 것은 발견 속도를 높이고 중요한 패턴을 인식하는 데 필수적이다.

6.2. 반대 측 주장

* 정부 기금은 민간 부문의 활동을 복제하거나 경쟁하는 데 사용될 수 있다. 예를 들어, PubChem과 같은 경우가 이에 해당할 수 있다.
* 정부는 납세자의 돈을 효율적으로 사용하는 것에 대해 책임을 져야 한다. 공공 기금이 데이터를 집계하는 데 사용되고, 그 데이터가 소수의 사용자에게만 상업적 이익을 가져다주는 경우, 사용자는 데이터 제공 비용을 정부에 보상해야 한다.
* 헬리콥터 연구 및 생물 해적 행위 문제가 발생할 수 있다. 개발도상국 관련 데이터를 부유한 연구 기관이 이용하여 지역 사회에 대한 추가적인 참여나 이익 없이 결과를 게시하는 경우가 이에 해당한다. 열대 우림에 대한 역사적인 개방 접근은 개발도상국에서 식물 유전자원을 도용하는 결과를 초래하기도 했다.
* 개인 정보 보호 문제는 데이터 접근을 특정 사용자로 제한하거나 데이터의 하위 집합으로 제한해야 할 수 있다.

7. 공공 데이터와 다른 "오픈" 활동과의 관계

공공 데이터 운동은 다른 "오픈" 운동과 목표를 공유한다.

* 오픈 액세스는 학술 출판물을 인터넷에서 무료로 사용할 수 있도록 하는 데 중점을 둔다. 경우에 따라 이러한 기사에는 열린 데이터 세트도 포함된다.
* 오픈 사양은 파일 형식이나 프로토콜을 설명하는 문서로, 해당 문서는 공개 라이선스로 제공된다. 이러한 사양은 주로 동일한 파일 형식 또는 프로토콜을 처리하는 다양한 소프트웨어를 개선하기 위한 것이지만, 법에 의해 오픈 사양을 강요받는 독점 기업은 이를 더 어렵게 만들 수 있다.
* 오픈 콘텐츠는 산문, 사진, 비디오와 같이 사람이 볼 수 있는 자료들을 무료로 사용할 수 있도록 하는 것을 말한다.
* 오픈 지식은 오픈 노리지 인터내셔널(Open Knowledge International)에서 주장하는 개념으로, 오픈 데이터와 관련된 문제를 포함하되 이에 국한되지 않고 다양한 문제에 대한 개방성을 주장한다. 여기에는 과학적, 역사적, 지리적 정보 또는 음악, 영화, 책과 같은 콘텐츠, 정부 및 기타 행정 정보 등이 포함된다. 오픈 데이터는 사이언스 커먼스(Science Commons)의 오픈 액세스 데이터 구현을 위한 프로토콜에서 언급된 오픈 지식 정의의 범위에 포함된다.
* 오픈 노트북 과학은 실패한 실험과 원시 실험 데이터를 포함하여 가능한 한 많은 과학적 과정에 오픈 데이터 개념을 적용하는 것을 의미한다.
* 오픈 소스 소프트웨어는 컴퓨터 프로그램을 배포할 수 있는 오픈 소스 라이선스와 관련이 있으며, 일반적으로 데이터에 중점을 두지 않는다.
* 오픈 교육 자료는 교육, 학습 및 평가뿐만 아니라 연구 목적으로 유용한 자유롭게 접근할 수 있고 공개적으로 라이선스가 부여된 문서 및 미디어이다.
* 오픈 연구/오픈 사이언스/오픈 사이언스 데이터 (연결된 오픈 사이언스)는 데이터, 방법 및 도구와 같은 오픈되고 상호 연결된 과학적 자산을 링크된 데이터 기술을 사용하여 투명하고 재현 가능하며 학제 간 연구를 가능하게 하는 접근 방식을 의미한다.
* 오픈-GLAM(갤러리, 도서관, 기록 보관소 및 박물관)은 디지털화된 컬렉션에 대한 오픈 액세스를 지원하는 문화 기관 간의 교류 및 협업을 지원하는 이니셔티브이자 네트워크이다. GLAM-위키 이니셔티브는 문화 기관이 경험이 풍부한 위키백과 편집자와의 협업 프로젝트를 통해 공개적으로 라이선스가 부여된 리소스를 전 세계와 공유하도록 돕는다. 오픈 유산 데이터는 오픈 GLAM과 관련이 있으며, 유산 부문의 공개적으로 라이선스가 부여된 데이터는 현재 연구, 출판 및 프로그래밍, 특히 디지털 인문학에서 자주 사용된다.
* CSV
* DOC (파일 형식)
* GeoRSS
* GPX
* GTFS
* HTML
* JSON
* KML
* RDF
* RSS
* TSV
* TXT
* XML
* XHTML

7.1. 오픈 액세스 (Open Access)

오픈 액세스는 학술 출판물을 인터넷에서 누구나 무료로 이용할 수 있도록 하는 데 중점을 둔다. 이러한 학술 자료에는 열린 데이터 세트도 포함되는 경우가 있다.

7.2. 오픈 콘텐츠 (Open Content)

오픈 콘텐츠(Open Content)는 산문, 사진, 비디오와 같이 인간이 볼 수 있는 자료들을 무료로 사용할 수 있도록 하는 것을 말한다.

7.3. 오픈 소스 소프트웨어 (Open Source Software)

Open Source Software영어는 컴퓨터 프로그램을 배포할 수 있는 오픈 소스 라이선스와 관련이 있으며, 일반적으로 데이터에 중점을 두지 않는다.

8. 공공 데이터와 공유 자원 (Commons)

공공 데이터 개방은 정부, 지방자치단체 및 공공기관이 보유·관리하는 공공 데이터를 이용자가 자유롭게 활용할 수 있도록 다양한 형태로 제공하는 것이다. 대한민국에서는 공공데이터포털을 통해 파일데이터, 오픈API, 시각화 등 다양한 방식으로 제공하고 있다. 단, 개인정보보호, 제3자의 권리(저작권 등), 국가 안보와 질서에 관련한 정보 등은 제외된다.

개방 데이터는 지도, 게놈, 커넥톰, 화학 화합물, 수학 및 과학 공식, 의료 데이터 및 관행, 생명 과학 및 생물 다양성과 같은 텍스트가 아닌 자료를 포함할 수 있다. 개방 데이터 운동의 주요 장벽은 데이터의 상업적 가치이며, 데이터에 대한 접근 또는 재사용은 종종 공공 또는 민간 조직에 의해 통제된다. 이러한 통제는 접근 제한, 라이선스, 저작권, 특허 및 접근 또는 재사용에 대한 요금을 통해 이루어질 수 있다. 개방 데이터 옹호자들은 이러한 제한이 공공의 이익을 저해하며, 데이터는 제한이나 수수료 없이 사용할 수 있어야 한다고 주장한다.

데이터 제작자는 소유권, 라이선스 및 재사용 조건 명시의 필요성을 고려하지 않고, 저작권을 주장하지 않으면 해당 데이터가 공공 영역에 들어간다고 추정한다. 예를 들어, 많은 과학자들은 자신들의 연구와 함께 출판된 데이터를 통제 대상으로 간주하지 않으며, 학술지에 출판하는 행위를 암묵적으로 데이터를 공유지로 공개하는 것으로 여긴다.

다수의 비영리 단체는 사용자, 회원 또는 제3자의 개인 정보 보호 권리를 침해하지 않는 범위 내에서 자체 데이터를 공개적으로 제공한다. 영리 기업과 비교하여 비영리 단체는 데이터 수익화를 추구하지 않는다. 국제 열대 농업 연구소(CIAT)는 국제 농업 연구의 이점을 향상시키기 위해 빅 데이터 분석을 수행하려는 모든 사람에게 공개 데이터를 제공한다. DBLP는 비영리 단체인 다크스툴에서 운영하며, 컴퓨터 과학 분야의 과학 출판물 데이터베이스를 공개 데이터로 제공한다. 숙박 공유 서비스는 과학자들에게 분석, 공공 연구 및 출판을 위한 데이터 익명화된 데이터 접근을 제공해 왔다.

공공 데이터의 사회적 이익을 위한 활용은 학술 연구에서 입증되었다. "지속 가능한 정책 및 공공 데이터를 사용한 소프트 모빌리티 현지화 최적화" 논문은 공공 데이터를 두 가지 방식으로 사용한다. 첫째, 도시의 다양한 지역 요구 사항 파악을 위해 사용한다. 예를 들어 인구 밀도, 교통 혼잡 및 대기 질에 대한 데이터를 사용하여 자전거 보관대 및 전기 자동차 충전소와 같은 소프트 모빌리티 자원이 가장 필요한 위치를 결정할 수 있다. 둘째, 공정하고 형평한 알고리즘 개발을 위해 사용한다. 예를 들어 도시의 인구 통계 데이터를 사용하여 연령, 장애 또는 성별에 관계없이 모든 사람이 소프트 모빌리티 자원에 접근할 수 있도록 분배할 수 있다.

8.1. 정의 및 아이디어

접근성, 재사용성, 검색 가능성, 비독점성 등은 개방 데이터와 공유 자원의 공통적인 특징이다. 개방 데이터와 공유 자원의 정의는 모두 접근 장벽이 낮은 공유 자원의 개념을 중심으로 이루어진다.

실질적으로 디지털 공유 자원은 온라인으로 유지되는 데이터와 같은 자원을 포함한다는 점에서 개방 데이터를 포함한다. 개방 데이터의 원칙은 검토 대상 데이터 유형에 따라 때때로 다르지만, 핵심 근거는 데이터 세트 재사용에 대한 장벽이 없다는 것이다. 그 기원에 관계없이, 개방 데이터 유형 전반의 원칙은 공유 자원의 정의의 핵심 요소를 암시한다.

8.2. 거버넌스

공유 자원과 열린 데이터는 모두 접근 장벽이 낮은 공유 자원의 개념을 중심으로 정의된다. 이 두 가지는 자본주의에 의해 형성된 지배적인 시장 논리와 차이를 보인다는 특징이 있다.

이탈리아 볼로냐의 Human Ecosystem Relazioni 프로젝트는 공공 데이터와 공유지의 관계, 그리고 그것들이 빅 데이터 사용을 주도하는 시장 논리를 어떻게 붕괴시킬 수 있는지 보여주는 예시이다. 이 프로젝트는 볼로냐에서 "협업"을 둘러싼 온라인 사회 관계를 추출하고 식별하는 것을 목표로 했다. 시민 협업을 위한 소셜 네트워크 및 온라인 플랫폼에서 데이터를 수집했다. 결국 데이터는 내용, 의미, 위치, 기간 및 기타 변수에 대해 분석되었다. 전반적으로 협업을 위한 온라인 사회 관계는 네트워크 이론을 기반으로 분석되었다. 결과 데이터 세트는 집계 및 익명화된 공공 데이터로 온라인에서 사용할 수 있게 되었다. 그럼에도 불구하고 개인은 자신의 모든 데이터를 되찾을 수 있다. 이것은 데이터를 공유 자원으로 만들려는 아이디어로 수행되었다. 이 프로젝트는 공공 데이터와 공유지의 관계, 그리고 그것들이 두 가지 방식으로 빅 데이터 사용을 주도하는 시장 논리를 붕괴시킬 수 있음을 보여준다. 첫째, 공공 데이터의 논리를 따르는 이러한 프로젝트가 효과적인 데이터 공유 자원 생성을 어떻게 유발할 수 있는지 보여준다. 이 프로젝트 자체는 소셜 네트워크 플랫폼 사용자에게 콘텐츠 삭제를 위한 다양한 유형의 지원을 제공했다. 둘째, 온라인 소셜 네트워크 상호 작용에 대한 데이터를 공개하면 해당 데이터에 대한 소셜 네트워크 플랫폼의 독점적 권한을 상당히 줄일 수 있다.