맨위로가기

링크드 데이터

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

링크드 데이터는 웹 상의 데이터를 연결하고 공유하기 위한 기술 및 접근 방식을 의미한다. 팀 버너스리에 의해 제시된 4가지 원칙(2006년)과 3가지 원칙(2009년)을 통해 개별 사물의 식별, HTTP URI 사용, 개방형 표준을 통한 정보 제공, 다른 사물 참조를 강조한다. 링크드 데이터 시스템은 URI, HTTP, 통제된 어휘, RDF 형식의 구조화된 데이터, 링크드 데이터 플랫폼 등으로 구성된다. 링크드 오픈 데이터(LOD)는 자유로운 재사용을 허용하는 공개 라이선스 하에 배포되는 링크드 데이터를 의미하며, 5성급 체계를 통해 데이터 품질을 평가한다. 유럽 연합은 링크드 데이터를 활용한 여러 프로젝트를 진행하고 있으며, FOAF, UMBEL과 같은 온톨로지가 사용된다. DBpedia, GeoNames, 위키데이터, GRID, KnowWhereGraph, Open ICEcat 등 다양한 데이터 세트가 링크드 데이터 형태로 제공된다.

더 읽어볼만한 페이지

  • 오픈 데이터 - 오픈스트리트맵
    오픈스트리트맵(OSM)은 전 세계 사용자들이 참여하여 자유롭게 이용할 수 있도록 만들어진 크라우드소싱 기반의 세계 지도로, 오픈 데이터베이스 라이선스(ODbL)에 따라 배포되며 다양한 분야에서 활용되고 지속적으로 발전하고 있다.
  • 오픈 데이터 - 열린 정부
    열린 정부는 투명성, 참여, 책무성을 통해 정부 활동에 대한 시민 이해를 돕고 정책 결정 참여를 장려하여 책임성을 강화하는 개념으로, OECD는 정부 조정, 시민 참여, 정보 접근 등의 범주로 접근하며, 전자 참여를 통해 시민의 거버넌스 직접 참여를 가능하게 한다.
  • 시맨틱 웹 - 시맨틱 네트워크
    시맨틱 네트워크는 개념 간의 관계를 표현하는 지식 표현 방법으로, 노드와 링크를 사용하여 지식을 구조화하며 인공지능, 언어학 등 다양한 분야에서 활용된다.
  • 시맨틱 웹 - 웹 온톨로지 언어
    웹 온톨로지 언어(OWL)는 시맨틱 웹 구축을 위한 지식 표현 언어로, W3C 웹 표준이며, 온톨로지 명시적 표현을 통해 데이터 공유 및 재사용을 가능하게 하고, 기술 논리에 기반하여 표현력 수준에 따라 다양한 종류를 제공한다.
  • 월드 와이드 웹 - 구글
    구글은 래리 페이지와 세르게이 브린이 개발한 웹 검색 엔진에서 출발하여 검색 기술 혁신을 통해 유튜브, 안드로이드 등 다양한 서비스를 제공하는 세계적인 기술 기업으로 성장했지만, 개인정보보호 및 독점 논란에도 직면하고 있다.
  • 월드 와이드 웹 - 온라인 언론
    온라인 언론은 인터넷을 통해 뉴스 및 정보를 제공하며, 디지털 기술 발달과 함께 성장하여 시민 저널리즘 부상, 정보 전달 속도 혁신 등의 특징을 보이지만 정보 신뢰성 문제, 전통 언론 쇠퇴 등의 과제를 안고 있다.
링크드 데이터

2. 구축 원칙

팀 버너스리가 제시한 링크드 데이터 구축 원칙은 다음과 같다.[31]

# URI 사용: 웹문서 위치를 나타내는 URL 중심 식별체계를 지양하고, 개별 객체에 URI를 부여한다.

# HTTP URI 사용: HTTP 프로토콜을 통해 접근 가능한 URI를 사용해 링크드 데이터 접근성을 높인다.

# RDF 사용: RDF와 같이 트리플 모형으로 구조화된 데이터를 사용하여 웹 데이터를 정형화하고 연계한다.

# 링크 정보 부여: 풍부한 링크 정보를 제공하여 웹 데이터를 연결하고, 발전된 시맨틱 웹을 구현한다.

2. 1. 4가지 원칙 (2006년)

2006년 팀 버너스리는 "링크드 데이터" 논문에서 링크드 데이터의 4가지 원칙을 다음과 같이 요약했다:[2]

  • 개별 사물을 명명하고 식별하기 위해 URI를 사용해야 한다.
  • 이러한 사물을 조회하고 해석하며, "디레퍼런스"할 수 있도록 HTTP URI를 사용해야 한다.
  • 이름이 무엇을 식별하는지에 대한 유용한 정보는 RDF, SPARQL 등과 같은 개방형 표준을 통해 제공되어야 한다.
  • 웹에서 데이터를 게시할 때는 다른 사물을 해당 HTTP URI 기반 이름을 사용하여 참조해야 한다.


팀 버너스리는 2009년 TED 컨퍼런스에서 이 원칙을 다시 언급했으며, 다음과 같이 요약했다:[4]

  • 모든 개념적 사물은 HTTP로 시작하는 이름을 가져야 한다.
  • HTTP 이름을 조회하면 해당 사물에 대한 유용한 데이터를 표준 형식으로 반환해야 한다.
  • 동일한 사물이 해당 데이터를 통해 관계를 맺고 있는 다른 모든 사물에도 HTTP로 시작하는 이름을 부여해야 한다.

2. 2. 3가지 원칙 (2009년)

팀 버너스리는 2009년 TED 컨퍼런스에서 링크드 데이터 원칙을 다시 언급하며 다음 세 가지로 요약했다.[4]

# 모든 개념적 사물은 HTTP로 시작하는 이름을 가져야 한다.

# HTTP 이름을 조회하면 해당 사물에 대한 유용한 데이터를 표준 형식으로 반환해야 한다.

# 동일한 사물이 해당 데이터를 통해 관계를 맺고 있는 다른 모든 사물에도 HTTP로 시작하는 이름을 부여해야 한다.

3. 구성 요소

4. 링크드 오픈 데이터 (LOD)

'''링크된 공개 데이터'''(Linked Open Data, LOD)는 공개 데이터이면서 링크된 데이터이다.[5][6][7] 팀 버너스 리는 링크된 데이터와 구별되는 링크된 공개 데이터에 대해 다음과 같이 정의했다.

대표적인 링크된 공개 데이터 세트로는 DBpedia, 위키베이스, 위키데이터 등이 있다.

4. 1. 5-star linked open data

링크된 오픈 데이터 배포 계획
[9]

팀 버너스 리는 2010년에 웹 상의 오픈 데이터 품질을 평가하기 위한 5성급 체계를 제안했으며, 최고 등급은 링크된 오픈 데이터이다.[10]

  • 1성: 어떤 형식으로든 데이터를 공개적으로 제공한다.
  • 2성: 마이크로소프트 엑셀 파일 형식과 같이 구조화된 형식으로 데이터를 제공한다.
  • 3성: 쉼표로 구분된 값과 같이 비독점적 구조화된 형식으로 데이터를 제공한다.
  • 4성: W3C 표준을 따르고, RDF를 사용하며, URI를 활용하여 데이터를 제공한다.
  • 5성: 위의 모든 조건을 충족하고, 다른 링크된 오픈 데이터 소스에 대한 링크를 포함한다.

4. 2. 역사

"링크드 오픈 데이터"라는 용어는 2007년 2월 "링크드 오픈 데이터" 메일링 리스트[11]가 개설되면서부터 사용되기 시작했다.[12] 이 메일링 리스트는 처음에는 매사추세츠 공과대학교의 SIMILE 프로젝트[13]에서 호스팅했다.

4. 3. Linking Open Data 커뮤니티 프로젝트

W3C 시맨틱 웹 교육 및 홍보 그룹의 링크드 오픈 데이터(Linking Open Data) 커뮤니티 프로젝트는 다양한 오픈 데이터 세트를 웹에 RDF 형식으로 게시하고, 서로 다른 데이터 소스의 데이터 항목 간에 RDF 링크를 설정함으로써 웹을 데이터 공유로 확장하는 것을 목표로 한다. 2007년 10월, 데이터 세트는 20억 개 이상의 RDF 트리플로 구성되었으며, 이는 200만 개 이상의 RDF 링크로 상호 연결되었다.[15][16] 2011년 9월에는 310억 개의 RDF 트리플과 약 5억 4백만 개의 RDF 링크로 크게 증가했다. 2014년에 자세한 통계 분석이 발표되었다.[17]



2017년 2월 기준 링크드 오픈 데이터(Linking Open Data) 데이터 세트 연결 현황. 2014년과 비교하여 불과 2년 반 만에 크게 성장한 모습을 보여준다.

5. 유럽 연합(EU) 프로젝트

유럽 연합은 링크드 데이터를 활용하는 여러 프로젝트를 진행하고 있다. 주요 프로젝트는 다음과 같다.


  • 링크드 오픈 데이터 어라운드 더 클락(LATC) 프로젝트[18]
  • 머신 판독 가능한 법률 데이터를 위한 AKN4EU 프로젝트[19]
  • PlanetData 프로젝트[20]
  • DaPaaS(데이터-및-플랫폼-애즈-어-서비스) 프로젝트[21]
  • 링크드 오픈 데이터 2(LOD2) 프로젝트[22][23][24]


데이터 연결은 누구나 재사용하고 연결할 수 있도록 수천 개의 데이터 세트를 제공하는 EU 오픈 데이터 포털의 주요 목표 중 하나이다.

6. 온톨로지

온톨로지는 데이터 구조에 대한 형식적인 설명이다. 잘 알려진 온톨로지 중 일부는 다음과 같다.


  • FOAF – 사람, 그들의 속성 및 관계를 설명하는 온톨로지
  • UMBEL – OpenCyc에서 파생된 20000개의 주제 개념 클래스와 그 관계에 대한 경량 참조 구조로, 외부 데이터에 바인딩 클래스로 작용할 수 있다. 또한 DBpedia 및 YAGO에서 150만 개의 명명된 엔티티에 대한 링크를 가지고 있다.

7. 데이터 세트


  • DBpedia - 위키백과에서 추출한 데이터를 포함하는 데이터 세트이다. 11개 언어로 된 초록을 포함하여 10억 개의 시맨틱 트리플로 설명되는 약 340만 개의 개념이 포함되어 있다.
  • GeoNames - 전 세계적으로 750만 개 이상의 지리적 특징에 대한 RDF 설명을 제공한다.
  • 위키데이터 - 위키미디어 재단의 자매 프로젝트의 구조화된 데이터를 위한 중앙 저장소 역할을 하는 협업으로 생성된 연결된 데이터 세트이다.
  • 글로벌 연구 식별자 데이터베이스(GRID, Global Research Identifier Database) - 학술 연구에 종사하는 89,506개 기관의 국제 데이터베이스로, 14,401개의 관계를 가지고 있다. GRID는 두 가지 유형의 관계를 모델링한다. 종속 관계를 정의하는 상위-하위 관계와 다른 관계를 설명하는 관련 관계이다.[25][26]
  • KnowWhereGraph[27] - Semantic Web 및 Linked Data 기술을 사용하여 인간과 환경의 교차점에 있는 30개의 데이터 레이어로 구성된 120억 개의 트리플 규모의 통합 지식 그래프이다.[28]
  • Open ICEcat|uk - 제품 데이터시트, 관련 디지털 자산 및 사용 통계를 포함하는 다국어 개방형 카탈로그이다.

참조

[1] 웹사이트 Linked Data as JSON http://jsld.org/ 2020-12-04
[2] 웹사이트 Linked Data http://www.w3.org/De[...] W3C 2010-12-18
[3] 웹사이트 What are Linked Data and Linked Open Data? https://www.ontotext[...] 2019-05-08
[4] 웹사이트 Tim Berners-Lee on the next Web http://www.ted.com/t[...] 2009-03-15
[5] 웹사이트 Frequently Asked Questions (FAQs) - Linked Data - Connect Distributed Data across the Web http://linkeddata.or[...] 2014-12-29
[6] 웹사이트 COAR » 7 things you should know about…Linked Data https://www.coar-rep[...] 2015-12-29
[7] 웹사이트 Linked Data Basics for Techies http://openorg.ecs.s[...] 2015-12-29
[8] 웹사이트 5 Star Open Data http://5stardata.inf[...]
[9] 웹사이트 5-star Open Data http://5stardata.inf[...] 2021-03-07
[10] 웹사이트 What is 5 Star Linked Data? {{!}} Webize Everything Community Group https://www.w3.org/c[...] 2021-03-07
[11] 웹사이트 public-lod@w3.org Mail Archives http://lists.w3.org/[...]
[12] 웹사이트 SweoIG/TaskForces/CommunityProjects/LinkingOpenData/NewsArchive http://www.w3.org/wi[...]
[13] 웹사이트 SIMILE Project - Mailing Lists http://simile.mit.ed[...]
[14] 문서 Linking open data cloud diagram 2014 http://lod-cloud.net[...] Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak
[15] 웹사이트 SweoIG/TaskForces/CommunityProjects/LinkingOpenData - W3C Wiki http://esw.w3.org/to[...] 2018-03-22
[16] 서적 Semantic Web Services Springer
[17] 웹사이트 State of the LOD Cloud http://linkeddatacat[...] 2018-03-22
[18] 웹사이트 Linked open data around the clock (LATC) http://latc-project.[...] 2018-03-22
[19] 간행물 Model-Driven Development of AKN Application Profiles: Background and Requirements https://link.springe[...] Springer International Publishing 2023-01-07
[20] 웹사이트 Welcome to PlanetData! - PlanetData http://planet-data.e[...] 2018-03-22
[21] 웹사이트 DaPaaS http://project.dapaa[...] 2018-03-22
[22] 문서 Linking Open Data 2 (LOD2) https://web.archive.[...]
[23] 웹사이트 CORDIS FP7 ICT Projects – LOD2 http://cordis.europa[...] European Commission 2010-04-20
[24] 웹사이트 LOD2 Project Fact Sheet – Project Summary http://static.lod2.e[...] 2010-12-18
[25] 웹사이트 GRID Statistics https://grid.ac/stat[...] 2018-10-26
[26] 웹사이트 GRID Policies https://grid.ac/page[...] 2018-10-26
[27] 웹사이트 KnowWhereGraph https://www.knowwher[...] 2022-05-16
[28] 논문 Know, Know Where, Knowwheregraph: A Densely Connected, Cross-Domain Knowledge Graph and Geo-Enrichment Service Stack for Applications in Environmental Intelligence
[29] 웹사이트 Instance relationships amongst datasets http://www4.wiwiss.f[...] 2018-03-22
[30] 웹사이트 Class relationships amongst datasets http://umbel.org/sit[...] 2018-03-22
[31] 웹인용 보관된 사본 http://linkeddata.or[...] 2020-04-10



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com