맨위로가기

시맨틱 스칼라

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

시맨틱 스칼라는 과학 문헌에 대한 한 문장 요약을 제공하는 학술 검색 엔진이다. 인공 지능 기술을 활용하여 논문의 핵심 내용을 파악하고, 머신 러닝, 자연어 처리, 머신 비전 등을 결합하여 의미론적 분석을 수행한다. 주요 기능으로는 적응형 연구 추천 시스템인 연구 피드, 과학적 독서를 돕는 시맨틱 리더 등이 있으며, 논문의 가장 중요하고 영향력 있는 요소를 강조하고 연구 주제 간의 연결을 식별하는 데 초점을 맞춘다. 시맨틱 스칼라는 고유한 식별자를 사용하여 논문을 관리하며, 2020년 말 기준 1억 9천만 개의 논문을 색인하고 월간 700만 명의 사용자를 기록했다.

더 읽어볼만한 페이지

  • 문헌 검색 서비스 - 구글 도서
    구글 도서는 2002년에 시작된 구글의 도서 디지털화 프로젝트로, 전 세계 도서관과 제휴하여 도서를 스캔하고 온라인에서 검색 및 열람을 가능하게 하며, 저작권 문제와 스캔 오류 등으로 비판을 받기도 했다.
  • 문헌 검색 서비스 - 구글 학술 검색
    구글 학술 검색은 2004년에 시작된 학술 자료 검색 엔진으로, 학술 논문, 학위 논문, 서적 등 다양한 학술 문헌 검색을 지원하고 인용 분석 도구 및 개인 학술 인용 프로필 관리 기능을 제공하지만, 검색 알고리즘 편향성, 스팸, 데이터 품질 문제 등의 비판도 존재한다.
  • 인공지능의 응용 - 가상 비서
    가상 비서는 음성 또는 텍스트 입력을 해석하여 정보 제공, 일정 관리, 기기 제어 등 다양한 작업을 수행하는 소프트웨어 에이전트로서, 시리, 알렉사, 구글 어시스턴트와 같은 다양한 형태로 발전해 왔으며, 챗GPT와 같은 생성형 AI 기반 가상 비서의 등장과 함께 발전하고 있지만 개인 정보 보호와 같은 과제도 존재한다.
  • 인공지능의 응용 - 질의 응답
    질의응답 시스템은 자연어 질문을 이해하고 답변을 생성하며, 질문 유형과 사용 기술에 따라 분류되고, 읽기 이해 기반 또는 사전 지식 기반으로 작동하며, 대규모 언어 모델과 다양한 아키텍처 발전에 힘입어 복잡한 질문에 대한 답변과 다양한 분야에 활용이 가능해졌다.
  • 공식 웹사이트에 알 수 없는 변수를 사용한 문서 - 브루클린 미술관
    브루클린 미술관은 1823년 브루클린 견습생 도서관으로 시작하여 현재 약 50만 점의 소장품을 보유한 뉴욕 브루클린 소재의 미술관으로, 다양한 분야의 예술 작품을 전시하며 특히 아프리카 미술과 여성주의 미술에 대한 기여가 크다.
  • 공식 웹사이트에 알 수 없는 변수를 사용한 문서 - 광주지방기상청
    광주지방기상청은 광주광역시와 전라남도 지역의 기상 예보, 특보, 관측, 기후 정보 제공 등의 업무를 수행하는 기상청 소속 기관으로, 1949년 광주측후소로 설치되어 1992년 광주지방기상청으로 개편되었으며, 기획운영과, 예보과, 관측과, 기후서비스과와 전주기상지청, 목포기상대를 두고 있다.
시맨틱 스칼라 - [IT 관련 정보]에 관한 문서
기본 정보
유형검색 엔진
개발앨런 인공지능 연구소
출시일2015년 11월 2일
웹사이트Semantic Scholar
상세 정보
특징인공지능 기반 과학 논문 검색 서비스
목표과학 지식 검색 방식 혁신
데이터 규모약 2억 건의 논문 (프린트 포함)
기능논문 요약
인용 분석
연구 동향 파악

2. 기술

시맨틱 스칼라는 머신 러닝, 자연어 처리, 머신 비전을 결합하여 전통적인 인용 분석 방법에 의미론적 분석 레이어를 추가하고, 관련 그림, 표, 개체 및 논문에서 주제를 추출한다.[9][10] 또한 Google Scholar 및 PubMed와 대조적으로 논문의 가장 중요하고 영향력 있는 요소를 강조하며, 연구 주제 간의 숨겨진 연결과 링크를 식별하도록 설계되었다.[13][14] 시맨틱 리더(Semantic Reader)는 과학적 독서를 더욱 접근하기 쉽고 풍부한 맥락으로 만들어 혁신을 일으킬 잠재력을 가진 증강된 리더이다.[12]

2. 1. 논문 요약

시맨틱 스칼라(Semantic Scholar)는 과학 문헌에 대한 한 문장 요약을 제공한다. 그 목표 중 하나는 모바일 장치에서 수많은 제목과 긴 초록을 읽는 어려움을 해결하는 것이었다.[7] 또한 매년 발표되는 3백만 건의 과학 논문이 독자에게 도달하도록 하는 것을 목표로 하는데, 이는 이 문헌의 절반만 읽히는 것으로 추정되기 때문이다.[8]

인공 지능은 논문의 본질을 파악하는 데 사용되며, "추상적인" 기술을 통해 생성된다.[3] 이 프로젝트는 머신 러닝, 자연어 처리, 머신 비전을 결합하여 전통적인 인용 분석 방법에 의미론적 분석 레이어를 추가하고, 관련 그림, 표, 개체 및 논문에서 주제를 추출한다.[9][10]

또 다른 주요 AI 기반 기능은 연구 피드(Research Feeds)로, AI를 사용하여 사용자가 어떤 논문을 읽고 싶어하는지 빠르게 학습하고 학자들이 최신 연구를 따라갈 수 있도록 최신 연구를 추천하는 적응형 연구 추천 시스템이다. 이는 각 라이브러리 폴더의 논문과 유사한 논문을 찾기 위해 대조 학습을 사용하여 훈련된 최첨단 논문 임베딩 모델을 사용한다.[11]

시맨틱 스칼라는 또한 시맨틱 리더(Semantic Reader)를 제공하는데, 이는 과학적 독서를 더욱 접근하기 쉽고 풍부한 맥락으로 만들어 혁신을 일으킬 잠재력을 가진 증강된 리더이다.[12] 시맨틱 리더는 사용자가 읽는 동안 자동으로 생성된 짧은 요약인 TLDR (Too Long, Didn't Read의 약자)로 인용문을 보고 논문의 핵심 사항을 포착하여 사용자가 더 빠르게 소화할 수 있도록 하는 스키밍 하이라이트를 제공하는 인라인 인용 카드를 제공한다.

Google Scholar 및 PubMed와 대조적으로 시맨틱 스칼라는 논문의 가장 중요하고 영향력 있는 요소를 강조하도록 설계되었다.[13] 이 AI 기술은 연구 주제 간의 숨겨진 연결과 링크를 식별하도록 설계되었다.[14] 이전에 언급된 검색 엔진과 마찬가지로 시맨틱 스칼라는 Microsoft Academic Knowledge Graph, Springer Nature의 SciGraph 및 Semantic Scholar Corpus (원래 컴퓨터 과학, 신경 과학 및 생명 의학 분야의 4,500만 개 논문 코퍼스)를 포함하는 그래프 구조를 활용한다.[15][16]

2. 2. 의미론적 분석

시맨틱 스칼라는 과학 문헌에 대한 한 문장 요약을 제공하여, 모바일 환경에서 제목과 초록을 읽는 어려움을 해결하고, 매년 발표되는 수백만 건의 과학 논문 중 더 많은 논문이 독자에게 도달하도록 돕는다.[7][8]

인공지능은 논문의 핵심 내용을 파악하기 위해 "추상적인" 기술을 사용한다.[3] 이 프로젝트는 머신 러닝, 자연어 처리, 머신 비전을 결합하여 전통적인 인용 분석에 의미론적 분석을 추가하고, 논문에서 그림, 표, 개체, 주제를 추출한다.[9][10]

연구 피드(Research Feeds)는 사용자가 읽고 싶어하는 논문을 빠르게 학습하고 최신 연구를 추천하는 적응형 연구 추천 시스템이다.[11] 이는 대조 학습을 통해 훈련된 논문 임베딩 모델을 사용한다.[11]

시맨틱 리더(Semantic Reader)는 과학 논문을 더 쉽게 읽고 풍부한 맥락을 제공하는 증강된 리더이다.[12] 시맨틱 리더는 인라인 인용 카드를 통해 빠르게 논문의 핵심 내용을 파악할 수 있게 돕는다. 인용 카드는 읽는 동안 자동 생성되는 TLDR (Too Long, Didn't Read, 너무 길어서 읽지 않음) 요약을 제공한다.[12]

Google Scholar나 PubMed와 달리 시맨틱 스칼라는 논문의 중요하고 영향력 있는 요소를 강조한다.[13] 인공지능 기술은 연구 주제 간의 숨겨진 연결과 링크를 찾도록 설계되었다.[14] 시맨틱 스칼라는 Microsoft Academic Knowledge Graph, Springer Nature의 SciGraph, Semantic Scholar Corpus 등의 그래프 구조를 활용한다.[15][16]

2. 3. 연구 피드 (Research Feeds)

시맨틱 스칼라의 주요 AI 기반 기능 중 하나는 연구 피드(Research Feeds)이다. 이 기능은 인공지능을 활용하여 사용자가 읽고 싶어하는 논문을 빠르게 학습하고, 학자들이 최신 연구 동향을 파악할 수 있도록 맞춤형 연구 추천 시스템을 제공한다. 이는 각 라이브러리 폴더의 논문과 유사한 논문을 찾기 위해 대조 학습을 사용하여 훈련된 최첨단 논문 임베딩 모델을 사용한다.[11]

2. 4. 시맨틱 리더 (Semantic Reader)

시맨틱 리더는 과학 논문을 더 쉽게 읽고, 더 풍부한 맥락을 제공하여 혁신을 일으킬 잠재력을 가진 증강된 리더이다.[12] 시맨틱 리더는 사용자가 읽는 동안 자동으로 생성되는 짧은 요약인 TLDR(Too Long, Didn't Read, 너무 길어서 읽지 않음)로 인용문을 보여주고, 논문의 핵심 내용을 빠르게 파악할 수 있도록 스키밍 하이라이트를 제공하는 인라인 인용 카드를 제공한다.

2. 5. 타 학술 검색 엔진과의 비교

시맨틱 스칼라는 과학 문헌에 대한 한 문장 요약을 제공하여, 모바일 환경에서 많은 제목과 긴 초록을 읽는 어려움을 해결하고자 한다.[7] 또한 매년 발표되는 3백만 건의 과학 논문 중 절반만 읽힌다는 점을 고려하여, 더 많은 논문이 독자에게 도달하도록 하는 것을 목표로 한다.[8]

구글 학술 검색이나 PubMed와 달리, 시맨틱 스칼라는 인공지능을 활용하여 논문의 핵심 요소를 강조하고 연구 주제 간의 숨겨진 연결 고리를 파악한다.[13][14] 머신 러닝, 자연어 처리, 머신 비전 기술을 결합하여 전통적인 인용 분석에 의미론적 분석을 추가함으로써, 관련 그림, 표, 개체 및 논문의 주제를 추출한다.[9][10]

시맨틱 스칼라는 연구 피드(Research Feeds) 기능을 통해 사용자가 읽고 싶어하는 논문을 빠르게 학습하고 최신 연구를 추천하는 맞춤형 추천 시스템을 제공한다.[11] 또한, 시맨틱 리더(Semantic Reader)는 논문을 읽는 동안 인용문의 핵심 내용을 빠르게 파악할 수 있도록 TLDR(Too Long, Didn't Read, 너무 길어서 읽지 않음) 요약 및 인라인 인용 카드를 제공한다.[12]

시맨틱 스칼라는 Microsoft Academic Knowledge Graph, Springer Nature의 SciGraph 등 그래프 구조를 활용하며, 구글 학술 검색과 같은 유사한 검색 엔진과 달리 유료화된 자료를 검색하지 않고 무료로 사용할 수 있다.[15][16][5]

한 연구에 따르면, 시맨틱 스칼라와 구글 학술 검색은 컴퓨터 과학 분야의 2차 연구에서 인용된 논문에 대해 비슷한 색인 범위를 가지는 것으로 나타났다.[17]

3. 논문 식별자 (S2CID)

시맨틱 스칼라에서 호스팅하는 각 논문에는 Semantic Scholar Corpus ID (약칭 S2CID)라는 고유한 식별자가 할당된다.

The reproductive number of COVID-19 is higher compared to SARS coronavirus영어 논문의 S2CID는 211099356이다.

4. 색인 (Indexing)

한 연구에서 시맨틱 스칼라의 색인 범위를 구글 학술 검색과 비교했는데, 컴퓨터 과학 분야의 2차 연구에서 인용된 논문에 대해 두 색인이 비슷한 범위를 가지며, 각각 몇 편의 논문을 놓치고 있다는 것을 발견했다.[17]

5. 사용자 및 논문 수

2018년 1월 기준으로, 생명 의학 논문과 주제 요약을 추가한 2017년 프로젝트에 따라, 시맨틱 스칼라 코퍼스는 컴퓨터 과학과 생명 의학 분야의 4천만 개 이상의 논문을 포함했다.[18] 2019년 8월, 마이크로소프트 아카데믹 그래프 기록 추가 후, 포함된 논문 메타데이터(실제 PDF가 아님) 수는 1억 7300만 개 이상으로 증가했다.[20][21] 2020년, 시카고 대학교 출판사와의 파트너십을 통해 시카고 대학교 출판사에서 발행된 모든 기사를 시맨틱 스칼라 코퍼스에서 사용할 수 있게 되었다.[22] 2020년 말, 시맨틱 스칼라는 1억 9천만 개의 논문을 색인했다.[23] 같은 해, 시맨틱 스칼라는 월간 700만 명의 사용자를 기록했다.[7]

6. 한국 연구자들을 위한 활용 방안

(이전 출력과 동일하게, 원본 소스가 제공되지 않아 내용을 작성할 수 없습니다.)

참조

[1] 논문 Artificial-intelligence institute launches free science search engine
[2] 뉴스 Paul Allen's AI research group unveils program that aims to shake up how we search scientific knowledge. Give it a try. https://www.washingt[...] 2015-11-03
[3] 웹사이트 An AI helps you summarize the latest in AI https://www.technolo[...] 2021-02-16
[4] 웹사이트 Semantic Scholar Research https://research.sem[...] 2021-11-22
[5] 논문 Semantic Scholar 2018-01-12
[6] 뉴스 Drowning in the literature? These smart software tools can help https://www.nature.c[...] 2021-09-01
[7] 뉴스 AI tool summarizes lengthy papers in a sentence https://techxplore.c[...] 2021-02-16
[8] 웹사이트 Allen Institute's Semantic Scholar now searches across 175 million academic papers https://venturebeat.[...] 2021-02-16
[9] 논문 A computer program just ranked the most influential brain scientists of the modern era https://www.science.[...] 2016-11-12
[10] 문서 Q108172042
[11] 웹사이트 Semantic Scholar ! Frequently Asked Questions https://www.semantic[...]
[12] 웹사이트 Semantic Scholar ! Semantic Reader https://www.semantic[...]
[13] 웹사이트 Semantic Scholar https://ijlls.org/in[...] 2021-11-09
[14] 서적 Driving Science Information Discovery in the Digital Age Chandos Publishing
[15] 서적 Advances in Information Retrieval: 42nd European Conference on IR Research, ECIR 2020, Lisbon, Portugal, April 14–17, 2020, Proceedings, Part I Springer Nature
[16] 웹사이트 Open Research Corpus http://labs.semantic[...] 2024-08-05
[17] 논문 Searching relevant papers for software engineering secondary studies: Semantic Scholar coverage and identification role https://onlinelibrar[...] 2021
[18] 뉴스 AI2 scales up Semantic Scholar search engine to encompass biomedical research https://www.geekwire[...] 2018-01-18
[19] 웹사이트 Tech Moves: Allen Instititue Hires Amazon Alexa Machine Learning Leader; Microsoft Chairman Takes on New Investor Role; and More https://www.geekwire[...] GeekWire 2018-05-09
[20] 웹사이트 Semantic Scholar https://www.semantic[...] 2019-08-11
[21] 웹사이트 AI2 joins forces with Microsoft Research to upgrade search tools for scientific studies https://www.geekwire[...] 2019-08-25
[22] 웹사이트 The University of Chicago Press joins more than 500 publishers working with Semantic Scholar to improve search and discoverability https://www.journals[...] 2021-11-22
[23] 뉴스 Semantic Scholar Adds 25 Million Scientific Papers in 2020 Through New Publisher Partnerships https://allenai.org/[...] 2021-11-22
[24] 논문 Artificial-intelligence institute launches free science search engine
[25] 논문 Artificial-intelligence institute launches free science search engine
[26] 뉴스 Paul Allen's AI research group unveils program that aims to shake up how we search scientific knowledge. Give it a try. https://www.washingt[...] 2015-11-03
[27] 웹인용 An AI helps you summarize the latest in AI https://www.technolo[...] 2021-02-16
[28] 웹인용 Semantic Scholar Research https://research.sem[...] 2021-11-22
[29] 논문 Semantic Scholar http://jmla.pitt.edu[...] 2018-01-12
[30] 뉴스 Drowning in the literature? These smart software tools can help https://www.nature.c[...] 2021-09-01



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com