구글 학술 검색
1. 개요
구글 학술 검색은 2004년 11월에 베타 버전으로 처음 공개된 학술 자료 검색 서비스이다. 알렉스 버스탁과 아누라그 아차리아가 개발을 주도했으며, 과학 지식 접근성 향상을 목표로 한다. 구글 학술 검색은 다양한 학술 자료를 검색할 수 있도록 지원하며, 검색 결과의 순위는 논문의 전체 텍스트, 저자, 출판물, 인용 횟수 등을 종합적으로 고려하는 알고리즘에 의해 결정된다. 또한, 인용 분석 도구와 저자 프로필 기능을 제공하며, 미국 판례 데이터베이스 검색도 가능하다. 하지만, 약탈적 저널 포함, 인용 횟수에 따른 순위 편향, 스팸 및 조작 가능성 등의 한계와 비판이 존재한다.
이미지 준비중입니다.
| 종류 | 서지 데이터베이스 |
|---|---|
| 언어 | 40개국어 (한국어 포함) |
| 등록 | 선택 사항 |
| 소유주 | 구글 |
| 출시일 | 2004년 11월 20일 |
| 현재 상태 | 활성 |
| 슬로건 | 거인의 어깨 위에 |
| 유형 | 검색 엔진 |
| 장르 | 학술 문헌 |
| 공식 웹사이트 | Google Scholar |
|---|
-
문헌 검색 서비스 -
구글 도서
-
문헌 검색 서비스 -
유로피아나
유로피아나는 유럽 위원회 주도로 시작되어 유럽 전역 기관들의 디지털 문화유산을 온라인으로 제공하는 플랫폼으로, 메타데이터 표준을 사용해 다양한 디지털 콘텐츠를 통합하고 전문가 네트워크 운영 및 관련 행사를 개최하며 유로피아나 재단에서 관리한다. -
인용 색인 -
한국학술지인용색인
한국학술지인용색인(KCI)은 한국연구재단에서 운용하는 학술지 인용 색인 데이터베이스로, 논문 유사도 검사 및 DOI 연동 서비스를 제공하며 RISS와 연계된 검색 서비스를 통해 학술지 논문 정보를 제공하고 연구 결과 발표의 주요 경로로 활용된다. -
인용 색인 -
과학인용색인
과학인용색인(SCI)은 전 세계 우수 학술지를 선정하여 등재하는 데이터베이스이며, 논문의 피인용 횟수를 통해 학술적 가치를 평가하고 Web of Science를 통해 접근할 수 있다. -
온라인 데이터베이스 -
한국학술지인용색인
한국학술지인용색인(KCI)은 한국연구재단에서 운용하는 학술지 인용 색인 데이터베이스로, 논문 유사도 검사 및 DOI 연동 서비스를 제공하며 RISS와 연계된 검색 서비스를 통해 학술지 논문 정보를 제공하고 연구 결과 발표의 주요 경로로 활용된다. -
온라인 데이터베이스 -
엠포리스
2. 역사
2004년 11월 18일 베타 버전 공개를 통해 구글 학술 검색 서비스가 시작되었다. 구글 학술 검색은 일반 구글 검색과 달리 인터넷에 흩어져 있는 동일 논문을 한데 모아 표시하는 특징을 가지고 있다. 예를 들어, 논문 자체가 유료 피어 리뷰 학술지에 투고된 경우라도, 저자의 웹사이트에 무료로 공개되어 있거나 arXiv에 사전 출판본이 업로드되어 있다면, 검색 결과에서 "전 5개 버전" 등으로 표시된 부분을 통해 해당 논문 본문에 접근할 수 있다.
2011년 11월부터는 [https://scholar.google.co.jp/intl/ja/scholar/citations.html Google Scholar Citations]가 일반 공개되었다. 이는 학술 문헌의 저자 프로필과 함께 해당 저작물을 일원적으로 관리할 수 있는 서비스이다.
홈페이지의 표어인 "거인의 어깨 위에 서다(Standing on the shoulders of giants)"는 12세기의 프랑스 학자 샤르트르의 베르나르의 말로, 현대의 학문은 많은 연구의 축적 위에 성립한다는 의미를 담고 있다.
2.1. 초기 개발 및 목표
알렉스 버스탁과 아누라그 아차리아는 당시 구글의 주요 웹 색인을 구축하는 작업을 하고 있었는데, 이들의 논의에서 구글 학술 검색이 시작되었다. 이들은 과학 지식에 더 쉽고 정확하게 접근할 수 있도록 하여 "세계의 문제 해결사들의 효율성을 10% 향상시키는 것"을 목표로 했다. 이러한 목표는 구글 학술 검색의 광고 슬로건인 "거인의 어깨에 올라서라"에 반영되어 있는데, 이는 샤르트르의 베르나르의 아이디어를 인용한 아이작 뉴턴의 인용구에서 가져온 것이다. 이 슬로건은 수세기 동안 각 분야에 기여하여 새로운 지적 성취의 토대를 제공한 학자들에게 경의를 표하는 것이다.
2.2. 주요 기능 추가 (2006년 ~ 2013년)
2006년에는 RefWorks, RefMan, EndNote, BibTeX 등 참고 문헌 관리자로 인용문을 가져오는 기능이 구현되었다. 2007년, 아누라그 아차리아는 구글 학술 검색이 출판사와의 협약을 통해 저널 기사를 디지털화하고 호스팅하는 프로그램을 시작했다고 발표했다. 이는 오래된 저널 스캔본에서 특정 기사를 식별하는 데 필요한 메타데이터가 없는 구글 도서와는 별개의 작업이었다.
2011년, 구글은 검색 페이지의 도구 모음에서 학술 검색을 제거하여 이미 알고 있는 사용자가 아닌 경우 접근성과 검색 가능성이 낮아졌다. 이 시기에 CiteSeer, Scirus, Windows Live Academic 검색과 유사한 기능을 가진 사이트들이 개발되었다. 이 중 일부는 현재 운영이 중단되었으며, 2016년 마이크로소프트는 새로운 경쟁 서비스인 Microsoft Academic을 출시했다.
2012년에는 개별 학자들이 개인 "학술 인용 프로필"을 만들 수 있는 기능이 추가되었다. 2013년 11월에는 로그인한 사용자가 검색 결과를 "구글 학술 검색 라이브러리"에 저장할 수 있는 기능이 도입되었다. 이 라이브러리는 사용자가 별도로 검색하고 태그로 구성할 수 있는 개인 컬렉션이다. "지표" 버튼을 통해 관심 분야의 상위 저널을 표시하고, 이러한 저널의 영향력을 만드는 기사에 접근할 수 있다. 이제 지표 기능을 통해 과학 및 학술 저널 전체 분야의 영향력을 볼 수 있다.
2.3. 경쟁 서비스 등장 및 발전
2006년 RefWorks, RefMan, EndNote, BibTeX 등 참고 문헌 관리자를 지원하는 인용문 가져오기 기능이 구현되었다. 2007년 아차리아는 구글 학술 검색이 출판사와의 협약을 통해 저널 기사를 디지털화하고 호스팅하는 프로그램을 시작했다고 발표했는데, 이는 구글 도서와는 별개의 노력이었다. 구글 도서는 오래된 저널을 스캔할 때 특정 기사를 식별하는 데 필요한 메타데이터가 포함되지 않은 경우가 있었다. 2011년 구글은 검색 페이지의 도구 모음에서 학술 검색을 제거하여, 이미 그 존재를 알고 있는 사용자가 아닌 사람들에게는 접근성과 검색 가능성이 낮아졌다. 이 시기에 CiteSeer, Scirus, 그리고 마이크로소프트의 Windows Live Academic 검색과 유사한 기능을 가진 사이트들이 개발되었다. 이 중 일부는 현재 운영이 중단되었으며, 2016년 마이크로소프트는 새로운 경쟁사인 Microsoft Academic을 출시했다.
3. 주요 기능 및 특징
구글 학술 검색은 사용자가 온라인이나 도서관에 있는 학술 자료의 디지털 또는 실물 사본을 검색할 수 있도록 지원한다. 일반 구글 검색과의 차이점은 인터넷에 흩어져 있는 동일 논문을 한데 모아 표시한다는 점이다. 피어 리뷰가 있는 학술지에 투고된 유료 논문이라도, 본인의 웹사이트에 무료로 업로드되어 있거나, arXiv에 사전 출판본이 있는 경우, 검색 결과 오른쪽 하단의 "전 5개 버전" 등에서 해당 논문 본문에 접근할 수 있다. 서비스는 2004년 11월 18일 베타 버전으로 공개되었다.
2011년 11월부터는 관련 서비스로 [https://scholar.google.co.jp/intl/ja/scholar/citations.html Google Scholar Citations]가 일반 공개되어, 학술 문헌 저자의 프로필과 저작물을 일원적으로 관리할 수 있게 되었다.
홈페이지의 표어인 "거인의 어깨 위에 서다(Standing on the shoulders of giants)"는 12세기 프랑스 학자 샤르트르의 베르나르의 말로, 현대 학문이 많은 연구의 축적 위에 성립한다는 의미이다.
3.1. 다양한 자료 검색
구글 학술 검색은 사용자가 온라인 또는 도서관에 있는 기사의 디지털 또는 실물 사본을 검색할 수 있도록 한다. "전문 저널 기사, 기술 보고서, 사전 인쇄본, 논문, 서적 및 기타 문서('학술적'으로 간주되는 선택된 웹 페이지 포함)의 전체 텍스트"를 색인한다. 구글 학술 검색의 검색 결과 중 상당수가 상업 저널 기사에 연결되기 때문에 대부분의 사용자는 기사의 초록 및 참고 문헌 세부 정보에만 접근할 수 있으며, 전체 기사에 접근하려면 요금을 지불해야 한다. 검색된 키워드와 가장 관련성이 높은 결과는 저자의 순위, 해당 기사와 연결된 참고 문헌 수와 다른 학술 문헌과의 관련성, 그리고 해당 저널이 게재된 간행물의 순위에 따라 먼저 나열된다.
3.2. 그룹 및 접근성
2005년 버전에서는 "그룹" 기능을 통해 기사의 구독 액세스 버전과 무료 전문 버전 모두에 대한 링크를 제공했다. 2006년 대부분의 기간에는 출판사 버전에 대한 링크만 제공했다. 2006년 12월부터는 게시된 버전과 주요 오픈 액세스 저장소에 대한 링크를 제공하며, 여기에는 개별 교수진 웹 페이지에 게시된 항목 및 기타 비구조화된 소스도 포함된다. 반면에 구글 학술 검색은 유료 액세스와 오픈 액세스 리소스를 명시적으로 필터링하는 것을 허용하지 않는다. 이는 언페이월(Unpaywall), 웹 오브 사이언스(Web of Science), 스코퍼스(Scopus), 언페이월 저널(Unpaywall Journals)과 같이 해당 데이터를 포함하는 도구에서 제공하는 기능으로, 도서관에서 소장 자료의 실제 비용과 가치를 계산하는 데 사용된다.
3.3. 인용 분석 도구
구글 학술 검색은 "피인용 횟수" 기능을 통해 해당 논문을 인용한 논문의 초록에 접근할 수 있게 해준다. 이러한 기능은 이전에 CiteSeer, Scopus, Web of Science에서만 제공되던 인용 색인을 제공한다. 구글 학술 검색은 또한 다양한 형식으로 인용구를 복사하거나 Zotero와 같은 사용자가 선택한 참고 문헌 관리 소프트웨어로 가져올 수 있는 링크를 제공한다.
"학술 인용 프로필"은 저자가 직접 편집할 수 있는 공개 저자 프로필이다. 학술 기관과 관련된 유효한 주소를 가진 구글 계정을 통해 로그인한 개인은 이제 관심 분야와 인용구를 제공하는 자신만의 페이지를 만들 수 있다. 구글 학술 검색은 개인의 총 인용 횟수, h-지수, i10-지수를 자동으로 계산하여 표시한다. 구글에 따르면, 2014년 8월 기준으로 "학술 검색 결과 페이지의 4분의 3이 저자의 공개 프로필 링크를 표시"한다.
3.4. 관련 논문
구글 학술 검색은 "관련 논문" 기능을 통해 원본 검색 결과와 얼마나 유사한지를 기준으로 순위가 매겨진 관련 논문 목록을 제공하며, 각 논문의 관련성 또한 고려한다.
3.5. 미국 판례 데이터베이스
구글 학술 검색의 미국 판례 데이터베이스는 방대한 규모를 자랑한다. 사용자는 1950년 이후의 미국 주 항소 법원 및 대법원 판례, 1923년 이후의 미국 연방 지방 법원, 항소 법원, 조세 법원 및 파산 법원 판례, 그리고 1791년 이후의 미국 대법원 판례의 공개된 판결문을 검색하고 읽을 수 있다. 구글 학술 검색은 판례 내에서 클릭 가능한 인용 링크를 제공하며, "인용 방법" 탭을 통해 변호사는 이전 판례와 법원 판결에 대한 후속 인용을 조사할 수 있다.
4. 순위 알고리즘
구글 학술 검색은 연구자들이 사용하는 방식과 유사하게, 각 논문의 전체 텍스트, 저자, 논문이 게재된 출판물, 그리고 해당 논문이 다른 학술 문헌에서 얼마나 자주 인용되었는지를 종합적으로 고려하는 결합된 순위 알고리즘을 사용하여 검색 결과의 순위를 매긴다. 특히 인용 횟수에 높은 가중치를 부여하며, 문서 제목에 포함된 단어에도 높은 가중치를 부여한다. 인용 횟수가 높은 논문은 저자 또는 연도별 검색에서 첫 번째 검색 결과로 나타나는 경우가 많다. 키워드 검색에서도 인용 횟수가 가장 큰 영향을 미치지만, 다른 요인들도 함께 작용한다.
5. 한계 및 비판
일부 연구자들은 구글 학술 검색이 특정 저널의 논문 인용을 살펴볼 때 구독 기반 데이터베이스와 품질 및 유용성 면에서 비슷하다고 평가했다. 특히, "피인용 횟수" 기능은 스코퍼스(Scopus) 및 웹 오브 사이언스(Web of Science)와 경쟁하고 있다고 평가했다. 그러나 생의학 분야 연구에서는 인용 정보가 "때로는 부적절하고, 업데이트가 덜 이루어진다"는 비판도 있다. 학문 분야에 따라 다른 데이터베이스와의 범위 차이가 있을 수 있다.
구글 학술 검색은 크롤링된 저널 목록이나 출판사를 공개하지 않고, 업데이트 빈도가 불확실하다. 2017년 기준으로, 인문학 분야에 대한 범위는 경험적으로 조사되지 않아, 해당 분야에서의 유용성은 여전히 불분명하다. 초기에는 일부 출판사가 자사 저널의 크롤링을 허용하지 않기도 했다. 엘스비어(Elsevier) 저널은 2007년 중반부터 포함되었다.
구글 학술 검색은 순위 알고리즘에서 인용 횟수에 높은 가중치를 부여하여 마태 효과를 강화한다는 비판을 받는다. 즉, 인용 횟수가 많은 논문이 상위에 노출되어 더 많은 인용을 얻고, 새로운 논문은 상대적으로 주목받기 어려워지는 현상이 발생한다. '구글 학술 검색 효과'는 연구자들이 구글 학술 검색 상위 결과에 나타나는 논문을 선택하고 인용하는 현상을 의미한다.
arXiv 프리프린트 서버의 출판물을 올바르게 식별하는 데 어려움을 겪는 경우가 있으며, 스팸에 취약하여 인용 횟수 조작이 가능하다는 문제점도 지적되었다. 2010년 기준으로, 렉시스넥시스(LexisNexis)와 같이 판례법을 shepardize할 수 없었다. 스코퍼스(Scopus) 및 웹 오브 사이언스(Web of Science)와 달리, 데이터 검색 자동화를 위한 응용 프로그래밍 인터페이스(API)를 제공하지 않으며, 웹 스크레이퍼를 사용한 검색 결과 수집은 CAPTCHA로 인해 제한된다. 디지털 객체 식별자(DOI)를 표시하거나 내보내지 않는다.
6. 구글 학술 검색을 위한 검색 엔진 최적화 (ASEO)
검색 엔진 최적화(SEO)는 구글과 같은 일반적인 웹 검색 엔진에서 수년 동안 인기를 얻고 있다. SEO는 구글 학술 검색과 같은 학술 검색 엔진에도 적용되어 왔다. 학술 출판에 대한 SEO는 "학술 검색 엔진 최적화"(ASEO)라고도 불리며, "학술 검색 엔진이 학술 문헌을 크롤링하고 색인화하기 쉽도록 학술 문헌을 생성, 출판 및 수정하는 것"으로 정의된다. ASEO는 엘스비어(Elsevier), OpenScience, 멘델리(Mendeley), 세이지 퍼블리싱(SAGE Publishing)을 포함한 여러 기관에서 구글 학술 검색에서 논문의 순위를 최적화하기 위해 채택했다. ASEO에는 부정적인 측면도 있다.