맨위로가기

웨이백 머신

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

웨이백 머신은 웹사이트의 변경 또는 소멸에 대비하여 과거의 웹 페이지를 보존하는 디지털 아카이브 서비스이다. 2001년 10월에 출시되었으며, 인터넷 아카이브의 설립자 브루스터 케일과 브루스 길리엇이 개발했다. 이 서비스는 웹 크롤링을 통해 웹 페이지, 유즈넷 게시판, 다운로드 가능한 소프트웨어 등 공개된 정보를 수집하며, 사용자는 시간을 거슬러 웹 페이지의 과거 버전을 확인할 수 있다. 웨이백 머신은 다양한 분야에서 활용되며, 언론, 사회 과학 연구, 위키피디아 편집 등에서 중요한 자료로 사용된다. 그러나 기술적인 한계, 법적 문제, 검열 및 보안 문제 등의 어려움도 존재한다.

더 읽어볼만한 페이지

  • 온라인 아카이브 - 위키리크스
    위키리크스는 2006년 설립되어 줄리언 어산지가 주도한 비영리 조직으로, 정부와 기업의 기밀 정보를 폭로하는 것을 목표로 하지만 정보 진위 논쟁, 러시아 정부 연루 의혹, 법적 문제 등으로 평가가 엇갈린다.
  • 온라인 아카이브 - 인터넷 아카이브
    인터넷 아카이브는 1996년 브루스터 케일에 의해 설립된 비영리 단체로, 웹 아카이빙, 텍스트, 오디오, 비디오, 소프트웨어 등 다양한 디지털 자료를 수집하고 보존하며, 웨이백 머신, Archive-It, 인터넷 아카이브 스칼라, 오픈 라이브러리 등 다양한 프로젝트를 운영한다.
  • 전자 도서관 - 위키문헌
    위키문헌은 저작권 만료 또는 공개 라이선스 자료를 디지털 형태로 수집, 보존하는 위키미디어 재단의 프로젝트로, ProofreadPage 확장 기능을 통해 스캔 자료의 교정 및 검증을 지원하며 여러 기관과의 협력을 통해 질적 향상을 도모하지만 신뢰성 문제에 대한 비판도 존재한다.
  • 전자 도서관 - 프랑스 국립도서관
    프랑스 국립도서관은 1368년 왕립 도서관으로 시작하여 프랑스 혁명 이후 국립 도서관으로 변경되었으며, 소장품 확장을 거쳐 현재 리슐리외관과 프랑수아 미테랑관을 운영하며 디지털 도서관 갈리카를 통해 자료를 제공한다.
  • 인터넷의 역사 - 네트워크 접속 지점
    네트워크 접속 지점(NAP)은 미국에서 ISP를 연결하기 위한 인터넷 연결점 중 하나이며, 미국 과학재단이 지원하여 설립되었고, 현재는 공용 교환 설비를 제공하지만 인터넷 트래픽의 대부분은 NAP를 거치지 않고 처리된다.
  • 인터넷의 역사 - 구글 크롬
    구글 크롬은 구글이 개발한 웹 브라우저로, 크로미엄 프로젝트를 기반으로 오픈 소스 코드를 활용하여 개발되었으며, 다양한 기능과 운영체제 지원을 통해 세계 시장 점유율 1위를 기록하지만 개인 정보 보호 정책으로 비판을 받기도 한다.
웨이백 머신 - [IT 관련 정보]에 관한 문서
개요
웨이백 머신 로고 2010
웨이백 머신 로고
유형디지털 아카이브
상업성비상업적
등록선택 사항
사용 언어영어
소유주인터넷 아카이브
설립일 (비공개)1996년 5월 10일
공개일2001년 10월 24일
현재 상태활성
프로그래밍 언어HTML
CSS
JavaScript
Java
Python
서비스 지역전 세계 (중국, 인도}}, 및 바레인 제외)
URL웨이백 머신 웹사이트
웹 아카이브 토어 주소
참고
위키백과 템플릿 도움말위키백과에서 웨이백 머신을 인용하는 방법
위키백과 템플릿위키백과의 웨이백 머신 템플릿

2. 역사

인터넷 아카이브의 설립자 브루스터 케일과 브루스 길리엇(Bruce Gilliat)은 웹사이트의 내용이 변경되거나 폐쇄되어 정보가 사라지는 문제를 해결하기 위해 2001년 10월 24일 웨이백 머신을 공식적으로 출시했다.[213][6] [7] [8][9][126] 이 서비스를 통해 사용자는 특정 시점의 웹 페이지 모습을 확인할 수 있으며, 인터넷 아카이브는 이를 "3차원 색인"이라고 부른다.[10][127] 케일과 길리엇은 인터넷 전체를 보존하고 "모든 지식에 대한 보편적인 접근"을 제공하고자 이 서비스를 만들었다.[11]

"웨이백 머신"이라는 이름은 1960년대 미국 애니메이션 《로키와 불윈클의 모험》(The Adventures of Rocky and Bullwinkle and Friends)에 등장하는 가상의 시간 여행 장치 'WABAC 머신'(웨이백으로 발음)에서 따왔다.[12] [13] [14][128][129] 애니메이션의 한 코너인 "피보디의 놀라운 역사"(Peabody's Improbable History)에서 주인공 피보디 교수와 셔먼은 이 기계를 이용해 과거의 유명한 역사적 사건들을 직접 경험한다.[15]

인터넷 아카이브는 1996년부터 웹 페이지 캐시를 보관하기 시작했으며, 가장 초기에 보관된 것으로 알려진 페이지는 1996년 5월 10일 오후 2시 8분(UTC)의 것이다.[5] 1996년부터 2001년까지 수집된 정보는 디지털 테이프에 보관되었고, 케일은 때때로 연구자나 과학자들이 이 데이터베이스에 접근할 수 있도록 허용했다.[16][130]

웨이백 머신은 인터넷 아카이브 설립 5주년이 되던 2001년에 캘리포니아 대학교 버클리 캠퍼스에서 열린 기념행사를 통해 대중에게 공개되었다.[17][131] 서비스가 공개될 당시 이미 100억 페이지 이상이 보관되어 있었다.[46] 데이터는 인터넷 아카이브의 대규모 리눅스 노드 클러스터에 저장되며,[11][132] 웹사이트의 새로운 버전은 주기적으로 다시 방문하여 보관된다.[29][142] 사용자가 직접 특정 웹사이트의 URL을 입력하여 수동으로 해당 페이지를 캡처할 수도 있다.[18]

2020년 10월 30일, 웨이백 머신은 보관된 콘텐츠에 대한 사실 확인 기능을 도입했다.[19] 2022년 1월부터는 광고 서버의 도메인은 캡처 대상에서 제외되었다.[20]

2021년 5월, 인터넷 아카이브 25주년을 기념하여 웨이백 머신은 "웨이포워드 머신(Wayforward Machine)"이라는 기능을 선보였다. 이는 사용자가 가상으로 "지식이 위협받는 2046년의 인터넷으로 여행"하는 경험을 제공한다.[21] [22]

2024년 10월 9일, 친팔레스타인계 해커티비스트(hacktivist) 그룹으로 알려진 "SN_BlackMeta"가 DDoS 공격을 감행하여 약 3,100만 명의 사용자 정보(사용자 이름, 이메일 주소, 암호화된 비밀번호 등)가 유출되는 사건이 발생했다. 이로 인해 인터넷 아카이브 측은 웨이백 머신을 포함한 여러 서비스를 일시적으로 중단했다.[133][134][135] 이후 2024년 10월 14일에 웨이백 머신은 임시로 읽기 전용 모드로 복구되었고,[136] 11월 4일에는 저장 기능까지 완전히 복구되었다.[137]

3. 기술적 정보

웨이백 머신의 소프트웨어는 웹 크롤링 기술을 사용하여 페이지, 고퍼 계층 구조, 넷뉴스(유즈넷) 게시판 시스템, 다운로드 가능한 소프트웨어 등 공개적으로 접근 가능한 정보와 데이터 파일을 수집하도록 개발되었다.[23][138] 하지만 이러한 "크롤러"가 수집하는 정보가 인터넷상의 모든 정보를 포함하는 것은 아니다. 많은 데이터가 게시자에 의해 접근이 제한되거나 데이터베이스에 저장되어 있기 때문이다. 이러한 부분적 캐싱 문제를 해결하기 위해 인터넷 아카이브는 2005년, 기관이나 콘텐츠 제작자가 직접 디지털 콘텐츠 컬렉션을 수집하고 보존하여 디지털 아카이브를 만들 수 있도록 Archive-It.org를 개발했다.[24][139]

크롤링 데이터는 다양한 출처에서 제공된다. 일부는 제3자로부터 가져오고, 다른 일부는 인터넷 아카이브 내부에서 직접 생성한다.[29][142] 예를 들어, 알프레드 P. 슬론 재단과 알렉사 인터넷에서 크롤링 데이터를 제공받으며, 인터넷 아카이브는 미국 국립문서기록관리청(NARA)과 Internet Memory Foundationeng(인터넷 메모리 재단)를 대신하여 크롤링을 실행하기도 한다. 또한 커먼 크롤의 미러 데이터도 활용한다.[29][142] "전 세계 웹 크롤링"(eng)은 2010년부터 실행되어 전 세계 웹을 포괄적으로 캡처하고 있다.[29][25][140][142]

수집된 문서와 리소스는 특정 시점의 타임스탬프가 포함된 URL과 함께 저장된다. 페이지 내의 이미지, 스타일시트, 스크립트와 같은 개별 리소스 및 외부 하이퍼링크는 해당 페이지가 저장된 시점의 타임스탬프와 연결되어, 시간적으로 가장 가까운 시점에 캡처된 버전으로 자동으로 연결(리다이렉트)된다.[27]

웹사이트 스냅샷이 캡처되는 빈도는 웹사이트마다 다르다.[29][142] "전 세계 웹 크롤링"에 포함된 웹사이트는 "크롤링 목록"에 따라 크롤링당 한 번씩 아카이브된다.[29][142] 크롤링 규모에 따라 완료하는 데 몇 달 또는 몇 년이 걸릴 수도 있다.[29] 예를 들어, "광범위 크롤링 13"(eng)은 2015년 1월 9일에 시작되어 2016년 7월 11일에 완료되었다.[28][141] 그러나 동시에 여러 크롤링 작업이 진행될 수 있고, 특정 사이트가 여러 크롤링 목록에 포함될 수도 있어 사이트가 크롤링되는 빈도는 매우 다양하다.[29][142]

2013년 10월에는 사용자가 직접 특정 웹 페이지를 아카이브할 수 있는 "지금 페이지 저장"(eng) 기능이 도입되었다.[30][44][45][151] 이 기능은 웨이백 머신 메인 페이지 오른쪽 하단에서 사용할 수 있으며,[31] 대상 URL을 입력하고 저장하면 해당 웹 페이지가 웨이백 머신에 보존된다.[30] https://web.archive.org/save 인터넷 주소를 통해[32] 사용자는 PDF데이터 압축 파일 형식을 포함한 다양한 콘텐츠를 웨이백 머신에 업로드할 수 있다. 웨이백 머신은 업로드된 콘텐츠에 대해 영구적인 로컬 URL을 생성하며, https://archive.org 공식 웹사이트에서 검색할 때 나열되지 않더라도 웹에서 접근할 수 있다.

2020년 9월, 인터넷 아카이브는 미국의 콘텐츠 전송 네트워크(CDN) 서비스 제공업체인 클라우드플레어와 파트너십을 맺었다고 발표했다. 이 협력을 통해 클라우드플레어의 "항상 온라인"(eng) 서비스를 통해 제공되는 웹사이트를 웨이백 머신이 자동으로 색인화하게 되었다.[26]

3. 1. 저장 용량 및 성장

기술 발전에 따라 웨이백 머신의 저장 용량도 지속적으로 증가했다. 2003년, 일반에 공개된 지 2년 만에 웨이백 머신은 매달 12테라바이트(TB)의 속도로 성장했다. 데이터는 인터넷 아카이브 직원들이 맞춤 설계한 PetaBox 랙 시스템에 저장되었다.[143][144] 첫 번째 100TB 랙은 2004년 6월에 완전히 가동되었지만, 곧 훨씬 더 많은 저장 공간이 필요하다는 것이 분명해졌다.[34][35]

2009년 인터넷 아카이브는 맞춤형 저장 아키텍처를 Sun Microsystems의 Sun Open Storage로 이전했으며, 캘리포니아 캠퍼스에 있는 Sun Modular Datacenter의 새로운 데이터 센터에서 이를 운영했다.[36][145] 2009년 당시 웨이백 머신은 약 3페타바이트(PB)의 데이터를 포함하고 있었고, 매달 100TB의 속도로 증가하고 있었다.[37][146]

2011년에는 업데이트된 인터페이스와 최신 보관 콘텐츠 색인을 갖춘 새로운 버전의 웨이백 머신이 공개 테스트용으로 제공되었다.[38][39][147] 같은 해 3월, 웨이백 머신 포럼에서는 "새로운 웨이백 머신 베타 버전은 2010년까지 크롤링된 모든 자료에 대해 더 완전하고 최신 색인을 가지고 있으며 정기적으로 업데이트될 것"이라며, "기존 웨이백 머신을 구동하는 색인은 2008년 이후 자료가 거의 없고 더 이상 업데이트 계획이 없어 올해 단계적으로 중단될 것"이라고 밝혔다.[41][148] 또한 2011년, 인터넷 아카이브는 6번째 PetaBox 랙 한 쌍을 설치하여 웨이백 머신의 저장 용량을 700TB 늘렸다.[42][149]

2013년 1월에는 보관된 URL 수가 2,400억 개에 달했다고 발표했다.[43][150] 같은 해 10월에는 모든 인터넷 사용자가 URL 콘텐츠를 보관하고 영구 링크를 생성할 수 있는 "페이지 저장"(Save a Page) 기능을 도입했다.[44][45][151]

저장 용량은 꾸준히 증가하여, 2014년 12월 기준 약 9PB (웹 페이지 4,350억 개),[46][47][48][154][155][156] 2016년 7월 기준 약 15PB,[49][157] 2018년 9월 기준 25PB 이상,[51][52][158][159] 2020년 12월 기준 70PB 이상으로 증가했다.[53][160] 2023년 3월에는 보관된 사이트 수가 8,000억 개에 달했다.[161]

2016년 10월, 웹 페이지 계산 방식이 변경되어 그림, 비디오, 스타일시트, 자바스크립트와 같은 임베디드 객체는 더 이상 "웹 페이지"로 계산하지 않고 HTML, PDF, 일반 텍스트 문서만 계산한다고 발표했다. 이 변경은 이후 발표되는 페이지 수 통계에 영향을 미쳤다.[50]

아래는 연도별 웨이백 머신에 보관된 페이지 수 변화를 나타낸 표이다.[164][165][214][215]

웨이백 머신 연도별 아카이브 페이지 수
연도보관된 페이지 수비고
200430,000,000,000
200540,000,000,000
200885,000,000,000
2012150,000,000,000
2013373,000,000,000
2014400,000,000,000
2015452,000,000,000
2016459,000,000,000
2017279,000,000,0002016년 페이지 수 계산 방식 변경 영향[50]
2018310,000,000,000
2019345,000,000,000
2020405,000,000,000
2021514,000,000,000
2022640,000,000,000
2024866,000,000,000


3. 2. API

웨이백 머신 서비스는 세 가지 공개 API인 SavePageNow, Availability, 그리고 CDX를 제공한다.[56] SavePageNow는 웹 페이지를 보관하는 데 사용할 수 있다. Availability API는 웹 페이지의 보관 상태를 확인하는 데 사용되며,[57] 웹 페이지의 보관 파일이 존재하는지 여부를 확인한다. CDX API는 수집된 데이터에 대한 복잡한 쿼리, 필터링 및 분석을 위한 것이다.[58][59]

4. 정책

웨이백 머신은 웹사이트 아카이빙과 관련하여 웹사이트 소유자의 권리를 존중하는 정책을 운영하고 있다. 주요 정책으로는 웹사이트 소유자가 robots.txt 파일이나 직접 요청을 통해 아카이브 제외를 요청할 수 있도록 하는 '웹사이트 제외 정책'과, 이러한 제외 권한의 근거가 된 '오클랜드 보관 정책' 등이 있다. 이러한 정책들은 시간이 지남에 따라 일부 변경되어 왔다.

4. 1. 웹사이트 제외 정책

역사적으로 웨이백 머신은 robots.txt 규칙을 준수하여 웹사이트 크롤링 여부와 이미 크롤링된 아카이브의 공개 여부를 결정했다. 웹사이트 소유자는 robots.txt 파일을 사용하여 웨이백 머신의 접근을 차단할 수 있었으며, 이 설정은 소급 적용되어 과거에 보관된 페이지까지 접근할 수 없게 만들었다.[60][166] 인터넷 아카이브는 웹사이트 소유자가 직접 크롤링이나 아카이빙 중지를 요청하는 경우 이를 준수했으며,[60][166] 자료 수집을 원하지 않는 이들의 웹사이트나 문서를 보존하거나 접근을 제공하는 데 관심이 없다는 입장을 밝혔다.[61][62][167][168]

이 소급적 제외 정책은 2002년 캘리포니아 대학교 버클리 정보관리시스템대학원에서 발표한 "삭제 요청 관리 및 보관 무결성 유지에 대한 권고"(Recommendations for Managing Removal Requests and Preserving Archival Integrity영어), 일명 "오클랜드 보관 정책"(The Oakland Archive Policy영어)에 부분적으로 기반을 두었다. 이 정책은 웹사이트 소유자에게 자신의 사이트 보관 자료에 대한 접근 차단 권리를 부여하며,[64][169] 웨이백 머신은 고액의 소송을 피하기 위해 이 정책을 따랐다.[65][170]

그러나 2017년 4월, 서비스가 중단되거나 유휴 도메인이 된 사이트들이 검색 엔진 제외를 위해 설정한 robots.txt 때문에 의도치 않게 웨이백 머신에서도 제외되는 문제가 보고되었다.[63] 이에 따라 인터넷 아카이브는 정책을 변경하여, 사이트를 웨이백 머신에서 제외하려면 명시적인 요청이 필요하도록 했다.[27]

같은 해(2017년), 웨이백 머신은 소급적 제외 정책을 완화하기 시작하여 미국 정부 및 군사 웹사이트에 대해서는 robots.txt 설정을 더 이상 준수하지 않고 크롤링 및 페이지 표시를 진행했다.[66][67][68][69][171][172][173][174] 2017년 4월 이후, robots.txt 무시는 미국 정부 웹사이트뿐만 아니라 더 광범위하게 적용되고 있다.[66][67][68][69][171][172][173][174]

4. 2. 오클랜드 보관 정책

웨이백 머신의 소급적 제외 정책은 2002년 캘리포니아 대학교 버클리캠퍼스 정보관리시스템대학원에서 발표한 "삭제 요청 관리 및 보관 무결성 유지에 대한 권고"(Recommendations for Managing Removal Requests and Preserving Archival Integrityeng)에 부분적으로 기반을 둔다. 이 문서는 흔히 "오클랜드 보관 정책"(The Oakland Archive Policyeng)으로 불리며, 웹사이트 소유자에게 해당 사이트의 보관된 자료에 대한 접근을 차단할 권리를 부여하는 내용을 담고 있다.[64][169] 인터넷 아카이브는 고액 소송을 피하기 위해 이 정책을 준수해 왔다.[65][170]

역사적으로 웨이백 머신은 웹사이트 소유자가 robots.txt 파일을 통해 자신의 사이트 크롤링 및 아카이브를 거부할 수 있도록 허용했으며, 이 설정은 소급 적용되어 이미 보관된 페이지라도 접근할 수 없게 되었다. 또한 웹사이트 소유자가 직접 크롤링 및 아카이브 중지를 요청하는 경우에도 이를 수용했다.[60][166] 인터넷 아카이브는 "'자료 수집을 원하지 않는 사람의 웹사이트나 기타 인터넷 문서를 보존하거나 접근을 제공하는 데 관심이 없다'"는 입장을 밝히기도 했다.[61][62][167][168]

그러나 2017년부터 이러한 소급적 제외 정책은 완화되기 시작했다. 유휴 도메인이 된 사이트가 검색 엔진 제외를 위해 설정한 robots.txt 때문에 의도치 않게 웨이백 머신에서도 제외되는 문제가 보고되자[63], 인터넷 아카이브는 사이트 제거를 위해서는 명시적인 제외 요청이 필요하도록 정책을 변경했다.[27] 이후 미국 정부 및 군사 웹사이트에 대해 robots.txt 설정을 따르지 않고 크롤링 및 페이지 표시를 하는 방향으로 정책이 완화되었으며, 2017년 4월부터는 robots.txt 무시 범위가 미국 정부 웹사이트를 넘어 더욱 확대되었다.[66][67][68][69][171][172][173][174]

5. 활용

웨이백 머신은 학술 연구, 언론 보도, 정치 및 사회 활동 감시, 위키백과 편집 지원 등 다양한 분야에서 활용된다.
학술 연구2001년 공개 이후 웨이백 머신은 데이터 수집 및 저장 방식, 보관된 페이지 자체에 대해 학자들의 연구 대상이 되어 왔다. 2013년까지 웨이백 머신 관련 논문 약 350편이 발표되었으며, 주로 정보 기술, 도서관 과학, 사회 과학 분야에서 연구가 이루어졌다. 사회 과학 분야에서는 1990년대 중반부터 현재까지 웹사이트 발전이 기업 성장에 미친 영향을 분석하는 데 웨이백 머신을 활용했다.[46][154] 또한 웨이백 머신은 페이지 보관 시 대부분의 하이퍼링크를 포함하며, 불안정한 인터넷 환경에서 끊어지기 쉬운 링크도 유지하는 경향이 있다. 인도의 연구자들은 온라인 학술 출판물에서 웨이백 머신의 하이퍼링크 보존 효율성을 연구하여, 절반 이상이 저장된다는 결과를 발표했다.[70][175]
언론 보도 및 정치·사회적 활용언론인들은 웨이백 머신을 통해 사라진 웹사이트, 과거 뉴스 기사, 웹사이트 콘텐츠 변경 사항 등을 확인한다. 웨이백 머신에 보관된 내용은 정치인에게 책임을 묻거나 전쟁 관련 허위 정보를 밝히는 데 사용되기도 한다.[71][176]


  • 2014년, 우크라이나 분리주의 반군 지도자 이고르 기르킨은 말레이시아항공 17편 격추 사건 당시, 처음에는 자신들이 우크라이나 군용기를 격추했다고 소셜 미디어에 게시했으나 민간 항공기임이 밝혀지자 게시물을 삭제했다. 웨이백 머신에는 삭제 전의 게시물이 보관되어 있어 그의 초기 주장을 확인할 수 있었다.[71][72][176][177]
  • 2017년, 백악관 웹사이트에서 기후 변화 관련 내용이 모두 삭제된 사실이 웨이백 머신을 통해 알려지면서 레딧 등에서 논의가 확산되었고, 이는 과학을 위한 행진의 계기가 되기도 했다.[73][74][75][178][179][180]

위키백과 지원웨이백 머신은 정보 검증에 유용하게 사용되며, 위키백과 편집자들이 참고 자료 확인 및 콘텐츠 제작에 활용한다.[76] 위키백과에 새로운 URL이 추가되면 인터넷 아카이브는 해당 페이지를 자동으로 보관하기도 한다.[76]
기타 협력2020년 9월에는 클라우드플레어와 파트너십을 맺어, 클라우드플레어의 "Always Online" 서비스를 이용하는 웹사이트를 자동으로 보관하기 시작했다. 이를 통해 원본 웹사이트 서버에 문제가 생겨 접근할 수 없을 때, 웨이백 머신에 저장된 사이트 복사본으로 사용자를 안내할 수 있게 되었다.[77]

6. 한계

웨이백 머신은 다양한 기능을 제공하지만 몇 가지 한계점도 가지고 있다.

우선, 기술적인 한계로 인해 모든 웹 페이지를 완벽하게 보관하지는 못한다. 웹 크롤러의 작동 방식 때문에 발생하는 문제인데, 예를 들어 플래시 플랫폼이나 자바스크립트로 만들어진 양식, 프로그레시브 웹 앱처럼 사용자와의 상호작용이 중요한 기능들은 완전히 보관하기 어렵다.[79] 이 때문에 2013년 7월경부터는 유튜브 동영상 페이지를 저장해도 댓글은 보이지 않게 되었는데, 이는 댓글이 더 이상 페이지 자체에 직접 포함되지 않기 때문이다.[79] 또한, HTML이나 그 변형이 아닌 방식으로 코딩된 내용은 추출하기 어려워, 보관된 페이지에서 하이퍼링크가 제대로 작동하지 않거나 이미지가 누락되는 경우가 자주 발생한다.[80][81] 다른 페이지로부터 링크가 전혀 없는 소위 '고립 페이지'(orphan page) 역시 웹 크롤러가 발견하기 어려워 보관되지 못할 수 있다.[80][81] 크롤러는 미리 정해진 깊이까지만 링크를 따라가기 때문에, 웹사이트 내의 모든 하이퍼링크를 전부 보관하지는 못한다.[25]

과거에는 웹사이트가 크롤링된 후 웨이백 머신에서 해당 내용을 볼 수 있기까지 상당한 시간이 걸렸다. 2014년에는 이 시간 차이가 6개월에 달하기도 했다.[78][181] 하지만 기술 발전으로 2024년 현재는 이 지연 시간이 3시간에서 10시간 정도로 크게 단축되었다.[27]

검색 기능에도 제한이 있다. 특정 웹사이트의 과거 모습을 보려면 기본적으로 해당 사이트의 URL 주소를 알고 있어야 한다.[184] 웨이백 머신 내의 "사이트 검색" 기능은 웹 페이지 본문에 포함된 단어가 아니라, 해당 사이트를 설명하기 위해 등록된 키워드를 기반으로 검색하기 때문에 원하는 정보를 정확히 찾기 어려울 수 있다.[80]

마지막으로, 웹사이트 운영자의 의사에 따라 보관이 제한될 수 있다. 웹사이트 관리자는 robots.txt 파일을 이용해 웨이백 머신과 같은 웹 크롤러의 접근을 차단할 수 있다. 만약 특정 사이트가 robots.txt를 통해 접근을 막으면, 이 설정은 소급 적용되어 이전에 이미 보관되었던 내용까지 웨이백 머신에서 볼 수 없게 된다.[183] 또한, 웹사이트 관리자가 인터넷 아카이브 측에 직접 연락하여 자신의 사이트를 보관하지 말아 달라고 요청하거나 이미 보관된 내용의 삭제를 요구할 경우, 인터넷 아카이브는 이러한 요청을 받아들인다.[166][183]

7. 법적 문제

인터넷 아카이브의 웨이백 머신은 방대한 웹 페이지 자료를 보관하고 제공하는 과정에서 다양한 법적 문제에 직면해 왔다. 아카이브된 자료가 특허법상 선행기술로 인정될 수 있는지, 민사 소송에서 증거로 활용될 수 있는지 등이 주요 쟁점 중 하나이다. 또한, 웹사이트 내용을 허가 없이 수집하고 저장하는 행위가 저작권법에 위배될 수 있다는 문제 제기도 꾸준히 이어지고 있다. 이와 관련된 구체적인 소송 사례와 법적 쟁점들은 하위 문단에서 더 자세히 다룬다.

7. 1. 민사 소송 및 특허법

미국 특허청(USPTO)과 유럽 특허청(EPO)은 특정 웹 페이지가 대중에게 언제 공개되었는지를 증명하는 증거로서 인터넷 아카이브의 날짜 기록을 인정한다. 이 날짜 정보는 특허 출원 심사 과정에서 해당 웹 페이지가 선행기술로 인정될 수 있는지 판단하는 데 중요한 근거로 활용된다.[88][189] 다만, 증거 능력을 인정받으려면 기록 보관자의 공식 진술서 제출 등 추가 요건을 충족해야 할 수 있다.[189]

웨이백 머신에 보관된 자료는 민사 소송에서도 증거로 사용될 수 있다. 예를 들어, 2003년 Harding Earley Follmer & Frailey 로펌은 상표권 관련 소송에서 웨이백 머신 자료를 활용하여 의뢰인을 성공적으로 변호했다. 이들은 웨이백 머신에 기록된 과거 웹사이트 내용을 제시하며 원고 측의 주장이 근거 없음을 입증했다.[196] 이에 대해 원고인 Healthcare Advocates, Inc.는 디지털 밀레니엄 저작권법(DMCA) 및 컴퓨터 사기 및 남용 방지법(CFAA) 위반 등을 주장하며 인터넷 아카이브를 상대로 소송을 제기하기도 했다. 특히, Healthcare Advocates 측은 자사 웹사이트에 robots.txt 파일을 설정하여 아카이브 수집을 거부했음에도 불구하고, 인터넷 아카이브가 과거 아카이브 기록 일부를 계속해서 접근 가능하게 유지한 점을 문제 삼았다.[196] 이 소송은 최종적으로 법정 외 합의를 통해 해결되었으며, 이후 웨이백 머신 시스템에서 관련 문제가 수정되었다.[197]

그러나 웹사이트 아카이브 기술에는 본질적인 한계가 존재한다. 예를 들어, 웨이백 머신은 사용자가 직접 정보를 입력해야 하는 웹 양식(form)을 제대로 처리하지 못하며, 이 때문에 비RESTful 방식의 전자상거래 데이터베이스와 같은 특정 유형의 콘텐츠는 아카이브에 포함되지 않을 수 있다.[89][190] 이러한 기술적 제약은 소송 과정에서 아카이브 자료가 오용되거나 잘못 해석될 여지를 남긴다. 특히, 원본 URL 정보 없이 웹 페이지의 스크린샷만 증거로 제출될 경우 오류가 발생할 가능성이 높아진다.[89][190]

7. 2. 저작권 문제

유럽에서는 웨이백 머신이 저작권법을 위반하는 것으로 해석될 여지가 있다. 저작권자만이 자신의 콘텐츠가 어디에 게시되거나 복제될지를 결정할 권리가 있으므로, 인터넷 아카이브는 저작권자의 요청이 있을 경우 시스템에서 해당 페이지를 삭제해야 한다.[90][191] 웨이백 머신의 콘텐츠 제외 정책에 대한 자세한 내용은 공식 웹사이트의 FAQ 섹션에서 확인할 수 있다.[91][192]

인터넷 아카이브의 웨이백 머신 아카이빙 활동과 관련하여 여러 소송이 제기되었다.

  • 사이언톨로지 관련 사이트 삭제 (2002년): 2002년 말, 인터넷 아카이브는 사이언톨로지를 비판하는 여러 웹사이트를 웨이백 머신에서 삭제했다.[92][193] 처음에는 "사이트 소유주의 요청"에 따른 것이라는 오류 메시지가 표시되었으나,[93][194] 나중에 실제로는 사이언톨로지 교회 변호사들의 요구였으며, 해당 사이트 소유주들은 삭제를 원하지 않았던 것으로 밝혀졌다.[94][195]

  • 헬스케어 어드보케이츠 (Healthcare Advocates, Inc.) 소송 (2003년): 2003년, 한 법률회사가 웨이백 머신을 이용해 의뢰인의 상표 분쟁 사건을 성공적으로 방어했다. 과거 웹사이트 내용을 근거로 원고의 주장이 무효임을 입증한 것이다. 이에 원고인 헬스케어 어드보케이츠는 소송 내용을 수정하여 인터넷 아카이브를 상대로 저작권 침해뿐만 아니라 디지털 밀레니엄 저작권법(DMCA) 및 컴퓨터 사기 및 남용 방지법 위반 혐의를 추가했다. 헬스케어 어드보케이츠는 자사 웹사이트에 robots.txt 파일을 설치하여 아카이브 접근을 차단했으므로, 인터넷 아카이브가 이전의 모든 웹사이트 사본을 삭제했어야 한다고 주장했다. 그러나 일부 자료는 여전히 접근 가능한 상태로 남아 있었다.[95][196] 이 소송은 결국 법정 밖에서 합의되었고, 웨이백 머신은 해당 문제를 해결했다.[96][197]

  • 수잔 셸 소송 (2005년~2007년): 활동가 수잔 셸(Suzanne Shell)은 2005년 12월, 인터넷 아카이브가 1999년부터 2004년까지 자신의 웹사이트(profane-justice.org)를 허락 없이 보관했다며 10만달러의 손해배상을 청구하는 소송을 제기했다.[97][98][198][199] 이에 인터넷 아카이브는 2006년 1월, 캘리포니아 북부 지방 연방 지방 법원에 셸의 저작권을 침해하지 않았다는 확인 판결을 구하는 소송을 냈다. 셸은 자신의 웹사이트 이용 약관 위반을 주장하며 인터넷 아카이브를 상대로 반소를 제기했다.[99][200] 2007년 2월, 콜로라도 지방 연방 지방 법원 판사는 계약 위반 혐의를 제외한 셸의 모든 반소 주장을 기각했다.[98][124] 인터넷 아카이브는 셸이 제기한 저작권 침해 주장에 대해서는 기각을 요청하지 않았다.[100][201] 2007년 4월 25일, 양측은 소송 합의를 발표했다.[97][124] 인터넷 아카이브는 "자신의 웹 콘텐츠 보관을 원하지 않는 사람들의 자료를 웨이백 머신에 포함시킬 의사가 없다"며 유감을 표했고, 셸은 "인터넷 아카이브 목표의 역사적 가치를 존중하며, 이를 방해할 의도는 없었다"고 밝혔다.[101][202]

  • 다니엘 데이비디욱 사례 (2013년~2017년): 포르노 배우였던 다니엘 데이비디욱은 2013년부터 2016년까지 웨이백 머신에 보관된 자신의 이미지를 삭제하기 위해 여러 차례 DMCA 요청을 보내고 캐나다 연방 법원에 항소하는 등 법적 조치를 취했다.[102][103][104] 해당 이미지들은 2017년에 결국 삭제되었다.

  • 플렉시스파이 (FlexiSpy) 사례 (2018년): 2018년, 스토킹웨어 애플리케이션인 플렉시스파이 웹사이트의 아카이브가 웨이백 머신에서 삭제되었다. 회사 측은 자신들이 인터넷 아카이브에 연락하여 삭제를 요청했다고 주장했다.[105]

8. 검열 및 기타 위협

Archive.org는 중국에서 차단되어 있다.[106][107][108][203][204] 또한 2015년부터 2016년까지 러시아에서는 지하드 선전 동영상을 호스팅했다는 이유로 전면 차단되기도 했다.[71][109][110][205][206][176] 2016년 이후 러시아에서 다시 접속이 가능해졌지만, 같은 해 러시아의 상업 로비스트들은 저작권을 문제 삼아 인터넷 아카이브를 금지하려는 소송을 제기했다.[111]

2015년 3월에는 아카이브된 사이트를 통해 의도치 않게 악성 바이너리가 유포될 수 있다는 보안 문제가 제기되었다.[112][113] 또한 원본 웹사이트에서 논란이 된 콘텐츠가 삭제된 후, 웨이백 머신에서도 해당 아카이브가 삭제되는 경우가 있었다. 예를 들어, 2016년 데일리 비스트 기자가 데이트 앱에서 가짜 프로필을 이용해 여러 게이 올림픽 선수를 아우팅한 기사가 비판을 받고 삭제되자, 인터넷 아카이브 역시 해당 선수들의 안전을 보호하기 위해 관련 아카이브를 삭제했다.[71]

Library Freedom Projecteng의 책임자인 앨리슨 매크리나는 "도서관 사서들은 개인 정보 보호를 매우 중요하게 생각하지만, 검열에도 강력하게 반대한다"고 언급하며 정보 접근성과 프라이버시 사이의 긴장을 지적했다.[71][176]

이 외에도 웨이백 머신은 다양한 위협에 직면해 있다. 자연재해[114][207], 원격 또는 물리적인 파괴 행위[115], 아카이브 내용의 조작 가능성, 저작권법 관련 문제[116], 그리고 사이트 사용자에 대한 감시[117][208] 등이 잠재적 위험 요소로 꼽힌다.

2024년에는 심각한 보안 사고가 발생했다. 9월에는 이메일 주소와 해시된 비밀번호를 포함한 3천 1백만 개의 사용자 기록이 유출되는 데이터 유출 사고를 겪었으며,[133][134][135] 이후 10월 9일, 친팔레스타인 성향의 해커 그룹 "SN_BlackMeta"에 의한 DDoS 공격으로 인해 웨이백 머신을 포함한 인터넷 아카이브 서비스가 중단되었다.[121][122] 서비스는 10월 14일에 읽기 전용 모드로 임시 복구되었고,[123][136] 11월 4일에 페이지 저장 기능을 포함하여 완전히 정상화되었다.[123][137]

9. 유사 서비스


  • 아카이브 투데이(archive.today)
  • 웹 아카이브

참조

[1] 웹사이트 Wayback Machine has been blocked in India https://www.theverge[...] 2017-08-09
[2] 웹사이트 Universal Access to all Knowledge https://archive.org/[...] 2022-06-05
[3] 웹사이트 Internet Archive: Wayback Machine https://web.archive.[...]
[4] 웹사이트 A Message from Internet Archive Founder, Brewster Kahle https://archive.org/[...] 2024-01-10
[5] 웹사이트 PepsiCo Home Page http://www.pepsico.c[...] 2022-10-08
[6] 웹사이트 Wayback Machine General Information https://help.archive[...] 2021-03-02
[7] 웹사이트 WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools http://whois.domaint[...] 2016-03-13
[8] 웹사이트 InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools http://whois.domaint[...] 2016-03-13
[9] 논문 The Wayback Machine: The Web's Archive 2002-03
[10] 문서 Frequently Asked Questions https://archive.org/[...] 2018-09-18
[11] 웹사이트 20,000 Hard Drives on a Mission https://blog.archive[...] 2018-10-15
[12] 잡지 A Library as Big as the World http://www.businessw[...] 2002-02-28
[13] 뉴스 Responsible Party – Brewster Kahle; A Library Of the Web, On the Web https://www.nytimes.[...] 2002-09-08
[14] 서적 The Moose that Roared: The Story of Jay Ward, Bill Scott, a Flying Squirrel, and a Talking Moose St. Martin's Press 2000
[15] 웹사이트 Toonopedia: "Peabody's Improbable History" Toonpedia.com 2024-11-07
[16] 뉴스 Web site takes you way back in Internet history http://www.seattlepi[...] 2001-11-01
[17] 잡지 Wayback Goes Way Back on Web https://www.wired.co[...] 2001-10-28
[18] 웹사이트 Internet Archive: Wayback Machine https://archive.org/[...] 2018-10-15
[19] 웹사이트 Fact Checks and Context for Wayback Machine Pages http://blog.archive.[...] 2021-01-17
[20] 문서 This URL is in our block list and cannot be captured.
[21] 웹사이트 Internet Archive 25th Anniversary – Universal Access to All Knowledge https://anniversary.[...] 2022-01-13
[22] 웹사이트 Wayforward Machine • Visit the future of the internet https://wayforward.a[...] 2022-01-13
[23] 웹사이트 Archiving the Internet http://www.uibk.ac.a[...] Scientific American – March 1997 Issue
[24] 웹사이트 Archive-It: Crawling the Web Together https://blog.archive[...] 2014-10-27
[25] 웹사이트 Worldwide Web Crawls https://archive.org/[...] Internet Archive
[26] 웹사이트 Cloudflare and the Wayback Machine, joining forces for a more reliable Web http://blog.archive.[...] 2020-09-17
[27] 웹사이트 Using The Wayback Machine https://help.archive[...] 2024-09-25
[28] 웹사이트 Wide Crawl Number 13 https://archive.org/[...] Internet Archive
[29] 웹사이트 The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web https://www.forbes.c[...] 2016-01-28
[30] 웹사이트 Fixing Broken Links on the Internet https://blog.archive[...] Internet Archive 2013-12-29
[31] 웹사이트 Wayback Machine main page https://archive.org/[...] Internet Archive 2013-12-30
[32] 웹사이트 Web.archive.org directory https://web.archive.[...] 2014-03-02
[33] 웹사이트 Too Many Requests https://archive.org/[...] Internet Archive 2021-11-27
[34] 웹사이트 Petabox https://archive.org/[...] 2018-10-25
[35] 뉴스 Big storage on the cheap http://news.zdnet.co[...] CNET News 2005-07-29
[36] 웹사이트 Internet Archive and Sun Microsystems Create Living History of the Internet http://www.sun.com/a[...] Sun Microsystems 2009-03-25
[37] 뉴스 Internet Archive to unveil massive Wayback Machine data center http://www.computerw[...] Computerworld 2009-03-19
[38] 웹사이트 Updated Wayback Machine in Beta Testing http://iawebarchivin[...] 2011-01-24
[39] 웹사이트 Advanced Search https://web.archive.[...]
[40] 웹사이트 What's the difference between the classic Wayback Machine and the new Beta version? http://faq.waybackma[...]
[41] 웹사이트 Beta Wayback Machine, in forum https://www.archive.[...]
[42] 웹사이트 Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used https://archive.org/[...]
[43] 웹사이트 Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs http://blog.archive.[...] 2013-01-09
[44] 웹사이트 Fixing Broken Links on the Internet https://blog.archive[...] Collections Team, the Internet Archive 2013-10-25
[45] 웹사이트 (The new Internet Archive Wayback Machine now online) http://www.digitaljo[...] 2013-10-23
[46] 논문 Using the wayback machine to mine websites in the social sciences: A methodological resource 2015-05-05
[47] 웹사이트 Internet Archive Frequently Asked Questions https://archive.org/[...]
[48] 웹사이트 Internet Archive Frequently Asked Questions https://archive.org/[...] 2014-12-18
[49] 웹사이트 Can the manipulation of big data change the way the world thinks? http://www.thenation[...]
[50] 웹사이트 Defining Web pages, Web sites and Web captures https://blog.archive[...] Internet Archive 2016-10-23
[51] 뉴스 Inside Wayback Machine, the internet's time capsule https://thehustle.co[...] 2018-09-28
[52] 간행물 Things Break and Decay on the Internet—That's a Good Thing https://www.wired.co[...] 2018-09-18
[53] 웹사이트 Donate to the Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine @internetarchive https://blog.adafrui[...] adafruit 2020-12-01
[54] 웹사이트 Wayback Machine Hits 400,000,000,000! https://blog.archive[...] Internet Archive 2014-05-09
[55] 웹사이트 Internet Archive https://www.archive.[...] Internet Archive
[56] 웹사이트 Wayback Machine APIs https://archive.org/[...]
[57] Github akamhy/waybackpy
[58] 웹사이트 Developers https://blog.archive[...] 2014-08-22
[59] 웹사이트 Documentation for Public APIs at the Internet Archive http://blog.archive.[...] 2018-12-13
[60] 웹사이트 FAQs – Some sites are not available because of Robots.txt or other exclusions. What does that mean? https://web.archive.[...]
[61] 웹사이트 Frequently Asked Questions https://www.archive.[...]
[62] 뉴스 The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers https://motherboard.[...] 2018-05-22
[63] 웹사이트 Robots.txt meant for search engines don't work well for web archives https://blog.archive[...] 2017-04-17
[64] 웹사이트 Recommendations for Managing Removal Requests And Preserving Archival Integrity http://www2.sims.ber[...] University of California 2002-12-14
[65] 웹사이트 Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy https://archive.org/[...] Internet Archive 2014-07-07
[66] 웹사이트 Robots.txt meant for search engines don't work well for web archives http://blog.archive.[...] 2017-04-17
[67] 웹사이트 Archivierung des Internets: Internet Archive ignoriert künftig robots.txt https://www.heise.de[...] heise online 2017-04-25
[68] 웹사이트 Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de https://www.golem.de[...]
[69] 뉴스 Internet Archive will ignore robots.txt files to keep historical record accurate https://www.digitalt[...] 2017-04-24
[70] 논문 Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs 2014-10-21
[71] 웹사이트 Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed https://www.usnews.c[...] 2016-08-17
[72] 간행물 What the Web Said Yesterday https://www.newyorke[...] 2015-01-26
[73] 뉴스 The March for Science began with this person's 'throwaway line' on Reddit https://www.washingt[...] 2017-04-21
[74] 뉴스 Are scientists going to march on Washington? https://www.washingt[...] 2017-01-25
[75] 뉴스 The global March for Science started with a single Reddit thread https://qz.com/96548[...] 2017-04-22
[76] 웹사이트 More than 9 million broken links on Wikipedia are now rescued http://blog.archive.[...] 2018-10-01
[77] 웹사이트 Cloudflare and the Wayback Machine, joining forces for a more reliable Web http://blog.archive.[...] 2020-09-17
[78] 웹사이트 Internet Archive Frequently Asked Questions https://archive.org/[...] 2014-04-02
[79] 웹사이트 YouTube – Archiveteam https://www.archivet[...]
[80] 논문 The Wayback Machine 2002
[81] 웹사이트 Internet Archive Frequently Asked Questions https://archive.org/[...]
[82] 웹사이트 Motion Opposing Removal of Robots.txt http://www.american-[...] 2009-10
[83] 웹사이트 Order to Disable Robots.txt http://www.american-[...] 2009-10
[84] 논문 Internet Archive's Web Page Snapshots Held Admissible as Evidence http://cyberlaw.stan[...] 2004-11-17
[85] 논문 Proving Web History: How to use the Internet Archive http://www.strozfrie[...] 2006-02
[86] 웹사이트 Looking For Evidence in Virtual Places Admissibility of Internet Evidence https://www.netforla[...]
[87] 서적 Find Info Like a Pro: Mining the Internet's Publicly Available Resources for Investigative Research, Tom 1 https://books.google[...] American Bar Association 2010
[88] 웹사이트 Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes? http://www.uspto.gov[...] 2002-10
[89] 웹사이트 Debunking the Wayback Machine http://www.practice.[...]
[90] 논문 The Wayback Machine und Google Cache – eine Verletzung deutschen Urheberrechts? http://www.jurpc.de/[...]
[91] 웹사이트 Internet Archive FAQ https://archive.org/[...]
[92] 뉴스 Net archive silences Scientology critic http://news.cnet.com[...] CNET News 2002-09-24
[93] 웹사이트 exclusions from the Wayback Machine https://archive.org/[...] Internet Archive 2002-09-23
[94] 웹사이트 Sherman, Set the Wayback Machine for Scientology http://research.yale[...] Yale Law School
[95] 논문 Website Sued for Controversial Trip into Internet Past
[96] 뉴스 Internet Archive Settles Suit Over Wayback Machine https://arstechnica.[...] 2006-08-31
[97] 법원 http://dockets.justi[...] 2006-08-31
[98] 웹사이트 Internet Archive v. Shell Civil Action No. 06cv01726LTBCBS http://blog.ericgold[...] 2007-02-13
[99] 뉴스 Colorado Woman Sues To Hold Web Crawlers To Contracts http://www.informati[...] InformationWeek, UBM Tech, UBM LLC 2007-03-16
[100] 웹사이트 Internet Archive v. Suzanne Shell http://www.internetl[...] Internet Library of Law and Court Decisions
[101] 웹사이트 Internet Archive and Suzanne Shell Settle Lawsuit https://archive.org/[...] 2007-04-25
[102] 웹사이트 Copyright Implications Of A "Right To Be Forgotten"? Or How To Take-Down The Internet Archive. http://www.mondaq.co[...] 2014-12-05
[103] 웹사이트 Davydiuk v. Internet Archive Canada, 2014 FC 944 http://canlii.ca/t/g[...] Federation of Law Societies of Canada 2014-10-16
[104] 웹사이트 Davydiuk v. Internet Archive Canada and Internet Archive, 2016 FC 1313 (CanLII) https://www.canlii.o[...] Federation of Law Societies of Canada 2016-11-30
[105] 웹사이트 The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers https://www.vice.com[...] 2018-05-22
[106] 뉴스 Backing up the history of the internet in Canada to save it from Trump https://techcrunch.c[...] 2017-05-14
[107] 웹사이트 Where to find what's disappeared online, and a whole lot more: the Internet Archive https://www.pri.org/[...] Public Radio International 2017-05-14
[108] 웹사이트 Online Censorship In China https://en.greatfire[...] 2023-10-22
[109] 웹사이트 There's no Wayback in Russia: Putin blocks Archive.org https://www.theregis[...] 2017-05-14
[110] 웹사이트 Russia won't go Wayback, blocks the Internet Archive https://www.digitalt[...] Digital Trends 2015-06-26
[111] 웹사이트 В России разблокирован крупнейший интернет-архив https://rg.ru/2016/0[...] 2016-04-18
[112] 웹사이트 207.241.226.190 IP address information https://www.virustot[...] VirusTotal 2015-03-25
[113] 웹사이트 Safe Browsing Diagnostic page for archive.org https://www.google.c[...] 2015-03-25
[114] 웹사이트 Help Us Keep the Archive Free, Accessible, and Reader Private Internet Archive Blogs https://blog.archive[...] 2017-05-14
[115] 웹사이트 Wayback Machine web archive survives destructive fire but needs help to recover https://www.engadget[...] 2022-04-03
[116] 웹사이트 Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web" https://consumerist.[...] Consumerist 2016-06-07
[117] 웹사이트 Die Trump-Angst grassiert https://www.heise.de[...] heise online 2017-05-14
[118] 저널 The Internet's Dark Ages https://www.theatlan[...] 2017-05-14
[119] 웹사이트 The Entire Internet Will Be Archived In Canada to Protect It From Trump https://motherboard.[...] Motherboard 2016-11-29
[120] 웹사이트 The Human Fear of Total Knowledge https://www.theatlan[...] 2016-06-03
[121] 웹사이트 Archive.org, a repository of the history of the Internet, has a data breach https://arstechnica.[...] 2024-10-10
[122] 웹사이트 The Internet Archive is back as a read-only service after cyberattacks https://www.theverge[...] 2024-10-14
[123] 웹사이트 Wayback Machine Homepage https://web.archive.[...] 2024-10-24
[124] 웹사이트 WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools https://whois.domain[...] 2016-03-13
[125] 웹사이트 InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools https://whois.domain[...] 2016-03-13
[126] 저널 The Wayback Machine: The Web's Archive 2002-03-01
[127] 문서 Frequently Asked Questions https://archive.org/[...] 2018-09-18
[128] 뉴스 A Library as Big as the World http://www.businessw[...] BusinessWeek 2002-02-28
[129] 뉴스 Responsible Party – Brewster Kahle; A Library Of the Web, On the Web https://www.nytimes.[...] 2002-09-08
[130] 뉴스 Web site takes you way back in Internet history https://www.seattlep[...] 2001-11-01
[131] 저널 Wayback Goes Way Back on Web https://www.wired.co[...] 2001-10-28
[132] 웹사이트 20,000 Hard Drives on a Mission Internet Archive Blogs https://blog.archive[...] 2018-10-15
[133] 뉴스 「Wayback Machine」のInternet Archiveから3100万人のユーザーデータ漏えい https://www.itmedia.[...] 2024-10-11
[134] 웹사이트 Internet Archive、ダウンは続くも「データは破損していない」 https://www.itmedia.[...] 2024-10-11
[135] 웹사이트 「Internet Archive」がDDoS攻撃でダウン--3100万件のアカウント情報が漏えい https://japan.zdnet.[...] 2024-11-02
[136] 웹사이트 Internet Archiveの「Wayback Machine」が復旧--ただし制限あり https://japan.zdnet.[...] 2024-11-02
[137] 웹사이트 「Wayback Machine」、ページ保存機能も復旧 https://www.itmedia.[...] 2024-11-10
[138] 웹사이트 Archiving the Internet https://www.uibk.ac.[...] Scientific American – March 1997 Issue
[139] 웹사이트 Archive-It: Crawling the Web Together https://blog.archive[...] 2014-10-27
[140] 웹사이트 Worldwide Web Crawls https://archive.org/[...] Internet Archive
[141] 웹사이트 Wide Crawl Number 13 https://archive.org/[...] Internet Archive 2017-10-16
[142] 웹사이트 The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web https://www.forbes.c[...] 2016-01-28
[143] 웹사이트 Internet Archive: Petabox https://archive.org/[...] 2018-10-25
[144] 뉴스 Big storage on the cheap http://news.zdnet.co[...] CNET News.com 2005-07-29
[145] 웹사이트 Internet Archive and Sun Microsystems Create Living History of the Internet http://www.sun.com/a[...] サン・マイクロシステムズ 2009-03-25
[146] 뉴스 Internet Archive to unveil massive Wayback Machine data center https://www.computer[...] Computerworld.com 2009-03-19
[147] 웹사이트 Updated Wayback Machine in Beta Testing https://iawebarchivi[...] Archive.org 2011-08-19
[148] 웹사이트 Beta Wayback Machine, in forum https://archive.org/[...] Archive.org 2014-04-16
[149] 웹사이트 Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used https://archive.org/[...] 2018-10-25
[150] 웹사이트 Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs https://blog.archive[...] Blog.archive.org 2013-01-09
[151] 웹사이트 Fixing Broken Links on the Internet https://blog.archive[...] Collections Team, the Internet Archive 2013-10-25
[152] 웹사이트 207.241.226.190 IP address information https://www.virustot[...] VirusTotal 2015-03-25
[153] 웹사이트 Safe Browsing Diagnostic page for archive.org https://transparency[...] Google 2015-03-25
[154] 논문 Using the wayback machine to mine websites in the social sciences: A methodological resource 2015-05-05
[155] 웹사이트 Internet Archive Frequently Asked Questions https://archive.org/[...]
[156] 웹사이트 Internet Archive Frequently Asked Questions https://archive.org/[...] 2014-12-18
[157] 웹사이트 Can the manipulation of big data change the way the world thinks? https://www.thenatio[...]
[158] 뉴스 Inside Wayback Machine, the internet’s time capsule https://thehustle.co[...] 2018-09-28
[159] 뉴스 Things Break and Decay on the Internet—That's a Good Thing https://www.wired.co[...] 2018-09-18
[160] 웹사이트 Donate to the Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine https://blog.adafrui[...] adafruit 2020-12-02
[161] 웹사이트 Wayback Machine https://web.archive.[...] 2023-03-04
[162] 웹사이트 Archive.org Site Info https://www.alexa.co[...] Alexa Internet
[163] 웹사이트 Archive.org Site Overview http://www.alexa.com[...] Alexa Internet
[164] 웹사이트 Wayback Machine Hits 400,000,000,000! https://blog.archive[...] Internet Archive 2014-05-09
[165] 웹사이트 web.archive.org 2015年2月13日時点のアーカイブ https://www.archive.[...] Internet Archive
[166] 웹사이트 Some sites are not available because of Robots.txt or other exclusions https://web.archive.[...]
[167] 웹사이트 How can I remove my site's pages from the Wayback Machine? https://www.archive.[...]
[168] 뉴스 The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers https://motherboard.[...] 2018-05-22
[169] 웹사이트 Recommendations for Managing Removal Requests And Preserving Archival Integrity https://www2.sims.be[...] University of California 2002-12-14
[170] 웹사이트 Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy https://archive.org/[...] Internet Archive 2014-07-07
[171] 웹사이트 Robots.txt meant for search engines don't work well for web archives https://blog.archive[...] 2017-04-17
[172] 웹사이트 Archivierung des Internets: Internet Archive ignoriert künftig robots.txt https://www.heise.de[...] heise online
[173] 웹사이트 Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de https://www.golem.de[...]
[174] 웹사이트 Internet Archive will ignore robots.txt files to keep historical record accurate https://www.digitalt[...] Digital Trends 2017-04-24
[175] 논문 Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs 2014-10-21
[176] 웹사이트 Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed https://www.usnews.c[...] 2017-05-14
[177] 웹사이트 What the Web Said Yesterday https://www.newyorke[...] The New Yorker 2017-05-14
[178] 웹사이트 The March for Science began with this person's 'throwaway line' on Reddit https://www.washingt[...] Washington Post 2017-04-23
[179] 웹사이트 Are scientists going to march on Washington? https://www.washingt[...] 2017-01-31
[180] 웹사이트 The global March for Science started with a single Reddit thread https://qz.com/96548[...] Quartz 2017-04-23
[181] 웹사이트 Internet Archive Frequently Asked Questions https://archive.org/[...] 2018-11-23
[182] 웹사이트 Internet Archive Frequently Asked Questions https://archive.org/[...] 2018-11-23
[183] 웹사이트 Internet Archive Frequently Asked Questions https://archive.org/[...] 2018-10-18
[184] 논문 The Wayback Machine 2002
[185] 웹사이트 Motion Opposing Removal of Robots.txt https://www.american[...] 2009-10
[186] 웹사이트 Order to Disable Robots.txt https://www.american[...] 2009-10
[187] 논문 Internet Archive's Web Page Snapshots Held Admissible as Evidence https://cyberlaw.sta[...] 2004-11-17
[188] 논문 Proving Web History: How to use the Internet Archive https://www.strozfri[...] 2006-02
[189] 웹사이트 Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes? https://www.uspto.go[...] 2002-Fall
[190] 웹사이트 Debunking the Wayback Machine https://www.practice[...]
[191] 웹사이트 The Wayback Machine und Google Cache - eine Verletzung deutschen Urheberrechts? https://www.jurpc.de[...] 2002
[192] 웹사이트 Internet Archive FAQ https://archive.org/[...] Archive.org
[193] 뉴스 Net archive silences Scientology critic http://news.cnet.com[...] CNET News.com 2002-09-24
[194] 웹사이트 exclusions from the Wayback Machine https://archive.org/[...] Internet Archive 2002-09-23
[195] 웹사이트 Sherman, Set the Wayback Machine for Scientology https://research.yal[...] Yale Law School
[196] 논문 Website Sued for Controversial Trip into Internet Past
[197] 뉴스 Internet Archive Settles Suit Over Wayback Machine https://arstechnica.[...] 2006-08-31
[198] 법원판결 https://dockets.just[...] 2006-08-31
[199] 웹사이트 Internet Archive v. Shell Civil Action No. 06cv01726LTBCBS https://blog.ericgol[...] 2007-02-13
[200] 뉴스 Colorado Woman Sues To Hold Web Crawlers To Contracts https://www.informat[...] InformationWeek, UBM Tech, UBM LLC 2007-03-16
[201] 웹사이트 Internet Archive v. Suzanne Shell http://www.internetl[...] Internet Library of Law and Court Decisions
[202] 웹사이트 Internet Archive and Suzanne Shell Settle Lawsuit https://archive.org/[...] Internet Archive 2007-04-25
[203] 웹사이트 Backing up the history of the internet in Canada to save it from Trump https://techcrunch.c[...] TechCrunch 2017-05-14
[204] 웹사이트 Where to find what's disappeared online, and a whole lot more: the Internet Archive https://www.pri.org/[...] Public Radio International 2017-05-14
[205] 웹사이트 There's no Wayback in Russia: Putin blocks Archive.org https://www.theregis[...] 2017-05-14
[206] 웹사이트 Russia won’t go Wayback, blocks the Internet Archive https://www.digitalt[...] Digital Trends 2017-05-14
[207] 웹사이트 Help Us Keep the Archive Free, Accessible, and Reader Private Internet Archive Blogs https://blog.archive[...] 2017-05-14
[208] 웹사이트 Die Trump-Angst grassiert https://www.heise.de[...] heise online 2017-05-14
[209] 웹사이트 The Internet's Dark Ages https://www.theatlan[...] The Atlantic 2017-05-14
[210] 웹사이트 The Human Fear of Total Knowledge https://www.theatlan[...] The Atlantic 2017-05-14
[211] 웹사이트 The Entire Internet Will Be Archived In Canada to Protect It From Trump https://motherboard.[...] Motherboard 2017-05-14
[212] Github https://github.com/y[...]
[213] 저널 The Wayback Machine: The Web's Archive 2002-03-01
[214] 웹인용 Wayback Machine Hits 400,000,000,000! https://blog.archive[...] Internet Archive 2014-05-09
[215] 웹인용 Internet Archive https://www.archive.[...] Internet Archive 2021-03-08



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com