맨위로가기

이미지넷

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

이미지넷은 AI 연구원 리페이페이가 2006년에 시작한 대규모 이미지 데이터베이스 프로젝트이다. 2007년 워드넷의 단어 데이터베이스를 기반으로 구축되었으며, 이미지 분류를 위해 아마존 메커니컬 터크를 활용했다. 2009년 CVPR에서 처음 발표되었고, 2010년부터 ImageNet 대규모 시각 인식 챌린지(ILSVRC)가 시작되었다. ILSVRC는 2017년 종료되었으며, 딥러닝 발전에 크게 기여했다. 이미지넷은 다양한 하위 집합을 가지고 있으며, 딥러닝 모델의 훈련 및 성능 평가를 위한 벤치마크로 활용된다. 하지만 데이터셋의 편향, 레이블 오류, 프라이버시 문제 등의 한계점도 존재한다.

더 읽어볼만한 페이지

  • 데이터베이스 - 지식 베이스
    지식 베이스는 특정 주제 정보를 체계적으로 저장 및 관리하며 규칙 기반 추론으로 새로운 지식 도출에 활용되고, 웹 콘텐츠 관리 및 지식 관리 시스템으로 확장되어 온톨로지를 이용, 인공지능 기술과 결합하여 문제 해결책을 제시하고 경험을 통해 학습하는 시스템이다.
  • 데이터베이스 - 화이트리스트
    화이트리스트는 특정 대상만 허용하고 나머지는 차단하는 접근 제어 목록으로, 정보보안, 무역, 금융 등 다양한 분야에서 활용되지만, 목록 선정 기준의 불명확성, 사회적 문제점 등의 위험성으로 투명하고 엄격한 관리가 필요하다.
이미지넷
개요
ImageNet 데이터 세트의 예시 이미지
다양한 객체 범주를 보여주는 ImageNet 데이터 세트의 예
유형이미지 데이터 세트
설명컴퓨터 비전 연구를 위한 대규모 이미지 데이터 세트. 계층 구조로 구성되어 있으며, 각 노드는 이미지로 표현되는 단어에 해당한다.
상세 정보
웹사이트ImageNet 공식 웹사이트
개발 시작2007년
데이터 크기150GB (2010년 기준)
이미지 수14,197,122개 (2024년 10월 26일 기준)
객체 카테고리 수21,841개
WordNet 시냅스 수80,000개 이상
목적객체 인식 알고리즘 학습 및 평가
특징대규모 데이터, 계층적 구조, 다양한 객체 카테고리
활용 분야컴퓨터 비전
딥러닝
객체 인식
이미지 분류
역사 및 배경
개발 동기컴퓨터가 시각적 세계를 더 잘 이해하도록 돕기 위해
ImageNet Large Scale Visual Recognition Challenge (ILSVRC)ImageNet 데이터 세트를 사용하여 객체 인식 알고리즘의 성능을 평가하는 연례 대회 (2010년부터 2017년까지 개최)
기여딥러닝 기반 객체 인식 모델 개발에 크게 기여
데이터 구성
구조WordNet의 어휘 데이터베이스를 기반으로 하는 계층적 구조
각 노드이미지로 표현되는 단어에 해당
이미지각 이미지는 객체의 종류에 따라 레이블이 지정됨
활용
주요 사용 분야객체 인식 모델 학습
이미지 분류 모델 학습
딥러닝 연구
ImageNet Large Scale Visual Recognition Challenge (ILSVRC)알고리즘 성능 벤치마킹
문제점 및 비판
데이터 편향 문제특정 지역, 문화, 인종에 대한 편향이 존재할 수 있음
윤리적 문제데이터 수집 및 사용 과정에서의 개인 정보 침해 가능성
레이블 오류이미지 레이블의 부정확성
관련 연구 및 기술
딥러닝ImageNet을 활용한 딥러닝 모델 연구 활발
CNN (합성곱 신경망)ImageNet 기반 이미지 인식 모델의 주요 기술
객체 탐지ImageNet 데이터는 객체 탐지 알고리즘 개발에도 활용됨
참고 자료
참고 자료New Scientist: New computer vision challenge wants to teach robots to see in 3D
The New York Times: For Web Images, Creating New Technology to Seek and Find
The Economist: From not working to neural networking

2. 역사

AI 연구원 리페이페이(Fei-Fei Li)는 대부분의 연구가 모델과 알고리즘에 집중하던 2006년, AI 학습용 데이터의 중요성에 주목하여 이미지넷 프로젝트 구상을 시작했다.[112][6] 2007년, 그녀는 워드넷(WordNet)의 창시자 중 한 명인 프린스턴 대학교의 크리스티안 펠바움(Christiane Fellbaum) 교수와 만나 논의한 후, 워드넷의 단어 데이터베이스를 기반으로 이미지넷 구축에 착수했다.[113][11]

프린스턴 대학교 조교수 시절 리페이페이는 연구팀을 꾸려 이미지 분류 작업을 위해 아마존 메커니컬 터크(Amazon Mechanical Turk)를 활용했으며,[113][11] 2009년 컴퓨터 비전 및 패턴 인식 컨퍼런스(CVPR)에서 데이터베이스를 처음으로 공개했다.[113][114][115][10]

이미지넷 데이터셋의 활용도를 높이기 위해, 2010년부터는 PASCAL VOC 챌린지와의 협력을 통해 연례 대회인 ImageNet 대규모 시각 인식 챌린지(ILSVRC)가 시작되었다.[19][11] 이 대회는 1000개의 이미지 범주에 대한 분류 및 객체 위치 탐지 능력을 겨루는 장이 되었다.[19]

초기 대회에서는 서포트 벡터 머신(SVM) 기반의 시스템들이 우승했으나,[33][8] 2012년 알렉스넷(AlexNet)이라는 합성곱 신경망(CNN) 모델이 압도적인 성능(Top-5 정확도 84.7%)을 보이며 우승하면서 딥 러닝 연구의 붐을 일으키는 결정적인 계기가 되었다.[38][4] 이후 ILSVRC에서는 딥 러닝 모델들의 경쟁이 심화되었고, 2015년에는 마이크로소프트ResNet이 등장하여 인간의 인식 능력을 넘어서는 성능을 보고하는 등[18][40] 기술 발전이 가속화되었다.

ILSVRC는 2017년 대회를 마지막으로 종료되었지만,[39] 이미지넷 데이터셋은 이후에도 딥 러닝 모델 개발과 성능 평가를 위한 핵심적인 벤치마크로 꾸준히 활용되고 있다.

2. 1. 배경

이미지넷이 발표되기 전, 대부분의 기계 학습 연구는 비교적 소규모 데이터셋에 의존하는 경향이 있었다. 특히 사람이 직접 특징을 설계하거나, 특정 문제 해결을 위한 사전 지식을 활용하는 경우가 많았다. 이미지넷과 유사하게 여러 범주의 이미지를 포함하는 데이터셋으로는 Caltech101, Pascal VOC, TinyImages 등이 있었지만, Caltech101과 Pascal VOC는 이미지넷에 비해 규모가 수천에서 수만 장 수준으로 작았고, TinyImages는 라벨의 정확성이 수동으로 검증되지 않았다.

이러한 상황에서 AI 연구자 리페이페이(Fei-Fei Li)는 당시 대부분의 AI 연구가 모델과 알고리즘 개발에 집중되어 있다는 점에 주목했다.[54][6] 그녀는 인간 아이가 시각적 경험을 통해 세상을 배우는 방식에 영감을 받아, 컴퓨터 역시 방대한 양의 데이터를 통해 학습할 수 있을 것이라는 가설을 세웠다.[54] 이에 따라 리페이페이는 모델 자체가 아닌 데이터에 초점을 맞춰, AI 알고리즘 훈련에 사용될 데이터셋을 확장하고 개선하는 것을 목표로 삼았다.[54][112] 그녀는 2006년부터 이미지넷 프로젝트에 대한 아이디어를 구체화하기 시작했다.[112]

2007년, 리페이페이는 워드넷(WordNet)의 창시자 중 한 명인 프린스턴 대학교의 크리스티안 펠바움(Christiane Fellbaum) 교수를 만나 프로젝트에 대해 논의했다.[113][11] 이 만남을 통해 리페이페이는 워드넷의 방대한 단어 데이터베이스를 기반으로 이미지를 분류하고 체계화하는 아이디어를 얻어 이미지넷 구축에 착수했다.[113][11][55]

당시 프린스턴 대학교의 조교수였던 리페이페이는 2007년에 이미지넷 프로젝트를 진행할 연구팀을 구성했다.[54] 연구팀은 이미지 분류 작업을 위해 아마존 메커니컬 터크(Amazon Mechanical Turk)를 활용했으며,[113][11] 2008년 7월부터 이미지 라벨링 작업을 시작하여 2010년 4월에 완료했다.[11]

연구팀은 2009년 플로리다에서 열린 컴퓨터 비전 및 패턴 인식 컨퍼런스(CVPR)에서 "ImageNet: 대규모 계층적 데이터 세트 미리보기"라는 제목의 포스터 발표를 통해 자신들의 데이터베이스를 처음으로 학계에 공개했다.[113][114][115][10][11][12][13]

2. 2. 데이터셋 구축

AI 연구원 리페이페이는 2006년부터 이미지넷에 대한 아이디어를 구체화하기 시작했다. 당시 대부분의 AI 연구가 모델과 알고리즘 개발에 집중하던 상황에서, 리페이페이는 AI 알고리즘 훈련에 사용될 데이터의 양과 질을 개선하고자 했다.[112][6]

2007년, 리페이페이는 워드넷(WordNet)의 창시자 중 한 명인 프린스턴 대학교 교수 크리스티안 펠바움(Christiane Fellbaum)을 만나 프로젝트를 논의했다. 이 만남을 계기로 리페이페이는 워드넷의 단어 데이터베이스(약 22,000개의 명사)를 기반으로 이미지넷 구축을 시작했다.[113][11] 그녀는 또한 인간이 평균적으로 약 30,000가지 종류의 객체를 인식한다는 1987년의 연구[7]에서도 영감을 얻었다.[8]

당시 프린스턴 대학교의 조교수였던 리페이페이는 이미지넷 프로젝트를 진행하기 위해 연구팀을 꾸렸다. 하지만 프로젝트 초기에는 연방 정부로부터 연구 보조금 신청이 거부되는 등 연구의 중요성을 인정받지 못하고 재정적인 어려움을 겪었다. 전례 없는 규모의 데이터셋 구축에는 많은 어려움이 따랐다.

이미지넷 구축 작업은 크게 데이터 수집과 데이터 정리의 두 단계로 진행되었다. 데이터 수집 단계에서는 워드넷에 기반한 'synset'(동의어 그룹이 나타내는 개념)별로 이미지를 모았다. 워드넷의 유의어 활용, 다른 언어로의 변환 등을 통해 검색 엔진으로 인터넷에서 이미지를 수집했으며,[56][57][58] 각 synset당 500~1,000개의 이미지를 목표로 했다.[56]

데이터 정리 단계에서는 수집된 이미지들이 해당 synset과 일치하는지 확인하고 분류하는 작업이 이루어졌다. 이 작업은 방대한 시간이 소요될 것으로 예상되었다. 초기 계획은 각 범주당 10,000개의 이미지, 총 40,000개 범주에 4억 개의 이미지를 모으는 것이었으나, 이는 약 19년의 노동력이 필요한 막대한 작업이었다.[9] 리페이페이는 처음에는 대학생 아르바이트를 활용하려 했으나, 작업 속도가 너무 느려(완료까지 수십 년 예상) 다른 방법을 찾아야 했다.[54]

결정적으로, 연구팀은 크라우드소싱 플랫폼인 아마존 메커니컬 터크(Amazon Mechanical Turk)를 활용하여 데이터 정리 작업을 수행했다.[113][80] 이를 통해 전 세계 약 49,000명의 작업자들이 데이터 분류 작업에 참여하여[54] 방대한 작업을 2년 반(2008년 7월 ~ 2010년 4월) 만에 완료할 수 있었다.[11] 작업자들에게는 synset과 이미지의 조합이 제시되었고, 이미지가 해당 synset에 맞는지 여부를 선택하도록 했다. 작업의 신뢰도를 높이기 위해 같은 이미지를 여러 작업자에게 할당하여 다수결로 최종 분류를 결정했으며,[56] 부정확하거나 무작위적인 답변을 걸러내기 위해 정답이 미리 알려진 이미지를 포함시키는 등의 품질 관리 절차도 마련되었다.[54]

이렇게 구축된 이미지넷 데이터베이스는 2009년 플로리다에서 열린 컴퓨터 비전 및 패턴 인식 컨퍼런스(CVPR)에서 "ImageNet: 대규모 계층적 데이터 세트 미리보기"라는 제목의 포스터 발표를 통해 처음으로 학계에 공개되었다.[113][114][115][10][11][12][13]

2. 3. ILSVRC 개최 이후

2010년, 페이페이 리는 [http://host.robots.ox.ac.uk/pascal/VOC/ PASCAL VOC 챌린지] 팀과의 협력을 통해 ImageNet 대규모 시각 인식 챌린지(ILSVRC)를 시작했다.[11][19][54][59] 이는 기존 PASCAL VOC 챌린지가 약 2만 개의 이미지와 20개의 클래스를 다룬 것에 비해 훨씬 규모가 큰, 1000개의 '정리된' 클래스[19]에 대한 이미지 분류 및 객체 감지 능력을 겨루는 연례 대회였다.[11] ILSVRC는 이미지 분류, 단일 객체 위치 특정(localization), 여러 객체 위치 특정(객체 감지)의 세 부문으로 구성되었다.

2010년에 열린 첫 대회에는 11개 팀이 참가했으며, 선형 서포트 벡터 머신(SVM)과 HOG, LBP 특징을 결합한 팀이 Top-5 정확도 71.8% (분류 정확도 52.9%)로 우승했다.[33][34] 2011년 두 번째 대회에서는 피셔 벡터를 활용한 SVM 기반 시스템(XRCE 팀)이 Top-5 오류율 25% (정확도 74.2%)로 우승을 차지했다.[8][36][37]

2012년 ILSVRC는 딥 러닝 분야의 중요한 전환점이 되었다. 제프리 힌튼 연구실 소속 알렉스 크리제브스키 등이 개발한 알렉스넷(AlexNet)이라는 합성곱 신경망(CNN) 모델이 등장하여 Top-5 오류율 15.3% (정확도 84.7%)라는 뛰어난 성과를 거두었다.[108][15][38] 이는 당시 2위 모델보다 10.8% 포인트 이상 낮은 오류율이었다.[108][15] 이러한 성능 향상은 대규모 이미지넷 데이터셋 학습과 그래픽 처리 장치(GPU)의 병렬 컴퓨팅 능력 활용 덕분에 가능했으며,[108][15] AI 연구 커뮤니티뿐만 아니라 기술 산업 전반에 걸쳐 딥 러닝에 대한 관심을 크게 증폭시키는 계기가 되었다.[105][109][110][4][16][17][62]

ImageNet 오류율 기록(팀별 최고 결과 및 연도별 최대 10개 항목 표시)


AlexNet의 성공 이후, ILSVRC는 딥 러닝 모델들의 경쟁 무대가 되었다. 2014년에는 VGG 모델이 2위를 차지했고, 2015년에는 마이크로소프트(Microsoft) 연구팀이 개발한 100개 이상의 레이어를 가진 깊은 CNN 모델인 ResNet이 AlexNet을 능가하며 우승했다.[111][18] ResNet은 기울기 소실 문제를 해결하기 위한 잔차 학습(residual learning) 개념을 도입하여 Top-5 오류율을 약 3.5%까지 낮추는 우수한 성능을 보였다. 마이크로소프트 연구팀은 이 결과를 바탕으로 특정 작업(ILSVRC 분류)에서는 자사의 CNN 성능이 인간의 능력을 넘어섰다고 보고하기도 했다.[18][40][63][64] 그러나 대회 조직자 중 한 명인 올가 루사코프스키(Olga Russakovsky)는 ILSVRC가 1000개의 제한된 범주만을 다루며, 인간은 훨씬 더 많은 범주를 인식하고 이미지의 맥락까지 이해할 수 있다는 점을 지적하며 이러한 주장에 신중한 입장을 보였다.[41][65]

한편, 2015년에는 중국의 바이두(Baidu) 연구팀이 대회 규정(주당 제출 횟수 제한)을 위반하기 위해 여러 계정을 사용한 사실이 드러나 1년간 참가 자격이 정지되는 사건도 있었다.[66][67] 바이두 측은 해당 팀 리더를 해고하고 재발 방지를 위한 조치를 취하겠다고 발표했다.[68]

ILSVRC 참가 규모는 꾸준히 증가하여 2014년에는 50개 이상의 기관이 참여했다.[19] 대회가 거듭되면서 모델 성능은 계속 향상되었고, 2017년 마지막 대회에서는 참가한 38개 팀 중 29개 팀이 95% 이상의 정확도를 달성하는 등[39][69] 성능 향상 폭이 점차 둔화되었다. 이에 따라 ILSVRC는 2017년 대회를 마지막으로 종료되었다.[59] ImageNet 측은 향후 자연어를 사용하여 3D 객체를 분류하는 등 더 어려운 새로운 챌린지를 계획하고 있다고 밝혔다.[1]

ILSVRC는 종료되었지만, 이미지넷 데이터베이스 자체는 여전히 딥 러닝 모델의 성능을 평가하고 개선하기 위한 중요한 벤치마크 데이터셋이자, 사전 학습(pre-training)을 위한 핵심 자원으로 널리 활용되고 있다.

3. 데이터셋

이미지넷 데이터셋 구축에는 크라우드 소싱 방식이 활용되었다. 이미지 주석 작업은 메카니컬 터크를 통해 이루어졌으며[19], 2012년 이미지넷은 메카니컬 터크의 가장 큰 학술 사용자였다.[2] 이미지 분류 체계는 광범위한 WordNet 스키마를 기반으로 하며, 세분화된 분류를 위해 120개 범주의 개 품종 등이 포함되었다.[19]

2010년 4월 30일 기준으로 공개된 데이터셋의 주요 통계는 다음과 같다.[20]

항목수치
비어 있지 않은 시노셋 총 개수21,841
이미지 총 개수14,197,122
경계 상자 주석이 있는 이미지 수1,034,908
SIFT 특징이 있는 시노셋 수1,000
SIFT 특징이 있는 이미지 수1,200,000



이미지넷 데이터셋은 사용 목적과 맥락에 따라 원본 전체 데이터셋(ImageNet-21K)을 포함하여[73] ILSVRC 대회용(ImageNet-1K),[73][74] 개인 정보 보호 처리 버전, 비공식 ImageNetV2 등 여러 변형이 존재한다.[82][75]

이미지넷 프로젝트는 이미지 URL과 각 이미지에 대한 주석 데이터베이스를 제공하며, 이는 이미지넷 웹사이트에서 직접 무료로 다운로드할 수 있다. 그러나 이미지 자체는 이미지넷이 소유하고 있지 않으므로[76], 사용자는 학술 연구 및 비영리 목적으로만 제공된 URL을 통해 이미지를 별도로 다운로드해야 한다.[76] ILSVRC 대회에서 사용된 데이터셋의 경우, 대회 개최 시 직접 배포되었으며[77], ImageNet-1K 데이터셋은 2024년 현재에도 Kaggle과 같은 플랫폼을 통해 접근할 수 있다.[78][79]

3. 1. 구성 및 특징

이미지넷은 다양한 해상도의 RGB 형식 이미지로 구성된다. 예를 들어, ImageNet 2012의 "물고기" 범주 이미지 해상도는 4288 x 2848 픽셀부터 75 x 56 픽셀까지 다양하다. 머신 러닝에서는 일반적으로 이미지를 신경망에서 처리하기 전에 표준화된 고정 해상도로 크기를 조절하고 백색화하는 전처리 과정을 거친다. 예를 들어, PyTorch에서는 이미지넷 이미지를 픽셀 값을 0과 1 사이로 정규화한 후, 이미지넷 데이터셋의 평균([0.485, 0.456, 0.406])을 빼고 표준편차([0.229, 0.224, 0.225])로 나누어 데이터를 백색화한다.[23]

이미지넷의 범주는 WordNet의 개념 체계를 기반으로 하며, 시각적으로 묘사 가능한 가산 명사에 해당하는 21,841개의 시노셋(synset, 동의어 집합)으로 구성된다. 각 시노셋은 "WordNet ID"(wnid)라는 고유 식별 번호를 가지며, 이미지넷은 명사만 포함하므로 모든 wnid는 'n'으로 시작한다 (예: 시노셋의 wnid는 "n02084071").[21] 이미지넷의 각 이미지는 정확히 하나의 wnid로 레이블링된다. 범주는 레벨 1("포유류" 등)부터 레벨 9("저먼 셰퍼드" 등)까지 9단계의 계층 구조를 가진다.[9]

이미지 데이터는 여러 언어의 동의어를 활용하여 구글, 플리커 등 온라인 이미지 검색 서비스를 통해 수집했다.[22] 이미지 주석 작업은 크라우드 소싱 플랫폼인 아마존 메카니컬 터크를 통해 이루어졌다.[19][2] 이미지 주석은 두 가지 수준으로 제공된다.

  • 이미지 수준 주석: 해당 이미지에 특정 객체 클래스가 존재하는지 여부를 나타낸다 (예: "이 이미지에 호랑이가 있다/없다").
  • 객체 수준 주석: 이미지 내 객체(의 보이는 부분) 주위에 경계 상자(bounding box)를 제공한다. 이 주석은 약 3,000개의 인기 있는 시노셋에 대해 제공되며[25], 각 시노셋당 평균 150개의 이미지에 경계 상자가 있다.[26]


또한, 약 400개의 인기 시노셋에 포함된 일부 이미지에는 다음과 같은 25가지 속성 정보가 추가로 제공된다.[27][28]

구분속성
색상검정, 파랑, 갈색, 회색, 녹색, 주황, 분홍, 빨강, 보라, 흰색, 노랑
패턴반점, 줄무늬
모양긴, 둥근, 직사각형, 정사각형
질감털이 있는, 부드러운, 거친, 반짝이는, 금속, 초목, 나무, 젖은



전체 원본 데이터셋은 ImageNet-21K라고 불리며, 21,841개 클래스로 분류된 14,197,122개의 이미지를 포함한다.[20][29][73] 일부 문헌에서는 클래스 수를 반올림하여 ImageNet-22K라고 부르기도 한다.[29][73] ImageNet-21K는 공식적인 훈련, 검증, 테스트 데이터 분할이 없으며, 클래스별 이미지 수가 1개에서 수천 개까지 매우 불균등하다.[29]

가장 널리 사용되는 하위 집합은 ImageNet-1K 또는 ILSVRC2017이라고 불리는 "ImageNet Large Scale Visual Recognition Challenge (ILSVRC) 2012–2017 이미지 분류 및 위치 확인 데이터 세트"이다.[30][74] 이 데이터셋은 ILSVRC 대회를 위해 1,000개의 클래스로 조정되었으며, 1,281,167개의 훈련 이미지, 50,000개의 검증 이미지, 100,000개의 테스트 이미지로 구성된다.[30][74] ImageNet-1K의 모든 클래스는 하위 분류가 없는 리프(leaf) 범주이다.[22] ImageNet-1K 데이터셋에 대해서는 시각적 단어 가방(Bag-of-visual-words) 모델을 위해 설계된 조밀한 SIFT 특징(원시 설명자, 양자화된 코드워드, 좌표 포함)도 제공했다.[24]

3. 2. 하위 집합

이미지넷 데이터셋에는 다양한 맥락에 따라 여러 하위 집합 또는 변형이 존재한다.[15][82]

원본 전체 데이터셋은 ImageNet-21K라고 불린다.[73] 이 데이터셋은 14,197,122개의 이미지를 포함하며, 21,841개의 클래스[71]로 분류되어 있다.[73][29] 여기에는 "기구(balloon)"나 "딸기(strawberry)"와 같이 일상에서 흔히 볼 수 있는 다양한 객체 범주가 포함되며, 각 클래스는 보통 수백 개의 이미지로 구성된다.[72] 문헌에 따라 클래스 수를 반올림하여 ImageNet-22k라고 부르기도 한다.[73][29] ImageNet-21K는 2011년 가을에 `fall11_whole.tar`라는 이름으로 공개되었으며, 공식적인 훈련, 검증, 테스트 데이터 분할은 없다.[29]

가장 널리 사용되는 하위 집합 중 하나는 "이미지넷 대규모 시각 인식 챌린지 (ILSVRC) 2012–2017 이미지 분류 및 위치 확인 데이터셋"이다.[74] 이 데이터셋은 연구 문헌에서 ImageNet-1K 또는 ILSVRC2017, ImageNet 1K-ILSVRC 등으로 불리기도 한다.[73][30] 이 데이터셋은 ILSVRC 대회를 위해 클래스 수를 1,000개로 조정한 것으로,[15] 1,281,167개의 훈련 이미지, 50,000개의 검증 이미지, 100,000개의 평가(테스트) 이미지를 포함한다.[74][73][30] ImageNet-1K의 각 범주는 더 이상 하위 분류가 없는 최종 단계의 범주(리프 범주)이다. 예를 들어, ImageNet-21K에는 단순히 "포유류"로 분류된 이미지가 있을 수 있지만, ImageNet-1K에는 "저먼 셰퍼드"와 같이 구체적인 품종으로만 분류된 이미지가 있다.[22]

이 외에도 비공식적으로 개발된 ImageNetV2라고 불리는 데이터셋이 있다. 이는 원본 ImageNet과 동일한 방법으로 구축되었으며, 각각 10,000개의 이미지로 구성된 3가지 종류의 새로운 테스트 세트를 포함한다.[75]

3. 3. 데이터 구축 과정 (ILSVRC용)

2010년부터 시작된 ILSVRC를 위해 데이터셋을 제작하고 제공하는 데에는 두 가지 주요 과제가 있었다. 첫째는 대회의 공정한 평가를 위해 기존에 공개되지 않은 새로운 평가용 데이터셋을 준비하는 것이었고, 둘째는 대회 과제(클래스 분류, 로컬라이제이션, 객체 감지)의 특성에 맞춰 데이터셋을 조정하거나 추가적인 주석을 다는 것이었다.

첫 번째 과제는 기존 이미지넷 데이터 구축 절차의 일부를 재활용하여 해결했다.

두 번째 과제는 ILSVRC의 세 가지 주요 부문, 즉 클래스 분류, 로컬라이제이션, 객체 감지 부문에 따라 세분화하여 접근했다.

분류 및 로컬라이제이션 과제의 학습용 데이터로는 기존 ImageNet-21K 데이터셋을 기반으로 카테고리를 조정하여 약 1,000개의 클래스를 포함하는 데이터셋을 제작했으며, 이것이 흔히 ImageNet-1K라고 불리는 데이터셋이다. 클래스를 1,000개로 줄인 이유는 과제의 목적에 더 적합한 클래스만을 선정하고, 주석 작업의 난이도 등을 고려했기 때문이다.

반면, 객체 감지 과제는 데이터셋 수집 및 주석 작업의 난이도가 매우 높아 클래스 수를 200개 정도로 축소하고, 이미지도 새로 수집했다. 분류나 로컬라이제이션과 달리 이미지를 새로 수집한 이유는, 감지 과제에서는 여러 객체가 동시에 찍힌 이미지 속에서 각 객체를 식별해야 하므로, 더 복잡하고 다양한 객체가 포함된 이미지가 필요했기 때문이다.

로컬라이제이션 및 감지 과제에서는 객체 주위에 경계 상자(객체를 둘러싸는 최소 크기의 직사각형)를 표시하는 추가적인 주석 작업이 필요했다. 이 작업은 단순히 이미지 내 객체의 종류를 분류하는 것보다 훨씬 어렵기 때문에 작업 효율성과 결과물의 품질 저하가 문제점으로 지적되었다.

이 문제를 해결하기 위해, 로컬라이제이션 과제에서는 주석 작업을 세 단계로 나누었다. 첫째, 주어진 클래스의 객체 중 아직 경계 상자가 없는 객체 하나를 찾아 경계 상자를 그린다. 둘째, 새로 그려진 경계 상자가 정확한지 품질을 검토한다. 셋째, 이미지 내에 경계 상자가 그려지지 않은 객체가 더 남아있는지 판단한다. 이를 통해 각 작업자가 작업을 더 쉽게 완료하고 결과물의 품질을 보증할 수 있도록 했다.

감지 과제에서도 유사한 절차를 따랐지만, 이미지 내에 있는 모든 클래스의 객체를 감지해야 한다는 특성 때문에 로컬라이제이션 절차를 그대로 적용하면 작업량이 클래스 수만큼 배로 늘어나는 문제가 있었다.

따라서 감지 과제에서는 작업 효율을 높이기 위해, 모든 클래스에 대해 이미지 포함 여부를 일일이 묻는 대신, 여러 클래스를 포괄하는 상위 개념(예: '개', '고양이', '토끼' 대신 '동물')이 이미지에 있는지 먼저 묻는 방식으로 주석이 필요한 클래스 수를 효과적으로 줄이는 방법을 사용했다. 이는 같은 이미지에 나타나는 객체들의 카테고리 사이에 상관관계가 있으며, 일반적으로 아주 많은 종류의 객체가 한 이미지에 동시에 나타나는 경우는 드물다는 가설에 기반한다.

4. 딥러닝에 대한 기여

2012년 9월 30일, 알렉스넷(AlexNet)[108][15][82]이라는 합성곱 신경망(CNN)은 이미지넷 대규모 시각 인식 경연대회(ILSVRC) 2012에서 상위 5개 오류율 15.3%를 기록하며 획기적인 성과를 거뒀다. 이는 2위보다 10.8% 포인트 이상 낮은 오류율로, 당시로서는 매우 뛰어난 결과였다. 이러한 성공은 학습 과정에서 그래픽 처리 장치(GPU)를 활용하여 복잡한 CNN 모델을 효과적으로 학습시킬 수 있었기 때문이며,[108][15] 이는 딥 러닝 혁명의 중요한 계기가 되었다. ''이코노미스트''는 이 사건 이후 "갑자기 사람들이 AI 커뮤니티뿐만 아니라 기술 산업 전체에서 딥 러닝에 주목하기 시작했다"고 평가했다.[105][109][110][4][16][17][84][85][86]

이후 딥러닝 모델은 계속 발전해, 2015년에는 마이크로소프트(Microsoft)가 개발한 100개 이상의 층을 가진 매우 깊은 CNN이 알렉스넷의 성능을 뛰어넘어 이미지넷 2015 경연대회에서 우승했다.[111][18][87]

이러한 딥러닝 모델의 눈부신 성능 향상 배경에는 모델 구조의 발전과 그래픽 처리 장치(GPU) 성능 향상 외에도, 이미지넷처럼 모델을 충분히 학습시킬 수 있는 대규모 학습 데이터셋의 등장이 핵심적인 역할을 했다.[53] 이미지넷은 딥러닝 모델 학습에 필요한 방대한 데이터를 제공하며 연구 발전을 크게 촉진했다.

ILSVRC는 2017년에 종료됐지만, 이미지넷 데이터베이스는 현재도 이미지 인식 분야에서 모델과 알고리즘의 성능을 비교하기 위한 중요한 벤치마크로 널리 사용된다.[88][89] 또한, 대규모 모델의 사전 학습에도 활발하게 활용된다.[73]

이미지넷의 등장은 딥러닝 연구 전반에 큰 영향을 미쳤다. 이미지 분야에서는 알렉스넷의 성공 이후 대량 데이터 학습의 중요성이 널리 인식되었다. 노이즈가 많은 데이터라도 대량으로 확보하면 이미지 분류에서 높은 성능을 낼 수 있다는 연구[90]나, 이미지넷에 영감을 받아 더 큰 데이터셋을 구축하고 데이터셋 크기와 모델 성능 간의 관계를 탐구하는 연구[91] 등이 활발히 진행되는 등, 더 큰 규모의 데이터셋 연구를 촉발했다.

나아가 이미지넷은 연구 수행의 표준으로 자리 잡았다. Medical ImageNet, ActivityNet 등 이미지 관련 데이터셋뿐 아니라 음악 분야의 MusicNet처럼 다른 분야 데이터셋 명칭에도 'Net'이 붙는 등 이미지넷의 영향력을 보여준다. 심지어 '자연어 처리 분야에도 이미지넷의 순간이 왔다!'[92]는 표현이 등장할 정도로, 이미지넷은 대규모 데이터셋을 통한 연구 혁신의 상징처럼 여겨진다.

5. 한계 및 과제

이미지넷 데이터셋은 대규모 이미지 인식 연구 발전에 크게 기여했지만, 동시에 여러 한계와 과제를 안고 있다. 데이터셋 구축 과정에서 발생한 알고리즘적 편향, 레이블의 오류 및 모호성, 이미지 속 인물의 프라이버시 침해 가능성, 특정 카테고리의 부적절한 표현 등이 주요 문제점으로 지적된다.[42][43][44][45][46][47][93][94][95][96][99][100][101] 또한 WordNet을 기반으로 구성된 클래스 계층 구조가 실제 활용 목적과 항상 부합하지 않거나[73], 하나의 이미지에 여러 객체가 포함되어 모델 성능 평가에 영향을 미치는 경우도 있다.[88]

이러한 문제들은 이미지 인식 모델의 성능 평가 결과의 신뢰성에 의문을 제기하고, 때로는 사회적 논란으로 이어지기도 했다. 이에 ImageNet 측은 데이터셋의 문제점을 인지하고 이를 개선하기 위해 지속적으로 데이터셋을 검토하고 업데이트하는 노력을 기울이고 있다.[48][98] 예를 들어, 문제가 된 카테고리를 삭제하거나[100][101] 프라이버시 보호를 위해 이미지 속 얼굴을 식별하고 처리하는 방안을 모색하는[31] 등의 조치가 이루어졌다. 또한, 기존 데이터셋의 한계를 보완하기 위해 ImageNetV2나 ImageNet-21K-P와 같이 새롭게 구성되거나 정제된 버전의 데이터셋을 공개하기도 했다.[32][29]

5. 1. 편향 문제

2019년 ImageNet과 WordNet의 여러 계층(분류, 객체 클래스 및 레이블)의 역사를 연구한 결과, 알고리즘적 편향이 다양한 이미지 분류 접근 방식에 깊이 내재되어 있다는 점이 지적되었다.[44][45][46][47]

WordNet을 사용하는 것의 한계점 중 하나는 ImageNet에 최적화된 것보다 범주가 더 상위 수준일 수 있다는 점이다. 예를 들어, ImageNet은 에 대해 120개의 개 품종 카테고리로 세분화하여 분류하지만,[73] ImageNet에 최적화된 카테고리 분류, 세분성 및 계층 구조가 실제 활용 목적과 항상 일치하지 않을 수 있다는 비판이 있다.[73] 예를 들어, ImageNet에는 "의자"와 "가구" 라벨이 모두 존재하는데, 의자가 찍힌 이미지에 "의자" 라벨 대신 더 상위 개념인 "가구" 라벨이 부여될 수도 있다.[73]

또한 ImageNet 데이터셋 자체의 레이블 오류 및 모호성 문제도 제기되었다. ImageNet-1k 검증 세트 레이블 중 6% 이상이 잘못된 것으로 추정되며,[42] 약 10%는 모호하거나 오류가 있는 레이블을 포함하고 있다. 2020년 연구에서는 인간 주석자에게 모델의 예측과 원래 ImageNet 레이블을 제시했을 때, 최신 모델의 예측을 더 선호하는 경향을 보여 ImageNet-1k 데이터셋의 품질 포화 가능성을 시사했다.[43] 구글 연구자들은 2020년에 ImageNet의 레이블을 새로 부여하고 여러 이미지 인식 알고리즘의 성능을 평가한 결과, 알고리즘 제작자들이 주장하는 것보다 성능 개선 효과가 작았다고 지적했다.[97] 동시에 알고리즘 성능 향상이 이러한 ImageNet 레이블의 오류에 과적합(overfitting)되었을 가능성도 제기했다.[97] 하나의 이미지에 여러 객체가 찍혀 있는 경우도 많아 모델 성능에 영향을 미친다는 지적도 있다.[88]

데이터 수집 과정에서 이미지 속 얼굴을 흐리게 처리하지 않아 프라이버시 문제가 발생할 수 있다는 점도 비판받았다.[99] 또한 2019년에는 인물 이미지 카테고리에 모욕적인 표현이 포함되어 있었다는 사실이 밝혀져 해당 카테고리를 제거한 데이터셋을 새로 공개하는 등 데이터 구축 과정에서의 문제점도 드러났다.[100][101]

ImageNet은 이러한 다양한 편향의 원인을 해결하기 위해 노력하고 있다.[48][98] 예를 들어, 2021년 겨울 ImageNet-21k 업데이트 시 "사람" 하위 트리에서 2,702개의 범주를 필터링했으며,[31] 2021년 ImageNet-1k 업데이트에서는 997개의 비(非) 사람 범주에 나타나는 얼굴에 주석을 달고, 이 얼굴들을 흐리게 처리한 데이터셋으로 모델을 훈련해도 성능 저하가 최소화된다는 점을 확인했다.[31] 또한 ImageNet-21K-P와 같이 필터링되고 정리된 하위 데이터셋을 공개하기도 했다.[29]

5. 2. 기타 문제

ImageNet의 주요 과제 중 하나는 WordNet에서 파생된 클래스 계층 구조의 타당성 문제이다. 예를 들어, 개에 대해 120개의 개 품종 카테고리로 세분화하는 등[73] 매우 상세한 분류 체계를 가지고 있지만, 이것이 실제 이미지 분류 작업에 최적화된 분류, 세분성, 계층 구조와 항상 일치하지는 않을 수 있다는 단점이 지적된다.[73] 가령, ImageNet에는 "의자"와 "가구" 라벨이 모두 존재하는데, 의자가 찍힌 이미지에 "의자" 라벨이 부여될 수도 있고, 의미상 상위 계층인 "가구" 라벨이 부여될 수도 있어 혼란을 야기할 수 있다.[73]

또한, 2019년에 수행된 연구에서는 분류 체계, 객체 클래스, 라벨링 등 다양한 관점에서 ImageNet과 WordNet 데이터셋 자체에 편향이 깊이 내재되어 있다는 점이 밝혀졌다.[93][94][95][96] 예를 들어, 구글의 연구자들은 2020년에 ImageNet의 라벨을 새롭게 검토하고 이를 기반으로 여러 이미지 인식 알고리즘의 성능을 평가했는데, 그 결과 알고리즘의 성능 개선 효과가 기존에 알려진 것보다 작았다고 지적했다.[97] 이는 알고리즘의 성능 향상이 ImageNet 라벨 자체의 오류에 과도하게 학습된 결과일 수 있음을 시사한다.[97] 더불어, 하나의 이미지에 여러 객체가 포함된 경우가 많아 모델의 성능 평가에 영향을 미친다는 지적도 제기되었다.[88]

데이터 수집 과정에서의 프라이버시 문제도 지적된다. ImageNet 이미지에 포함된 인물들의 얼굴이 블러 처리되지 않은 상태로 포함되어 있다는 점이다.[99] 이 외에도 데이터셋 구축 과정 자체의 문제가 드러나기도 했다. 2019년에는 인물 이미지에 대한 카테고리 중 일부에 모욕적인 표현이 포함되어 있었다는 사실이 밝혀졌고, 이에 따라 해당 카테고리를 제거한 데이터셋을 새롭게 공개하는 조치가 이루어졌다.[100][101]

ImageNet은 이러한 편향 및 문제점들을 해결하기 위한 노력을 지속하고 있다.[98] 2021년 겨울 업데이트된 ImageNet-21k에서는 훈련된 모델에서 나타날 수 있는 "문제적 행동"을 방지하기 위해 "사람" 관련 하위 트리에서 2,702개의 범주를 필터링했다. 또한, 2021년 ImageNet-1k 업데이트에서는 997개의 비(非) 사람 범주 이미지에 나타나는 얼굴에 주석을 달고, 이 얼굴들을 흐리게 처리한 데이터셋으로 모델을 훈련했을 때 성능 저하가 최소화된다는 사실을 확인하며 프라이버시 문제 해결 가능성을 모색했다.[31]

참조

[1] 뉴스 New computer vision challenge wants to teach robots to see in 3D https://www.newscien[...] 2017-04-07
[2] 뉴스 For Web Images, Creating New Technology to Seek and Find https://www.nytimes.[...] 2012-11-19
[3] 웹사이트 ImageNet http://image-net.org[...] 2020-09-07
[4] 뉴스 From not working to neural networking https://www.economis[...] 2016-06-25
[5] 웹사이트 ImageNet Overview https://image-net.or[...] ImageNet 2022-10-15
[6] 간행물 Fei-Fei Li's Quest to Make AI Better for Humanity https://www.wired.co[...] 2019-05-05
[7] 논문 Recognition-by-components: A theory of human image understanding. http://dx.doi.org/10[...] 1987
[8] 웹사이트 How a stubborn computer scientist accidentally launched the deep learning boom https://arstechnica.[...] 2024-11-12
[9] 문서 ImageNet CMU VASC Semin 2010
[10] 웹사이트 CVPR 2009: IEEE Computer Society Conference on Computer Vision and Pattern Recognition http://tab.computer.[...] 2024-11-13
[11] 웹사이트 The data that transformed AI research—and possibly the world https://qz.com/10349[...] Atlantic Media Co. 2017-07-26
[12] 간행물 2009 conference on Computer Vision and Pattern Recognition 2017-07-26
[13] 문서 How we're teaching computers to understand pictures https://www.ted.com/[...] 2018-12-16
[14] 문서 Construction and analysis of a large scale image ontology Vision Sciences Society 2009
[15] 논문 ImageNet classification with deep convolutional neural networks https://papers.nips.[...] 2017-05-24
[16] 뉴스 Machines 'beat humans' for a growing number of tasks https://www.ft.com/c[...] 2018-02-03
[17] 웹사이트 The inside story of how AI got good enough to dominate Silicon Valley https://qz.com/13070[...] 2018-12-10
[18] 서적 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)
[19] 문서 ImageNet Large Scale Visual Recognition Challenge IJCV 2015
[20] 웹사이트 ImageNet Summary and Statistics (updated on April 30, 2010) http://www.image-net[...] 2024-11-13
[21] 웹사이트 ImageNet API documentation http://www.image-net[...] 2024-11-13
[22] 문서 Large scale visual recognition challenge 2010 2010-11
[23] 웹사이트 std and mean for image normalization different from ImageNet · Issue #20 · openai/CLIP https://github.com/o[...] 2024-09-19
[24] 웹사이트 ImageNet http://www.image-net[...] 2024-11-13
[25] 문서 https://web.archive.[...]
[26] 웹사이트 ImageNet http://www.image-net[...]
[27] 웹사이트 ImageNet http://www.image-net[...]
[28] 서적 Trends and Topics in Computer Vision Springer 2012
[29] 간행물 ImageNet-21K Pretraining for the Masses 2021-08-05
[30] 웹사이트 ImageNet https://www.image-ne[...] 2022-10-19
[31] 웹사이트 An Update to the ImageNet Website and Dataset https://www.image-ne[...] 2024-11-13
[32] 논문 Do ImageNet Classifiers Generalize to ImageNet? https://proceedings.[...] PMLR 2019-05-24
[33] 문서 ImageNet classification: fast descriptor coding and large-scale SVM training https://www.image-ne[...]
[34] 서적 CVPR 2011 IEEE 2011-06
[35] 서적 CVPR 2011 IEEE 2011-06
[36] 서적 Computer Vision – ECCV 2010 Springer 2010
[37] 간행물 "XRCE@ILSVRC2011: Compressed Fisher vectors for LSVR" https://web.archive.[...]
[38] 웹사이트 https://www.image-ne[...]
[39] 뉴스 The Quartz guide to artificial intelligence: What is it, why is it important, and should we be afraid? https://qz.com/10463[...] 2018-02-03
[40] 뉴스 A Learning Advance in Artificial Intelligence Rivals Human Abilities https://www.nytimes.[...] 2016-06-22
[41] 뉴스 Forget the Turing test – there are better ways of judging AI https://www.newscien[...] 2016-06-22
[42] 간행물 Pervasive Label Errors in Test Sets Destabilize Machine Learning Benchmarks 2021-11-07
[43] 간행물 Are we done with ImageNet? 2020-06-12
[44] 잡지 The Viral App That Labels You Isn't Quite What You Think https://www.wired.co[...] 2019-09-22
[45] 뉴스 The viral selfie app ImageNet Roulette seemed fun – until it called me a racist slur https://www.theguard[...] 2019-09-22
[46] 웹사이트 Excavating AI: The Politics of Training Sets for Machine Learning https://www.excavati[...] 2019-09-22
[47] 학술지 Excavating "Excavating AI": The Elephant in the Gallery 2020-12-24
[48] 웹사이트 Towards Fairer Datasets: Filtering and Balancing the Distribution of the People Subtree in the ImageNet Hierarchy http://image-net.org[...] 2019-09-22
[49] 웹사이트 ImageNet https://www.image-ne[...] 2024-10-26
[50] 뉴스 New computer vision challenge wants to teach robots to see in 3D https://www.newscien[...] 2017-04-07
[51] 뉴스 For Web Images, Creating New Technology to Seek and Find https://www.nytimes.[...] 2012-11-19
[52] 뉴스 From not working to neural networking https://www.economis[...] 2016-06-25
[53] 학술지 Deep Learning for Generic Object Detection: A Survey 2020-11-20
[54] 학술지 Fei-Fei Li's Quest to Make AI Better for Humanity https://www.wired.co[...] 2019-05-05
[55] 웹사이트 The data that transformed AI research—and possibly the world https://qz.com/10349[...] Atlantic Media Co. 2017-07-26
[56] 웹사이트 The data that transformed AI research—and possibly the world https://qz.com/10349[...] Atlantic Media Co. 2017-07-26
[57] 간행물 2009 conference on Computer Vision and Pattern Recognition
[58] 간행물 How we're teaching computers to understand pictures https://www.ted.com/[...] 2018-12-16
[59] 웹사이트 《日経Robo》ImageNet後継コンテスト、中国ベンチャーMalong社が世界トップに https://xtech.nikkei[...] 2022-01-28
[60] 웹사이트 The data that transformed AI research—and possibly the world https://qz.com/10349[...] Atlantic Media Co. 2017-07-26
[61] 뉴스 Does an AI need to make love to Rembrandt's girlfriend to make art? https://www.theguard[...] 2016-05-06
[62] 뉴스 From not working to neural networking https://www.economis[...] 2016-06-25
[63] 학술지 Deep Residual Learning for Image Recognition.
[64] 뉴스 A Learning Advance in Artificial Intelligence Rivals Human Abilities https://www.nytimes.[...] 2015-12-10
[65] 뉴스 Forget the Turing test – there are better ways of judging AI https://www.newscien[...] 2015-09-21
[66] 뉴스 Computer Scientists Are Astir After Baidu Team Is Barred From A.I. Competition https://www.nytimes.[...] 2015-06-03
[67] 뉴스 Chinese search giant Baidu disqualified from AI test https://www.bbc.com/[...] 2015-06-14
[68] 뉴스 Baidu fires researcher involved in AI contest flap http://www.pcworld.c[...] 2015-06-11
[69] 뉴스 The Quartz guide to artificial intelligence: What is it, why is it important, and should we be afraid? https://qz.com/10463[...] 2017-09-10
[70] 학술지 画像解析関連コンペティションの潮流 https://www.journal.[...] 電子情報通信学会 2017-05
[71] 논문 安全安心な社会を支える画像認識技術(<特集>企業におけるAI研究の最前線) 人工知能学会
[72] 뉴스 From not working to neural networking https://www.economis[...] 2018-02-03
[73] arXiv ImageNet-21K Pretraining for the Masses 2021-08-05
[74] 웹사이트 ImageNet https://www.image-ne[...] 2022-10-19
[75] 논문 Do ImageNet Classifiers Generalize to ImageNet? https://proceedings.[...] PMLR 2019-05-24
[76] 웹사이트 About ImageNet https://image-net.or[...] ImageNet 2024-10-31
[77] 웹사이트 ImageNet Large Scale Visual Recognition Challenge 2014 (ILSVRC2014) https://www.image-ne[...] 2024-11-02
[78] 웹사이트 Download ImageNet Data image-net.org/downlo[...] ImageNet 2024-11-02
[79] 웹사이트 ImageNet Large Scale Visual Recognition Challenge (ILSVRC) https://www.image-ne[...] 2024-11-02
[80] 웹사이트 The data that transformed AI research—and possibly the world https://qz.com/10349[...] Atlantic Media Co. 2017-07-26
[81] 뉴스 For Web Images, Creating New Technology to Seek and Find https://www.nytimes.[...] 2012-11-19
[82] 논문 ImageNet classification with deep convolutional neural networks https://papers.nips.[...] 2017-05-24
[83] 논문 コンピュータビジョンによる動画認識 https://doi.org/10.2[...] 2019
[84] 뉴스 From not working to neural networking https://www.economis[...] 2016-06-25
[85] 뉴스 Machines 'beat humans' for a growing number of tasks https://www.ft.com/c[...] 2017-11-30
[86] 웹사이트 The inside story of how AI got good enough to dominate Silicon Valley https://qz.com/13070[...] 2018-12-10
[87] 논문 Deep Residual Learning for Image Recognition.
[88] 논문 From ImageNet to Image Classification: Contextualizing Progress on Benchmarks https://www.semantic[...] 2020
[89] 논문 Re-labeling ImageNet: from Single to Multi-Labels, from Global to Localized Labels https://ieeexplore.i[...] IEEE 2021-06
[90] 간행물 The Unreasonable Effectiveness of Noisy Data for Fine-Grained Recognition http://link.springer[...] Springer International Publishing 2024-10-23
[91] 논문 Revisiting Unreasonable Effectiveness of Data in Deep Learning Era http://ieeexplore.ie[...] IEEE 2017-10
[92] 웹사이트 NLP's ImageNet moment has arrived https://thegradient.[...] 2024-10-23
[93] 뉴스 The Viral App That Labels You Isn't Quite What You Think https://www.wired.co[...] 2019-09-22
[94] 뉴스 The viral selfie app ImageNet Roulette seemed fun – until it called me a racist slur https://www.theguard[...] 2019-09-22
[95] 웹사이트 Excavating AI: The Politics of Training Sets for Machine Learning https://www.excavati[...] 2019-09-22
[96] arXiv Excavating "Excavating AI": The Elephant in the Gallery 2020-09-04
[97] 논문 Are we done with ImageNet? https://arxiv.org/ab[...] 2020-06-12
[98] 웹사이트 Towards Fairer Datasets: Filtering and Balancing the Distribution of the People Subtree in the ImageNet Hierarchy http://image-net.org[...] 2019-09-22
[99] 논문 A Study of Face Obfuscation in ImageNet https://arxiv.org/ab[...] 2021-03-14
[100] 웹사이트 Towards Fairer Datasets: Filtering and Balancing the Distribution of the People Subtree in the ImageNet Hierarchy https://image-net.or[...] 2022-01-28
[101] 웹사이트 巨大写真データセット「ImageNet」で攻撃的・差別的なカテゴリー分類タグ付けが判明し人物写真の半数以上を削除 https://gigazine.net[...] 2022-01-29
[102] 뉴스 New computer vision challenge wants to teach robots to see in 3D https://www.newscien[...] 2017-04-07
[103] 뉴스 For Web Images, Creating New Technology to Seek and Find https://www.nytimes.[...] 2012-11-19
[104] 웹인용 ImageNet http://image-net.org[...] 2022-10-11
[105] 뉴스 From not working to neural networking https://www.economis[...] 2016-06-25
[106] 웹인용 ImageNet Overview https://image-net.or[...] ImageNet 2022-10-15
[107] 논문 ImageNet Large Scale Visual Recognition Challenge
[108] 저널 ImageNet classification with deep convolutional neural networks https://papers.nips.[...] 2017-05-24
[109] 뉴스 Machines 'beat humans' for a growing number of tasks https://www.ft.com/c[...] 2018-02-03
[110] 웹인용 The inside story of how AI got good enough to dominate Silicon Valley https://qz.com/13070[...] 2018-12-10
[111] 서적 2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)
[112] 잡지 Fei-Fei Li's Quest to Make AI Better for Humanity https://www.wired.co[...] 2019-05-05
[113] 웹인용 The data that transformed AI research—and possibly the world https://qz.com/10349[...] Atlantic Media Co. 2017-07-26
[114] 인용 2009 conference on Computer Vision and Pattern Recognition 2017-07-26
[115] 인용 How we're teaching computers to understand pictures https://www.ted.com/[...] 2018-12-16



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com