맨위로가기

오픈AI 파이브

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

오픈AI 파이브는 2016년 11월부터 개발된 인공지능(AI) 시스템으로, 5대 5 대전 비디오 게임인 도타 2에서 인간을 상대로 경쟁하도록 설계되었다. 강화 학습 방식을 사용하여 개발되었으며, 2017년 1대 1 대결에서 프로 선수에게 패배한 후, 2018년에는 5명의 팀으로 구성되어 아마추어 및 세미 프로 선수 팀을 이겼다. 2019년에는 The International 2018 챔피언인 OG를 상대로 승리하며 기술력을 입증했다. 오픈AI 파이브는 20,000개의 숫자로 게임 상태를 관찰하고, 17만 개의 가능한 행동 공간을 가지며, 딥마인드의 알파스타와 유사한 기술적 특징을 보인다. AI, 기술, 비디오 게임 커뮤니티로부터 긍정적인 평가를 받았으며, 루빅스 큐브를 푸는 데에도 활용되었다.

더 읽어볼만한 페이지

  • 디펜스 오브 디 에인션츠 - 도타 2
    도타 2는 밸브 코퍼레이션에서 개발 및 배급한 MOBA 비디오 게임으로, 10명의 플레이어가 두 팀으로 나뉘어 상대 진영의 고대 요새를 파괴하는 것을 목표로 하며, e스포츠로서도 큰 인기를 끌고 있다.
  • 디펜스 오브 디 에인션츠 - 도타 언더로드
    도타 언더로드는 밸브 코퍼레이션에서 개발 및 배급한 오토 배틀러 장르의 전략 게임으로, 도타 2의 인기 커뮤니티 모드인 도타 오토체스를 기반으로 제작되었으며 다양한 플랫폼을 지원하고, 플레이어는 영웅들을 전략적으로 배치하여 자동으로 전투를 진행하며 온라인 매치메이킹, 싱글 플레이어 모드, 듀오 모드 등을 통해 다른 플레이어들과 경쟁하거나 협력할 수 있고, 얼리 액세스를 거쳐 2020년 2월 정식 출시되었으며 PC와 모바일 간 크로스 플랫폼 플레이를 지원한다.
  • 응용 기계 학습 - 알파고
    알파고는 구글 딥마인드가 개발한 인공지능 바둑 프로그램으로, 심층 신경망과 몬테카를로 트리 탐색 알고리즘을 결합하여 자가 학습을 통해 인간을 뛰어넘는 바둑 실력을 달성하며 인공지능 기술 발전과 사회적 영향에 대한 논의를 촉발했다.
  • 응용 기계 학습 - 알파폴드
    알파폴드는 딥마인드에서 개발한 단백질 구조 예측 인공지능 시스템으로, 아미노산 서열로부터 3차원 구조를 예측하며 높은 정확도로 신약 개발과 질병 연구에 기여할 가능성이 있지만, 단백질 복합체 및 무질서 단백질 영역 예측에는 한계가 있다.
  • 오픈AI - 챗GPT
    챗GPT는 오픈AI가 개발한 GPT-3.5 기반의 대화형 인공지능 서비스로, 인간과 유사한 텍스트 생성, 코드 생성, 보고서 작성, 번역 등의 다양한 기능을 제공하지만, 편향된 정보 생성, 데이터 유출, 윤리 및 저작권 문제 등의 논란도 있으며, 유료 서비스를 포함한 다양한 형태로 제공되고, 지속적인 모델 개발을 통해 성능을 향상시키고 있다.
  • 오픈AI - GPT-3
    GPT-3는 OpenAI가 개발한 1,750억 개의 매개변수를 가진 대규모 언어 모델로, 텍스트 생성, 코드 작성, 질문 응답 등 다양한 작업을 수행할 수 있지만, 윤리적 문제점과 사회적 비판도 존재한다.
오픈AI 파이브
기본 정보
Dota 2에서 플레이하는 OpenAI Five
Dota 2에서 플레이하는 OpenAI Five
개발사OpenAI
출시일2018년
게임도타 2
플랫폼인공지능
유형신경망
라이선스MIT 라이선스
기술 정보
교육 방법강화 학습
사용된 프레임워크TensorFlow
Python
모델 아키텍처장단기 기억 (LSTM) 신경망
훈련 시간약 180년
훈련 환경자체 시뮬레이션 환경
성능 및 평가
인간 프로 선수아마추어 및 준프로 레벨의 인간 플레이어 상대로 승리
주요 성과도타 2 프로 선수와의 공개 경기에서 승리 (2018년)
The International 2018 시범 경기에서 패배
The International 2019 풀 5:5 경기에서 승리
제한 사항특정 영웅 및 전략에 제한
복잡한 게임 상황에 대한 적응력 부족
기타
관련 프로젝트OpenAI

2. 역사

오픈AI의 봇 개발은 2016년 11월에 시작되었으며, 복잡성과 API 접근성을 고려하여 경쟁적인 5 대 5 비디오 게임인 '''도타 2'''를 기반으로 선택했다.[1] 초기에는 1대 1 대결 능력을 개발하여 2017년 8월 The International 2017에서 프로 선수 Dendi를 상대로 승리하는 성과를 보였다.[2][3] 이는 강화 학습을 통해 봇이 단기간에 복잡한 작업을 학습할 수 있음을 보여주는 사례였다.[4][5][6][7][24]

2018년 6월에는 5명으로 구성된 완전한 팀으로 플레이할 수 있는 능력을 갖추고 아마추어 및 세미 프로 팀을 이겼다.[8][6][9][10] 같은 해 The International 2018에서는 두 프로 팀(paiN Gaming, 중국 올스타 팀)과 대결했으나 패배했다. 오픈AI는 이 경험을 통해 알고리즘을 분석하고 개선하는 기회로 삼았다고 밝혔다.[11][12][13]

오픈AI 파이브의 마지막 공개 시연은 2019년 4월 샌프란시스코에서 열렸으며, 당시 The International 2018 챔피언이었던 OG를 상대로 승리했다.[14] 이후 같은 달 진행된 온라인 공개 행사에서는 일반 플레이어들을 상대로 42,729개의 공개 게임을 진행하여 99.4%의 높은 승률을 기록했다.[15][16]

2. 1. 초기 개발 (2016-2017)

봇에 사용될 알고리즘 개발은 2016년 11월에 시작되었다. 오픈AI는 경쟁적인 5 대 5 비디오 게임인 '''도타 2'''를 개발 기반으로 선택했는데, 이는 생방송 플랫폼 트위치에서의 인기, 리눅스 기본 지원, 그리고 응용 프로그래밍 인터페이스(API) 사용 가능성 때문이었다.[1]

초기 개발은 5명 팀 구성 이전에 1대 1 대결에 초점을 맞추었다. 첫 공개 시연은 2017년 8월, 도타 2의 연례 프리미어 챔피언십 토너먼트인 The International 2017에서 이루어졌다. 이 행사에서 우크라이나의 프로 선수 Dendi는 오픈AI 봇과의 1대 1 라이브 매치업에서 패배했다.[2][3] 경기 후, CTO Greg Brockman은 이 봇이 실시간으로 2주 동안 서로 대결하며 학습했으며, 이 학습 소프트웨어는 "외과 의사가 되는 것"과 같은 복잡한 작업을 처리할 수 있는 소프트웨어를 만드는 방향으로 나아가는 단계라고 설명했다.[4][5]

오픈AI강화 학습이라는 방법론을 사용했는데, 봇은 적을 죽이거나 타워를 파괴하는 것과 같은 행동에 대한 보상을 받으며, 수개월 동안 하루에도 수백 번씩 서로 대결하며 시간이 지남에 따라 학습한다.[6][7][24]

2. 2. 팀 플레이 및 발전 (2018-2019)

2018년 6월까지 봇은 5명의 완전한 팀으로 함께 플레이할 수 있는 능력을 갖추게 되었으며, 아마추어 및 세미 프로 선수들로 구성된 팀을 상대로 승리할 수 있었다.[8][6][9][10] The International 2018에서는 두 차례 프로 팀과 경기를 가졌다. 상대는 브라질 기반의 paiN Gaming과 전직 중국 선수들로 구성된 올스타 팀이었다.[11][12] 비록 오픈AI 파이브는 두 경기 모두 패배했지만, 오픈AI는 이를 성공적인 경험으로 평가했다. 최고의 도타 2 선수들과의 대결을 통해 얻은 데이터로 향후 경기를 위한 알고리즘을 분석하고 조정할 수 있었기 때문이다.[13]

봇의 마지막 공개 시연은 2019년 4월 샌프란시스코에서 열린 라이브 이벤트였다. 이 행사에서 오픈AI 파이브는 The International 2018 챔피언인 OG를 상대로 3전 2선승제 경기에서 승리했다.[14] 같은 달, 일반 플레이어들이 봇과 대결할 수 있는 4일간의 온라인 이벤트가 열렸다.[15] 이 기간 동안 봇은 총 42,729번의 공개 게임을 플레이했으며, 99.4%라는 높은 승률을 기록했다.[16]

3. 아키텍처

오픈AI 파이브는 각 봇이 단일 계층의 LSTM 신경망을 사용하여 도타 2 게임 상태를 관찰하고 행동을 결정하는 아키텍처를 기반으로 한다.[17][23] 시스템 학습은 "Rapid"라는 자체 개발 인프라 위에서 강화 학습 방식으로 진행되었으며, 근접 정책 최적화(PPO) 알고리즘이 사용되었다.[18][23][19] 학습에는 대규모 컴퓨팅 자원이 투입되었다.

3. 1. 기술적 특징

왓슨의 ''Jeopardy!'', 딥 블루의 체스, 알파고의 바둑과 같이 이전에도 AI가 인간과 대결하여 성공한 사례들이 있었다.[20][21][22] 하지만 오픈AI 파이브가 플레이하는 도타 2는 이러한 게임들과 비교하여 다음과 같은 기술적 특징과 어려움을 가진다.[23]

  • '''장기적 관점''': 도타 2 경기는 평균 45분 동안 진행되며, 이는 게임 내 시간 단위인 틱(tick)으로 환산하면 약 80,000틱에 해당한다. 봇은 초당 30 프레임으로 실행되며, 매 4번째 프레임마다 게임 상태를 관찰하여 약 20,000번의 행동을 수행한다. 이는 보통 40수 미만으로 끝나는 체스나 150수 미만으로 끝나는 바둑에 비해 훨씬 긴 시간 동안의 전략적 판단이 필요함을 의미한다.
  • '''부분 관찰된 게임 상태''': 플레이어는 자신과 아군 주변의 제한된 시야만 확보할 수 있으며, 나머지 영역은 전장 안개에 가려져 적의 위치나 움직임을 직접 볼 수 없다. 따라서 도타 2는 불완전한 정보를 바탕으로 상대의 행동을 추론하고 예측해야 하는 게임이다. 반면, 체스나 바둑은 모든 정보가 양측 플레이어에게 공개되는 "완전 정보 게임"이다.[27]
  • '''연속적인 행동 공간''': 도타 2의 각 영웅은 수십 가지의 행동을 할 수 있으며, 특정 대상이나 위치를 지정하는 방식까지 고려하면 가능한 행동의 수는 매우 많다. 오픈AI는 영웅당 약 17만 개의 가능한 행동 공간을 고려하도록 설계했다. 매 순간(틱)마다 평균적으로 약 1,000개의 유효한 행동 선택지가 존재한다. 이는 평균 35개의 행동 수를 가지는 체스나 250개의 행동 수를 가지는 바둑과 비교했을 때 훨씬 복잡한 의사 결정 과정이 요구된다.
  • '''연속적인 관찰 공간''': 도타 2는 넓은 맵에서 10명의 영웅, 수십 개의 건물, 그리고 다수의 비 플레이어 캐릭터(NPC) 유닛들이 상호작용하는 복잡한 환경을 가진다. 오픈AI 시스템은 개발자가 제공하는 API를 통해 게임 상태를 관찰하며, 이는 약 20,000개의 숫자로 구성된 방대한 데이터로 표현된다. 이는 약 70개의 목록으로 표현되는 체스판이나 약 400개의 열거형으로 표현되는 바둑판에 비해 훨씬 많은 정보를 처리해야 함을 의미한다.


각 오픈AI 파이브 봇은 게임 상태를 관찰하기 위해 4096개 유닛[17]의 LSTM을 포함하는 단일 계층 신경망으로 구성된다. 이 신경망은 도타 2 개발자 API로부터 현재 게임 상태 정보를 입력받아, 다양한 행동(액션 헤드)을 출력한다. 예를 들어, 행동을 지연시킬 시간(틱), 선택할 행동의 종류, 해당 행동을 수행할 좌표(X, Y) 등을 결정한다.[23] 이 과정에서 인간 플레이어의 데이터는 사용되지 않는다. AI는 20,000개의 숫자로 표현되는 게임 세상을 관찰하고, 8가지 종류의 행동 값을 결정하여 게임을 플레이한다.[23]

오픈AI 파이브는 "Rapid"라고 불리는 자체 개발 인프라 위에서 강화 학습 방식으로 훈련되었다. Rapid 인프라는 수천 대의 컴퓨터가 서로 통신하며 학습을 진행하는 계층과, 실제 소프트웨어를 실행하는 계층으로 구성된다.[18] 2018년 기준으로, 오픈AI 파이브는 근접 정책 최적화(PPO)라는 정책 경사 방법을 사용하여 256개의 GPU와 128,000개의 CPU 코어를 활용해 하루에 약 180년 분량의 게임 플레이 경험을 쌓으며 학습했다.[18][23][19]

2017년 1v1 봇과 2018년 OpenAI Five 비교
OpenAI 1v1 봇 (2017)OpenAI Five (2018)
CPU마이크로소프트 애저 60,000 코어구글 클라우드 플랫폼 128,000 선점형 코어
GPU마이크로소프트 애저 256개 K80 GPU구글 클라우드 플랫폼 256개 P100 GPU
수집된 경험 (하루)약 300년 분량약 180년 분량
관측 크기약 3.3kB약 36.8kB
초당 관측 수10회7.5회
배치 크기8,388,608 관측1,048,576 관측
분당 배치 수약 20회약 60회


4. 다른 게임 AI 시스템과의 비교

오픈AI 파이브 이전에도 인공지능이 인간과 대결하여 성공을 거둔 사례는 여럿 있었다. 예를 들어 IBM의 왓슨은 미국의 유명 퀴즈 쇼 ''Jeopardy!''에서 우승했고, 딥 블루는 세계 체스 챔피언을 이겼으며, 구글 딥마인드알파고는 세계 최고 수준의 바둑 기사를 상대로 승리했다.[20][21][22]

하지만 오픈AI 파이브가 도전한 도타 2는 이들 게임과는 다른 차원의 복잡성을 지닌다.[23]


  • '''장기적인 계획 필요''': 도타 2 한 경기는 평균 45분 동안 진행되며, 초당 30프레임으로 계산하면 게임당 약 8만 번의 상태 변화(틱)가 발생한다. 오픈AI 파이브는 4프레임마다 한 번씩 상황을 판단하여 총 2만 번의 행동을 결정해야 한다. 이는 보통 40수 이내에 끝나는 체스나 150수 이내에 끝나는 바둑과 비교했을 때 훨씬 긴 시간 동안의 전략적 판단이 요구됨을 의미한다.

  • '''불완전한 정보''': 도타 2에서는 플레이어가 자신과 아군 주변의 제한된 시야만 확보할 수 있다. 나머지 지역은 전장 안개(Fog of Wareng)에 가려져 상대방의 위치나 움직임을 직접 볼 수 없다. 따라서 플레이어는 제한된 정보를 바탕으로 상황을 추론하고 상대방의 행동을 예측해야 한다. 반면 체스나 바둑은 모든 정보가 양측 플레이어에게 공개되어 있는 '완전 정보 게임'이라는 점에서 근본적인 차이가 있다.[27]

  • '''방대한 행동 가짓수''': 도타 2에서 플레이어가 조종하는 영웅은 수십 가지의 행동을 할 수 있으며, 각 행동은 다양한 대상(다른 유닛, 특정 위치 등)을 목표로 할 수 있다. 오픈AI는 영웅 한 명당 가능한 행동의 가짓수를 약 17만 개로 설정했다. 게임의 매 순간마다 평균적으로 약 1,000개의 유효한 행동 중 하나를 선택해야 한다. 이는 평균 행동 수가 35개인 체스나 250개인 바둑과 비교할 수 없을 정도로 많은 경우의 수이다.

  • '''복잡한 게임 상태''': 도타 2는 넓은 맵에서 각 팀 5명씩 총 10명의 영웅, 수십 개의 건물, 그리고 다수의 비 플레이어 캐릭터(NPC) 유닛들이 동시에 움직이며 상호작용한다. 오픈AI 시스템은 게임 API를 통해 게임 상태 정보를 받아들이는데, 이 정보는 약 2만 개의 숫자로 구성된다. 이는 약 70개의 정보로 표현되는 체스판이나 약 400개의 정보로 표현되는 바둑판 상태와 비교했을 때 훨씬 복잡하고 방대한 양의 정보를 처리해야 함을 보여준다.

4. 1. 비교표

비교 차트
OpenAI 1v1 봇 (2017)OpenAI Five (2018)
CPU마이크로소프트 애저의 60,000 CPU 코어구글 클라우드 플랫폼의 128,000개의 선점형 CPU 코어
GPU애저의 256개 K80 GPUGCP의 256개 P100 GPU
수집된 경험하루 약 300년하루 약 180년
관측 크기약 3.3kB약 36.8kB
게임 플레이 초당 관측 수107.5
배치 크기8,388,608 관측1,048,576 관측
분당 배치 수약 20약 60


5. 반응 및 평가

오픈AI 파이브는 인공지능(AI), 기술, 비디오 게임 커뮤니티로부터 광범위한 주목을 받았다. 마이크로소프트 창업자 빌 게이츠는 오픈AI 파이브의 승리가 "팀워크와 협업을 필요로 했다"는 점을 강조하며 이를 "중요한 일"이라고 평가했다.[24][25] 1997년 딥 블루 AI에게 패배했던 체스 선수 가리 카스파로프는 2018년 더 인터내셔널 2018에서 봇들이 패배했음에도 불구하고, 결국 목표를 "예상보다 더 빨리" 달성할 것이라고 전망했다.[26]

AI 전문가들은 ''MIT 테크놀로지 리뷰''와의 인터뷰에서 오픈AI 파이브 시스템을 주목할 만한 성과로 평가했다. 이는 ''도타 2''가 "극도로 복잡한 게임"이기 때문에, 비전문가 수준의 선수들을 이긴 것만으로도 인상적인 성과라는 이유에서였다.[27] ''PC 게이머''는 프로 선수들을 상대로 거둔 승리가 머신러닝 분야에서 중요한 사건이라고 평가했다.[28] ''The Verge''는 봇들의 성공이 오픈AI의 강화 학습 접근 방식과 AI에 대한 일반적인 철학이 "획기적인 성과를 내고 있다"는 증거라고 보도했다.[15]

반면, ''마더보드''는 오픈AI 파이브의 승리에 대해 비판적인 시각을 제시했다. 양측이 선택할 수 있는 영웅의 폭이 제한되었고, 봇들이 인간처럼 화면의 픽셀을 해석하는 대신 게임의 API에 직접 접근했다는 점을 들어, 이러한 조건에서의 승리는 "기본적으로 부정행위"에 가깝다고 지적했다.[29]

2019년, 딥마인드는 ''스타크래프트 II''를 위한 유사한 AI 봇인 알파스타를 공개했다. 오픈AI 파이브와 마찬가지로 알파스타 역시 강화 학습과 자기 대전(self-play) 방식을 사용했다. ''The Verge''는 이러한 AI 연구의 목표가 단순히 게임에서 인간을 이기는 것을 넘어, 충분한 시간과 자원이 투입된다면 정교한 AI 소프트웨어가 보드 게임이든 현대 비디오 게임이든 거의 모든 경쟁적 인지 과제에서 인간을 능가할 수 있음을 증명하는 것이라고 설명했다. 또한 딥마인드와 오픈AI의 성공은 강화 학습이라는 특정 방법론의 강력함을 보여주는 사례라고 덧붙였다.[30]

오픈AI는 이 기술이 게임과 같은 디지털 영역을 넘어 현실 세계에서도 활용될 수 있기를 기대했다. 2018년에는 오픈AI 파이브에 사용된 것과 동일한 강화 학습 알고리즘과 훈련 코드를 재사용하여, 물리적 객체를 조작하도록 설계된 신경망 기반의 로봇 손 닥틸(Dactyl)을 개발했다.[31] 2019년, 닥틸은 루빅스 큐브를 푸는 데 성공했다.[32]

6. 딥마인드의 알파스타와의 비교

2019년, 딥마인드는 ''스타크래프트 II''를 위한 유사한 AI 봇인 알파스타를 공개했다. 오픈AI 파이브와 마찬가지로, 알파스타는 강화 학습과 자기 대전(self-play) 방식을 사용했다.[30] ''The Verge''는 이러한 AI 연구의 목표가 단순히 게임에서 인간을 이기는 것을 넘어, 충분한 시간과 자원이 투입된다면 정교한 AI 소프트웨어가 보드 게임이든 현대 비디오 게임이든 거의 모든 경쟁적 인지 과제에서 인간을 능가할 수 있음을 증명하는 것이라고 보도했다. 또한, 딥마인드와 오픈AI의 성과는 강화 학습 방법론의 강력함을 보여주는 사례라고 덧붙였다.[30]

7. 활용 및 미래

OpenAI는 오픈AI 파이브에 적용된 기술이 단순히 디지털 게임 영역을 넘어 실제 세계의 문제를 해결하는 데 활용될 수 있기를 기대했다.[31] 이러한 가능성을 보여주는 사례로, 2018년 오픈AI는 오픈AI 파이브 개발에 사용된 것과 동일한 강화 학습 알고리즘과 훈련 코드를 이용하여 닥틸(Dactyl)이라는 로봇 손을 개발했다. 닥틸은 물리적인 물체를 정교하게 다룰 수 있도록 설계된 신경망 기반의 인간형 로봇 손이다.[31] 이듬해인 2019년, 닥틸은 복잡한 조작 능력이 요구되는 루빅스 큐브를 푸는 데 성공하며 기술의 잠재력을 입증했다.[32]

이러한 인공지능 연구는 단순히 특정 게임에서 인간 플레이어를 능가하는 것을 넘어, AI가 다양한 분야에서 인간의 능력을 뛰어넘을 수 있음을 보여주는 것을 목표로 한다. 2019년 딥마인드가 스타크래프트 II를 플레이하는 AI인 알파스타를 공개한 것도 이러한 맥락에서 이해될 수 있다.[30] 미국 IT 매체 The Verge는 오픈AI 파이브와 알파스타와 같은 AI의 성공 사례들이 충분한 시간과 자원이 투입된다면, 정교한 AI 소프트웨어가 보드 게임이든 현대 비디오 게임이든 거의 모든 경쟁적인 인지 과제에서 인간을 능가할 수 있다는 점을 시사한다고 분석했다. 또한, 이러한 성과는 강화 학습이라는 특정 AI 개발 방법론의 강력함을 증명하는 것이라고 덧붙였다.[30]

참조

[1] 웹사이트 OpenAI Five https://openai.com/f[...] 2018-10-10
[2] 웹사이트 My favorite game has been invaded by killer AI bots and Elon Musk hype https://www.theverge[...] 2018-06-25
[3] 웹사이트 OpenAI's bot beats top Dota 2 player so badly that he quits https://web.archive.[...] 2017-08-12
[4] 웹사이트 Dota 2 https://blog.openai.[...] 2017-08-12
[5] 웹사이트 More on Dota 2 https://blog.openai.[...] 2017-08-16
[6] 간행물 Can Bots Outwit Humans in One of the Biggest Esports Games? https://www.wired.co[...] 2018-06-25
[7] 뉴스 A Bot Backed by Elon Musk Has Made an AI Breakthrough in Video Game World https://www.bloomber[...] 2018-06-27
[8] 웹사이트 OpenAI Five Benchmark https://blog.openai.[...] 2018-08-25
[9] 웹사이트 AI bots trained for 180 years a day to beat humans at Dota 2 https://www.theverge[...] 2018-06-25
[10] 웹사이트 The OpenAI Dota 2 bots just defeated a team of former pros https://www.theverge[...] 2018-08-07
[11] 간행물 Pro Gamers Fend off Elon Musk-Backed AI Bots—for Now https://www.wired.co[...] 2018-08-25
[12] 웹사이트 Game over, machines: Humans defeat OpenAI bots once again at video games Olympics https://www.theregis[...] 2018-08-25
[13] 웹사이트 The International 2018: Results https://blog.openai.[...] 2018-08-25
[14] 웹사이트 OpenAI Five defeats professional Dota 2 team, twice https://venturebeat.[...] 2019-04-13
[15] 뉴스 OpenAI's Dota 2 AI steamrolls world champion e-sports team with back-to-back victories https://www.theverge[...] Vox Media 2019-04-13
[16] 웹사이트 OpenAI's Dota 2 bot defeated 99.4% of players in public matches https://venturebeat.[...] 2019-04-22
[17] 웹사이트 Dota 2 with Large Scale Deep Reinforcement Learning https://cdn.openai.c[...] 2024-09-29
[18] 웹사이트 Why are AI researchers so obsessed with games? https://qz.com/13481[...] 2018-08-04
[19] arXiv Proximal Policy Optimization Algorithms
[20] 뉴스 IBM computer Watson wins Jeopardy clash https://www.theguard[...] 2011-02-17
[21] 웹사이트 Chess grandmaster Garry Kasparov on what happens when machines 'reach the level that is impossible for humans to compete' https://www.business[...] 2017-12-29
[22] 웹사이트 DeepMind's Go-playing AI doesn't need human help to beat us anymore https://www.theverge[...] 2017-10-18
[23] 웹사이트 OpenAI Five https://blog.openai.[...] 2018-06-25
[24] 웹사이트 Bill Gates says gamer bots from Elon Musk-backed nonprofit are 'huge milestone' in A.I. https://www.cnbc.com[...] 2018-06-28
[25] 웹사이트 Bill Gates hails 'huge milestone' for AI as bots work in a team to destroy humans at video game 'Dota 2' https://www.business[...] 2018-06-27
[26] 웹사이트 Garry Kasparov's Twitter https://twitter.com/[...] 2018-08-24
[27] 웹사이트 A team of AI algorithms just crushed humans in a complex computer game https://www.technolo[...] 2018-06-25
[28] 뉴스 How the OpenAI Five tore apart a team of Dota 2 pros https://www.pcgamer.[...] 2018-08-11
[29] 뉴스 OpenAI Is Beating Humans at 'Dota 2' Because It's Basically Cheating https://www.vice.com[...] 2018-08-17
[30] 뉴스 DeepMind's StarCraft 2 AI is now better than 99.8 percent of all human players https://www.theverge[...] 2019-10-30
[31] arXiv Learning Dexterous In-Hand Manipulation 2019
[32] arXiv Solving Rubik's Cube with a Robot Hand 2019



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com