캐글
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
캐글(Kaggle)은 2010년 앤서니 골드블룸에 의해 설립된 데이터 과학 및 머신 러닝 경진대회 플랫폼이다. 구글에 인수되었으며, 1,500만 명 이상의 사용자를 보유하고 있다. 캐글은 기업이 과제를 제시하고, 참가자들이 데이터를 분석하여 최적의 모델을 구축하도록 경쟁하는 방식으로 운영된다. 경진대회, 프로그레션 시스템, 데이터 세트 공유, 커널(코드 공유) 등을 제공하며, 다양한 분야의 발전에 기여하고 있다.
더 읽어볼만한 페이지
- 구글 클라우드 - 구글 워크스페이스
구글 워크스페이스는 구글이 제공하는 클라우드 기반 생산성 및 협업 도구 모음으로, Gmail, 구글 드라이브 등을 포함하며, 마이크로소프트 365와 경쟁하며 생성형 AI 기능을 도입했다. - 구글 클라우드 - 구글 행아웃
구글 행아웃은 구글에서 개발한 메시징 서비스로, 구글 토크를 대체하며 출시되었으나, 기능 분리 후 2022년 구글 챗으로 통합되어 서비스가 종료되었다. - 응용 기계 학습 - 알파고
알파고는 구글 딥마인드가 개발한 인공지능 바둑 프로그램으로, 심층 신경망과 몬테카를로 트리 탐색 알고리즘을 결합하여 자가 학습을 통해 인간을 뛰어넘는 바둑 실력을 달성하며 인공지능 기술 발전과 사회적 영향에 대한 논의를 촉발했다. - 응용 기계 학습 - 알파폴드
알파폴드는 딥마인드에서 개발한 단백질 구조 예측 인공지능 시스템으로, 아미노산 서열로부터 3차원 구조를 예측하며 높은 정확도로 신약 개발과 질병 연구에 기여할 가능성이 있지만, 단백질 복합체 및 무질서 단백질 영역 예측에는 한계가 있다. - 크라우드소싱 - 듀오링고
듀오링고는 루이스 폰 안과 세버린 해커가 개발한 무료 언어 학습 플랫폼으로, 웹사이트와 모바일 앱을 통해 다양한 언어 코스를 제공하고 게이미피케이션 요소를 활용하며, 광고 및 유료 구독 서비스로 수익을 창출하고 듀오링고 영어 시험을 통해 공인 영어 능력 시험 서비스도 제공하며, 수학, 음악 학습 기능도 추가하고 있다. - 크라우드소싱 - 페이지랭크
페이지랭크는 래리 페이지와 세르게이 브린이 개발한 알고리즘으로, 하이퍼링크로 연결된 문서 집합에서 웹 페이지의 상대적 중요도를 측정하며, 링크를 투표로 간주하여 페이지 순위를 재귀적으로 결정하고, 구글 검색 엔진의 초기 핵심 알고리즘으로 활용되었으며, 다양한 분야에서 활용된다.
캐글 - [회사]에 관한 문서 | |
---|---|
기본 정보 | |
![]() | |
설립 | 2010년 4월 |
본사 | 미국 샌프란시스코 |
산업 | 데이터 과학 |
제품 | 경쟁 캐글 커널 캐글 데이터 세트 캐글 런 |
모회사 | 구글 (2017년~) |
웹사이트 | 캐글 공식 웹사이트 |
기업 정보 | |
창립자 | 앤서니 골드블룸 |
최고 경영자 (CEO) | D. Sculley |
최고 운영 책임자 (COO) | 줄리아 엘리엇 |
최고 설계자 | 제프 모저 |
추가 정보 | |
소유주 | 알파벳 (기업) (2017년~) |
2. 역사
앤서니 골드블룸이 2010년 4월에 캐글을 설립하였다.[2] 제러미 하워드는 초기 사용자였는데, 2010년 11월에 사장 겸 최고 과학자로 합류하였다.[3] 니콜라스 그린은 창립 의장으로 참여했다.[4] 2011년에는 12500000USD를 모금했고, 맥스 레브친이 의장이 되었다.[5] 2017년 3월 8일, 구글의 수석 과학자인 페이페이 리는 구글이 캐글을 인수한다고 발표했다.[6]
캐글은 과제 제출자가 데이터와 과제 설명을 제공하면, 과제 제작 지원, 과제 구성 생성, 데이터 익명화, 최적 모델 운영 등의 컨설팅을 담당한다. 참가자들은 다양한 기법을 시도하여 최적 모델을 구축하고 경쟁하며, 대부분의 제출 결과는 즉시 채점되어 상위 순위대로 게시된다.
2017년 6월, 캐글의 등록 사용자는 100만 명을 넘었고, 2023년 10월에는 194개국에서 1,500만 명 이상의 사용자를 보유하게 되었다.[7][8][9]
2022년에는 창립자인 골드블룸과 해머가 물러나고, D. 스컬리가 CEO가 되었다.[10]
2023년 2월, 캐글은 사용자들이 사전 훈련된 모델을 찾아 활용하고, 캐글 플랫폼의 다른 부분들과 긴밀하게 통합할 수 있도록 하는 모델을 도입했다.[11]
3. 운영 방식
과제 제출자는 제출 모델의 사용에 있어 영구적이고 취소 불가능한 무상 이용권(개발한 알고리즘, 소프트웨어, 지적 재산권 포함)에 동의한 응답자에게 상금을 지급한다.[26]
공개 과제 외에도 헤비 유저나 대학 단체[27] 등 참가자를 제한한 과제도 제공한다.
3. 1. 경진 대회 (Competitions)
캐글이 설립된 이후 많은 머신 러닝 경진 대회가 개최되었다. 주목할 만한 대회로는 마이크로소프트 키넥트의 제스처 인식,[12] 맨체스터 시티 FC를 위한 축구 인공지능 제작, 투 시그마 인베스트먼트(Two Sigma Investments)를 위한 거래 알고리즘 코딩,[13] CERN에서 힉스 보손 탐색 개선 등이 있다.[14]
대회 주최측은 데이터와 문제 설명을 준비하며, 상금 지급 여부를 결정한다. 참가자들은 다양한 기술을 실험하고 서로 경쟁하여 최고의 모델을 만들어낸다. 더 나은 벤치마크를 달성하고 새로운 아이디어를 얻기 위해 작업은 캐글 커널(Kaggle Kernels)을 통해 공개적으로 공유된다. 제출은 캐글 커널, 수동 업로드 또는 캐글 API를 통해 할 수 있다. 대부분의 대회의 경우 제출물은 즉시 점수가 매겨지고 (숨겨진 솔루션 파일에 대한 예측 정확도를 기준으로) 실시간 순위표에 요약된다. 마감일이 지나면 대회 주최측은 "우승 출품작" (알고리즘, 소프트웨어 및 관련 지적 재산권)을 사용할 수 있는 "전 세계적이고, 영구적이며, 취소 불가능하며, 로열티가 없는 라이선스"를 대가로 상금을 지급하며, 이는 "달리 명시되지 않는 한 비독점적"이다.[15]
캐글은 공개 대회와 함께 캐글 최고 참가자들만 참여할 수 있는 비공개 대회도 제공한다. 캐글은 데이터 과학 교사가 학술 머신 러닝 대회를 개최할 수 있도록 무료 도구를 제공한다.[16] 또한 캐글은 데이터 과학자들이 페이스북(Facebook), 윈턴 그룹(Winton Capital), 월마트(Walmart)와 같은 주요 데이터 과학 회사에서 면접을 볼 기회를 얻기 위해 경쟁하는 채용 대회를 개최한다.
캐글 대회를 통해 HIV 연구,[17] 체스 평점[18] 및 교통 예측[19]과 같은 성공적인 프로젝트가 이루어졌다. 제프리 힌턴과 조지 달은 딥 신경망을 사용하여 머크 & 컴퍼니(Merck & Co.)가 주최한 대회에서 우승했다. 힌턴의 제자 중 한 명인 블라드 미니흐는 딥 신경망을 사용하여 아드주나(Adzuna)가 주최한 대회에서 우승했다. 그 결과 이 기술은 캐글 커뮤니티의 다른 사람들에게 채택되었다. 워싱턴 대학교의 톈치 천은 캐글을 사용하여 XGBoost의 강력함을 보여주었으며, 이후 캐글 대회에서 우승하는 데 사용되는 주요 방법 중 하나로 Random Forest를 대체했다.
캐글 대회에서 얻은 결과를 바탕으로 여러 학술 논문이 발표되었다.[20] 이는 참가자들이 기존의 모범 사례를 넘어 지속적으로 혁신하도록 장려하는 실시간 순위표가 기여한 바가 크다.[21] 우승 방법은 종종 캐글 위너 블로그(Kaggle Winner's Blog)에 게시된다.
3. 2. 프로그레션 시스템 (Progression System)
캐글은 플랫폼 내 기여와 성과에 따라 사용자를 인식하고 보상하기 위해 프로그레션 시스템을 구현했다. 이 시스템은 노비스(Novice), 컨트리뷰터(Contributor), 엑스퍼트(Expert), 마스터(Master), 그랜드마스터(Grandmaster)의 5단계로 구성된다. 각 단계는 대회, 데이터 세트, 커널(코드 공유), 토론에서의 특정 기준을 충족함으로써 달성된다.[22]
최고 단계인 캐글 그랜드마스터는 솔로 팀에서 높은 순위를 포함하여 여러 대회에서 최상위권에 랭크된 사용자에게 수여된다. 2024년 5월 28일 기준, 캐글 계정은 1,850만 개이며, 이 중 2,745명이 캐글 마스터 지위를, 530명이 캐글 그랜드마스터 지위를 획득했다.[23]
4. 영향
정보 과학, 통계학, 경제학, 수학 등 여러 분야에서 전 세계 약 95,000명의 데이터 과학자가 등록되어 있으며[28], 캐글은 미국 항공 우주국(NASA), 위키백과, 딜로이트 투쉬 토마츠, 올스테이트 보험 등과 같은 여러 조직과 제휴하고 있다.
캐글은 Heritage Health Prize에서 300만달러의 상금을 걸어 화제가 되었으며,[29] 최근에는 키넥트의 동작 인식 개선 과제가 알려져 있다.[30]
캐글은 공개 과제 방식을 통해 HIV 연구에 대한 최신 기술을 촉진하고,[31] 더 정확한 체스 레이팅[32] 및 교통량 예측[33] 등 다양한 과제 해결에 기여했다. 즉시 반영되는 스코어보드는 응답자들이 기존의 최적해를 넘어서는 혁신적인 해결책을 찾도록 동기를 부여한다.[34] 모범 답안은 캐글 공식 블로그에 자주 게재된다.
DeNA에서는 캐글을 인재 육성 및 기술자 모집 등에 활용하고 있다.[35]
참조
[1]
웹사이트
A Beginner’s Guide to Kaggle for Data Science
https://www.makeuseo[...]
2023-04-17
[2]
웹사이트
Google is acquiring data science community Kaggle
https://techcrunch.c[...]
Techcrunch
2017-03-08
[3]
뉴스
The exabyte revolution: how Kaggle is turning data scientists into rock stars
https://www.wired.co[...]
[4]
웹사이트
Local minnow the toast of Silicon Valley
https://www.smh.com.[...]
2011-11-04
[5]
웹사이트
Max Levchin Becomes Chairman Of Kaggle, A Startup That Helps NASA Solve Impossible Problems
https://www.business[...]
[6]
뉴스
Welcome Kaggle to Google Cloud
https://cloudplatfor[...]
[7]
웹사이트
Unique Kaggle Users
https://www.kaggle.c[...]
[8]
뉴스
Scientists See Advances in Deep Learning, a Part of Artificial Intelligence
https://www.nytimes.[...]
2012-11-24
[9]
뉴스
We've passed 1 million members
http://blog.kaggle.c[...]
2017-06-06
[10]
웹사이트
Kaggle gets new CEO, founders quit after a decade
https://analyticsind[...]
2022-06-08
[11]
웹사이트
"[Product Launch] Introducing Kaggle Models | Data Science and Machine Learning"
https://www.kaggle.c[...]
[12]
뉴스
Kaggle launches competition to help Microsoft Kinect learn new gestures
https://venturebeat.[...]
2011-12-12
[13]
뉴스
Hedge funds adopt novel methods to hunt down new tech talent
https://www.ft.com/c[...]
2017-03-08
[14]
뉴스
The machine learning community takes on the Higgs
http://www.symmetrym[...]
2014-07-15
[15]
웹사이트
Terms and Conditions - Kaggle
https://www.kaggle.c[...]
[16]
웹사이트
Kaggle in Class
http://inclass.kaggl[...]
[17]
뉴스
May the Best Analyst Win
https://www.science.[...]
2011-02
[18]
뉴스
The Deloitte/FIDE Chess Rating Challenge
http://www.chessbase[...]
2011-02-20
[19]
뉴스
Smartphones to predict NSW travel times?
http://www.theaustra[...]
2011-04-06
[20]
간행물
NIPS 2014 Workshop on High-energy Physics and Machine Learning
http://jmlr.org/proc[...]
[21]
뉴스
The Value of Feedback in Forecasting Competitions
http://www.sciencedi[...]
[22]
웹사이트
Kaggle Progression System
https://www.kaggle.c[...]
Kaggle
[23]
웹사이트
Kaggle in Numbers
https://www.kaggle.c[...]
Kaggle
2022-02-10
[24]
웹사이트
Google is acquiring data science community Kaggle
https://techcrunch.c[...]
Techcrunch
2017-03-08
[25]
뉴스
Google buys Kaggle and its gaggle of AI geeks
https://www.cnet.com[...]
2017-03-08
[26]
웹사이트
Terms and Conditions - Kaggle
https://www.kaggle.c[...]
[27]
웹사이트
Kaggle in Class
http://inclass.kaggl[...]
[28]
웹사이트
About Us
http://www.kaggle.co[...]
[29]
뉴스
Healthy Competition
http://www.economist[...]
2011-04-10
[30]
뉴스
Kaggle launches competition to help Microsoft Kinect learn new gestures
http://venturebeat.c[...]
2011-12-12
[31]
뉴스
May the Best Analyst Win
http://www.sciencema[...]
2011-02
[32]
뉴스
The Deloitte/FIDE Chess Rating Challenge
http://www.chessbase[...]
2011-02-20
[33]
뉴스
Smartphones to predict NSW travel times?
http://www.theaustra[...]
2011-04-06
[34]
뉴스
The Value of Feedback in Forecasting Competitions
http://www.sciencedi[...]
[35]
서적
DeNA、世界大会でAI腕磨き 本業ゲームに還元
https://www.nikkei.c[...]
2021-11-01
[36]
뉴스
구글, 최대 데이터과학자 커뮤니티 '캐글' 인수
http://www.ciokorea.[...]
ZDNet Korea
2017-03-09
[37]
뉴스
구글의 캐글(Kaggle) 인수, AI 분야에 미칠 영향은?
http://www.ciokorea.[...]
CIO
2017-03-20
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com