맨위로가기

타이탄 (슈퍼컴퓨터)

"오늘의AI위키"는 AI 기술로 일관성 있고 체계적인 최신 지식을 제공하는 혁신 플랫폼입니다.
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.

1. 개요

타이탄은 미국 오크리지 국립 연구소에서 개발한 슈퍼컴퓨터로, 2005년부터 2012년까지 개발되었다. 재규어 슈퍼컴퓨터를 업그레이드하여 구축되었으며, 2012년 11월 LINPACK 성능 평가에서 17.59페타플롭스로 1위를 차지했다. 엔비디아 K20X GPU를 탑재하여 최대 27페타플롭스의 성능을 낼 수 있으며, 다양한 과학 분야의 연구에 활용되었다. S3D, WL-LSMS, Denovo, LAMMPS, CAM-SE, NRDF, Bonsai, VERA 등 여러 응용 프로젝트에 사용되었으며, GPU 기반 아키텍처에 맞춰 코드 수정 및 최적화 작업이 이루어졌다.

더 읽어볼만한 페이지

  • 엔비디아 - ARM 홀딩스
    ARM 홀딩스는 저전력 특성의 ARM 아키텍처 기반 반도체 설계 자산 IP를 라이선스하는 회사로, 모바일 기기부터 슈퍼컴퓨터까지 다양한 분야에 활용되며 소프트뱅크 그룹에 인수 후 나스닥에 상장되었다.
  • 엔비디아 - 터보캐시
    터보캐시는 GPU가 시스템 메모리를 비디오 메모리처럼 활용하여 그래픽 성능을 높이는 기술로, 엔비디아에서 저가형 비디오 카드 및 통합 그래픽의 성능 향상을 위해 개발되었다.
  • 64비트 컴퓨터 - IA-64
    IA-64는 인텔과 HP가 공동 개발한 64비트 ISA로, EPIC 아키텍처를 채택하여 병렬성을 극대화하려 했으나, x86 호환성 문제와 소프트웨어 생태계 부족으로 상용 시장에서 실패하고 단종되었다.
  • 64비트 컴퓨터 - 아이테니엄
    아이테니엄은 인텔과 HP가 공동 개발한 IA-64 아키텍처 기반의 64비트 마이크로프로세서로, 엔터프라이즈 서버 및 고성능 컴퓨팅 시장을 목표로 했으나 x86-64 아키텍처의 부상과 여러 문제로 2021년 단종되었다.
  • 독특한 컴퓨터 - 클로드 섀넌
    클로드 섀넌은 정보 이론의 창시자이자 디지털 회로 설계의 선구자로, 정보 엔트로피 개념을 도입하여 정보 이론을 개척하고 디지털 회로 설계의 이론적 기반을 마련했으며, 암호학, 인공지능, 컴퓨터 체스 연구에도 기여하여 현대 디지털 시대의 기반을 구축했다.
  • 독특한 컴퓨터 - 해석기관
    해석기관은 19세기 찰스 배비지가 설계한 기계식 범용 컴퓨터로, 천공 카드, 증기 기관, 십진법을 사용하며 튜링 완전성을 갖춘 것으로 여겨지지만, 기술적 어려움으로 인해 배비지 생전에는 완성되지 못했다.
타이탄 (슈퍼컴퓨터)
기본 정보
2013년의 타이탄
2013년의 타이탄
운영 시작2012년 10월 29일
운영 종료2019년 8월 2일
운영자크레이사
후원미국 DOE 및 NOAA (10% 미만)
위치오크리지 국립 연구소
목적과학 연구
하드웨어 사양
아키텍처18,688개의 AMD 옵테론 6274 16코어 CPU
18,688개의 NVIDIA Tesla K20X GPU
메모리693.5 TiB (CPU 584 TiB, GPU 109.5 TiB)
저장 공간40 PB, 1.4 TB/s IO Lustre 파일 시스템
크기404 m2 (4352 ft2)
성능
속도17.59 페타플롭스 (LINPACK)
이론상 최대 27 페타플롭스
전력 소비8.2 MW
소프트웨어
운영체제Cray Linux Environment
기타 정보
비용9700만 미국 달러 (2012년 기준 $ 미국 달러 상당)
TOP500 순위4위 (2017년 6월)
레거시구축 당시 TOP500 1위
10 페타플롭스 이상을 수행한 최초의 GPU 기반 슈퍼컴퓨터
웹사이트타이탄 공식 웹사이트

2. 역사

타이탄 개발은 2005년 오크리지 국립 연구소(ORNL)의 오크리지 리더십 컴퓨팅 시설(OLCF)에서 20 페타플롭스(petaFLOPS)급 슈퍼컴퓨터를 만들 계획을 세우면서 시작되었다. 이는 2020년까지 엑사스케일 (1000 페타플롭스 ~ 1 엑사플롭스) 머신을 운영하려는 ORNL의 계획 중 일부였다. 타이탄을 위해 새로운 건물을 건설하는 대신 재규어의 기존 인프라를 사용하기로 결정했다.

2009년 엔비디아(Nvidia)와 GPU 공급 계약을 체결했고, 2010년에 시스템 아키텍처가 확정되었다. 타이탄은 2010년 11월 16일 ACM/IEEE 슈퍼컴퓨팅 컨퍼런스(SC10)에서 비공개로 처음 발표되었고, 2011년 10월 11일 타이탄 업그레이드의 첫 단계가 시작되면서 공개적으로 발표되었다.

타이탄은 주로 ORNL을 통해 미국 에너지부의 자금 지원을 받았다. 미국 해양대기청(NOAA)은 계산 시간 제공을 대가로 GPU 노드에 자금을 지원했다. ORNL 과학 컴퓨팅 책임자 제프 니콜스는 타이탄의 초기 비용이 약 6000만달러였으며, NOAA의 기여는 1000만달러 미만이었다고 언급했다. 크레이와의 계약 전체 기간에는 잠재적 업그레이드를 제외하고 9700만달러가 포함되었다.

2013년 3월, 엔비디아는 타이탄의 K20X GPU와 동일한 GPU 다이를 사용하는 소비자용 그래픽 카드인 GTX 타이탄을 출시했다. 타이탄은 2013년 초 인수 시험에서 92%만 완료하여 요구되는 95%에 미치지 못했다. 마더보드의 PCIe 슬롯의 암 에지 커넥터에 과도한 금이 있어 마더보드의 납땜에 균열을 일으키는 것이 문제였다. 수리 비용은 크레이가 부담했으며, 매주 12개에서 16개의 캐비닛이 수리되었다. 3월 11일에는 8,972개의 GPU를 사용할 수 있었다. ORNL은 4월 8일에 수리가 완료되었음을 발표했고, 2013년 6월 11일에 인수 시험 완료를 발표했다.

2. 1. 재규어 슈퍼컴퓨터 업그레이드

오크리지 국립 연구소(ORNL)의 오크리지 리더십 컴퓨팅 시설(OLCF)에 있던 슈퍼컴퓨터 재규어는 여러 번의 업그레이드를 거쳐 타이탄으로 재탄생했다. 2008년 재규어는 XT4 플랫폼으로 업그레이드되어 263테라플롭스의 성능을 보였다. 2009년에는 XT5 플랫폼으로 업그레이드되어 1.4페타플롭스 성능에 도달했다. 마지막 업그레이드를 통해 재규어는 1.76페타플롭스의 성능을 갖게 되었다.

2011년 10월 9일부터 1년간의 전환 작업이 시작되었다. 10월과 12월 사이에, 24개의 XT5 블레이드 서버(노드당 2개의 6코어 CPU, 블레이드당 4개의 노드)가 포함된 재규어의 200개 캐비닛 중 96개가 XK7 블레이드(노드당 1개의 16코어 옵테론 6274 프로세서, 블레이드당 4개의 노드)로 업그레이드되었다. 12월에는 계산이 96개의 XK7 캐비닛으로 이동하는 동안 나머지 104개의 캐비닛은 XK7 블레이드로 업그레이드되었다. 재규어에 사용된 Seastar 디자인은 타이탄에 사용된 Gemini 상호 연결로 업그레이드되었으며, 이는 노드를 직접 3D 토러스 상호 연결 네트워크로 연결한다. 시스템 메모리는 584 TiB로 두 배로 증가했다. 960개의 XK7 노드(10개의 캐비닛)에는 페르미 기반 테슬라 GPU가 장착되었고, 이 960개의 노드는 TitanDev로 지칭되어 코드를 테스트하는 데 사용되었다. 이 업그레이드의 첫 번째 단계로 재규어의 최고 성능이 3.3 페타플롭스로 증가했다. 2012년 9월 13일부터 케플러 기반 엔비디아 K20X GPU가 960개의 TitanDev 노드를 포함하여 재규어의 모든 XK7 컴퓨팅 블레이드에 장착되었다. 10월에 작업이 완료되었고 컴퓨터는 마침내 타이탄으로 이름이 변경되었다.

타이탄의 하드웨어는 이론상 27 페타플롭스의 최고 성능을 가지고 있다.

3. 하드웨어

타이탄은 재규어의 200개 캐비닛을 재사용하여 404m2의 공간을 차지하며, 내부 부품 교체 및 네트워킹 업그레이드를 거쳤다. 재규어의 전력 및 냉각 시스템을 재사용하여 약 2천만 달러를 절약했다. 각 캐비닛에는 삼상 교류 480 V 전력이 공급되는데, 이는 미국 표준 208 V보다 얇은 케이블을 사용하여 구리 비용 100만 달러를 절약했다. 타이탄은 최대 8.2MW의 전력을 소비하며, 재규어보다 1.2MW 더 많지만, 부동 소수점 연산에서는 거의 10배 더 빠르다. 정전 시, 탄소 섬유 플라이휠 전력 저장 장치는 네트워킹 및 저장 인프라를 최대 16초 동안 가동시킬 수 있다. 전원이 2초간 차단된 후, 디젤 발전기가 가동되어 완전한 전력에 도달하는 데 약 7초가 걸리며, 디젤 발전기는 무기한 전력을 공급할 수 있다. 발전기는 재부팅 속도를 빠르게 하기 위해 네트워킹 및 저장 구성 요소에만 전력을 공급하도록 설계되었으며, 처리 인프라에는 전력을 공급할 수 없다.

타이탄은 18,688개의 노드를 가지고 있으며, 각 노드에는 32 GB의 DDR3 ECC 메모리를 갖춘 16코어 AMD 옵테론 6274 CPU와 6 GB GDDR5 ECC 메모리를 갖춘 엔비디아 테슬라 K20X GPU가 포함되어 있다. 총 299,008개의 프로세서 코어와 총 693.6 TiB의 CPU 및 GPU RAM이 있다.

처음에 타이탄은 재규어의 10 PB Lustre 스토리지를 사용하여 240 GB/s의 전송 속도를 보였지만, 2013년 4월에 스토리지가 40 PB로 업그레이드되어 전송 속도가 1.4 TB/s로 향상되었다. GPU는 CPU에 비해 훨씬 더 높은 병렬 처리 효율성 때문에 선택되었다. GPU는 CPU보다 클럭 속도가 느리지만, 각 GPU에는 732 MHz에서 2,688개의 CUDA 코어가 포함되어 있어, 전체 시스템 속도가 더 빨라진다. 결과적으로, CPU의 코어는 기존 슈퍼컴퓨터처럼 데이터를 직접 처리하기보다는 GPU에 작업을 할당하는 데 사용된다.

타이탄은 사용자가 직접 접근하는 로그인 노드에서 리눅스의 전체 버전인 크레이 리눅스 환경(Cray Linux Environment)을 실행하지만, 컴퓨팅 노드에서는 더 작고 효율적인 버전을 실행한다.

3. 1. 냉각 시스템

타이탄의 구성 요소는 방열판으로 공랭식으로 냉각되지만, 공기는 랙에 보내지기 전에 냉각된다. 팬 소음이 너무 커서 기계실에서 15분 이상 근무하는 사람들에게는 청력 보호가 필요하다. 이 시스템은 23.2MW(약 5987421.00kg)의 냉각 용량을 가지며, 물을 5.5°C까지 냉각시켜 재순환 공기를 냉각시키는 방식으로 작동한다.

4. 소프트웨어 및 응용

타이탄은 Cray Linux Environment를 운영 체제로 사용했으며, 사용자가 직접 접근하는 로그인 노드에서는 전체 버전의 리눅스를, 컴퓨팅 노드에서는 더 작고 효율적인 버전을 실행했다.

2009년, 오크리지 리더십 컴퓨팅 시설(OLCF)은 연구의 중요성과 시스템 활용 능력을 기준으로 50개의 애플리케이션 중에서 6개의 "선구자" 코드를 선정했다. 이 코드들은 핵물리학, 재료 과학, 기후 모델링 등 다양한 과학 연구 및 공학 분야에서 중요한 역할을 수행했다. 2013년에는 31개의 프로그램이 타이탄에서 실행될 예정이었으며, 일반적으로 한 번에 4~5개가 실행되었다.

4. 1. 주요 응용 프로젝트


  • '''S3D'''는 바이오 연료 엔진과 디젤 엔진의 효율 향상을 목표로 연소의 분자 물리학을 모델링하는 프로젝트이다. 2009년에 재규어(Jaguar)를 사용하여 직접 분사 디젤 엔진의 효율과 관련된 탄화수소 화염의 자동 점화에 대한 최초의 완전하게 해결된 시뮬레이션을 생성했다.
  • '''WL-LSMS'''는 절대 영도가 아닌 온도에서 자기 물질 내의 전자와 원자 간의 상호 작용을 시뮬레이션한다. 이 코드의 이전 버전은 재규어에서 1페타플롭스 이상의 성능을 처음으로 달성했다.
  • '''데노보(Denovo)'''는 핵반응을 시뮬레이션하여 원자로의 효율을 개선하고 폐기물을 줄이는 것을 목표로 한다. 타이탄에 맞춰 조정된 후 CPU 기반 머신에서의 ''데노보''의 성능은 두 배로 향상되었으며, 재규어보다 타이탄에서 3.5배 더 빠르게 실행된다.
  • '''대규모 원자/분자 병렬 시뮬레이터(LAMMPS)'''는 분자 역학 코드로서, 양자 역학에서 상대성 이론에 이르기까지 다양한 규모의 입자를 시뮬레이션하여 반도체, 생체 분자, 고분자 개발에 잠재적으로 적용할 수 있는 재료 과학을 향상시킨다.
  • '''CAM-SE'''는 전 지구 대기 모델인 ''커뮤니티 대기 모델''과 유체 및 열역학 방정식을 푸는 코드인 ''고차 방법 모델링 환경''을 결합한 것이다. ''CAM-SE''는 기후 시뮬레이션의 정확도를 높일 것이다.
  • '''비평형 복사 확산(NRDF)'''은 초신성을 통해 비전하 입자를 추적하며, 레이저 융합, 유체 역학, 의료 영상, 원자로, 에너지 저장 및 연소에 잠재적으로 적용할 수 있다. 이 코드의 키메라(Chimera)는 수백 개의 편미분 방정식을 사용하여 초신성이 일어나는 별에서 모델링된 각 중성미자의 에너지, 각도, 산란각 및 유형을 추적하여 수백만 개의 개별 방정식을 생성한다. 이 코드는 세 개의 "머리"를 가지고 있기 때문에 신화 속 생물의 이름을 따서 ''키메라''라고 명명되었다. 첫 번째는 별 물질의 유체 역학을 시뮬레이션하고, 두 번째는 복사 전달을 시뮬레이션하며, 세 번째는 핵융합을 시뮬레이션한다.
  • '''분재(Bonsai)'''는 n체 시뮬레이션을 위한 중력 트리 코드이다. 2000억 개의 별을 기반으로 은하수를 시뮬레이션하기 위해 2014년 고든 벨 상 후보로 사용되었다. 이 애플리케이션에서 컴퓨터는 24.773페타플롭스의 지속적인 속도에 도달했다.
  • '''VERA'''는 경수형 원자로의 첨단 시뮬레이션 컨소시엄(CASL)에서 재규어에서 작성한 경수형 원자로 시뮬레이션이다. ''VERA''를 통해 엔지니어는 원자로의 수명 동안 원자로 노심의 모든 부분의 성능과 상태를 모니터링하여 관심 지점을 식별할 수 있다. 처음 6개의 프로젝트 중 하나는 아니었지만, ''VERA''는 CAAR의 지원과 타이탄Dev에서의 테스트를 통해 최적화된 후 타이탄에서 실행될 예정이었다. 컴퓨터 과학자 톰 에반스는 타이탄의 하이브리드 아키텍처로의 적응이 이전의 CPU 기반 슈퍼컴퓨터보다 더 어렵다는 것을 발견했다. 그는 타이탄에서 18~36개월의 프로세스인 전체 핵연료 주기를 일주일 만에 시뮬레이션하는 것을 목표로 했다.

4. 2. 코드 수정 및 최적화

타이탄의 GPU 기반 아키텍처에 맞춰 기존 코드를 수정하고 최적화하는 작업이 필요했다. 오크리지 리더십 컴퓨팅 시설(OLCF)은 가속 애플리케이션 준비 센터(Center for Accelerated Application Readiness, CAAR)를 설립하여 코드 수정 및 최적화 작업을 지원했다. 이 센터는 엔비디아 본사에서 개발자 워크숍을 개최하여 타이탄의 아키텍처, 컴파일러, 애플리케이션에 대해 사용자들을 교육했다. CAAR는 엔비디아 및 코드 공급업체와 협력하여 프로그래밍 언어에 GPU용 지시어를 통합하는 컴파일러를 개발했다. 이를 통해 연구자들은 포트란, C, C++와 같은 기존 프로그래밍 언어를 사용하여 코드에서 병렬성을 표현하고, 컴파일러가 이를 GPU로 표현할 수 있게 되었다.

계산 천체물리학자인 브론슨 메써 박사는 "타이탄을 최대한 활용하는 애플리케이션은 GPU를 계속 사용하도록 하면서, GPU가 빠르지만 CPU보다 덜 유연하다는 것을 기억해야 한다"고 언급했다. 모압 클러스터 스위트는 작업의 노드 우선순위를 정하는 데 사용되어 효율성을 70%에서 약 95%로 향상시켰다. 일부 프로젝트에서는 코드 수정을 통해 GPU가 아닌 시스템에서도 성능 향상을 얻을 수 있었는데, ''데노보''(Denovo)의 성능은 CPU 기반 시스템에서 두 배로 증가했다.

GPU에서 실행하기 위해 필요한 코드 변경량은 프로젝트마다 달랐다. ''NRDF''의 메써 박사에 따르면, 그의 코드는 비교적 간단한 계산이 반복적으로 병렬 처리되기 때문에 소량만 GPU에서 실행되었다. ''NRDF''는 GPU용 CUDA 확장을 갖춘 CUDA 포트란으로 작성되었다. 키메라의 세 번째 "머리"는 핵 연소를 GPU 아키텍처로 가장 쉽게 시뮬레이션할 수 있었기 때문에 처음으로 GPU에서 실행되었고, 코드의 다른 측면도 시간이 지남에 따라 수정될 예정이었다. 재규어에서 이 프로젝트는 14개 또는 15개의 핵종을 모델링했지만, 메써는 최대 200개의 핵종을 시뮬레이션하여 시뮬레이션을 경험적 관찰과 비교할 때 훨씬 더 정밀해질 것으로 예상했다.

참조

[1] 뉴스 TOP500 list refreshed, US edged out of third place https://www.top500.o[...] TOP500 2017-06-19
[2] 웹사이트 Summit FAQs https://www.olcf.orn[...] Oak Ridge National Laboratory 2014-11-15
[3] 뉴스 TOP500 list refreshed, US edged out of third place https://www.top500.o[...] TOP500 2017-06-19
[4] 웹사이트 Summit FAQs https://www.olcf.orn[...] Oak Ridge National Laboratory 2014-11-15
[5] 뉴스 スパコン「TOP500」、米「Titan」が首位に https://japan.cnet.c[...]
[6] 웹인용 Summit FAQs https://www.olcf.orn[...] Oak Ridge National Laboratory 2014-11-15



본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.

문의하기 : help@durumis.com